Защита конфиденциальности в Интернете: новая система предоставит людям больший контроль над общими цифровыми данными

В то же время множество недавних исследований продемонстрировали, что невероятно легко идентифицировать неназванных людей в якобы «анонимных» наборах данных, даже если они содержат миллионы записей. Итак, если нам нужны преимущества интеллектуального анализа данных — например, персонализированные рекомендации или локализованные услуги — как мы можем защитить нашу конфиденциальность?В последнем выпуске PLOS One исследователи Массачусетского технологического института предлагают один из возможных ответов.

Их прототип системы, openPDS — сокращение от хранилища личных данных — хранит данные с ваших цифровых устройств в одном указанном вами месте: это может быть зашифрованный сервер в облаке, но это также может быть компьютер в запертом ящике под ваш стол. Любое приложение для мобильного телефона, онлайн-сервис или группа по исследованию больших данных, которые хотят использовать ваши данные, должны запросить ваше хранилище данных, которое возвращает только столько информации, сколько требуется.Совместное использование кода, а не данных«Мне нравится использовать индивидуализированную музыку, — говорит Ив-Александр де Монжуа, аспирант в области медиаискусств и естественных наук и первый автор новой статьи. "Pandora, например, сводится к тому, что они называют музыкальным геномом, который содержит краткое изложение ваших музыкальных вкусов.

Чтобы порекомендовать песню, все, что вам нужно, это последние 10 песен, которые вы слушали — просто чтобы убедиться, что вы не рекомендую снова одну и ту же — и этот музыкальный геном. Вам не нужен список всех песен, которые вы слушали ».С openPDS де Монтжой говорит: «Вы делитесь кодом; вы не делитесь данными.

Вместо того, чтобы отправлять данные в Pandora, чтобы Pandora определяла ваши музыкальные предпочтения, это Pandora отправляет вам фрагмент кода, чтобы вы определяли свои музыкальные предпочтения и отправьте им обратно ".К де Монтжуа присоединяется к работе его научный руководитель Алекс «Сэнди» Пентланд, профессор медиаискусств и наук компании Toshiba; Эрез Шмуэли, постдок группы Пентланда; и Сэмюэл Ван, инженер-программист Foursquare, который на момент завершения исследования был аспирантом факультета электротехники и информатики.

После первоначального развертывания с участием 21 человека, которые использовали openPDS для регулирования доступа к своим медицинским картам, исследователи сейчас тестируют систему с несколькими телекоммуникационными компаниями в Италии и Дании. Хотя openPDS в принципе может работать на любом компьютере по выбору пользователя, в ходе испытаний данные хранятся в облаке.

Значимые разрешенияОдно из преимуществ openPDS, по словам де Монжуа, состоит в том, что приложения должны указывать, какая информация им нужна и как она будет использоваться. Сегодня, по его словам, «когда вы устанавливаете приложение, оно сообщает вам, что« это приложение имеет доступ к вашему точному GPS-местоположению »или« имеет доступ к вашей SD-карте ». У вас, как у пользователя, нет абсолютно никакого способа узнать, что это значит.

Разрешения вам ничего не говорят ".На самом деле приложения часто собирают гораздо больше данных, чем им действительно нужно.

Поставщики услуг и разработчики приложений не всегда заранее знают, какие данные окажутся наиболее полезными, поэтому они хранят как можно больше, чтобы они не могли им понадобиться позже. Например, может оказаться, что для некоторых слушателей музыки обложка альбома оказывается лучшим предиктором того, какие песни им понравятся, чем что-либо, зафиксированное музыкальным геномом Пандоры.

OpenPDS сохраняет все потенциально полезные данные, но в репозитории, контролируемом конечным пользователем, а не разработчиком приложения или поставщиком услуг. Разработчик, обнаруживший, что ранее неиспользованный бит информации полезен, должен запросить доступ к нему у пользователя. Если запрос кажется излишне агрессивным, пользователь может просто отклонить его.Конечно, гнусный разработчик может попытаться обмануть систему, создав запросы, которые выявляют больше информации, чем пользователь намеревается раскрыть.

Например, навигационное приложение может быть авторизовано для определения ближайшей к пользователю остановки метро или парковки. Но он не должен нуждаться в обеих частях информации одновременно, и, запросив их, он может вывести более подробную информацию о местоположении, чем пользователь желает раскрыть.Де Монжуа признает, что создание мер защиты от таких утечек информации должно осуществляться в каждом конкретном случае, от приложения к приложению, и, по крайней мере, на начальном этапе все последствия некоторых комбинаций запросов могут быть неочевидными.

Но «даже если это не на 100 процентов безопасно, это все равно огромное улучшение по сравнению с текущим состоянием», — говорит он. «Если нам удастся предоставить людям доступ к большей части их данных и если мы сможем добиться перехода от анонимности к интерактивным системам в целом, это будет огромная победа».«OpenPDS — одна из ключевых технологий, обеспечивающих развитие цифрового общества, потому что она позволяет пользователям контролировать свои данные и в то же время раскрывает ее потенциал как на экономическом уровне, так и на уровне общества», — говорит Дирк Хелбинг, профессор. социологии в ETH Zurich. «Я не вижу другого способа сделать большие данные совместимыми с конституционными правами и правами человека».