
Когда вы открываете веб-сайт, ваш браузер не просто обращается к сайту, который вы намеревались посетить. Сайт может содержать «третьи стороны» — другие встроенные веб-сайты, с которыми также взаимодействует ваш браузер, например, рекламодатели, системы аналитики веб-сайтов или виджеты социальных сетей, которые могут наблюдать за вашим поведением в Интернете. Часто эти компании используют эту информацию для невинных, хотя иногда и назойливых, приложений, таких как таргетированная реклама или персонализированный контент. Но сторонние веб-трекеры вызывают вопросы о конфиденциальности пользователей, поскольку они могут идентифицировать пользователей, когда они посещают несколько сайтов, собирать след человека и потенциально создавать всеобъемлющий профиль на основе поведения в Интернете.
На конференции по безопасности USENIX в Остине, штат Техас, группа исследователей из Вашингтонского университета в августе. 12 представили первый в истории всесторонний анализ стороннего веб-отслеживания за три десятилетия и новый инструмент TrackingExcavator, который они разработали для извлечения и анализа поведения отслеживания на данной веб-странице.
Они отметили четырехкратное увеличение количества сторонних отслеживающих на ведущих сайтах с 1996 по 2016 год и отметили растущую сложность трекеров за десятилетия.
«Стороннее отслеживание началось довольно рано в истории Интернета», — сказал Адам Лернер, аспирант факультета компьютерных наук и инженерии Университета штата Вашингтон, который представил результаты своей команды на конференции. "Люди все больше обеспокоены потенциальным воздействием стороннего веб-отслеживания, но нам не хватало исчерпывающей истории того, как трекеры — и типы информации, которую они собирают — развивались с течением времени."
Лернер и его коллега по докторантуре Анна Корнфельд Симпсон намеревались заполнить пробелы в нашем понимании отслеживания, работая с доцентом информатики и инженерии Франциской Рознер и доцентом Тадаёши Коно из Лаборатории безопасности и конфиденциальности UW.
Рознер и Коно ранее изучали сторонние методы веб-отслеживания, включая разработку ранней таксономии базовых подходов, которые используют многие трекеры на основе файлов cookie.
«Поведение отслеживания варьируется от чего-то« принудительного », например всплывающего окна, до чего-то более« ванильного », например, стороннего файла cookie, который отслеживает пользователя», — сказал Коно. "До сих пор у нас не было инструментов, чтобы понять, как эти подходы изменились с первых дней Интернета.
Теперь мы можем увидеть, как выросло количество и разнообразие трекеров, и как одни подходы вышли из моды, а другие растут."
Проект был немалым подвигом, поскольку никто не собирал систематически информацию об отслеживании с течением времени. Чтобы преодолеть это ограничение, TrackingExcavator собирает данные из обширного архива веб-сайтов с открытым доступом, известного как Wayback Machine, который сохраняет контент веб-сайтов еще в 1996 году.
«Восстановить поведение отслеживания с помощью Wayback Machine сложно, потому что он был разработан для архивирования веб-контента, а не методов отслеживания», — сказал Корнфельд Симпсон. "Нам пришлось разработать методы извлечения отслеживающей информации из архива. Например, мы собрали файлы cookie отслеживания из архивных заголовков HTTP и Javascript, а затем смоделировали поведение хранилища файлов cookie в браузере, чтобы определить поведение отслеживания."
Эта сложная реконструкция заняла большую часть времени команды в прошлом году, но конечным результатом является исторический обзор тенденций стороннего отслеживания ведущих интернет-сайтов с 1996 по 2016 год. Они количественно оценили рост стороннего веб-отслеживания и проиллюстрировали появление различных методов отслеживания с течением времени.
В 1996 году среднее количество сторонних запросов на популярных веб-сайтах было меньше одного. Десять лет спустя это число выросло примерно до 1.5. Сегодня средний популярный веб-сайт имеет в среднем не менее четырех сторонних трекеров, отслеживающих активность пользователей.
Команда подчеркивает, что эти цифры, вероятно, занижены, поскольку не все веб-сайты полностью заархивированы.
Они также обнаружили, что сегодня индивидуальные трекеры охватывают гораздо большую часть Интернета. До 2003 года ни один трекер не мог наблюдать за просмотром более чем 5 процентов самых популярных сайтов.
К 2007 году это число увеличилось до 10 процентов. Сегодня многие популярные трекеры расширили свое покрытие как минимум до 20 процентов сайтов, в то время как одна сторонняя компания — Google Analytics — находится на более чем трети самых популярных сайтов. Эти результаты важны для понимания влияния отслеживания на конфиденциальность, поскольку отслеживание пользователей на большем количестве сайтов позволяет трекерам составить более подробную и близкую картину их поведения.
Эта 20-летняя историческая перспектива рисует четкую картину того, как стороннее отслеживание эволюционировало с появлением и падением различных техник, развитием технологий и нашей растущей зависимостью от Интернета в нашей жизни.
Как правило, третьи стороны наблюдают и собирают информацию. Как мы можем относиться к этому, еще неизвестно.
"Без контекстуализации сегодняшнего поведения отслеживания в истории Интернета, мы не знаем, должны ли пользователи испытывать растущую озабоченность по поводу своей конфиденциальности или защитники конфиденциальности плачут, как волк. Более того, мы не можем оценить, имеют ли влияние протесты СМИ, обсуждения политики или изменение настроек браузера по умолчанию », — сказал Рознер. "Наша работа дает нам инструменты, чтобы ответить на эти вопросы. Наши результаты показывают, что веб-отслеживание должно оставаться проблемой для защитников конфиденциальности."
Посетите веб-сайт проекта команды по адресу https: // trackingexcavator.CS.Вашингтон.edu.
