«Это исследование действительно углубляет наше количественное понимание человеческого поведения», — сказал Дашун Ван, доцент кафедры информационных наук и технологий Пенсильванского университета. «Нам хотелось бы думать, что мы контролируем свое собственное поведение и можем делать то, что хотим. Но что мы начинаем видеть с большими данными, так это то, что существует очень глубокая закономерность, лежащая в основе большей части того, что мы делаем».
В ходе исследования данные о местонахождении и связи, собранные у трех международных операторов мобильной связи, показали, что люди передвигаются и общаются по предсказуемым схемам, сказал Ван.Он добавил, что, поскольку движение и общение связаны, исследователям может потребоваться только один тип данных, чтобы делать прогнозы о другом явлении.
Например, коммуникационные данные могут раскрывать информацию о том, как люди двигаются.«Во многих случаях у нас нет обеих сторон информации», — сказал Ван. «У нас может быть только информация о социальных связях, а может быть, только информация о мобильности. Это математическое уравнение позволяет нам выводить одно из другого».
По словам исследователей, которые сообщают о своих выводах в Proceedings of the National Academy of Sciences, уравнение может лучше прогнозировать, среди прочего, то, как может распространяться вирус. В ходе исследования они протестировали уравнение на моделируемой эпидемии и обнаружили, что для надежного прогнозирования распространения болезни можно использовать наборы данных о местоположении или коммуникации.«Одно из приложений, которое мы показали, заключается в том, что если мы знаем, кто с кем общается в стране, мы сможем оценить, как вирус будет распространяться в этой стране», — сказал Ван. «Чтобы узнать, как распространяется вирус, традиционно нам нужно знать, как люди передвигаются, но теперь нам не нужно этого знать. Если вирус, такой как вирус Зика, проник в Даллас, скажем, мы показывают, что мы не только знали бы, как он распространится по Соединенным Штатам, но и наши оценки будут гораздо более точными, чем те, которые были получены с помощью методов, которые мы использовали ранее ».
Он добавил, что исследователи также могут использовать эти данные, чтобы предсказать, как идеи и тенденции распространяются в культуре.Ван сказал, что это явление основано на математических правилах, часто называемых степенным законом распределения.
Этот закон описывает закономерность определенного поведения, но признает, что всегда есть небольшая вероятность случайного большого отклонения от нормы.«Например, большую часть времени люди перемещаются только на очень, очень короткие расстояния, просто в места вокруг города», — сказал Ван. «Но иногда вы совершаете прыжок в длину. Вы совершаете поездку в Нью-Йорк, а затем, когда вы там, вы можете сделать еще несколько коротких прыжков, прежде чем вернуться домой».Исследователи проанализировали данные из трех разных баз данных с сообщениями от 1,3 миллиона пользователей из Португалии и 6 миллионов пользователей из неназванной европейской страны.
Они также собрали данные за четыре года у крупного оператора мобильной связи в Руанде.По словам Ванга, наборы данных включали информацию о том, кто, кому звонит или отправляет текстовые сообщения.

