Несмотря на бомбы, все языки склоняются к счастью: универсальное человеческое пристрастие к позитивным словам

Несмотря на бомбы, все языки склоняются к счастью: универсальное человеческое пристрастие к позитивным словам

Теперь команда ученых из Университета Вермонта и корпорации MITER применила подход больших данных — используя массивный набор данных из многих миллиардов слов, основанный на фактическом использовании, а не на мнении «экспертов», — чтобы подтвердить 1960-е годы. Угадай.
Субтитры к фильмам на арабском языке, ленты Twitter на корейском языке, известная темная литература России, веб-сайты на китайском языке, музыкальные тексты на английском языке и даже истерзанные войной страницы New York Times — исследователи обнаружили, что это, а возможно, и все человеческие язык¬, склоняется к использованию счастливых слов.
«Мы изучили десять языков», — говорит математик UVM Питер Доддс, соавтор исследования, — «и во всех источниках, на которые мы смотрели, люди используют больше положительных слов, чем отрицательных."

Но разве наш глобальный поток проклятий в Твиттере, фильмах ужасов и бесконечных СМИ о бедствии в дневное время не означает, что это не может быть правдой?? Нет. Это огромное исследование «атомов языка — отдельных слов», говорит Доддс, показывает, что сам язык — возможно, величайшая технология человечества — имеет позитивный взгляд на вещи.

И, следовательно, "кажется, что позитивное социальное взаимодействие", — говорит Доддс, — встроено в его фундаментальную структуру.
Новое исследование «Человеческий язык выявляет универсальную позитивную предвзятость» появилось в онлайн-выпуске журнала Proceedings of the National Academy of Sciences от 9 февраля.

Счастье выше среднего
Чтобы глубоко изучить эту возможность Поллианны, команда ученых из лаборатории вычислительных историй UVM — при поддержке Национального научного фонда и корпорации MITER — собрала миллиарды слов со всего мира, используя двадцать четыре типа источников, включая книги и новости. торговые точки, социальные сети, веб-сайты, субтитры к телешоу и фильмам, а также тексты песен. Например, «мы собрали около ста миллиардов слов, написанных в твитах», — говорит математик UVM Крис Данфорт, который руководил новым исследованием.
Затем из этих источников команда определила около десяти тысяч наиболее часто используемых слов на каждом из десяти языков, включая английский, испанский, французский, немецкий, бразильский португальский, корейский, китайский (упрощенный), русский, индонезийский и арабский языки.

Затем они платили носителям языка за то, чтобы они оценили все эти часто используемые слова по девятибалльной шкале от глубоко нахмуренного лица до широко улыбающегося. От этих носителей языка они собрали пять миллионов человеческих оценок слов. В среднем по английскому языку "смех" получил 8 баллов.50, «еда» 7.44, "грузовик" 5.48, "the" 4.98, "жадность" 3.06 и "террорист" 1.30.
Поиск в Google испаноязычных сайтов показал самый высокий средний уровень словесного счастья, а поиск китайских книг — самый низкий, но — и вот в чем дело — все двадцать четыре источника слов, которые они проанализировали, оказались выше нейтральной оценки. из пяти по шкале от одного до девяти — независимо от языка.

На всех языках нейтральные слова, такие как "the", набирают именно то, что вы ожидаете: посередине, около пяти. И когда команда переводила слова с одного языка на другой, а затем обратно, они обнаружили, что «оценочное эмоциональное содержание слов одинаково для разных языков."

Во всех случаях ученые обнаружили «предвзятость позитивности, инвариантную к использованию», как они пишут в исследовании. Другими словами, глядя на слова, которые люди на самом деле используют чаще всего, они обнаружили, что в среднем мы — человечество — «используем больше счастливых слов, чем грустных», — говорит Данфорт.

Моби Дик vs. Граф Монте Кристо

Это новое исследование также описывает более крупный проект, который команда из четырнадцати ученых разработала для создания «физических инструментов» для измерения счастья в крупномасштабных текстах как в реальном времени, так и в автономном режиме — «в основном, огромные пакеты слов» ", — объясняет Данфорт.
Этот инструмент называют «гедонометром» — измерителем счастья. Теперь он может отслеживать глобальный сигнал счастья из англоязычных постов в Твиттере почти в реальном времени и показывать разные сигналы счастья в разные дни.

Например, большое падение было отмечено в день теракта на Charlie Hebdo в Париже, но в следующие три дня оно восстановилось. Гедонометр также может различать различные сигналы счастья в штатах и ​​городах США: в настоящее время у Вермонта самый счастливый сигнал, а у Луизианы — самый печальный.

По последним данным, Боулдер, штат Колорадо, занимает первое место по уровню счастья, а Расин, штат Висконсин, находится внизу.
Но, как описывается в новом документе, команда работает над применением гедонометра для изучения сигналов счастья на многих других языках и из многих источников, помимо Twitter. Например, команда применила свою технику к более чем десяти тысячам книг, вдохновленных идеей Курта Воннегута «формы историй».

Визуализации эмоциональных взлетов и падений этих книг можно увидеть на веб-сайте гедонометра; они растут и падают, как тикер фондовой биржи. Новое исследование показывает, что 170 914 слов Моби Дика имеют четыре или пять основных впадин, которые соответствуют нижним точкам истории, а сигнал гедонометра резко падает в конце, раскрывая мрачно загадочный вывод этого классического романа. Напротив, «Граф Монте-Кристо» Дюма — 100 081 слово по-французски — заканчивается ликующей нотой, о чем свидетельствует сильный всплеск на шкале.
Новое исследование «никоим образом не утверждает, что все естественные тексты будут иметь позитивный сдвиг», пишут исследователи, поскольку эти различные книги показывают.

Но на более элементарном уровне исследование приводит доказательства из больших данных в давнюю дискуссию об эволюции человека: наша социальная природа, по-видимому, закодирована в строительных блоках языка.