Анализ Twitter может помочь игрокам побороть распространение игр НФЛ

Ответ, говорят компьютерные ученые из Университета Карнеги-Меллона, положительный. Или, по крайней мере, это может немного помочь в определенное время в течение сезона. Они сообщат о своих выводах 27 сентября на конференции по машинному обучению и интеллектуальному анализу данных для спортивной аналитики в Праге, Чешская Республика.Исследование началось как классный проект тогдашним студентом Кевином Гимпелем, ныне доцентом-исследователем Технологического университета Toyota в Чикаго.

В конечном итоге он включал три сезона НФЛ, 2010-2012 гг. Исследователи использовали автоматизированные инструменты для сортировки потока твитов, который в 2012 году составлял в среднем 42 миллиона сообщений в день.Из них исследователи вытащили сообщения с хэштегами, связанными с отдельными командами НФЛ — #giants, #newyorkgiants, #nygiants, #steelers, #steelersnation и т. Д. — которые были отправлены не менее чем через 12 часов после начала командных соревнований. предыдущая игра и за час до начала ее предстоящей игры. В 2012 году было выявлено более миллиона таких сообщений.

Идея, как объяснил Кристофер Дайер, доцент Института языковых технологий CMU, заключалась в том, чтобы увидеть, что можно угадать из коллективной мудрости или настроений фанатов, отраженных в их твитах. Могут ли простые показатели, такие как количество твитов или распределение положительных и отрицательных слов в твитах, дать представление о том, какие команды выиграют, какие команды превзойдут разброс очков, или предоставить рекомендации по размещению ставок на линии больше / меньше ( общее количество очков, набранных обеими командами в игре)?«Это эксперимент каждую неделю», — сказал Дайер.

Они обнаружили, что их анализ твитов не очень помог, когда дело дошло до предсказания победителей или большего / меньшего результата. Но когда дело дошло до выигрыша с помощью спреда, исследователи заявили, что их метод был точен на 55 процентов. Дайер признал, что это не дает большого преимущества, но может быть достаточно для получения прибыли.Разумеется, при установке спреда букмекеры учитывают не только результаты команды или такие факторы, как преимущество домашнего поля и прогнозы погоды.

Цель состоит в том, чтобы привлечь равное количество ставок для обеих команд, что минимизирует финансовые риски букмекера. Дайер отметил, что на разброс влияют определенные психологические факторы, что позволяет предположить, почему оценка настроений болельщиков команды может дать некоторые преимущества для ставок.

Но исследователи также глубоко оценили эффективность спортивных книжек и то, насколько сложно преодолеть разброс. «Одна вещь, которая нас удивила, — это то, насколько сложно установить разброс точек, чтобы добиться успеха», — сказал Дайер. «И спортивные книги очень, очень хороши».Существовали ограничения на то, что Твиттер мог раскрыть. Дайер сказал, что анализ Твиттера не сработал в течение первых четырех недель сезона. И в последние несколько недель сезона, когда многие команды начинают изменять свои стратегии в рамках подготовки к пост-сезону, анализ Twitter также оказался бесполезным.

Хотя преимущества анализа Твиттера были скромными, Дайер сказал, что улучшения могут быть возможны при более сложном анализе содержания твитов. Кроме того, распространенной проблемой анализа Twitter является быстро меняющийся характер социальной сети. «Это движущаяся цель», — объяснил Дайер. «В этом году в Твиттере больше людей, чем годом ранее и годом ранее».

Количество твитов, проанализированных исследователями в сезоне 2012 года, было в пять раз больше, чем количество твитов в сезоне 2010 года.Сами букмекеры могут выиграть от анализа Twitter, если они еще не используют его, сказал Дайер.

Что касается исследователей, в число которых входил доцент кафедры языковых технологий и машинного обучения Ноа Смит и студент-математик Шиладитья Синха, то их интересовало исключительно понимание того, как можно анализировать и использовать данные Twitter.«Насколько мне известно, — сказал Дайер, — никто из нас не делал ставки, основываясь на наших выводах».