Программа для игры в покер знает, когда их сбрасывать: лимит хедз-ап для холдем-покера решен

«Покер был проблемой для искусственного интеллекта более 40 лет назад, и до сих пор хедз-ап лимитный техасский холдем-покер не был решен», — говорит Боулинг, ведущий автор и профессор факультета естественных наук, результаты которого были опубликованы в январе. 9 в науке.Покер — это семейство игр, в которых представлена неполная информация, а игроки не имеют полной информации о прошлых событиях. Самый популярный вариант покера сегодня — Техасский холдем.

Когда в него играют только два игрока (хедз-ап) и с фиксированными размерами ставок и количеством рейзов (лимит), это называется хедз-ап лимитным холдемом. Хотя хедз-ап лимитный холдем меньше по размеру, чем шашки, но из-за несовершенной информации, компьютер становится гораздо более сложной игрой для игры или решения.«Мы определяем игру, которая должна быть решена по существу, если в течение всей продолжительности игры невозможно статистически отличить ее от решаемой с достоверностью 95%», — объясняет Боулинг. «Представьте, что кто-то играет в покер 200 рук в час по 12 часов в день, не пропуская ни дня в течение 70 лет. Более того, представьте, что он использует наихудшую, максимально эксплуатирующую стратегию оппонента и никогда не совершает ошибок».

Хотя многие игры с идеальной информацией (где все игроки информируются обо всем, что произошло в игре до принятия решения) были решены, например, Connect Four, ни одна нетривиальная игра с несовершенной информацией, в которую играют люди на соревнованиях, ранее не решалась. Эти игры более сложные: теория, вычислительные алгоритмы и примеры решенных игр отстают от результатов в идеальной информационной обстановке. И хотя точная информация может быть общим свойством комнатных игр, в реальных условиях принятия решений она встречается гораздо реже.«Прорыв, лежащий в основе этого результата, — это общие алгоритмические достижения, которые делают теоретико-игровые рассуждения в крупномасштабных моделях любого вида более понятными», — говорит Боулинг.

И, хотя теория игр казалась игривой, всегда предполагалось, что она будет иметь серьезные последствия, включая всплеск теоретико-игровых приложений, связанных с безопасностью, таких как системы, развертываемые на контрольно-пропускных пунктах аэропортов, диспетчеризация воздушных судов и патрулирование береговой охраны. В реальных условиях принятия решений, которые почти всегда связаны с неопределенностью и отсутствующей информацией, алгоритмические достижения, такие как те, которые необходимы для решения проблемы покера, необходимы для управления будущими приложениями.

Пн	Вт	Ср	Чт	Пт	Сб	Вс
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Похожие записи