Спецпроект

19 сентября 2020, 11:59 6 мин.

Сначала компьютер победил человека в шахматы и го, потом пришел за покером. Да, искусственный интеллект умеет блефовать

Автор

Покер – одна из самых сложных игр для искусственного интеллекта. В отличие от шахмат или шашек, это игра с неполной информацией – компьютер не может точно знать, какие карты на руках у оппонента, он может только догадываться. Кроме того, в покере часто блефуют, что сложно поддается математическому анализу. Наконец, в покер играет, как правило, несколько человек с разными стратегиями – чтобы выигрывать, надо быть успешным против каждой.

Искусственный интеллект уже год как справился с этой задачей. Впрочем, сомнений в том, что это произойдет, не было по крайней мере с 2015 года, когда AI только начал свой путь к покорению покера. Это не повод для грусти – да, покер стал «решенной» игрой, но зато, как и в шахматах, изучение компьютерных стратегий обогатит игру и, возможно, приведет к пересмотру даже тех вещей, которые считаются аксиоматическими.

Расскажем обо всем по порядку, но сначала напомним, что играть в покер с живыми людьми лучше всего в покер-руме ПокерОК. Сейчас там идет мини-WSOP – серия турниров Good Game Series Of Poker для микролимитчиков, полностью повторяющая WSOP, только с небольшими бай-инами и высокими призовыми.

Первая победа: Cepheus

Сконструировать такой искусственный интеллект, который бы устойчиво обыгрывал людей в их любимые игры – одна из самых сложных задач современности, поэтому неудивительно, что ей занимаются в основном ученые. Программу Cepheus, названную то ли в честь персонажа греческой мифологии Кефея, то ли в честь созвездия (а скорее всего – в честь обоих), разработали еще в 2014 году эксперты из университета в Альберте.

Результаты их работы были опубликованы в Science: через 70 дней обучения Cepheus стал настолько хорошо играть в хедз-ап (=один на один) пот-лимит (=с фиксированными ставками) покер, что мог обыгрывать любого профессионала. Более того, он выбирал такие ходы, которые исключали, что человек, даже если будет играть с Cepheus всю жизнь, сможет достичь уровня компьютера. «Мы не говорим, что он будет выигрывать деньги каждую раздачу. Но на дистанции компьютер не может проиграть – будет ничья или победа AI», – радовался один из разработчиков Cepheus Майкл Боулинг.

Тогда казалось, что это еще не конец. В конце концов, покер с лимитированными ставками не настолько популярен, как безлимитный, к тому же понятно, что вариантов применить блеф там намного меньше. Поэтому победа Cepheus не оказала большого влияния на покерный мир, а ученые начали создавать такой компьютер, который бы умел играть в безлимитные игры.

И снова человек потерпел поражение: Libratus отомстил за Claudico

В 2016-м произошло важное событие не из мира покера, после которого стало понятно, что победа в безлимитной игре – вопрос времени. В 2016-м компьютер AlphaGo победил в го лучшего игрока планеты Ли Седоля.

Особенность той победы в том, что компьютер не перебирал комбинации, а учился «думать». Позднее в усовершенствованные AI системы AlphaGo вообще перестали загружать партии с людьми – искусственный интеллект учился только на партиях с самим собой (последняя версия AlphaGo обыграла ту, против которой сражался Ли Седоль, со счетом 100:0).

Одновременно с этим происходила работа над «решением» покера. Наиболее значительных результатов добились в Университете Карнеги Меллон. Сначала там создали Claudico, который в 2015 году сразился с четырьмя профессионалами в хедз-ап покер и проиграл – три из четырех профессионалов обыграли искусственный интеллект на дистанции в 80 тысяч раздач, на время подтвердив, что компьютеру не дается блеф.

За Claudico отомстил Libratus, разработка того же университета. В 2017 году он сразился также против четырех профессионалов, на этот раз количество раздач было увеличено до 120 тысяч, это заняло 20 дней. Уже в начале стало понятно, что профи соревнуются не с Libratus, а между собой – кто проиграет меньше всех. Компьютер легко обыграл всех четверых, зарабатывая по 14,7 больших блайнда за 100 раздач.

Теперь ученым предстояло самое сложное: допустить компьютер до покера, в котором играет больше двух человек. AI должен был не только научиться держать в голове несколько стратегий разных оппонентов, но и разыгрывать мультипоты – когда до вскрытия могут дойти сразу несколько человек.

И тут пришел Pluribus

Новую разработку университет Карнеги Меллон делал вместе с Facebook. В 2019 году Pluribus сыграл два матча: в одном он сражался с пятью профессионалами, в другом – профессионалы сражались с пятью копиями AI, которые не передавали информацию друг другу. Иными словами, Pluribus решил победить самый популярный тип покера.

За 12 дней компьютер сыграл 10 тысяч раздач и оказался успешен в обеих дисциплинах – покерные игроки не могли подобрать ключ к искусственному интеллекту ни в одиночку, ни когда все были за столом. Pluribus постоянно менял стратегии, не давая возможности различить паттерны в его действиях. Кроме того, он делал шаги, которые в покере считаются минусовыми и ассоциируются с действиями новичков. В частности, обсуждались его частые «донк-беты»: компьютер играл пассивно, а когда на столе появлялась следующая карта, вдруг ставил в оппонента, который до этого был агрессором (как правило, такие ставки считаются показателем блефа и легко раскусываются даже непрофессиональными игроками).

Из комментариев профессиональных игроков мы знаем, что все AI играют не только непредсказуемо, но и очень агрессивно: чтобы проверять их блефы или полублефы, игрокам надо жертвовать значительным количеством фишек. Кроме того, в его модель было заложено, чтобы Pluribus в основном сосредотачивался на следующих двух-трех шагах, а не на долгосрочной стратегии – и это дало неожиданно хорошие результаты.

«Можно с уверенностью сказать, что он играет на сверхчеловеческом уровне. И это уже не поменяется», – уверен один из разработчиков Pluribus Ноам Браун.

***

Теоретически еще остались виды покера, в которых искусственному интеллекту предстоит доказать свою состоятельность – например, в больших турнирах, где стратегию необходимо адаптировать к постоянному увеличению обязательных ставок. Тем не менее, уже сейчас можно сказать, что покер стал «решенной» игрой.

Разработчики Pluribus не планируют зарабатывать на покере: их модель перестала обновляться, и можно надеяться, что по крайней мере какое-то время такие AI не выйдут из стен научных лабораторий и не убьют онлайн-покер. Сами ученые считают, что похожие на Pluribus системы пригодятся в кибербезопасности, в финансовых переговорах, для предотвращения преступлений или будут помогать компьютерам в беспилотных автомобилях – в общем, везде, где приходится сталкиваться с решением задач с неполной информацией.

Ну а игрокам в покер остается только изучать раздачи Pluribus и других AI и подмечать в них что-то, что сделает их похожим на суперкомпьютер. А также соревноваться в онлайн и офлайн-турнирах по типу WSOP, Мировой серии покера для живых людей (искусственному интеллекту вход запрещен), которая в этом году проходила в покер-руме GGпокерок. За время серии общий призовой фонд превысил несколько десятков миллионов долларов.

Фото: poker.srv.ualberta.ca; youtube.com/Engadget ; qz.com

Искусственный интеллект

WSOP

50 комментариев

По дате

Лучшие

Актуальные

С диалогами

Mbest77

16 сентября 2020, 17:52

Прикольно. Покеррум оплачивает статью о том, что не надо онлайн играть в покер, искусственный интеллект тебя рано или поздно обыграет

Cousin Avi

16 сентября 2020, 18:06

Ответ Mbest77

я играю в этом руме, они реально делают максимум для борьбы с любым софтом и ботами. Если что не реклама, просто констатация факта. Старзы курят в сторонке по сравнению с ГГ. Вроде даже ГГ их по трафику обогнали в последнее время. На ГГ любой софт запрещен типа ХМ и прочих приблуд. Так что вариант наткнуться там на бота в процентах намного ниже, нежели в любом другом руме, который разрешает сторонний софт.

Eltay Shakhmarov

16 сентября 2020, 19:37

Ответ Cousin Avi

Ты очевидно не очень хорошо понимаешь, что румы где софт разрешен, более безопасны, тк софт позволяет как раз увидеть ботов , которые играют по GTO, умник.

podkop09

16 сентября 2020, 17:53

Главное чтобы такие проги не пришли в онлайн покер, надо бороться румам как с любым другим запрещенным софтом, а то смысл покер онлайн потеряет, когда там будут AI читаки

GromwuD

16 сентября 2020, 18:11

Ответ podkop09

то смысл покер онлайн потеряет, когда там будут AI читаки
-------------------------------------------------------
Онлайн покер давно потерял смысл, с изменением расчета рейка и огромным количеством ботов от самого рума.

Евгений Медведев

16 сентября 2020, 18:29

Ответ podkop09

Скорее всего, они уже давно туда пришли.

АтАс

16 сентября 2020, 17:55

ИИ уже умеет блефовать? Судный день не за горами....

Serghi991 S

16 сентября 2020, 17:43

Странно, думал покер для компа намного проще шахмат

Cousin Avi

16 сентября 2020, 18:07

Ответ Serghi991 S

Странно, думал покер для компа намного проще шахмат

в шахматах всё понятно, весь расклад перед глазами. А в покере 2 карты у каждого оппонента скрыты. В этом вся соль.

Levais

16 сентября 2020, 18:28

Ответ Cousin Avi

Нет там никакой соли. Либо правильная карта у оппонента, либо нет. Либо тебе придёт правильная карта, либо нет.
А в шахматах думать надо.
Собственно это и есть те самые "игры с не полной информацией".

Zlatan

19 сентября 2020, 15:17

Когда же ИИ придет за компьютерными играми? Тупость компьютера в стратегиях просто неимоверна

Пользователь заблокирован

16 сентября 2020, 21:12

Следующим заходом сделают Скайнет и амба! ААААААААААААААА

Леван Мкртчян

19 сентября 2020, 16:39

Обьеденение ИИ и нейросетей...приведёт к феноменальному результату ...если правильно помню ...в игре Го..в одной из партий с чемпионом мира...программа сделала ход...который вошёл в историю ..помоему ход 34 или 37 был...все игроки признали потом , что этот ход был невероятно творческим..абсолютно не вытекающем из логики позиции...в итоге этот ход привёл в замешательство чемпиона..и программа уверено победила

omgwtf

30 ноября 2020, 17:54

Подключив гугл аналитику компьютер будет учитывать характер игрока, так сказать психологию. Оптимист или пессимист. Сангвиник, халерик... Ну вы понимаете, о чем я? Безусловно время на принятие решения/ставки- важный показатель. Я думаю, что этим учёным было сделано разумное предложение и они поделились не самой программой, так ключом для создания копии. Даже в целях безопасности, старзы или ещё кто выделили из корпоративного бюджета сумму... Через пару лет таких гиборгов в казино начнут ловить за одним столом) А учёные пусть теперь над рулеткой думают...