ReBeL – новый покерный бот от Facebook

Автор
NewSted
Опубликовано
30.07.2020
Обновлено
30.07.2020

Подразделение Facebook, занимающееся разработкой искусственного интеллекта, на днях опубликовало доклад о создании и успешном тестировании нового покерного бота ReBeL. Разработчики заявили, что его алгоритмы мощнее и эффективнее чем у Libratus – единственного бота, который смог обыграть ПРО-покеристов.

ReBeL-new-poker-bot-Facebook_1

Facebook AI Research – лидер в разработке покерных ботов?

В 2019 году одно из подразделений Фэйсбук уже наделало много шума, выпустив бота Pluribus, который по факту оказался просто еще одним шагом в развитии ИИ, но никак не "убийцей покера", способным играть в плюс не только HU, но и 6-макс против сильных соперников.

На этот раз, правда, никаких громких заявлений о влиянии бота на покерную индустрию и его революционных возможностях не было. Также, как и записей видео игры против реальных оппонентов. Компания Rebel AI ограничилась 27-страничным отчетом с описанием общих принципов работы своего бота и его сравнением с программами предыдущего поколения.

Что такое ReBeL?

Название бота представляет собой аббревиатуру фразы "Recursive Belief-based Learning", то есть упор в нем сделан на возможность самообучения в условиях ограниченной информации. Это подтверждает и название отчета от трех разработчиков (Ноума Брауна, Антона Бахтина и Адама Гуна) – "Комбинация глубокого обучения и подкрепленного поиска для игр с неполной информацией".

Создан ReBeL на основе бота DeepStack, который первым в 2017 году обыграл в покер человека. Его главное отличие от всех предыдущих разработок в этой сфере заключается в использовании так называемого «Public Belief States» (PBS).

PBS – это новый механизм самообучения бота, который включает в себя не только анализ непосредственной информации об игре, но и ведет учет мнения соперника о его положении в процессе розыгрыша.

То есть ReBeL уже не только анализирует саму раздачу, но и то, как ее может оценивать его оппонент, как это делают все успешные живые игроки.

Какие результаты показал новый бот?

ReBeL, по сравнению со всеми своими предшественниками, работает быстрее: на розыгрыш он тратит минимум на 2 секунды меньше, чем Libratus, и для принятия решения ему требуется не более 5 секунд.

Единственный игрок в покер, против которого он сыграл, был Донг Ким (именно он меньше всего проиграл Либратусу).

На дистанции в 7,500 раздач программа выигрывала у человека 0,165ББ за одну руку, тогда как Libratus имел показатель в 0,147ББ.

Понятно, что для более реальной оценки возможностей ReBeL нужен полноценный тест против целой группы сильных покеристов. Особенно, для понимания реального уровня работы PBS.

Насколько опасен ReBeL для онлайн-покера?

Разработчики бота сразу заявили, что их целью не являются какие-то достижения их детища в сфере покера. Он должен помочь людям в организации сложных систем с неполной информацией, например, транспортной логистики, аукционов, кибербезопасности. Также они не намерены обнародовать его код.

А для успокоения игроков в покер можем сказать, что:

  • Как и в случае с Pluribus, винрейт для этого бота высчитывался с помощью алгоритма сглаживания дисперсии Aivat, что автоматически завышает размер выигрыша.
  • ReBeL создан и работает только в играх с «нулевой суммой», применительно к покеру это означает полное отсутствие рейка.
  • Бот рассчитан только на игры в HU-формате.

Поэтому в современной борьбе игроков и аффилейтов против проявлений нечестной игры в покер-румах ReBeL никак не сможет быть на стороне ботоводов.

Have a question? Contact us:
Anton Manager Wpd Ru
Антон
Online
Глава службы поддержки
Еще по теме