Ми вже писали про перемогу ШЇ у грі го. Тепер же новий алгоритм зміг перемогти людей в області, яка традиційно вважалася нездоланною для машини. А саме – в покері, тобто у грі з неповною інформацією.

У 2015 році алгоритм Claudico за підсумками покерного турніру з чотирма живими гравцями посів третє місце. Змагання тривали два тижні — за цей час було зіграно 80 тисяч роздач. Новий же алгоритм Libratus зіграв 120 тисяч роздач в безлімітний техаський холдем. Змагання тривало 20 днів. Проти нової версії програми виступили Джиммі Чу, Даніель МакОлэй, Джейсон Ліс і Кім Донг, однак комп’ютер зміг обіграти їх, заробивши більше $1,7 млн. При цьому призовий фонд у розмірі $200 тисяч розділять між гравцями-людьми.

Розробники обіцяють відкрити подробиці роботи механізму Libratus найближчим часом. Зазначимо, що такі системи зможуть допомогти у питаннях інформаційної безпеки, при проведенні аукціонів, на переговорах і так далі.

Розробники заявили, що алгоритм складається з трьох частин: «ядра», на тренування якого пішло 15 мільйонів ядро-годин; модуля моніторингу помилок суперників; і модуля моніторингу власних помилок. Така система дозволила програмі як блефувати, так і розпізнавати блеф.