Ми вже не раз писали про алгоритм Alpha Go від DeepMind. Раніше він обіграв чемпіонів у грі го, а тепер нова версія – Alpha Zero, за 14 годин освоїла го, шахи і японську сьоги, при цьому обійшла кращі спеціалізовані алгоритми. При цьому алгоритм ніхто не навчав – йому просто дали правила гри і можливість тренуватися з самим собою.

Після 8 годин ігор з самим собою Alpha Zero зміг обіграти свою попередню версію Alpha Go, а потім – кращий в світі шаховий алгоритм Stockfish. Те ж відбулося і з японськими шахами.

Звичайно, шахова гра сама по собі простіше, ніж го, тому алгоритм куди швидше зміг навчитися. Але той факт, що універсальний ігровий алгоритм зміг самостійно навчитися грі на настільки високому рівні, що говорить про серйозний прогрес у цій області. При цьому він став вимагати набагато менших обчислювальних ресурсів. Якщо стара версія вимагала 48 тензорних процесорів (TPU) на декількох комп’ютерах, то нова обійшлася 4 TPU.

При цьому гра – не єдина сфера застосування таких ШІ. Вони знадобляться і в науці.

Розробка ліків, білків, квантова хімія, нові матеріали — тільки подумайте, можливо, не за горами поява надпровідника, що працює при кімнатній температурі

Деміс Хассабис, голова DeepMind