Мы уже не раз писали об алгоритме Alpha Go от DeepMind. Ранее он обыграл чемпионов в игре го, а теперь новая версия – Alpha Zero, за 14 часов освоила го, шахматы и японскую сеги, при этом обошла лучшие специализированные алгоритмы. При этом алгоритм никто не обучал – ему просто дали правила игры и возможность тренироваться с самим собой.

После 8 часов игр с самим собой Alpha Zero смог обыграть свою предыдущую версию Alpha Go, а затем – лучший в мире шахматный алгоритм Stockfish. То же произошло и с японскими шахматами.

Конечно, шахматная игра сама по себе проще, чем го, потому алгоритм куда быстрее смог обучиться. Но тот факт, что универсальный игровой алгоритм смог самостоятельно обучиться игре на столь высоком уровне, говорит о серьёзном прогрессе в этой области. При этом он стал требовать гораздо меньших вычислительных ресурсов. Если старая версия требовала 48 тензорных процессоров (TPU) на нескольких компьютерах, то новая обошлась 4 TPU.

При этом игры – не единственная сфера применения таких ИИ. Они пригодятся и в науке.

Разработка лекарств, белков, квантовая химия, новые материалы — только подумайте, возможно, не за горами появление сверхпроводника, работающего при комнатной температуре

Демис Хассабис, глава DeepMind