Мы уже писали, что искусственный интеллект AlphaGo не раз побеждал сильнейших игроков в го. Но теперь он «всухую» проиграл новой версии алгоритма под названием AlphaGo Zero. Как сообщается, последняя версия стала самообучаемой.

Если ранее ИИ обучался на тысячах партий, сыгранных любителями и профессиональными игроками, то AlphaGo Zero предоставили только правила игры и дали возможность самой сформировать выигрышную стратегию. ИИ в произвольном порядке размещал камни на доске, фиксировал удачные ходы и на основании предыдущего опыта формировал успешные действия против самого себя.

Для того, чтобы обыграть версию AlphaGo, которая победила Ли Седоля в марте 2016 года, версии AlphaGo Zero потребовалось всего 3 дня. На 21 день она обыграла AlphaGo Master, который победил лучшего в мире игрока в го Кэ Цзе минувшей весной. А на 40 день AlphaGo Zero уже могла обыграть всех своих предшественников. В итоге AlphaGo проиграл AlphaGo Zero со счетом 0:100.

Таким образом, теория о том, что сознание не является необходимым для обучения, получила ещё один аргумент.