Искусственный интеллект пока что далёк от того, что показывают в фильмах вроде «Терминатора» или «Матрицы». Однако при этом он уже достаточно умён для того, чтобы жульничать и использовать читы. Во всяком случае, в играх.

Как и где это удалось сделать

Искусственный интеллект, разработанный в Фрайбургском университете, Германия, самостоятельно создал новые необычные способы прохождения заданий в аркадных играх, которые использовались для его обучения. Как сообщается, в старой аркаде Q * bert (1982 год) ИИ придумал два необычных способа игры. В игре нужно перемещать персонажа по имени Кьюберт по изометрической пирамидальной структуре из трёхцветных кубиков. Прыгая по кубикам, персонаж перекрашивает их в заданный цвет.

Но это так задумано, и так действуют обычные игроки. ИИ придумал другие способы достичь победы. Как оказалось, в коде Q * bert есть баг, который позволяет совершить самоубийство персонажа, но при этом пройти уровень. Этим и воспользовался ИИ. Причём баг он нашёл самостоятельно.

Он завершает первый уровень, а затем начинает прыгать с платформы на платформу, это кажется случайным. По неизвестной нам причине игра не продвигается ко второму раунду, но платформы начинают мигать, и агент быстро получает огромное количество очков (около 1 миллиона для нашего временного ограничения на эпизод). Интересно, что сеть не всегда может использовать эту ошибку в игре

Разработчики ИИ

Всего же нейросеть играла в 8 старых игр от компании Atari.

А как в других играх?

Мы ранее сообщали, что нейросеть AlphaGo победила человека в игре го (которая долгое время считалась «невозможной» для машины). При этом ведущий программист AlphaGo Дэвид Сильвер заявил, что система использовала стратегии, которые были забыты или отброшены человечеством тысячи лет назад.

Он обнаружил человеческие стратегии, он их пробовал, а затем в конечном итоге нашёл то, что он предпочитает

Дэвид Сильвер

А разработчики DeepMind создали нейросеть Alpha Zero, которая обучилась игре в шахматы сама. Из исходных данных она получила только правила игры, но никакой конечной стратегии. При этом через 14 часов обучения Alpha Zero смогла «порвать» самую рейтинговую шахматную программу под названием Stockfish.

В целом, подобный подход показывает, что искусственный интеллект сможет в перспективе использоваться для улучшения безопасности игр и сложных программ, а также писать их, ориентируясь по исходным данным.