Искусственный интеллект покоряет всё новые вершины. На сей раз группа разработчиков из канадского стартапа Maluuba, который был ранее приобретен корпорацией Microsoft, смогла разработать платформу, которая показала превосходные результаты в старой и до сих пор популярной игре Pac-Man.

Первоначально эта игра вышла ещё в 1982 году. В тесте использовалась версия для Atari 2600. Программа смогла побить все ранее установленные рекорды и набрать 999 990 очков.

Некоторые эксперты полагают, что такая победа показывает достижение в области слабого искусственного интеллекта (слабый ИИ – это тот, что не может осознавать себя и мыслить подобно человеку).

Для того, чтобы достичь успеха, команда Maluuba решила разбить игру на группу мелких элементов, с поиском решения для взаимодействия с каждым из них. Далее эти элементы были распределены среди ИИ-агентов, каждый из которых решал свою определенную задачу. Дойна Прекап, профессор из McGill University в Монреале, заявила о том, что идея, предложенная разработчиками, заслуживает внимания. По ее мнению, именно так работает в некоторых случаях мозг человека — разбивает какую-то проблему на несколько составляющих и решает последовательно каждый из элементов.

Свой метод разработчики назвали Hybrid Reward Architecture, в нем используется более 150 ИИ-агентов, каждый из которых работает параллельно с другими в процессе прохождения игры. Причем каждый из агентов получает «награду» при успешном прохождении своего участка игры.

Кроме «мелких» агентов, существует еще один агент высшего уровня, который занимается сведением воедино всех данных, полученных от всех «подчиненных». Он же и принимает решение о том, куда должна двигаться фигурка героя. При этом анализируется большое количество данных. Главный фактор — это направление движения, выбранное максимальным количеством элементарных агентов. С другой стороны, если 100 агентов хотят идти направо, чтобы получить трофей, но 3 агента планируют свернуть налево, поскольку заметили призрака, то главный агент «послушает» этих троих.

При этом, как заявил главный разработчик, когда агентов запрограммировали на эгоистичное поведение, система начала улучшать результаты в целом. Проще говоря – общий результат был лучше, когда агенты принимали решение без оглядки на других. А вот общее решение о направлении движения героя принимает уже главный агент. Он оценивает различные факторы и командует, куда нужно идти.

Это баланс между, с одной стороны, необходимостью взаимодействия, и с другой стороны, необходимостью принимать индивидуальные решения

Харм ван Сейджен, глава исследовательской группы Microsoft

При этом было отмечено, что Pac-Man выбрали по той причине, что в игре нужно мыслить «по-человечески».

Многие компании работают над ИИ для игр, разрабатывая собственные проекты, поскольку для прохождения нужны многие человеческие качества

Рауль Мехротра, один из программистов Maluuba

Как отмечается, такая программная платформа может использовать во многих сферах. Например, ее можно привлечь к работе внутри компании, которая занимается продажами, чтобы предсказывать динамику наплыва покупателей, популярность товаров и так далее. При этом, система может работать как с общими тенденциями, так и с отдельными факторами, включая индивидуальных покупателей.