Штучний інтелект підкорює все нові вершини. Цього разу група розробників з канадського стартапу Maluuba, який був раніше придбаний корпорацією Microsoft, змогла розробити платформу, яка показала чудові результати в старій і досі популярній грі Pac-Man.

Спочатку ця гра вийшла ще в 1982 році. У тесті використовувалася версія для Atari 2600. Програма змогла побити всі раніше встановлені рекорди і набрати 999 990 очок.

Деякі експерти вважають, що така перемога показує досягнення в області слабкого штучного інтелекту (слабкий ШІ – це той, що не може усвідомлювати себе і мислити подібно людині).

Для того, щоб досягти успіху, команда Maluuba вирішила розбити гру на групу дрібних елементів, з пошуком рішення для взаємодії з кожним з них. Далі ці елементи були розподілені серед ШІ-агентів, кожен з яких вирішував свою певну задачу. Дойна Прекап, професор з McGill University в Монреалі, заявила про те, що ідея, запропонована розробниками, заслуговує уваги. На її думку, саме так працює в деяких випадках мозок людини розбиває якусь проблему на кілька складових і вирішує послідовно кожний з елементів.

Свій метод розробники назвали Hybrid Reward Architecture, в ньому використовується понад 150 ШІ-агентів, кожен з яких працює паралельно з іншими у процесі проходження гри. Причому кожен з агентів отримує «нагороду» при успішному проходженні своєї ділянки гри.

Крім «дрібних» агентів, існує ще один агент вищого рівня, який займається зведенням докупи всіх даних, отриманих від усіх підлеглих. Він же і приймає рішення про те, куди повинна рухатися фігурка героя. При цьому аналізується велика кількість даних. Головний фактор — це напрямок руху, вибране максимальною кількістю елементарних агентів. З іншого боку, якщо 100 агентів хочуть йти направо, щоб отримати трофей, але 3 агента планують повернути ліворуч, оскільки помітили привида, то головний агент «послухає» цих трьох.

При цьому, як заявив головний розробник, коли агентів запрограмували на егоїстична поведінка, система почала покращувати результати в цілому. Простіше кажучи – загальний результат був краще, коли агенти приймали рішення без оглядки на інших. А от загальне рішення про напрямок руху героя приймає головний агент. Він оцінює різні фактори і командує, куди потрібно йти.

Це баланс між, з одного боку, необхідністю взаємодії, і з іншого боку, необхідністю приймати індивідуальні рішення

Харм ван Сейджен, глава дослідницької групи Microsoft

При цьому було відзначено, що Pac-Man вибрали з тієї причини, що в грі потрібно мислити «по-людськи».

Багато компаній працюють над ШІ для ігор, розробляючи власні проекти, оскільки для проходження потрібні багато людські якості

Рауль Мехротра, один з програмістів Maluuba

Як зазначається, така програмна платформа може використовувати у багатьох сферах. Наприклад, її можна залучити до роботи всередині компанії, яка займається продажами, щоб передбачати динаміку напливу покупців, популярність товарів і так далі. При цьому, система може працювати як із загальними тенденціями, так і з окремими факторами, включаючи індивідуальних покупців.