Исследователями из американского и французского подразделений Facebook был разработан крупнейший на сегодня датасет (набор данных) для обучения искусственного интеллекта игре в StarCraft. В него входят более 65 тысяч игр и в общей сложности более полутора миллиардов «кадров». Общий объём его составляет 365 ГБ.

Как отмечается, игры рассматриваются учёными и разработчиками как хорошая «школа» для нейросетей и искусственного интеллекта. Так, особый интерес у их вызывают стратегии вроде StarCraft, где есть понятие «тумана войны», из-за чего это игра с неполной информацией, в отличие от шахмат или го. Это требует активно пользоваться разведкой и предугадывать действия соперника.

Исследователи из Facebook подробно описали созданный ими датасет STARDATA, в который вошли записи игр в StarCraft (как профессиональные, так и любительские), «переведенные» на доступный для алгоритомв машинного обучения язык. То есть, для каждой игры с частотой примерно восемь кадров в секунду записаны полные действия игрока, численность и состав его армии, положения юнитов и зданий, технологическое развитие и так далее.

В качестве демонстрации возможностей, который открывает новый датасет, авторы привели в качестве примеров несколько простых статистик. Как оказалось, сражения зергов против зергов в среднем заканчивались значительно быстрее, чем игры терранов против терранов. При этом независимо от расы наблюдалась тенденция, что игроки заканчивали игру (сдавались), имея в распоряжении еще как минимум половину от максимальной численности армии, а иногда и вовсе сдавались при максимальной силе армии. Самым контрастным выглядел график употребления ресурсов, где приведено отношение запасов «бедного» игрока к «богатому». Из-за стратегий «раша», то есть быстрой атаки, хорошо видно, что часто проигравший игрок даже не успевал начать добывать газ (второй вид ресурсов после кристаллов).

Кроме этого, авторы предложили собственный алгоритм для определения сражений, основанный на группировке «кадров» по смертям юнитов, а также привели простой кластерный анализ различных стратегий.

Как ожидается, такие методики будут полезны для исследований в области машинного обучения с подкреплением, и позволят в перспективе создать искусственный интеллект, который бы смог потягаться на равных с профессиональным игроком-человеком в StarCraft. Пока же, несмотря на все успехи в области ИИ, этого не произошло.