Дослідниками з американського і французького підрозділів Facebook був розроблений найбільший на сьогодні датасет (набір даних) для навчання штучного інтелекту грі StarCraft. У нього входять понад 65 тисяч ігор і в загальній складності понад півтора мільярдів «кадрів». Загальний обсяг його становить 365 ГБ.

Як зазначається, ігри розглядаються вченими і розробниками як хороша «школа» для нейромереж і штучного інтелекту. Так, особливий інтерес у їх викликають стратегії начебто StarCraft, де є поняття «туман війни», із-за чого це гра з неповною інформацією, на відміну від шахів або го. Це вимагає активно користуватися розвідкою і передбачати дії суперника.

Дослідники з Facebook докладно описали створений ними датасет STARDATA, в який увійшли записи ігор в StarCraft (як професійні, так і аматорські), «перекладені» на доступний для алгоритомв машинного навчання мову. Тобто, для кожної гри з частотою приблизно вісім кадрів в секунду записані повні дії гравця, чисельність і склад його армії, положення юнітів і будівель, технологічний розвиток і так далі.

В якості демонстрації можливостей, що відкриває новий датасет, автори привели в якості прикладів кілька простих статистик. Як виявилося, битви проти гул zerg в середньому закінчувалися значно швидше, ніж ігри терранов проти терранов. При цьому незалежно від раси спостерігалася тенденція, що гравці закінчували гру (здавалися), маючи в розпорядженні ще як мінімум половину від максимальної чисельності армії, а іноді і зовсім здавалися при максимальній силі армії. Найбільш контрастним виглядав графік споживання ресурсів, де наведено відношення запасів «бідного» гравця до «багатого». З-за стратегій «раша», тобто швидкої атаки, добре видно, що часто програв гравець навіть не встигав почати видобувати газ (другий вид ресурсів після кристалів).

Крім цього, автори запропонували власний алгоритм для визначення битв, заснований на групуванні «кадрів» за смертями юнітів, а також привели простий кластерний аналіз різних стратегій.

Як очікується, такі методики будуть корисні для досліджень в області машинного навчання з підкріпленням, і дозволять в перспективі створити штучний інтелект, який би зміг позмагатися на рівних з професійним гравцем-людиною в StarCraft. Поки ж, незважаючи на всі успіхи в області ШІ, цього не сталося.