Схоже, що скоро можна буде сказати комп’ютера «зроби кльову картинку», і він зуміє це організувати. У всякому разі, штучний інтелект від Microsoft зміг намалювати птаха, грунтуючись виключно на текстовому описі. При цьому він не брав за основу готове фото.

У компанії «попросили» комп’ютер намалювати «жовту птицю з чорними крилами і коротким дзьобом». Що вийшло, можна подивитися в заголовку статті. Треба сказати, що малюнок виявився досить точним і схожим на фото, при тому, що система створила його з нуля.

Якщо ви підете на Bing, і пошукаєте птицю, то отримаєте безліч схожих картинок з птахом, але тут фотографії створюються за допомогою комп’ютера з нуля, піксель за пікселем. Ці птахи не можуть існувати в реальному світі — вони всього лише аспект уяви нашого комп’ютера

Глава дослідницької групи Сяодун Хе

Звичайно, сама технологія поки ще не ідеальна, але можна лише уявити, до якого рівня її можливо довести. У Microsoft вважають, що така технологія може стати платформою для створення анімаційних фільмів за сценарієм. Але точно також вона може застосовуватися створення фейкових відео.

Як повідомляється, технологія складається з двох частин: одна, Generative Adversarial Network (GAN), генерує зображення, а інша, дискримінатор, оцінює їх якість. Основою її є ШІ-система CaptionBot, яка розпізнає фото і створює підписи до них в автоматичному режимі. Також в основі системи лежить нейромережа під назвою SeeingAI, яка відповідає на питання, пов’язані з зображеннями. Її, до речі, можна використовувати для сліпих і слабозорих людей.

Як зазначається, CaptionBot навчався на парах фотографій і підписів, які підказують, як слова співвідносяться з якими фотографіями. Крім цього, дослідники створили математичне уявлення людської уваги, що ми використовуємо, коли малюємо картини, грунтуючись на складних описів.

Увага — це людське якість, ми ж використовуємо математику, щоб зробити увагу обчислюється

Сяодун Хе