Напевно багато хто пам’ятають епізод з фільму Стенлі Кубрика «Космічна одіссея 2001 року», коли штучний інтелект HAL9000 зумів прочитати по губах наміри космонавтів відключити його. І ось, схоже, це теж стало реальністю.

Дослідники з Оксфордського університету при підтримці DeepMind і NVIDIA розробили алгоритм, який дозволяє розпізнавати до 93% тексту, вимовленого таким чином. Як зазначається, точність досягає 93,4, що на 40% перевищує середній результат людей з порушеннями слуху. Їх середній рівень – 52,3% точності.

Машинне читання по губах має величезний потенціал для використання в додатках удосконалених слухових апаратів, а також для безшумної диктування в громадських місцях, таємних переговорів, розпізнавання мови в галасливій обстановці, біометричної ідентифікації та реставрації німого кіно

Автори розробки

Система використовує в роботі просторово-часові згорткові нейронні мережі (STCNNs), LSTM-мережі і нейромережеву темпоральну класифікацію (Connectionist Temporal Classification, CTC). Доповідь про роботу планується представити на конференції ICLR 2017.

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту і натисніть Ctrl + Enter .