Искусственный интеллект от Google достиг ещё одного уровня развития, который, как ранее казалось уж точно не покорится машине. Он научился распознавать голоса отдельных людей в толпе.

Как это работает

Для распознавания используется нейросеть, которая отслеживает лица людей и сопоставляет звук и мимику, а затем выделяет нужный канал. Это позволяет вычленить из общего шума конкретные голоса, а также «изолировать» их на разных звуковых дорожках.

При этом тесты показали, что даже если люди пытаются перебивать друг друга, говорить одновременно и так далее, система всё равно работает и может вычленить звук каждого голоса. Это работает также, если часть лица закрыла.

Зачем это нужно

Применение такой технологии найдётся в виртуальных помощниках и программах вроде Hangouts или Duo. Это позволит системе «не отвлекаться» на посторонних, слушая только владельца гаджета. Также это улучшит работу слуховых аппаратов, позволив приглушить фоновые звуки и слушать только конкретного человека.

И да, это также может найти применение в методах скрытого наблюдения, что позволит «слушать» определённого человека.