Исследователи из Университета штата Флорида, США, под руководством Цзе Яна разработали методику повышения качества и безопасности распознавания голоса на смартфоне. Это позволит, с одной стороны, улучшить конечный результат, а с другой – обеспечить приватность данных.

Как сообщается, принцип основан на работе доплеровского радара, в качестве которого используется динамик и микрофон смартфона. Он позволяет измерять уникальные для каждого пользователя особенности движения губ и языка, используя ультразвук.

При взаимодействии этих волн с двигающимися во время речи губами и языком частота колебаний меняется в зависимости от скорости движения. Таким образом, записывая отраженные волны на микрофон, можно составить речевой «отпечаток» конкретного человека.

Это позволяет обезопасить смартфон от записанных команд. Ведь устройство запоминает голос, однако запись позволяет обойти это. Использование же такой биометрической идентификации позволит только владельцу отдавать голосовые команды.

В тестировании принял участие 21 доброволец. Им дали задание по несколько раз произнести 10 кодовых фраз, состоящих из нескольких слов. Затем исследователи провели атаки двух типов на систему: в первом случае они воспроизводили аудиозаписи кодовых фраз, а во втором показывали одним участникам видеозапись произношения других добровольцев, и просили их произнести ту же самую фразу с максимально похожим произношением. Система определяла подмену с точностью в 99,3%.

Разумеется, это пока лишь прототип, но в условиях развития систем голосового управления такая предосторожность кажется нелишней.