Почему телефонные переговоры больше не гарантия достоверности

Apple недавно анонсировала ИИ-сервисы для своих устройств, способные синтезировать любой голос на основе всего 15 минут аудиозаписи. Однако ученым и экспертом по безопасности от этого совсем не весело: исследование Лондонского университета показало, что 73% людей не способны различить настоящий голос и синтезированный.

Для эксперимента было сгенерировано 50 различных аудиосэмплов на английском и китайском языках, которые проигрывали 529 участникам опыта. И даже после специального обучения люди все равно не смогли отличить голоса нейросетей от человеческих в более 70% случаев. Уточняется, что аудиозаписи для эксперимента генерировали ИИ-модели предыдущего поколения, и новые версии способны приблизить неразличимость подделок к 100%.

Почему это тревожит ученых и экспертов по безопасности? Потому что такой мощный инструмент передается в руки массовому потребителю, который может делать с ним, что угодно. И уже делает: например, известен случай, когда еще в далеком 2019 году злоумышленник убедил гендиректора одной крупной британской компании перевести тысячи фунтов не тому контрагенту, подделав голос его босса. А представьте теперь, на какой уровень выйдут наши пронырливые телефонные мошенники, укравшие данные, наверное, уже всего населения страны.

Что это значит для нас? Что телефонные переговоры теперь полностью дискредитированный канал, и давать/принимать комментарии голосом становится небезопасно. Так что будьте недоверчивы и сохраняйте бдительность.

 

Комментарии 0