Новостная лента

Имитация человеческого голоса: на хорошо и на плохо

28.04.2016

 

Произнесите 160 французских или английских фраз в приложение на смартфоне, который разрабатывает компания CandyVoice, и приложение анализирует ваш голос и озвучит нам любой текст. Звучание, правда, получается нечто искусственное, но шеф компании Жан-Люк Кребуа обещает, что уже скоро его невозможно будет отличить от вашего естественного голоса. Аналогичную программу под названием FestVox разрабатывает Институт лингвистических исследований Университета Карнеги-Меллон для английского и четырех самых распространенных языков в Индии. А китайский интернет-гигант Baidu заявляет, что уже создал программу, которой достаточно послушать всего пятьдесят предложений, чтобы точно воспроизводить любой голос.

 

Клонирование (или «банкинг») человеческого голоса до сих пор было весьма недешевой делом, которое делали в студиях под заказ, как правило, для людей, которые рисковали потерять голос из-за рака или операцию. Для этого нужно было произносить множество фраз, причем каждый раз с разным эмоциональным ударением и с разной интонацией (утвердительное предложение, вопрос, команда и тому подобное), чтобы охватить все варианты произношения. Стоимость такой услуги в компании AcapelaGroup в Бельгии составляет минимум 3.000 евро и требует, как минимум, восьми часов студийной записи. Другие компании берут даже дороже и заставляют своих клиентов целые дни просиживать в студии.

 

Теперь этого всего больше не нужно. Приложение на смартфоне раскладывает сказанные вами фразы на мікрофрагменти продолжительностью пять миллисекунд (каждый с точной высотой), которые использует как своеобразный голосовой алфавит, из которого комбинирует слова. С помощью этого приложения женщина, например, может предоставить свой голос программе, которая озвучивает текст на мониторе для ее слепого мужа. Шеф может записать свой командный тон на автоответчик для подчиненных на работе. Пользователь Facebook может прослушать пост голосом его автора, а родители, которые много времени проводят на работе, могут записать свои голоса на интерактивные игрушки, которыми играют их дети. По крайней мере так видит будущее этой технологии Гирсон Сільберт, шеф компании VivoText из Тель-Авива, которая занимается клонированием голоса.

 

VivoText уже в следующем году планирует выпустить приложение, которое позволит пользователям регулировать не только скорость и интонацию озвученного текста, но даже уровень радости или печали в нем. Лицензию на использование этой программы VivoText хочет предоставить американскому производителю детских игрушек Hasbro. Компания хочет добиться полностью идентичного имитации голоса, однако в ней соглашаются, что успехи не могут не пугать. Ведь без предохранительных мер, например, пранкеры могут записать проклятие голосом мамы и довести ребенка до отчаяния.

 

Еще больше пугает то, что голос любого человека можно взять с YouTube или любого другого ресурса. Исследователям из Алабамского университета во главе с Нітешем Саксеною достаточно было всего пяти минут онлайновых записей, чтобы сымитировать голос с помощью программы FestVox. Когда эти записи использовали против биометрических голосовых программ, которые используются банками для проверки подлинности клиента, они смогли обмануть их в 80% случаев. А когда их дали послушать добровольцам в течение 90 секунд, они не смогли отличить подделки в половине случаев. По словам эксперта голосовых систем Джорджа Пепкуна, появление таких технологий «открывает безграничный потенциал для дезинформации», особенно если их используют как доказательство в суде. Др. Пепкун, который ранее работал как эксперт по синтезу человеческого голоса в Лос-Аламосской национальной лаборатории (военная лаборатория в Нью-Мексико), считает, что имитация голоса будет иметь и военное применение: например, можно будет дезинформировать вражеские войска голосом их командира.

 

Против подобных действий сегодня уже разрабатывают контрмеры. Компания Nuance Communications создает алгоритм, который будет распознавать крошечные колебания частоты в местах, где мікрофрагменти голоса сшитые вместе. А разработчик фотошопа Adobe закодовуватиме в сфабрикован своим приложением VoCo искусственный голос специальные водяные знаки, по которым компьютер сможет его распознать. Впрочем, даже несмотря на это все легко себе представить, какой хаос воцарится в мире, если злодеи смогут копировать чей угодно голос.

 

Imitating people’s speech patterns precisely could bring trouble

The Economist, 20/04/2017

Отреферировал Евгений Ланюк

You Might Also Like

Loading...

Нет комментариев

Комментировать

Яндекс.Метрика