Нейросеть Deep Voice от Baidu научилась говорить с акцентом » Мужской журнал Sobesednik

Компьютерные системы синтеза речи становятся все более совершенными — близок тот день, когда симуляция уникального голоса какого-то конкретного человека станет обыденным делом. О новых успехах в создании голосовых синтезаторов сообщают китайские ученые, которые научили нейросеть Baidu разговаривать с акцентом.

"При наличии достаточного количества образцов голоса, мы можем научить нашу нейронную сеть имитировать акцент менее, чем за час. То есть, нейросеть Baidu умеет разговаривать с уникальными акцентами", — рассказывают программисты из Поднебесной.

Речь идет о системе text-to-speech под названием Deep Voice, созданной инженерами Baidu. Новая версия системы Deep Voice умеет обучаться акценту, при этом, она способна делать это всего за полчаса — ранее для чего-то подобного требовались целые сутки.

Кроме синтеза речи, приближенные к искусственному интеллекту алгоритмы могут анализировать записи голоса и находить едва заметные различия между ними, то есть у технологии есть широкие практические перспективы.

"Мы планируем использовать технологию в системах синтеза речи, используемых в разнообразных умных гаджетах. Голосовые помощники будущего будут синтезировать речь, приятную для владельца девайса", — отмечают в Baidu.

© planet-today.ru

Предыдущая статья

Смартфон LG G7 получит чип Snapdragon 845

Следующая статья

Астрономы: Вокруг Сатурна могут вращаться самособирающиеся луны

Комментарии