Нейросеть Deep Voice от Baidu научилась говорить с акцентом
Компьютерные системы синтеза речи становятся все более совершенными — близок тот день, когда симуляция уникального голоса какого-то конкретного человека станет обыденным делом. О новых успехах в создании голосовых синтезаторов сообщают китайские ученые, которые научили ...
"При наличии достаточного количества образцов голоса, мы можем научить нашу нейронную сеть имитировать акцент менее, чем за час. То есть, нейросеть Baidu умеет разговаривать с уникальными акцентами", — рассказывают программисты из Поднебесной.
Речь идет о системе text-to-speech под названием Deep Voice, созданной инженерами Baidu. Новая версия системы Deep Voice умеет обучаться акценту, при этом, она способна делать это всего за полчаса — ранее для чего-то подобного требовались целые сутки.
Кроме синтеза речи, приближенные к искусственному интеллекту алгоритмы могут анализировать записи голоса и находить едва заметные различия между ними, то есть у технологии есть широкие практические перспективы.
"Мы планируем использовать технологию в системах синтеза речи, используемых в разнообразных умных гаджетах. Голосовые помощники будущего будут синтезировать речь, приятную для владельца девайса", — отмечают в Baidu.
© planet-today.ru
Предыдущая статья
Смартфон LG G7 получит чип Snapdragon 845
Следующая статья
Астрономы: Вокруг Сатурна могут вращаться самособирающиеся луны
Комментарии
Минимальная длина комментария - 50 знаков. комментарии модерируются