Новости сегодня - В Google возникла программа Tacotron 2 с человеческим звуком
Google занимается разработкой систем синтеза человеческой речи довольно давно.
Инженеры компании создали голосовую систему Tacotron 2, умеющую читать тексты почти, как человек.
Метод Tacotron 2, работающий на основе двух нейронных сетей, представила команда разработчиков Google с участием Джонатана Шена. Она преобразует напечатанный текст в речь, используя две нейросети глубокого обучения. Первая способна преобразовывать текст в спектрограмму, а метод WaveNet преобразует его в звуковой формат.
Отмечается, что Tacotron 2 справляется с трудными для произношения словами и названиями, а кроме этого меняет интонации зависимо от знаков препинания.
Образцы работы Tacorton 2 уже можно послушать на официальном сайте Google. Потом это же выполнил Tacotron 2.
Создатели посоветовали вначале оценить 8-ми добровольцам звуковые записи приложения. Произношение фраз оценивалось по пятибалльной шкале, где максимальному значению соответствует произношение, как у реального человека. В 2016 г компания представила синтезатор, звучащий недалеко к человеческой речи.
Говорить Tacotron 2 пока может только дамским звуком, но в планах разработчиков добавить и мужскую речь.
На настоящий момент планируется ввести технологию в сервисы Google — онлайн-переводчик и в Google Assistant.