Компания Google провела тесты преобразователя текста в речь Tacotron 2. Он может синтезировать голос, фактически неотличимый от человеческого. Программа действует по принципу нейронной сети и способна верно выделять слова и расставлять акценты во фразах.
Основная часть существующих преобразователей такого рода зачитывают слова подобно роботу. Это происходит вследствие того, что звуковая дорожка создается из заранее записанных слов и без дальнейшей обработки. В отличие от них Tacotron 2 применяет нейронные сети, чтобы осмысливать текст и правильно выдерживать паузы между словами, делать акценты и ударения.
Для демонстрации возможностей новой программы в Google попросили актрису зачитать несколько фраз. Затем то же самое проделал Tacotron 2. Итоги эксперимента удивили даже разработчиков.