Google Cloud lança Text-to-Speech, nova solução que permite aos clientes converter texto em mais de 32 vozes

Text-to-Speech chega com base em versão atualizada do WaveNet, executada na infraestrutura Google Cloud TPU, que gera formas de onda brutas 1.000 vezes mais rápidas que o modelo original

Text-to-Speech está disponível em mais de 32 vozes em 12 idiomas diferentes, inclusive português | Imagem: divulgação
Text-to-Speech está disponível em mais de 32 vozes em 12 idiomas diferentes, inclusive português | Imagem: divulgação

Google Cloud expande seu portfólio de produtos em inteligência artificial e lança o Text-to-Speech, nova ferramenta que permite aos clientes a conversão de fala em texto em mais de 32 vozes em 12 idiomas diferentes, inclusive português. É a primeira vez que a empresa disponibiliza o WaveNet, um produto inovador de pesquisa de síntese de voz da DeepMind, para o público.

“Muitos produtos do Google como, por exemplo, o Google Assistant, Search e Maps, vêm com uma síntese de texto para fala incorporada, de alta qualidade, que produz fala com som natural. Os desenvolvedores nos disseram que gostariam de adicionar texto para voz a seus próprios aplicativos. Por isso, hoje estamos trazendo essa tecnologia para o Google Cloud Platform, com o Cloud Text-to-Speech”, declara Dan Aharon, gerente de produto de Google Cloud AI.

Além de permitir que os usuários escolham entre 32 vozes diferentes de 12 idiomas, o Cloud Text-to-Speech também traz pronúncias mais assertivas em textos complexos, como nomes, datas, horários e endereços. O produto, já utilizado por empresas como Cisco e Dolphin ONE, permite a personalização do tom, a taxa de fala e o ganho de volume da voz, além de oferecer suporte a diversos formatos de áudio, incluindo MP3 e WAV.

Com o Cloud Text-to-Speech é possível selecionar vozes de alta fidelidade construídas com base no o WaveNet, um modelo generativo para áudio bruto criado pela DeepMind. O WaveNet traz uma fala mais natural, fazendo com que os usuários prefiram o seu áudio ao invés de outras tecnologias de conversão de texto em voz que já existem no mercado.

Quem quiser experimentar a ferramenta, basta clicar aqui.

The Secret Society 300

Últimas notícias

[td_block_social_counter custom_title=”SIGA O ROCKARAMA” header_color=”#b51c2a” facebook=”rockaramarocks” facebook_app_id=”184492152022640″ facebook_security_key=”cbb02711a74c79041165a05436b82199″ facebook_access_token=”184492152022640|MpsLSXM8JDPDVg6vKwy8BjG02AU” twitter=”rockaramarocks” instagram=”rockaramarocks” open_in_new_window=”y”]

Leia também

Comentários

comentários