Estilos De Voz E Emoções Na Alexa

Apesar da inegável evolução dos sintetizadores de voz (alguém lembra de um que vinha com o windows?) ainda existem aqueles que acham as vozes de nossas assistentes pessoais frias demais.

 

O pessoal da Amazon também achava que dependendo da skill e da resposta que queríamos dar ao usuário ainda faltava algo.

 

Eis que em novembro de 2019 ela disponibilizou duas novas capacidades para a Alexa que ajudarão a criar uma experiência de voz mais natural e intuitiva para os usuários. Agora Alexa tem emoções e estilos de voz.

 

Como? Emoções Na Alexa?

 

As respostas emocionais são particularmente relevantes para as habilidades nas categorias de jogos e esportes. Por isso, novos recursos foram adicionados a Alexa: emoção e estilo.

 

É isso mesmo! A partir de hoje, você pode fazer a Alexa responder com um tom mais animado ou desapontado.

 

E mais: podemos utilizar estilos de voz para criar uma experiência do cliente mais agradável para um tipo conteúdo específico, como notícias da TV e dos apresentadores de rádio.

 

Infelizmente por enquanto estes recursos estão disponíveis apenas para os Estados Unidos. Mas com certeza é questão de tempo para que as emoções na Alexa possam ser utilizadas aqui no Brasil.

 

 

Como Funcionam As Emoções Na Alexa

 

As emoções na Alexa utilizam a tecnologia de conversão de texto em fala (text-to-speech) da Amazon, a Neural TTS (NTTS).

 

Podemos fazer com que a Alexa responda animadamente quando o usuário der uma resposta certa durante um jogo ou falar desapontadamente quando o time de futebol do usuário tiver perdido um jogo.

 

Veja alguns exemplos abaixo. Primeiro o tom normal e depois versões animadas e desapontadas:

 

Normal

 

Animado (alta intensidade)

 

Animado (intensidade média)

 

Animado (baixa intensidade)

 

Decepcionado (alta intensidade)

 

Decepcionado (intensidade média)

 

Decepcionado (baixa intensidade)

 

 

E Os Estilos De Voz na Alexa?

 

Os estilos de voz na Alexa também utilizam a NTTS e adaptam a voz da Alexa ao tipo de conteúdo sendo entregue, alterando alguns aspectos da fala, como entonação, palavras enfatizadas e tempo das pausas.

 

Estão disponíveis estilos de música e notícias dos Estados Unidos e estilo de notícias da Austrália.

 

Veja abaixo um comparativo entre os estilos e a voz normal.

 

Voz Normal

Estilo de Notícias (EUA)

 

Voz Normal

 

Estilo de Música (EUA)

 

Voz Normal

 

Estilo de Notícias (Austrália)

 

Agora que você ouviu os estilos de voz na Alexa, o que achou? Será que os apresentadores de telejornal e locutores do Brasil falam desse jeito?

 

Eu particularmente achei o estilo de notícias muito americano, não acho que os apresentadores daqui façam desse jeito. Será que quando os estilos vierem para o idioma pt-BR eles passarão por alguma adaptação? Ficamos no aguardo dos próximos capítulos…

 

Como Usar Emoções Na Alexa E Estilos De Voz

 

Para utilizar as emoções e estilos de voz na Alexa é bem simples! É só usar as novas tags SSML.

 

Se você não sabe o que é SSML, leia o artigo já publicado aqui.

 

Apenas envolva a resposta com as tags apropriadas: emotion e domain. São tags proprietárias (não fazem parte do padrão proposto pelo W3C) mas bem fáceis usar.

 

Para dar um tom animado para a Alexa, use o valor ‘excited’ ou ‘disappointed’ para a propriedade name da tag emotion (defina a intensidade também):

 

<amazon:emotion name="excited" intensity="medium">Resposta certa, parabéns!</amazon:emotion>

<amazon:emotion name="disappointed" intensity="high">Puxa vida, a resposta está errada... Que pena, você perdeu.</amazon:emotion>

 

E para usar estilos de voz na Alexa, utilize a tag amazon:domain:

 

<amazon:domain name="news">TA miniature manuscript written by the teenage Charlotte Bronte is returning to her childhood home in West Yorkshire after it was bought by a British museum at auction in Paris. </amazon:domain>

 

<amazon:domain name="music">Sweet Child O’ Mine by Guns N’ Roses became one of their most successful singles, topping the billboard Hot 100 in 1988. Slash’s guitar solo on this song was ranked the 37th greatest solo of all time. Here’s Sweet Child O’ Mine. </amazon:domain>

 

Para chavear entre os estilos dos EUA e da Austrália não é preciso fazer nada, a tag domain é utilizada da mesma forma. O estilo usado é automaticamente escolhido de acordo com o local da skill.

 

E se você quer saber mais sobre como desenvolver skills para Alexa, me acompanhe nesta jornada entrando para o Grupo VIP App Dev!

 

Comece pelo e-book GRATUITO

5 Passos Para Desenvolver Alexa Skills

Se você não sabe por onde começar, este e-book te mostra os passos para ser um desenvolvedor de skills de sucesso.
100% livre de spam.

Para enviar seu comentário, preencha os campos abaixo:

Deixe uma resposta

*

Seja o primeiro a comentar!