Como Funciona Alexa?

Já vimos bem resumidamente como funciona Alexa num outro artigo, agora veremos seu funcionamento com mais detalhes.

 

A Alexa foi desenvolvida com base no processamento de linguagem natural (Natural Language Processing – NLP), um procedimento de conversão da fala em palavras, sons e ideias.

 

A interpretação de sons usa muito processamento computacional, por isso os dispositivos com Alexa embarcada apenas gravam sua voz e a enviam aos servidores da Amazon para ser analisada com mais eficiência.

 

Mas… Como Funciona Alexa Lá Nos Servidores?

 

Como Funciona Alexa - Diagrama de funcionamento da Alexa

 

Lá na “nuvem” da Alexa, seu comando de voz é dividido em sons individuais. Depois é feita uma consulta em um banco de dados contendo as pronúncias de várias palavras para descobrir quais palavras mais se aproximam a combinação dos sons individuais.

 

Agora imagina o tamanho deste banco de dados, com N palavras gravadas, nos mais diferentes sotaques.

 

Imagina também ter que fazer uma pesquisa neste banco de dados gigante, procurando um som igual ao que você pronunciou. Isto é feito em frações de segundo, pois ele tem que procurar todas as palavras que você disse e colocar em contexto para que seu comando seja executado.

 

Por isso esta tarefa de reconhecimento da fala precisa ser feito na nuvem. São vários servidores processando milhares de comandos de milhares de pessoas ao mesmo tempo (Ô loko!!).

 

Voltando: depois de descobrir quais palavras foram ditas, ela identifica quais destas palavras são importantes para entender as tarefas que foram requisitadas. Uma das coisas que ela precisa descobrir neste reconhecimento é o Nome de Invocação (Invocation Name), que é o nome da aplicação que será executada.

 

Por exemplo, se Alexa identificar a palavras como “tempo” ou “clima”, ela enviaria o comando para a skill (aplicativo) de clima.

 

Agora é com a skill. O aplicativo processa esse comando e devolve uma resposta (é aí que a gente entra, desenvolvendo aplicativos que extendem as funcionalidades da Alexa).

 

Os servidores da Amazon enviam as informações de retorno a Alexa. Se a resposta precisar ser falada pelo dispositivo (existe a possibilidade da resposta ser através de vídeo), então todo o processo descrito acima seria feito de forma inversa.

 

O dispositivo do usuário “fala” a resposta recebida pela sua skill.

 

E dependendo do aplicativo, a interação pode não acabar aqui. Podem ser necessários mais que um simples comando para que o usuário consiga sua tarefa executada.

 

Enfim

 

Este foi um maior detalhamento de como funciona Alexa. Sabendo melhor como ela funciona, podemos desenvolver skills melhores e mais úteis para os usuários.

 

E para receber um aviso quando os próximos artigos forem publicados, se cadastre na Grupo VIP App Dev!

Comece pelo e-book GRATUITO

5 Passos Para Ser Um App Dev

Se você não sabe por onde começar, este e-book te mostra os passos para ser um desenvolvedor de aplicativos de sucesso.
100% livre de spam.

Para enviar seu comentário, preencha os campos abaixo:

Deixe uma resposta

*

Seja o primeiro a comentar!