A Amazon anunciou nesta terça-feira (8) o seu mais novo modelo de inteligência artificial voltado para conversas de voz. Batizado de Nova Sonic, o modelo vai permitir conversas por voz mais humanizadas em aplicativos de IA. Segundo o anúncio, a empresa disponibilizou o modelo através de uma nova API no Amazon Bedrock. O Amazon Bedrok é um serviço no AWS que permite que clientes empresariais experimente diversos modelos de base para criar aplicações de IA generativa.
De acordo com a Amazon, o diferencial do Nova Sonic é unificar a “compreensão de fala e a geração de fala em um único modelo”. Isso porque as abordagens tradicionais dos seus concorrentes envolve o processo de orquestrar vários modelos para essa finalidade. Em outras palavras, as atuais aplicações de IA para voz, usam um modelo que reconhece a fala e converte para texto. Em seguida, utiliza modelos LLMs para compreender e gerar respostas e depois outro modelo para converter o texto gerado em novo áudio. Logo podemos compreender que a abordagem do Nova Sonic pode refletir em menor latência.
A Amazon diz que a abordagem usada no Nova Sonic permite que o modelo preserve com mais fidelidade as nuances e contexto acústico das falas. Com isso o modelo é capaz de entender melhor as nuances dessa conversa, o que inclui as pausas e hesitações presentes em uma fala humana. Além disso, o modelo é capaz de lidar com interrupções e aguardar o momento certo para falar.
Nova Sonic chega para concorrer com ChatGPT, Gemini e outros
O Amazon Nova Sonic chega em um momento que até então parecia estar consolidado pelos modelos da OpenAI com ChatGPT, Google Gemini e Microsoft Copilot. Com as afirmações de que seu modelo é competitivo em desempenho e conversação mais natural, o modelo de IA por voz da Amazon chega para movimentar ainda mais o mercado de assistentes de IA.

Além disso, vamos relembrar que a Amazon anunciou recentemente uma nova versão da Alexa com IA generativa, a Alexa+. Em uma entrevista ao TechCrunch, o vice-presidente sênior da Amazon Rohit Prasad, confirmou que componentes do Nova Sonic já estão alimentando a nova Alexa. Isso significa que podemos esperar uma conversa bem mais natural do que imaginávamos, se confirmadas todas as características do modelo divulgadas pela Amazon.
A Amazon, com sua assistente virtual Alexa, detém uma posição de destaque no mercado de assistentes virtuais e smart speakers. De acordo com dados do Market.us, o mercado global de assistentes virtuais inteligentes tem crescido significativamente, com uma projeção de atingir um valor de US$ 27,9 bilhões em 2025.
O lançamento da Alexa+ (Plus) foi a resposta que seus usuários esperavam da Amazon para ter uma assistente mais pessoal e com maior capacidade. O anúncio do novo modelo de IA por voz da Amazon sinaliza que a empresa quer bater de frente com seus concorrentes e se manter em destaque no mercado de assistentes virtuais, mesmo sendo apontada como atrasada. Será que o dito popular “quem ri por último ri melhor” mesmo?