Amazon lança Nova Sonic: seu modelo de IA que conversa

A imagem mostra um balão de fala com as letras 'AI' em destaque, iluminado em azul neon. Abaixo do balão de fala, há uma representação de uma onda sonora também em azul neon. O fundo da imagem é escuro, com um leve contorno de um perfil humano à esquerda, sugerindo a integração da inteligência artificial com a comunicação humana. Créditos: imagem criada com ChatGPT.

A Amazon anunciou nesta terça-feira (8) o seu mais novo modelo de inteligência artificial voltado para conversas de voz. Batizado de Nova Sonic, o modelo vai permitir conversas por voz mais humanizadas em aplicativos de IA. Segundo o anúncio, a empresa disponibilizou o modelo através de uma nova API no Amazon Bedrock. O Amazon Bedrok é um serviço no AWS que permite que clientes empresariais experimente diversos modelos de base para criar aplicações de IA generativa.

De acordo com a Amazon, o diferencial do Nova Sonic é unificar a “compreensão de fala e a geração de fala em um único modelo”. Isso porque as abordagens tradicionais dos seus concorrentes envolve o processo de orquestrar vários modelos para essa finalidade. Em outras palavras, as atuais aplicações de IA para voz, usam um modelo que reconhece a fala e converte para texto. Em seguida, utiliza modelos LLMs para compreender e gerar respostas e depois outro modelo para converter o texto gerado em novo áudio. Logo podemos compreender que a abordagem do Nova Sonic pode refletir em menor latência.

A Amazon diz que a abordagem usada no Nova Sonic permite que o modelo preserve com mais fidelidade as nuances e contexto acústico das falas. Com isso o modelo é capaz de entender melhor as nuances dessa conversa, o que inclui as pausas e hesitações presentes em uma fala humana. Além disso, o modelo é capaz de lidar com interrupções e aguardar o momento certo para falar.

Nova Sonic chega para concorrer com ChatGPT, Gemini e outros

O Amazon Nova Sonic chega em um momento que até então parecia estar consolidado pelos modelos da OpenAI com ChatGPT, Google Gemini e Microsoft Copilot. Com as afirmações de que seu modelo é competitivo em desempenho e conversação mais natural, o modelo de IA por voz da Amazon chega para movimentar ainda mais o mercado de assistentes de IA.

Imagem com fundo gradiente que transita do verde escuro à esquerda para o azul claro à direita. No centro, há um símbolo branco formado por oito linhas em forma de 'Z', organizadas em um padrão circular que lembra uma estrela. À esquerda e à direita do símbolo, há representações gráficas de ondas sonoras, compostas por linhas verticais de diferentes alturas, conectadas por uma linha pontilhada horizontal. Créditos: divulgação Amazon.
Novo modelo de IA da Amazon conversa de forma mais natural. Créditos: divulgação Amazon.

Além disso, vamos relembrar que a Amazon anunciou recentemente uma nova versão da Alexa com IA generativa, a Alexa+. Em uma entrevista ao TechCrunch, o vice-presidente sênior da Amazon Rohit Prasad, confirmou que componentes do Nova Sonic já estão alimentando a nova Alexa. Isso significa que podemos esperar uma conversa bem mais natural do que imaginávamos, se confirmadas todas as características do modelo divulgadas pela Amazon.

A Amazon, com sua assistente virtual Alexa, detém uma posição de destaque no mercado de assistentes virtuais e smart speakers. De acordo com dados do Market.us, o mercado global de assistentes virtuais inteligentes tem crescido significativamente, com uma projeção de atingir um valor de US$ 27,9 bilhões em 2025.

O lançamento da Alexa+ (Plus) foi a resposta que seus usuários esperavam da Amazon para ter uma assistente mais pessoal e com maior capacidade. O anúncio do novo modelo de IA por voz da Amazon sinaliza que a empresa quer bater de frente com seus concorrentes e se manter em destaque no mercado de assistentes virtuais, mesmo sendo apontada como atrasada. Será que o dito popular “quem ri por último ri melhor” mesmo?

Fonte: Amazon, Market.us.