Comece a usar o Amazon Polly

O Amazon Polly é um serviço que transforma texto em falas realistas. O Amazon Polly permite criar aplicações que falam, o que possibilita o desenvolvimento de novas categorias de produtos com recursos de voz. O Amazon Polly é um serviço do Amazon AI que usa tecnologias avançadas de aprendizado profundo para sintetizar falas que soam como a voz humana. O Amazon Polly inclui dezenas de vozes realistas distribuídas em vários idiomas, o que permite selecionar a voz ideal e criar aplicações com recursos de fala que funcionam em vários países diferentes.

O Amazon Polly oferece tempos de resposta rápidos e com a uniformidade necessária para possibilitar diálogos interativos em tempo real. Você pode salvar e armazenar em cache o áudio das falas do Amazon Polly para reprodução off-line ou redistribuição. E o Amazon Polly é fácil de usar. Basta que a aplicação envie o texto a ser convertido em fala à API do Amazon Polly. A aplicação receberá imediatamente o stream de áudio do Amazon Polly para reprodução imediata ou armazenamento em um formato de arquivo de áudio padrão, como o MP3.

Com o Amazon Polly, você paga apenas pelo número de caracteres convertidos em fala. Além disso, é possível salvar e reproduzir as falas geradas pelo Amazon Polly. O baixo custo por caractere convertido, bem como a inexistência de restrições de armazenamento e reutilização da saída de voz, fazem do Amazon Polly uma maneira econômica de possibilitar a conversão de texto em fala em qualquer lugar.

Ouça o Amazon Polly

O Adobe Flash Player ou um navegador moderno é obrigatório para assistir aos vídeos neste site.

Introdução ao Amazon Polly
1:20
Amazon Polly: AWS re:Invent 2016


Comunicado sobre os recursos de aspas (marcas de fala) e voz sussurrada

Visão geral de dois minutos dos novos recursos de aspas e voz sussurrada no Amazon Polly (abril de 2017)


Idioma Feminino Masculino Amostra de texto
Inglês Joanna Joey Hello. Do you speak a foreign language? One language is never enough.
Dinamarquês Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Português do Brasil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Espanhol Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Islandês Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.

Confira a lista completa de vozes e idiomas para os quais o Amazon Polly oferece suporte aqui.

Vozes com som natural

Vozes com som natural

O Amazon Polly disponibiliza dezenas de vozes realistas e aceita vários idiomas, inclusive uma grande variedade de vozes masculinas e femininas com diversos sotaques. A pronúncia fluida de texto em vários idiomas do Amazon Polly permite disponibilizar uma saída de voz de alta qualidade e criar aplicações para usuários globais.

Integração fácil

Integração fácil

O Amazon Polly facilita a adição de voz a um site, aplicativo móvel ou dispositivo. Com o Amazon Polly, basta escrever o texto que você quer converter em fala e enviá-lo à API do Amazon Polly. Depois disso, você receberá imediatamente o stream de áudio. Ao contrário de outras soluções que exigem um demorado processo de aprovação, não é necessário descrever como você usará as falas do Amazon Polly na sua aplicação nem assinar contratos de distribuição. Você pode começar a usar o serviço imediatamente.

Armazene e redistribua falas

Armazene e redistribua falas

Outras soluções exigem royalties ou cobram uma taxa a cada reprodução de um áudio gerado anteriormente. O Amazon Polly permite reproduções ilimitadas, sem taxas adicionais. Essas reproduções gratuitas também se aplicam ao uso off-line. Você pode criar arquivos de fala em diversos formatos padrão, como MP3 e OGG, e armazená-los em dispositivos como celulares ou dispositivos da Internet das Coisas (IoT) para reprodução off-line.

 

Baixo custo

Baixo custo

A definição de preço com pagamento conforme o uso, o baixo custo por caractere convertido e as reproduções ilimitadas fazem do Amazon Polly uma forma econômica de habilitar a síntese de falas em praticamente qualquer aplicação.

Resposta rápida

Resposta rápida

A entrega de vozes realistas e experiências de usuário conversacionais exige tempos de resposta consistentemente rápidos. As aplicações com uso de voz precisam reproduzir falas sintetizadas sem demora. Considere aplicações que fornecem orientações de navegação faladas, aplicações de eLearning que instruem alunos verbalmente e aplicações que envolvem os usuários por meio de diálogos em tempo real. Essas aplicações serão mais eficazes se as respostas iniciarem sem demoras percebidas no fluxo da conversação. Sempre que você envia um texto longo à API do Amazon Polly, o áudio é retornado à aplicação como um stream, o que permite reproduzir imediatamente as vozes. Esses tipos de respostas dinâmicas e faladas exigem acesso a uma quantidade de áudio de fala muito maior que a normalmente disponível para armazenamento nos dispositivos dos usuários. O Amazon Polly reside na nuvem, o que permite acessar uma grande variedade de falas sintetizadas. O Amazon Polly permite que a aplicação dê respostas ainda mais relevantes com a inclusão de dados em tempo real.

O Amazon Polly facilita a adição de fala a vídeos, apresentações ou cursos de treinamento on-line. O Amazon Polly pode gerar falas em 24 idiomas, o que facilita a adição de voz a aplicações com um público global. Com o Amazon Polly, você pode ler feeds de RSS, notícias ou e-mail e armazenar as falas sintetizadas na forma de arquivos de áudio.

Criação de conteúdo
GoAnimate

"O Amazon Polly oferece aos usuários do GoAnimate o recurso de dar imediatamente voz aos personagens animados em nossa plataforma. Isso é particularmente útil em cenários em que a narração ao vivo exige muitos recursos ou muito tempo, como no desenvolvimento de um vídeo em diversos idiomas ou na fase de pré-produção para acelerar o processo de aprovação. A fala é integrada diretamente ao nosso conjunto sofisticado de ativos pré-animados, o que reforça a facilidade de uso do GoAnimate e proporciona aos nossos clientes eficiência e velocidade de acesso ao mercado."

– Alvin Hung, diretor executivo e fundador, GoAnimate


O Amazon Polly permite que desenvolvedores disponibilizem suas aplicações com uma experiência visual otimizada, oferecendo recursos como animação facial sincronizada com a fala ou destaque de palavras em estilo de karaokê. O Amazon Polly torna fácil solicitar streams adicionais de metadados com informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Ao usar esses streams de metadados junto com streams de áudio de fala sintetizada, os clientes poderão animar avatares e destacar textos à medida que o texto for falado (lido ao vivo) em suas aplicações.

Criação de conteúdo
Wizkids

"Tentamos tornar as salas de aula baseadas na nuvem mais atraentes e eficazes a todos, inclusive para usuários com dificuldades de leitura e escrita. O Amazon Polly otimiza a nossa plataforma de aprendizado, integrando vozes de alta qualidade para conversão de texto em fala ao nosso pacote de produtos do AppWriter. É essencial que os nossos usuários possam ver o destaque em tempo real do texto enquanto ele estiver sendo lido em voz alta. Com o recurso de aspas (marcações de fala) do Polly, o AppWriter pode proporcionar uma experiência de leitura otimizada que oferece as condições certas para qualquer pessoa que esteja tendo dificuldades de leitura e escrita."

– Stefan Pal, Diretor de operações, Wizkids

O Amazon Polly facilita a adição de voz a aplicativos e jogos móveis. O Amazon Polly permite armazenar respostas de fala padrão no dispositivo, além de possibilitar respostas dinâmicas e em tempo real, como diálogos de personagens no jogo, classificação em tabelas de liderança e convites para jogos.

Aplicações móveis e de desktop
Washington Post

"Já faz tempo que estamos interessados em fornecer versões em áudio de nossas mais de 1.200 matérias diárias, mas constatamos que as soluções anteriores de conversão de texto em fala não tinham um bom custo/benefício considerando a qualidade de fala oferecida. Com a chegada do Amazon Polly e suas vozes de alta qualidade, estamos ansiosos para oferecer aos leitores formas mais sofisticadas e versáteis de experimentar o nosso conteúdo."

– Joseph Price, gerente de produtos sênior, The Washington Post


Com o Amazon Polly, as centrais de atendimento aos clientes podem responder com vozes que soam naturais. Você pode reproduzir as saídas de fala do Amazon Polly em sistemas de IVR (Interactive voice response – Resposta de voz interativa). Além disso, você pode usar a API do Amazon Polly para disponibilizar automaticamente informações em tempo real, como status de serviços, consultas de contas e faturamento, endereços e informações de contato.

Central de atendimento de clientes

O Amazon Polly viabiliza novos casos de uso da Internet das Coisas (IoT), permitindo adicionar fala a dispositivos IoT com facilidade e baixo custo. Os dispositivos da IoT podem usar a fala para fornecer respostas e notificações naturais, o que torna as aplicações mais acessíveis e permite que os usuários consumam informações sem depender de uma tela. Com o Amazon Polly, você pode gerar arquivos de fala e armazená-los em dispositivos para reprodução offline.

Use o AWS Lambda para gerar URLs pré-assinados do Polly com base em eventos do mecanismo de regras da AWS IoT e use o Device Gateway para enviar esses URLs a dispositivos da IoT para que possam solicitar falas realistas.

Internet das Coisas (IoT)

O Amazon Polly pode ser usado para aprimorar a usabilidade de aplicações que ensinam pessoas a falar novos idiomas. Por exemplo, os usuários finais podem digitar frases em um idioma estrangeiro no aplicativo para ouvi-las faladas por um falante nativo. O Amazon Polly oferece 24 idiomas, o que proporciona aos professores e alunos um grande número de opções.

Aprendizado de idiomas
Duolingo

"Não consigo pensar em muitos casos de uso em que a pronúncia precisa seja mais importante que no aprendizado de um novo idioma. Constatamos que as vozes do Amazon Polly, além de terem alta qualidade, são tão eficientes quanto a fala humana natural para ensinar um idioma."

– Severin Hacker, diretor de tecnologia, Duolingo


Com o Amazon Polly, você pode criar e distribuir informações acessíveis na forma de falas sintetizadas para pessoas com deficiências visuais. Dessa forma, você pode ajudar pessoas com perdas visuais a consumir vários conteúdos, como notícias livros ou mensagens de e-mail.

Royal National Institute of Blind People

"No momento, usamos a tecnologia de conversão de texto em fala da Amazon para criar e distribuir informações acessíveis na forma de conteúdo de áudio sintetizado para nossa grande base de clientes B2B e B2C, incluindo concessionárias de serviços públicos, instituições financeiras e empresas de mídia, bem como outros materiais voltados ao cliente, como revistas e publicações. O anúncio do Amazon Polly nos entusiasmou com a capacidade de oferecer uma experiência ainda melhor a esses clientes, entregando vozes incrivelmente realistas que cativarão e envolverão o nosso público."

– John Worsfold, gerente de implementação de soluções, Royal National Institute of Blind People

É fácil começar a usar o Amazon Polly. Faça login no console para começar a gerar falas com seu próprio texto em apenas alguns cliques.

Comece a usar