Amazon Polly 入门

Amazon Polly 是一种可将文本转换为逼真语音的服务。借助 Polly,您能够打造可以聊天的应用程序,从而构建全新类别的具有语音功能的产品。Polly 是一种 Amazon AI 服务,它使用高级深度学习技术来合成很像人声的语音。Polly 包含 47 种逼真声音,并支持 24 种语言,因此您可以选择最合适的声音,并构建适用于许多不同国家/地区的具有语音功能的应用程序。

Amazon Polly 可提供一致且快速的响应时间,以支持实时的交互式对话。您可以缓存并保存 Polly 的语音音频,以便在离线时重放或重新分发。此外,Polly 简单易用。您只需把想要将其转换为语音的文本发送到 Polly API,Polly 便会立即将音频流返回到您的应用程序中。您的应用程序可以直接播放该音频流,也可以将其存储为标准音频文件格式,如 MP3。

对于 Polly,您只需为转换为语音的字符数付费,并且可以保存和重放 Polly 生成的语音。Polly 的每字符转换费用非常低廉,且对声音输出的存储和重复使用没有任何限制,这使您可以通过一种经济高效的方式随时随地提供文本转语音功能。

Amazon Polly 简介
1:20
Amazon Polly:AWS re:Invent 2016
语言 女性 男性 示例文本
英语 Joanna Joey Hello.Do you speak a foreign language?One language is never enough.
丹麦语 Naja Mads Hej.Taler du et fremmed sprog?Et sprog er aldrig nok.
巴西葡萄牙语 Vitória Ricardo Oi.Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
西班牙语 Penélope Miguel Hola.¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
冰岛语 Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.
声音自然

声音自然

Amazon Polly 提供 47 种逼真声音,并支持 24 种语言,其中包括各种口音的多种男音和女音。Polly 可以流畅地读出多种语言的文本,这使您可以交付高质量声音输出并构建面向全球用户的应用程序。

易于集成

易于集成

Amazon Polly 让您能够轻松地为网站、移动应用程序或设备添加声音。借助 Polly,您只需把想要将其转换为语音的文本写入 Polly API,然后 Polly 便会立即返回音频流。不同于需要繁琐的审批流程的其他解决方案,Polly 并不要求您说明将如何在应用程序中使用 Polly 的语音,且您无需签订任何分发协议便可立即开始使用。

存储和重新分发语音

存储和重新分发语音

在您每次重放其他解决方案之前生成的音频时,您必须拥有特权或支付相应费用,但 Amazon Polly 允许您无限次重放,且不会收取任何额外费用。这种免费重放功能还可延伸至离线使用的情况。您可以创建多种标准格式 (如 MP3 和 OGG) 的语音文件,并将它们存储在手机等设备和物联网 (IoT) 设备上,以便在离线时重放。

 

费用低廉

费用低廉

Amazon Polly 采用按需付费的定价模式,每字符转换费用非常低廉,且支持无限次重放,这为您提供了一种经济高效的方式,使您能够在几乎任何应用程序中实现语音合成。

快速响应

快速响应

要提供逼真声音和对话式用户体验,必须具有一致且快速的响应时间。具有语音功能的应用程序需要能够在无任何延迟的情况下播放合成语音。不妨思考一下提供语音导航方向的应用程序、为学生提供言语指导的应用程序以及通过实时对话与用户互动的应用程序。当这类应用程序可以在对话流中立即作出响应,而不会出现可感知到的延迟时,才最为有效。即使您向 Polly API 发送了冗长的文本,它也可以将音频作为流返回到您的应用程序中,以便您可以立即播放声音。要提供这种动态的语音响应功能,仅靠通常存储在用户设备上的可用语音音频远远不够,您需要能够访问大量语音音频。Amazon Polly 位于云中,因此您可以访问各种合成语音。借助 Polly,您的应用程序可提供更多包含实时数据的有价值响应。

Amazon Polly 让您能够轻松地为视频、演示文稿或在线培训课程添加语音。Polly 可以生成 24 种语言的语音,让您能够轻松地为具有全球受众的应用程序添加声音。借助 Polly,您可以阅读 RSS 源、新闻或电子邮件,并将合成语音存储为音频文件形式。

创建内容
GoAnimate

“借助 Amazon Polly,GoAnimate 用户可立即为他们使用我们的平台制作出的动画人物提供声音。当没有足够的资源或时间来提供实时画外音时,如制作使用多种语言的视频或者在前期制作期间想加快审批流程时,Amazon Polly 尤为有用。语音可与我们丰富的前期动画资源集无缝集成,这增强了 GoAnimate 的易用性,并提高了我们客户的效率和上市速度。”

– Alvin Hung,GoAnimate 首席执行官兼创始人


借助 Amazon Polly,您的客户联系中心可以通过自然的声音进行回复。您可以通过交互式语音应答 (IVR) 系统重放 Polly 的语音输出。此外,您可以使用 Polly API 自动提供实时信息,如服务状态、账户和账单问询、地址和联系信息。

客户联系中心

Amazon Polly 让您能够以低廉的成本轻松地为 IoT 设备添加语音,从而为新的物联网 (IoT) 使用案例提供支持。IoT 设备可使用语音提供自然的应答和通知,从而提高应用程序的可访问性,并使用户无需依赖于屏幕即可获取信息。借助 Polly,您可以生成语音文件并将它们存储在设备上,以便在离线时重放。

您可以使用 AWS Lambda 根据来自 AWS IoT 规则引擎的事件生成预先签署的 Polly URL,然后使用设备网关将这些 URL 发送到您的 IoT 设备,以便它们请求逼真语音。

物联网 (IoT)

Amazon Polly 可用于提高教人们如何说新语言的应用程序的可用性。例如,最终用户可在您的应用程序中键入外语短语,然后听母语人士如何说这个短语。Polly 支持 24 种语言,为教师和学生提供了很多选择。

语言学习
Duolingo

“我没法举出很多使用案例来证明发音准确比何时学习新语言更重要。我们发现,Amazon Polly 声音的质量很高,而且对于教授语言来说,这些声音与自然人类语言的教授效果一样好。”

– Severin Hacker,Duolingo 首席技术官


Amazon Polly 让您能够轻松地为移动应用程序和游戏添加声音。借助 Polly,您可以将标准语音响应内容存储在设备上,并能启用动态实时响应,如游戏内人物对话、排行榜排名以及游戏邀请。

移动应用程序和桌面应用程序
Wizkids

“我们努力让云驱动型课堂对所有人 (包括有读写障碍的用户) 来说都更加有趣和有效。Amazon Polly 通过将高质量文本转语音的声音与我们的 AppWriter 产品系列集成,来提高我们的学习平台的性能。”

– Stefan Pal,Wizkids 首席运营官


借助 Amazon Polly,您可以为视障人士创建和分发合成语音形式的无障碍信息。通过这种方法,您可以帮助有视觉障碍的人士获取各种内容,如新闻、图书或电子邮件消息。

英国皇家盲人协会

“我们目前使用 Amazon 的语音转文本技术来为众多 B2B 和 B2C 客户 (包括公用事业公司、金融机构、媒体公司),创建和分发合成音频内容形式的无障碍信息以及其他面向客户的材料 (如杂志和出版物)。随着 Amazon Polly 的推出,我们很高兴能够通过提供令人难以置信的逼真声音来吸引受众并与之互动,从而为这些客户提供更好的体验。”

– John Worsfold,英国皇家盲人协会解决方案实施经理

Polly 非常容易上手。只需登录控制台,然后单击几次即可开始将您自己的文本生成语音。

开始使用