Amazon Polly 시작하기

Amazon Polly는 텍스트를 생생한 음성으로 변환하는 서비스입니다. Amazon Polly를 사용하면 말하는 애플리케이션을 만들 수 있으므로 음성 지원 제품이라는 전혀 새로운 카테고리를 구축할 수 있습니다. Amazon Polly는 고급 딥 러닝 기술을 사용하여 실제 사람 목소리처럼 음성을 합성하는 Amazon AI 서비스입니다. Amazon Polly에는 다양한 언어로 수십 개의 생생한 음성이 포함되어 있으므로 여러 국가에서 원하는 음성을 선택하여 음성 지원 애플리케이션을 개발할 수 있습니다.

또한, 양방향 대화를 실시간으로 지원하는 데 필요한 일관성 있게 빠른 응답 시간을 구현합니다. Amazon Polly의 음성 오디오를 캐싱 및 저장하여 오프라인에서 재생하거나 재배포할 수도 있습니다. 그 밖에도 Amazon Polly는 사용이 쉽습니다. 음성으로 변환할 텍스트를 Amazon Polly API로 전송하기만 하면 Amazon Polly가 애플리케이션으로 오디오 스트림을 즉시 반환하기 때문에 애플리케이션에서 직접 재생하거나, 혹은 MP3 같은 표준 오디오 파일 형식으로 저장할 수 있습니다.

Amazon Polly를 사용하면 음성으로 변환한 문자 수에 대해서만 요금을 지불하고 Amazon Polly에서 생성된 음성을 저장하고 재생할 수 있습니다. Amazon Polly는 변환된 문자당 비용이 저렴하고 음성 출력의 저장 및 재사용에 제한이 없어 어디서나 텍스트 음성 변환을 비용 효과적으로 지원할 수 있습니다.

Amazon Polly 듣기

이 사이트에서 동영상을 보려면 Adobe Flash Player 또는 최신 브라우저가 필요합니다.

Amazon Polly 소개
1:20
Introducing Amazon Polly, AWS re:Invent 2016


인용 부호와 속삭임 기능 발표

Amazon Polly의 새로운 인용 부호 및 속삭임 소리 기능에 대한 2분 개요(2017년 4월)


언어 여성 남성 샘플 텍스트
영어 Joanna Joey Hello. Do you speak a foreign language? One language is never enough.
덴마크어 Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
포르투갈어(브라질) Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
스페인어 Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
아이슬란드어 Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.

Amazon Polly 음성 및 지원되는 언어 전체 목록은 여기에서 확인하십시오.

자연스러운 음성

자연스러운 음성

Amazon Polly는 다양한 억양의 남성 및 여성 음성을 비롯해 수십 개의 생생한 음성을 제공하고 여러 언어를 지원합니다. 여러 언어로 유창하게 텍스트를 발음하는 Amazon Polly를 이용해 고품질 음성 출력을 제공하고 글로벌 사용자를 대상으로 애플리케이션을 제작할 수 있습니다.

용이한 통합

용이한 통합

Amazon Polly는 손쉽게 웹사이트, 모바일 앱 또는 디바이스에 음성을 추가할 수 있게 해줍니다. 음성으로 변환할 텍스트를 작성하여 Amazon Polly API에 전송하기만 하면 Amazon Polly API가 즉시 오디오 스트림을 반환합니다. 긴 승인 프로세스가 필요한 다른 솔루션과 달리, Amazon Polly는 애플리케이션에서 Amazon Polly의 음성을 어떻게 사용할지 설명할 필요가 없고 배포 계약에 서명할 필요도 없으므로 곧바로 시작할 수 있습니다.

음성 저장 및 재배포

음성 저장 및 재배포

이전에 재생된 오디오를 재생할 때마다 로열티를 요구하거나 요금을 부과하는 다른 솔루션과 달리, Amazon Polly는 추가 요금 없이 무제한 재생을 허용합니다. 이러한 무료 재생은 오프라인 사용까지 확대됩니다. MP3 및 OGG와 같은 다양한 표준 형식으로 음성 파일을 생성하여 오프라인 재생 전용으로 휴대폰 또는 사물 인터넷(IoT) 디바이스와 같은 디바이스에 저장할 수 있습니다.

 

저렴한 비용

저렴한 비용

Amazon Polly의 종량 요금제, 변환 문자당 저렴한 비용, 무제한 재생은 거의 모든 애플리케이션에서 음성 합성을 구현하는 비용 효과적인 방법을 제공합니다.

빠른 응답

빠른 응답

실제 같은 음성과 대화 사용자 경험을 제공하기 위해서는 일관되게 빠른 응답 시간이 요구됩니다. 음성 지원 애플리케이션은 지연 없이 합성 음성을 재생해야 합니다. 내비게이션용 음성 안내를 제공하는 앱, 학생에게 음성으로 교수하는 이러닝 애플리케이션, 실시간 대화를 통해 사용자와 상호 작용하는 앱을 생각해 봅시다. 이러한 앱은 대화 흐름에서 인지되는 지연 없이 응답이 시작될 수 있을 경우 가장 효과적입니다. Amazon Polly API로 긴 텍스트를 전송하더라도 Amazon Polly API가 오디오를 스트림으로 애플리케이션으로 반환하므로 즉시 음성을 재생할 수 있습니다. 이러한 동적 음성 응답은 일반적으로 사용자의 디바이스에 장착된 저장 공간에서 사용 가능한 것보다 훨씬 큰 용량의 음성 오디오에 대한 액세스를 요구합니다. Amazon Polly는 클라우드 기반이므로 매우 다양한 합성 음성에 액세스할 수 있습니다. Amazon Polly를 사용하면 애플리케이션이 실시간 데이터가 포함된 훨씬 유용한 응답을 제공할 수 있습니다.

Amazon Polly는 손쉽게 비디오, 프레젠테이션 또는 온라인 교육 과정에 음성을 추가할 수 있게 해줍니다. Amazon Polly는 24개 언어로 음성을 생성할 수 있어 전 세계 사용자를 대상으로 하는 애플리케이션에 간편하게 음성을 추가할 수 있습니다. Amazon Polly를 사용하면 RSS 피드, 뉴스 또는 이메일을 읽고 합성 음성을 오디오 파일로 저장할 수 있습니다.

콘텐츠 생성
GoAnimate

“Amazon Polly는 GoAnimate 사용자가 당사 플랫폼을 사용하여 애니메이션화하는 캐릭터에 즉각적으로 음성을 부여하는 기능을 제공합니다. 이 기능은 예를 들어 여러 언어로 비디오를 개발하거나 승인 프로세스 시간을 단축하기 위해 사전 제작 범위 내에서 비디오를 개발하는 경우와 같이 실시간 보이스오버가 리소스 또는 시간상 불가능한 시나리오에서 특히 유용합니다. 음성은 당사의 풍부한 사전 애니메이션화된 자산과 원활하게 통합되어 GoAnimate를 더욱 사용하기 쉽게 만들 뿐 아니라 고객이 효율을 높이고 출시 시간을 단축할 수 있게 해줍니다.”

– Alvin Hung, CEO 겸 창업자, GoAnimate


Amazon Polly를 사용하면 개발자가 음성이 동기화된 얼굴 애니메이션 또는 노래방 형태의 자막 강조 표시와 같은 향상된 시각적 경험을 애플리케이션에서 제공할 수 있습니다. Amazon Polly에서는 특정 문장, 단어 또는 소리가 발음되는 시점에 대한 정보가 담긴 메타데이터의 추가 스트림을 손쉽게 요청할 수 있습니다. 합성된 음성 오디오 스트림과 함께 이러한 메타데이터 스트림을 사용하면 고객이 현재 음성 텍스트를 제공하는 앱에서 아바타를 애니메이션으로 만들고 텍스트를 강조 표시할 수 있습니다.

콘텐츠 생성
Wizkids

“당사는 클라우드 기반 강의실을 읽기 및 쓰기 장애를 가진 사용자를 포함하여 모든 사람에게 좀 더 매력적이고 효과적으로 만들기 위해 노력하고 있습니다. Amazon Polly는 당사의 AppWriter 제품군에 고품질 텍스트 음성 변환 기능의 음성을 통합함으로써 학습 플랫폼을 강화합니다. 우리 사용자에게는 텍스트를 읽는 음성이 들리면서 해당 텍스트가 실시간으로 강조 표시되는 것이 정말 중요합니다. Polly의 인용 부호 기능을 통해 AppWriter는 향상된 읽기 경험을 제공할 수 있습니다. 이는 읽기와 쓰기에 어려움을 겪고 있는 모든 사용자에게 큰 도움이 됩니다."

- Stefan Pal, COO, Wizkids

Amazon Polly는 손쉽게 모바일 앱 및 게임에 음성을 추가할 수 있게 해줍니다. Amazon Polly를 사용하면 디바이스에 표준 음성 응답을 저장할 수 있을 뿐 아니라 게임 내 캐릭터 대화, 순위표 및 게임 초대와 같은 동적 실시간 응답도 구현할 수 있습니다.

모바일 및 데스크톱 앱
The Washington Post

"우리는 오래동안 1,200개 이상의 일상 이야기를 오디오 버전으로 제공하는 데 관심을 기울였지만, 이전에 있었던 TTS(텍스트 투 스피치) 솔루션은 제공했던 음질에 비해 경제적이지 않다는 것을 알았습니다. Amazon Polly와 여기서 제공하는 고급 음성이 나오면서, 우리는 독자들에게 우리의 콘텐츠를 경험하기 위한 더 풍부하고 다채로운 방법을 제공할 것을 기대합니다."

- Joseph Price, 워싱턴 포스트, 수석 제품 관리자


Amazon Polly를 사용하면 고객 문의 센터가 자연스러운 음성으로 응답할 수 있습니다. Amazon Polly의 음성 출력을 대화형 음성 응답(IVR) 시스템을 통해 재생할 수 있습니다. 또한, Amazon Polly API를 이용하여 서비스 상태, 계정 및 요금 문의, 주소, 연락처 정보와 같은 자동화된 실시간 정보를 제공할 수 있습니다.

고객 문의 센터

Amazon Polly를 사용하면 저렴하게 사물 인터넷(IoT) 디바이스에 음성을 추가할 수 있으므로 새로운 IoT 사용 사례를 구현할 수 있습니다. IoT 디바이스는 음성을 사용하여 자연스러운 응답 및 알림을 제공할 수 있으므로 애플리케이션 접근성이 개선되고 사용자는 화면을 통해 응답하지 않고 정보를 소비할 수 있습니다. Amazon Polly에서는 음성 파일을 생성하여 오프라인 재생을 위해 디바이스에 저장할 수 있습니다.

AWS Lambda를 사용하여 AWS IoT 규칙 엔진의 이벤트를 기반으로 사전 서명된 Polly URL을 생성한 다음, 디바이스 게이트웨이를 통해 이들 URL을 IoT 디바이스로 전송하여 실제 같은 음성을 요청하도록 허용합니다.

사물 인터넷(IoT)

Amazon Polly는 새로운 언어를 말하는 법을 교수하는 애플리케이션의 사용성을 개선하는 데 활용할 수 있습니다. 예를 들어 최종 사용자가 애플리케이션에 외국어를 입력하고 원어민의 발음으로 들을 수 있습니다. Amazon Polly는 24개 언어를 지원하므로 강사 및 학생에게 다양한 옵션을 제공합니다.

언어 학습
Duolingo

“새로운 언어를 학습할 때보다 정확한 발음이 중요한 사용 사례는 거의 없을 것입니다. Amazon Polly 음성은 품질만 높은 것이 아니라 언어 교수 용도에서 사람 음성만큼 자연스럽습니다.”

– Severin Hacker, CTO, Duolingo


Amazon Polly를 사용하면 시각 장애인을 위해 합성 음성 형태로 액세스 가능한 정보를 생성하고 배포할 수 있습니다. 이를 통해 시력을 상실한 사람이 뉴스, 도서 또는 이메일 메시지와 같은 다양한 콘텐츠를 소비하도록 도울 수 있습니다.

Royal National Institute of Blind People

“당사는 현재 Amazon의 스피치 투 텍스트 기술을 사용하여 유틸리티 회사, 금융회사, 미디어 회사를 비롯한 많은 B2B 및 B2C 고객을 위한 음성 오디오 콘텐츠, 그리고 잡지, 서적과 같은 다른 고객 대면 자료의 형식으로 액세스 가능한 정보를 생성하고 배포하고 있습니다. Amazon Polly가 출시되면서 놀라울 정도로 실제와 비슷하여 고객을 사로잡고 몰입시킬 수 있는 음성을 제공함으로써 이러한 고객에게 훨씬 향상된 환경을 제공할 수 있게 된 것을 기쁘게 생각합니다.”

– John Worsfold, 솔루션 구현 매니저, Royal National Institute of Blind People

쉽게 Amazon Polly를 시작할 수 있습니다. 콘솔에 로그인하고 몇 번의 클릭이면 텍스트를 음성으로 변환하기 시작할 수 있습니다.

시작하기