読者です 読者をやめる 読者になる 読者になる

オルトプラスエンジニアの日常をお伝えします!

Amazon Polly で変換した音声で Siri に Get Wild をかけてもらう

※この記事は AltPlus Advent Calendar 2016 の3日目の記事です。

こんにちは、中田 (id:satotech) です。

f:id:s-nakada:20161202205921p:plain

AWS re:Invent 2016 では新しいサービスがたくさん発表されましたね!
この記事では「Amazon Polly で変換した音声で Siri に Get Wild をかけてもらう」をやってみたので書いていきます。

youtu.be

  • 音楽が流れはじめてからの音声は消しています
  • でかいボタンの箱の中にはラズパイが入っています
  • iPhone 左にある猫の顔をしているのはスピーカーです
  • 無事、"OK, playing 'Get Wild' by TM NETWORK..." と表示され、再生されました

Amazon Polly

Amazon Polly はテキストを音声で読み上げるサービス。47の男性・女性の声、日本語を含む24の言語をサポートしています。
今後追加予定の言語や声がロードマップにあります。

aws.amazon.com

やったこと

  1. Siri に持ち主の声として、Polly で変換した次の声を用意、iPhone に設定
    • Hey Siri.
    • Hey Siri, How's the weather today?
    • Hey Siri, it's me.
  2. ボタンが押されたらイベントを検知
  3. AWS CLI で Polly の SynthesizeSpeech API を呼び出し、Siri に伝えたいメッセージを mp3 ファイルに変換
  4. 作成された mp3 ファイルをスピーカーから再生
  5. Siri がメッセージを受けて、「Get Wild」を再生

API 呼び出しで実行しているコマンド

$ aws polly synthesize-speech \
  --output-format mp3 --voice-id Joey \
  --text "Hey Siri, play, Get Wild." \
  getwild.mp3

注意点

  • 単語の間にちょうどいい間ができるように "play" の後ろにカンマを入れた
  • ラズパイのアナログ音声出力端子に接続したスピーカーからノイズ音が出ていたためか、Siri がうまく聞き取れない時があった
  • PC にスピーカーを接続した時は音声がクリアでスムーズに反応した

おわりに

  • 他にもいろんな文章からの音声変換を試してみましたが、本物そっくりの音声・表現に変換されていました
  • 発音について情報を追加していくこともできるようなので、試してみたいと思います

※この記事は Qiita の 私の投稿 から転載しています。