電話と音声合成エンジンのコラボ – Twilio API 勉強会 Vol.13

20140227-01.png

 

2014 年 2 月 26 日の Twilio API 勉強会は「電話と音声合成エンジンのコラボでより広がる可能性!」をテーマに株式会社 エーアイの皆様と「Twilio x AITalk® Web API」を開催いたしました。

電話 API Twilio と音声合成 API AITalk® Web API を両方触りながらデベロッパーのみなさんともくもくと進み、90% 以上の方々が勉強会のゴールまで無事完成しました。エーアイの皆様、参加の皆様お疲れさまでした!

ようこそ Twilio API 勉強会へ

20140227-02.jpg

 

Twilio API 勉強会は Twilio for KDDI Web Communications のデベロッパーコミュニティで、Twilio を触る機会を持ち、今まで気付いてなかったところに気付く等、電話の可能性や新しいアイデアが生まれる勉強会です。

「触る」ことで生まれる新しい発想から我々の生活をより便利により楽しくしてくれるアプリケーションが開発されるのを楽しみにしながら参加のみなさんとハンズオン中心に進んでいます。
Twilio API 勉強会はこれからも皆さんの好奇心へお答えできるような内容で開催して行きます。
引き続き Twilio API 勉強会を楽しみにしてください。

今回の勉強会ではこれをやりました。

20140227-03.png

 

① ウェブでテキスト入力。
② AITalk® Web API を呼び出す。
③ 合成された「mp3」ファイルがローカルに保存される。
④ ウェブサーバーに音声ファイルをアップ。
⑤ TwiML を作成し、ウェブサーバーにアップ。
⑥ Twilio の電話番号に TwiML 設定。
⑦ Twilio 電話番号 ( 050 ) に電話をかけ確かめる。

AITalk® Web API

AITalk® は、コーパスベース音声合成方式を採用し、より人間らしく自然な音声で、自由に音声合成をすることができる音声合成エンジンです。

3つの特徴
  1. 人間の声に近い自然な音声
  2. 20分〜5時間程度の録音で、誰の声でもオリジナルの音声辞書を作成することが可能
    ※1: 個人によって読上げスピードや読み間違い等があるため、収録時間に差があります。
    ※2: 一般的に収録文章数が多いほど音質は向上します。ご用途によって最適な収録数・音声辞書作成法方をご提案いたします。
  3. 豊富な話者のラインナップ

WEB サービス等から音声合成エンジンを SaaS 型で利用できるサービスです。自社で音声合成用 Server を構築する手間が省けるため、WEB サービスや、スマートフォンアプリケーション、ソーシャルゲーム等、様々なサービスで、手軽に音声合成を利用したサービスを開始する事ができます。

テキストを音声に合成

20140227-04.png

 

株式会社 エーアイの孫さんから API の説明を頂きました。API に文字列を乗せ、たたくだけで音声に変換されます。
音声の種類も様々で、いろんな国の言葉にも対応されている面白い API です。
性能にも充実されていてリクエストを送信するとすぐレスポンスが戻って来ますので、リアルタイム的なアプリケーションでも使われます。

勉強会では API URL に合成する文字列を付けて API を呼び出す感じで行いました。
URL を実行すると合成された音声ファイルが各自のローカルにダウンロードされます。
ダウンロードされた音声ファイルを勉強会で用意したウェブサーバーや自分のウェブサーバーにアップし、Twilio の <Play> 動詞に設定しました。

Twilio の電話番号に電話をかければ自分が設定した音声ファイルが再生される。
このように簡単な方法でウェブと電話を繋ぐ事が可能です。

TwiML の作成

20140227-05.png

 

次は合成されたファイルを電話で再生できる機能を実装します。
やり方は簡単 Twilio の <Play> 動詞に mp3 など、音声ファイルの URL を設定します。

コードはこんな感じです。

  1. <Play> と </Play> の間に再生するファイルの URL を設定
  2. Twilio アカウント→電話番号→ Request URL に TwiML URL を設定

その後、自分の Twilio 電話番号 ( 050 ) に着信があった場合、指定されている mp3 ファイルが電話から再生されます。

Request URL 設定についてはこちらをご覧ください。

20140227-06.png

 

これで再生ファイル、Twilio を動かす TwiML、電話番号の設定が終わりました。
ここが参加の皆さんが初めて Twilio の体験するところで勉強会中一番盛り上がるところです!
それでは試してみましょう!
今までは考えたことのない新しい体験で、たった数行のコードを書いて、初めてなのに 1 時間もかからない時間で電話と繋がるアプリケーションの完成や自分で書いたコードで電話の処理が動くのを確認するとみなさんは大喜び!

このように Twilio は驚くほど簡単なコードを書くだけで電話と皆さんのアプリケーションを繋いでくれます。やり方は簡単、アイデア次第で我々の生活はより便利により楽しく変化します。

タブレットでもくもく!!

20140227-07.jpgのサムネイル画像20140227-08.jpg20140227-09.jpg

 

パソコンの電源を忘れていらした参加者の方は持っていたタブレットでもくもくと、みごとに勉強会のゴールまで!大変お疲れさまでした!

もくもくとTwilioハンズオン

20140227-10.jpg20140227-11.jpg20140227-12.jpg20140227-13.jpg20140227-14.jpg20140227-15.jpg

 

まとめ

Smart Communication Award 2014 には株式会社 エーアイ様より「AITalk® Web API」が開発素材として無料で提供されています。

事業化をテーマにした「Smart Communication Award 2014」
https://contact.secure.ne.jp/webapp/form/12402_ajs_152/index.do

電話とウェブをどこにどうやって使えばいいのか最初はよくわからないまま、好奇心で参加した皆さんは勉強会後、Twilio を使った新しいアイデアを話し合いながら楽しんでいます。
これからも Twilio API 勉強会はデベロッパーのみなさんと一緒に新しいアプリケーション、既存システムやアプリケーションの強化を狙って行きます!
触ってみましょう!そこから生まれるアイデアを楽しみましょう!

次回の Twilio API 勉強会は 3 月 26 日を予定しています。
テーマは「音声をテキストに!」この機能は Twilio でも持っていますが、今現状英語のみになっています。
これを Amivoice という音声認識エンジンを使って実現させてみたいと思います。

みなさんのご参加をお待ちしております!
http://twiliomeetup.doorkeeper.jp/events/9523

この記事をシェア


すべての記事へ

Event

ビジネスセミナーVol.57 コミュニケーションをデータにして分析しよう

Event

セミナーレポート:ビジネスセミナーVol.56 顧客体験向上のためのLINE活用法

Event

Twilio ビジネスセミナー Vol.55 Twilio × Stripe で実現する Fintech ソリューション 〜プログラマブルで安全な電話決済と業務効率化〜

Event

TwilioビジネスセミナーVol.54 SIGNAL報告会

Event

SIGNAL Day2での発表事項振り返り

Event

SIGNAL Day1での発表事項振り返り