2020年のオリンピック開催も来年となり、日本を訪れる外国人の方々をそこかしこで目にするようになりました。こうした外国人とのコミュニケーションに必要な言語はやはり英語になるのでしょう。
「英語が苦手な日本人」というイメージはまだ筆者にはあります。先日、とあるスーパーの店員が外国人とうまくコミュニケーションできない光景を目にしました。英語が苦手な日本人にとっても、ある程度の英会話能力は仕事の現場で必要になってきています。
弊社は「仕事で使う英語」をテーマにした英会話ダイアログサイト『SENSE OF NET』をオープンしました。当サイトでは、英会話ダイアログとその音声(オーディオ)を公開しています。オーディオは、AMAZON WEB SERVICE 「Polly」を使い、mp3を書き出しています。
【Amazon Pollyの使用感】
・ボイスのクォリティ
Amazon Pollyで出力するボイスは、一昔前の音声と比較するとクォリティがかなり向上しています。選択するキャラクター(若年~中年を選択可能)によって、若干発話が不自然な箇所もありますが、時間が経てばそれも解決することでしょう。
・イントネーション、発話スピード
単語のみの発話とセンテンスでのそれでは、多少違和感が出る場合があるので、直したいセンテンスの箇所はSSMLタグを使って調整します。
SSMLとは
SSML 拡張の入力テキストを使用すれば、Amazon Polly を使用して入力したテキストから音声を生成する方法を詳細に制御することができます。
たとえば、テキスト内に長い一時停止時間を追加したり、話す速度やピッチを変更できます。Amazon Polly では、「音声合成マークアップ言語 (SSML) バージョン 1.1、W3C 勧告」で定義されている SSML マークアップタグのサブセットを使用して、このように制御できます。
Amazon Polly でサポートされている SSML タグはこちら