音声アシスタント端末の普及が、ナレーターや声優など声を武器に仕事をする人々に新たなビジネスチャンスを生み出している。音声コンテンツや音声合成に、人間の生音声を利用したい需要が増えているためだ。今夏米国で開かれた音声テクノロジー業界専門のカンファレンス「VOICE Summit 2019」では、その潮流を強く感じることができた。

今夏、米国ニュージャージー州ニューアークで開かれた「VOICE Summit 2019」
今夏、米国ニュージャージー州ニューアークで開かれた「VOICE Summit 2019」

 VOICE Summit 2019の3日目に開かれた講演「The Human Voice in the Voice-First Era」では、カナダVoices.comがプロのボイスタレントと企業をマッチングする自社のマーケットプレイスを紹介した。例えば「南アフリカなまりの英語を話す中年男性」のように条件を指定し、オンライン上でボイスタレントを探してオーディションの開催までできる。言語や方言の種類は日本語を含む合計100以上。ボイスタレント登録数は8万件を超えているという。

 Voices.comがマーケター向けに行ったアンケート調査によると、音声アプリにボイスタレントの声を利用しているのは15%にとどまる。音声アシスタント端末に標準設定されている機械的な声のみを利用している人は74%もいる。

3日目に開かれた講演が「The Human Voice in the Voice-First Era」。カナダVoices.comが生身の人間の声を使った方が利用者とのエンゲージメントが高まるとアピールした
3日目に開かれた講演が「The Human Voice in the Voice-First Era」。カナダVoices.comが生身の人間の声を使った方が利用者とのエンゲージメントが高まるとアピールした

 だが、機械的で冷たい標準の声に比べて生の人間の声を利用すれば、利用者とのエンゲージメントは高まるだろう。機械的な声は1分以内のナビゲーションには向くかもしれないが、比較的長い時間聞いてもらいたい場合やエンターテインメント要素を取り入れたい場合には、生の人間の声の方が効果的だ。自社ブランドをより効果的に表現し、他社アプリと差異化するにも最適である。

 こうした動きを受けて、2007年に米マサチューセッツ州で創業したアプローズは、米アマゾン・ドット・コムのVUI「Alexaスキル」および米グーグルのVUI「Googleアクション」に特化したボイステスト支援の提供を始めている。音声アシスタント機器の難しいところは、利用者が人間の声で操作する点だ。イントネーションや方言はもちろん、言い回しのバリエーションは無限にあり、100%動作を試験することは不可能に近い。

 同社の講演では、VUIを開発する過程で必要になる人間による対話テストを、クラウド経由でアプローズに依頼できることを紹介した。同社は世界各国にテストを手伝ってくれるメンバーを抱えており、テストごとにチームを編成。対話だけでなく、システム側の不具合を洗い出す目的でも利用できる。サードパーティーがAlexaを自社製品に組み込むためのアマゾン提供のサービスAVS(Alexa Voice Service)にも対応している。

機械的な声は1分以内のナビゲーションには向く。ただ比較的長い時間になると、生の人間の声の方が利用者の反応が良いという
機械的な声は1分以内のナビゲーションには向く。ただ比較的長い時間になると、生の人間の声の方が利用者の反応が良いという

VoiceUIがダイバーシティを推進

 いくつも聴講した講演のうち、筆者が最も驚いたのは、最終日のクロージング基調講演だった。というのも、VUIのカンファレンスにもかかわらず、壇上に“声”がなかったからだ。

有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>