話した言葉をテキストデータに変換できる「音声文字起こしサービス」。テレワーク時代の情報共有ツールとして大いに役立つものの、気になるのはその実用性だ。発言の認識精度に加え、大まかな流れや会話の文脈を後から振り返るのに使えるのかどうか。主要な7つのサービスを使用し、比較した。
※日経トレンディ2021年5月号の記事を再構成
ディープラーニングやビッグデータの活用が進み、音声認識の精度が大きく向上。話した言葉をテキストデータに変換できる「音声文字起こしサービス」が相次いで登場している。
会議の内容を振り返ったり、他の人にシェアしたりなど、テレワーク時代の情報共有ツールとして注目されているこれらのサービスは、どこまで実用的なのか。主要な7つのサービスを実際に使い、比較してみた。
音声文字起こしサービスを選ぶ際のポイントは3つ。まず重視すべきは音声の「認識方式」だ。進行中の会議の音声をリアルタイムでテキスト化していくものと、アップロードした会議の録音データをテキスト化する2つの方式がある。リアルタイム方式であれば会議中でも直前の発言などを確認できて便利だが、会議の間はインターネットに接続しておく必要がある。
生成されたテキストを、サービス上で「直接編集」できるかどうかにも違いがある。特に再生している位置をテキストでハイライト表示できると、後から文字修正する際に便利だ。
さらに、会議の音声やテキストをクラウドに「保存」するかにも違いがある。保存した会議の内容を後から確認したり共有したりできるサービスもある。
この記事は会員限定(無料)です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー