2019年7月31日、中国インターネット検索最大手の百度(バイドゥ)は、AI(人工知能)を活用した言語認識において、言語の意味を理解する自然言語処理モデルの新バージョン「ERNIE 2.0」を発表した。バージョン1.0に続き、英語を扱う言語認識能力が一層強化された。

バイドゥは、ERNIE2.0を発表した
バイドゥは、ERNIE2.0を発表した

 ERNIEは19年3月に初めて発表され、中国語を扱うタスクにおいては米グーグルの自然言語処理モデル「BERT」を全面的にしのぐパフォーマンスを見せ、業界内で注目を集めた。その後、約4カ月という短い期間でERNIE 2.0にグレードアップし、英語を扱うタスクにおいても優秀なパフォーマンスを見せた。

 英語を取り扱う自然言語処理能力を評価するためのデータセット「GLUE」を用いて9つのタスクを実行するパフォーマンス測定において、ERNIE 2.0はBERTおよび19年6月に発表された自然言語処理モデル「XLNet」の両方を、7つのタスクで上回った。また、中国語を取り扱うタスクでは読解や感情分析、問答などそれぞれ異なる9つのタスクすべてのパフォーマンス測定でBERTを超え、同時に「SOTA(State of the Art=最高水準)」を達成した。

教師なし学習の技術を活用

 ERNIE 2.0は、AIに正解を教えずにデータの共通点を見つけ出させる「教師なし学習」の技術を事前学習に活用している。教師なし学習は、この2年の間に自然言語処理の領域で重要視されるようになっており、BERTとXLNetも教師なし学習を活用している。教師なし学習による事前学習は、これまでに言語推定、類似性の把握、実体の認識、感情の分析といった多数のタスクで、ブレークスルー(技術的な突破)を達成している。

有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>