メインページに戻る
Japan Blog

最新技術 MUM で新型コロナワクチンに関する検索の精度を向上



おむすびとおにぎり、定規と物差し、サッカーとフットボールのように、多くのものには異なる呼び方があります。これは、言語あるいは文化的な傾向やニュアンス、または場所など様々な理由によるものです。

同じような例のひとつとして、新型コロナウイルス感染症が挙げられます。多くの人々が厚生労働省や世界保健機関などの 信頼性の高いタイムリーな情報 を入手できるよう、新型コロナウイルス感染症のすべての呼び方を検索において識別する必要がありました。1 年後、ワクチンの呼び方でも同様の課題に直面しましたが、今回は新しく Multitask Unified Model (MUM) という技術を活用することができました。

ワクチン情報に関する検索を理解する

アストラゼネカ、モデルナ、ファイザー、コロナバック、スプートニクを含め広く配布されているすべてのワクチンは、世界中でさまざまな呼び方をされています。分析によると、その数は 800 を超えています。ワクチンに関する情報の検索では、新型ウイルスワクチン、mrnaワクチン、AZD1222 など、多くの異なる検索ワードが使用されています。
これらすべての名前を正しく識別する能力は、ワクチンに関して最新の信頼性の高い情報を提供するために重要です。しかし、世界中の人々が用いる異なるワクチンの呼び方を特定することは、非常に時間のかかる作業であり、数百時間が必要でした。 

そこで、検索の新しい技術 MUM を活用したところ、50 を超える言語で 800 を超えるワクチン名のバリエーションを数秒で特定することができました。この MUM が特定した結果を検証した後、Google 検索に適用することで、新型コロナワクチンに関する信頼性の高い世界中の情報を探すことが可能になりました。

検索で新型コロナワクチンの情報を表示される画面の画像。

検索で、新型コロナワクチンに関して信頼性の高い情報を表示

言語間で知識を伝達する

MUM が数週間かかる仕事をわずか数秒でこなせたのは、知識移転スキルのおかげです。MUM はトレーニングを受けた 75 以上の言語から学習して知識を伝達することができます。たとえば、本を読むことを想像してみてください。あなたがマルチリンガルであれば、どれほど流暢に話せるかにもよりますが、他の言語でその本の要点を説明することができます。これは、あなたが言語や翻訳に頼ることなく、本の内容を理解できているためです。MUM は、同じように言語間で知識を伝達することができます。 

また、MUM は異なる言語ごとに新たな能力やスキルを習得する必要がありません。学習内容を異なる言語間で伝達することにより、使用するトレーニングデータが少ない場合でも、検索精度の改善を迅速に広く適用できます。これは、MUM のサンプル効率が良いおかげでもあります。MUM は、以前のモデルよりもはるかに少ないデータ入力で同じタスクをこなせます。新型コロナワクチンのケースでは、公式のワクチン名のほんのわずかなサンプルで言語間のバリエーションを識別することができました。

MUM で Google 検索を改善

この度の MUM の初めての適用は、世界中のユーザーに重要な情報をタイムリーに提供するのに役立ちました。私たちは、今後も MUM の活用を通じて検索をより便利にしていくことを楽しみにしています。初期のテスト段階では、MUM は既存システムの改善だけでなく、情報の検索および探索における新たな手法の開発にも役立つことが示されています。