PaLM 2 のご紹介
過去 10 年間の AI における最大の進化を振り返ると、Google はその多くの場面で先頭に立ってきました。私たちの基盤モデルにおける画期的な研究は、この業界と何十億人もの人々が毎日使用している AI を活用した製品の基礎になっています。私たちがこれらの技術を責任を持って進歩させ続けることで、医療から人間の創作活動に至るまで、広範囲にわたる分野で大きな変革をもたらすことができる可能性があります。
AI の開発における過去 10 年間に、私たちはニューラルネットワークを大規模化することで非常に多くのことが可能になることを学びました。実際、より大きなサイズのモデルが驚くべき能力を示すのを見てきました。しかし同時に、私たちの研究を通じて、それは「大きければ良い」という単純なものではなく、創造的な研究が優れたモデルを構築するための鍵であることも学びました。モデルのアーキテクチャと学習方法に関する最近の進歩の過程で、マルチモーダル性を獲得させる方法、人間からのフィードバックをプロセスに含めることの重要性、モデルをこれまで以上に効率的に構築する方法などが分かりました。これらはどれも有用な技術要素であり、AI の最新技術を進歩させ、人々の日常生活に真の利益をもたらすモデルを構築していくために役立ちます。
PaLM 2 について
本日、次世代言語モデルである PaLM 2 を発表しました。PaLM 2 は、 この研究 を発展させたもので、多言語、推論、およびコーディング機能が向上した最先端の言語モデルです。
多言語: PaLM 2 は、100 以上の言語にわたる多言語テキストに、より重点をおいて学習しています。これにより、慣用句、詩、なぞなぞなど、ニュアンスを含む表現を数多くの言語で理解、生成、翻訳するという難しい問題に対する性能が大幅に向上しました。PaLM 2 は、上級レベルの言語能力試験で「習得」レベルに合格しました。
推論: PaLM 2 で学習に利用した広範なデータセットには、数式を含む科学論文やウェブページが含まれています。その結果、ロジック、常識に基づく推論、数学に関する能力が向上しています。 コーディング(プログラミング): PaLM 2 は、公開されている大量のソースコードデータセットで事前学習しています。結果として、Python や JavaScript などのよく使われるプログラミング言語だけでなく、Prolog、Fortran、Verilog などの言語でコードを生成することもできます。
幅広い用途をカバーするモデルラインナップ
PaLM 2 は、以前のモデルよりも能力が高く、高速で効率的です。また、さまざまなサイズで提供されるため、あらゆる用途で展開できます。PaLM 2 には、Gecko、Otter、Bison、Unicorn という 4 つのサイズがあります。Gecko は非常に軽量なため、モバイル 端末で動作し、オフラインの状態でも、デバイス上の優れたインタラクティブ アプリケーションを実現するのに十分な速さです。この汎用性のおかげで、PaLM 2 は、幅広い製品をカバーする形でファインチューニングすることができ、より多様な形でより多くの方の役に立つことができます。
25 を超える Google の製品と機能に搭載
本日の I/O で、PaLM 2 を搭載した 25 以上の製品と新機能を発表しました。PaLM 2 は、最新の高度な AI 機能を直接製品に搭載し、世界中のユーザー、開発者、企業などあらゆる規模の人々に提供します。以下にいくつかの例を挙げます。
- PaLM 2 の多言語機能の向上により、本日より Bard を日本語を含む新しい言語で対応しました。また、最近発表されたコーディングアップデートにも利用されています。
- Gmail と Google ドキュメントでの下書きやスプレッドシートでの整理をサポートする Google Workspace の機能は、PaLM 2 の機能を活用することで、ユーザーがより良い仕事をより速く行えるよう支援します。
- 当社の医療研究チームが医療情報のデータを使って学習した Med-PaLM 2 は、理解するのが容易でない医学文章の内容を用いて質問に答えたり、洞察をまとめたりすることができます。医師としての適性を測るテストにおいて最先端の結果を達成し、米国医師国家試験形式の質問で「エキスパート」レベルのパフォーマンスを達成した最初の大規模言語モデルとなりました。現在、X 線やマンモグラフィーなどの情報も統合するためのマルチモーダル機能を追加しており、将来的に患者の回復に貢献することを目指しています。Med-PaLM 2 は、安全で役立つ利用法を探すため、今年の夏後半に少数の Cloud のお客様にフィードバックをいただくことを目的とし提供する予定です。
- Sec-PaLM は、セキュリティユースケース向けにトレーニングされた PaLM 2 の特殊バージョンであり、サイバーセキュリティ分析の飛躍的な可能性を秘めています。Google Cloud を通じて提供される Sec-PaLM は、AI を利用して潜在的に悪意のあるスクリプトの動作を分析・説明することで、人や組織に実際に脅威を与えるスクリプトをかつてないほど迅速に検出できます。
- この 3 月から、少数の開発者向けに PaLM API のプレビューを実施しています。本日より、開発者は PaLM 2 モデルへの登録が可能になり、お客様は Vertex AI でエンタープライズクラスのプライバシー、セキュリティ、ガバナンスを備えたモデルを使用することができます。PaLM 2 は Duet AI for Google Cloud にも搭載されています。Duet AI は、ユーザーがこれまで以上に速く学び、構築し、運用できるように設計されたジェネレーティブ AI とのコラボレーションです。
- Google 検索の Search Labs では、PaLM2 や さらに進化した MUM など複数の大規模言語モデルをベースとしたジェネレーティブ AI を活用した SGE (Search Generative Experience) の試験運用を行います。SGEは、まずは英語での対応となり、米国にて登録された方のみお試しいただけます。
AI の未来を前進させる
PaLM 2 は、非常に高性能なモデルが多様な大きさと速度で提供されることで、多用途に使えるのAIモデルがすべての人にとって真の利益をもたらすことを示してくれました。Google は現在、最も役立ち責任ある AI ツールの提供に尽力しているのと同時に、Google にとってこれまでで最高の基盤モデルの作成にも取り組んでいます。
Google の Brain と DeepMind の研究チームは、過去 10 年間に AI で多くの画期的な成果を生み出してきました。この 2 つのワールドクラスのチームを 1 つのユニットに統合し、進歩を加速し続けています。Google の計算リソースに支えられた Google DeepMind は、毎日使用する製品に驚くべき新機能をもたらすだけでなく、責任を持って次世代の AI モデルへの道を開くでしょう。
私たちはすでに、Gemini の開発に取り組んでいます。Gemini は、マルチモーダル、そして他のツールや API との統合に効率的でメモリやプランニングなどのイノベーションを実現するために一から構築している次世代モデルです。Gemini はまだ学習中ですが、以前のモデルでは見られなかったレベルでのマルチモーダル能力をすでに示しています。Gemini は、安全性の観点でのファインチューニングとテストを行った上で、PaLM 2 と同様にさまざまなサイズと性能として提供し、あらゆる人が恩恵を受けられるように多様な製品、アプリケーション、およびデバイスに展開する予定です。