ゲームから生物学、そしてその先へ:AlphaGo が変えた 10 年とそのインパクト
10 年前、Google DeepMind の AI システム AlphaGo は、極めて複雑なゲームである囲碁で初めて世界チャンピオンを破ったプログラムとなりました。これは、多くの専門家が実現には少なくともあと 10 年かかると考えていた時期に到達した、大きな節目でした。この快挙は、現在の AI 時代の幕開けを告げるものとなりました。伝説的な「37 手目」によって、AlphaGo は AI の創造的な可能性を証明し、現実世界の科学的課題への応用に向けた技術を私たちはすでに手にしていることを世界に示したのです。
この画期的な進歩は今日も、AGI の実現に向けた道のりにおいて、私たちのシステム構築の指針となり続けています。AGI は、これまでの発明の中で最も革新的なテクノロジーとなり、科学、医療、そして生産性を飛躍的に向上させる究極のツールになると私たちは信じています。
創造性の火花
2016 年、ソウルで開催された AlphaGo と囲碁世界チャンピオン李世ドル氏との対局は、2 億人以上の人々に見守られました。この対局を象徴するのが、第 2 局の「37 手目」です。型破りな一手に、プロの解説者は最初、打ち間違いではないかと疑いました。しかし、これこそが決定的な一手となりました。その一石が、約 100 手先の AlphaGo の勝利を決定づける完璧な布石であったことが、のちに証明されたのです。それは、AI システムが単に人間の専門家を模倣するだけでなく、全く新しい戦略を見出す先見性と能力を示した瞬間でした。
囲碁は、その圧倒的な複雑さから、長年にわたり AI 研究の試金石とされてきました。盤上で起こり得る局面の数は 10170 通りにも上り、観測可能な宇宙に存在する原子の数をはるかに凌駕します。
この膨大なゲームを攻略するため、AlphaGo は深層ニューラル ネットワークに高度な探索アルゴリズムと強化学習を融合しました。これは、Google DeepMind が先駆けて開発した AI のアプローチです。
AlphaGo はまず、人間のプロ棋士の棋譜から学習し、その後数十万回にも及ぶ自己対局を繰り返すことで、勝利に直結する戦略を自ら強化していきました。こうして、無数にある手の中から最も有望な候補を絞り込み、その中から勝利に繋がる可能性が最も高い一手を見出すのです。
AlphaGo の後、完全にランダムな対局から囲碁を学習し、おそらく史上最強の棋士となった AlphaGo Zero を開発しました。さらに、このシステムを汎用化し、囲碁、チェス、将棋など、2 人用の完全情報ゲームをゼロから習得できる AlphaZero へと進化させましたました。AlphaZero はルール以外の事前知識を持たない状態から、わずか数時間でチェスを学習し、人間のトップ プレイヤーだけでなく、当時の最強のチェス プログラムだった Stockfish をも上回りました。こうしたプログラムにより徹底的に解析しつくされていたチェスでさえ、AlphaZero は囲碁と同様に、革新的な戦略を生み出しました。
それは、ソウルでの勝利の瞬間に私たちが確信したことのさらなる証明でもありました。このテクノロジーは、科学的なブレークスルーを加速するという私たちの真の目標に応用できる段階に達していたのです。
科学的なブレークスルーの触媒として
囲碁の盤上という広大な探索空間を攻略できることを証明した AlphaGo は、物理世界の広大で複雑な仕組みの解明に AI が貢献できる可能性を示しました。私たちは次に、タンパク質の 3D 構造を予測するというタンパク質折り畳み問題に取り組みました。これは、50 年にわたる科学界の大きな課題で、疾患の理解や新薬開発に不可欠な情報を提供します。
2020 年、私たちは AlphaFold 2 によって、この長年の科学的難問を解決しました。そこから、既知の 2 億個のタンパク質構造を解析し、オープンソースのデータベースとして世界中の科学者に無償で公開しました。現在、世界中で 300 万人以上の研究者が AlphaFold データベースを活用し、マラリア ワクチンからプラスチック分解酵素に至るまで、さまざまな重要な研究を加速させています。2024 年には、AlphaFold チームを代表し、プロジェクトを率いた John Jumper と私がノーベル化学賞を受賞するという、この上ない栄誉を授かりました。
AlphaGo の勝利以来、私たちはその画期的なアプローチを、科学や数学などの多くの分野に応用してきました。
数学的推論: AlphaGo のアーキテクチャを最も直接的に継承した AlphaProof は、言語モデルと、AlphaZero の強化学習および探索アルゴリズムを組み合わせ、数学的命題の証明を学習しました。AlphaGeometry 2 とともに、国際数学オリンピック(IMO)で銀メダル相当の成績を収めた初のシステムとなり、AlphaGo の手法が高度な数学的推論を可能にすること、そして私たちの最も高性能な汎用モデルの基礎を築いていることを証明しました。
私たちの最大かつ最も高性能なモデルである Gemini は、さらにその先へ進みました。Gemini の 複雑な問題を解決する「思考モード」高度版は、AlphaGo にインスパイアされた手法を用いることで、2025 年の IMO で金メダル相当のパフォーマンスを達成しました。以来、Deep Think は科学や工学における、より複雑でオープンエンドな課題にも応用されています。
アルゴリズムの発見:AlphaGo が囲碁において最善手を探索したように、コーディング エージェントの AlphaEvolve は、より効率的なアルゴリズムを求めてコードの空間を模索します。現代のほぼすべてのニューラル ネットワークを支える基礎的な数学演算である行列乗算の新しい手法を発見した際、このモデルも独自の「37 手目」の瞬間を迎えました。AlphaEvolve は現在、データセンターの最適化から量子コンピューティングに至るまで、さまざまな問題に適用が進められています。
科学的コラボレーション:AlphaGo で先駆けた探索と推論の原理は AI co-scientist にも統合しています。複数のエージェントが科学的なアイデアや仮説を「議論する」ことで、データのパターンを特定し、複雑な問題解決に必要な厳密な思考を行う協力者として機能します。インペリアル カレッジ ロンドンでの検証研究では、数十年の文献を分析し、研究者が長年かけて開発し、検証してきた抗菌薬耐性に関する仮説と、同じ結論に独自に到達しました。
また、ゲノムの理解、核融合エネルギー研究の推進、天気予報の精度向上などにも AI を活用しています。
これらの科学モデルは驚異的な成果を上げていますが、まだ特定の分野に特化したものです。クリーン エネルギーの実現や、未解明の疾患の克服といった根本的なブレークスルーを達成するには、異なる分野をつなぐ構造を発見し、優れた科学者のように新しい仮説を提案できる汎用的な AI システムが必要です。
知能の未来
真に汎用的な AI は、物理世界を理解しなければなりません。私たちは Gemini を当初からマルチモーダルとして構築してきました。言語だけでなく、音声、動画、画像、コードを理解し、世界のモデルを構築できるようにするためです。
これらのモダリティを横断して思考し、推論するために、最新の Gemini モデルには AlphaGo や AlphaZero で先駆けて開発された技術が活用されています。
次世代の AI システムは、特化型のツールを自ら使いこなすようになります。例えば、モデルがタンパク質の構造を知る必要がある場合に、AlphaFold を呼び出して利用するなどです。
私たちは、Gemini の世界モデル、AlphaGo の探索と計画の技術、そして特化型の AI ツールの活用を組み合わせることが、AGI の実現に不可欠であると考えています。
そのような AGI システムが備えるべき重要な能力が、真の創造性です。「37 手目」は、AI が固定概念にとらわれずに思考できる可能性の片鱗を見せてくれました。しかし、真に独創的な発明にはそれ以上のものが必要です。AlphaGo が囲碁の斬新な戦略を考案したように、単に新しい手法を見つけるだけでなく、囲碁のように深く洗練され、研究し続ける価値がある「ゲームそのもの」を創り出せるようになることも見据えています。
AlphaGo の歴史的な勝利から 10 年。私たちの究極の目標は、もう手の届くところまで来ています。「37 手目」に灯った創造性の火花は、いくつものブレイクスルーを呼び起こし、今 AGI への道を確かなものにしています。私たちは今、科学的な発見の新たな黄金時代の入口に立っているのです。