日本における疾患管理や予防医療発展への貢献を目指し、東京大学と AI を活用した多遺伝子リスクスコア モデル研究について協業
国立大学法人東京大学と Google 日本法人 は AI を活用した多遺伝子リスクスコア(PRS: Polygenic Risk Score) モデル研究の協業に関して契約を締結しました。本協業は、多様な社会問題の解決と AI が人と相利共生して生み出す未来社会「AI 相利共生未来社会」の実現に向けて、東京大学と Google が 2020 年 10 月に締結した パートナーシップ の一環です。
Google は、これまでに、ゲノム(遺伝子配列データにおける変異やバリアント)を特定するプロセスであるバリアントコーリングの精度を向上させる AI モデルを開発し、2018 年に Nature Biotechnology で発表しています。また、ゲノム配列データから目の色や特定の病気などの身体的特徴をより正確に予測できるモデルや、これを利用して特定の特徴と関連するバリアントを発見するモデルも開発しています。東京大学医科学研究所では、これまで バイオバンク・ジャパン の解析を通じて肥満症、血液検査、2型糖尿病、心筋梗塞、心房細動、等の、数々のゲノムワイド研究において非欧米系集団で最大の貢献をしてきました。今回の協業では、欧州で開発された PRS を予測する Google の AI モデルを日本でも検証し、改良すると共に、東京大学のゲノムワイド研究の知見をもって評価することで、日本における疾患管理や予防医療の発展への貢献を目指します。
PRS は、多くの バリアントの影響を1つのスコアにまとめ、バリアントに起因する疾患リスクを推定するために使用できます。PRS は、個人がある特定の病気にどの程度かかりやすいかを示すもので、本人や医療従事者が、病気の予防や、早期発見、治療の計画に役立つ可能性があると考えられています。
現在、多くの遺伝学的研究は、ヨーロッパ地域に祖先をもつ個人を対象にしています。それらの人々は世界人口の 4 分の 1 以下であるにもかかわらず、既存の GWAS (ゲノムワイド関連解析)研究の 4 分の 3 、そして PRS 研究の 3 分の 2 以上は彼らが対象です。病気やその治療法に関する理解は、しばしばこれらの研究に基づいており、ヨーロッパ地域に祖先もつ人々を対象に開発された PRS の予測性能は他の集団では低くなることがあるなど、集団間での精度の違いが影響を与える可能性もあります。 本研究は、バイオバンク・ジャパンの包括的なデータと、Google の遺伝統計学とディープニューラルネットワークの専門性を合わせることで、多くの集団に対する遺伝学研究の有用性を広げる機会を提供します。
東京大学大学院新領域創成科学研究科 教授の鎌谷洋一郎氏は、本協業に関して以下のように述べています。
「バイオバンク・ジャパンは非欧米系として世界最大級の疾患バイオバンクであり、PRS研究の地域間の予測性能差を 最初に大規模に証明した研究 でも主要な役割を果たしました。今回のデータ利活用と Google の先進的な AI によって、平等で公正な予測性能を持ち、全世界で健康と福祉の増進につながる PRS の開発につながることを期待しています。また、バイオバンク・ジャパンは今後も医療の革新を目指して産業界を含めた更なるデータ利活用の推進をおこなっていきます。」
今回の協業では、東京大学医科学研究所のバイオバンク・ジャパンのデータを使用し、機械学習モデルのパフォーマンス分析を行います。これらのデータは、本協業での利用のみを目的として、高水準のセキュリティを有する Google Cloud の日本国内に設置したサーバーに暗号化した上で保管されます。
この取り組みが、日本、そして世界の疾病管理や予防医療の発展に貢献するよう願っています。