メインページに戻る
Japan Blog

AI

Gemini 1.5 Pro を Gemini Advanced に搭載

電話画面とコンピュータ画面の輪郭の上の黒い背景にジェミニのロゴ。コンピューター画面には「こんにちは、リサさん。ご用件をお聞かせください。」というテキストが表示されます。

Gemini は、直観的で役立つ会話型のパーソナル AI アシスタントとして設計され、アプリでもブラウザでも、複雑なタスクを行うユーザーをサポートします。

そして、コンテキスト ウィンドウの拡大や新しいデータ分析機能の導入、より多くの Google アプリとの連携、カスタマイズ可能なオプションの追加など、Gemini にいくつかのアップデートを加えます。これにより、これまでで最も高性能かつパーソナライズされた Gemini とのコラボレーションが可能になります。

世界最長のコンテキスト ウィンドウでドキュメントを分析

本日、Google の最先端 AI モデルである Gemini 1.5 ProGemini Advanced に搭載します。 わずか 3か月で 100 万人以上の方に Gemini Advanced に登録いただきました。そして今、Gemini 1.5 Pro は、一般ユーザー向けの会話型 AI の中で最長となる 100 万トークン以上へと大幅に拡張されたコンテキスト ウィンドウなど、最新の技術的進歩を実現しました。このコンテキスト ウィンドウの拡大により、Gemini Advanced は最大 1,500 ページの複数のドキュメントを理解したり、100 件の電子メールを要約したりできます。間もなく、1 時間の動画コンテンツや 30,000 行を超えるコードベースの処理も可能になります。

Google ドライブ経由、またはデバイスから直接ファイルを Gemini Advanced にアップロードする機能を追加することで、この長いコンテキスト ウィンドウを活用いただけます。これにより、たとえば、賃貸契約書のペットに関する規定を探し出したり、複数の長い研究論文の主な論点の比較など、情報量の多い文書に関する回答や洞察をすばやく得ることが可能になります。加えて、間もなく Gemini Advanced をデータ アナリストとして活用できるようになり、スプレッドシートなどのデータ ファイルをアップロードするだけで、分析や独自のグラフやチャートの作成などを即座に実行できるようになります。

Gemini は、ユーザーのファイルを非公開に保ちます。データがモデルのトレーニングに使用されることはありません。

※製品および機能による結果は説明用に作成されたものであり、研究用プロトタイプを示しています。回答の正確性を確認ください。サブスクリプションが必要な場合があります。国や言語によって利用可能な機能は異なります。

Gemini のネイティブなマルチモダリティにより、1.5 Pro は画像理解で大きく進化しました。たとえば、お気に入りのレストランで料理を撮影してレシピを調べたり、数学の問題の写真を撮影して解き方を段階的に説明したりといったことが、すべて 1 枚の画像から実行できます。

Gemini 1.5 Pro は、日本語を含む 35 以上の言語で 150 か国以上において、Google One AI Premium Planでご利用いただけます。

Gemini Live でより自然な会話を

また、テキストメッセージや会話など、Gemini とより自然な会話を可能にする新機能も追加しています。Google メッセージの Gemini を使用すれば、普段メッセージの送信に使っているおなじみのアプリで Gemini と会話できます。(英語のみ)

そして今後数か月以内に、Gemini Advanced ユーザー向けに ライブチャット (Gemini Live) を展開します。これは、最先端の音声テクノロジーを使用して Gemini との会話をより直感的にする、新しいモバイル向け会話型 AI エクスペリエンスです。ライブチャットを使用すると、Gemini に話しかけて、自然な会話音声を選んで応答することができます。通常の会話と同じように、自分のペースで話したり、応答を途中でさえぎって追加の質問をしたりといったことも可能です。

たとえば、面接の前に、Gemini Live にアクセスして準備を手伝ってもらうことができます。Gemini は、リハーサルをしたり、面接担当者にアピールできるスキルまで提案します。今年後半には、ライブチャットでカメラを使用できるようになり、周囲のものについての会話も可能になります。(英語のみ)

旅行などの複雑な計画を簡単に

旅行自体の時間よりも、下調べや計画を立てることに多くの時間を費やすことがあります。Gemini Advanced では、おすすめのアクティビティのリストを表示するだけでなく、細かい旅行計画を作成することもできます。

たとえば、Gemini に、「レイバーデイに家族とマイアミに旅行する予定。息子はアートが好きで、夫は新鮮なシーフードを食べたいと言っている。Gmail からフライトとホテルの情報を取得して、旅行計画を作成してもらえる?」と質問したとします。

この質問では、Gemini は、フライト時間、食事の好み、現地の美術館に関する情報を考慮すると同時に、各目的地の場所と各アクティビティ間の移動にかかる時間を把握します。Gmail からフライト情報を取得し、Google マップにアクセスしてホテル周辺のレストランや美術館のおすすめを検索したうえで、検索を使用してデザイン・ディストリクトのウォーキング ツアーやビーチで過ごす時間などといったその他の推奨アクティビティを調べて、1 日の予定を充実させます。Gemini は、これらすべての情報を総合して、ユーザーの要望を満たすパーソナルな旅行計画を作成します。ユーザーが予定に変更を加えたり、詳細を追加したりすると、旅行計画が自動的に更新されます。

製品および機能による結果は説明用に作成されたものであり、研究用プロトタイプを示しています。回答の正確性を確認してください。サブスクリプションが必要な場合があります。国や言語によって利用可能な機能は異なります。

この新しい Gemini の体験は、今後数か月以内に Gemini Advanced に導入する予定です。

Gems で Gemini をカスタマイズ

さらにパーソナルなエクスペリエンスとして、Google One AI Premium Plan でまもなく Gem(Gemini のカスタマイズされたバージョン) を作成できるようになります。ジム仲間、副料理長、コーディングのパートナー、クリエイティブな執筆におけるガイドなど、思い描いたあらゆる Gem を作成できます。セットアップも簡単です。Gem に何をしてもらいたいのか、どのように反応してほしいのかを簡単に説明します。たとえば、「ランニング コーチとして、毎日のランニング計画を提案して。ポジティブで、明るく、やる気に満ちた感じで」のように頼むことができます。Gemini はこれらの指示を受けると、ワンクリックで内容を強化して、特定のニーズを満たす Gem を作成します。

製品および機能による結果は説明用に作成されたものであり、研究用プロトタイプを示しています。回答の正確性を確認してください。サブスクリプションが必要な場合があります。国や言語によって利用可能な機能は異なります。

より多くの Google アプリと接続

昨年、Google は拡張機能を Gemini に組み込み、既存の Google アプリやサービスを使ってより多くのことが実行できるようになりました。現在展開中の YouTube Music Extension など、より多くの Google アプリを Gemini に追加しています。Gemini を使えば、曲名がわからない場合でも、歌詞やアーティストについて言及するだけで、お気に入りの曲を検索できます。

間もなく、Google カレンダー、Google ToDo リスト、Google Keep など、より多くの Google ツールを Gemini に接続できるようになります。(英語のみ)これにより、子供の学校の予定表の写真を撮影して課題ごとにカレンダーに予定を追加したり、レシピを撮影して買い物リストを Google Keep に追加したりといったことが Gemini に頼むだけでできるようになります。

これらのアップデートにより、これまでの Gemini の中で最もパーソナルで役に立つエクスペリエンスをすべて 1 つのプロンプトから実行できるようになります。機能の多くは、法人ユーザー向けにも提供予定です。

これらの新機能は、間もなくご利用いただけるようになります。Gemini との会話を始めるには、こちらにアクセスしてください