Nano Banana Pro を発表
Google は数か月前、Gemini 2.5 Flash Image モデル Nano Banana を公開しました。古い写真の補正からミニチュア フィギュアの生成まで、Nano Banana は画像編集における大きな進歩であり、多くのみなさまにクリエイティビティを自由に表現いただける機会になりました。
本日、最新の画像生成および編集モデルの Nano Banana Pro(Gemini 3 Pro Image)を公開します。Gemini 3 Pro を基盤とする Nano Banana Pro は、Gemini の最先端の推論能力と現実世界の知識を活用することで、これまで以上に優れた情報の視覚化を実現します。
Nano Banana Pro であらゆるアイデアやデザインを現実に
Nano Banana Pro は、プロトタイプの作成、データからのインフォグラフィック作成、手描きのスケッチの図表化など、あらゆるアイデアを視覚化し、デザインする作業を支援します。
Nano Banana Pro で実現できること
強化された推論と豊富な知識、リアルタイム情報に基づき、より正確で文脈を理解したビジュアルを生成
Gemini 3 の高度な推論能力により、Nano Banana Pro は美しい画像を生成するだけでなく、役に立つコンテンツ作成も可能です。たとえば、新しい科目について学ぶ際に役立つ図解や、事実や文脈に基づいたインフォグラフィックや図表なども生成できます。さらに、Google 検索の膨大な知識ベースとも連携し、簡単なレシピや、天気やスポーツなどリアルタイム情報の可視化にも対応します。
一般的な観葉植物である「ペペロミア タートル」のインフォグラフィック。原産地、必須の管理方法、成長パターンに関する情報が含まれています
プロンプト:この植物に関する興味深い情報に焦点を当てたインフォグラフィックを作成してください
エライチ チャイ(カルダモン チャイ)の作り方を段階的に説明したインフォグラフィック。レシピや現実世界の情報を視覚化する能力を示しています
プロンプト:エライチ チャイの作り方を示すインフォグラフィックを作成してください
Nano Banana Pro を使用し、検索によるグラウンディングを介してリアルタイムの天候情報を取り込み、ポップアート調のインフォグラフィックを構築
いろんな言語で、読みやすく、より正確なテキスト入り画像を生成
Nano Banana Pro は、短いキャッチコピーから長文まで、正確にレンダリングし、読みやすいテキストを画像内に直接作成するのに最適なモデルです。Gemini 3 のニュアンスへの理解も含む深い理解能力により、画像の生成および編集において、特にテキスト表現の可能性が大きく広がりました。ポスターやモックアップにおけるより細かなテキスト表現や、多彩な質感、フォント、カリグラフィー表現にも対応します。さらに多言語推論が強化され、複数の言語でのテキスト生成、コンテンツのローカライズや翻訳も可能になりました。これにより、複数国間や文化間での展開や、家族や友人とのコンテンツ共有もより簡単になります 。
対象を中距離で捉えるミディアム・ショット、詳細に迫るクローズアップ、そして没入的な主観視点たるPOVショットを網羅した絵コンテのスケッチの作成
プロンプト:当該シーンのストーリーボードを作って
'BERLIN' という単語が、複数の建築物群を跨ぎ、都市区画に統合され、具象化された様子
プロンプト: 晴れた明るい日のベルリンの居心地の良い通りの眺め、はっきりとした影。古い家々が、青、赤、白、黒で色付けられた『BERLIN』という文字を綴るように、奇妙な形をしている。
文字の意味に着想を得たカリグラフィ。多様な質感やフォントで表現力豊かなテキストを 生成
プロンプト:ミニマルなロゴを 8点作成してください。 それぞれのロゴは表現力豊かな単語で構成し、単語の持つ意味、メッセージ、または音を、文字の視覚的な表現によってドラマチックに伝えてください。
構成:すべてのロゴを黒で描いたフラットなベクター レンダリングとし、単一の白い背景に配置
正確な翻訳と表現によって英語のテキストを韓国語に変換した、ある飲料キャンペーンのコンセプト
プロンプト:3 つの黄色と青の缶に書かれている英語のテキストを韓国語に翻訳し、他の要素は変更しないでください
木こりの情景にフレーズを融合させることで、テキストと質感を融合
プロンプト:「How much wood would a woodchuck chuck if a woodchuck could chuck wood」という英語の早口言葉をウッドチャックが木材で表す画像を作成してください
進化したクリエイティブ機能で、高精細なビジュアル作成
- デザインの一貫性:Nano Banana Pro ではこれまで以上に多くの要素を組み合わせることができます。最大 14 枚の画像を組み合わせて、最大 5 人までの人物の特徴や類似性を維持したまま画像を生成できます。スケッチから製品画像にしたり、設計図を写真のような 3D 構造にしたりと、アイデアと創造の橋渡しを行います。さらに、ブランドのトーンとマナーに合わせたビジュアルをモックアップに簡単に適用でき、あらゆる接点で一貫性を保つことができます。
複数のキャラクターを含む最大 14 の入力に対して、複雑な構図全体での一貫性を維持
プロンプト:摩耗した ベージュの布製ソファと床に、14 匹のふわふわしたキャラクターがぎっしりと横一列に並んで座っているミディアムショットを作成してください。全員が正面を向いており、ソファの前の低い木製テーブルに置かれた、ヴィンテージの木製ボックス型テレビを見ています。部屋は薄暗く、左側の窓からの暖かい光と、テレビの光が生き物たちの顔と、そのふわふわした質感を照らしています。背景は、編み込みのラグ、古い本が並ぶ本棚、そして素朴なキッチン用品などがある、居心地の良い、やや散らかったリビングルームです。全体的な雰囲気は暖かく、居心地が良く、楽しげです
複数の要素を組み合わせて、生活シーンを生成。
プロンプト:これらの画像を適切に組み合わせて、16 : 9 フォーマットの 1 つのシネマティックな画像に結合し、マネキンが着用しているドレスを画像内のドレスに変更してください
複数の入力要素を組み合わせてシュールな風景を生成
プロンプト:これらの画像を適切に組み合わせて、16 : 9 フォーマットの 1 つのシネマティックな画像に結合してください
5 人の人物と 1 匹の犬を 1 枚の画像に収め、ファッション エディトリアルのような素晴らしい作品に仕上げてください。5 人の人物の個性と服装、そして犬は全体を通して一貫している必要がありますが、シーンに最も自然で適した、異なる角度や距離から見られるようにしてください。色と照明はすべて自然に見えるようにし、彼らがこのファッション ショーに自然に溶け込んでいるように見せてください
- スタジオ品質のクリエイティブコントロール:Nano Banana Pro はより高度なクリエイティブ機能を搭載しています。改善されたローカライズ編集機能で、画像内の任意の部分を選択、調整、変換できます。カメラアングルの調整、フォーカス変更、洗練されたカラー グレーディングの適用、さらには昼から夜への変更、ボケ効果の作成など、シーン ライティング調整も可能です。ソーシャルメディアから印刷物まで、様々なプラットフォームに対応できるアスペクト比と、2K や4K の解像度にも対応しています。
アスペクト比を調整し、さまざまなプラットフォームに合わせて画像のルック アンド フィールを変更
プロンプト:背景を減らしてアスペクト比を 1:1 に変更してください。キャラクターは現在の位置に完全に固定されたままにしてください
シーンを昼から夜へと変更するため、照明とフォーカスの制御を適用
プロンプト:このシーンを夜にしてください
照明コントロールで画像の特定部分を暗くもしくは明るくし、ドラマチックな効果を獲得
プロンプト:このポートレートの照明を、左から拡散された柔らかな光に変更してください
被写界深度や焦点を花に合わせるなどして調整し、構図の細部を際立たせる
プロンプト:花に焦点を合わせてください
Nano Banana Pro を今日から
手軽で楽しい編集ができる従来の Nano Banana と、より高品質で複雑な構図にも対応する Nano Banana Pro を目的に合わせてお選びいただけるようになりました。
- 一般ユーザーおよび学生向け:Gemini アプリで「画像の作成」を選択し、「思考モード」を選ぶと利用できます。無料ユーザーには限定的な無料クレジットが提供され、その後は Nano Banana に切り替わります。Google AI Plus、 Pro、Ultra ユーザーはより多くのクレジットを利用可能です。米国の Google AI Pro、Ultra ユーザーを対象に、Google 検索の AI モードでも利用できます。NotebookLM では、世界中のユーザーが利用できます。
- プロフェッショナル:Google 広告での画像生成が Nano Banana Pro にアップグレードされ、世界中の広告主の皆様がより高度なクリエイティブ制作および編集を行えるようになります。Google Workspace ユーザーは、Google スライド と Google Vids で本日からご利用いただけます。
- 開発者および企業向け:Gemini API と Google AI Studio と Google Antigravity でリッチな UX レイアウトやモックアップを作成できます。企業ユーザーの皆様は Vertex AI で生成ワークフローを本日より構築できます。Gemini Enterprise でも近日提供予定です。
- クリエイター向け:Google AI Ultra ユーザーは、AI 映像制作ツール Flow で利用できます。クリエイター、映画制作者、そしてマーケターはより緻密なフレームやシーンの制作ができます。
Gemini アプリにおける AI 生成画像の識別について
Google では、AI によって生成された画像を識別できることは非常に重要だと考えています。そのため、Google のツールで生成されたメディアには、目に見えない SynthID デジタル透かしを埋め込んでいます。
本日より、SynthID 技術により、Gemini アプリに画像をアップロードし、Google AI が生成したものかを簡単に確認できるようになりました。まずは画像から対応を開始し、今後音声や動画にも拡大する予定です。
無料ユーザーおよび Google AI Pro ユーザーが生成した画像には、これまで通り、目に見える透かし(Gemini のスパークル アイコン)が表示され、Google AI での生成であることをより容易に識別できるようにします。
また、プロフェッショナル用途においては、クリーンなビジュアルが重要なことを認識していますので、Google AI Ultra ユーザーが生成する画像の目に見える透かしは廃止します。
SynthID を活用した AI コンテンツの透明性向上については、ブログ記事でご確認ください。