Whisk: 頭にあるアイデアをパッとかたちに

2025年 2月 12日

Thomas Iljic

Director of Product Management, Google Labs

本日より、Google Labs で生成 AI を活用した画像生成の試験運用機能 Whisk を日本を含む 100 以上の国と地域で順次提供します。Whisk は、詳細なテキストプロンプトの必要なく、画像をプロンプトとして使用する画像生成 AI です。画像を選択して、Whisk に入力するだけで簡単に始めることができます。

（一部の機能については、Whiskを最大限に活用していただくため、英語でのご利用を推奨しております）

動画はイメージです。実際の操作よりも時間を短縮して表示しています。

Whisk は、モデル、シーン、スタイルごとに自分の好きな画像を入力できます*。入力後、それらを組み合わせて、選択したぬいぐるみなどのテンプレートに合わせたオリジナルの画像を生成できます。また、今回の日本での提供にあわせて、日本文化からインスパイアされた新しい２つのテンプレート、「カプセルトイ」と「お弁当」も新しく追加しました。また、今回はバレンタインデーに合わせた特別なテンプレートも用意しています。

Whisk のシステム内では、 Gemini が画像の詳細なキャプションを自動的に作成し、その説明を Google の最新の画像生成モデルである Imagen 3 に入力します。このプロセスは、入力したモデルを正確に複製するのではなく、被写体の本質を捉えるため、モデル、シーン、スタイルを新しい方法で簡単に組み合わせることができます。

Whisk は画像からいくつかの重要な特徴のみを抽出するため、ユーザーが予期するものとは異なる画像が生成される場合があります。たとえば、生成されるモデルの身長、体重、髪型、肌の色が異なるものになることもあります。一方で、そうした特徴がユーザーにとっては重要になることも理解しています。そうした Whisk が生成した画像が予期するレベルに達していない場合には、いつでも基となるプロンプトを表示および編集できるようにしています（Whiskを最大限に活用していただくために、英語でのプロンプトのご使用を推奨しています*）。

米国におけるアーティストやクリエイターとの初期テストでは、Whisk は従来の画像エディターではなく、新しいタイプのクリエイティブツールであると評価されました。私たちは、ピクセル単位の編集ではなく、すばやい視覚的なアイデア探索のために Whisk を開発しました。私たちは、Whisk を通して、新しい創造的な方法でアイデアを探求し、多数のオプションを検討して、気に入ったものをダウンロードできるようにすることが重要だと考えています。

Whisk の試験運用版は、本日より labs.google/whisk からお試しいただけます。

Google Labs は、Gemini、Imagen、Veo などの最新の生成 AI モデルを活用した試験開発を行っています。私たちは、ユーザーと協力してテクノロジーを形作ることを目指しており、そのためにも新製品や新機能に関するフィードバックを得ることが大切です。ぜひニュースレター（英文）への登録や、X、Reddit、Discord で Google Labs をフォローし Whisk やその他の Google Labs の最新情報をチェックしてください。

_{*プロンプトをご利用になる場合、Whiskを最大限に活用していただくためには、英語でのプロンプトのご使用を推奨しています。一部の機能では他言語のプロンプトもサポートする可能性がありますが、生成されるアウトプットの品質は、言語やプロンプトの複雑さによって異なる場合があります。}

_{** Whiskの利用に関する説明は例示を目的としています。実際の回答結果については、ご自身で正確性をご確認いただくようお願いいたします。}

_{*** 18歳以上の方のみご利用いただけます。}

Whisk: 頭にあるアイデアをパッとかたちに

関連記事