想像力を広げる最新のメディア生成モデルとツール

Google は本日、飛躍的な進歩をもたらす最新のメディア生成モデルを発表しました。これらのモデルは、高品質な画像、動画、音楽を生成し、アーティストがビジョンを実現するサポートをします。また、誰もが自由に創造性を発揮できる優れたツールも提供します。
最新の動画生成モデル Veo 3 と画像生成モデル Imagen 4 は、画期的な新機能により、メディア生成の可能性を広げます。また、Lyria 2 へのアクセスを拡大し、ミュージシャンが音楽制作に活用できるツールを拡充しました。さらに、映像制作者向けに新しい AI 映像制作ツール Flow の提供を開始しました。Google DeepMind の最先端のモデルを活用した Flow は、キャラクター、シーン、スタイルをより細かく制御しながら、臨場感あふれる映画のような作品を作成できます。
私たちは、映画製作者、ミュージシャン、アーティスト、YouTube クリエイターといったクリエイティブ業界と緊密に連携し、これらのモデルや製品を責任ある形で開発するとともに、クリエイターが自身の作品で AI の可能性を最大限に引き出せる新しいツールを提供しています。
Veo 3:動画に音声を追加
最新の動画生成モデル Veo 3 は、Veo 2 の品質を向上させただけでなく、音声付きの動画生成を初めて実現しました。街中の交通音、公園の鳥のさえずり、キャラクター同士の対話なども生成できます。
Veo 3 は、テキストや画像によるプロンプト入力から、現実世界の物理法則の反映、正確なリップシンクまで、あらゆる側面で優れた性能を発揮します。理解力も優れており、プロンプトで短いストーリーを伝えるだけで、その内容を鮮明に表現した映像を生成します。Veo 3 は本日より、米国の Ultra ユーザーを対象に Gemini アプリおよび Flow でご利用いただけます。また、 Vertex AI 上のエンタープライズ向けユーザーも利用可能です。
Veo 2:映画製作者と共同開発した新機能
Veo 3 の開発を進める中で、クリエイターや映画制作者との連携から得られた知見に基づき、Veo 2 モデルにも新機能を追加しました。本日、以下の新機能を発表しました。
- 参照画像による動画生成:この最新機能により、キャラクター、シーン、オブジェクト、さらにはスタイルの画像を Veo に提供し、より細やかなクリエイティブ制御と一貫性を実現できます。
- カメラ コントロール:回転、カメラワーク、ズームなど、カメラの動きを正確に設定して、思い通りのショットを作成できます。
- アウトペインティング:フレームを拡張し、動画をポートレートからランドスケープに変更したり、シーンにインテリジェントに追加することで、あらゆる画面サイズに合わせやすくなります。
- オブジェクトの追加と削除:動画内のオブジェクトを追加、または削除できます。Veo は縮尺、相互作用、影などの概念を理解し、これらを考慮しながら自然でリアルなシーンを作成します。
参照画像による動画生成機能とカメラ コントロール機能は、 Flow でご利用いただけます。これらすべての新機能を今後数週間で Vertex AI API で提供開始し、今後数か月でさらに多くの製品に展開する予定です。
Imagen 4:圧倒的な品質と優れたテキスト生成
最新の Imagen モデルは、スピードと精度を兼ね備え、素晴らしい画像を生成します。複雑な布地模様、水滴、動物の毛並みのような細かい部分も驚くほど鮮明に描写し、フォトリアルなスタイルおよび抽象的なスタイルの両方に対応できます。Imagen 4 は、様々なアスペクト比で最大 2K 解像度の画像を生成でき、印刷やプレゼンテーションにも最適です。文字表現やタイポグラフィの生成能力も大幅に向上しており、グリーティングカード、ポスター、漫画なども簡単に作成できます。
Imagen 4 は本日より、Gemini アプリ、Whisk、 Vertex AI、そして Workspace の Google スライド、Vids、ドキュメントなどでご利用いただけます。
近日中に、Imagen 3 と比較して最大 10 倍のスピードでの処理を実現する Imagen 4 の高速版も公開予定です。これにより、アイデアをさらに迅速に形にすることができます。
Lyria 2:高度な楽曲制作と無限の探求
4 月に、Lyria 2 を搭載した Music AI Sandbox へのアクセスを拡大しました。Music AI Sandbox は、ミュージシャン、プロデューサー、ソングライターに実験的なツールセットを提供し、新たなクリエイティブの可能性を引き出し、アーティストがユニークな音楽のアイデアを探求できるよう支援します。音楽業界の専門知識と貴重なフィードバックは、これらのツールがクリエイターの可能性を広げるとともに、アーティストが自身の作品で AI の可能性を実感してもらうことにも繋がります。
Lyria 2 は、高度な楽曲制作と音楽へのさらなる探求を可能にします。現在 YouTube ショートを通じてクリエイター向けに、また Vertex AI でエンタープライズ向けに提供しています。さらに、 MusicFX DJ の基盤技術であるインタラクティブな音楽生成モデル Lyria RealTime を、API 経由および AI Studio で利用できます。Lyria RealTime を使えば、誰でも生成 AI による音楽をリアルタイムでインタラクティブに制作し演奏することができます。
責任あるコンテンツ作成とクリエイティブ コミュニティとの連携
2023 年の提供開始以来、SynthID は 100 億を超える画像、動画、音声ファイル、テキストに電子透かしを施してきました。これにより、AI によって生成されたコンテンツの特定を容易にし、誤情報や不正確な帰属表示のリスクを軽減に貢献しています。Veo 3、Imagen 4、Lyria 2 によって生成されたコンテンツにも、引き続き SynthID の透かしを付与します。
本日、AI 生成コンテンツの識別を支援する検証ポータルサイトである SynthID Detector を公開しました。コンテンツをアップロードすると、 SynthID Detector がファイル全体、あるいはその一部に SynthID よる電子透かしが含まれているかどうかを識別します。
Google は、提供するすべての生成 AI モデルにおいて、人間の創造性を解き放ち、アーティストやクリエイターの皆さんがこれまで以上に迅速かつ手軽にアイデアを形にできるようなることを目指しています。