Przejdź do głównego menu

Blog Google Polska

Rozwiń swoją kreatywność dzięki nowym modelom i narzędziom do generowania multimediów

[]

Rozwiń swoją kreatywność dzięki nowym modelom i narzędziom do generowania multimediów

20 Maj, 2025

Introducing Veo 3 and Imagen 4, and a new tool for filmmaking called Flow.

EliCollins1637

Eli Collins

VP, Google DeepMind

Collage of various nature images generated by AI

Dziś przedstawiamy najnowsze modele generatywnej AI, które stanowią znaczący przełom w kreowaniu multimediów. Modele te tworzą zapierające dech w piersiach obrazy, filmy i muzykę, umożliwiając artystom przekraczanie granic ich rzemiosła i urzeczywistnianie ich kreatywnej wizji. Stanowią również podstawę niesamowitych narzędzi, dzięki którym każdy może lepiej wyrazić siebie.

Veo 3 i Imagen 4, najnowsze modele generowania wideo i obrazów, przesuwają granicę tworzenia multimediów dzięki nowym, przełomowym funkcjom. Rozszerzamy również dostęp do Lyria 2, dając muzykom więcej narzędzi do komponowania muzyki. Zachęcamy też twórców opowieści wizualnych do wypróbowania Flow, nowego narzędzia do tworzenia filmów z wykorzystaniem AI. Dzięki najbardziej zaawansowanemu modelowi Google DeepMind Flow pozwala przekształcać opowieści w filmy jakości kinowej z bardziej zaawansowaną kontrolą postaci, scen i stylów.

Nawiązaliśmy bliską współpracę z branżami kreatywnymi – filmowcami, muzykami, artystami i twórcami YouTube – aby pomóc w odpowiedzialnym kształtowaniu tych modeli i usług oraz zapewnić twórcom nowe narzędzia umożliwiające wykorzystanie możliwości AI w sztuce.

Veo 3: Obrazie, oto dźwięk

Veo 3, nasz najnowocześniejszy model generowania wideo, nie tylko rozwija możliwości Veo 2, ale po raz pierwszy może również tworzyć filmy z dźwiękiem – dodając odgłosy ruchu ulicznego w tle sceny ulicznej, śpiew ptaków w parku, a nawet dialogi między postaciami.

Veo 3 wyróżnia możliwość stosowania promptów tekstowych i graficznych, odwzorowanie rzeczywistego świata oraz dokładna synchronizacja ruchu warg. Doskonale rozumie Twoje intencje: możesz opowiedzieć w prompcie krótką historię, a model stworzy klip, który ją ożywi. Veo 3 jest dostępny od dziś w aplikacji Gemini i we Flow dla subskrybentów Ultra w Stanach Zjednoczonych. Dostęp do niego mają również użytkownicy firmowi w Vertex AI.

Veo 2: Nowe możliwości stworzone przez filmowców dla nich samych

Rozwijamy model Veo 3, ale zapewniliśmy również nowe możliwości naszemu popularnemu modelowi Veo 2, którego podstawą jest współpraca z twórcami i filmowcami. Wprowadzamy kilka z tych nowych funkcji, w tym:

Najnowocześniejsze funkcje wideo, oparte na materiałach referencyjnych, umożliwiają przekazywanie do Veo obrazów postaci, scen, obiektów, a nawet stylów w celu zapewnienia lepszej kontroli kreatywnej i spójności.
Elementy sterujące kamerą pomagają zdefiniować precyzyjne ruchy kamery, w tym obroty, najazdy i zbliżenia, aby uzyskać idealne ujęcie.
Funkcja rozszerzania obrazu pozwala poszerzyć kadr, przekształcając film z pionowego w poziomy, ułatwiając dopasowanie go do dowolnego rozmiaru ekranu.
Funkcja dodawania i usuwania obiektów umożliwia wstawianie obiektów do filmów i usuwanie ich. Veo wie, czym jest skala, interakcje oraz cienie i wykorzystuje tę wiedzę do tworzenia naturalnych, realistycznie wyglądających scen.

Elementy sterujące wideo i kamer oparte na materiałach referencyjnych są już dostępne w aplikacji Flow. Wszystkie nowe funkcje zostaną dodane do interfejsu API Vertex AI już w nadchodzących tygodniach, a w ciągu najbliższych kilku miesięcy także do innych usług.

Original

Outpaint

Original

Remove spaceship

Flow: narzędzie AI do tworzenia filmów zaprojektowane dla Veo

Stworzone przez twórców i dla twórców Flow to narzędzie AI do tworzenia filmów, które pozwala płynnie kreować klipy filmowe, sceny i historie, łącząc najbardziej zaawansowane modele Google DeepMind: Veo, Imagen i Gemini. Przedstawiaj zaplanowane ujęcia Flow przy użyciu języka naturalnego, zarządzaj elementami swojej historii – obsadą, lokalizacjami, obiektami i stylami – w jednym wygodnym miejscu i przekształć swoją opowieść w piękne sceny.

Aplikacja Flow jest dostępna od dziś dla subskrybentów Google AI Pro i Ultra w Stanach Zjednoczonych, a wkrótce pojawi się w kolejnych krajach.

Imagen 4: olśniewająca jakość i doskonała typografia

Najnowszy model Imagen łączy szybkość z precyzją, aby tworzyć oszałamiające obrazy. Imagen 4 charakteryzuje się niezwykłą wyrazistością drobnych szczegółów, takich jak bogate tkaniny, krople wody i sierść zwierząt. Pozwala działać zarówno w stylu fotorealistycznym, jak i abstrakcyjnym. Może tworzyć obrazy w różnych proporcjach i rozdzielczości do 2K – idealnej do druku i prezentacji. Znacznie lepiej radzi sobie również z pisownią i typografią, co ułatwia tworzenie kartek okolicznościowych, plakatów, a nawet komiksów.

Image of whale created by Imagen 4

Comic strip created by Imagen 4

Graphic created by Imagen 4

Dog image created by Imagen 4

Image of woman created by Imagen 4

Lake painting created by Imagen 4

Field photo created by Imagen 4

Egg carton photo created by Imagen 4

Knit scene created by Imagen 4

Cat comic created by Imagen 4

Imagen 4 jest dostępny od dziś w aplikacji Gemini, Whisk i Vertex AI oraz w Prezentacjach, Vids, Dokumentach i innych elementach Workspace.

Wkrótce wprowadzimy również szybki wariant Imagen 4, nawet 10 razy szybszy niż Imagen 3 – dzięki czemu będziesz w stanie jeszcze sprawniej realizować swoje pomysły.

Lyria 2: zaawansowane kompozycje i eksploracja bez końca

W kwietniu rozszerzyliśmy dostęp do opartej na modelu Lyria 2 kolekcji Music AI Sandbox – zestawu eksperymentalnych narzędzi dla muzyków, producentów i autorów tekstów, które mogą pobudzić nowe możliwości twórcze i pomóc artystom w rozwijaniu wyjątkowych idei muzycznych. Doświadczenie i opinie branży muzycznej pomagają nam zadbać o to, aby nasze narzędzia wspierały twórców, jednocześnie zachęcając ich do wykorzystania możliwości sztucznej inteligencji w sztuce.

Lyria 2, zapewniająca zaawansowane możliwości komponowania i umożliwiająca niekończącą się eksplorację, jest już dostępna dla twórców w YouTube Shorts oraz klientów korporacyjnych, poprzez Vertex AI. Udostępniliśmy również Lyria RealTime, interaktywny model generowania muzyki, który zasila MusicFX DJ, za pośrednictwem interfejsu API i w AI Studio. Lyria RealTime pozwala każdemu interaktywnie tworzyć, kontrolować i wykonywać muzykę generatywną w czasie rzeczywistym.

Odpowiedzialne tworzenie i współpraca ze społecznością kreatywną

Od momentu uruchomienia w 2023 r. narzędzie SynthID oznaczyło znakiem wodnym ponad 10 miliardów obrazów, filmów, plików audio i tekstów, pomagając w identyfikacji ich jako wygenerowanych przez AI, a co za tym idzie zmniejszeniu ryzyka dezinformacji i błędnego przypisania. Obiekty generowane przez Veo 3, Imagen 4 i Lyria 2 nadal będą oznaczane znakami wodnymi SynthID.

Dziś wprowadzamy SynthID Detector, portal weryfikacyjny, który pomaga identyfikować treści generowane przez AI. Prześlij fragment treści, a SynthID Detector określi, czy cały plik lub jego część zawiera oznaczenie SynthID.

Dzięki wszystkim naszym generatywnym modelom AI staramy się uwolnić ludzką kreatywność i umożliwić artystom i twórcom szybsze i łatwiejsze niż kiedykolwiek wcielanie pomysłów w życie.

MIEJSCE PUBLIKACJI: