Nowe, jeszcze lepsze sposoby tworzenia obrazów dzięki Imagen 2

01 Lut, 2024

Imagen 2 – duża aktualizację naszej technologii generowania obrazów – już dzisiaj dostępna w Bardzie, ImageFX i Vertex AI w języku angielskim.

Eli Collins

VP, Research

Niezależnie od tego, czy interesuje Was tworzenie muzyki, chcecie uzyskać pomoc przy kodowaniu czy utworzyć obraz, modele sztucznej inteligencji oparte na zadaniach, takie jak Lyria, Codey i Imagen, pomagają wcielać w życie kreatywne pomysły. Nasz zaktualizowany model Imagen 2, który wprowadziliśmy w grudniu, zapewnia wysokiej jakości, fotorealistyczne wyniki. Teraz oferuje nowe funkcje generowania obrazów w usługach Bard i ImageFX, poszerzając w ten sposób dotychczasowe możliwości zamiany tekstu na obraz wykorzystywane w generatywnej AI w wyszukiwarce (SGE), Ads oraz usługach Duet AI w Workspace i Vertex AI.

Od czasu wprowadzenia na rynek w zeszłym roku nasza technologia Imagen umożliwia użytkownikom i użytkowniczkom prywatnym oraz firmom generowanie obrazów przy użyciu zaledwie kilku słów lub wyrażeń bezpośrednio w usługach, z których już korzystają. Dzięki wykorzystaniu generatywnej AI w wyszukiwarce technologia ta pozwala na przykład zwizualizować sobie wyszukiwaną rzecz czy temat bezpośrednio w wyszukiwarce. Umożliwia również tworzenie obrazów bezpośrednio w Prezentacjach Google lub zaprojektowanie unikalnego tła w Meet za pomocą funkcji Duet AI w Workspace. Ponadto deweloperzy i firmy, takie jak Canva i Snap, wykorzystują interfejs Imagen API w Google Cloud Vertex AI, aby wspierać miliony użytkowników w rozwijaniu kreatywności.

Bardziej zaawansowana technologia generowania obrazów dzięki Google DeepMind

Imagen 2 wykorzystuje najnowsze osiągnięcia Google DeepMind w zakresie przetwarzania tekstu na obraz w modelu opartym na dyfuzji. Ta aktualizacja umożliwia generowanie obrazów najwyższej jak dotąd jakości, a także oferuje ulepszenia w obszarach, z którymi często borykają się systemy zamiany tekstu na obraz, takich jak renderowanie realistycznych dłoni i twarzy oraz usuwanie rozpraszających artefaktów wizualnych.

Imagen 2 został wytrenowany do parowania obrazów i opisów wysokiej jakości, generuje także bardziej szczegółowe obrazy, które są lepiej dopasowane do semantyki promptów językowych. Jest dokładniejszy w przetwarzaniu szczegółów niż nasz poprzedni system i potrafi lepiej uchwycić niuanse, zapewniając bardziej fotorealistyczne obrazy w różnych stylach i przypadkach użycia.

Zdjęcie starszego mężczyzny widzianego z profilu, oświetlonego z przodu czerwonym światłem i z tyłu głowy w turkusowym świetle.

Mały obraz olejny na płótnie przedstawiający pomarańczę na desce do krojenia z szmatką w niebiesko-białe paski.

Zbliżenie starszej kobiety w czapce i szaliku, trzymającej brązowo-białego psa.

Imagen 2 jest teraz dostępny w usługach Bard, ImageFX, SGE i Vertex AI

W grudniu udostępniliśmy model Imagen 2 programistom, a dzisiaj udostępniamy go użytkownikom, twórcom i firmom w ramach naszych usług, w tym Barda. Bard z Imagen 2 pomoże Wam wcielać w życie pomysły, niezależnie od tego, czy projektujecie broszurę, czy też chcecie dopasować obrazy do wpisu na blogu. Dzięki Imagen 2 Bard rozumie proste i złożone prompty, więc możecie generować szereg obrazów wysokiej jakości. Generowanie obrazów w Bardzie jest obecnie dostępne w większości krajów w języku angielskim.

Animacja pokazująca możliwości Imagen 2 w Bardzie

Model Imagen 2 umożliwia także zamianę tekstu na obraz z wykorzystaniem generatywnej AI w wyszukiwarce. Deweloperzy korporacyjni mogą również używać Imagen z Vertex AI w Google Cloud.

Już wkrótce użytkownicy w Indiach zarejestrowani w Laboratorium wyszukiwarki również będą mieli dostęp do funkcji zamiany tekstu na obraz w ramach generatywnej AI w wyszukiwarce.

Dwa obrazy przedstawiające możliwości Imagen 2 z Vertex AI. Są to następujące prompty: „tubka pasty do zębów z napisem CYMBAL leżąca na blacie w łazience, reklama” oraz „kobieta myjąca zęby, uśmiechnięta, szczęśliwa, reklama pasty do zębów”

Po lewej stronie: Obraz umywalki z białą tubką na pierwszym planie z ciemnozielonym tekstem „Cymbal” Tekst alternatywny. Po prawej stronie: Kobieta myjąca zęby

Ponadto udostępniamy nowy eksperyment służący do zamiany tekstu na obraz o nazwie ImageFX. ImageFX został zaprojektowany z myślą o eksperymentowaniu i kreatywności i umożliwia łatwe modyfikowanie obrazów dzięki zastosowaniu nowego podejścia do promtów polegającego na wykorzystaniu wyrazistych elementów w polu tekstowym. Za pomocą zaledwie kilku kliknięć tekst „surrealistyczny szydełkowy krajobraz dżungli” może zamienić się w „surrealistyczny szydełkowy krajobraz miasta”. ImageFX jest dostępny w aplikacji AI Test Kitchen, gdzie można tworzyć za pomocą innych generatywnych eksperymentów AI, takich jak MusicFX i TextFX.

W nadchodzących miesiącach pojawią się nowe funkcje eksperymentalne i aktualizacje.

Nasze odpowiedzialne podejście do budowania Imagen 2

Pracując nad zwiększeniem możliwości Imagen 2 w zakresie generowania fotorealistycznych obrazów, priorytetowo traktowaliśmy kwestię bezpieczeństwa modelu. Od samego początku inwestowaliśmy w trenowanie Imagen 2 w taki sposób, aby bezpieczeństwo danych było na pierwszym miejscu. Dodaliśmy też zabezpieczenia techniczne, aby ograniczyć problematyczne wyniki, takie jak treści zawierające przemoc, obraźliwe lub o charakterze jednoznacznie seksualnym. Zgodnie z naszymi zasadami dotyczącymi AI przeprowadziliśmy również szeroko zakrojone testy kontradyktoryjne i ataki typu red teaming, aby zidentyfikować i zminimalizować liczbę potencjalnie szkodliwych i problematycznych treści. Stosujemy też filtry, aby uniknąć generowania obrazów konkretnych osób. Będziemy nadal inwestować w nowe technologie, aby ulepszać bezpieczeństwo i ochronę prywatności naszych modeli.

Bardzo ważne jest, aby użytkownicy i użytkowniczki mieli dostęp do narzędzi umożliwiających rozpoznawanie treści generowanych przez sztuczną inteligencję. Wszystkie obrazy wygenerowane za pomocą Imagen 2 w naszych usługach konsumenckich zostaną oznaczone za pomocą SynthID, narzędzia opracowanego przez Google DeepMind, które dodaje cyfrowy znak wodny bezpośrednio do pikseli generowanych przez nas obrazów. Znaki wodne SynthID są niedostrzegalne dla ludzkiego oka, ale wykrywalne w celu identyfikacji. Dzięki dodatkowym informacjom w sekcji O tym obrazie możecie dowiedzieć się, czy obraz mógł zostać wygenerowany za pomocą narzędzi Google AI, gdy natkniecie się na niego w wyszukiwarce lub przeglądarce Chrome.

Przykład wykorzystania funkcji „O tym obrazie”, aby pokazać, że dany obraz mógł zostać wygenerowany przy użyciu AI od Google.

Obraz przedstawiający motyla z metalowymi skrzydłami ułożonymi w pryzmat oraz tekst informujący za pomocą nowej funkcji „O tym obrazie”, że obraz został wygenerowany przy użyciu AI od Google.

Dowiedz się więcej o technologii wykorzystywanej w Imagen 2 i jej możliwościach.

MIEJSCE PUBLIKACJI:

Nowe, jeszcze lepsze sposoby tworzenia obrazów dzięki Imagen 2

Bardziej zaawansowana technologia generowania obrazów dzięki Google DeepMind

Imagen 2 jest teraz dostępny w usługach Bard, ImageFX, SGE i Vertex AI

Nasze odpowiedzialne podejście do budowania Imagen 2

Powiązane artykuły

Jak projektujemy pomocne narzędzia AI z myślą o bezpieczeństwie młodych użytkowników

Nowe funkcje przejrzystości AI w Google Ads

Nowe możliwości, kontrola i statystyki dla właścicieli witryn

Ulepszone etykiety AI dla widzów i twórców na YouTube

Gemini Omni: kolejny krok w rozwoju multimodalnej sztucznej inteligencji

Gemini 3.5: przełomowa inteligencja w działaniu