Przejdź do głównego menu
Blog Google Polska

Nowości w Gemini: spersonalizowane Gemy i ulepszone generowanie obrazów za pomocą Imagen 3

Logo Gemini, stylizowany logotyp w gradiencie od niebieskiego do czerwonego umieszczony centralnie na ciemnym tle. Wokół logo znajdują się różne ikony reprezentujące pomysły, zadania, szybkość i rozwój kodu.

Dziś zaczynamy wprowadzać nowe funkcje, które zaprezentowaliśmy na Google I/O. Gemy, czyli opcja tworzenia w Gemini osobistych ekspertów AI specjalizujących się w dowolnym temacie, są teraz dostępne dla użytkowników Gemini Advanced, Business i Enterprise. Z kolei z naszego nowego modelu do generowania obrazów – Imagen 3 – możecie korzystać we wszystkich wersjach Gemini, w tym w Gemini Advanced, Business i Enterprise.

Gemy i spersonalizowana pomoc – od kodowania po wskazówki dotyczące kariery

W ciągu najbliższych dni subskrybenci Gemini Advanced, Business i Enterprise będą mogli tworzyć Gemy – spersonalizowane wersje Gemini, które po raz pierwszy zaprezentowaliśmy podczas Google I/O. Gemy mogą działać jako eksperci w wybranych dziedzinach lub pomagać w realizacji konkretnych celów. Wystarczy podać instrukcje, nadać nazwę i zacząć rozmowę.

Animacja wyświetlająca tekst „Przedstawiamy Gemy, niestandardowych ekspertów AI specjalizujących się w dowolnym temacie”.

Dzięki Gemom stworzycie zespół ekspertów AI, którzy pomogą Wam w realizacji trudnych projektów, planowaniu wydarzeń czy tworzeniu idealnych postów w mediach społecznościowych. Wasze Gemy zapamiętają szczegółowe instrukcje, oszczędzając Wasz czas na powtarzalnych lub trudnych zadaniach.

W ramach ułatwienia wprowadzamy zestaw gotowych Gemów do wykorzystania w różnych scenariuszach. Oto niektóre z nich:

  • Partner w nauce: pomaga wyjaśnić skomplikowane tematy, czyniąc je łatwiejszymi do zrozumienia.
  • Partner do burzy mózgów: dostarcza Wam inspiracji — od nowych pomysłów na imprezę tematyczną po propozycje prezentu na nadchodzące urodziny.
  • Doradca zawodowy: pomaga Wam zwiększać potencjał zawodowy, oferując szczegółowe plany doskonalenia umiejętności i osiągania celów.
  • Redaktor tekstów: ulepsza jakość materiałów pisemnych, zapewniając jasne i konstruktywne uwagi, od gramatyki po strukturę.
  • Partner w programowaniu: rozwija Wasze umiejętności programowania i może pomóc w tworzeniu projektów oraz nauce w trakcie pracy.

Gemy udostępniamy na urządzeniach stacjonarnych i mobilnych użytkownikom Gemini Advanced, Gemini Business i Gemini Enterprise w ponad 150 krajach i w większości języków.

Generuj obrazy wysokiej jakości z pomocą Imagen 3

Ulepszyliśmy funkcje twórczego generowania obrazów, a w ciągu najbliższych dni wprowadzimy do aplikacji z Gemini najnowszy model do tworzenia grafik, Imagen 3 – będzie dostępny dla wszystkich użytkowników i użytkowniczek oraz we wszystkich językach.

  • Prompt: "Obraz animowanego małego smoka wykluwającego się z jaja na słonecznej łące, otoczonego ciekawskimi, rozświetlonymi motylami. Żywe kolory, szczegółowe łuski." Obraz wygenerowany przy użyciu pytania w języku angielskim — wyniki mogą się różnić.

    Prompt: "Obraz animowanego małego smoka wykluwającego się z jaja na słonecznej łące, otoczonego ciekawskimi, rozświetlonymi motylami. Żywe kolory, szczegółowe łuski." Obraz wygenerowany przy użyciu pytania w języku angielskim — wyniki mogą się różnić.

  • Obraz sukni balowej wykonanej z papierowych serwetek i wywieszonej w eleganckim showroomie.

    Prompt: "Obraz sukni balowej wykonanej z papierowych serwetek i wywieszonej w eleganckim showroomie." Obraz wygenerowany przy użyciu pytania w języku angielskim — wyniki mogą się różnić.

  • Fotorealistyczny obraz zapierającego dech w piersiach widoku na góry z ostrymi szczytami i ośnieżonymi wierzchołkami skąpanymi w ciepłym blasku zachodzącego słońca. Dramatycznie wyglądające chmury w żywych odcieniach pomarańczu, różu i fioletu przemykają po niebie, rzucając długie cienie na surowy krajobraz.

    Prompt: "Fotorealistyczny obraz zapierającego dech w piersiach widoku na góry z ostrymi szczytami i ośnieżonymi wierzchołkami skąpanymi w ciepłym blasku zachodzącego słońca. Dramatycznie wyglądające chmury w żywych odcieniach pomarańczu, różu i fioletu przemykają po niebie, rzucając długie cienie na surowy krajobraz." Obraz wygenerowany przy użyciu pytania w języku angielskim — wyniki mogą się różnić.

  • Żywy, abstrakcyjny obraz z napisem „Dream Big” w odważnych kolorach i rozbryzgami na płótnie.

    Prompt: "Żywy, abstrakcyjny obraz z napisem „Dream Big” w odważnych kolorach i rozbryzgami na płótnie." Obraz wygenerowany przy użyciu pytania w języku angielskim — wyniki mogą się różnić.

Imagen 3 wprowadza nowy standard jakości, generując obrazy na podstawie zaledwie kilku słów. Możecie nawet poprosić Gemini o stworzenie obrazów w różnych stylach — np. fotorealistycznego krajobrazu, teksturowanego obrazu olejnego czy fantazyjnej sceny w stylu animacji plastelinowej.

Imagen 2 vs. Imagen 3

Prompt: Wygeneruj obraz połyskujących kropelek rosy na aksamitnym płatku czerwonej róży. Uchwyć skomplikowane szczegóły kropelek wody odbijających poranne promienie słońca oraz delikatne żyłki na płatku. Obraz wygenerowany przy użyciu pytania w języku angielskim — wyniki mogą się różnić.

Imagen 3 wprowadza zaawansowane możliwości generowania obrazów wyposażone we wbudowane środki ochronne i zgodne z naszymi zasadami projektowania produktów. W różnych testach porównawczych Imagen 3 wypada korzystnie w porównaniu z podobnymi dostępnymi modelami. Podobnie jak Imagen 2, Imagen 3 używa SynthID, naszego narzędzia do znakowania wodnego obrazów generowanych przez AI.

Nasze zasady projektowania są jasne: od początku do końca masz pełną kontrolę nad procesem twórczym. Jeśli pierwszy obraz, który otrzymacie, nie spełni Waszych oczekiwań, wystarczy napisać Gemini, co chcecie zmienić, a otrzymacie nowy obraz.

W ciągu najbliższych dni zaczniemy również wprowadzać generowanie obrazów przedstawiających ludzi. Z wczesnego dostępu do tej funkcji będą mogli korzystać użytkownicy Gemini Advanced, Business i Enterprise w języku angielskim. Pracowaliśmy ostatnio nad technicznym ulepszeniem usługi, a także nad poprawą zestawów ewaluacyjnych, ćwiczeniami z red-teamingu i jasnymi zasadami produktowymi.

Dzięki Imagen 3 zrobiliśmy znaczące postępy w zapewnianiu lepszych doświadczeń użytkownikom i użytkowniczkom w ramach generowania obrazów przedstawiających ludzi. Funkcja ta nie obsługuje generowania fotorealistycznych twarzy rozpoznawalnych osób, obrazów przedstawiających osoby małoletnie ani krwawych, brutalnych czy seksualnych scen. Oczywiście nie każdy obraz stworzony przez Gemini będzie doskonały, ale będziemy słuchać opinii użytkowników Gemini Advanced, którzy wypróbują tę funkcję w pierwszej kolejności, i na ich podstawie zamierzamy dalej ulepszać usługę. Wkrótce planujemy stopniowo rozszerzać dostęp do tej funkcji na większą liczbę użytkowników i języków.

Aby skorzystać z nowych funkcji jako jedna z pierwszych osób, wypróbuj Gemini Advanced już dziś lub zarejestruj się do Gemini w Workspace.