Neu in Gemini: Benutzerdefinierte Gems und Bildgenerierung mit Imagen 3
Heute startet der Rollout von neuen Funktionen, die wir auf der Google I/O bereits angekündigt hatten. Gems123 ist eine neue Funktion, mit der ihr Gemini so anpassen könnt, dass ihr eure persönlichen KI-Experten für verschiedene Themen erstellen könnt. Sie ist nach dem Rollout für Gemini Advanced, Business und Enterprise Nutzer*innen verfügbar. Und unser neues Bildgenerierungsmodell Imagen 334 ist sowohl in der kostenfreien Version von Gemini als auch in den Gemini Advanced sowie Business- und Enterprise-Versionen verfügbar.
Erstellt Gems für individuelle Unterstützung – vom Coden bis zur Karriereberatung
Im Laufe der nächsten Tage können Abonnent*innen von Gemini Advanced, Business und Enterprise damit beginnen, mit Gems benutzerdefinierte Versionen von Gemini zu erstellen und mit ihnen zu chatten. Gems können dabei als Experten für Themen fungieren oder können auf spezifische Ziele hin optimiert werden. Schreibt einfach eine Anleitung, wie sich euer Gem verhalten soll, gebt ihm einen Namen und chattet dann mit ihm, wann immer ihr wollt.
Mit Gems könnt ihr euch ein Team von Experten zusammenstellen, das euch dabei unterstützt, ein anspruchsvolles Projekt zu durchdenken, Ideen für eine bevorstehende Veranstaltung zu sammeln oder die perfekte Überschrift für einen Social-Media-Beitrag zu schreiben. Euer Gem kann sich auch eine Vielzahl von detaillierten Anweisungen merken, damit ihr Zeit bei langwierigen, sich wiederholenden oder schwierigen Aufgaben sparen könnt.
Um euch den Einstieg zu erleichtern, haben wir eine Reihe vorgefertigter Gems für verschiedene Szenarien erstellt, die wir euch zur Verfügung stellen. Dazu zählen:
- Eine Lernhilfe, die euch dabei unterstützt, komplexe Themen herunterzubrechen, damit sie leichter verständlich sind.
- Ein kreativer Partner für mehr Inspiration – von frischen Ideen für eine Themenparty bis hin zum perfekten Geschenk für einen bevorstehenden Geburtstag.
- Ein Karriereberater, um euer volles Potenzial zu entfalten und euch dabei mit konkreten Vorschlägen zu helfen, eure Karriereziele zu erreichen.
- Ein Schreibassistent, damit ihr euren Schreibstil durch klares, konstruktives Feedback verbessern könnt – von der Grammatik bis zum Textaufbau.
- Ein Coding-Assistent, zum Verbessern eurer Programmierkenntnisse und um euch beim Erstellen von Projekten zu unterstützen.
Der Rollout von Gems startet jetzt für Desktop und Mobile Nutzer*innen von Gemini Advanced, Gemini Business und Gemini Enterprise in mehr als 150 Ländern und den meisten bei Gemini verfügbaren Sprachen, darunter auch Deutsch.
Erstellt qualitativ hochwertige Bilder mit Imagen 3
Wir haben an unseren Bildergenerierungsfunktionen gearbeitet und starten heute den Rollout für unser neuestes Modell, Imagen 3, in Gemini Apps und machen es für Nutzer*innen in allen verfügbaren Sprachen verfügbar.
Imagen 3 setzt einen neuen Standard für Bildqualität und generiert Bilder mit nur wenigen Worten. Ihr könnt Gemini sogar bitten, Bilder in verschiedenen Stilen zu erstellen – wie fotorealistische Landschaften, strukturierte Ölgemälde oder skurrile Claymation-Szenen.
Der englische Prompt für dieses Bild lautete: “Generate an image of glistening dewdrops clinging to a velvety red rose petal. Capture the intricate details of the water droplets, reflecting the morning sunlight, and the delicate veins of the petal.“
Imagen 3 bringt erweiterte Bildgenerierungsfunktionen mit integrierten Sicherheitsvorkehrungen und entspricht unseren Produktdesignprinzipien. In einer Vielzahl von Benchmarks schneidet Imagen 3 im Vergleich zu anderen verfügbaren Bildgenerierungsmodellen gut ab. Und wie bei Imagen 2 verwenden wir SynthID, unser Tool für Wasserzeichen und zum Identifizieren von KI-generierten Bildern.
Unsere Designprinzipien sind klar: Von Anfang bis Ende behaltet ihr die Kontrolle über den kreativen Prozess. Wenn das erste Bild, das ihr erhaltet, nicht euren Erwartungen entspricht, sagt Gemini einfach, was ihr ändern möchtet, und ihr erhaltet ein neues Bild.
Über die nächsten Tage starten wir auch den Rollout der Generierung von Bildern, die Personen abbilden. Auf diese Funktion werden zunächst nur Nutzer*innen von Gemini Advanced, Business und Enterprise auf Englisch Zugriff haben. Wir haben daran gearbeitet, das Produkt in vielen Bereichen zu verbessern: technisch, im Bereich Evaluierungssets,durch Red-Teaming-Übungen und klare Produktprinzipien.
Mit Imagen 3 haben wir erhebliche Fortschritte bei der Bereitstellung einer besseren Nutzererfahrung bei der Generierung von Personenbildern gemacht. Die Erzeugung fotorealistischer, identifizierbarer Personen, die Darstellung von Minderjährigen oder übermäßig blutiger, gewalttätiger oder sexueller Szenen wird von uns nicht unterstützt. Natürlich wird nicht jedes Bild, das Gemini erstellt, perfekt sein, aber wir werden weiterhin auf das Feedback unserer Early Access Gemini Advanced Nutzer*innen hören und die Funktion weiter verbessern. Der Rollout erfolgt schrittweise und wir haben das Ziel, es schon bald mehr Nutzer*innen und in mehr Sprachen verfügbar zu machen.
Um zu den Ersten zu gehören, die diese neuen Funktionen ausprobieren können, schließt ein Gemini Advanced-Abo ab oder meldet euch für Gemini for Workspace an.