Gemini 3: Eine neue KI-Ära beginnt
Vorwort von Sundar Pichai, CEO Google und Alphabet
Vor fast zwei Jahren haben wir die Gemini-Ära eingeläutet – eines unserer größten wissenschaftlichen und produktbezogenen Projekte. Wir freuen uns und sind beeindruckt, welchen Anklang das Produkt bereits gefunden hat. Übersichten mit KI werden jeden Monat 2 Milliarden Menschen angezeigt. Gemini wird von über 650 Millionen Menschen pro Monat genutzt, mehr als 70% unserer Cloud-Kund*innen verwenden unsere KI, 13 Millionen Entwickler*innen haben mit unseren generativen Modellen gearbeitet – und das ist nur ein kleiner Ausschnitt des Fortschritts, den wir beobachten.
Und dank unseres differenzierten Full-Stack-Ansatzes für KI-Innovationen – von unserer führenden Infrastruktur über unsere erstklassige Forschung und unsere Modelle und Tools bis hin zu Produkten, die Milliarden von Menschen auf der ganzen Welt erreichen – können wir die Welt schneller als je zuvor mit fortschrittlichen Funktionen versorgen.
Jede Generation von Gemini baut auf der vorherigen auf und ermöglicht euch noch mehr. Die bahnbrechenden Fortschritte von Gemini 1 in den Bereichen native Multimodalität und der Länge des Kontextfensters haben die verschiedenen Arten von Informationen, die verarbeitet werden konnten, erweitert. Gemini 2 hat den Grundstein für agentische KI-Fähigkeiten und erweiterte die Grenzen des logischen Denkens gelegt. So konnten komplexere Aufgaben und Ideen unterstützt werden. Gemini 2.5 Pro war über sechs Monate lang Spitzenreiter bei LMArena.
Und jetzt stellen wir Gemini 3 vor, unser intelligentestes Modell, das alle Funktionen von Gemini vereint, damit ihr jede Idee zum Leben erwecken könnt.
Es ist auf dem neuesten Stand der Technik, wenn es um Schlussfolgerungen geht, und wurde entwickelt, um Tiefe und Nuancen zu erfassen – sei es, um die subtilen Hinweise in einer kreativen Idee zu erkennen oder die sich überschneidenden Ebenen eines schwierigen Problems zu durchdringen. Gemini 3 ist auch viel besser darin, den Kontext und die Absicht hinter euren Anfragen zu erkennen, sodass ihr mit weniger Prompts die Antwort bekommt, die ihr sucht. Es ist erstaunlich, dass sich KI in nur zwei Jahren von einer Technologie, die nur Texte und Bilder lesen konnte, zu einer Technologie entwickelt hat, die zwischen den Zeilen lesen kann.
Und ab heute stellen wir Gemini in der Größenordnung von Google bereit. Dazu gehört Gemini 3 im KI-Modus in der Suche mit der Fähigkeit zu komplexeren Schlussfolgerungen und neuen dynamischen Funktionen (Abo erforderlich). Das ist das erste Mal, dass wir Gemini in der Suche direkt ab dem ersten Tag anbieten. Gemini 3 ist ab heute auch in der Gemini App, für Entwickler*innen in AI Studio und Vertex AI sowie in unserer neuen agentenbasierten Entwicklungsplattform Google Antigravity verfügbar – mehr dazu weiter unten.
Wie schon die vorherigen Generationen setzt auch Gemini 3 wieder neue Maßstäbe. In diesem neuen Kapitel werden wir die Grenzen von Intelligenz, KI-Agenten und Personalisierung weiter verschieben, um KI für alle wirklich hilfreich zu machen.
Wir hoffen, dass euch Gemini 3 gefällt. Wir werden das Modell stetig verbessern und sind gespannt darauf, was ihr damit erschafft. Es wird noch viel mehr kommen.
Gemini 3: Unser bisher intelligentestes Modell, mit dem ihr jede Idee zum Leben erwecken könnt
Demis Hassabis, CEO von Google DeepMind, und Koray Kavukcuoglu, CTO von Google DeepMind und Chief AI Architect bei Google, im Namen des Gemini-Teams
Heute machen wir einen weiteren großen Schritt auf dem Weg zur AGI (Artificial General Intelligence) und veröffentlichen Gemini 3.
Es ist das weltweit beste Modell für multimodales Verständnis und unser bisher leistungsstärkstes Agentic- und Vibe-Coding-Modell. Es bietet bessere Visualisierungen und eine größere Interaktivität – und das alles auf der Grundlage modernster Schlussfolgerungen.
Wir beginnen die Ära von Gemini 3 mit der Vorabversion von Gemini 3 Pro, die ab heute in einer Reihe von Google-Produkten verfügbar ist. So können Sie Gemini 3 Pro im Alltag nutzen, um zu lernen, zu entwickeln und zu planen. Außerdem führen wir Gemini 3 Deep Think ein – unseren verbesserten Modus für logisches Schlussfolgern, der die Leistung von Gemini 3 noch weiter steigert. Vor der Veröffentlichung für Google AI Ultra-Abonnent*innen wird er von Sicherheitstester*innen geprüft.
Modernste Schlussfolgerungen mit beispielloser Tiefe und Nuance
Gemini 3 Pro kann mit seinen State-of-the-Art-Funktionen für logisches Denken und Multimodalität jede Idee zum Leben erwecken. Bei allen wichtigen KI-Benchmarks übertrifft es 2.5 Pro deutlich.
Mit 1.501 Punkten führt es das LMArena-Ranking an. Das Modell leistet komplexe Schlussfolgerungen auf PhD-Niveau und erzielt Spitzenwerte bei Humanity’s Last Exam (37,5% ohne Verwendung von Tools) und GPQA Diamond (91,9%). Außerdem setzt es einen neuen Standard für die neuesten Modelle in der Mathematik und erreicht einen neuen Bestwert von 23,4% bei MathArena Apex.
Gemini 3 Pro geht über Text hinaus und definiert multimodales Schlussfolgern mit bahnbrechenden Ergebnissen von 81% bei MMMU-Pro und 87,6% bei Video-MMMU neu. Außerdem erreicht Gemini 3 Pro einen Wert von 72,1% bei SimpleQA Verified, was einen großen Fortschritt in Bezug auf die faktische Genauigkeit darstellt. Das bedeutet, dass Gemini 3 Pro in der Lage ist, komplexe Probleme in einer Vielzahl von Themenbereichen wie Naturwissenschaften und Mathematik mit hoher Zuverlässigkeit zu lösen.
Gemini 3 Pro bietet außerdem ein neues Maß an Tiefe und Nuancen bei jeder Interaktion. Die Antworten sind intelligent, prägnant und direkt. Klischees und Schmeicheleien werden durch echte Einblicke ersetzt – Ihr erfahrt, was ihr wissen müsst, nicht nur, was ihr hören wollt. Gemini ist ein echter Sparringspartner, der euch neue Möglichkeiten bietet, Informationen zu verstehen und sich auszudrücken – von der Übersetzung komplexer wissenschaftlicher Konzepte durch die Generierung von Code für hochauflösende Visualisierungen bis hin zum kreativen Brainstorming.
Gemini 3 Deep Think
Der Deep Think-Modus von Gemini 3 verschiebt die Grenzen der KI noch weiter und bietet einen Quantensprung bei den Schlussfolgerungs- und multimodalen Verständnis-Funktionen von Gemini 3, sodass ihr noch komplexere Probleme lösen könnt.
In Tests übertrifft Gemini 3 Deep Think die bereits beeindruckende Leistung von Gemini 3 Pro beim Humanity’s Last Exam (41,0%, ohne Verwendung von Tools) und GPQA Diamond (93,8%). Außerdem erreicht es einen beispiellosen Wert von 45,1% bei ARC-AGI (mit Code-Verwendung, ARC Prize Verified) und zeigt damit seine Fähigkeit, neue Herausforderungen zu meistern.
Der Gemini 3 Deep Think-Modus erzielt hervorragende Ergebnisse bei einigen der anspruchsvollsten KI-Benchmarks. Weitere Informationen zu unserer Bewertungsmethodik findet ihr hier.
Gemini 3 hilft euch beim Lernen, Erschaffen und Planen
Alles lernen
Gemini wurde von Anfang an so entwickelt, dass es Informationen zu jedem Thema verschiedenster Art (wie Text, Bildern, Videos, Audio und Code) nahtlos zusammenfassen kann. Gemini 3 setzt neue Maßstäbe für multimodales Schlussfolgern. Das Modell kombiniert modernste Schlussfolgerungs-, Bild- und Raumverständnisfähigkeiten, mehrsprachige Leistung und ein Kontextfenster von 1 Million Tokens, um euch das Lernen auf eine Weise zu ermöglichen, die für euch sinnvoll ist.
Wenn ihr zum Beispiel lernen möchtet, wie ihr Familienrezepte kocht, kann Gemini 3 handgeschriebene Rezepte in verschiedenen Sprachen entschlüsseln und in ein Kochbuch übersetzen, das ihr mit eurer Familie teilen könnt. Oder wenn ihr euch in ein neues Thema einarbeiten möchtet, könnt ihr Gemini wissenschaftliche Arbeiten, lange Videovorträge oder Tutorials geben und das Modell generiert Code für interaktive Karteikarten, Visualisierungen oder andere Formate, die euch helfen, den Stoff zu beherrschen. Es kann sogar Videos von Pickleball-Spielen analysieren, Bereiche identifizieren, in denen ihr euch verbessern könnt, und einen Trainingsplan für die Verbesserung eurer Technik erstellen.
Gemini 3 hilft euch, Familienrezepte zu bewahren und nachzukochen. In Gemini Canvas ausprobieren.
Gemini 3 kann euch dabei helfen, komplexe Informationen zu analysieren, zum Beispiel Forschungsarbeiten, und Code für einen interaktiven Leitfaden zu generieren.
Bekommt Analysen auf Sport-Expert*innnen-Level zu eurem Pickleball-Spiel, um eure Skills zu verbessern.
Damit ihr Informationen im Web besser einordnen könnt, nutzt der KI-Modus in der Suche jetzt Gemini 3 (Abo erforderlich). So sind neue Benutzeroberflächen mit generativer KI möglich, zum Beispiel immersive visuelle Layouts und interaktive Tools und Simulationen. Diese werden alle direkt basierend auf Ihrer Suchanfrage generiert.
Mit der generativen KI-Benutzeroberfläche im KI-Modus der Suche komplexe Themen wie die Funktionsweise der RNA-Polymerase lernen
Alles erschaffen
Gemini 3 baut auf dem Erfolg von Gemini 2.5 Pro auf und erfüllt das Versprechen, Entwicklern die Möglichkeit zu geben, jede Idee zum Leben zu erwecken. Sie eignet sich hervorragend für die Zero-Shot-Generierung und kann komplexe Prompts und Anweisungen verarbeiten, um eine umfangreichere, interaktivere Web-UI zu rendern.
Gemini 3 ist das beste Modell für die Vibe Coding und die Agentic Coding, das wir je entwickelt haben. Es macht unsere Produkte autonomer und steigert die Produktivität von Entwicklungsteams. Mit einem beeindruckenden Elo-Wert von 1487 führt es die WebDev Arena-Bestenliste an. Außerdem erreicht es 54,2% bei Terminal-Bench 2.0, einem Test, bei dem die Fähigkeit eines Modells zur Nutzung von Tools zur Bedienung eines Computers über das Terminal gemessen wird. Damit übertrifft es Gemini 2.5 Pro bei SWE-bench Verified (76,2%), einem Benchmark zur Bewertung von Coding-Agents, deutlich.
Ihr könnt jetzt mit Gemini 3 coden – in Google AI Studio, Vertex AI, der Gemini CLI und unserer neuen Plattform für die Entwicklung von Agenten, Google Antigravity. Außerdem ist Gemini in Plattformen von Drittanbietern wie Cursor, GitHub, JetBrains, Manus und Replit verfügbar.
Ein Retro-3D-Raumschiffspiel mit detaillierterer Visualisierung und verbesserter Interaktivität programmieren. Jetzt in AI Studio ausprobieren.
Mit Gemini 3 könnt ihr eurer Fantasie freien Lauf lassen und detaillierte 3D-Voxelkunst mit Code erstellen, zerlegen und neu zusammenfügen. In AI Studio ausprobieren.
Mit Gemini 3 und Shadern eine spielbare Science-Fiction-Welt erstellen. Jetzt in AI Studio ausprobieren.
Erstellt umfangreichere, interaktivere Web-UIs und Apps per Vibe Coding in Gemini 3.
Neue Entwicklungsumgebung für KI-Agenten
Mit Gemini 3 wird die Modellintelligenz weiter verbessert. Das bietet uns die Möglichkeit, die gesamte Entwicklungsumgebung neu zu gestalten. Heute veröffentlichen wir Google Antigravity, unsere neue agentische Entwicklungsplattform, mit der Entwickler auf einer höheren, aufgabenorientierten Ebene arbeiten können.
Mit den fortschrittlichen Funktionen von Gemini 3 für Schlussfolgerungen, Tool-Nutzung und eigenständigem Programmieren verwandelt Google Antigravity die KI-Unterstützung von einem Tool im Entwickler-Toolkit in einen aktiven Sparringspartner. Google Antigravity bietet zwar im Kern eine vertraute KI-IDE-Umgebung, die KI-Agenten wurden jedoch auf eine eigene Oberfläche verschoben und haben direkten Zugriff auf Editor, Terminal und Browser. Jetzt können KI-Agenten selbstständig komplexe Softwareaufgaben von Anfang bis Ende planen und ausführen und gleichzeitig ihren eigenen Code validieren.
Neben Gemini 3 Pro ist Google Antigravity eng mit unserem neuesten Gemini 2.5 Computer Use-Modell für die Browsersteuerung und unserem erstklassigen Bildbearbeitungsmodell Nano Banana (Gemini 2.5 Image) verknüpft.
Alles planen
Seit wir mit Gemini 2 die Ära der KI-Agenten eingeläutet haben, haben wir große Fortschritte gemacht. Wir haben nicht nur die Fähigkeiten von Gemini als Coding-Agent verbessert, sondern auch seine Fähigkeit, zuverlässig über längere Zeiträume zu planen. Gemini 3 belegt den ersten Platz auf der Vending-Bench 2, die die Planung über einen längeren Zeitraum testet, indem ein simuliertes Automatengeschäft verwaltet wird. Gemini 3 Pro behält die Toolnutzung und Entscheidungsfindung über ein ganzes simuliertes Betriebsjahr hinweg bei und sorgt so für höhere Renditen, ohne vom Kurs abzukommen.
Gemini 3 Pro bietet eine bessere langfristige Planung und erzielt im Vergleich zu anderen Spitzenmodellen deutlich höhere Renditen.
Das bedeutet, dass Gemini 3 euch im Alltag noch besser unterstützen kann. Durch die Kombination von komplexeres logisches Schlussfolgern mit einer verbesserten, konsistenteren Tool-Nutzung kann Gemini 3 an eurer Stelle handeln, indem es komplexere, mehrstufige Workflows von Anfang bis Ende durchführt – beispielsweise die Buchung lokaler Dienstleistungen oder die Organisation eures Posteingangs – und das alles unter eurer Kontrolle und Anleitung.
Abonnent*innen von Google AI Ultra können diese agentischen Funktionen in Gemini mit Gemini Agent ausprobieren (zunächst nur in den USA verfügbar). Wir haben viel gelernt, um die agentischen-Funktionen von Gemini zu verbessern, und wir sind gespannt, wie ihr sie nutzen werdet, wenn wir sie bald auf weitere Google-Produkte ausweiten.
Gemini Agent hilft euch, euer Gmail-Postfach zu organisieren. Google AI Ultra-Abonennt*innen können die Funktion ab sofort in der Gemini-App testen.
Verantwortungsbewusste Entwicklung von Gemini 3
Gemini 3 ist unser bisher sicherstes Modell und wurde umfassender auf Sicherheit geprüft als jedes andere KI-Modell von Google. Das Modell zeigt eine geringere Ja-Sagerei, eine höhere Widerstandsfähigkeit gegen Prompt-Injections und einen besseren Schutz vor Missbrauch durch Cyberangriffe.
Zusätzlich zu unseren internen Tests für die kritischen Bereiche unseres Frontier Safety Framework haben wir auch mit weltweit führenden Fachleuten zusammengearbeitet, um Bewertungen durchzuführen, dem UK AI Security Institute frühzeitigen Zugang gewährt und unabhängige Bewertungen von Branchenexpert*innen wie Apollo, Vaultis und Dreadnode erhalten.
Die nächste Ära von Gemini
Das ist erst der Anfang der Gemini 3-Ära. Ab heute könnt ihr Gemini 3 testen:
- Für alle in der Gemini App und für Abonnentinnen und Abonnenten von Google AI Pro und Ultra im KI-Modus in der Google Suche
- Für Entwickler in der Gemini API in AI Studio, unserer neuen Plattform für die Entwicklung von Agenten, Google Antigravity, und der Gemini CLI
- Für Unternehmen in Vertex AI und Gemini Enterprise
Für den Deep Think-Modus von Gemini 3 nehmen wir uns mehr Zeit für Sicherheitsbewertungen und Feedback von Sicherheitstester*innen, bevor wir ihn in den kommenden Wochen für Abonnent*innen von Google AI Ultra verfügbar machen.
Wir planen, bald weitere Modelle der Gemini 3-Serie vorzustellen, damit ihr noch mehr mit KI erledigen könnt. Wir freuen uns auf euer Feedback und darauf, zu sehen, was ihr mit Gemini lernt, entwickelt und plant.