Ein wichtiger nächster Schritt auf unserer KI-Reise
Künstliche Intelligenz (KI) ist die tiefgreifendste Technologie, an der wir heutzutage arbeiten. Ob es darum geht, Ärzt:innen dabei zu helfen, Krankheiten früher zu erkennen, oder Menschen den Zugang zu Informationen in ihrer Muttersprache zu ermöglichen – KI hilft Menschen, Unternehmen und Gemeinschaften, ihr Potenzial zu entfalten. Und sie eröffnet neue Möglichkeiten, die das Leben von Milliarden von Menschen erheblich verbessern könnten. Aus diesem Grund haben wir das Unternehmen vor sechs Jahren neu auf KI ausgerichtet – denn wir sehen darin eine wichtige Möglichkeit, unsere Mission zu erfüllen: die Informationen der Welt zu organisieren und sie universell zugänglich und nutzbar zu machen.
Seitdem haben wir auf allen Ebenen in KI investiert – und Google AI und DeepMind setzen bereits neue Maßstäbe. Heute verdoppelt sich der Umfang der größten KI-Berechnungen alle sechs Monate und übertrifft damit das Mooresche Gesetz bei weitem. Gleichzeitig beflügeln fortschrittliche, generative KI und große Sprachmodelle die Phantasie von Menschen auf der ganzen Welt. Unser Transformer-Forschungsprojekt und unsere richtungsweisende Veröffentlichung aus dem Jahr 2017 sowie unsere bedeutenden Fortschritte bei den Diffusionsmodellen bilden die Grundlage für viele der generativen KI-Anwendungen, die wir heute sehen.
Wir stellen vor: Bard
Es ist eine wirklich aufregende Zeit, an diesen Technologien zu arbeiten, denn wir übertragen Ergebnisse und Durchbrüche in der Forschung auf Produkte, die Menschen wirklich helfen. Das ist der Weg, den wir mit großen Sprachmodellen eingeschlagen haben. Vor zwei Jahren haben wir die nächste Generation von Sprach- und Konversationsfunktionen auf der Grundlage unseres Sprachmodells für Dialoganwendungen („Language Model for Dialogue Applications“, kurz: LaMDA) vorgestellt.
Wir haben an einem experimentellen KI-Dienst gearbeitet, der von LaMDA unterstützt wird und den wir „Bard“ nennen. Und heute machen wir einen weiteren Schritt nach vorn, indem wir ihn für erste sogenannte „Trusted Tester“ öffnen, bevor wir ihn in den kommenden Wochen einer breiteren Öffentlichkeit zugänglich machen.
Bard versucht, die Breite des weltweiten Wissens mit der Leistung, Intelligenz und Kreativität unserer großen Sprachmodelle zu kombinieren. Es greift auf Informationen aus dem Internet zurück, um aktuelle, qualitativ hochwertige Antworten zu liefern. Bard kann ein Ausdruck für Kreativität und ein Ausgangspunkt für Neugier sein – ob es nun darum geht, einem Neunjährigen die neuen Entdeckungen des James-Webb-Weltraumteleskops der NASA zu erklären oder mehr über die derzeit besten Stürmer:innen im Fußball zu erfahren.
Bard kann dazu genutzt werden, um komplexe Themen zu vereinfachen, z. B. um einem neunjährigen Kind neue Entdeckungen des James-Webb-Weltraumteleskops der NASA zu erklären.
Wir werden Bard zunächst in einer vereinfachten Modellversion von LaMDA veröffentlichen. Dieses viel kleinere Modell benötigt deutlich weniger Rechenleistung, so dass wir es für mehr Menschen öffnen können und so mehr Feedback erhalten. Wir werden externes Feedback mit unseren eigenen internen Tests kombinieren, um sicherzustellen, dass die Antworten von Bard hohen Anforderungen an Qualität, Sicherheit und Realitätsnähe erfüllen werden. Wir freuen uns auf diese Testphase, die uns helfen wird, weiter zu lernen und die Qualität und Geschwindigkeit von Bard zu verbessern.
Die Vorteile von KI in unsere alltäglichen Produkte einbringen
Schon lange nutzen wir KI, um die Google Suche für Milliarden von Menschen zu verbessern. BERT, eines unserer ersten Transformer-Modelle, war revolutionär im Verständnis der Feinheiten der menschlichen Sprache. Vor zwei Jahren haben wir MUM eingeführt, das 1.000 Mal leistungsfähiger als BERT ist und über ein mehrsprachiges Verständnis von Informationen verfügt, welches Schlüsselmomente in Videos erkennen und wichtige Informationen, einschließlich Unterstützung in Krisenfällen, in mehr Sprachen bereitstellen kann.
Unsere neuesten KI-Technologien – wie LaMDA, PaLM, Imagen und MusicLM – bauen darauf auf und schaffen völlig neue Möglichkeiten, mit Informationen umzugehen – von Sprache und Bildern bis hin zu Video und Audio. Wir arbeiten daran, diese neuesten KI-Fortschritte in unsere Produkte zu integrieren, angefangen bei der Google Suche.
Eine der aufregendsten Möglichkeiten besteht darin, wie KI unser Verständnis von Informationen vertiefen und sie effizienter in nützliches Wissen umwandeln kann – was es den Menschen leichter macht, zum Kern dessen zu gelangen, was sie suchen, und Dinge zu erledigen. Wenn Menschen an Google denken, denken sie oft daran, dass sie bei uns schnelle, sachliche Antworten finden, zum Beispiel „Wie viele Tasten hat ein Klavier?“. Aber immer mehr Menschen wenden sich an Google, wenn sie tiefere Einblicke und ein besseres Verständnis benötigen, zum Beispiel „Ist Klavier oder Gitarre leichter zu erlernen, und wie viel Übung braucht man dafür?“. Oft ist es etwas mühsam, genau das herauszufinden, was man wirklich wissen muss, und oft möchte man verschiedene Meinungen und Perspektiven kennenlernen.
KI kann in diesen Momenten hilfreich sein, indem sie Erkenntnisse für Fragen zusammenfasst, auf die es keine einzig richtige Antwort gibt. In Kürze werdet ihr KI-gestützte Funktionen in der Suche sehen, die komplexe Informationen und mehrere Perspektiven in leicht verständliche Formate umsetzen, damit ihr schnell das große Ganze verstehen und mehr aus dem Web lernen könnt: sei es, dass ihr zusätzliche Perspektiven sucht, wie zum Beispiel Blogs von Menschen, die sowohl Klavier als auch Gitarre spielen, oder ein verwandtes Thema vertiefen wollt, wie zum Beispiel Schritte für den Einstieg als Anfänger:in. Diese neuen KI-Funktionen werden bald in die Google Suche integriert.
Bei der Suche nach Erkenntnissen können KI-gestützte Funktionen in der Suche Informationen destillieren, um euch zu helfen, das große Ganze zu sehen.
Unterstützung von Entwickler:innen bei der Innovation mit KI
Neben unseren eigenen Produkten halten wir es für wichtig, es anderen einfach, sicher und skalierbar zu machen, von diesen Fortschritten zu profitieren, indem sie auf unseren besten Modellen aufbauen. Nächsten Monat beginnen wir mit dem Onboarding einzelner Entwickler:innen, Creator und Unternehmen, damit sie unsere API für generative Sprachmodelle ausprobieren können, die zunächst auf LaMDA basiert und später um eine Reihe von Modellen erweitert wird. Im Laufe der Zeit wollen wir eine Reihe von Tools und APIs entwickeln, die es anderen leicht machen, innovativere Anwendungen mit KI zu entwickeln. Die nötige Rechenleistung für den Aufbau zuverlässiger und vertrauenswürdiger KI-Systeme ist für Startups ebenfalls von entscheidender Bedeutung, und wir freuen uns darauf, diese Bemühungen durch unsere Google Cloud-Partnerschaften mit Cohere, C3.ai und Anthropic, die erst letzte Woche angekündigt wurden, zu unterstützen. Bleibt dran, um bald weitere Details für Entwickler:innen zu erfahren.
Groß denken und verantwortungsbewusst handeln
Es ist von entscheidender Bedeutung, dass wir Erfahrungen, die auf diesen Modellen beruhen, groß denken und gleichzeitig verantwortungsbewusst agieren. Deshalb setzen wir uns für eine verantwortungsvolle Entwicklung von KI ein: Im Jahr 2018 war Google eines der ersten Unternehmen, das eine Reihe von KI-Grundsätzen veröffentlicht hat. Wir bieten weiterhin Schulungen und Ressourcen für unsere Forscher:innen an, arbeiten mit Regierungen und Organisationen zusammen, um Standards und Best Practices zu entwickeln, und kooperieren mit Expert:innen, um KI sicher und nützlich zu machen.
Ganz gleich, ob wir KI einsetzen, um unsere eigenen Produkte radikal zu verändern, oder ob wir diese leistungsstarken Tools anderen zur Verfügung stellen – wir werden weiterhin mutig und verantwortungsbewusst an die Sache herangehen. Und das ist erst der Anfang – in den kommenden Wochen und Monaten werden wir in all diesen Bereichen noch mehr tun.