Google Suche 101: Wie Menschen weltweit die Google Suche verbessern
Jeden Tag werden Milliarden von Suchanfragen an die Google Suche gestellt. In weniger als einer halben Sekunde durchsuchen unsere Systeme hunderte Milliarden von Websites auf der Suche nach den relevantesten und hilfreichsten Ergebnissen.
Das Web und die Informationen darin ändern sich ständig. Deshalb nehmen wir an unseren Suchalgorithmen immer wieder Verbesserungen vor. Das können durchaus Tausende im Jahr sein. Wir suchen immer nach neuen Wegen, um die Ergebnisse noch nützlicher zu machen, sei es durch neue Funktionen oder neue Möglichkeiten der Sprachanalyse für die Google Suche.
Diese Verbesserungen durchlaufen einen Bewertungsprozess, der dafür sorgen soll, dass Menschen auf der ganzen Welt mit Google weiterhin finden, wonach sie suchen. Hier sind einige Beispiele dafür, wie die Einblicke und das Feedback von Menschen weltweit dabei helfen, die Google Suche zu verbessern.
Unser Research-Team bei der Arbeit
Veränderungen an der Google Suche sollen den Nutzer:innen erleichtern, nützliche Informationen zu finden. Allerdings brauchen unterschiedliche Menschen auch unterschiedliche Informationen, je nachdem, wo ihre Interessen liegen, welche Sprache sie sprechen oder wo auf der Welt sie sich befinden. Es ist unser Anliegen, Informationen universell zugänglich und nützlich zu machen, und wir sind fest entschlossen, dies für alle Nutzerinnen und Nutzern zu erreichen.
Deshalb haben wir ein Team, dessen Aufgabe darin besteht, sich mit Menschen auf der ganzen Welt in Verbindung zu setzen und zu erfahren, wie die Google Suche noch besser gemacht werden kann. Wir laden Nutzerinnen und Nutzer dazu ein, Feedback zu verschiedenen Versionen unserer Projekte abzugeben, und führen Beobachtungen und Befragungen durch, um zu verstehen, wie verschiedene Communitys online auf Informationen zugreifen.
So entwickelten wir beispielsweise im Laufe der Jahre ein Verständnis für die einzigartigen Bedürfnisse und technischen Einschränkungen von Nutzerinnen und Nutzern in Schwellenländern, wenn sie im Internet Informationen abrufen wollen. Daraufhin entwickelten wir Google Go, eine schlanke Suchanwendung, die ideal für die Nutzung mit weniger leistungsfähigen Mobiltelefonen und weniger verlässlichen Verbindungen ist. Außerdem haben wir eigens für Google Go hilfreiche Funktionen entwickelt, zum Beispiel die Möglichkeit, sich Websites laut vorlesen zu lassen. Dies kann vor allem Menschen helfen, die eine neue Sprache lernen und vielleicht noch Schwierigkeiten haben, lange Texte zu lesen. Solche Funktionen sind nur mithilfe der Einblicke der Menschen möglich, die sie am Ende nutzen werden.
Evaluator:innen der Suchqualität
Ein wichtiger Teil unseres Bewertungsprozesses ist das Nutzerfeedback dazu, ob unser Ranking-System und die vorgeschlagenen Verbesserungen gut funktionieren. Aber was genau heißt „gut funktionieren“? Wir machen Richtlinien für Evaluator:innen öffentlich zugänglich. Hier wird genau beschrieben, wie unsere Systeme nützliche Inhalte zu Tage fördern sollen. Diese Richtlinien umfassen mehr als 160 Seiten. Wenn wir ihren Inhalt jedoch mit nur einem Satz ausdrücken müssten, würden wir sagen, dass die Google Suche dazu entwickelt wurde, relevante Ergebnisse aus den verlässlichsten Quellen zu finden.
Unsere Systeme nutzen Signale aus dem Web, z. B. Informationen dazu, wo auf einer Website Wörter aus Suchanfragen auftauchen oder wie Seiten miteinander verlinkt sind. So kann bestimmt werden, welche Informationen zu einer Suchanfrage passen und ob Informationen von anderen Menschen als vertrauenswürdig erachtet werden. Doch letztendlich sind Relevanz und Vertrauenswürdigkeit menschliche Beurteilungen. Um zu messen, ob unsere Systeme das richtige Verständnis dafür haben, brauchen wir daher die Hilfe von Menschen.
Wir haben eine Gruppe aus über 10.000 Menschen von überall auf der Welt zusammengestellt, die uns als Evaluator:innen helfen herauszufinden, welche Erfahrungen Nutzerinnen und Nutzer mit unseren Suchergebnissen wahrscheinlich machen werden. Ihre Bewertungen basieren auf unseren Richtlinien und repräsentieren reale Nutzer:innen und ihren wahrscheinlichen Informationsbedarf. Dabei setzen sie ihr bestes Urteilsvermögen ein, um ihre Region zu vertreten. Bevor diese Menschen mit dem Bewerten beginnen, machen sie sich mit unseren Richtlinien für Evaluator:innen vertraut und werden auf ihr diesbezügliches Wissen getestet.
So funktioniert das Bewerten
Eine Bewertung läuft folgendermaßen ab: Wir generieren ein Muster an Suchanfragen, das beispielsweise aus einigen hundert Anfragen besteht. Diesem Muster wird eine Gruppe aus Evaluator:innen zugewiesen, denen zwei Versionen der Ergebnisseiten für diese Suchanfragen gezeigt werden. Eine Version entspricht den aktuellen Ergebnissen der Google Suche und die andere stammt aus einer verbesserten Version, an der wir arbeiten.
Die Evaluator:innen sehen sich alle Suchergebnisseiten an und bewerten sie im Hinblick auf die Suchanfrage und basierend auf unseren Richtlinien. Sie bewerten, ob diese Seiten die Informationen bieten, nach denen in der Anfrage gesucht wurde. Dabei beachten sie auch, wie maßgeblich und vertrauenswürdig die Quelle im jeweiligen Themengebiet zu sein scheint. Um Dinge wie Fachkenntnis, Sachkompetenz und Vertrauenswürdigkeit (oder „E-A-T“: Expertise, Authoritativeness and Trustworthiness) zu bewerten, recherchieren Evaluator:innen den Ruf der Quellen.
So sieht das Ganze in der Praxis aus: Nehmen wir als Beispiel die Suchanfrage „Rezept für Karottenkuchen“. Unter den Ergebnissen können Artikel von Kochwebsites, von Lebensmittelmarken, aus Kochmagazinen und vielleicht aus Blogs sein. Damit ein Evaluator oder eine Evaluatorin bestimmen kann, ob eine Webseite den Informationsbedarf deckt, zieht er oder sie möglicherweise verschiedene Faktoren in Betracht: Wie leicht kann man dem Rezept folgen? Gibt es hilfreiche visuelle Anweisungen oder Bilder? Verfügt die Seite über nützliche Funktionen wie eine Einkaufsliste oder die Möglichkeit, Mengenangaben zu verdoppeln?
Um zu verstehen, ob ein Autor auf dem Gebiet des Kochens Fachkenntnisse besitzt, suchen Evaluatori:innen online nach möglichen Referenzen. Wurden auf anderen Websites Profile über den Autor erstellt? Wird auf ihn verwiesen oder gibt es andere tolle Inhalte von ihm, die positiv bewertet wurden? Im Grunde werden Antworten auf die Fragen gesucht, ob diese Seite vertrauenswürdig ist und ob sie von einem Autor mit einem guten Ruf stammt.
Bewertungen werden nicht direkt für das Ranking der Suchergebnisse verwendet
Nach ihren Recherchen stellen Evaluator:innen eine Qualitätsbewertung für jede Seite zusammen. Diese Bewertung hat jedoch keinen direkten Einfluss auf den Rang einer Seite in der Google Suche. Niemand bestimmt, ob eine Quelle „maßgeblich“ oder „vertrauenswürdig“ ist. Seiten erhalten keine Bewertungen, um sie in eine Rangliste einzuordnen. Das wäre eine unmögliche Aufgabe und hätte für uns keinen Nutzen. Es gibt hunderte Milliarden von Websites, die sich noch dazu ständig ändern – es wäre also gar nicht möglich, jede einzelne Seite immer wieder zu bewerten.
Stattdessen bilden Bewertungen Datenpunkte, die uns in ihrer Gesamtheit zeigen, wie gut unsere Systeme hochwertige Inhalte finden, die von Menschen in einem Land und auf der ganzen Welt auch so bewertet wurden.
Livetests im Produkt
Wenn es darum geht, Verbesserungen vorzunehmen, nutzen wir nicht nur unsere Recherchen und das Feedback von Evaluator:innen. Wir müssen auch verstehen, wie sich eine neue Funktion verhält, wenn sie tatsächlich in der Google Suche verfügbar ist und in einem realen Kontext genutzt wird. Diese Einblicke erhalten wir durch Livetests.
Die Bezeichnung kommt daher, dass die Tests mit einer kleinen Gruppe zufällig ausgewählter Nutzerinnen und Nutzer durchgeführt werden, die die aktuelle Version der Google Suche benutzen. Um eine Änderung zu testen, wird eine Funktion für einen kleinen Anteil aller Suchanfragen verfügbar gemacht. Wir sehen uns dann verschiedene Messwerte an, um die Auswirkungen zu beurteilen.
Haben Nutzerinnen und Nutzer auf die neue Funktion geklickt oder getippt? Haben die meisten Nutzer:innen einfach daran vorbei gescrollt? Hat sich die Ladezeit der Seite verlängert? Diese Punkte verraten uns ziemlich viel darüber, ob eine neue Funktion oder eine Änderung hilfreich ist und ob sie von Nutzer:innen tatsächlich angenommen wird.
2019 fanden mehr als 17.000 solcher Livetests statt, bei denen neue Funktionen und Verbesserungen der Google Suche getestet wurden. Vergleicht man diese Zahl mit den tatsächlich veröffentlichten Funktionen (das waren etwa 3.600), dann wird deutlich, dass es am Ende nur die besten und nützlichsten Verbesserungen in die Google Suche schaffen.
Ständige Verbesserungen
Unsere Suchergebnisse werden nie perfekt sein. Unsere Forschungs- und Bewertungsprozesse haben sich in den letzten zwei Jahrzehnten aber als sehr effektiv erwiesen. Sie ermöglichen uns, regelmäßige Verbesserungen durchzuführen und so dafür zu sorgen, dass die Änderungen Menschen auf der ganzen Welt helfen, wenn sie sich auf der Suche nach Informationen an uns wenden.