Googleが目指す最高の検索UI

2009年 5月 18日

Ben Gomes

上級ソフトウェアエンジニア

数ヶ月前にウディ・マンバーがサーチクオリティグループの存在を紹介し、この連載でも前に文書のランキングについて触れました。ウェブ文書のランキングはグーグル検索の品質の要ですが、皆さんの行っている検索はそれよりもっと多くのものから成り立っています。今回は、グーグル検索の発展を支えている理念とその実例について述べようと思います。また、グーグルがいかに徹底した実験を通して確実に機能を向上させているかについても述べるつもりです。次回は、現在行っている実験のいくつかを紹介する予定です。

まずは自己紹介から始めましょう。私の名前はベン・ゴメス。1999 年からグーグルで主に検索品質を中心に検索にたずさわってきました。ロボットによるページの収集からランキングまで検索エンジンのほとんどに貢献するという幸運に恵まれ、現在は検索インターフェースと検索機能の技術責任者として働いています。

グーグルの検索ユーザーインターフェースの仕事をしていると言うと、友人たちは一様に「いったい何をするんだ？何も変わっていないじゃないか」と言います。そして、疑わしげに私を見て、せっかくの良いものを下手に変えないでくれとも言います。「心配には及ばないよ。グーグルは今までどおり、簡単で早くてわかりやすいページのままだよ」「それは良かった。でも、そのメンテナンスのどこが難しいっていうんだ？」

その質問に答えるには、私たちのウェブ検索における一番の目的「ユーザーをできるだけ早く求めるウェブページへ辿り着かせること」から説明しなければなりません。検索はそれ自体では完結せず、単なる中継点にすぎないのです。一見あたりまえのようにみえるこの目的が、ユーザーがどれだけ長くとどまってくれるかが成功の鍵となる他のウェブサイトと検索エンジンを根本的に違うものにしています。私たちにとってウェブ検索の成功とは、ユーザーがどれだけ早く立ち去るか（満足して去ってくれているといいのだけれど！）で測られるところがあります。ユーザーが最小限の時間で必要な情報を手に入れられるように、私たちが採用している理念がいくつかあります。

小さなページ　一般的に、ページが小さければダウンロード時間が短く、早く画面に表示されます。それゆえ、最低限の整ったデザインを採用します。インターフェースがあまりに凝っているとページのダウンロードが遅くなり、ユーザーのためになりません。
複雑なアルゴリズムをシンプルに表示　多くの検索機能には、その機能を十分に働かせるために非常に複雑なアルゴリズムと膨大なデータ分析が必要です。そういった複雑なものすべてを、すっきりした使いやすいユーザーインターフェースの裏に隠してしまうのがミソとなります。打ち間違いの修正、サイトリンク（後述）、クエリの書き換え候補の表示などは高度なアルゴリズムを必要とする機能の一例ですが、常に改良されています。ユーザーからすると、気づかないうちに検索がしやすくなっていることになります。
どこででも使える機能　アルゴリズムと結果の表示があらゆる言語、国に適応できるように機能設計しなければなりません。例えば、日本語ではクエリ中の単語は必ずしもスペースで区切られていません。またヘブライ語やアラブ語では文は右から左に書かれます。これらの言語でどこでも使えるような「もしかして」のUIを作ろうとしたら、どうすればよいでしょう。
データに基づいた決定－実験、実験、とにかく実験　私たちは、実験を行うことで自分たちが間違っていないと証明しようとしています。有望に見える設計のテスト結果が必ずしもいいとは限りません。

そして常に気を使うべきことがあります。例えば、結果ごとに表示するテキスト（または画像）を増やせばユーザーは最良の結果を選択しやすくなるかもしれません。しかし、結果ページの情報が多すぎるとダウンロードが長くなり、目を通すのにも時間がかかるようになります。そのため、その情報を追加する代償よりもユーザーの利益のほうが大きくなるように、検索結果ページに加える情報のひとつひとつを慎重に検討しなければなりません。これはクエリ入力から検索結果の順位付け、改善策の検討にいたるまで検索のあらゆる場面で言えることです。

検索はクエリを入力するところから始まります。検索に際してよくあるいらいらの原因は、単語の正しい綴りがわからないことです！シンプルであたりまえのように見える打ち間違い修正機能の裏側には多くの技術課題が潜んでいます。例えば、一般的な日本語辞書には「倖田來未」は載っていません。私たちは、ユーザーが本当に検索したい単語や打ち間違いそうな単語を決定するために、ウェブと私たちのクエリ・ログを分析します。ユーザーの打ち間違いを修正するシステムは、ユーザーが入力しようとした可能性のある膨大な量の単語（それは今まで手で編纂されたどんな辞書よりもはるかに多い）を瞬時に検討し、もっと可能性の高いクエリがあるかどうか判断しなければならないのです。打ち間違いの修正をするアルゴリズムは常に改良されています。現在は多言語対応が可能で、ユーザーの打ち間違いを見抜く能力は向上しています。クエリを正しく入力することは非常に重要なので、今年の 1 月には打ち間違いを修正されたクエリの検索結果をページの上部に表示するような変更を行いました。

クエリを正しく表示できたら、次は検索結果リストからページを選択します。結果ごとにタイトルと URL、そして普段は 3 行の簡潔なスニペットが表示されます。適切なタイトルのないページは無視されがちです。最近の大きな変更のひとつは、ページのタイトルが明示されていても HTML タイトルがないページからタイトルを引き出すことができるようになったことです。そのページの HTML を分析してページ作成者が意図するタイトルを「把握」し、決定します。これによって、適切なタイトルがないからといってページを無視するようなことは大幅に減るでしょう。タイトルの下にはスニペットが表示されますが、グーグルの初期革新の要はこのスニペットの内容にありました。当時の検索エンジンは、単にウェブページの最初の2行分を表示していました。グーグルは、その代わりにページ中の検索キーワードが出てくる部分を表示したのです（情報検索の専門家はこれを「keywords-in-context（文脈付き索引）」と呼びます）。keywords-in-context の表示は見た目には単純で、シンプルなほうのスニペットとほとんど変わらないように見えますが、サイト選びの効率を飛躍的に上げます。この簡潔さの裏には複雑な作業が隠されています。スニペットを作成する際に、単に最初の数行ではなくもっとも関連性の高い部分（ユーザーのキーワードを含む部分）を表示できるように、ひとつひとつの検索結果のテキストに目を通さなければならないのです。

私たちは、ページ内の関連部分を決定するアルゴリズムを使ってスニペットを改良してきました。改善点は、検索結果の中にあるクエリの同義語を強調するといった些細なものからはっきりとわかるものまで多岐にわたっています。ここに、ユーザーが「テレ朝」を検索したときのスクリーンショットの例があります。検索結果スニペットで「テレビ朝日」が太字になっていますが、これはおそらく「テレビ朝日」のことを指しているのだろう、という分析がなされた結果です。

「テレ朝」の検索で、「tv asahi テレビ朝日」が結果ページに表示され、テレビ朝日を囲って注目にしている画像。

もっとわかりやすい例を挙げると、現在はページに日付が記載されている場合はその日付を抜き出して提示しています。これらの日付は様々な形式で記されていますが、私たちはそれを抜き出して均一に表示し、ユーザーがスキャンしやすいようにしています。

「新型インフルエンザ休校」の検索で、表示された結果で日付を提示しているところを囲って注目にしている画像。

もっとも一般的なユーザーのニーズのひとつで、知っているウェブサイトの名前をクエリとして入力する「ナビゲーショナルクエリ」では、ショートカット（サイトリンクと呼ばれている）を導入しました。サイトリンクのおかげでユーザーはサイト内の重要な部分に行くことができ、これには上述されている理念の多くが実際に適用されています。サイトリンクは、一番目の検索結果に簡潔に付け加えられ、ページに少しテキストが増えることになります。

検索結果ページで一番目の検索結果に簡潔にサイトリンクは付け加えられたことを示す画像。

例えば、NHKのホームページではページの上部や下部に有用そうなリンクがたくさんはられています。様々なシグナルの組み合わせを用いた私たちのアルゴリズムが、これらの中からユーザーが最も見たがっていると思われるものを選択します

ユーザーが検索順位の上位から探しているものを見つけられなかった場合はどうするのでしょう？その場合はおそらく別のクエリで検索してみる必要があります。このとき、検索結果ページの一番下にクエリの書き換え候補の一覧が表示されます（たとえその中に必要なものがなくても、クエリを書き換えできる別の《もっと成功率の高い》方向にユーザーが目を向けるヒントとなります）。ページの一番下にクエリ書き換え候補が表示されてもユーザーの邪魔にはなりませんし、残りの検索結果で必要な情報が得られない場合はこれらを参考にできます。

多くの変更（些細なものもあれば明らかなものもあります）を加えたところを含め、検索の主な部分について述べてきました。検索にこのような変更を実施したとき、それが改悪ではなく改善であったとどのように判断するのでしょう？私たちは、変更をユーザーたちと共有することで、絶えず自分たちの仕事を評価しています！提案された変更をごく一部のユーザーに行ってみて、それが検索に役立っているか害になっているかを見きわめるのです。成功か失敗かの判断基準はたくさんあります。これらの改善を判断するプロセス自体が科学であり、そこには多くの落とし穴が隠されています。自分たちの実験的方法論のおかげで、私たちはさまざまな可能性を探求し、もっとも効果的なものを実行することができています。私たちが世に送り出した機能ひとつひとつの裏には、日の目を見なかった数多くの実験があるのです。

だから、最初に述べた質問に答えさせて欲しい。私たちは実際にグーグルの検索結果ページに絶えず手を加えており、今までもずっとそうしてきました。そして、決して品質を落としたりはしません。あなたたちユーザーがそうさせないでしょう。

次回は、現在行っている実験のいくつかと、そこから学びたいことについて話をしたいと思います。

Googleが目指す最高の検索UI

関連記事