メインページに戻る
Japan Blog

思いどおりの日本語入力 - Google 日本語入力



本日、Google 日本語入力 (ベータ) をリリースしました。

Google 日本語入力は Windows (現時点では 32 ビットのみ) および Mac に対応した日本語入力ソフトウェア (インプットメソッド) です。豊富な語彙と強力なサジェスト機能で思いどおりの日本語入力をサポートします。

Google 日本語入力は桁違いの語彙力を持っています。Web から機械的・自動的に辞書を生成することで、人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録しています。高い変換精度を実現するために、Web 上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成しています。現在の Web のありのままを反映したインプットメソッドと言えます (この辞書および統計的言語モデルの作成は Google の大規模分散処理システム MapReduce を用いて、数千台規模の計算機クラスタを使って行っています)。さらに、強力なサジェスト機能によりこれらの大量の単語を少ないキー数で入力することが出来ます。

そもそも Google 日本語入力は、ソフトウェアエンジニアの工藤と小松の 20% プロジェクトからスタートしました。ご存知の方も多いと思いますが、Google の「20% ルール」とは、勤務時間の 20% を自分の好きなことに使って良いという社内ルールです。

当時、工藤は Googleの「もしかして」機能を担当していました。スペルミスの多くがインプットメソッドの誤変換に起因していることと、チームで開発した「もしかして」システムが高い精度でそれらを修正していく様を目の当たりにして、Google 日本語入力の可能性を確信しました。

同じ時期に、別のチームにいた小松も、オープンソースソフトウェアの日本語入力システムの作者であり、インプットメソッドの開発を希望して Google に入社したことから、Web 上の大量のデータとサジェスト機能を活用した Google ならではのインプットメソッドのアイデアを温めていました。

このように工藤と小松の二人で始めたプロジェクトですが、徐々に 20% プロジェクトとしての貢献者も増え、しばらくたつと、Anthy, WinAnthy, scim-skk, skkime, AjaxIME, PRIME, MeCab などの日本語処理システムや日本語入力システムの開発に携わっていたエンジニアや Windows の TSF での開発経験のあるエンジニア、各種オペレーティングシステムの開発経験者がこのプロジェクトに様々な形で参加するようになっていました。今回お届けする Google 日本語入力は、このような自然言語処理や各種プラットフォームの開発経験者たちのノウハウが凝縮されたものとなっています。

Google 日本語入力はまだベータ版です。アプリケーション互換性問題、誤変換、未実装の機能を含め多くの改善点が残っています。不具合や改善点など皆様からのフィードバックをお待ちしております。

<追記>

問い合わせが多かったので、追記いたします。

  • Google 日本語入力はネットワークに接続されていない状態、すなわちオフラインで動作します。
  • プロパティにある「シークレットモード」は、学習機能と入力履歴からのサジェストおよびユーザー辞書を一時的に無効にする機能です。
  • Windows の 64 ビット版は鋭意開発中です。

Google 日本語入力についての情報はヘルプセンターを参照ください。また、ヘルプフォーラムも用意しておりますので、ご利用ください。