メインページに戻る
Japan Blog

Google 日本語入力がオープンソースになりました



Google が Google 日本語入力を発表してから、5ヶ月がたちました。発表から今日まで、数回のベータ版のアップデートを通じて不具合の修正や機能の追加を行い、また、開発版も追加しました。ベータ版にも関わらず、非常に多くの方にお使いいただき、貴重なフィードバックも多数いただいております。私たちの考える「思いどおり」の入力というものをユーザーの皆さんも望んでいることをひしひしと感じます。多くの方が出来るだけ少ない労力で日本語を入力したいと考えており、また誤変換の心配から解放されたいと願っていることがわかりました。ユーザーの方にストレス無くインターネットを使っていただけるようにすることが Google の使命であると考えています。

ただし、このようなビジョンを実現するためにはオープンソース・コミュニティの方々からの助けが必要です。Google 日本語入力発表時にお約束したとおり、本日、Google 日本語入力のソースコードをオープンソースとし公開いたします。

オープンソース・プロジェクトの名前は Mozc (モズクと発音します) です。Mozc プロジェクトページでソースコードやビルド方法などの情報を得ることが出来ます。

今回のオープンソース化は、まずは Chromium OS への対応を目的としたものですが、同時に、より多くの開発者に日本語入力やインプットメソッドに興味を持っていただくことも強く期待しています。また、積極的にオープンソースを活用する企業として、オープンソース・コミュニティに貢献していきたいとも考えています。

私たちは今後の展開に胸をふくらませており、みなさんもそうであるよう願っています。今後の Google 日本語入力のアップデートおよびオープンソース・プロジェクトである Mozc の動向にも引き続き注目しつつ、美しい新緑の季節をお過し下さい。

よくある質問

- 全部オープンソースになるのですか?
現時点では、Chromium OS で必要な部分のみがオープンソースとして公開されます。また、 オープンソース版の辞書データは、Google 日本語入力で使用しているものと構成が異なります。

- オープンソース化されていないものはなんですか?
Windows/Mac OS 用クライアント/インストーラや辞書登録ツール、環境設定ツールなどの GUI により実現されているツールです。

- オープンソース版のライセンスは何ですか?
BSD ライセンスです。

- オープンソース・プロジェクトに参加できますか?
現時点では参加出来ません。

- Windowsで動きますか?
現時点では動きません。

- Mac OSでは動きますか?
現時点では動きません。

- Linuxでは動きますか?
Ubuntu 9.10 および 10.04 での動作を確認しています。Google が動作を保証するものではありません。Linux Build Instruction を参照してください。

- Androidでは動きますか?
現時点では動きません。

- 辞書の構成の違いは何ですか
Webデータから自動抽出された大規模語彙データは含まれていません。 語彙集合は基本的に IPAdic と同一です。 そのため、固有名詞以外の変換精度は Google日本語入力 とほぼ同一です。以下、Google 日本語入力で使用している辞書および IPAdic との主な違いです。

  • IPAdic に収録されていない、表外動詞や形容詞が一部含まれています。
  • IPAdic に収録されていない、Web 上に多く出現するカタカナ語が含まれています。
  • IPAdic の中にある単語のみで構成され、Web上によく出現する複合語 が追加 されています。(例: 再起動, 社員証)。
  • Google 日本語入力で使用されている辞書に含まれている カタカナ→ 英語 は含まれていません (例:アンドロイド→Android)。
  • Google 日本語入力で使用されている辞書に含まれている 郵便番号 → 住所 は含まれていません。

- なぜオープンソース版の辞書はデータが違うのですか?
Google 日本語入力の辞書は、Web 上のデータなどから作成されており、膨大な量の単語のみならず、Google の検索のランキング・インデクシングアルゴリズムを反映するような単語の頻度情報も含まれております。Google 日本語入力で使用している辞書をオープンソース化するということは、辞書及び頻度情報を、日本語入力以外の目的で使われることに許諾することを意味し、これは Google の意図するところではありません。以上のような理由により、オープンソース版の辞書は異なるものを使用しています。