読者です 読者をやめる 読者になる 読者になる

かな入力を少し楽にする辞書を作る

ローマ字入力を12年ぶりにかな入力に戻した。やまとことばは打鍵数が少ないが、漢語や外来語ではどうしてもシフトキーの操作が多くなってしまう。

そこで、拗音や促音を通常の文字として入力することを考えた。iOS での文字入力にも使われている方法だ。「にゆうりよく」で「入力」に変換させる。

使えそうな辞書として、オープンソースの日本語入力システム Canna や FreeWnn の辞書を利用することも考えたが、今回は形態素解析エンジン Mecab の辞書を利用してみた。

Mecab 辞書を入手する

Mecab のダウンロードページから mecab-jumandic-7.0-20130310.tar.gz をダウンロードする。アーカイブを展開すると ContentW.csv というファイルがある。これを辞書として使えるよう変換する。

辞書を変換する

PHP で変換するプログラムを書いてみた。Macことえり)なら yutori-kana-mac.php, MS-IME あるいは Office IME の場合は yutori-kana-msime.php を使う。

このスクリプトが行っていることは、名詞の代表表記を抜き出し、読みの拗促音をでっかく、そして辞書に登録できる形にすることである。

入出力ファイルを指定して実行するとテキストファイルが出来上がる。実行方法については割愛する。

辞書を登録する

OS X の新しいバージョン Mavericks では辞書登録の場所が少し分かりづらくなっていたので併せて解説する。

メニューから「“ことえり”環境設定を開く」を選ぶと下図ような画面が表示される。この赤枠部分に先ほどのテキストファイルをドラッグすれば登録完了。6140語が登録される。

もし登録した単語が変換できない場合は com.apple.JapaneseAnalysis について調べること。

参考

似た考えのもと、さらに入力しやすくした辞書がこちらで公開されています。