« ココデカウ | トップページ | UbuntuにHDD増設 »

2016年12月22日 (木)

Mozcに辞書を追加した

 サブPCの、と言うか使用頻度ではメインPCとも言える余り物PCのUbuntu機には下記の記事を参考にしてMozc UT Dictionaryをインストールしてあります。

旧ID:itiriのブログ様
Ubuntu 14.04 LTS に Mozc UT Dictionary をインストールしてみた

 おかげで、例えば「いんたーねっと」と入力して変換すると

Henkan_1

 と「Internet」が候補に出てくるようになりました。が、それでも「よーろっぱ」と入力したら英語での変換候補は出ません(漢字候補が出るのは有難いのですが)

Henkan_2

 ネットで検索してみたら、Mozcのプロパティを見るとカタカナ英語変換書や郵便番号変換など全てにチェックが入っていても、辞書そのものがインストールされていないので変換されないのだそうです。

Mozc_001

 ということで、ナレッジエース様の
Mozc(Google IME)でカナ英・和英変換

を参考にさせていただき、Google 日本語入力用のカナ英語辞書と和英辞書をMozcに入れてみることにしました。

 ダウンロードしたのは「Google日本語入力強化辞書v5-1.7z」
 展開した8つの辞書ファイルの内、今回使ったのは「カナ英辞書v2」「英和辞書」の2つです。

Jisyo_tenkai

 コレをブログの記事に書いてあったように、意図しないところで英語に変換されるのを防ぐために、単語の先頭に@を入れて、英語に変換したい時だけ例えば「@りんご」で「Apple」と変換されるようにしたいので、正規表現を使って全行先頭に「@」付けようとgeditで開くと、

Gedit1

 読み込み途中ですが、見事に文字化けしています。しかも読み込み完了後にgeditがフリーズしてしまいます。殆どの文字コード(エンコード)を読み込んでくれるLeafpadでも開けません。

Leafpad_1

 そこで急遽Windows機でmEditorという名前の時から愛用しているMeryをWineにインストールして開いてみました。

Mery_001

 さすがMery、一発で開きます。開いたついでに、Meryで全行の先頭に「@」を付けます。検索→置換で「検索する文字列」に正規表現で行頭を示す半角の「^」キャレットを指定。「変換する文字列」には全角で「@」アットマークを指定します。「正規表現を使用する」にチェックを入れて「すべて置換」をクリックすると、

Mery_002

 一瞬で全置換してくれます。で、名前を付けて保存。

Mery_hozon1

 このテキストファイルは文字コードが「UTF-16LE」なんですね。これを「UTF-8」で保存します。

Mery_hozon2

すると、

Leafpad_2

 Leafpadでも開けるようになりました。
 ちなみに検索で表示されている半角の「?」は、多分最初のファイルを保存する時に、機種依存文字の「ゔ」が表示できなくて「?」になったのだと思います。だから「?ぁ」は「ゔぁ」になります。「Violin」をカタカナで「ヴァイオリン」と書いたりしますよね。

Kana_en_002


 でも、「?」が全角文字ならいいのですが、これは半角英数字なので、全角入力から一旦半角の「?」を入力し、全角に戻して「ぁ」と入力して変換するのも面倒くさいので、「?ぁ」は「ば」に、「?ぃ」は「び」に、「?」「?ぇ」「?ぉ」はそれぞれ「ぶ」「べ」「ぼ」に検索→置換しました(Avrilは除く)。

Kana_en_004

 上書き保存してこれで完了です、が……ふと思いつきました。geditはフリーズするからダメとして、文字化けするだろうとハナっから使わなかったmeditでも文字コードを選択したら開けるのでは? 思いついたら試してみないと気が済まないので、やってみました。

Medit_2

 思った通り「UTF-16LE(リトルエンディアン、BOMあり)」を選択すると、開くことが出来ました。文字コードが判っていればMeryをインストールする必要はなかったですね。とは言っても、Meryで開くことが出来たから文字コードも判った訳ですが。

Medit_4

 このまま置換をしてみます。やることはMeryの時と一緒です。

Medit_5

Medit_6a

Medit_6b

Medit_7

Medit_8

 UTF-8で保存したファイルを「Mozc辞書ツール」でユーザー辞書に追加します。

Mozc__003

 これで、カナ英辞書や和英辞書を使って変換したい時は文字の先頭に「@」を付けて例えば「@よーろっぱ」と入力しただけで変換前に候補として表示されます。

Henkan_004

 変換するとこうなります。

Henkan_3

 Mozc UT Dictionaryの変換効率がいいので滅多には使わないと思いますが、でもカナ英辞書や和英辞書は、あれば便利です。

 Mozc UT Dictionaryの導入はコチラのサイト様でもわかりやすく解説されています。
萌え萌えmoebuntu様 Mozcの辞書を強化する方法 その3

|

« ココデカウ | トップページ | UbuntuにHDD増設 »

ウェブログ・ココログ関連」カテゴリの記事

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/507657/64639918

この記事へのトラックバック一覧です: Mozcに辞書を追加した:

« ココデカウ | トップページ | UbuntuにHDD増設 »