anthyのユーザー辞書

Date: 2019/02/09 (initial publish), 2019/05/23 (last update)

Source: jp/note-00001.md

Previous Post Top Next Post

TOC

2019-05-11:加筆修正。

Anthyのソースを見るとメイン 辞書以外のユーザー辞書は、単漢字入力などの入力文字列として半角tを最後 につけた辞書が、ファイル名「*.t」で多数含まれ配布されています。

(もっとも、現在のDebianのソースは NIIBE Yutakaさんが最近再構成したので、 ファイルの起源はどうもalt-cannadicは由来かもしれません)

これらは個人用辞書用と言うことですが、現在(2019年2月)の時点では 「郵便番号→住所」変換をするためのzipcode.t以外はバイナリーパッケージに コピーされていないので直接システムに導入するようにはなっていません。

ただ同梱された「郵便番号→住所」変換をするための辞書は「7桁半角数字」 を入力すると郵便番号に対応する住所の文字列を吐き出すようになっているように 見受けます。–> 7桁半角数字が変換されないように見えたのはDEBIANのバグでし た。 2019-05-06: Debian BTS

実際にanthyをibus-anthyの下で動作させると「7桁半角数字」を入れても何も起こりません。 ibus-anthyの下では、現在このzipcode.tは明らかに使えません。Busterは既にフリーズ中 なのでこの修正は次回リリースやバックポートで入るように提案していきます。

(zipcode.tは「t」で終わるトリックは使っていません。)

良く見るとibus-anthyが

/usr/share/ibus-anthy/dicts/emoji.t
/usr/share/ibus-anthy/dicts/era.t
/usr/share/ibus-anthy/dicts/oldchar.t
/usr/share/ibus-anthy/dicts/symbol.t
/usr/share/ibus-anthy/dicts/zipcode.t

をインストールして、GUIの設定が「~/.anthy/*.t」からシムリンクをはるなど してこれらをibus-anthyのGUIでユーザー辞書として使えるようにしているようです。

ただこれらのユーザー辞書では、入力文字列として半角tを最後つけることはされて いません。「郵便番号→住所」変換をするための辞書は「3桁全角数字、 全角の長音(UTF-8=E383BC, Unicode=U+30FC)、4桁全角数字」を入力すると、 郵便番号に対応する住所の文字列を対応させるようになっていますし、実際の 動作もそうです。

どうもこの違いは、使うフロントエンドによって提供されるローマ字入力からかな に変換される際のルールが異なるので、ibusでは小文字のtが入れにくいことにある ようです。(「uim」は使っていないのであくまで推測です)

ローマ字入力からのかな漢字変換は、どうも使うフロントエンドによって少々動作が 違うので要注意です。

そもそもこの変な小文字のtを末尾に入れる変換辞書スタイルは、 昔の「canna辞書」由来かもしれません。

2019-05-22: 上記メモを書いた後いろいろ試して、FREEZE中なのでDebianの experimentalにバグ修正版1:0.3-9をアップロードしています。7桁数字での 郵便番号はちゃんと出るようになりました。

Previous Post Top Next Post