[mecab-users 265] ユーザー辞書追加

Back to archive index

遠藤大二 dendo****@rakun*****
2007年 4月 25日 (水) 03:08:05 JST


遠藤です

いつも勉強させていただいております。
ユーザー辞書を登録したところmecabが実行できなくなりました。
問題点および対処方法をご教示いただけると幸いです。

OSはSuse linux 10.1
mecab は 0.95をutf8で使用しています。

実施したこと
1
ファイル(flutd.utf8.csv)をユーザー辞書(oka.dic)として作成登録しました。

****************
flutd.utf8.csv は

圧痛,120,120,6058,名詞,一般,*,*,*,*,圧痛,アッツウ,アッツー
圧迫排尿,120,120,6058,名詞,一般,*,*,*,*,圧迫排尿,アッパクハイニョウ,アッパクハイニョー
異所,120,120,6058,名詞,一般,*,*,*,*,異所,イショ,イショ

のようになっています。
****************************

oka @ Geneknot14:~> cd oka
oka @ Geneknot14:~/oka> /usr/local/libexec/mecab/mecab-dict-index
-d/usr/local/lib/mecab/dic/ipadic -u oka.dic -f utf8 -t utf8
flutd.utf8.csv
reading flutd.utf8.csv ... 53
emitting double-array: 100% |###########################################|

done!

2
configファイルにユーザー辞書(oka.dic)を追加しました。

;
; Configuration file of MeCab
;
; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $;
;
dicdir =  /usr/local/lib/mecab/dic/ipadic

userdic = /home/oka/oka/oka.dic

; output-format-type = wakati
; input-buffer-size = 8192

; node-format = %m\n
; bos-format = %S\n
; eos-format = EOS\n

3
追加後、ファイル(flutd.txt)に対してmecab処理をしたところ不備が生じました

oka @ Geneknot14:~> cd oka
oka @ Geneknot14:~/oka> mecab ./flutd.txt
tagger.cpp(149) [tokenizer_.open(*param)] tokenizer.cpp(134)
[sysdic->isCompatible(*d)] incompatible dictionary:
/home/oka/oka/oka.dic

*******************
flutd.txt :
マグネシウム過剰摂取
頻尿
排尿困難
有痛性排尿困難
不適切な場所での排尿
**********************

ユーザー辞書が正しく登録されていないようなのですが、対処方法がわかりません。なにとぞよろしくお願いします。




mecab-users メーリングリストの案内
Back to archive index