2009年10月25日

MeCab辞書実演比較WEBアプリ

今日は二日酔いのちMeCabな1日でした。

というわけで、今日作った代物。

IPA、NAIST、UniDic、JUMANの辞書実演比較
http://www.mwsoft.jp/programming/munou/mecab_dic_perform.html

複数の辞書で解析をして、その結果を並べて出力するページです。結局どの辞書がいいのさって思った人が直感的に選べるようにという意図で作りました。


IPA, NAIST, JUMANはライセンス的に大丈夫そうだったので許可とか取らずに使ってます。UniDicはよく分からなかったのでメールで問い合わせてみたら、登録ユーザが配布元を明記して使うのであればOKという返事を頂けました。ありがたや、ありがたや。

その他の部分でライセンス上の問題がありましたら、右上のフォームかコメントにてご連絡ください。すぐに対応します。謝るとか、泣くとか、削除するとか。

また、この辞書の結果も載せて欲しいという要望があれば、受け付けております。

そのうちユーザ辞書(はてなとか、Wikipedia使ったヤツ)も追加する予定です。

ちなみに形態素解析は先日ちょっと触れたコマンドラインから実行するソースを使ってます。
http://www.mwsoft.jp/programming/src/mecabru.rb

前回掲載時はBOSやEOSのコストを取ってなかったけど、その辺りは修正したので、ちょっとは質が良くなったと思います。相変わらず複数解については未対応だけど。


あと、なんだっけ。作ってる時に何か書こうと思ってたんだけど、忘れてしまった。言葉を覚えて忘れてしまった。