辞書を作成するあたりの資料とか、一般ユーザ(学生さんとか非プログラマの利用者さんとか)向けの説明というのは割と少ないし。
章立てはこんな感じか。
- 形態素解析とは(10p)
- 形態素解析とは
- 形態素解析の利用例
- MeCabのインストール(20p)
- Windows
- Cygwin
- CentOS
- Ubuntu
- 辞書のインストール(10p)
- IPA
- NAIST
- UniDic
- デフォルト辞書の設定(mecabrc)
- ライセンスについて
- 形態素解析の実行(20p)
- 標準出力
- 出力フォーマットの変更
- ファイル出力
- 制限付き解析
- コマンドライン引数一覧(20p)
- 辞書の指定
- 辞書情報の出力
- NBest
- 結果のダンプ
- BOS/EOS
- 未知語フォーマット
- 辞書の追加(15p)
- ユーザ辞書の追加
- ユーザ辞書を利用した形態素解析
- システム辞書への追加
- コスト計算(20p)
- コストの仕組み
- コスト計算の実演
- 未知語について
- 辞書のカスタマイズ(20p)
- dicrc
- unk.def
- char.def
- rewrite.def
- matrix.def
- コーパスからの学習(15p)
- IPA modelを利用した再学習
- コーパスを利用して1から学習する
- 辞書を自作する(20p)
- dicrcを記述する
- 各defファイルを記述する
- CSV辞書ファイル
- 辞書の生成
- プログラムからの利用(20p)
- Ruby
- Python
- Perl
- Java
- RMeCab
- C++
- マルチスレッド下での利用
- ソフト分かち書き
おー、なんかそれっぽい。
来月から暇になるし、気が向いたら企画だけでも出してみるかな。