Mahoutのseqdirectoryとseq2sparseを使って文書クラスタリング
http://www.mwsoft.jp/programming/mahout/text_clustering1.html
コマンドを使って日本語文書をクラスタリングする方法を確認した。
MahoutのIDMigratorを使ってみる
http://www.mwsoft.jp/programming/mahout/id_migrator.html
IDを振るときに使うかもと思ったので確認した。
ScalaのRegexParsersを使ってみる
http://www.mwsoft.jp/programming/scala/regexparsers.html
Parser combinatorさんとは今まで疎遠だったので仲良くなろうとしてみた。