2010年12月16日

Nutchで指定URLだけFetch

しばらくNutch週間。

今回はリンクを辿らずInjectしたURLだけFetchするという、「それはNutchの仕事か?」と思えるような微妙な処理をするための設定を探ってみた。

http://www.mwsoft.jp/programming/nutch/inject_crawl.html

そんなことをしていたらいつの間にか3時を過ぎていた。もう寝なければ・・・