2012年02月15日

メモ書き(CDH4 b1とか)

まずはさっき書いた記事をブログに貼り忘れてたので気持ち的に貼っておく。

HadoopとLuceneとNutchの名前の由来
http://www.mwsoft.jp/programming/hadoop/where_come_from.html


で、本題。CDH4のベータ版が出たらしいので適当にメモ書き。

とりあえず大きな変化として、Hadoopのバージョンが0.23になっているらしい。

CDH Version and Packaging Information
https://ccp.cloudera.com/display/DOC/CDH+Version+and+Packaging+Information

New Features in CDH4
https://ccp.cloudera.com/display/CDH4B1/New+Features+in+CDH4


0.23は、NameNodeが単一障害点になってたのが解消されるとか、MapReduce2になるとか。

これが今後主流になりそうなバージョンに見えるけど、個人的にはElasticMapReduceで使えるようにならないと本格的に参入というのも難しいので、Amazonさんの動向待ちというステータスにしておく。


ところでHadoopのバージョンってややこしいよね。0.20が1.0で、CDHでは0.21と0.22を飛ばして0.23が採用されて、あと0.22は0.23より後にリリースされたとか、1.0より0.22や0.23の方が新しいとか。

うん、自分で言っていて意味が分からなくなってきた。そういえば0.22と0.23はどういう立ち位置なんだっけ。


軽く調べてみたけど、とりあえず混沌としていることは分かったので、深くは触れずに落ち着くのを待つことにしよう。

hadoopのバージョン表記について
http://d.hatena.ne.jp/shiumachi/20111230/1325234679

Apache Hadoopの1.0のアップデート
http://www.cloudera.co.jp/hadoop/column/apache-hadoop-1-update.html

上記リンクの「2002年、(うまくいけば)正常に戻る」の文字が輝いて見えた。