あー、なんか12月になってますね。今年も終わりか。
先月下旬はいまさらですがHBaseにハマってました。やってることがどんどん裏方の方へ裏方の方へと行っている昨今。あっ、でもLiftもちょっとだけやった。
HBase
HBase を使ってセマンティック Web を実現する方法を探る
http://www.ibm.com/developerworks/jp/opensource/library/os-hbase/?ca=drs-jp
HBaseのイメージをさらっと理解したい時に便利そうな文書。
Facebookが新サービスの基盤にしたのは、MySQLでもCassandraでもなく、HBaseだった
http://www.publickey1.jp/blog/10/facebookmysqlcassandrahbase.html
HBaseの行単位の一貫性の方が、Cassandraの結果整合性より向いていたらしい。この辺は用途によって分かれるところ。個人的には大規模データをシーケンシャルに扱うのと、キー単一で拾うのと両方を使えるとありがたいのでこの子でいいのかなぁと思って勉強中。
Facebook の HBase は、毎月 1350億 メッセージを処理する!
http://agilecat.wordpress.com/2010/11/18/facebook-%E3%81%AE-hbase-%E3%81%AF%E3%80%81%E6%AF%8E%E6%9C%88-1350%E5%84%84-%E3%83%A1%E3%83%83%E3%82%BB%E3%83%BC%E3%82%B8%E3%82%92%E5%87%A6%E7%90%86%E3%81%99%E3%82%8B%EF%BC%81-cloud-cloudcomputing/
頻繁にはアクセスされない、永遠に成長していくデータ・セットってのは厄介だよね。
[Hadoop]複数ディスクを使って効率の良い処理
http://shun0102.net/?p=75
MapReduceをHDD1個と2個の時で比較したら、50%ほど速くなったそうな。処理にもよるだろうけど、やはりHadoop使う際はHDD4台構成が良いのかな。
Programming
MalformedなHTMLに戦わずして勝利しテキストを抜き出す方法
http://subtech.g.hatena.ne.jp/y_yanbe/20101127/1290923676
w3mを使って1行でスクレイピングする方法。ちょっと情報を取ってきたいと思った時に便利そう。
Igo - a morphological analyzer
http://igo.sourceforge.jp/
MeCab互換のJava製形態素解析ソフト。導入がいささか面倒なSenの代わりに使ってみるのもアリかも。
漢(オトコ)のコンピュータ道: 大人のためのInnoDBテーブルとの正しい付き合い方。
http://nippondanji.blogspot.com/2010/09/innodb.html
varcharよりcharとか、UPDATEよりDELETE INSERTとかは今の時代には通用しないとか。
UnicodeとUTF-8の違いは?
http://d.hatena.ne.jp/tyru/20091129/difference_between_unicode_and_utf8
けっこう詳しく説明してある。サロゲートペアとかBOMとか説明しづらい内容が、文字だけでけっこう解りやすく書かれていて感心した。
米Yahoo!で議論された、フロントエンドエンジニアリングの将来
http://www.publickey1.jp/blog/10/yahoo_1.html
「あらゆる期待に反して、JavaScriptは世界でもっとも重要なプログラミング言語に」なったそうです。JavaScriptは私が使ったことがある言語の中で、書いている時に私の邪魔をすることが最も少ない言語だと感じている。こう表現したいと思えば、文法に阻害されることなくそう表現できる。その部分は悪くないと思っておこう。ふんっ。
Google WaveがApacheプロジェクトの候補に
http://www.itmedia.co.jp/news/articles/1011/25/news025.html
どうやら一命を取り留めたようで。
Life
河野太郎公式サイト | 経産省が隠蔽した文書の全文
http://www.taro.org/2010/11/post-857.php
隠蔽とかそういうところは置いておいて、普通に良い文章だと思ったので貼っておく。何事も長所進展の方がうまくいくと思うのですよ。
Androidに情報流出の脆弱性が見つかる パッチは開発中
http://www.itmedia.co.jp/enterprise/articles/1011/25/news027.html
先月あたりから注目していたAndroidの脆弱性のニュース。それなりに危険な脆弱性だけど、さて、どの程度で各キャリアは対応するか。
ITmedia ライブガイド/ニコ生、Ustreamの厳選動画番組表
http://www.itmedia.co.jp/live/
そうそう、前に言ってたWebの動画番組表の話は、こういうのをイメージしていた。
触って分かった:「LuvPad」徹底検証――高性能Androidタブレットの実力
http://plusd.itmedia.co.jp/pcuser/articles/1011/22/news043.html
LuvPadはルート権限持ってやりたいようにやるのが望みの人向け。欲しいけど、もう少し環境が整うまで待ちかな。
宮内庁のHPからリンクを駆使してエロサイト行こうぜwwwwww
http://bipblog.com/archives/1593679.html
人間の探索能力の一面が見られる試み。このリンクはいけそうだと脳が判断できるのは、ものすごい大量のパターンを蓄積していて、そこから繋がり易いかとかを測ってるんだろうか。