2014年12月01日

日記的なもの

胃腸風邪でダウンする。最近、没頭し過ぎると身体のどこかにガタが来る。

これが年齢というヤツだろうか。難儀な話だ。もっと気楽に没頭したいのに。


健康維持の対策はした。

体温を高い状態で保つのが基本なので、腹巻きと布団を購入する。胃腸風邪には何度もやられているので、腹部の体温維持を重要課題として認識している。

ケトルを買う。何か飲みたいと思った時にすぐにお湯が出るように。

水筒を買う。保温性の高いヤツ。温かいお茶を入れて職場に持っていき、ちびちびと飲んでいる。温かいものを飲むと体温を手軽に上げることができる。

ヨガのコースにも通うことにした。会社の近くにあるので通う手間は少ない。免疫力の向上には効果があると言われているのでそれを期待してのことだが、効果がどの程度あるかはわからない。ただ、やってみて肩こりには効くことはわかったので、免疫の問題が解決されなくても週2くらいでは通いそう。

ここまでやれば、少しは効果が出てくれるのではないだろうか。でなければやり方を再検討する必要がある。



最近知り合った人と高尾山に行く。不思議なほど楽しかった。

自分は基本、1人で好きなように歩いて好きなところに顔を出すのを好んでいるのだが、おそらく私と同じように好奇心旺盛な人で、2人でいることによる相乗的な発見や行動があったことが良かったのではないだろうか。

他人といることのメリットは、自分では得られない発想や行動にあると思う。ただ、その発想の方向性が自分の希望と離れ過ぎていると、良い結果は生まない。

よほど相性が良いのだろうか。経過を観察する必要がある。



ここのところ本をそれなりの冊数読んでいる。けど、読書というのは冊数やページ数で量が把握できるものでもない。

何度も読み返しながら1ヶ月かけてようやく読み終えられる本もあるし、2時間くらいかけて読めてしまう本もある。どちらが良いとかの問題でもなく、どちらも必要な本ではある。どちらも積み上げないといけない。

今は簡単な本ばかり読んでいる。そういう時期があっても良いだろう。基礎を固めて、応用に手を出して、弾き返されて、もう一度基礎。そんな感じ。



2014年10〜11月の進捗

2ヶ月ぶりの更新だというのにいろいろ出来てない。もっと真面目に生きよう。

1. pandasと親しむ

だいたい覚えたので終了。次はちょっとだけJuliaの現状を調べてみる。

下記はアウトプット。もう少し増やしたかったが時間が今ひとつ取れてない。やり方を変える必要があるか。
http://www.mwsoft.jp/programming/numpy/

2. 論文とか資料を読む

Practical Lessons from Predicting Clicks on Ads at Facebook
https://www.facebook.com/publications/329190253909587/

decision tree + linear classifyを利用している。featureの数と評価する回数を考えればdecision treeが効果的だろうなとは思っていたので、このやり方はしっくりきた。オンライン学習を交えてとかは手間が掛かり過ぎるので読み飛ばした。

down samplingは10%くらいが良いらしい。特徴量が資料よりももっと少なければ1%まで下げてもそんなに劣化しないと思ってる。

Web Scale Bayesian Click Through Rate Prediction for Sponsored Search Advertising in Microsoft’s Bing Search Engine
http://research.microsoft.com/pubs/122779/adpredictor%20icml%202010%20-%20final.pdf

こういうのができる人間にならないといけんのだけどできてない。

最適化超入門
http://www.slideshare.net/tkm2261/ss-42149384

全80ページ。こういうのがあらかた理解できてないといけないのだけど、半分以上わかってない。

3. 読書

a. ヤバイ統計学

kindleで統計で検索して出てきたから読んでみる。中身は読み物。タイトルは多分釣り。統計の勉強ができる本ではない。ちょっと書き方がクドいかなと思ったけど、こうした分野の話に対して免疫がない人にとっては、これくらいの書き方の方が良いのだろうか。

人に説明する際に「アメリカではこういう事例があってね」的な例として出す為の例文集として考えると、悪くないと思う。

b. リナックスの革命 ― ハッカー倫理とネット社会の精神

前に買って途中まで読んで忘れてた。原著の出版が2001年。10年以上昔の本。

ITでは10年も経つと多くの常識が変わってしまい、本の大半が約立たずな存在に変わったりするものだが、ハッカー倫理という考えについては10年やそこらで大きく変わるものでもないことがわかる。

c. フリーソフトウェアと自由な社会

これも途中まで読んで忘れていたのでちゃんと読み終えておく。感想は後述。

d. データ分析の教科書

QC7つ道具とかが出てくる系。エンジニア向けではない。前になんかの資格でこれに似たの勉強した気がする。

e. Python Data Visualization Cookbook

序盤はcsvやjsonの読み込み方から始まる。こう書いたらこういう表示になるよ的なサンプルが並んでいる。画像使ったり白地図の上にplotしたりもする。こんなことできるんだふーんと言いながら眺めるには良い本かもしれない。でもこの内容なら必要になった時に個別にググった方が良いよねと思う人も多そう。

f. 東大准教授に教わる「人工知能って、そんなことまでできるんですか?」

人工知能に関する対談。エンジニア向けではなく、一般向け。マトリックスとかマイノリティレポートとかトランセンデンスとか、映画を例にしている表現が多い。映画のタイトルはいっぱい覚えられる。文章として面白かった。後半、現実から離れた未来の話になってたところは読み飛ばしたけど。

g. 現場ですぐ使える時系列データ分析

時系列データについてはまったくの素人なので、書いてあることがわからなくて苦労した。多分、今もわかっていない。とりあえず言葉は覚えたので、あとは仕事とかで出てきた時に活かせるところは活かしたい。

h. DSP/RTBオーディエンスターゲティング入門

仕事なので。

だいたい自分の感覚に合ったことが書かれていて、ところどころ具体的な数値(多少改変されてはいるのだろうけど)が思っているのと違う形をしていたので、その辺りはぼちぼち検証していきたい。

4. 映画を観る

週に1本、映画を観ることにした。

a. Identity

豪雨でモーテルに閉じ込められた男女が1人ずつ殺されていく系の低予算サスペンス映画。

シナリオは途中までは概ね予想できたが、ラストのオチまでは気が回らず。そうか、そう来たか。言われてみればそういう前振りがされてたな。

展開を予想しながら見れる映画というのは割と好き。低予算映画も好き。

b. Basic - 閉ざされた森

セットはそれほどお金はかかってないと思うけど、ジョン・トラボルタやサミュエル・L・ジャクソンを使っているのでそれなりに予算はかかってそう。

証言から真実を引き出そうとするサスペンスものだけど、証言の中に嘘が多過ぎて展開の予測は難しい。観客を騙してどんでん返しを何度も味合わせるのが主眼とされているのではないだろうか。

ただラストは回収してない伏線を考えれば予想できたように思う。途中の二転三転で「どうせまた嘘だろ」と考えることを放棄して見てたので予測できなかったけど。

c. 狼の死刑宣告

シナリオは単純で細部はそんなに寝られてないので、深く考えずにケヴィン・ベーコンの演技を味わってればOKな作品。

ええ、私は大好きです。ケヴィン・ベーコン。



読書感想 - フリーソフトウェアと自由な社会

RMSがフリーソフトウェアの概念についていろいろ語っているエッセイをまとめた本。

本書の中には下記に類似した言葉がよく出てくる。

次のMotifやQtが現れたとき、これらの雑誌は、プログラマたちに離れよと警告を発するのだろうか、それともそれらの広告を掲載するのだろうか。


現実問題として、非フリーのソフトが入り込んだことで、gifとかもそうだけど多くの問題が起きてきており、注意してないとまた同じ問題が起きるだろう的な話。まあ、これからも起きるだろうなとは思う。

あとは有名どころだと、GNU/Linuxという呼び名のお話。

「Linux」という用語は、初めて登場して以来、協力の自由を支持するわけではない思想と結び付けられてきた。業界がこの名前を使う頻度が高まるにつれ、私達はこの言葉とコミュニティ精神を結びつけるのが難しくなっていくだろう。(中略)人々は「Linuxの人気」の名のもとに非フリーソフトウェアを追加することを正当化する。つまり、自由よりも人気に高い価値を置いているのだ。


「仕事」が本当に終わったら、そしてクレジット以外に失うものがなくなったら、クレジットなどなくなるに任せたほうが賢明だろう。しかし、私達はまだその段階には達していない。


IT関連の法律は現場の理解もなく怪しいものが多いし、フリーと非フリーの間で問題が起きたり、特許が進歩を阻害しまくっている問題もある。誰かがそれに対して活動はせにゃならん中で、RMSが行った活動というのは理想主義が過ぎると言われつつも、かなり大きな成功を収めているところは実に興味深いことだと思う。

自分が書いたコードにGPSv3を使うかと言われれば、それはまた別の話として。



2014年12月の予定

1. Juliaを使えるようになる

今やろうとしていることについて、実はPythonよりJuliaの方が適切である可能性があるので、今のうちに触れておく。

本格的にやるかどうかは今後考えていく。全然関係ない話だけど、この前カラオケに行った時にチェッカーズ歌った。

2. 論文とか資料を読む

いつもどおり。

3. 読書

Kindleに3冊ほど積んであるのでとりあえずそれを読む。ちょっと統計は離れて一般的なところを。

4. 映画を観る

単調な生活を続けていると老化が早くなるので、なんらかの刺激を入れようという試み。レビューとかの評判も良さそうなのを週に1本借りてみる。