とある数値について、0.0〜1.0の間にいて欲しいのに-0.1とか1.1みたいな値が混ざっていた場合。 続きを読む
2016年07月23日
2016年04月16日
2016年04月13日
LinuxでAmazonの動画を見る
Amazonのプレミアムに入った。理由は見たい映画がタダだったので。
ボビー・フィッシャーを探してとか、This is Itとか、チェンジリングとか、ホビットとか、28週間後とか、レスラーとか、極大射程あたりを見たかった。
あと、スターシップ・トゥルーパーズの2と3とか、遊星からの物体Xとか、レッド・ウォーター/サメ地獄とか、スピーシーズとか、ザ・フライとか、ファイナル・デッドサーキットとか。 続きを読む
2016年01月14日
LinuxでPDFをconcatしたかった
領収書整理の季節。Amazonの領収書をPDFで出力したものが大量にある。これを1枚ずつ印刷するのはたいへんだるいので、結合して1枚のpdfファイルにして印刷したかった。
pdfjamを使えばいけた。
$ sudo apt-get install pdfjam $ pdfjam *.pdf -o output.pdf
2015年12月13日
PyCallで利用するPythonのパスを変えたい
PyCallでnumpyを呼ぼうとしたら、No module named numpyと言われてしまった。
using PyCall @pyimport numpy #=> ERROR: PyError (:PyImport_ImportModule)#=> ImportError('No module named numpy',)
原因はうちの環境ではpythonとpython3コマンドが同居しているのだけど、python3側にしかnumpy等が入っていないせい。 続きを読む
2015年12月12日
2015年08月30日
pip install pycurlがエラーになった
エラーメッセージは下記。 続きを読む
2015年07月13日
今回Xubuntu14.04 再インストール時に打ったコマンド
毎回微妙に変わる気がする。 続きを読む
2015年05月10日
vimでexpandtabを解除する
うちの.vimrc。
set expandtab set tabstop=4
これ、解除したい時はどうするんだっけ、と思って調べたところ、invexpandtabで良いらしい。
set invexpandtab
ちょくちょく使うことがあるのでメモしておく。
2015年04月04日
最近書いたまともな部類の記事
Scala.jsの導入から簡易なサンプルの作成まで
http://www.mwsoft.jp/programming/scala/scala_js_install.html
使ってみたので情報を残しておく。今後も使うかはわからない。合うケースによっては使いたい。あと、Bootstrapの勉強の為にレイアウト新しくしてみる。
mwSoft Tools
http://tool.mwsoft.jp/
同じくBootstrapに慣れようとしてうちのサイトのWebツール的なものを移管してみる。だいぶスマホ対応した感があるけど、うちのサイトはPC率が9割なので対応した意味があるかはわからない。
Siriの機能をOSSで実現できる「Sirius」の作者紹介記事
http://newsit.sblo.jp/article/115852719.html
Siriusについてけっこう調べた。ありものでEnd-to-Endのシステムを作って負荷を調べてFPGAとかで高速化しようみたいなところが焦点で、精度の向上についてはそれほど語られていないけど、これを調べると最近の流行りものがまとめて理解できるという点で触る価値アリだと思った。
RIP Internet Explorer(IEよ安らかに)
http://newsit.sblo.jp/article/115781614.html
IE6もようやく死に絶えて今のIEへの不満はだいぶ減っているところだと思いますが、過去のしがらみ的な互換や歴史的負のイメージと共に火葬されることになったようです。
ホワイトハウスがFacebookからディレクターを引き抜く
http://newsit.sblo.jp/article/115681094.html
OpenIDの主要人物でFacebookでディレクターしている人をホワイトハウスは他にもけっこうIT系の有名な人を雇っているとか。よし、私も有名になって官邸から及びがかかるようにしよう。
Amazonの配達ロボがテスト開始
http://newsit.sblo.jp/article/115431632.html
例の自動操縦ヘリで宅配を実行するドローン。早く飛ばないかなぁ。見たいなぁ。
2015年03月21日
今月書いた中でまともそうな記事
興味を惹かれた英語の記事を読んで、一部だけ翻訳して、調べたことを追記してるだけなんだけど、書いてると驚くほど勉強になる。
高いHDMIケーブルって買う価値あるの?
http://newsit.sblo.jp/article/114612744.html
希望小売価格10万円のHDMIケーブル(2m)とかがあることを初めて知った。。。HDMIの仕様を作っている人的には、そんなの意味ないよねとのこと。
コンピュータの時刻をより正確にしようというお話
http://newsit.sblo.jp/article/114566685.html
NTPの遅延とかも許されないような環境でより正確な時刻を得ようということで、Precision Time Protocolが紹介されていた。初めて知った。
機械学習エンジニアとデータサイエンティストの違いは?
http://newsit.sblo.jp/article/114367787.html
Quoraの質問。まあだいたいこういうイメージだよねという回答だった。
IBMの変容の軌跡
http://newsit.sblo.jp/article/114366161.html
IBMが1911年創業というのを初めて知った。IBMの変化を眺めていると、ITの歴史を追っているような感覚になる。
Lucene5.0がリリースされました
http://newsit.sblo.jp/article/114914956.html
まだ使ってないけどリリースノートとかちゃんと読んで書きました。運用する側には大きい変更だと思うけど、ライトなユーザにはそんなに影響はない変更が多いかな。
.htaccessの便利な記述が並ぶ、.htaccess Snippets
http://newsit.sblo.jp/article/114814078.html
便利だった。
2015年03月15日
メールフォームを直しました
さくらが用意しているデフォルトのcgiを呼ぶようにしただけですが。
SMTPの認証が変わったのが2013年の1月らしいので、かれこれ1年半くらい動かないまま放置されていたことになりますね。こんなことをしてたら仕事が減ってしまう。もう少しちゃんとメンテしないと。
そういえばContact Usって書いてあるけど、今も昔もmwSoftは1人きりの単数形です。
2015年03月10日
昔のFedoraのコードネームの付け方
Fedora21からリリース名が付けられなくなったらしい
http://newsit.sblo.jp/article/114809014.html?1425874094
2015年02月12日
pandasでカラムサイズが一定でないcsv/tsvを読み込む
下記のようなカラムの数が一定でないtsvを読み込みたかった。
105497 101731 90359 107575 105320 76175 96971 95604 109100 72563 105730 109194 96971 95604
2015年02月02日
実践 コンピュータビジョンを読む 1-3 NumPy
http://www.mwsoft.jp/programming/computer_vision_with_python/1_3_numpy.html
2015年01月22日
2015年01月21日
実践 コンピュータビジョンを読む 1-1 PIL
とりあえず1-1 PILのところを読んでサンプルコードを真似ていろいろ書いてみた。
http://www.mwsoft.jp/programming/computer_vision_with_python/1_1_pil.html
このペースでやってたら読み終えるまでに3ヶ月くらいかかかりそう。
2015年01月15日
数式 → コードの例文に正規分布(CDF)追加
http://www.mwsoft.jp/programming/equation/normal_dist_cdf.html
全体
http://www.mwsoft.jp/programming/equation/
今回のは楽な感じで済ませた。そろそろ実技に移りたいのでこのシリーズはこのへんで休止。
2015年01月12日
数式 → コードの例文に最小二乗法(一次)を追加
http://www.mwsoft.jp/programming/equation/least_square_method.html
全体
http://www.mwsoft.jp/programming/equation/
けっこうめんどかった。次はもう少し楽なヤツにしよう。
2015年01月02日
数式 → コードの例文にカイ二乗分布追加
http://www.mwsoft.jp/programming/equation/chi_square_dist.html
全体
http://www.mwsoft.jp/programming/equation/
これをあと20題くらいやれば、基礎的な数式はだいたい理解できるようになる気がする。
2014年12月31日
数式 → コードの例文にポアソン分布追加
http://www.mwsoft.jp/programming/equation/poisson_dist.html
全体
http://www.mwsoft.jp/programming/equation/
だいぶ慣れてきた。SciPyとかで簡単に答え合わせができるのがありがたい。
2014年12月29日
初歩的な数式をプログラムのコードに
http://www.mwsoft.jp/programming/equation/
つもりだったのだが、どう見てもJuliaのステマになっている。なぜこうなったのか。
2014年12月27日
2014年12月26日
今使ってるFirefoxアドオン
先日、他の会社から支給されたPCを自分用にセットアップしようとした時に「自宅で入れてるあのアドオンなんだっけ」的な状態になったので、一覧を更新しておく。 続きを読む
2014年12月21日
JuliaでREPLを使っている時に情報をクリアする方法を探す
IPythonのresetみたいなヤツが理想。
使用バージョンは0.3.3 続きを読む
2014年12月19日
apt-getで入れたpipがなんかエラー吐くようになった
pip installしようとすると、下記のようなエラーを吐くようになった。 続きを読む
2014年12月18日
julia-vimを入れる
vimでJuliaのシンタックスハイライトをしたかったので、julia-vimを入れる。
以下、手順ログ。続きを読む
2014年12月15日
数式をWebで表示する方法を調べかけて途中でやめた
もう少し状況が固まってからちゃんと調べよう。多分、3年後くらいに。
今回調べた内容の途中経過はとりあえず下記にまとめた。
数式をWebで表示する方法を調べる
http://www.mwsoft.jp/programming/nlp/web_math_eq.html
2014年12月09日
matplotlibのfill_betweenの簡易サンプルコード
とりあえず適当に (0.0, 0.1) 〜 (1.0, 0.9) に向かう線を引いてみる。
from matplotlib import pylab as plt import numpy as np intercept = 0.1 coef = 0.8 line = np.linspace( intercept, intercept + 1 * coef, 2 ) plt.plot( line ) plt.ylim( (0, 1.0) ) plt.show()続きを読む
2014年11月26日
pandasのplotで日本語を使う
デフォルトだとtitleとかcolumnsに日本語使うと化けたので、matplotlib.rcで設定してみる。 続きを読む
2014年10月06日
2014年09月15日
Ubuntuでcanopy使うとrequire wxPython >= 2.8的なエラーが出る
ImportError: Matplotlib backend_wx and backend_wxagg require wxPython >=2.8
versionはcanopy1.4.1(64bit)。
続きを読む
2014年08月16日
pythonで日付の加算
なんかよく同じものを書いてる気がしたので貼っておく。
2014/8/1〜8/31までをyyyymmddで出力する例。
from datetime import datetime, timedelta start_dt = datetime(2014, 8, 1) for i in range(0, 31): dt = ( start_dt + timedelta( days = i ) ).strftime( '%Y%m%d' ) print( dt )
2014年08月10日
jodaで直近の日曜を取得する
dt.withDayOfWeek(DateTimeConstants.SUNDAY)
dtが左だった場合、右に変換される。
7/26(Sun) → 7/27(Sun)
7/27(Sun) → 7/27(Sun)
7/28(Mon) → 8/03(Sun)
7/29(Tue) → 8/03(Sun)
前回の日曜日を取りたい、つまり7/28(Sun)なら7/27(Sun)を取りたい場合はどうするか。とりあえず1週減らして取ればいいか。
dt.minusWeeks(1).withDayOfWeek(DateTimeConstants.SUNDAY)
この場合、7/27(Sun)は7/20(Sun)になる。7/27→7/27にしたい場合は、6日減らす感じだろうか。
dt.minusDays(6).withDayOfWeek(DateTimeConstants.SUNDAY)
Java8のTime APIの場合はwithでTemporalAdjusters使うなど書き方が違う。けっこう面倒。
2014年07月19日
Xubuntu14.04のAlt+PrintScreenが動かない
設定マネージャでチャネルのxfce4-keyboard-shortcutsを選択して、Alt + Printが設定されているのを見つける。するとこんなふうに書いてある。
xfce4-screenshooter -w
ちゃんとWindowでコピーはしてくれるような設定になっているようだ。
とりあえずコマンド的には上記で実行可能なので、これを適当なショートカットに割り振ってやる。新規から下記のように登録。
プロパティ : /commands/custom/<Super>Print
データ型 : String
値 : xfce4-screenshooter -w
これでSuper + PrintScreenでとりあえずスクリーンショットは取れるようになった。
Luceneに32bit以上の数のデータを入れてみる
Luceneの検索件数を返すtotalHitsがintだったので32bit以上だとどうなるんだろうと思ってやってみた。 続きを読む
2014年07月05日
Kindleでハイライト共有をオフにする
小説でやられると興醒めするので、下記手順でオフにする。
設定 → 読書オプション → メモとハイライト
ここに「ポピュラー・ハイライト」と「公開メモ」があるので、これをオフにする。
Ubuntuでmp3ファイルの音量を変更する
http://wiki.audacityteam.org/wiki/Lame_Installation#Obtaining_LAME_using_APT_on_the_command_line
$ sudo apt-get install lame libmp3lame0
下記のようなコマンドで実行できる。
$ lame --scale 3 in.mp3 out.mp3
scaleを大きくすれば出力ファイルの音量も上がる。上げ過ぎると歪む。5も上げればけっこう大きくなった感じがする。
2014年06月09日
2014年05月06日
2014年05月05日
Pythonのunicodedataを使ってみる
unicodedataはUnicode正規化ができたり、少し手を入れれば簡易なUnicodeBlock判定ができたりする。 続きを読む
2014年05月04日
Bing Search APIにリクエストしてPDFのURLを集めるPythonのコード
世の中のPDFファイルを少し収集したかったので、5000回までなら無料で検索できる優しいBingさんにお願いすることにした。5000回以上のリクエストは有料。1万回だと1570円、10万回15,699円。商用で使うならアリな値段だけど個人ではちょっと手を出しづらい。
5000回ということは日に150回は検索ができる。個人での情報収集用途なら十分な回数。
とりあえず下記サイトに行って、右側の5,000回無料のところでサインアップ。
http://datamarket.azure.com/dataset/bing/search
サインアップできたら、マイ アカウントのマイ データのところからデモができる。 続きを読む
shellで日曜の時に条件分岐したい
week=`date '+%w'` if [ $week -eq 0 ] ; then echo 日曜日 fi
直近の日曜日の日付も欲しかった。
week=`date '+%w'` sunday=`date -d "-$week days" '+%Y%m%d'`
過去の自分が書いた記事でよく読まれているものを眺める
PVはまともに残してないので、自分が書いた記事ではてなブックマークで50以上になっているものを並べている。数字は当時(多分3月のどこか)のもの。
続きを読む
HDDの情報を全部消去する時のコマンド
間違えると被害甚大なので寝不足の時に使ってはいけない。先日、間違えてsdaと打ちそうになった。
$ sudo dd if=/dev/zero of=/dev/hdx
2014年05月03日
2014年04月20日
青空文庫のデータでword2vecした出力結果のメモ
Wikipediaのデータに続いて、青空文庫のデータ(10,975タイトル、554MB)をword2vecに突っ込んでみた。
青空文庫は普通にgithubに置いてある(https://github.com/aozorabunko/aozorabunko)ので、そこからcloneし、ルビや改頁指定などは除去。タイトル、底本などに関する記述も除去。
ホントはあと1500タイトルほど文書があるはずなんだけど、不要な部分を除去する処理を噛ませた時にうまくいかなかったのをすっ飛ばしたので1万タイトル程度に収まる。
形態素解析時に姓名は連結、カタカナの連続は連結。中黒の前後も連結。動詞は基本形に変換している。 続きを読む
2014年04月18日
Wikipediaのデータでword2vecした出力結果のメモ
ここのところ遅ればせながらword2vecと戯れ中。学習にかかる時間も短いし、うまく使えばいろいろ役に立ちそう。
とりあえずWikipediaのデータを突っ込んだ結果などを。
形態素解析時に、姓と名を連結してみたり、接尾語と接頭語を連結してみたり、カタカナの連続を連結してみたりしている。
以下はdistanceした時の上位。上が入力ワード、下が出力されたワード。 続きを読む
2014年04月13日
日記的なもの
以前の部屋は押入れも台所の収納も無駄に広く、1人暮らしの身ではどれだけモノを詰め込んでいっぱいにはならなかった。そうした状況だと整理整頓をする必要があまり発生せず、ついついいらないものが増えてしまう。
ということで、今回の部屋では「収納スペースを減らす」ことをテーマにした。
収納スペースが限られていれば、そこに入りきらないものは捨てるしかなくなる。これは私の本に対する運用ルールでもある。本は油断するとどんどん増えていって、部屋中を侵食してしまう。侵食が目に余るようになったら「ここに入る分以外は捨てる」というルールのもと、あっちを捨てようか、いやこっちを捨てようかと悩みながら始末を断行する。
幸い、今回の部屋は余計な収納がない。台所の収納も狭く、押し入れもない。そこで可能な限り収納用品を削って、モノを減らすように努めてみた。
続きを読む
2014年04月01日
K2pdfoptでPaperWhite向きのPDFを作る
PDFをKindle PaperWhiteで読む時はK2pdfoptを利用することにした。下記の記事を見て導入した。
http://netbuffalo.doorblog.jp/archives/4332005.html
各種プラットフォームに対応していてLinuxでも動作する。 続きを読む
2014年03月18日
プログラミング言語の擬人化記事(その2)の元ネタ
プログラミング言語擬人化計画2
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002477&vos=dyterssc000000000000
ので、前回と同じく元ネタを貼っておく。
その1はこちら
http://blog.mwsoft.jp/article/82065726.html
続きを読む
2014年03月04日
ITエンジニア向けの女子ファッション用語解説を書く
ITエンジニアのためのファッション用語解説
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002469
ファッション雑誌5冊を1文字も余さず読み込んだり、Web上の用語集や画像を見て勉強したり、知り合いの女性を捕まえてアンケート取ったりと頑張ったんだけど、非プログラマがプログラムの話を書くと少し違和感が出てしまうのと似た類の無理さはあったと思う。
とりあえず今回の企画で良かったことは、下記の商品を見つけられたことだろう。
https://www.google.co.jp/search?site=imghp&tbm=isch&q=Geek+%E3%83%AF%E3%83%83%E3%83%9A%E3%83%B3%E3%82%B9%E3%82%A6%E3%82%A7%E3%83%83%E3%83%88
これは流行る(*´ω`*)
続きを読む
2014年02月27日
libnotifyを使って指定時間にnotifyを表示してみる
データ処理の仕事をしていると「30分後くらいに今やってる処理が終わるから、そしたら出力結果を確認して次の処理を流す」とか「今投げてるクエリが終わるのを待ちつつ次のクエリを書く」といった時間差タスクがけっこう発生する。
別のタスクに手を出してしまうと、ついついそちらに熱中して、前に実行していたタスクのことを忘れてしまうことも多い。
そんな時は、libnotifyを使って指定時間に「そろそろ○○の作業終わったんじゃね?」といったnotifyを表示すれば、前のタスクを忘れずに済む。
続きを読む
2014年01月01日
2013年12月07日
プログラミング言語擬人化計画の元ネタについて
プログラミング言語擬人化計画!|【Tech総研】
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002412
続きを読む
プログラミング言語の擬人化の記事を書く
プログラミング言語擬人化計画!|【Tech総研】
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002412
いい年してこういうものを書くことに抵抗がないのかと言われると、少し悩むところではある。今はトーマス・マンの魔の山を読んでいるので、セテムブリーニから「エンジニア! あなたという人は!」と怒られそうな気がしてならない。ごめんなさい。
続きを読む
2013年11月09日
Kindle Paperwhiteを買ってみる
Kindle Paperwhiteはそういう路線の端末だと思ったので、新モデルが出るのを待って買ってみた。2週間ほど使って見た感じでは、予想に違わず自分向きの良い製品だった。
書籍の揃い以外は。
続きを読む
2013年11月07日
ノートパソコンにMint13を入れたら頻繁にフリーズした
続きを読む
2013年10月20日
【読書感想】死にいたる病
そんな時はキルケゴール先生の本でも読んで、息抜きでもするといい。あなたがそれを何だと思うかは知りませんがね、少なくとも慰みの1つくらいにはなるんじゃないですかね。
続きを読む
2013年10月15日
Cloudera QuickStart VMと戯れ中
VirtualBoxでCloudera QuickStart VM(CDH4)を動かしてみる
http://www.mwsoft.jp/programming/hadoop/cdh4_virtualbox.html
Mint上で動かしてるけど、今のところ動作はすこぶる快調。Ubuntu上で動かしてた時より良い気がする。今後は開発はこれで行こう。
続きを読む
2013年10月05日
Ubuntu12.04 + GnomeClassicでAlt+Tabが効かなかった
続きを読む
2013年10月02日
最近のClouderaさんのプロジェクトを眺める
Solrを組み込んだCloudera Searchやら、高速な処理を可能とするImpalaやら、いろいろと新しい子分が出来て大所帯になっているようだ。とりあえず子分だけ眺めてみる。
続きを読む
2013年07月07日
play eclipse する際に with-source でソースを参照できるようにする
下記のように最初に play コマンドを打ってから、with-srouce 付きで実行したら通った。
$ play
[app_name] $ eclipse with-source=true
[app_name] $ exit
これで F3 でPlayのソースが見れるようになる。
2013年07月06日
Play Framework のデフォルトキャッシュが開発モードですぐ消えるのを解消する
普通はキャッシュにヒットしなければDBなりから取ってくるようになってそうだけど、そうじゃないケースに遭遇すると開発時にちょっと困るので、conf/ehcache.xml にキャッシュの設定を置くことでリロード時にファイルにストアしたり戻したりしてもらうことにする。
続きを読む
2012年09月13日
2012年09月11日
boilerpipeを使ってみる
■概要
HTMLから本文を抽出してSolrに登録する用事があったので、Javaの本文抽出ライブラリを探してみたところ、boilerpipeという子を見つけた。
英語色が強そうだけど、そこそこに精度は出そうに見えたので使ってみた。 続きを読む
2012年07月30日
悪い栄養ドリンクマニアの棚
我ながら酷いと思ったので写真を撮ってみた。 続きを読む
2012年07月22日
2012年07月16日
UbuntuでMeCabやKyTeaを入れてlibなんちゃらがないと言われた時
UbuntuでMeCabやKyTeaをソースからインストールしてコマンドを叩いてみると、こんなエラーが出ることがある。
# MeCabの場合 mecab: error while loading shared libraries: libmecab.so.2: cannot open shared object file: No such file or directory # KyTeaの場合 kytea: error while loading shared libraries: libkytea.so.0: cannot open shared object file: No such file or directory続きを読む
2012年06月06日
2012年04月18日
2012年04月14日
Lucene/Solr3.6リリース - 形態素解析が使えるようになった
今週はAmazonのCloudSearchが発表されたり、Lucene/Solrの3.6がリリースされたりと、全文検索さんとお付き合いしている人たちにはアドレナリンが出やすい1週間でした。
3.6には形態素解析を使ったAnalyzer(Kuromoji)が入るなど、日本人にとっては脳内物質が駆けめぐりやすいリリースになっているようです。β‐エンドルフィン。チロシン。エンケファリン。
とりあえず触ってみたところとかをメモ。 続きを読む
2012年04月04日
in-mapper combiningメモ
子象本くらいは読んでますよ、みたいなところをアピールするためにこんなのを書いてみる。
in-mapper combining(MapReduceデザインパターン)
http://www.mwsoft.jp/programming/hadoop/in_mapper_combining.html
0.23系が触りたい気持ちもありつつ、今仕事で使うとしたら0.20だろうということで地固めに励む。
2012年04月02日
HadoopのWritableに関するメモ
とりあえずHadoopに関するそれっぽい記事をたくさん書くのだ。書くのだ。
HadoopのWritableに関するメモ
http://www.mwsoft.jp/programming/hadoop/writable_memo.html
書くのだ。
2012年03月13日
Kuromojiで日本語WordCount
とりあえずこの辺から。
Hadoop、Scala、Kuromojiで日本語WordCount
http://www.mwsoft.jp/programming/hadoop/scala_ja_word_count.html
今もHadoopは仕事で使ってるけど、それメインというわけではないのでちょっと物足りない。
夏頃までは仕事が埋まってるので、8月か9月にそういう仕事が取れることを目指して、ボチボチやってみよう。
2012年02月21日
MoreLikeThisで遊んでみた
http://www.mwsoft.jp/programming/lucene/more_like_this_wikipedia.html
今週は確定申告の準備をすると言ったな。あれは嘘だ。
いや、ちゃんとやるつもりでCalc開いて入力とかも始めたんですけどね。
気がついたら上のようなものを書いてました。
おかしいなぁ。
2012年02月15日
メモ書き(CDH4 b1とか)
HadoopとLuceneとNutchの名前の由来
http://www.mwsoft.jp/programming/hadoop/where_come_from.html
で、本題。CDH4のベータ版が出たらしいので適当にメモ書き。
続きを読む
2012年02月11日
Solrjのサンプルコードをいろいろ書いてみた
Solrjサンプルコード集
http://www.mwsoft.jp/programming/lucene/solrj.html
けっこう頑張って書きました。でも、今ひとつまだSolrさんの中身を把握しきれてない。情報の変化がけっこう激しいし。
もう少し仲良くなりたい。気兼ねなく休日に誘えるくらい。
「今週末、一緒にMoreLikeThisしに行かない?」
2012年02月07日
Twitter4JでTweetを収集してみる
Twitter4JでTweetを収集してみる
http://www.mwsoft.jp/programming/java/twitter4j.html
GeoLocationが何で検索してるのか良く分からなかったけど、興味ないからいいや。
個人的には「登録してあるユーザとハッシュタグについて今日1日分の情報を収集して、その中に含まれてるリンクを並べて表示」みたいなことをしている。
情報収集ツールとしてはけっこうありがたい。あと、不自然言語好きな人も重宝してそう。
2012年02月03日
プログラマ文庫更新
プログラマ文庫
http://www.mwsoft.jp/column/novel/
原文以上に宗教的になってしまった感があるけど、思った通りなんでもいけそうだということが分かった。
2012年02月02日
Java製形態素解析器「Kuromoji」を試してみる
Java製形態素解析器「Kuromoji」を試してみる
http://www.mwsoft.jp/programming/lucene/kuromoji.html
Luceneの状況とかを見極めてから手を出した方が良かった気もした。すぐに記事の修正が必要になりそうな気がする。
あと、ソースが読みやすかった。
2012年01月30日
lucene-gosenのメモを更新
Java製形態素解析ライブラリ「lucene-gosen」を試してみる
http://www.mwsoft.jp/programming/munou/lucene_gosen.html
次回はKuromojiでUniDic使った解析とかを予定しているので、マニアの皆さんはお楽しみに。
2012年01月27日
JavaのHTTP通信でプロキシを使う
JavaのHTTP通信でプロキシを使う
http://www.mwsoft.jp/programming/java/http_proxy.html
来週はLucene関連で行ってみようと思う。
2012年01月24日
ScalaでRubyのeach_with_indexみたいなループ
ScalaでRubyのeach_with_indexみたいなループ
http://www.mwsoft.jp/programming/scala/scala_zipwithindex.html
これで今週分のノルマ達成。
でも今週分は2本とも内容が浅い気がする。もう1本軽いのを書くべきか、来週に備えて今から重いのを準備すべきか。
2012年01月23日
JavaのRSSライブラリ、ROMEを使ってみる
JavaのRSSライブラリ、ROMEを使ってみる
http://www.mwsoft.jp/programming/java/rome_sample.html
自前でRSS2.0とAtom用のパーサを書いてたらほどほどに疲労したので、ライブラリに頼ることにした。
2012年01月20日
scala.swingを試してみる
scala.swing簡易サンプル
http://www.mwsoft.jp/programming/scala/scala_swing.html
イベントまわりの書き心地は想像していた通りやはり良い。
あと、今回からサイトのレイアウトを少し変えてみた。
IE9、FF10、Chrome16では表示確認したけど、他のブラウザについては知らない。border-radiusとかbox-shadowとか平気で使ってるし。
単純なレイアウトだから読むのに困るような崩れ方はしないと思うのだけど。崩れてないといいなぁ。
2012年01月15日
LuceneのCJKAnalyzerで遊んでみた
Lucene/SolrのCJKAnalyzerをカスタマイズして遊んでみる
http://www.mwsoft.jp/programming/lucene/lucene_custom_cjk.html
良い勉強になった。けど、個人的な要件は今ひとつ満たせなかった感がある。
まぁ、いいか。
2012年01月11日
ScalaのORM、Squerylを試してみる
ScalaのORM、Squerylを試してみる
http://www.mwsoft.jp/programming/scala/squeryl.html
使い心地は悪くないけど、もう少し柔らかい感じの子の方が好きだと思った。
あと、チュートリアルがけっこうしっかりしているのはありがたかった。
とりあえずこれで今週のノルマは達成。意外と軽いな。
今週の内容はちと普通過ぎた感があるので来週はもう少し変態風味に攻めてみたい。
2011年12月10日
2011年11月16日
象さんと戯れ中
http://www.mwsoft.jp/programming/hadoop/
思った処理はだいたい実現できるようになってきたけど、どうすればパフォーマンスが上がるのかとかが今ひとつまだ分かってない。mapred-site.xmlの設定とかもう少し試してみないとな。
あと、4台ほど常時可動させてしまっているので今月の電気代に少し怯えてもいる。EMSも嗜んでいるのでterminateし損ねて高額課金されたりしないかとかにも怯えている。
総じて怯えている。でもやめられない。
象本の第二版を買ったので読みながらもう少し仲良くなってみようと思う。