2016年07月23日

numpyで数値が指定範囲にいない場合に、指定範囲のmin/maxに置き換えたい

とある数値について、0.0〜1.0の間にいて欲しいのに-0.1とか1.1みたいな値が混ざっていた場合。 続きを読む

2016年04月16日

Scalaでfoo:1.0のような文字列を分割してtupleに

下記のような文字列があったとする。

"foo:1.0"

これを foo(String)と1.0(Double)に分けたかった。 続きを読む

2016年04月13日

LinuxでAmazonの動画を見る

Amazonのプレミアムに入った。理由は見たい映画がタダだったので。

ボビー・フィッシャーを探してとか、This is Itとか、チェンジリングとか、ホビットとか、28週間後とか、レスラーとか、極大射程あたりを見たかった。

あと、スターシップ・トゥルーパーズの2と3とか、遊星からの物体Xとか、レッド・ウォーター/サメ地獄とか、スピーシーズとか、ザ・フライとか、ファイナル・デッドサーキットとか。 続きを読む

2016年01月14日

LinuxでPDFをconcatしたかった

領収書整理の季節。Amazonの領収書をPDFで出力したものが大量にある。これを1枚ずつ印刷するのはたいへんだるいので、結合して1枚のpdfファイルにして印刷したかった。

pdfjamを使えばいけた。

$ sudo apt-get install pdfjam

$ pdfjam *.pdf -o output.pdf

2015年12月13日

PyCallで利用するPythonのパスを変えたい

PyCallでnumpyを呼ぼうとしたら、No module named numpyと言われてしまった。

using PyCall
@pyimport numpy

  #=> ERROR: PyError (:PyImport_ImportModule) 
  #=> ImportError('No module named numpy',)

原因はうちの環境ではpythonとpython3コマンドが同居しているのだけど、python3側にしかnumpy等が入っていないせい。 続きを読む

2015年12月12日

Juliaでimportする時に別名は付けられるか

Pythonだとこう書くヤツ。

import numpy as np

バージョン0.4.2現在、Juliaではasのような文法は用意されてないらしい。 続きを読む

2015年08月30日

pip install pycurlがエラーになった

エラーメッセージは下記。 続きを読む

2015年07月13日

2015年05月10日

vimでexpandtabを解除する

うちの.vimrc。

set expandtab
set tabstop=4

これ、解除したい時はどうするんだっけ、と思って調べたところ、invexpandtabで良いらしい。

set invexpandtab

ちょくちょく使うことがあるのでメモしておく。

2015年04月04日

最近書いたまともな部類の記事

Scala.jsとかはけっこう時間かけて調べた。



Scala.jsの導入から簡易なサンプルの作成まで
http://www.mwsoft.jp/programming/scala/scala_js_install.html

使ってみたので情報を残しておく。今後も使うかはわからない。合うケースによっては使いたい。あと、Bootstrapの勉強の為にレイアウト新しくしてみる。



mwSoft Tools
http://tool.mwsoft.jp/

同じくBootstrapに慣れようとしてうちのサイトのWebツール的なものを移管してみる。だいぶスマホ対応した感があるけど、うちのサイトはPC率が9割なので対応した意味があるかはわからない。



Siriの機能をOSSで実現できる「Sirius」の作者紹介記事
http://newsit.sblo.jp/article/115852719.html

Siriusについてけっこう調べた。ありものでEnd-to-Endのシステムを作って負荷を調べてFPGAとかで高速化しようみたいなところが焦点で、精度の向上についてはそれほど語られていないけど、これを調べると最近の流行りものがまとめて理解できるという点で触る価値アリだと思った。



RIP Internet Explorer(IEよ安らかに)
http://newsit.sblo.jp/article/115781614.html

IE6もようやく死に絶えて今のIEへの不満はだいぶ減っているところだと思いますが、過去のしがらみ的な互換や歴史的負のイメージと共に火葬されることになったようです。



ホワイトハウスがFacebookからディレクターを引き抜く
http://newsit.sblo.jp/article/115681094.html

OpenIDの主要人物でFacebookでディレクターしている人をホワイトハウスは他にもけっこうIT系の有名な人を雇っているとか。よし、私も有名になって官邸から及びがかかるようにしよう。



Amazonの配達ロボがテスト開始
http://newsit.sblo.jp/article/115431632.html

例の自動操縦ヘリで宅配を実行するドローン。早く飛ばないかなぁ。見たいなぁ。

2015年03月21日

今月書いた中でまともそうな記事

例のサイト、なにげに更新が続いているのでまともに書けた感がある記事だけ紹介。

興味を惹かれた英語の記事を読んで、一部だけ翻訳して、調べたことを追記してるだけなんだけど、書いてると驚くほど勉強になる。



高いHDMIケーブルって買う価値あるの?
http://newsit.sblo.jp/article/114612744.html

希望小売価格10万円のHDMIケーブル(2m)とかがあることを初めて知った。。。HDMIの仕様を作っている人的には、そんなの意味ないよねとのこと。



コンピュータの時刻をより正確にしようというお話
http://newsit.sblo.jp/article/114566685.html

NTPの遅延とかも許されないような環境でより正確な時刻を得ようということで、Precision Time Protocolが紹介されていた。初めて知った。



機械学習エンジニアとデータサイエンティストの違いは?
http://newsit.sblo.jp/article/114367787.html

Quoraの質問。まあだいたいこういうイメージだよねという回答だった。



IBMの変容の軌跡
http://newsit.sblo.jp/article/114366161.html

IBMが1911年創業というのを初めて知った。IBMの変化を眺めていると、ITの歴史を追っているような感覚になる。



Lucene5.0がリリースされました
http://newsit.sblo.jp/article/114914956.html

まだ使ってないけどリリースノートとかちゃんと読んで書きました。運用する側には大きい変更だと思うけど、ライトなユーザにはそんなに影響はない変更が多いかな。



.htaccessの便利な記述が並ぶ、.htaccess Snippets
http://newsit.sblo.jp/article/114814078.html

便利だった。

2015年03月15日

メールフォームを直しました

さくらのSMTPの仕様変更依頼ずっと動かなくなっていたメールフォーム(左上のContact Usのところとかのヤツ)ですが、そろそろ新しい仕事の依頼が舞い込んで欲しくなってきたので、とりあえず送信できる状態にまで回復させました。

さくらが用意しているデフォルトのcgiを呼ぶようにしただけですが。

SMTPの認証が変わったのが2013年の1月らしいので、かれこれ1年半くらい動かないまま放置されていたことになりますね。こんなことをしてたら仕事が減ってしまう。もう少しちゃんとメンテしないと。

そういえばContact Usって書いてあるけど、今も昔もmwSoftは1人きりの単数形です。

2015年03月10日

昔のFedoraのコードネームの付け方

Fedora21から一旦リリースのコードネームがなくなったのだけど、それ以前のコードネームの付け方をわかってなかったので調べて記事にしてみた。

Fedora21からリリース名が付けられなくなったらしい
http://newsit.sblo.jp/article/114809014.html?1425874094

2015年02月12日

pandasでカラムサイズが一定でないcsv/tsvを読み込む

下記のようなカラムの数が一定でないtsvを読み込みたかった。

105497

101731	90359	107575
105320	76175	96971	95604	109100	72563	105730	109194   

96971	95604

続きを読む

2015年02月02日

実践 コンピュータビジョンを読む 1-3 NumPy

ようやく1-3まで来た。pickleに関する話は別にここで扱う内容でもないので飛ばしている。
http://www.mwsoft.jp/programming/computer_vision_with_python/1_3_numpy.html

日記的なもの

先月は前半はよく勉強できていたものの、月末に忙しくなり手が止まる。

生活していくためだ。致し方なし。



続きを読む

2015年01月21日

実践 コンピュータビジョンを読む 1-1 PIL

画像処理を学びたくて実践コンピュータビジョンを読んでる。

とりあえず1-1 PILのところを読んでサンプルコードを真似ていろいろ書いてみた。

http://www.mwsoft.jp/programming/computer_vision_with_python/1_1_pil.html

このペースでやってたら読み終えるまでに3ヶ月くらいかかかりそう。

2015年01月15日

数式 → コードの例文に正規分布(CDF)追加

正規分布(CDF)
http://www.mwsoft.jp/programming/equation/normal_dist_cdf.html

全体
http://www.mwsoft.jp/programming/equation/

今回のは楽な感じで済ませた。そろそろ実技に移りたいのでこのシリーズはこのへんで休止。

2015年01月12日

2015年01月02日

数式 → コードの例文にカイ二乗分布追加

カイ二乗分布
http://www.mwsoft.jp/programming/equation/chi_square_dist.html

全体
http://www.mwsoft.jp/programming/equation/

これをあと20題くらいやれば、基礎的な数式はだいたい理解できるようになる気がする。

2014年12月31日

数式 → コードの例文にポアソン分布追加

ポアソン分布
http://www.mwsoft.jp/programming/equation/poisson_dist.html

全体
http://www.mwsoft.jp/programming/equation/

だいぶ慣れてきた。SciPyとかで簡単に答え合わせができるのがありがたい。

2014年12月29日

初歩的な数式をプログラムのコードに

数式アレルギーを直す為に、簡単な数式をJuliaのコードに直して実行する記事を書いてみた
http://www.mwsoft.jp/programming/equation/

つもりだったのだが、どう見てもJuliaのステマになっている。なぜこうなったのか。

2014年12月27日

青空文庫のテキストファイルをまとめてダウンロードする

自然言語処理の業界ではそこそこ使われている青空文庫。

青空文庫の内容はgithubから落とせる。

https://github.com/aozorabunko/aozorabunko 続きを読む

2014年12月26日

今使ってるFirefoxアドオン

先日、他の会社から支給されたPCを自分用にセットアップしようとした時に「自宅で入れてるあのアドオンなんだっけ」的な状態になったので、一覧を更新しておく。 続きを読む

2014年12月21日

JuliaでREPLを使っている時に情報をクリアする方法を探す

IPythonのresetみたいなヤツが理想。

使用バージョンは0.3.3 続きを読む

2014年12月19日

apt-getで入れたpipがなんかエラー吐くようになった

pip installしようとすると、下記のようなエラーを吐くようになった。 続きを読む

2014年12月18日

julia-vimを入れる

vimでJuliaのシンタックスハイライトをしたかったので、julia-vimを入れる。

以下、手順ログ。続きを読む

2014年12月15日

数式をWebで表示する方法を調べかけて途中でやめた

とりあえずMathJax読み込んでMathMLを使えばいいか的な気持ちになったけど、今後もそれでいいかよくわからなかったので調査中断。

もう少し状況が固まってからちゃんと調べよう。多分、3年後くらいに。

今回調べた内容の途中経過はとりあえず下記にまとめた。

数式をWebで表示する方法を調べる
http://www.mwsoft.jp/programming/nlp/web_math_eq.html

2014年12月09日

matplotlibのfill_betweenの簡易サンプルコード

とりあえず適当に (0.0, 0.1) 〜 (1.0, 0.9) に向かう線を引いてみる。

from matplotlib import pylab as plt
import numpy as np

intercept = 0.1
coef = 0.8
line = np.linspace( intercept, intercept + 1 * coef, 2 )
plt.plot( line )
plt.ylim( (0, 1.0) )
plt.show()
続きを読む

2014年12月01日

日記的なもの

胃腸風邪でダウンする。最近、没頭し過ぎると身体のどこかにガタが来る。

これが年齢というヤツだろうか。難儀な話だ。もっと気楽に没頭したいのに。
続きを読む

2014年11月26日

pandasのplotで日本語を使う

デフォルトだとtitleとかcolumnsに日本語使うと化けたので、matplotlib.rcで設定してみる。 続きを読む

2014年10月06日

日記的なもの

仕事漬けの日々。

ようやくデータが揃ってきて分析らしい仕事ができるようになってきたので(これまでは開拓しては失敗しての繰り返しだった……)、休日も休まずにあれこれ数字を見て楽しんでいる。

溺れそう。
続きを読む

2014年09月15日

Ubuntuでcanopy使うとrequire wxPython >= 2.8的なエラーが出る

Pythonによるデータ分析入門を買ったのでcanopyを試してみたところ、pylabを使うところで下記のようなエラーが出る。

ImportError: Matplotlib backend_wx and backend_wxagg require wxPython >=2.8

versionはcanopy1.4.1(64bit)。
続きを読む

2014年08月16日

pythonで日付の加算

なんかよく同じものを書いてる気がしたので貼っておく。

2014/8/1〜8/31までをyyyymmddで出力する例。

from datetime import datetime, timedelta

start_dt = datetime(2014, 8, 1)
for i in range(0, 31):
  dt = ( start_dt + timedelta( days = i ) ).strftime( '%Y%m%d' )
  print( dt )

2014年08月10日

jodaで直近の日曜を取得する

下記のような書き方ができる。

dt.withDayOfWeek(DateTimeConstants.SUNDAY)

dtが左だった場合、右に変換される。

7/26(Sun) → 7/27(Sun)
7/27(Sun) → 7/27(Sun)
7/28(Mon) → 8/03(Sun)
7/29(Tue) → 8/03(Sun)

前回の日曜日を取りたい、つまり7/28(Sun)なら7/27(Sun)を取りたい場合はどうするか。とりあえず1週減らして取ればいいか。

dt.minusWeeks(1).withDayOfWeek(DateTimeConstants.SUNDAY)

この場合、7/27(Sun)は7/20(Sun)になる。7/27→7/27にしたい場合は、6日減らす感じだろうか。

dt.minusDays(6).withDayOfWeek(DateTimeConstants.SUNDAY)

Java8のTime APIの場合はwithでTemporalAdjusters使うなど書き方が違う。けっこう面倒。

2014年07月19日

Xubuntu14.04のAlt+PrintScreenが動かない

他のショートカットと設定がぶつかってるらしい。

設定マネージャでチャネルのxfce4-keyboard-shortcutsを選択して、Alt + Printが設定されているのを見つける。するとこんなふうに書いてある。

xfce4-screenshooter -w

ちゃんとWindowでコピーはしてくれるような設定になっているようだ。

とりあえずコマンド的には上記で実行可能なので、これを適当なショートカットに割り振ってやる。新規から下記のように登録。

プロパティ : /commands/custom/<Super>Print
データ型 : String
値 : xfce4-screenshooter -w

これでSuper + PrintScreenでとりあえずスクリーンショットは取れるようになった。

Luceneに32bit以上の数のデータを入れてみる

Luceneの検索件数を返すtotalHitsがintだったので32bit以上だとどうなるんだろうと思ってやってみた。 続きを読む

2014年07月05日

Kindleでハイライト共有をオフにする

Kindleで読んでいる本には、他のユーザがハイライトした箇所に、何人がハイライトしています的な注釈が入ることがある。

小説でやられると興醒めするので、下記手順でオフにする。

設定 → 読書オプション → メモとハイライト

ここに「ポピュラー・ハイライト」と「公開メモ」があるので、これをオフにする。

Ubuntuでmp3ファイルの音量を変更する

lameを使う

http://wiki.audacityteam.org/wiki/Lame_Installation#Obtaining_LAME_using_APT_on_the_command_line

$ sudo apt-get install lame libmp3lame0

下記のようなコマンドで実行できる。

$ lame --scale 3 in.mp3 out.mp3

scaleを大きくすれば出力ファイルの音量も上がる。上げ過ぎると歪む。5も上げればけっこう大きくなった感じがする。

2014年06月09日

日記的なもの

頭の体力の衰えが激しい。短時間の考える能力は特に衰えた感じはしない。詰将棋などのトレーニングで逆に良くなっているようにも感じる。

ところが長時間の作業になると、途中からどうにも頭が回らなくなる。疲労した状態が続くと8時間寝ても回復しない。これは将棋のプレイヤーも良く言っていることなので、人間の脳の傾向がそうなっているのだろう。

それでも自分自身の取り扱い方はうまくなっているので、そのアドバンテージと蓄積された知識を活かせば、まだ当面は問題ないレベルは保てるはずだが。



続きを読む

2014年05月06日

libnotifyとatによる1人時間差進捗管理

連休に入ってから15本目の投稿。これはポメラじゃなく前のPCのメモに残っていた文章。


続きを読む

紙の書籍、電子書籍、自炊 どれが失われやすいか考える

引き続きポメラの中身の整理中。これは内容的にだいぶ昔に書いたヤツだと思う。



続きを読む

2014年05月05日

Pythonのunicodedataを使ってみる

unicodedataはUnicode正規化ができたり、少し手を入れれば簡易なUnicodeBlock判定ができたりする。 続きを読む

2014年05月04日

Bing Search APIにリクエストしてPDFのURLを集めるPythonのコード

世の中のPDFファイルを少し収集したかったので、5000回までなら無料で検索できる優しいBingさんにお願いすることにした。5000回以上のリクエストは有料。1万回だと1570円、10万回15,699円。商用で使うならアリな値段だけど個人ではちょっと手を出しづらい。

5000回ということは日に150回は検索ができる。個人での情報収集用途なら十分な回数。

とりあえず下記サイトに行って、右側の5,000回無料のところでサインアップ。
http://datamarket.azure.com/dataset/bing/search

サインアップできたら、マイ アカウントのマイ データのところからデモができる。 続きを読む

shellで日曜の時に条件分岐したい

week=`date '+%w'`
if [ $week -eq 0 ] ; then
  echo 日曜日
fi

直近の日曜日の日付も欲しかった。

week=`date '+%w'`
sunday=`date -d "-$week days" '+%Y%m%d'`

Arch Linuxをインストールした時に打ったコマンドのメモ

Archを入れた際にメモしたコマンドを貼っておく。



続きを読む

Xubuntu14.04を入れた後にやった作業メモ

Xubuntu14.04を入れた後にapt-getで何入れたかをメモっておく。後でまたインストールし直したくなった時に使うはず。



続きを読む

過去の自分が書いた記事でよく読まれているものを眺める

引越し後に今後はもう少し真面目にブログ書くかなぁと思い、方向性を考える足しにしようと思って書いた何か。

PVはまともに残してないので、自分が書いた記事ではてなブックマークで50以上になっているものを並べている。数字は当時(多分3月のどこか)のもの。



続きを読む

メモ書き

これもポメラに置いてあった文章。いつ書いたかは覚えてない。とりあえず貼っておく。

友達の友達(大学生)が就活中で苦労しているという話を聞いて「Githubにコード載せれば仕事なんてすぐ見つかるんじゃないだろうか」と思って書いたんだと思う。

こういう文章はあまり好きではないのだけど、なんで書いたんだろう。



続きを読む

インターネットのない生活

この文章は3月の中旬頃に書いたものだと思われる。ポメラに入ってたのでなんとなく貼っておく。



続きを読む

HDDの情報を全部消去する時のコマンド

HDDを処分する時によく使うのでメモしておく。

間違えると被害甚大なので寝不足の時に使ってはいけない。先日、間違えてsdaと打ちそうになった。
$ sudo dd if=/dev/zero of=/dev/hdx

2014年05月03日

日記的なもの

新しいPCを買う。旧PCのHDDが異音を発していたのと、CPUがAthronUなので買い換えればそれなりの性能向上が望めると考えて。

256GBのSSDと16GBのメモリを載せたので少し高くついて、送料込みで8万。秋葉原行って安いパーツを漁ればマイナス1万くらいでできたと思う。でも選び始めるといくら時間があっても足りなくなるのでBTOで済ませる。

最近の大手のBTOはOSなしモデルを減らしているらしい。Windowsとかいうよくわからないソフトを付けて割高な値段にしたモデルばかり販売していた。フルカスタムのとこや小口のとこはOSなしをけっこう扱っているようだ。

続きを読む

2014年04月20日

青空文庫のデータでword2vecした出力結果のメモ

Wikipediaのデータに続いて、青空文庫のデータ(10,975タイトル、554MB)をword2vecに突っ込んでみた。

青空文庫は普通にgithubに置いてある(https://github.com/aozorabunko/aozorabunko)ので、そこからcloneし、ルビや改頁指定などは除去。タイトル、底本などに関する記述も除去。

ホントはあと1500タイトルほど文書があるはずなんだけど、不要な部分を除去する処理を噛ませた時にうまくいかなかったのをすっ飛ばしたので1万タイトル程度に収まる。

形態素解析時に姓名は連結、カタカナの連続は連結。中黒の前後も連結。動詞は基本形に変換している。 続きを読む

2014年04月18日

Wikipediaのデータでword2vecした出力結果のメモ

ここのところ遅ればせながらword2vecと戯れ中。学習にかかる時間も短いし、うまく使えばいろいろ役に立ちそう。

とりあえずWikipediaのデータを突っ込んだ結果などを。

形態素解析時に、姓と名を連結してみたり、接尾語と接頭語を連結してみたり、カタカナの連続を連結してみたりしている。

以下はdistanceした時の上位。上が入力ワード、下が出力されたワード。 続きを読む

2014年04月13日

日記的なもの

前の部屋には6年間住んでいたのだが、いざ引っ越しの荷物をまとめ始めると、いらないものが大量に溜まっていることに驚いた。

以前の部屋は押入れも台所の収納も無駄に広く、1人暮らしの身ではどれだけモノを詰め込んでいっぱいにはならなかった。そうした状況だと整理整頓をする必要があまり発生せず、ついついいらないものが増えてしまう。

ということで、今回の部屋では「収納スペースを減らす」ことをテーマにした。

収納スペースが限られていれば、そこに入りきらないものは捨てるしかなくなる。これは私の本に対する運用ルールでもある。本は油断するとどんどん増えていって、部屋中を侵食してしまう。侵食が目に余るようになったら「ここに入る分以外は捨てる」というルールのもと、あっちを捨てようか、いやこっちを捨てようかと悩みながら始末を断行する。

幸い、今回の部屋は余計な収納がない。台所の収納も狭く、押し入れもない。そこで可能な限り収納用品を削って、モノを減らすように努めてみた。



続きを読む

2014年04月01日

K2pdfoptでPaperWhite向きのPDFを作る

PDFをKindle PaperWhiteで読む時はK2pdfoptを利用することにした。下記の記事を見て導入した。

http://netbuffalo.doorblog.jp/archives/4332005.html

各種プラットフォームに対応していてLinuxでも動作する。 続きを読む

2014年03月18日

プログラミング言語の擬人化記事(その2)の元ネタ

Teck総研さんでまたなんかアレなものを書いた。

プログラミング言語擬人化計画2
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002477&vos=dyterssc000000000000

ので、前回と同じく元ネタを貼っておく。

その1はこちら
http://blog.mwsoft.jp/article/82065726.html



続きを読む

2014年03月04日

ITエンジニア向けの女子ファッション用語解説を書く

何を言っているのかわからないと思うかもしれないが、書いている本人もわかっていない。とりあえずこういう企画があるよという話を聞いたので挑戦してみた。人生は挑戦である。

ITエンジニアのためのファッション用語解説
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002469

ファッション雑誌5冊を1文字も余さず読み込んだり、Web上の用語集や画像を見て勉強したり、知り合いの女性を捕まえてアンケート取ったりと頑張ったんだけど、非プログラマがプログラムの話を書くと少し違和感が出てしまうのと似た類の無理さはあったと思う。

とりあえず今回の企画で良かったことは、下記の商品を見つけられたことだろう。

https://www.google.co.jp/search?site=imghp&tbm=isch&q=Geek+%E3%83%AF%E3%83%83%E3%83%9A%E3%83%B3%E3%82%B9%E3%82%A6%E3%82%A7%E3%83%83%E3%83%88

これは流行る(*´ω`*)


続きを読む

2014年02月27日

libnotifyを使って指定時間にnotifyを表示してみる

データ処理の仕事をしていると「30分後くらいに今やってる処理が終わるから、そしたら出力結果を確認して次の処理を流す」とか「今投げてるクエリが終わるのを待ちつつ次のクエリを書く」といった時間差タスクがけっこう発生する。

別のタスクに手を出してしまうと、ついついそちらに熱中して、前に実行していたタスクのことを忘れてしまうことも多い。

そんな時は、libnotifyを使って指定時間に「そろそろ○○の作業終わったんじゃね?」といったnotifyを表示すれば、前のタスクを忘れずに済む。


続きを読む

2014年01月01日

日記的なもの

去年1年を振り返ってみる。

ダメな1年だった。プログラマ的にはまるで成長していない。本はたくさん読んだので、文学的な方面での知識は増えた。あと、将棋と英語の勉強もそこそこ進んだ。でも本業のプログラマとしての面で伸びないとアカンだろ。

ということで、年末年始は家に篭って特訓中。前から書こうと思ってたコードをいくつか書いている。今年はプログラミングの能力強化を重点的にやる。具体的には数式をコードに落とすあたり。

続きを読む

2013年12月07日

プログラミング言語擬人化計画の元ネタについて

昨日出たこの記事のネタ元について聞かれることがあったのでまとめておく。

プログラミング言語擬人化計画!|【Tech総研】
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002412

続きを読む

プログラミング言語の擬人化の記事を書く

リクナビさんからのご依頼でこんなのを書いた。(文章のみ)

プログラミング言語擬人化計画!|【Tech総研】
http://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002412

いい年してこういうものを書くことに抵抗がないのかと言われると、少し悩むところではある。今はトーマス・マンの魔の山を読んでいるので、セテムブリーニから「エンジニア! あなたという人は!」と怒られそうな気がしてならない。ごめんなさい。

続きを読む

2013年11月09日

Kindle Paperwhiteを買ってみる

自分はスマホとかタブレットを持つとどうも時間を潰してしまうことが多いので、単機能で有意義に時間を過ごせるようなガジェットが好き。ポメラは最高だ。

Kindle Paperwhiteはそういう路線の端末だと思ったので、新モデルが出るのを待って買ってみた。2週間ほど使って見た感じでは、予想に違わず自分向きの良い製品だった。

書籍の揃い以外は。

続きを読む

2013年11月07日

ノートパソコンにMint13を入れたら頻繁にフリーズした

知り合いから下取りしたノートPCにMint13を入れて使おうとしたら、頻繁に(1日に5回くらい)フリーズして使いものにならなかった。Mate使用。型番はDELLのLatitude E6330。

続きを読む

2013年10月20日

【読書感想】死にいたる病

随分とお疲れの様子ですね。それとも疲労ではなく、何かに絶望でもなさっておいでですかな?

そんな時はキルケゴール先生の本でも読んで、息抜きでもするといい。あなたがそれを何だと思うかは知りませんがね、少なくとも慰みの1つくらいにはなるんじゃないですかね。

続きを読む

2013年10月15日

Cloudera QuickStart VMと戯れ中

最近、CDH4がVM上で試せるCloudera QuickStart VMと戯れている。先日はこんなの書いた。

VirtualBoxでCloudera QuickStart VM(CDH4)を動かしてみる
http://www.mwsoft.jp/programming/hadoop/cdh4_virtualbox.html

Mint上で動かしてるけど、今のところ動作はすこぶる快調。Ubuntu上で動かしてた時より良い気がする。今後は開発はこれで行こう。


続きを読む

2013年10月05日

Ubuntu12.04 + GnomeClassicでAlt+Tabが効かなかった

Cloudera Managerを使ってみようかと思ったけど、Mintで叩いたら「そのOSには対応してないぜ」と言われた。Cloudera Managerが現在対応しているのは下記だそうな。

続きを読む

2013年10月02日

最近のClouderaさんのプロジェクトを眺める

ここ1年くらい象さんと会う機会がなく疎遠になっていたのだけど、先日、久々に街でClouderaさんを見かけたらなんか1年前と雰囲気が違っていたので、少しだけ様子を眺めてみた。

Solrを組み込んだCloudera Searchやら、高速な処理を可能とするImpalaやら、いろいろと新しい子分が出来て大所帯になっているようだ。とりあえず子分だけ眺めてみる。




続きを読む

2013年07月07日

play eclipse する際に with-source でソースを参照できるようにする

昔は play eclipse with-source=true でできた気がするけど、2.1でやってみたらうまく動かなかった。

下記のように最初に play コマンドを打ってから、with-srouce 付きで実行したら通った。

$ play
[app_name] $ eclipse with-source=true
[app_name] $ exit

これで F3 でPlayのソースが見れるようになる。

2013年07月06日

Play Framework のデフォルトキャッシュが開発モードですぐ消えるのを解消する

Play の CacheAPI はデフォルトだと EHCACHE を利用している。この子は developer mode (play run) で開発している時に、コード修正が走ってアプリの内容が変更されると、中身がごそっと消えるようになっている。デフォルト設定だとメモリに載ってるだけの状態だし仕方ないね。

普通はキャッシュにヒットしなければDBなりから取ってくるようになってそうだけど、そうじゃないケースに遭遇すると開発時にちょっと困るので、conf/ehcache.xml にキャッシュの設定を置くことでリロード時にファイルにストアしたり戻したりしてもらうことにする。

続きを読む

2012年09月13日

CSSBoxでHTMLのwidthとheightを取ってみる

HTMLの本文抽出をするライブラリを探していたら、ふとHTMLのwidthやheightを取りたい衝動に駆られたので、CSSBoxというJavaのレンダリングエンジンを使ってさらっと取得してみた。 続きを読む

2012年09月11日

boilerpipeを使ってみる

■概要

HTMLから本文を抽出してSolrに登録する用事があったので、Javaの本文抽出ライブラリを探してみたところ、boilerpipeという子を見つけた。

英語色が強そうだけど、そこそこに精度は出そうに見えたので使ってみた。 続きを読む

2012年07月30日

悪い栄養ドリンクマニアの棚

我ながら酷いと思ったので写真を撮ってみた。 続きを読む

2012年07月22日

ブラウザのAccept-Languageを英語優先にする

ブラウザの表示内容を英語寄りにしたかったので、Accept-Languageがen優先になるようにしてみる。

続きを読む

2012年07月16日

UbuntuでMeCabやKyTeaを入れてlibなんちゃらがないと言われた時

UbuntuでMeCabやKyTeaをソースからインストールしてコマンドを叩いてみると、こんなエラーが出ることがある。

# MeCabの場合
mecab: error while loading shared libraries: libmecab.so.2: cannot open shared object file: No such file or directory

# KyTeaの場合
kytea: error while loading shared libraries: libkytea.so.0: cannot open shared object file: No such file or directory
続きを読む

2012年06月06日

MeCabの使い方の本書いたら売れるかな

と、コードリーディングをして遊んでいる時に、ふと思った。

続きを読む

2012年04月18日

メモ書き

さくらのVPSのプランに変更があった。これまで月額980円の最安プランはメモリ512MB、HDD20GBだったのが、同額でメモリ1GB、HDD100GBになった。

メモリはどうでもいいけどHDDの容量は欲しいので、新規に1GBのプランを契約し、旧契約を破棄する形で乗り換えてみる。 続きを読む

2012年04月14日

Lucene/Solr3.6リリース - 形態素解析が使えるようになった

今週はAmazonのCloudSearchが発表されたり、Lucene/Solrの3.6がリリースされたりと、全文検索さんとお付き合いしている人たちにはアドレナリンが出やすい1週間でした。

3.6には形態素解析を使ったAnalyzer(Kuromoji)が入るなど、日本人にとっては脳内物質が駆けめぐりやすいリリースになっているようです。β‐エンドルフィン。チロシン。エンケファリン。

とりあえず触ってみたところとかをメモ。 続きを読む

2012年04月04日

in-mapper combiningメモ

就職活動月間その2。

子象本くらいは読んでますよ、みたいなところをアピールするためにこんなのを書いてみる。

in-mapper combining(MapReduceデザインパターン)
http://www.mwsoft.jp/programming/hadoop/in_mapper_combining.html

0.23系が触りたい気持ちもありつつ、今仕事で使うとしたら0.20だろうということで地固めに励む。

2012年04月02日

HadoopのWritableに関するメモ

今月は就職活動準備月間。

とりあえずHadoopに関するそれっぽい記事をたくさん書くのだ。書くのだ。

HadoopのWritableに関するメモ
http://www.mwsoft.jp/programming/hadoop/writable_memo.html

書くのだ。

2012年03月13日

Kuromojiで日本語WordCount

Hadoop関連の仕事に就きたい気持ちがフツフツと湧いてきたので、しばらくそれっぽいことを書いて過ごしてみようと思う。

とりあえずこの辺から。

Hadoop、Scala、Kuromojiで日本語WordCount
http://www.mwsoft.jp/programming/hadoop/scala_ja_word_count.html

今もHadoopは仕事で使ってるけど、それメインというわけではないのでちょっと物足りない。

夏頃までは仕事が埋まってるので、8月か9月にそういう仕事が取れることを目指して、ボチボチやってみよう。

2012年02月21日

MoreLikeThisで遊んでみた

SolrのMoreLikeThisでWikipediaの類似記事を取得してみた
http://www.mwsoft.jp/programming/lucene/more_like_this_wikipedia.html

今週は確定申告の準備をすると言ったな。あれは嘘だ。

いや、ちゃんとやるつもりでCalc開いて入力とかも始めたんですけどね。

気がついたら上のようなものを書いてました。

おかしいなぁ。

2012年02月15日

メモ書き(CDH4 b1とか)

まずはさっき書いた記事をブログに貼り忘れてたので気持ち的に貼っておく。

HadoopとLuceneとNutchの名前の由来
http://www.mwsoft.jp/programming/hadoop/where_come_from.html


で、本題。CDH4のベータ版が出たらしいので適当にメモ書き。

続きを読む

2012年02月11日

Solrjのサンプルコードをいろいろ書いてみた

今週2本目。もう少しで今週が終わるとこだった。セーフ。

Solrjサンプルコード集
http://www.mwsoft.jp/programming/lucene/solrj.html

けっこう頑張って書きました。でも、今ひとつまだSolrさんの中身を把握しきれてない。情報の変化がけっこう激しいし。

もう少し仲良くなりたい。気兼ねなく休日に誘えるくらい。

「今週末、一緒にMoreLikeThisしに行かない?」

2012年02月07日

Twitter4JでTweetを収集してみる

今週1つ目。

Twitter4JでTweetを収集してみる
http://www.mwsoft.jp/programming/java/twitter4j.html

GeoLocationが何で検索してるのか良く分からなかったけど、興味ないからいいや。

個人的には「登録してあるユーザとハッシュタグについて今日1日分の情報を収集して、その中に含まれてるリンクを並べて表示」みたいなことをしている。

情報収集ツールとしてはけっこうありがたい。あと、不自然言語好きな人も重宝してそう。

2012年02月03日

プログラマ文庫更新

死に至る病の文章って実は汎用性があるんじゃないかと思ったので、プログラマ文庫にそれっぽい内容を追加してみる。

プログラマ文庫
http://www.mwsoft.jp/column/novel/

原文以上に宗教的になってしまった感があるけど、思った通りなんでもいけそうだということが分かった。

2012年02月02日

Java製形態素解析器「Kuromoji」を試してみる

予告通りKuromojiに手を出してみた。

Java製形態素解析器「Kuromoji」を試してみる
http://www.mwsoft.jp/programming/lucene/kuromoji.html

Luceneの状況とかを見極めてから手を出した方が良かった気もした。すぐに記事の修正が必要になりそうな気がする。

あと、ソースが読みやすかった。

2012年01月30日

lucene-gosenのメモを更新

以前書いたlucene-gosenのメモがバージョンの変更によりだいぶ通じなくなっていたので更新する。

Java製形態素解析ライブラリ「lucene-gosen」を試してみる
http://www.mwsoft.jp/programming/munou/lucene_gosen.html

次回はKuromojiでUniDic使った解析とかを予定しているので、マニアの皆さんはお楽しみに。

2012年01月27日

JavaのHTTP通信でプロキシを使う

今週は内容が薄かった気がしたので、追加でこんなのを書いた。

JavaのHTTP通信でプロキシを使う
http://www.mwsoft.jp/programming/java/http_proxy.html

来週はLucene関連で行ってみようと思う。

2012年01月24日

ScalaでRubyのeach_with_indexみたいなループ

ググったらzipWithIndex使えばいいと出てきたけど、なんか不安な気がしたので少し調べた。

ScalaでRubyのeach_with_indexみたいなループ
http://www.mwsoft.jp/programming/scala/scala_zipwithindex.html

これで今週分のノルマ達成。

でも今週分は2本とも内容が浅い気がする。もう1本軽いのを書くべきか、来週に備えて今から重いのを準備すべきか。

2012年01月23日

JavaのRSSライブラリ、ROMEを使ってみる

今週の1個目。

JavaのRSSライブラリ、ROMEを使ってみる
http://www.mwsoft.jp/programming/java/rome_sample.html

自前でRSS2.0とAtom用のパーサを書いてたらほどほどに疲労したので、ライブラリに頼ることにした。

2012年01月20日

scala.swingを試してみる

持ち運び可能な簡易なGUIアプリを作る必要があったので、scala.swingをさらっと試してみた。

scala.swing簡易サンプル
http://www.mwsoft.jp/programming/scala/scala_swing.html

イベントまわりの書き心地は想像していた通りやはり良い。

あと、今回からサイトのレイアウトを少し変えてみた。

IE9、FF10、Chrome16では表示確認したけど、他のブラウザについては知らない。border-radiusとかbox-shadowとか平気で使ってるし。

単純なレイアウトだから読むのに困るような崩れ方はしないと思うのだけど。崩れてないといいなぁ。

2012年01月15日

LuceneのCJKAnalyzerで遊んでみた

自前のルールでインデックスを作る必要に迫られたので、試しにCJKAnalyzerに手を入れて要件が満たせないか試してみた。

Lucene/SolrのCJKAnalyzerをカスタマイズして遊んでみる
http://www.mwsoft.jp/programming/lucene/lucene_custom_cjk.html

良い勉強になった。けど、個人的な要件は今ひとつ満たせなかった感がある。

まぁ、いいか。

2012年01月11日

ScalaのORM、Squerylを試してみる

家で作っているプログラムでDBを使う必要が出たので、試しにSquerylを使ってみた。

ScalaのORM、Squerylを試してみる
http://www.mwsoft.jp/programming/scala/squeryl.html

使い心地は悪くないけど、もう少し柔らかい感じの子の方が好きだと思った。

あと、チュートリアルがけっこうしっかりしているのはありがたかった。

とりあえずこれで今週のノルマは達成。意外と軽いな。

今週の内容はちと普通過ぎた感があるので来週はもう少し変態風味に攻めてみたい。

2011年12月10日

最近使っているChromeのマウスオーバー辞書

ブラウザのマウスオーバー辞書っていろいろあるけど、どれがいいのだろう。

とりあえず現在自分が使っているのは以下。ブラウザはChrome。

続きを読む

2011年11月16日

象さんと戯れ中

最近はもっぱら象さんと2人きりで日々を過ごしています。

http://www.mwsoft.jp/programming/hadoop/

思った処理はだいたい実現できるようになってきたけど、どうすればパフォーマンスが上がるのかとかが今ひとつまだ分かってない。mapred-site.xmlの設定とかもう少し試してみないとな。

あと、4台ほど常時可動させてしまっているので今月の電気代に少し怯えてもいる。EMSも嗜んでいるのでterminateし損ねて高額課金されたりしないかとかにも怯えている。

総じて怯えている。でもやめられない。

象本の第二版を買ったので読みながらもう少し仲良くなってみようと思う。

2011年10月23日

メモ書き

今日、Ubuntuを入れた時にやったことメモ。割と長期で使う予定だったのでバージョンはサポートが長い10.04を利用。

とりあえず打ったコマンドを残しておく。

って、入れてから気づいたけど11.10でもサポート終了のタイミング一緒だった。入れ直すのも面倒なので12.04が安定したら入れ替えるかな。

続きを読む