2010年02月20日

Unicodeは麻雀牌すら表現してみせる

この前、Unicodeのブロックを見ていた時に、麻雀牌が割り当てられたブロックがあるのを見て笑った。誰が登録したんだろう。

もっと面白いものがないか探してみたけど、けっこう変なものが登録されていてやっぱり笑った。混沌という言葉が似合う気がした。

以下、見ていて気になった者ども。



1. Unicodeには麻雀牌用のコード領域が確保されている

U+1F000-1F02F Mahjong Tiles
http://unicode.org/charts/PDF/U1F000.pdf

まだあまり対応されていないけど、対応率が上がったらテキストだけで麻雀できます。JavaScript+テキストで画像一切なしの麻雀ゲームを作る人が出没すること請け合い。フォントカラーを変えることで赤ウーも表現可能。ただ、点棒は登録されてないので、そこだけ画像を使う必要があるかも。



2. 六十四卦(易という占いで使われるもの)が登録されている

U+4DC0-4DFF Yijing Hexagram Symbols
http://unicode.org/charts/PDF/U4DC0.pdf

先生、なんでこれを文字コードに登録しようと思ったんでしょうか。そりゃ、65536じゃ致命的に足りなくなるわけだよ。ただ、上のPDFを見ていて思ったのですが、この文字ってアスキーアートの素材に凄く向いていると思いません?



3. Unicodeには雪だるまが登録されている

http://0xcc.net/blog/archives/000221.html

もう文字とか記号じゃないじゃん。完全に絵じゃん。登録されているのは「U+2603」だから「Miscellaneous Symbols」の中ですね。この中には他にも、電話機とかハート、クラブ、ダイヤ、クローバーとか、コーヒーカップとか、いろいろ定義されています。

U+2600-26FF Miscellaneous Symbols
http://unicode.org/charts/PDF/U2600.pdf



4. 平仮名に定義されている「U+309F」が読めません

U+3040-309F Hiragana
http://unicode.org/charts/PDF/U3040.pdf

よりと読むらしい。Wikipediaに書いてある内容によると、「よ」と「り」を組み合わせた合字で手紙の差出人の末尾で使われるとか。すいません、無学なものなので初めて見ました。



5. カタカナに定義されている「U+30FF」が読めません

U+30A0-30FF Katakana
http://unicode.org/charts/PDF/U30A0.pdf

コトと読むそうで。カタカナの「コ」と「ト」の合字で、事の意味で使用されるとか。やっぱり知りませんでした。無知ですいません。



6. くさび形文字はとても複雑

U+12000-123FF Cuneiform
http://unicode.org/charts/PDF/U12000.pdf

なんか同じような絵とか、部屋の間取りみたいな形した図形みたいなのが並んでる。これ、読めるものなんですか。昔の人ってすごいなぁ。



7. 音楽記号ももちろん完備

U+1D100-1D1FF Musical Symbols
http://unicode.org/charts//PDF/U1D100.pdf

音楽は得意科目だったはずなんだけど、なんか知らない記号が大量にならんでいやがります。もちろん、Unicodeのキャパはただの音楽記号には収まらず、古代ギリシア音符記号(Ancient Greek Musical Notation)なんかも完備しているそうです。どこまで網羅したいんだ。



8. 「1月」とか「2月」が1文字で書ける

U+3200-32FF Enclosed CJK Letters and Months
http://unicode.org/charts/PDF/U3200.pdf

囲みCJK文字(Enclosed CJK Letters and Months)の中には、「1月」〜「12月」を1字で表すものが存在しているようです。なんで1つの文字にしたんだろう。あと、「(一)」、「(二)」みたいに漢数字を括弧で囲ったものもあります。3字で書けばいいじゃん。(株)はあっても良い気もしなくもないけど。いや、いらないか。



9. 縦書き用の句読点や記号が用意されている

U+FE10-FE1F Vertical Forms
http://unicode.org/charts/PDF/UFE10.pdf

なんか至れり尽くせりですね。でも、わざわざ縦書きで綺麗に見えるように「U+FE12」の句点を使ったりすることなんてあるのだろうか。縦書き用フォントを使うことになるだけな気もする。




以上、Unicodeで気になったものどもでした。眺めてると、そのうち携帯とかで使われている顔文字が全部登録されてても驚かないような気もした。

ていうか、何かが間違っている気がする。何かが。