Archive for the 'プログラミング' Category

「2chまとめビューワー ののワ」が使いにくい

Posted by onaneetX.Q on 6月 5 2010 Add Comments

まずコメントのお返事をします。

POSTED BY 匿名 ON 2010年6月1日
アファーマティブアクションに関して。
差別を中和するために差別を使う、という発想にあまり賛成できない。
新しい差別が古い差別の完璧な反対になっているということは、まず、ありえない。
なんらかの偶然で社会の中央から外れてしまった人々も、
自然にまた中央に戻って来るような復元力を
社会制度に持たせることのほうが重要だと思う。

アファーマティブアクションは単なる票稼ぎですね。選挙前に黒人票が欲しくなると黒人優遇策を発表するみたいなものです。

似たような言葉にポリティカル・コレクトネス(PC)があります。これは票稼ぎ的な意味はないようですけど、差別を止めようという旗の下に別の差別を生んでいるとも言われます。

どちらかというと、おいらはPCでは損をする立場なので反対の立場を採っています。その代わり判断基準を明確にして公平に判断することが大事でしょう。例えば男女差別の問題だと、あなたが女性/男性だから差別的な待遇を受けているわけではないことを開示するのです。例えば大学入試の得点開示のように。

2chまとめビューワーが使いにくい

大学に行ったりバイトに行ったり日頃から長時間電車に拘束されていると暇つぶしが欲しくなります。iPadでも買ってIEEEとかの雑誌の電子版を読もうかなと思っているけど、現状ではiPhoneの小さい画面なので文字通り時間を潰すことに充てがちになります。

最近みつけたのが「2chまとめビューワー ののワ」なのだけど、これが結構ひどい。ひどいと思う点を2点挙げる。

(iPhoneの)プログラミングスキルが洗練されていない

これはそのうち改善されるだろうけど、あからさまにデザインが悪いし、細かいところが雑である。読み込み中を示すくるくるは穴が空いたようであり、通信エラーが出たときの例外処理も甘いように見える。

でもこれは本質ではない。

単にWebビューをしているだけに見える点

これが最大の問題点だと思う。iPhoneの画面でブログベースのまとめをそのまま表示されても見にくい。

もっと酷いのはページビューのために変なことをするサイトの対策がなされていない。読みたい記事を選ぶと数秒はその記事が表示されるが、JavaScriptか何かで全然興味ないところに飛ばされることがある。他にも読みたい記事をすぐに出すのではなく、記事のリストから選ぶようなまとめサイトもあって、パソコンから見ていてもいい加減面倒臭いのに、iPhoneでそれではどうしようもない。

あと重い。

ではどうすればいいのか

最低限、HTMLを解析して必要な部分だけ表示することが重要。これをするだけで、記事とは関係ない部分が画面を占領することもないし、重かったり、ページビューのために変なことをされることもなくなる。

できることなら、専用サーバを用意してcronなどで巡回させて記事をクロールさせておく。iPhoneからはその専用サーバにアクセスすれば、余分な情報を除去して構造化されたデータから読むだけになるのでずいぶん利便性が上がるはず。ソフト側をバージョンアップしなくても、サーバの解析機能をバージョンアップして、定型の構造化済みデータに出力すればほとんどの場合は事足りるのも大きい。

問題点はサーバを運用すること。レンタルサーバを借りればお金がかかるし、アプリを公開して使う人が増えたらもっとコストがかかる。

いきなり話は変わるが、フィジー留学

広告であったのだけど、フィジー留学でぐぐると格安のプランが出てくる。4週間で合計67,000円とかその程度(ただし4人部屋でプライバシーがない)。ある程度英語を日本でやって、あとは英語漬けになろうと思っている人にはいいかも知れない。

Google画像検索で「フィジー」を見ると、とても美しい環境なのでバカンスがてら英語も勉強というものでもいいと思う。

英文読解講座@高橋善昭

英文読解講座 [新装復刊]

著者/訳者:Array

出版社:研究社( 2010-06-01 )

定価:¥ 1,575

単行本(ソフトカバー) ( 228 ページ )

ISBN-10 : 4327764736

ISBN-13 : 9784327764739


復刊されたらしい。一部で絶大な人気を誇る高橋善昭の英語本。まだ読んでいないけど是非読んでみたいと思う。

受験英語のマイルストーンの一人に伊藤和夫がいる。伊藤和夫以前と以後では受験英語はずいぶん変わっていて、当然おいら達が高校で勉強したのは伊藤和夫以降の英語がほとんどのはず(じーさん先生に習った人は知らない)。で、高橋善昭はその後継者みたいな人で構文マニア。最初は感動するけどそのうち飽きるとよく言われた。

おいらも別に受験英語を研究しているわけでもないけど、昔の英語は駿台の『基本英文700選』みたいなのが多かったそうだ。

新・基本英文700選 (駿台受験シリーズ)

著者/訳者:鈴木 長十 伊藤 和夫

出版社:駿台文庫( 2002-01 )

定価:¥ 1,050

単行本 ( 175 ページ )

ISBN-10 : 4796110445

ISBN-13 : 9784796110440


とにかく例文とその日本語訳を覚える。そうすると、ほとんどの文章は700選の○○番と同じだなということで読めたらしい。和文英訳はその逆をする。ところが、伊藤和夫や高橋善昭は暗記に頼った英語から、構文を主体にした理屈の読解に切り替えたと言われる。

700選のやり方は現在でも結構使えると思っている。下手な考え休みに似たりというか、とにかく一定の学習量をこなせば結果が付いてくる暗記は案外悪くないのだけど、暗記というのは現在ではあまり支持されていないようで、その転換点となる本の復刻版である。

ランキング

東大生ブログランキング登録しました。ぽちしていただけると喜びます。

東大生ブログランキング

雑記いろいろ

Posted by onaneetX.Q on 5月 28 2010 Add Comments

まずはコメントのお返事をします。

POSTED BY どせい ON 2010年5月24日
本当にそこまで考えて pdf を選んでいるのかはちょっと疑問だったりします.
word などで資料を作っていた場合 html にするよりは pdf にしてしまった方が楽なので pdf がここまで広まっているのかなあと勝手に考えていました.セキュリティという観点は持っていなかったのでとてもおもしろく読ませていただきました.
僕は記録を web に置くなら pdf よりも html で置いてほしいと思います.最近はそうでもないようですが pdf だと検索にかかりにくい,引用がしにくい,プラグインや Reader の起動時間を待たなければいけないといった理由が主にあげられます.最後の理由は些細なことですが pdf が web で嫌われる最大の理由だと思います.読んでもらいたい資料,積極的に公開したい資料であるのならば pdf だけではなく html でも公開してほしいなあと考えています.

htmlの方が読みやすいし、最近はCSSとかで上手くレイアウトすれば十分綺麗なのでそうするべきだと思います。WordのHTML書き出しは結構ひどかったけど最近は改善されたのかな。HTMLはCSSさえ用意しておけば、ごく簡単なタグ付けだけで結構見られるレイアウトになるはずなので、ハードルも低いかと思います。

POSTED BY あ ON 2010年5月24日
PDFがよく使われるのは、本来内部資料書類向けに作ったものをそのまま(もしくはちょっと手入れして)
使おうって考えからじゃないですか?後、リーダさえインストールされていれば誰でも
ほぼ同じ画面で見られますし、印刷できます。
まぁ、HP作成時の参考本とかに、PDFでやれって書いてあるのかもしれないですし、
担当者がただ単にワード等で作る方に慣れてて、それをPDF化して公開してるだけなのかもしれません。

たぶんワードばっかり使っている人がそのままやっているんでしょうね。セキュリティとかを意識しているわけでもなさそうだし。

POSTED BY えぬ ON 2010年5月24日
あと、「よみ・かき・そろばん」に加えて、
「こんぴゅーた」の知識も教えるといいのではないでしょうか。
初等教育では不要かな?
余談ですが、大陸法的な「法治主義」は、今日では法の中身を問題とする(「悪法も法なり」を否定する)ので、
英米法の「法の支配」と実質的には大差ない(はず)です。

こんぴゅーたについて教えるのは賛成ですけど、結構教えられない教員がいるらしいので難しいかな。未だにTwitterを校則で禁止する学校があるとかいうニュースもありました。頭ごなしに禁止するのは教育の放棄だと思うのだけど。正しく使う方法を教えるべき。

そういえば、少し前に悪法を持ち出して「日本は法治国家なのだから従う必要がある」と言っていた人を見かけたのですが、法治国家が拘束するのは国家権力ですよね。悪法を通して置いて法治国家だから従えというのはまるっきり法治国家の考えに反していると思うのですが。。。これが日本の教育だと思うと脱力します。

POSTED BY 毒舌批評家 ON 2010年5月24日
>こうであったらいいなという妄想を書いてはいけない
笑いました。
法の支配、法治主義に関連して、
憲法が存在する意味(=国家権力を拘束するためにある)ということ、
自由は与えられたものではなく、歴史の中で奪い取ったものであること
をちゃんと教えてもらいたいです。
列挙されている事項を改めて考慮してみると、
これらを知られると権力者達が非常に困るから、
敢えて教えていないんじゃないかと疑いたくなる事項ばっかりです。
投資家という職業が省かれているのは、
金融の知識が足りないのと、お金アレルギーに由来するはずです。
あと、「物事は見る角度によってどうにでも解釈できる」
というあらゆる学問の基本も教えるべきだと思いました。

やはり権力者にとって教えない方がいい事実というのがあって、それが教科書に反映されているのでしょうか。まだまだ書き足したり直すべき点が多そうですね。

台湾の中国語の本が相次いで発行

小道迷子の台湾ではじめよう、中国語

著者/訳者:小道 迷子 渡辺 豊沢

出版社:三修社( 2010-05-31 )

定価:¥ 2,100

単行本(ソフトカバー) ( 199 ページ )

ISBN-10 : 4384056087

ISBN-13 : 9784384056082



中国語は台湾で学べ 台湾華語のススメ

著者/訳者:和田健一郎 李慧君

出版社:NPO法人日台学生交流会( 2010-05-30 )

定価:¥ 1,680

単行本 ( 170 ページ )

ISBN-10 : 4990413105

ISBN-13 : 9784990413101


5月末になって台湾の中国語を習おう的本が相次いで発行される。そういう企画があるのはいいけど、時期が重なるのは何かあるのだろうか。いま、台湾の中国語が人気で出版社が動いたとか。

台湾の中国語は本土の中国語といくつかの違いはあるが、アメリカ英語とイギリス語ほどの違いはないと聞いた。

一番大きい違いは正字体(繁体字)を使うことだろう。日本もいい加減簡略化しているとはいえ、本土の漢字はちょっと受け付けがたいものがある。一方で古い本を読めば日本でも正字体を使っていたわけで、台湾とか香港の字は違和感がない。新しい建物なのに駒場図書館の「図」は正字体だったりするように、今でも若干残っている。

発音が台湾は訛っていると言える。中国語はつい最近始めたので中立的な立場にいるのだが、北京の発音の方が洗練されているように聞こえる。台湾のは田舎っぽい。ただ、そり舌音って言うのかzh, sh, chなどの音は北京ほどにはハッキリ発音しないので、日本人には台湾の方が発音しやすいと思う。北京語ではないけど、台湾語はかなり日本語に近いものもある。

いくつかの言葉が違う。台湾では「餃子」は鍋貼という。他にもコンピュータ関係の言葉が違ったような気がする。インターネットは台湾では「上網」だが本土では別の言葉(网路?)を当てる。よく漫画で中国人が「〜アルよ」というけど、本土の言葉には児化(アルか、簡体字:儿化、繁体字:兒化、拼音:érhuà )が多い。台湾の人はあまり「アル」とは言わない。

あと、意外と注目する人が多いのだけど、台湾は注音符号という日本語で言う仮名みたいなものを使う。これは小学生くらいまでは漢字が書けない場合は注音符号で書いても許されるらしいので、仮名としての役割がある。また、子供向けに書いてある看板なんかは注音符号も併記されている。面白いと思ったのは、アイスクリームの屋台に注音符号だけで書いてあった。これは「ばーぶー」みたいな豆腐屋のラッパみたいな音を表しているそうだが、漢字がなく音だけなので注音符号だそうだ。

本土ではピンインというローマ字で発音を表すものを用いる。発音記号じゃないので、表記通りに読めば正しい発音ができるというわけではないので、中国語の発音向けに作られた注音符号の方が誤解は少ないと思う。ピンインはしばしば誤解しやすいものがあるので、慣れている人はいいけど、初学者にとっては厄介である。

ただ、注音符号も「ㄨㄥ」なんかはわかりにくいと思う。ㄨは「う」みたいな音でピンインだとuとかwuである。実は中国語には日本語の「う」はないようである(間違っているかも)。ㄥは「おんっ」みたいな音で、ピンインだとengと書く。「ㄨㄥ」はuengかと思うとongと書く。おいらの耳には「ㄨㄥ」は「おんっ」と聞こえるので、ongの方が正しいような気がするが、注音符号だと「うおんっ」と言いたくなる。

まだまだ中国語の音はわからないので、今の時点でどっちがいいかはわからないけど、中国語では「う」に注意だと思っている。ピンインのsi(注音符号のㄙ)は「すぅ」と読む日本人が多いようだ。ドラゴンボールの四星球(スーシンチュウ)とか。けど「すぅ」と「う」っぽく発音すると違うと言われる。

おいらはどうも音感が悪いようで中国語の発音には苦労している。でも、よく考えると日本語だと何ら問題なくアクセントも言えるし聞き分けられるので単に練習量が足りていないだけかも知れない。学習はこれからも続けていきたいけど、日本で中国語の教材を買うと漢字が嫌だから、台湾の中国語が増えてくるとしたら嬉しい限りである。

ネットでただで読める本

iPadの発売日が近づいてきて電子ブックとか色々言われているけど、探してみるとあまり読みたいのがない。売れているコンテンツは無理にリスクを取らなくても売れるから殿様商売をしていて、崖っぷちのコンテンツは起死回生を図っているのかも知れない。

ところで前から本を書いてみる経験をしたくて、少しずつ原稿を書いている。ゴールデンウィークが終わってしまってほとんど手が回っていないのだけど、Rubyでネットから情報をかき集める方法について書きたいと思っている。とは言ってもRubyに詳しいわけでもないので本が欲しいなと思っていた。

Rubyベストプラクティス -プロフェッショナルによるコードとテクニック

著者/訳者:Array

出版社:オライリージャパン( 2010-03-26 )

定価:¥ 3,360

大型本 ( 364 ページ )

ISBN-10 : 4873114454

ISBN-13 : 9784873114453



プログラミングRuby 第2版 言語編

著者/訳者:Dave Thomas Chad Fowler Andy Hunt

出版社:オーム社( 2006-08-26 )

定価:¥ 3,990

大型本 ( 434 ページ )

ISBN-10 : 4274066428

ISBN-13 : 9784274066429


が欲しいと思った。オライリーではeBookを出しているので見てみたのだけど、日本語版はなかった。英語版ならあると思っていたところ、

というのがあった。海賊版ではなく正規の物らしい。なんと太っ腹。英語の本はよく探すとフリーでPDFを配布しているものもある。本を解体してスキャンしたものと違って容量は小さいし軽いし文字もハッキリしていて読みやすい。

正規の物かわからないのでリンクしないけど、他にも色々有益な書籍のPDFが英語版にはあるようだ。あちこちにアップされているものは違法コピーなのか、それとも正規の物を再配布しているだけなのかわからない。

Wikipediaの深さ優先探索の説明がおかしいような

Wikipediaの「深さ優先探索」の再帰を使わない例の説明が不適当な気がする。

def depthFirstSearch( start, goal ):
    stack = Stack()
    start.setVisited()
    stack.push( start )
    while not stack.empty():
        node = stack.top()
        if node == goal:
            return stack # stack contains path to solution
        else:
            child = node.findUnvisitedChild()
            if child == none:
                stack.pop()
            else:
                child.setVisited()
                stack.push( child )

何がおかしいかというと、start.setVisited()とかchild.setVisited()してノードにフラグを立てている点。またchild = node.findUnvisitedChild()なんてこともしている。

深さ優先探索とは

Wikipediaから拝借してきた図にあるように、どんどん先に、先にと探索していって、行き詰まったら戻るという処理を繰り返す。

他に幅優先探索というのもある。

コンピュータでよく使う概念にスタックというものがある。教科書にはFILO(First In Last Out)と書いてあることも多いけど、おいらはFILOとかFIFOという言い方はしないで「スタック」とか「キュー」と呼ぶ。

スタックというのは早い話がプリングルズの入れ物とか、テニスボールの缶である。ボールに番号を付けて、1,2,3と入れたら、3を取り出さないと2を取り出せない。1は最後にならないと取り出せない。一見不便な制約のように思えるけど、順番を覚えておくには便利で、Wikipediaのサンプルのような面倒臭いことをしなくてもスタック1つあれば事足りるはずである。

深さ優先探索の流れ

プリングルズの缶(スタック)に次に行ける場所を入れる。ここでは右側を先に入れて、次に左側を入れることにする。

やることがなくなったから、スタックから1つ取り出す。スタックの制約で2しか取り出せないので2に行く。

2を取り出したからスタックには7しか残っていない。ここでまた行けるところ(6と3)を全部スタックに突っ込む。

やることがなくなったから、スタックから1つ取り出してそこに移動する。今回は3を取り出したので3に行く。

同じく次に行ける5と4をスタックに放り込む。やることがなくなったのでスタックから1つ取り出してそこに行く。次は4番。

ここで次に行けるところをスタックに入れて・・・と言いたいけど、行き止まりなので入れるものがない。仕方がないので、スタックから1つ取り出す。ここでは5が出てくるので5に行く。

図を描くのが面倒になったけど、5も行き止まりなのでスタックに入れるものはない。だからスタックから1つ取り出して6に行く。さらに7へ行くという流れになる。

ここで大事なのは、Wikipediaの説明にあったように「○番には既に行った」という情報はどこにもないけどちゃんと順番に探索できているし、同じところに二度行くことはない。スタックを使えばこういうことがすごく簡単に表現できる。

Wikipediaって一日中張り付いて雑草取りをしている暇な人がすぐに「要出典」を貼り付けたり記事を削除したりパトロールしている(Wikipediaは自分のものでもないのに)わけだけど、こういうところは出典が不明確な記事でも何も付けないし、訂正もしない。うぃきぺでぃあんはニートみたいなものだと誰かが言っていたけど、そうなのかも知れない。

おいらはうぃきぺでぃあんが嫌いなのでWikipediaに寄稿することはないし訂正もしない。ニート同士で同族嫌悪をしているわけだけど、Wikipediaはニートが管理している百科事典なので、専門的な内容についてはあまり信頼性がないと思う。

自分で確認したわけじゃないんだけど、ある人の指摘によると英語はそんなにひどくないらしい。自分のものでもないものの草取りに励むというのは日本人には多いけどアメリカ人には多くないのか何なのか知らないけど、日本語版Wikipediaに限って言うと変な人が縄張り意識を持ってパトロールしている。

少し前も別の人の指摘だけど「挿入ソート」の記述がおかしかった。どこから持ってきたコードかわからないけど、本質を欠いていた。訂正してやったらどうだという話もあったようだけど、

ええ、そう書くと「その無駄なwritebackを消すと本当に速いのか?」「どのアーキテクチャで本当に速いのか?」「どのコンパイラで本当に速いのか?」「そのソースは本当にわかりやすいのか?」「似たサンプルコードを2種類掲載する意味はあるのか?」「伝統的な教科書のサンプルコードとは違うようだが、これはお前が考えたのか?」「出典を示せ」「番兵のパターンは広く使われているのか?」「要出典」「サンプルにそこまで必要ないだろう」「要出典」「要出典」「要出典」etc..(´Д`)

速いコードである必要がないなら、併記すること自体の価値が問われるのでは。「writebackを消して速くなると思うのか」「writebackを消せれば何が嬉しいのだ」「writebackを消したコードがどこに使われているのだ」「writebackを消したコードはどの本に載っているんだ」「要出典」「writebackを消して速くなる例を」「サンプルコードとして掲載する価値があるのか」「要出典」「要出典」「要出典」…心が一瞬で折れそうです(´ω`)

結局、何か出版されている本に載っていないと信じないということで、放置することにしたらしい。自分で本を書いて、それを出典にする?

キャリア官僚の特権

いきなり話を変えるが、国際公務員(国連職員?)になるのは結構大変だ。英語がネイティブ級なのは必須で、他に主要言語が数カ国語流暢であることが求められるという。残念ながら日本語は主要言語の中に含まれないようなので、日本人がなるには2,3カ国語をみっちり勉強しなければならない。スイスの人は4カ国語くらい流暢にできる人が珍しくないようだし、カナダとか英語とフランス語とか、公用語が強力な国に生まれ育った人は有利だ。中国語も有力言語に入っているので、中国人や台湾人なら英語をしっかり勉強すればよく、ヨーロッパに比べると少し不利だけど日本よりは有利だ。

また、単に言葉を喋れればOKというものでもなく専門知識が要求される。博士号2つくらい持っている人はざらにいるそうだ。

ところが官僚だと国連に行きたいと言っていると比較的簡単に出向できるらしい。これは日本が国連に多額のお金を出している割に国連職員が少ないから、希望すれば簡単に配属されるという。国としても国連には人をたくさん送りたいらしい。

ここで気になるのは国連に金を出しているのは日本という国家であって官僚ではない。なのに国連職員というポストは官僚だと簡単に手に入り、民間人だと相当高い素養がないとなることができない。

他にも官僚は官費留学ができる。今は昔ほどひどくなく、例えば野口悠紀夫という人の経歴を見たら

  • 1964年大蔵省(現・財務省)に入省。大学院中退。同期には野田毅、田波耕治、秋山昌廣、涌井洋治など。
  • アメリカ合衆国カリフォルニア大学ロサンゼルス校(UCLA)へ留学し、1968年修士号取得、1972年、計5年間に渡り経済学を専攻し、米国イェール大学にて、Ph.D(経済学博士号)を取得。
  • 帰国後大蔵省に戻ったのち文部省に出向

  • 1974年埼玉大学教養学部助教授(大蔵省より出向)
  • 1978年一橋大学経済学部助教授

となっている。2年+5年も官費で留学して、少しだけ大蔵省で仕事をして一橋の助教授になってしまった。今は官費留学は2年だし、すぐに辞めると留学費用を返さないといけない制約がついているけど、それだけでも十分に恵まれている。

他にも国の仕事として面白そうな、税金で運営されている機関にタッチできたりする。

霞ヶ関の仕事はかなりつまらないものも多く、仕事量は多く、ソルジャーの数は足りない。民主党の天下り禁止で年配の官僚が省内に残り、実働部隊の若手の採用が全体で4割削減されるから、これからますますブラック組織になっていくのだと思う。メディアには叩かれるし、お気の毒である。でも、上記のメリットがあるから、それでもなお日本全体で享受すべき甘い汁を半ば独占的に吸える職場ではあると思う。民間企業ではここまでの待遇はなかなかない。

公務員叩きはちょっと異常な面もある

官僚は甘い汁を吸えるポストではあるのだけど、公務員叩きはちょっと行きすぎているところもある。

よく言われるのは「税金を頂いている身分で〜」という批判である。確かに公務員は国家から給料などが出るわけだけど、公務員全体は知らないけど官僚に限って言うと給料分以上に働いているし、さらに言うと給料分以上の経済的メリットを国家に対してもたらしている。だから、このようにスネかじりであるかのように言うのは筋違いである。

一方で民間企業の納税意識は低い。法人税を納めていない企業は相当あり、少し前の調査で7割を越えていたので今はもっとひどいと思う。就職の説明会に行くと、立派なオフィスビルを借りていたりする企業がたくさんある。その企業の担当者が、儲かっていますから古いオフィスから○○に移転することにしました。どうせ法人税で取られてしまうのだから、綺麗なオフィスに引っ越した方がいいと判断しました、といった内容のことを言っていた。

六本木ヒルズとかミッドタウン、丸ビルなどのオフィスビルに入っている、あまりぱっとしない(失礼)会社も多いけど、賃料いくらなんだろ、少し調べたら六本木ヒルズで1ヶ月5千万円くらいらしい。広さにもよるだろうけど、年間6億円くらいあれば六本木ヒルズにオフィスを構えることができる。会計的に利益を出して税金を払うよりは、きれいなオフィスビルに引っ越したいという企業は多いようだ。

この前の新生銀行の決算は大赤字だった。以前就職活動で新生銀行に行ったら、面接官が公的資金を注入されているから、保養施設みたいなものは全部売却せざるを得ませんでしたと、やや被害者っぽく言っていた。続いて、その代わり住宅手当はたくさん出ます。給料もいいとかアピールしていた。また、役員報酬も高額であることが最近明らかになった。

さて、公務員が無駄遣いして税金が1億円使われたのと、民間企業が「節税」をしたりして税収が1億円減ったのはどう違うのだろう?結果だけ見れば同じように見える。国家が赤字で大変な思いをしているのに、ある種の企業は社員が会社の金で贅沢をして、結果的に国家の予算が減ってしまっている。しかし、公務員の場合は叩かれて民間企業は叩かれない。何故かと何人かに聞いたら、民間企業の人は働いているからいいとか、稼いでいるからいいとか言うのだけど、じゃあ公務員は働いていないのか、稼いでいないのか。

そんなこんなで、公務員ばかり批判されるのは可哀想だなと思った。日本の経済をここまで悪くした最大の原因は無責任な民間企業だと思う。自民党政治が悪いとか官僚が悪いと言っている人は偏見に満ちていたり、あるいは保身のために自分たちの贅沢三昧については何も言わないことが多いようだけど、今の日本の問題で政治の失策であることってどのくらいあるのかな。ほとんどは大手企業の仲良しグループ体質で、仲間(正社員)は手厚い福利厚生とか研修とかでお金をかけつつ、ひどい扱いをされる人を作り出したり、《醜活》を押し進めて産業の国際競争力をなくしたり、枚挙に遑がない。

ランキング

東大生ブログランキング登録しました。ぽちしていただけると喜びます。

東大生ブログランキング

漢字を注音符号にするWebサービス(4)

Posted by onaneetX.Q on 2月 6 2010 Add Comments

かなり雑なデザインだけどとりあえず完成。Webデザインはおいおいやることにします。追記:Googleで”漢字 注音符号 変換”を検索するとトップなので、たぶん唯一のサービスなんでしょう。

漢字→注音符号変換

サンプル

台湾のyahooあたりで適当なニュース記事を拾ってきてテスト。

入力「冬天針織款單品絕對不能錯過。草寫英文字母圖騰搭配合身的設計。不管是搭配襯裙或牛仔褲都很好看」
出力

ㄉㄨㄥ1
ㄊㄧㄢ1
ㄓㄣ1
ㄓ1
ㄎㄨㄢ3
ㄉㄢ1
ㄆㄧㄣ3
ㄐㄩㄝ2
ㄉㄨㄟ4
ㄅㄨ2/ㄅㄨ4
ㄋㄥ2
ㄘㄨㄛ4
ㄍㄨㄛ4
?
ㄘㄠ3
ㄒㄧㄝ3
ㄧㄥ1
ㄨㄣ2
ㄗ4
ㄇㄨ3
ㄊㄨ2
ㄊㄥ2
ㄉㄚ1
ㄆㄟ4
ㄏㄜ2
ㄕㄣ1
/ㄉㄧ2
ㄕㄜ4
ㄐㄧ4
?
ㄅㄨ2/ㄅㄨ4
ㄍㄨㄢ3
ㄕ4
ㄉㄚ1
ㄆㄟ4
ㄔㄣ4
ㄑㄩㄣ2
ㄏㄨㄛ4
ㄋㄧㄡ2
ㄗ1/ㄗ3
ㄎㄨ4
ㄉㄡ1
ㄏㄣ3
ㄏㄠ3/ㄏㄠ4
ㄎㄢ4/ㄎㄢ1

中国語でなくても問題なく処理できます。もちろん注音符号はありませんので”?”が表示されます。

入力「年が明けて1ヶ月ほど経ったため、ぼちぼち各地の大学のサマープログラムの案内が来るようになりました。」
出力

ㄋㄧㄢ2
?
ㄇㄧㄥ2
?
?
1 ?
?
yㄨㄜ4
?
?
ㄐㄧㄥ4
?
?
?
?
?
?
?
?
?
ㄍㄜ4
ㄉㄧ4
?
ㄉㄚ4
ㄒㄨㄜ2
?
?
?
?
?
?
?
?
?
?
ㄢ4
ㄋㄟ4
?
ㄌㄞ2
?
?
?
?
?
?
?
?
?
?

まだバグがありますね。月:yueが上手く変換できていない。直しておこう。

置き場について

Onaneet & Companyドメインに置くかネオニート商会にするか考えたけど、今後中国語関係を増やしていくなら卑猥なイメージのあるオナカンよりもネオニート商会か(株)自宅警備員の方がいいと思って暫定的に置きます。

ネオニート商会のWebサービス(というほど立派じゃないけど)には他にもいくつかあり

イートレードランキング

なんかは日常的に自分で使っています。これは近日中にもう少しマシなものにしたいと思っています。なんせ、イートレランキングってSBIランキング以前から使っているもので、よくこんなコードで動作するなと感心するほど汚いコードです。でも短くて案外合理的だったりする。新しいのはRuby + mechanize + Nokogiri + xpathを使ったモダンな設計になっています。mysqlにガシガシ記録していく方式なので時系列的な分析もできたり機能は飛躍的に向上するはず。

phaさんのトップページに色々Webサービスのリンクが張ってあるので、ああいう感じでそのうちまとめたい。

簡単な解説

前回までに作った漢字と注音符号の対応表(CSVファイル)をPHPで読んで、単に二分検索でごりごり計算しているだけの簡単なものです。文字が約20,000文字あるから、頭から探していくと文字数によっては大変なことになりそうなので、二分検索にしました。2^15 = 32,768なのでたかだか10回ちょっとの探索で全部の漢字を調べ尽くすことができるはずです。

PHPは久しぶりに使うから案外手こずった。PHPの文字列がどうなっているかとか知らないからね。C言語だと単なるcharの配列で、つまり数字の羅列だとわかっているから比較をするのも簡単です。

ランキング

東大生ブログランキング登録しました。ぽちしていただけると喜びます。

東大生ブログランキング