本を書きたいと願っているが、なかなか難しいもので遅々として進まない。今のネタはネットワークプログラミングと、スクレーピングである。スクレーピングというのはネットから情報をかき集めるものである。
ネットワークプログラミング
著者/訳者:Array
出版社:ソフトバンク クリエイティブ( 2007-04-28 )
定価:¥ 3,885
大型本 ( 408 ページ )
ISBN-10 : 4797341866
ISBN-13 : 9784797341867
Javaのネットワークプログラミング本ってありそうでないなーと思っていたら、あった。2007年出版だからかなり長いこと見逃していたことになる。内容もnioについて触れているし、まあいい本だと思う。ただし応用がないので差別化は図れるかな。
スクレーピング
Javaスパイダーツールサンプル&クックブック―自動アクセス&収集・加工プログラム
著者/訳者:Array
出版社:秀和システム( 2005-05 )
定価:¥ 2,730
単行本 ( 377 ページ )
ISBN-10 : 4798010618
ISBN-13 : 9784798010618
Spidering hacks―ウェブ情報ラクラク取得テクニック101選
著者/訳者:Kevin Hemenway Tara Calishain
出版社:オライリー・ジャパン( 2004-05 )
定価:¥ 3,675
単行本 ( 516 ページ )
ISBN-10 : 4873111870
ISBN-13 : 9784873111872
著者/訳者:Array
出版社:オライリージャパン( 2008-07-25 )
定価:¥ 3,570
大型本 ( 392 ページ )
ISBN-10 : 4873113644
ISBN-13 : 9784873113647
こっちが本題。細かい技術の下書きは別のブログに書くことにして、ざっくり説明することにする。
最終的な目標は自動的に株取引をしていて寝ているだけで大金持ちになれるというものである。それはあまりに遠大な計画なので手近な話から。まず株価のデータを刻々と取らないといけない。以前は携帯サイトにアクセスするのが簡単かと思ったが、頻繁にリロードしていると証券会社から叱られるらしい。マウス連打程度の間隔(1秒に1回とか)に押さえないといけない。そうすると1分間に取得できるのは60銘柄だけになり、逆に言うと60銘柄を取得すると1銘柄の更新間隔は1分おきになってしまう。これはリアルタイムにはほど遠い。
そういうわけで、いくつかの証券会社を見て回ったが、どうもSBI証券がよさそうな感じがする。
このようなリストを簡単に作れる点でメリットがある。どうも50銘柄まで一覧にできるようだ。これを30秒ごとにリロード(このくらいなら迷惑にならんでしょう、マウス連打する人よりはよほど転送量は少ないし、また画像とか余分なものを読まない)してゴリゴリ切り出す。
今のところロジックとプレゼンテーションが分離されていないとかごちゃごちゃになっているけど、とりあえずこういうことができる。そこで、本番では得たデータをデータベースにどんどん放り込むプログラムにしたい。あとはRという統計処理のソフト(実に検索しにくい名前だと思う)で時系列分析をして、またデータベースに放り込み、プレゼンテーション部分を作る。
著者/訳者:Array
出版社:シーエーピー出版( 2008-06 )
定価:¥ 3,150
単行本 ( 393 ページ )
ISBN-10 : 4916092910
ISBN-13 : 9784916092915
評価関数の自動生成
ところで、将棋ソフトのBonanzaというのがある。突如現れて非常に強かったことで話題になった。プロがブログで「プロが平手で餌食になった」とか「奨励会有段者クラスがコロコロ負けているらしい」とか「奨励会の三段くらい」だそうだ。女流は2級からなので、女流ではBonanzaには勝てないかも知れない(女流は奨励会で4段になった人はいないそうだ)。
Bonanzaの画期的なところはボナンザメソッドという棋譜から評価関数を自動生成するところにあるそうだ。逆に言うと今までのソフトはプログラマの棋力が評価関数に影響して、将棋が強くプログラミングもできる人が勝っていたらしい。
で、このテーマはいま結構流行っているらしく、是非盛り込みたいと思っている点の一つである。つづく。
ランキング
東大生ブログランキング登録しました。ぽちしていただけると喜びます。












はじめまして、こんにちは、
いろいろな本を読んでおられるのですね。
少しだけ、自分が持っている才能や能力を
もっと、いろいろな方向に生かして見ませんか?
きっと生かせられる場所があると思います。
では!