本ネタ

Posted by onaneetX.Q on 2月-4-2009 one Commented   add to hatena hatena.comment (0) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 0

本を書きたいと願っているが、なかなか難しいもので遅々として進まない。今のネタはネットワークプログラミングと、スクレーピングである。スクレーピングというのはネットから情報をかき集めるものである。

ネットワークプログラミング

Javaネットワークプログラミングの真髄

著者/訳者:Array

出版社:ソフトバンク クリエイティブ( 2007-04-28 )

定価:¥ 3,885

大型本 ( 408 ページ )

ISBN-10 : 4797341866

ISBN-13 : 9784797341867


Javaのネットワークプログラミング本ってありそうでないなーと思っていたら、あった。2007年出版だからかなり長いこと見逃していたことになる。内容もnioについて触れているし、まあいい本だと思う。ただし応用がないので差別化は図れるかな。

スクレーピング

Javaスパイダーツールサンプル&クックブック―自動アクセス&収集・加工プログラム

著者/訳者:Array

出版社:秀和システム( 2005-05 )

定価:¥ 2,730

単行本 ( 377 ページ )

ISBN-10 : 4798010618

ISBN-13 : 9784798010618



Spidering hacks―ウェブ情報ラクラク取得テクニック101選

著者/訳者:Kevin Hemenway Tara Calishain

出版社:オライリー・ジャパン( 2004-05 )

定価:¥ 3,675

単行本 ( 516 ページ )

ISBN-10 : 4873111870

ISBN-13 : 9784873111872



集合知プログラミング

著者/訳者:Array

出版社:オライリージャパン( 2008-07-25 )

定価:¥ 3,570

大型本 ( 392 ページ )

ISBN-10 : 4873113644

ISBN-13 : 9784873113647


こっちが本題。細かい技術の下書きは別のブログに書くことにして、ざっくり説明することにする。

最終的な目標は自動的に株取引をしていて寝ているだけで大金持ちになれるというものである。それはあまりに遠大な計画なので手近な話から。まず株価のデータを刻々と取らないといけない。以前は携帯サイトにアクセスするのが簡単かと思ったが、頻繁にリロードしていると証券会社から叱られるらしい。マウス連打程度の間隔(1秒に1回とか)に押さえないといけない。そうすると1分間に取得できるのは60銘柄だけになり、逆に言うと60銘柄を取得すると1銘柄の更新間隔は1分おきになってしまう。これはリアルタイムにはほど遠い。

そういうわけで、いくつかの証券会社を見て回ったが、どうもSBI証券がよさそうな感じがする。

sbisec
SBI証券のポートフォリオ画面

このようなリストを簡単に作れる点でメリットがある。どうも50銘柄まで一覧にできるようだ。これを30秒ごとにリロード(このくらいなら迷惑にならんでしょう、マウス連打する人よりはよほど転送量は少ないし、また画像とか余分なものを読まない)してゴリゴリ切り出す。

e38394e382afe38381e383a3-3
監視リスト
直前(30秒前)と比較して赤と青で表示

今のところロジックとプレゼンテーションが分離されていないとかごちゃごちゃになっているけど、とりあえずこういうことができる。そこで、本番では得たデータをデータベースにどんどん放り込むプログラムにしたい。あとはRという統計処理のソフト(実に検索しにくい名前だと思う)で時系列分析をして、またデータベースに放り込み、プレゼンテーション部分を作る。

Rによる時系列分析入門

著者/訳者:Array

出版社:シーエーピー出版( 2008-06 )

定価:¥ 3,150

単行本 ( 393 ページ )

ISBN-10 : 4916092910

ISBN-13 : 9784916092915


評価関数の自動生成

ところで、将棋ソフトのBonanzaというのがある。突如現れて非常に強かったことで話題になった。プロがブログで「プロが平手で餌食になった」とか「奨励会有段者クラスがコロコロ負けているらしい」とか「奨励会の三段くらい」だそうだ。女流は2級からなので、女流ではBonanzaには勝てないかも知れない(女流は奨励会で4段になった人はいないそうだ)。

Bonanzaの画期的なところはボナンザメソッドという棋譜から評価関数を自動生成するところにあるそうだ。逆に言うと今までのソフトはプログラマの棋力が評価関数に影響して、将棋が強くプログラミングもできる人が勝っていたらしい。

で、このテーマはいま結構流行っているらしく、是非盛り込みたいと思っている点の一つである。つづく。

ランキング

東大生ブログランキング登録しました。ぽちしていただけると喜びます。

東大生ブログランキング

  • はじめまして、こんにちは、
    いろいろな本を読んでおられるのですね。
    少しだけ、自分が持っている才能や能力を
    もっと、いろいろな方向に生かして見ませんか?
    きっと生かせられる場所があると思います。
    では!

Post a Comment

(required. But it will not be published)