最新

Miyako Shogi System

コツコツ改良、へこたれない
2014| 1|
2013| 12|
2012| 01| 02| 04| 05| 06| 07| 08| 09| 10|
2011| 01| 02| 03| 04| 05| 07| 08| 10| 11| 12|
2010| 02| 03| 06| 07| 08| 09| 10| 12|

2010/08/22

コンピューター将棋の自己対戦の棋譜を学習用データに用いる

前から考えていたが、人対人の棋譜では悪手やポカによる誤った学習の懸念がある。コンピューター将棋の自己対戦の棋譜を用いればその危険性は排除できる。

GPS対GPSによる500局の棋譜で学習をさせてみた。学習条件は下記と同じ。

12844052866873884795464857265265712161312

対戦条件は、持ち時間10分、秒読み30秒と、持ち時間3分、秒読み30秒と持ち時間1分、秒読み15秒で、評価関数に5までの乱数を加えて同じ棋譜になるのを防いでいる。下記の人対人に比べると、わずかな違いは有るが、ほぼ同じ結果が得られた。

Bonanza対Bonanzaによる棋譜も現在作成中である。

2010/08/11

評価関数の自動学習の結果

BonanzaMethodによる駒割自動学習の結果

アマチュア竜王戦(全82局)

12842653366270685495966658365565112071319

アマチュアレーティング戦(全576局)

12843153566571685995068257165665312131304

朝日名人戦(全460局)

12843053266671185296066457166365512111310

グランドチャンピオン戦(全87局)

12843553667070285794466558765965912161306

どの棋戦でも似通った値となった。

歩を128に固定し、駒割合計が10000に正規化した。駒取りと成りだけの特徴量で、後の評価値はゼロを返す。学習終了は成銀の価値が銀より11低くなったとき。過学習を防ぐコスいやり方。学習開始の駒割は次のとおり。

128410480600690850101062060065067512301380
リンクはご自由に (Miyako Shogi System Kyoto Japan)

ダウンロードのページ

Lighttpd

DreamPlug