2010/08/22
■ コンピューター将棋の自己対戦の棋譜を学習用データに用いる
前から考えていたが、人対人の棋譜では悪手やポカによる誤った学習の懸念がある。コンピューター将棋の自己対戦の棋譜を用いればその危険性は排除できる。
GPS対GPSによる500局の棋譜で学習をさせてみた。学習条件は下記と同じ。
歩 | 香 | 桂 | 銀 | 金 | 角 | 飛 | と | 杏 | 圭 | 全 | 馬 | 龍 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
128 | 440 | 528 | 668 | 738 | 847 | 954 | 648 | 572 | 652 | 657 | 1216 | 1312 |
対戦条件は、持ち時間10分、秒読み30秒と、持ち時間3分、秒読み30秒と持ち時間1分、秒読み15秒で、評価関数に5までの乱数を加えて同じ棋譜になるのを防いでいる。下記の人対人に比べると、わずかな違いは有るが、ほぼ同じ結果が得られた。
Bonanza対Bonanzaによる棋譜も現在作成中である。