2010/12/29
■ 評価関数の自動学習の結果(その4)
誤差関数をsigmoid関数よりtanh関数へ変更。学習に使用する棋譜はこの10年分のプロの棋譜より無作為に1000棋譜を抽出した。
駒割
歩 | 香 | 桂 | 銀 | 金 | 角 | 飛 | と | 杏 | 圭 | 全 | 馬 | 龍 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
128 | 473 | 552 | 690 | 765 | 920 | 1017 | 843 | 712 | 762 | 736 | 1161 | 1236 |
取った回数
歩 | 香 | 桂 | 銀 | 金 | 角 | 飛 | と | 杏 | 圭 | 全 | 馬 | 龍 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
23448 | 2474 | 4538 | 6376 | 5564 | 3536 | 2100 | 3092 | 524 | 1668 | 1046 | 2904 | 960 |
成った回数
と | 杏 | 圭 | 全 | 馬 | 龍 |
---|---|---|---|---|---|
4198 | 724 | 2044 | 1356 | 4040 | 2312 |
学習回数 16150540
平均誤差 -0.4990
学習率を2.0と1.0で2回学習を行った。
誤差関数の係数は1.386e-3で、飛車1枚差でJ=0.88とした。これは将棋24での飛車落ちのレーティング差350からELO ratingにより求めた。ちなみにチェスのKnight Capはpawn1枚でJ=0.25である。
ペナルティのかけ方は 特徴の出現回数×駒割×ペナルティ率
である。ペナルティ率は0.000002とした。