7月度強化学習勉強会実施しました


7月度強化学習勉強会実施しました。
第3回目の強化学習の勉強会です。とはいえ、実際にはまた強化学習には入っていないのですが、今はその土台となるリバーシのプロトタイプ作成中です。具体的にはこんなことをしました。

・IF文でリバーシの対戦ロジックを作成する(角を必ず取るとか、)
・各自から考えたロジックの発表
・できたメンバーで対戦

対戦では、ビジュアルモード(実際にどこに石を置いたかが画面表示される)とシュミレーションモード(全員を50回づつ対戦)で行いました。結果は

【ビジュアルモード】
・勝)MYさん(入社2年目) 負)MRさん(入社7年目)
・勝)Oさん(入社32年目) 負)MYさん(入社2年目)
・勝)MRさん(入社7年目) 負)Oさん(入社32年目)
で仲良く、1勝1敗だったのですが、

【シュミレーションモード】
ここでTさん(入社4年目)も参加し、実施し結果は、
Oさん(入社32年目) 勝率:34.0%
MRさん(入社7年目) 勝率:33.0%
MYさん(入社2年目) 勝率:73.7%
Tさん(入社4年目) 勝率:52.7%

で、MYさん(入社2年目)の圧勝となりました。本当の実力はシュミレーションモードでないとわかりませんが、ビジュアルモードは、実際にコマを打つのが見えるので「なぜそこを取る?」みたいな感じだったりするので、非常に面白かったです。

次回からは、対戦ロジックに強化学習・深層強化学習を取り入れる予定で、講師チームのメンバーが準備してくれています。楽しみです!