當前位置:首頁 > 科技文檔 > 體育 > 正文

結合A2C和手牌估值方法的麻將博弈研究

重慶理工大學學報(自然科學) 頁數(shù): 8 2024-05-15
摘要: 針對大眾麻將中對手牌信息利用不充分的問題,提出了手牌估值方法,并設計了基礎麻將程序(MJE)。為進一步提升麻將AI的博弈能力,使用深度強化學習方法設計了麻將AI(MJE-RL)。首先,通過MJE自對弈生成深度學習的訓練數(shù)據(jù)。其次,根據(jù)訓練集、測試集和對比實驗的結果,選擇效果最好的模型作為強化學習的預訓練模型。最后,使用優(yōu)勢演說-評論家模型作為強化學習的主要框架,將訓練好的深度學... (共8頁)

開通會員,享受整站包年服務立即開通 >