融合動作退出和軟獎勵的強化學(xué)習(xí)知識推理方法
計算機工程與應(yīng)用
頁數(shù): 8 2023-11-30
摘要: 針對深度強化學(xué)習(xí)推理方法中存在的過擬合以及稀疏獎勵的問題,提出了一種融合動作退出和軟獎勵的強化學(xué)習(xí)知識推理方法(knowledge reasoning method of reinforcement learning integrating action withdrawal and soft reward,AS-KRL)。AS-KRL使用門控循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)對歷史路徑信... (共8頁)
開通會員,享受整站包年服務(wù)