基于改進(jìn)Q學(xué)習(xí)算法的AUV路徑規(guī)劃
摘要: 針對欠驅(qū)動AUV全局路徑規(guī)劃問題,提出一種輕量級改進(jìn)Q學(xué)習(xí)算法。設(shè)計(jì)距離獎勵函數(shù)加快學(xué)習(xí)速率,提高算法穩(wěn)定性,結(jié)合ε貪婪策略和Softmax策略提供一種平衡探索與利用的機(jī)制,根據(jù)AUV運(yùn)動約束簡化動作集合提高計(jì)算時(shí)間。仿真結(jié)果表明,改進(jìn)的算法能夠高效解決AUV路徑規(guī)劃問題,提升算法穩(wěn)定性與適用范圍。相比較傳統(tǒng)Q學(xué)習(xí)算法,執(zhí)行短距離任務(wù)時(shí),算法學(xué)習(xí)效率提高90%,路徑長度縮短7.... (共5頁)
自主水下航行器 路徑規(guī)劃 Q學(xué)習(xí) Softmax策略 距離獎懲機(jī)制
開通會員,享受整站包年服務(wù)