當(dāng)前位置:首頁 > 科技文檔 > 數(shù)學(xué) > 正文

基于距離信息的追逃策略:信念狀態(tài)連續(xù)隨機(jī)博弈

自動化學(xué)報 頁數(shù): 13 2024-04-15
摘要: 追逃問題的研究在對抗、追蹤以及搜查等領(lǐng)域極具現(xiàn)實(shí)意義.借助連續(xù)隨機(jī)博弈與馬爾科夫決策過程(Markov decision process, MDP),研究使用測量距離求解多對一追逃問題的最優(yōu)策略.在此追逃問題中,追捕群體僅領(lǐng)導(dǎo)者可測量與逃逸者間的相對距離,而逃逸者具有全局視野.追逃策略求解被分為追博弈與馬爾科夫決策兩個過程.在求解追捕策略時,通過分割環(huán)境引入信念區(qū)域狀態(tài)以估計逃...

開通會員,享受整站包年服務(wù)立即開通 >
科技文檔