事件觸發(fā)式多智能體分層安全強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃
控制與決策
頁(yè)數(shù): 8 2024-06-06
摘要: 針對(duì)深度強(qiáng)化學(xué)習(xí)序貫決策過(guò)程中面臨的動(dòng)作安全性問(wèn)題,研究一種事件觸發(fā)式多智能體分層安全強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃方法.首先,基于受限馬爾可夫決策模型,構(gòu)建一種具備安全約束的多智能體深度確定性策略梯度框架,該框架針對(duì)不同狀態(tài)空間,以事件觸發(fā)的方式實(shí)現(xiàn)運(yùn)動(dòng)策略的分層學(xué)習(xí);然后,通過(guò)引入李雅普諾夫評(píng)價(jià)網(wǎng)絡(luò),建立帶有條件約束的目標(biāo)動(dòng)作選擇機(jī)制,并利用拉格朗日乘子法,解決多目標(biāo)約束求解困難的問(wèn)題,... (共8頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)