基于MADDPG算法的匝道合流區(qū)多車協(xié)同控制
摘要: 為了保障匝道合流區(qū)的安全高效通行,提出了一種基于多智能體強(qiáng)化學(xué)習(xí)算法的多車協(xié)同控制方法。以提升系統(tǒng)計(jì)算效率為目標(biāo),設(shè)計(jì)了基于多智能體確定性策略梯度算法(MADDPG)的分布式訓(xùn)練框架;針對(duì)智能體模型難以應(yīng)對(duì)連續(xù)車流場(chǎng)景的問(wèn)題,通過(guò)構(gòu)建相對(duì)靜止環(huán)境,改進(jìn)策略更新梯度,保障智能體面向連續(xù)車流環(huán)境的平穩(wěn)性;拆分匝道合流區(qū)場(chǎng)景為準(zhǔn)備區(qū)和匯入?yún)^(qū),分別依據(jù)兩區(qū)域控制目標(biāo)設(shè)計(jì)了狀態(tài)、動(dòng)作空間... (共11頁(yè))
多智能體確定性策略梯度算法(MADDPG) 多智能體強(qiáng)化學(xué)習(xí) 多車協(xié)同控制 匝道合流
開(kāi)通會(huì)員,享受整站包年服務(wù)