多智能體強化學習理論及其應(yīng)用綜述
摘要: 強化學習是一種用于解決序列決策問題的常用機器學習方法,核心思想是讓智能體與環(huán)境交互獲得反饋,從而逐步學會最佳策略.隨著實際應(yīng)用對計算能力和數(shù)據(jù)規(guī)模的要求不斷提高,單體智能轉(zhuǎn)向群體智能逐漸成為人工智能未來發(fā)展的必然趨勢,這為強化學習帶來諸多新的機遇和挑戰(zhàn).文中首先從深度多智能體強化學習概念著手,針對目前的理論困境,如可拓展性較差、效用分配較難、探索-利用困境、環(huán)境非穩(wěn)態(tài)、信息部分... (共22頁)
深度強化學習 多智能體 效用分配 人類反饋 馬爾科夫決策過程
開通會員,享受整站包年服務(wù)