基于集成DQN的自適應(yīng)邊緣緩存算法
南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版)
頁(yè)數(shù): 11 2024-07-01
摘要: 工業(yè)應(yīng)用中,動(dòng)態(tài)多變的流式數(shù)據(jù)特性使強(qiáng)化學(xué)習(xí)算法在訓(xùn)練過(guò)程中很難在模型收斂性與知識(shí)遺忘之間實(shí)現(xiàn)很好的平衡。考慮工業(yè)現(xiàn)場(chǎng)內(nèi)容請(qǐng)求與當(dāng)前生產(chǎn)任務(wù)具有高度相關(guān)性,提出一種基于集成深度Q網(wǎng)絡(luò)算法(Integrated Deep Q-Network, IDQN)的自適應(yīng)緩存策略。算法在離線階段利用不同歷史任務(wù)數(shù)據(jù),訓(xùn)練并保存多個(gè)歷史任務(wù)模型。在線階段每當(dāng)檢測(cè)到實(shí)時(shí)數(shù)據(jù)流的任務(wù)特征發(fā)生變化... (共11頁(yè))
開通會(huì)員,享受整站包年服務(wù)