語音驅(qū)動說話數(shù)字人視頻生成方法綜述
電子科技大學(xué)學(xué)報
頁數(shù): 11 2024-11-30
摘要: 近年來,深度學(xué)習(xí)技術(shù)的飛速發(fā)展極大地推動了虛擬數(shù)字人技術(shù)的進(jìn)步,尤其是在說話數(shù)字人視頻生成方面。該領(lǐng)域的研究在視頻翻譯、電影制作和虛擬助手等多個場景中展現(xiàn)出廣闊的應(yīng)用前景。該文對當(dāng)前語音驅(qū)動說話數(shù)字人視頻生成方法及研究現(xiàn)狀進(jìn)行了梳理與總結(jié),并深入探討了關(guān)鍵技術(shù)、數(shù)據(jù)集以及評估策略。在關(guān)鍵技術(shù)方面,生成對抗模型、擴(kuò)散模型和神經(jīng)輻射場等人工智能技術(shù)均發(fā)揮了重要作用。數(shù)據(jù)集的規(guī)模和多... (共11頁)
開通會員,享受整站包年服務(wù)