當(dāng)前位置:首頁 > 科技文檔 > 計算機軟件及計算機應(yīng)用 > 正文

視覺Transformer(ViT)發(fā)展綜述

計算機科學(xué) 頁數(shù): 16 2024-10-12
摘要: 視覺Transformer(Vision Transformer, ViT)是基于編碼器-解碼器結(jié)構(gòu)的Transformer改進模型,已經(jīng)被成功應(yīng)用于計算機視覺領(lǐng)域。近幾年基于ViT的研究層出不窮且效果顯著,基于該模型的工作已經(jīng)成為計算機視覺任務(wù)的重要研究方向,因此針對近年來ViT的發(fā)展進行概述。首先,簡要回顧了ViT的基本原理及遷移過程,并分析了ViT模型的結(jié)構(gòu)特點和優(yōu)勢;然... (共16頁)

開通會員,享受整站包年服務(wù)