當前位置:首頁 > 科技文檔 > 計算機硬件技術(shù) > 正文

保證延遲敏感型任務(wù)服務(wù)質(zhì)量的情況下利用流處理器內(nèi)所有并行性以最大化系統(tǒng)吞吐

中國科學:信息科學 頁數(shù): 18 2024-12-04
摘要: 為了應(yīng)對越來越高的算力需求, GPU在流處理器內(nèi)集成了多種通用計算單元及專用計算單元(FP32 Core, INT32 Core, FP64 Core, Tensor Core, RT Core).任意一種GPU內(nèi)可能包含以上計算單元中的部分單元.盡管GPU的流處理器內(nèi)存在著多種計算單元,它們之間的計算并行性無法從硬件設(shè)計白皮書中獲知.與此同時,現(xiàn)有調(diào)度接口無法支持使用不同計算... (共18頁)

開通會員,享受整站包年服務(wù)