當前位置:首頁 > 科普 > 列表 > 正文

準確率達 91.74%!東南大學提出光伏電池缺陷檢測模型,首次引入神經(jīng)結構搜索
2024-03-04

乘著從全球吹來的「綠色發(fā)展、低碳轉型」東風,光伏 (photovoltaic, PV) 產(chǎn)業(yè)自進入 21 世紀以來,便以令世人驚嘆的速度迅猛向前發(fā)展。在我國,光伏發(fā)電更是呈現(xiàn)出前所未有的活力。根據(jù) 2023 年 4 月國家能源局公布的當年 1-3 月份全國電力工業(yè)統(tǒng)計數(shù)據(jù),截止當年 3 月底,我國光伏累計裝機量已超越水電,成為全國第二大電源。

隨著光伏發(fā)電的規(guī)?;瘧茫绾伪U瞎夥╇姺€(wěn)定以及可持續(xù)發(fā)展也成為行業(yè)研究的重要課題。光伏組件是光伏的基本單元,受生產(chǎn)鏈條較長、應用場景復雜等多種外因影響,在其制造、運輸、安裝等過程中都極易發(fā)生模塊破損,如果這些缺陷組件投入到實際運行中,極大可能造成整個供電系統(tǒng)功率降低甚至出現(xiàn)安全問題。因此,針對光伏的現(xiàn)場維護和故障診斷要求正變得越來越高。

目前,較為傳統(tǒng)的 PV 缺陷檢測手段包括電流-電壓 (I-V) 曲線 (current–voltage (I–V) curve)、紅外熱成像 (IRT) 等,但囿于識別精度限制,上述方法均無法有效識別微裂紋等潛在風險因素。卷積神經(jīng)網(wǎng)絡 (CNN) 憑借其強大的特征捕獲能力,結合基于高分辨率的電致發(fā)光 (electroluminescence, EL) 成像,正在成為 PV 缺陷檢測的主流方法。不過基于 CNN 的模型參數(shù)通常較大,且對硬件資源要求嚴格,因此很難在實際的工業(yè)項目中得到大規(guī)模部署。

為了同時滿足工業(yè)領域對缺陷檢測的精度和速度要求,來自東南大學自動化學院的張金霞教授團隊,提出了一種基于神經(jīng)結構搜索 (neural architecture search, NAS) 和知識蒸餾 (Knowledge Distillation) 的新型輕量級高性能光伏電池電致發(fā)光 (EL) 圖像缺陷自動檢測模型。

目前,該研究成果已發(fā)布在 arXiv 上,標題為「A lightweight network for photovoltaic cell defect detection in electroluminescence images based on neural architecture search and knowledge distillation」。

研究亮點:

* 提出一種用于光伏電池缺陷檢測的輕量級模型,準確率高達 91.74%;
* 首次將 NAS 引入到光伏電池缺陷檢測領域,用于自動化輕量級網(wǎng)絡設計,減少了手工設計的工作量;
* 引入知識蒸餾充分利用了各種先驗知識 (prior knowledge),且通過實驗證明了該設計對提高缺陷光伏電池識別能力的有效性。

論文鏈接:
https://arxiv.org/abs/2302.07455
關注公眾號,后臺回復「光伏電池」即可下載論文

數(shù)據(jù)集和數(shù)據(jù)增強
本次研究的數(shù)據(jù)集為一個公共光伏電池數(shù)據(jù)集,含 2,624 張分辨率為 300 x 300 像素的光伏電池 EL 圖像,包括單晶和多晶兩種類型。研究團隊以 0.5 為閾值,將樣本分為功能樣本和缺陷樣本,將其中 75% 的圖像,即 1,970 張圖像隨機選擇為訓練集,剩余的 654 張圖像為測試集。訓練集進一步被平分為搜索訓練集與搜索測試集。所有圖片的大小均調整為 150 x 150 像素。


數(shù)據(jù)集劃分

數(shù)據(jù)增強是在小幅度增加數(shù)據(jù)的情況下,從原始數(shù)據(jù)中獲得更多的表征,提升原始數(shù)據(jù)的質量,從而幫助模型減少過擬合,并增強魯棒性。數(shù)據(jù)增強操作包括隨機水平翻轉、隨機垂直翻轉、在 (-2°,2°) 范圍內(nèi)隨機旋轉、在 {0°、90°、180°、270°} 范圍內(nèi)隨機旋轉和隨機仿射變換。

該研究提出的模型由 Normal cells 和 Reduction cells 堆疊而成,通過搜索算法得到的內(nèi)部結構如下圖所示:


基于公共PV數(shù)據(jù)集上搜索得到的內(nèi)部結構

一種基于 NAS 和知識蒸餾的缺陷檢測方法
該輕量級網(wǎng)絡設計架構如下圖所示。研究人員通過 NAS 算法在設計好的搜索空間中自動獲得了輕量級網(wǎng)絡,并通過知識蒸餾充分利用了現(xiàn)有預訓練大規(guī)模模型獲取的先驗知識,從而提高模型性能。


輕量級網(wǎng)絡設計架構

首先,研究團隊采用了基于連續(xù)梯度的 NAS 框架 DARTS 來自動設計用于光伏電池缺陷檢測的模型,基于 DARTS 的快速搜索特性,研究人員進一步考慮了 PV 缺陷的視覺多尺度特征,設計了合適的搜索空間來增強對不同缺陷尺寸的特征識別。


為輕量級缺陷分類網(wǎng)絡設計的搜索空間

輕量級網(wǎng)絡所采用的搜索空間主要由兩種單元結構堆疊而成,即 5 個 normal cell 和 4 個 reduction cell。設置 normal cell 是為了保持輸入的大小,設置 reduction cell 是具有下采樣的功能。如上圖所示,每個單元融合前兩個單元尺度不同的兩個特征,第一個 normal cell 將相同的特征作為兩次輸入。


輕量化網(wǎng)絡的詳細結構

前 3 個 reduction cell 執(zhí)行下采樣和信道擴展,最后一個 reduction cell 的信道數(shù)量保持不變。所提出的輕量級網(wǎng)絡將輸入的光伏電池分類為功能正?;蛴腥毕?。

其次,知識蒸餾是最有效的模型壓縮方法之一,采用 Teacher-Student 模式,能夠將知識從 Teacher 模型轉移到 Student 模型。那些無法利用預訓練模型中先驗知識的網(wǎng)絡架構,可以通過學習 Teacher 網(wǎng)絡的知識來提高性能。在該實驗中,由于輕量級網(wǎng)絡只能從頭開始訓練,通過使用知識蒸餾,可以更好地利用先驗知識進行訓練。

研究人員轉移了 4 種不同的知識先驗——注意力信息、特征信息、logit 信息和面向任務的信息,以增強對光伏電池缺陷檢測任務的蒸餾效果。


知識蒸餾概覽

模型性能出眾
研究團隊將其所提出的輕量級模型與 Teacher 模型以及其他研究進行了比較,并在私有數(shù)據(jù)集上進行了測試,進一步證明該網(wǎng)絡架構的有效性。

研究團隊將該模型與手動設計的 6 個神經(jīng)網(wǎng)絡和公開數(shù)據(jù)集上的 Teacher 模型,在 200 個相同的 epoch 下進行了對比,結果如下圖所示:


準確度/平衡準確度/精確度/召回率/F1分值的對比

結果顯示,該研究提出的輕量級模型在測試集上的精度達到了 91.74%,甚至超過了 Teacher 模型水平的 1.22%。同時,該研究所提出的模型參數(shù)量更小,相比部分經(jīng)典大模型所用資源更少,更易部署在實際的終端設備上。

上圖為模型在識別缺陷光伏電池和功能正常的光伏電池上的準確率對比,研究人員所提模型在缺陷光伏電池識別上的正確率達到 86.28%,遠超其他方法。

由此得出結論,與其他手動設計的模型相比,研究團隊提出的模型不僅能夠通過 NAS 算法自動搜索,減少了工作量,同時還能夠在相對輕量級的架構下取得更高性能,證明了所提方法的有效性。

為進一步評估所提模型的性能,研究團隊又提供了單晶或多晶 PV 上得性能對比,如表 4 所示:


左表:相同數(shù)據(jù)增強條件下, ELPV 公共數(shù)據(jù)集中僅單晶光伏電池與其他方法的對比
右表:相同數(shù)據(jù)增強條件下, ELPV 公共數(shù)據(jù)集中僅多晶光伏電池與其他方法的對比

在單晶 PV 電池上,所提模型的每一項指標都達到了最高水平,至于更難處理的多晶模型,該模型也遠超其他模型。

效率和泛化能力
在終端設備上的部署需要綜合考慮模型規(guī)模和計算量,為了測試效率,研究團隊在 CPU 平臺 (Intel i9-10980XE 24.75M Cache, 3 GHz) 上對該模型進行了評估。


CPU平臺上的效率比較

綜合評估發(fā)現(xiàn),該模型遠遠優(yōu)于其他小型模型、甚至大型經(jīng)典模型。該輕量化模型可以滿足一些常見的低功耗嵌入式設備的部署需求,如 Raspberry Pi-4B (4GB, 15W, 9~10 GFLOPS) 和 NVIDLA Jetson Nano (4GB, 10W, 7.368 GEFLOPS FP64)。

為了驗證模型在不同數(shù)據(jù)源上的泛化性能,研究團隊在一個私有光伏電池數(shù)據(jù)集上進行了模型訓練。從 6 x 10、6 x 12、6 x 24 三種規(guī)格的光伏電池中提取出了8,580 張像素分辨率為 256 x 256 的圖像,其中缺陷樣品 482 張,功能正常樣品 8,089 張。

結果顯示,該模型在平衡精度和缺陷樣本精度上分別比 Teacher 模型高出約 2.3% 和 5.7%。與其他方法相比差距很大。該模型對缺陷樣本的準確率達到 94.26%,特別是在現(xiàn)實場景中表現(xiàn)出更好的缺陷識別能力。如下圖所示:


在相同數(shù)據(jù)增強下,與其他方法在私有數(shù)據(jù)集上的對比

始于百年前,光伏發(fā)電仍是綠色能源的「寵兒」
作為新能源的代表,關于光伏發(fā)電技術的研究實際上已有超百年之久。1839 年,法國物理學家貝克勒爾首次發(fā)現(xiàn)了光伏效應,在此之后,經(jīng)過各國科學家的不斷鉆研和努力,第一塊實用光伏電池終于在 1954 年問世。如今,光伏產(chǎn)業(yè)隨著全球綠色發(fā)展的腳步又一次乘上了東風,尤其在國內(nèi)明確提出「雙碳」目標之后,光伏產(chǎn)業(yè)的發(fā)展可謂前途一片大好。

這從不久前國家能源局發(fā)布的 2023 年全國電力工業(yè)統(tǒng)計數(shù)據(jù)便可見微知著。數(shù)據(jù)顯示,截止 12 月底,全國累計發(fā)電裝機容量約 29.2 億千瓦,同比增長 13.9%,其中,太陽能發(fā)電裝機容量約 6.1 億千瓦,實現(xiàn)同比 55.2% 的增長。

從政策方面來看,2019 年 5 月 30 日,國家能源局發(fā)布了《關于 2019 年風電、光伏發(fā)電項目建設有關事項的通知》,其中明確了優(yōu)先推進無補貼的平價上網(wǎng)項目建設,再開展需要國家補貼項目的競爭配置工作。這表明了我國光伏產(chǎn)業(yè)雖然已經(jīng)進入穩(wěn)定發(fā)展的成熟期,但推動光伏產(chǎn)業(yè)發(fā)展也仍然會是未來國內(nèi)實現(xiàn)能源結構轉型的重點工作。

2023 年,國家能源局、國家發(fā)改委等多個部門相繼印發(fā)多個關于能源工作的文件,其中都明確了光伏是 2023 年能源行業(yè)的重點方向。

而本次研究則從產(chǎn)業(yè)層面為光伏產(chǎn)業(yè)的發(fā)展帶來了利好消息,張金霞教授團隊的研究成果從實際的應用側為光伏電池缺陷檢測提供有效工具,尤其是引入了 NAS 與知識蒸餾,為應用場景設計模型提供了一種新的思路,這或許將有望為產(chǎn)業(yè)就深度學習在光伏領域應用帶來新的啟迪,從而讓技術與產(chǎn)業(yè)更好的結合。

開通會員,享受整站包年服務立即開通 >