當(dāng)前位置：首頁(yè) > 技術(shù)頻道 > 技術(shù)百科 > 基于 VSD-YOLOv5s 的輕量化注塑齒輪缺陷檢測(cè)

基于 VSD-YOLOv5s 的輕量化注塑齒輪缺陷檢測(cè)

時(shí)間：2024-06-11來(lái)源：組合機(jī)床與自動(dòng)化加工技術(shù)

導(dǎo)語(yǔ)：針對(duì)注塑齒輪加工過(guò)程中在線缺陷檢測(cè)存在的識(shí)別速度較慢、識(shí)別精度較低等問(wèn)題，提出了一種基于 ShuffleNetV2 主干網(wǎng)絡(luò)的改進(jìn) YOLOv5s 網(wǎng)絡(luò)模型。

　　針對(duì)注塑齒輪加工過(guò)程中在線缺陷檢測(cè)存在的識(shí)別速度較慢、識(shí)別精度較低等問(wèn)題，提出了一種基于 ShuffleNetV2 主干網(wǎng)絡(luò)的改進(jìn) YOLOv5s 網(wǎng)絡(luò)模型。在 YOLOv5s 網(wǎng)絡(luò)模型的基礎(chǔ)上將原來(lái)的 C3 主干網(wǎng)絡(luò)結(jié)構(gòu)替換為輕量化 ShuffleNetV2 結(jié)構(gòu)，降低模型參數(shù)量和尺寸，提升識(shí)別速度。引入 SE 注意力機(jī)制，并通過(guò) DIOU-NMS 方法去除冗余框，減少錯(cuò)誤抑制，提高識(shí)別精度。實(shí)驗(yàn)結(jié)果表明: 相比于原模型，改進(jìn)的模型識(shí)別準(zhǔn)確率提升了 0.9%，平均識(shí)別精度提升了 1.7% ，識(shí)別速度提升了 5 fps，滿足注塑齒輪表面缺陷在線識(shí)別的速度以及精度要求。

　　在注塑齒輪生產(chǎn)過(guò)程中，由于溫度、注塑時(shí)間等因素影響，齒輪可能出現(xiàn)表面黑點(diǎn)、輪齒變形、輪齒缺失等缺陷。由于齒輪缺陷檢測(cè)過(guò)程往往十分復(fù)雜，檢測(cè)設(shè)備也較為昂貴，因此在實(shí)際生產(chǎn)中迫切需要對(duì)齒輪進(jìn)行快速檢測(cè)和分析。傳統(tǒng)齒輪制造過(guò)程中的檢測(cè)方式以人工檢測(cè)為主，但是人工檢測(cè)不可避免地會(huì)出現(xiàn)錯(cuò)檢、漏檢等問(wèn)題。機(jī)器視覺(jué)檢測(cè)是一種非接觸式無(wú)損檢測(cè)，在高速、精細(xì)和重復(fù)的制造過(guò)程中更加可靠，與傳統(tǒng)的檢測(cè)方法相比，具有不可替代的優(yōu)越性。

　　陳碩等提出利用廣泛的 Canny 算子提取出待檢齒輪的輪廓，通過(guò)計(jì)算機(jī)求解出輪廓之間的距離，但該方法可能在提取輪廓時(shí)出現(xiàn)誤差且識(shí)別速度較低。郭冕等提出以模態(tài)分解模型將齒輪信號(hào)分解，并通過(guò) BP 神經(jīng)網(wǎng)絡(luò)，實(shí)現(xiàn)微型塑料齒輪缺陷檢測(cè)，但該方法在齒輪信號(hào)除噪聲方面檢測(cè)識(shí)別精度低、魯棒性差。楊亞等采用 SURF 算法對(duì)于齒輪的特征進(jìn)行匹配，獲取缺陷信息后采用 OSTU 算法對(duì)缺陷進(jìn)行分割處理并分類，但是該方法不能很好的分類缺陷。JEON-GHYEON 等采用聲波頻率分析法，采用 CNN 模型進(jìn)行分析缺陷，數(shù)據(jù)分析需要大量時(shí)間，導(dǎo)致檢測(cè)效率降低。仇嬌慧等提出一種改進(jìn)的 YOLOv5 網(wǎng)絡(luò)模型，但該模型中的主干網(wǎng)絡(luò) C3 結(jié)構(gòu)以及添加的注意力機(jī)制結(jié)構(gòu)導(dǎo)致參數(shù)量上升、識(shí)別速度降低。

　　基于上述問(wèn)題，本文提出一種改進(jìn)的 YOLOv5s (即 VSD-YOLOv5s) 網(wǎng)絡(luò)模型。該網(wǎng)絡(luò)模型使用輕量化 ShuffleNetv2 主干網(wǎng)絡(luò)，引入 SE 注意力機(jī)制及 DI-OU-NMS 方法，提升注塑齒輪缺陷檢測(cè)的識(shí)別精度與識(shí)別速度。

　　一、YOLOv5s 網(wǎng)絡(luò)模型結(jié)構(gòu)

　　YOLOv5 包含 4 個(gè)版本的目標(biāo)檢測(cè)網(wǎng)絡(luò)模型，即 YOLOv5s、YOLOv5m、YOLOv51 和 YOLOv5x，模型的規(guī)模和訓(xùn)練參數(shù)的數(shù)量在 4 個(gè)版本中依次增加，其中，YOLOv5s 網(wǎng)絡(luò)模型最快。考慮到缺陷檢測(cè)需要嚴(yán)格的實(shí)時(shí)性，本文以最簡(jiǎn)單、最快的網(wǎng)絡(luò)模型 YOLOv5s 作為基準(zhǔn)，來(lái)完成表面缺陷的在線檢測(cè)。YOLOv5s 的結(jié)構(gòu)由 4 部分組成，輸入端、Backbone 網(wǎng)絡(luò)、Neck 網(wǎng)絡(luò)、Prediction 輸出端，如圖 1 所示。輸入端采用自適應(yīng)圖像填充、自適應(yīng)錨框計(jì)算和 Mosaic 數(shù)據(jù)增強(qiáng)，以提升檢測(cè)的準(zhǔn)確性; 在 Backbone 網(wǎng)絡(luò)中，使用了 Focus 模塊、C3 主干網(wǎng)絡(luò)模塊和卷積模塊。Focus 模塊主要用于切片操作，通過(guò)增加特征圖的維度來(lái)縮小特征圖的尺寸，同時(shí)保留圖像特征信息。C3 主干網(wǎng)絡(luò)模塊中的殘差結(jié)構(gòu)有效防止梯度消失，使得特征更加細(xì)致; Neck 網(wǎng)絡(luò)中主要包含 C3 網(wǎng)絡(luò)模塊、上采樣和下采樣過(guò)程，降低計(jì)算量，同時(shí)提高特征融合能力和信息保留度。Prediction 輸出端中使用 NMS 后處理方法篩選多個(gè)目標(biāo)錨框，抑制無(wú)效信息，以提高識(shí)別準(zhǔn)確性。

　　二、改進(jìn)的 YOLOv5s 網(wǎng)絡(luò)模型

　　為了滿足注塑齒輪表面缺陷在線檢測(cè)的速度和識(shí)別精度要求，本文提出了一種 VSD-YOLOv5s 網(wǎng)絡(luò)模型，對(duì) YOLOv5s 的結(jié)構(gòu)進(jìn)行了修改，能夠檢測(cè)不規(guī)則和細(xì)小的齒輪缺陷。

　　將主干網(wǎng)絡(luò) C3 替換為 ShuffleNetV2

　　YOLOv5s 中主干網(wǎng)絡(luò) C3，如圖 2 所示，旨在更好地提取圖像的深層特征。C3 主要由 Bottleneck、Conv2d、BN + SiLU 激活函數(shù)組成，輸入通道分為兩個(gè)分支，通過(guò)兩個(gè)分支的卷積運(yùn)算，將特征映射中的通道數(shù)減半。然后特征映射通過(guò)第二分支中的 Conv2d 層、BN 層和瓶頸層，并利用 Concat 層對(duì)兩個(gè)分支進(jìn)行深度融合。最后，通過(guò)連續(xù)穿過(guò) Conv2d 層和 BN 層生成模塊的輸出特征映射，特征映射的大小與主干網(wǎng)絡(luò) C3 的輸入大小相同。

　　YOLOv5s 主干特征提取網(wǎng)絡(luò)采用 C3 網(wǎng)絡(luò)結(jié)構(gòu)，帶來(lái)較大的參數(shù)量，識(shí)別速度較慢，應(yīng)用受限。因此本文將主干特征提取網(wǎng)絡(luò)替換為更輕量的 ShuffleNetV2 網(wǎng)絡(luò)結(jié)構(gòu)，以實(shí)現(xiàn)網(wǎng)絡(luò)模型的輕量化，提升識(shí)別速度和識(shí)別精度。

　　如圖 3 所示，本文使用先進(jìn)的 ShuffleNetv2 單元，其中 Channel Split 操作將通道數(shù)平均分成兩部分，代替了原有的分組卷積結(jié)構(gòu)。每個(gè)分支中的卷積層輸入、輸出通道數(shù)均相同，其中一個(gè)分支不進(jìn)行任何操作以減少基本單元數(shù)。針對(duì) ShuffleNetv2 中單元塊的下采樣，不再采用 Channel Split，通過(guò)在每個(gè)分支中添加stride = 2 代替原有的 Channel Split 模塊以提高模型容量及檢測(cè)效率。最后使用 Concat、Channle Shuffle 代替原有的 Add、Re-LU 模塊以增加模型通道之間的信息交流。綜合上述改動(dòng)，特征圖空間大小將減半，且使模型具有較高的模型容量和檢測(cè)效率，減小了模型的計(jì)算復(fù)雜度，降低了模型的內(nèi)存占用率，極大地提高了模型的計(jì)算效率。

　　引入 SE 注意力機(jī)制模塊

　　注意力機(jī)制是指重點(diǎn)關(guān)注檢測(cè)部分而忽略無(wú)關(guān)要素，SE 注意力機(jī)制模塊，如圖 4 所示。首先，對(duì)特征映射進(jìn)行壓縮操作以獲得通道的全局特征; 然后，對(duì)全局特征進(jìn)行激勵(lì)操作，以學(xué)習(xí)通道之間的關(guān)系，并獲取不同通道的權(quán)重; 最后，對(duì)原始特征映射進(jìn)行乘法操作，得到最終的特征。這個(gè)機(jī)制有助于模型更加注重信息量最大的通道特征，同時(shí)抑制那些不重要的通道特征。

　　本文通過(guò)引入 SE 注意力機(jī)制模塊，以建立卷積特征通道之間的相互依賴性來(lái)提高網(wǎng)絡(luò)的表示能力。首先，輸入特征圖 X，讓其經(jīng)過(guò) Ftr操作生成特征圖 U; 然后，進(jìn)行 Squeeze 操作、Excitation 操作，Scale 操作。Squeeze 操作是一種壓縮操作，它將輸入圖像的高度 H 和寬度 W 都?jí)嚎s為 1，但通道數(shù)不變的矩陣。通常使用全局平均“池化”操作來(lái)實(shí)現(xiàn)，以確保最終特征包含輸入圖像的所有信息。Excitation 操作對(duì)通過(guò) Squeeze 操作生成的 1 × 1 × C 特征圖進(jìn)行維度降低和恢復(fù)操作，使用全連接層獲取不同通道的權(quán)重，自動(dòng)關(guān)注具有最高權(quán)重的通道。Scale 操作是一種簡(jiǎn)單的加權(quán)運(yùn)算操作，它將 Excitation 操作生成的特征圖與輸入特征圖通過(guò) Sigmoid 激活函數(shù)進(jìn)行 Channel 運(yùn)算，得到輸出值。

　　將 NMS 改進(jìn)為 DIOU-NMS

　　在 YOLOv5s 原有的 NMS 中，使用 IOU 度量來(lái)抑制冗余檢測(cè)框，IOU 的全稱為交并比，即表示為預(yù)測(cè)邊框 A(Prediction box) 和真實(shí)邊框 B(Ground truth box) 的交集和并集的比值。IOU 的計(jì)算公式為:

　　但 IOU 度量法并未將兩個(gè)框之間的中心點(diǎn)距離考慮在抑制標(biāo)準(zhǔn)之內(nèi)，此時(shí)模型檢測(cè)到的遺漏框和錯(cuò)誤框的數(shù)量將會(huì)增加。考慮到以上情況，為提高模型檢測(cè)的準(zhǔn)確性，本文使用 DIOU-NMS 方法，其計(jì)算函數(shù)方程可以定義為:

　　式中: S_i 表示第 i 個(gè)檢測(cè)框?qū)?yīng)的置信度得分，_RDIOU( M，b_i ) 表示基于 DIOU 的檢測(cè)框交叉比，M 表示置信度得分最高的檢測(cè)框，b_i 表示剩余檢測(cè)框集合中的第 i 個(gè)檢測(cè)框，Nt 表示設(shè)定的閾值。本文 DIOU 損失函數(shù)的懲罰項(xiàng)可以定義為:

　　如圖 5 所示，c 是覆蓋兩個(gè)錨框的最小封閉框的對(duì)角線長(zhǎng)度，d = ρ ² ( b，b^gt) 是兩個(gè)錨框的中心點(diǎn)的距離。其中 b 和 b^gt分別表示和的中心點(diǎn)，ρ 為歐氏距離，c 為覆蓋兩個(gè)框的最小包圍框的對(duì)角線長(zhǎng)度。DIOU 損失函數(shù)可以定義為:

　　以此來(lái)看，DIOU 損失函數(shù)不是按外接矩形和并集面積的差值，而是同時(shí)最小化外接矩形的面積和兩框中心點(diǎn)的距離，這會(huì)使得網(wǎng)絡(luò)更傾向于移動(dòng)邊界框的位置來(lái)減少損失函數(shù)。因此，考慮到影響邊界框檢測(cè)的 3 個(gè)幾何因素，即重疊區(qū)域、中心點(diǎn)距離和縱橫比，并在此基礎(chǔ)上將 DIOU-NMS 方法添加到本文的模型中，從而加快了模型的收斂速度，提高了模型的性能。

　　三、結(jié)果與分析

　　實(shí)驗(yàn)環(huán)境: 在該實(shí)驗(yàn)中使用的計(jì)算機(jī)中央處理單元(CPU 型號(hào)) 是 Intel(R) Core(TM) i7-12700F CPU@ 2.10 GHz，并且運(yùn)行存儲(chǔ)器是 16 GB。圖形處理器 (GPU 型號(hào)) 為 NVIDIA GeForce RTX 1080 獨(dú)立顯卡，顯存為 8 GB。采用 64 位 Windows 10 操作系統(tǒng)作為軟件環(huán)境，PyCharm 作為開(kāi)發(fā)平臺(tái)，PyTorch 作為深度學(xué)習(xí)框架，Python 作為編程語(yǔ)言，CUDA 11.3 版本并行計(jì)算框架作為開(kāi)發(fā)平臺(tái)，如圖 7 所示。

　　實(shí)驗(yàn)數(shù)據(jù)集共包含 2000 張分辨率為 640 × 640 的圖片，按照 8∶ 2 的比例劃分為數(shù)據(jù)集和驗(yàn)證集。在訓(xùn)練過(guò)程中，設(shè)置每批次訓(xùn)練 16 張圖片，初始學(xué)習(xí)率為 0.003，IOU 閾值為 0.5，針對(duì)所有參照模型均按照這些參數(shù)訓(xùn)練 300 個(gè) Epoch。

　　數(shù)據(jù)集預(yù)處理: 采用自制的齒輪缺陷數(shù)據(jù)集，其中主要包括輪齒變形、輪齒缺失、表面黑點(diǎn)3 種情況，如圖 8 所示。運(yùn)用 VSD-YOLOv5s 模型進(jìn)行缺陷檢測(cè)，采用 Mosaic 增強(qiáng)方法和自適應(yīng)錨框方法對(duì)于數(shù)據(jù)集進(jìn)行前期處理。

　　本文 VSD-YOLOv5s 模型的模型評(píng)估指標(biāo)主要包括準(zhǔn)確率(P) 、召回率(R) ，平均識(shí)別精度(MAP) 、識(shí)別速度(FPS) 。

　　式中: TP 表示正確識(shí)別齒輪缺陷，F(xiàn)P 表示對(duì)齒輪缺陷識(shí)別的錯(cuò)誤分類，F(xiàn)N 表示不明齒輪缺陷，C 表示齒輪缺陷對(duì)象類別的數(shù)量，k 表示 IOU 閾值，N 表示閾值的 IOU 數(shù)量，P(k) 表示識(shí)別精度，R(k) 表示召回率。

　　如圖 9 所示，為了對(duì) VSD-YOLOv5s 模型的檢測(cè)性能進(jìn)行全面評(píng)估，本文采用 YOLOv5s 和 VSD-YOLOv5s 作為縱向比較模型、采用經(jīng)典的目標(biāo)檢測(cè)模型 Fast- RCNN 作為橫向比較模型，設(shè)置相同的實(shí)驗(yàn)參數(shù)，上述模型的檢測(cè)效果表 1 所示。

　　由表1 的實(shí)驗(yàn)結(jié)果可知，VSD-YOLOv5s 的 MAP 達(dá)到 94.1%，準(zhǔn)確率達(dá)到 95.1%，相較于另外 3 種模型有所提升，對(duì)各類表面缺陷具有良好的檢測(cè)效果，識(shí)別速度相較于 YOLOv5s，F(xiàn)PS 提高5 fps。因此，與 YOLOv5s，F(xiàn)ast-RC-NN 兩種模型相比，VSD-YOLOv5s 模型具有優(yōu)越的檢測(cè)性能，取得了最佳的檢測(cè)效果，能夠滿足在線缺陷檢測(cè)系統(tǒng)的較高識(shí)別精度需求。

　　本文將3 種模型在測(cè)試過(guò)程中產(chǎn)生的準(zhǔn)確率以及召回率記錄并繪制 P-R 曲線圖，如圖 10 所示，通過(guò) P-R 曲線我們可以看到 VSD-YOLOv5s 模型的性能優(yōu)于 Fast-RCNN 和 YOLOv5s。

　　為了驗(yàn)證不同改進(jìn)方法對(duì) YOLOv5s 模型性能的影響，本文對(duì)多種改進(jìn)方法進(jìn)行了比較與討論，如表 2 所示。“√”表明網(wǎng)絡(luò)模型中加入此模塊，而“× ”表明網(wǎng)絡(luò)模型中沒(méi)有加入此模塊。原 YOLOv5s 模型的大小是 14.58 MB，F(xiàn)PS 為 70 fps。使用 ShuffleNetV2 模塊的輕量級(jí) ShuffleNetV2-YOLOv5s 模型的大小減少到 7. 95 MB，F(xiàn)PS 提升到74 fps。結(jié)果表明，當(dāng)在模型中加入 ShuffleNetV2 時(shí)，可達(dá)到模型輕量化的效果并提升識(shí)別速度; 單獨(dú)使用 SE 模塊時(shí)，YOLOv5s 模型的 MAP 從 91.2% 增加到 92.1% 。ShuffleNetV2-YOLOv5s 模型的 MAP 從 91.80% 增加到93.8% 。當(dāng)SE 注意力機(jī)制、DIOU-NMS 以及 ShuffleNetV2 同時(shí)應(yīng)用時(shí)，相比于原模型，VSD-YOLOv5s 模型的識(shí)別準(zhǔn)確率提升了 0. 9% ，識(shí)別精度提升了 1.7% ，識(shí)別速度提升了 5 fps，模型的性能得到了全面改善，達(dá)到最優(yōu)。

　　四、結(jié)論

　　針對(duì)注塑齒輪缺陷檢測(cè)存在的問(wèn)題，提出一種 VSD-YOLOv5s 的齒輪缺陷檢測(cè)輕量化網(wǎng)絡(luò)模型結(jié)構(gòu)，在改進(jìn)后的模型架構(gòu)中，使用了輕量級(jí)的 ShuffleNetV2 模塊，為了準(zhǔn)確識(shí)別注塑齒輪缺陷的不同種類，在模型中引入 SE 注意力機(jī)制，將 NMS 改進(jìn)為 DIOU-NMS 方法加速模型的收斂，在不同測(cè)試集進(jìn)行測(cè)試驗(yàn)證 VSD-YOLOv5s 網(wǎng)絡(luò)模型的可行性，實(shí)驗(yàn)結(jié)果表明，模型滿足在線檢測(cè)系統(tǒng)對(duì)高實(shí)時(shí)性、低漏檢率和低誤檢率的要求，結(jié)構(gòu)更簡(jiǎn)化，復(fù)雜度更低，檢測(cè)識(shí)別精度更高。未來(lái)在模型的實(shí)際應(yīng)用中，將建立缺陷樣本庫(kù)，并及時(shí)收集和完善樣本庫(kù)，提升檢測(cè)效果。

　　參考文獻(xiàn)略.

標(biāo)簽：注塑齒輪

分享到：

上一篇：卡車變速箱中高低擋同步器的改進(jìn)

下一篇：基于時(shí)變嚙合剛度的修形齒輪承載接觸分析

免責(zé)聲明:凡注明(來(lái)源：齒輪頭條網(wǎng))的所有文字、圖片、音視和視頻文件，版權(quán)均為齒輪頭條網(wǎng)(www.19dnf.cn)獨(dú)家所有，如需轉(zhuǎn)載請(qǐng)與本網(wǎng)聯(lián)系。任何機(jī)構(gòu)或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“齒輪頭條網(wǎng)”，違反者本網(wǎng)將追究其法律責(zé)任。本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件，均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者，禁止擅自篡改，違者自負(fù)版權(quán)法律責(zé)任。

相關(guān)資訊

技術(shù)熱點(diǎn)