一種基于異形卷積核的特征融合方法與流程

文檔序號：42887569發(fā)布日期：2025-08-29 19:35閱讀：10來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及計算機視覺中目標(biāo)檢測，尤其是指一種基于異形卷積核的特征融合方法。

背景技術(shù)：

1、目前隨著計算機視覺技術(shù)的發(fā)展，目標(biāo)檢測越來越多的被應(yīng)用于高難度的識別領(lǐng)域，如安防、災(zāi)難檢測和目標(biāo)搜尋等等領(lǐng)域。

2、在大多數(shù)領(lǐng)域中，需要檢測的目標(biāo)長寬比和方向都相差較大，故目前主流的檢測模型都擁有一個強大的特征提取主干和多個特征融合模塊，其目的是為了能夠提取出含多種維度信息的特征并對其進行融合，以顯著提升目標(biāo)檢測效果，如金字塔結(jié)構(gòu)。但通常的金字塔結(jié)構(gòu)這樣的類似的結(jié)構(gòu)都是反復(fù)提取特征來將特征進行簡單的加法操作來完成特征融合。同時其大幅度增加了檢測模型的參數(shù)量和計算量，增加了檢測模型的復(fù)雜程度。

3、另一方面，傳統(tǒng)的特征融合方法如金字塔結(jié)構(gòu)和路徑聚合網(wǎng)絡(luò)都是簡單通過特征圖相加來實現(xiàn)特征圖融合，在特征融合階段模型沒有進行充分的學(xué)習(xí)，融合的比例是固定的，這些導(dǎo)致現(xiàn)有的檢測模型難以應(yīng)對越來越復(fù)雜的檢測任務(wù)和越來越多樣化的檢測物品。

技術(shù)實現(xiàn)思路

1、為解決上述技術(shù)問題，本發(fā)明提供了一種基于異形卷積核的特征融合方法，包括如下步驟：

2、步驟s1：提取輸入圖像的特征圖?x，其尺寸為?c×h×w，其中?c?為通道數(shù)，h為高度，w為寬度；

3、步驟s2：采用至少三種不同形狀的異形卷積核對?x?并行進行特征提取，包括：

4、標(biāo)準(zhǔn)方形卷積核：尺寸為3×3，用于提取通用空間特征；其中膨脹卷積的核尺寸固定為?3×3，且不添加填充(padding)，以抑制邊界噪聲。

5、第一異形卷積核：尺寸為1×3，用于增強垂直方向特征響應(yīng)；

6、第二異形卷積核：尺寸為3×5，用于提取長寬比敏感特征；

7、步驟s3：將步驟s2輸出的各特征圖沿高度維度?h?進行拼接，生成融合前的特征圖；

8、步驟s4：對拼接后的特征圖執(zhí)行膨脹卷積操作，其中所述膨脹卷積的擴張率d根據(jù)輸入特征圖分辨率動態(tài)調(diào)整，擴張率?d≥2，以擴大感受野并融合多方向信息；

9、步驟s5：將膨脹卷積輸出與步驟s1的原始特征圖?x?進行殘差相加，生成最終特征圖用于目標(biāo)檢測或分類。

10、其中方法集成于特征金字塔網(wǎng)絡(luò)(fpn)中：在fpn的上采樣層中，使用上述所述異形卷積核組合替代標(biāo)準(zhǔn)卷積，并對上采樣后的特征執(zhí)行步驟s3-s5的融合操作。

11、方法在yolov4_tiny模型中替換resblock_body模塊：將原模塊中的標(biāo)準(zhǔn)卷積層替換為上述所述的異形卷積核組合及融合流程。

12、在本發(fā)明的一個實施例中，其中步驟s2還包括：針對長寬比超過2:1的目標(biāo)，增加第三異形卷積核，其尺寸為?4×1或?1×4，用于適配極端長寬比特征提取。

13、在本發(fā)明的一個實施例中，所述步驟s4中膨脹卷積的擴張率?d?動態(tài)調(diào)整：當(dāng)輸入特征圖分辨率低于?32×32時，設(shè)置?d=4；當(dāng)分辨率在?32×32至64×64時，設(shè)置?d=2；當(dāng)分辨率高于64×64時，設(shè)置d=1。

14、在本發(fā)明的一個實施例中，所述步驟s3中高度維度拼接的具體方式為：將各卷積分支輸出的特征圖按高度坐標(biāo)對齊，沿?h?軸堆疊，使輸出特征圖尺寸變?yōu)?c′×(k×h)×w，其中?k?為異形卷積核數(shù)量。

15、在本發(fā)明的一個實施例中，所述步驟s2中異形卷積核的通道數(shù)壓縮策略為：對3×3標(biāo)準(zhǔn)卷積保留原通道數(shù)c，對?1×3?和?3×5異形卷積輸出通道數(shù)壓縮至?c/2，以控制參數(shù)量。

16、在本發(fā)明的一個實施例中，所述步驟s5的殘差相加前增加通道注意力機制：使用se模塊對膨脹卷積輸出特征進行通道權(quán)重的重標(biāo)定，再與原始特征圖相加。

17、本發(fā)明的上述技術(shù)方案相比現(xiàn)有技術(shù)具有以下優(yōu)點：本發(fā)明所述的基于異形卷積核的特征融合方法，具備更大的卷積范圍，計算時能夠?qū)⒉煌矸e核輸出的特征都納進來一起計算，從而能夠獲得更多的物品方向信息。將多種異形卷積核提取出的特征拼接后進行膨脹卷積來特征融合，能夠讓卷積核每次計算都含有檢測物品更多的方向信息，提升模型針對不同檢測物品的特征提取能力。

技術(shù)特征：

1.一種基于異形卷積核的特征融合方法，其特征在于，包括如下步驟：

2.根據(jù)權(quán)利要求1所述的基于異形卷積核的特征融合方法，其特征在于：其中步驟s2還包括：針對長寬比超過2:1的目標(biāo)，增加第三異形卷積核，其尺寸為?4×1或?1×4，用于適配極端長寬比特征提取。

3.根據(jù)權(quán)利要求1所述的基于異形卷積核的特征融合方法，其特征在于：所述步驟s4中膨脹卷積的擴張率?d?動態(tài)調(diào)整：當(dāng)輸入特征圖分辨率低于?32×32時，設(shè)置?d=4；當(dāng)分辨率在?32×32至64×64時，設(shè)置?d=2；當(dāng)分辨率高于64×64時，設(shè)置d=1。

4.根據(jù)權(quán)利要求1所述的基于異形卷積核的特征融合方法，其特征在于：所述步驟s3中高度維度拼接的具體方式為：將各卷積分支輸出的特征圖按高度坐標(biāo)對齊，沿?h?軸堆疊，使輸出特征圖尺寸變?yōu)?c′×(k×h)×w，其中?k?為異形卷積核數(shù)量。

5.根據(jù)權(quán)利要求1所述的基于異形卷積核的特征融合方法，其特征在于：所述步驟s2中異形卷積核的通道數(shù)壓縮策略為：對3×3標(biāo)準(zhǔn)卷積保留原通道數(shù)c，對?1×3?和?3×5異形卷積輸出通道數(shù)壓縮至?c/2，以控制參數(shù)量。

6.根據(jù)權(quán)利要求1所述的基于異形卷積核的特征融合方法，其特征在于：所述步驟s5的殘差相加前增加通道注意力機制：使用se模塊對膨脹卷積輸出特征進行通道權(quán)重的重標(biāo)定，再與原始特征圖相加。

技術(shù)總結(jié)
本發(fā)明涉及一種基于異形卷積核的特征融合方法，針對解決傳統(tǒng)特征融合對物體方向、長寬比變化適應(yīng)性差的問題；包括如下步驟：提取輸入圖像特征；采用多種異形卷積核并行提取多方向特征；沿高度維度拼接特征圖；通過膨脹卷積融合多尺度信息，并與原始特征殘差相加。且本發(fā)明的特征融合方法是顯著提升對方向多變、長寬比差異大目標(biāo)的檢測精度，在SIXray和CLCXray數(shù)據(jù)集上mAP分別提升2.22%和1.84%，適用于安檢、遙感等復(fù)雜場景目標(biāo)檢測。

技術(shù)研發(fā)人員：朱智敏,魏江杰
受保護的技術(shù)使用者：中電科申泰信息科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/8/28

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：朱智敏,魏江杰
技術(shù)所有人：中電科申泰信息科技有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

av网站播放,国产一级特黄毛片在线毛片,久久精品国产99精品丝袜,天天干夜夜要,伊人影院久久,av大全免费在线观看,国产第一区在线

一種基于異形卷積核的特征融合方法與流程