[發明專利]融合視覺顯著性的鳥類識別方法和系統在審
| 申請號: | 202211550489.0 | 申請日: | 2022-12-05 |
| 公開(公告)號: | CN116052206A | 公開(公告)日: | 2023-05-02 |
| 發明(設計)人: | 祝禮佳 | 申請(專利權)人: | 廣州辰創科技發展有限公司 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/46;G06V10/42;G06V10/80;G06V10/82;G06N3/0464 |
| 代理公司: | 廣州市越秀區哲力專利商標事務所(普通合伙) 44288 | 代理人: | 康婕 |
| 地址: | 510000 廣東省廣州市天河區高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融合 視覺 顯著 鳥類 識別 方法 系統 | ||
1.一種融合視覺顯著性的鳥類識別方法,其特征在于,包括:
獲取待檢測的圖像;
利用殘差譜對待檢測的圖像進行處理,得到頻域顯著圖;
利用全局對比度對待檢測圖像的Lab顏色域處理獲得時域全局性特征顯著圖;
利用局部對比度對待檢測圖像的RGB顏色域進行處理獲得時域局部特征顯著圖;
將待檢測圖像、頻域顯著圖、時域全局性特征以及時域局部特征顯著圖融合為多通道圖像,得到輸入圖像;
利用圖像識別模型對輸入圖像進行預測,確定輸入圖像中鳥類的位置和分類。
2.根據權利要求1所述的融合視覺顯著性的鳥類識別方法,其特征在于,所述利用殘差譜對待檢測的圖像進行處理,得到頻域顯著圖,具體是:
對待檢測的圖像進行灰度化處理,獲得灰度圖像;
基于對數譜與對數譜的均值之差獲得頻域顯著圖像。
3.根據權利要求2所述的融合視覺顯著性的鳥類識別方法,其特征在于,所述頻域顯著圖像以S1表示,其中,
S1=g(x)*F-1[exp(R(f)+P(f))]2;
g(x)表示對殘差普獲得的顯著特征進行高斯濾波操作,F-1表示快速傅里葉逆變換,P(f)表示相位譜,其中R(f)表示殘差譜;
P(f)=S(F[I_gray(x)]);
R(f)=L(f)-hn(f)*L(f);
hn(f)表示均值濾波操作,n表示濾波器窗口大小,L(f)表示對數譜,即對傅里葉變換獲得的幅度譜取對數運算;
R(f)=log(R(F[I_gray(x)]));
其中,F表示快速傅里葉變換。
4.根據權利要求1所述的融合視覺顯著性的鳥類識別方法,其特征在于,所述利用全局對比度對待檢測圖像的Lab顏色域處理獲得時域全局性特征顯著圖,具體是:
將待檢測圖像的顏色空間域轉換成Lab顏色空間域;
按照以下公式進行處理得到時域全局性特征顯著圖S2;
其中c表示遍歷Lab三個通道層,ac表示三個通道分別計算的視覺顯著圖進行加權的權重值,經驗值為1/c,n表示顏色值覆蓋范圍,fj表示顏色值j出現的頻率,D(Vcx,Vcj)表示顏色值x與顏色值j之間的顏色距離。
5.根據權利要求1所述的融合視覺顯著性的鳥類識別方法,其特征在于,所述利用局部對比度對待檢測圖像的RGB顏色域進行處理獲得時域局部特征顯著圖,具體是:
將待檢測圖像的顏色空間域轉換成RGB顏色空間;
按照以下公式處理得到時域局部特征顯著圖S3;
其中,
設像素點x為R1和R2的中心點,R1邊長小于R2,局部對比度體現在第一窗口R1區域的顏色值均值與第二窗口R2區域的顏色值均值的距離,距離度量D采用歐式距離,時域局部特征顯著圖S3由分別處理RGB三通道獲得顯著圖加權融合獲得。
6.根據權利要求1所述的融合視覺顯著性的鳥類識別方法,其特征在于,所述多通道圖像是六通道圖像;
所述圖像識別模型是輸入層為通道數為6的yolov5模型。
7.根據權利要求6所述的融合視覺顯著性的鳥類識別方法,其特征在于,所述yolov5模型包括:
特征挖掘層,用于對原始圖像的視覺顯著性特征進行挖掘;
特征提取網絡,用于對輸入圖像進行特征提取;
SPP模塊與PANet網絡,用于對卷積層提取的特征進行進一步提取;
檢測頭部分,用于對目標位置提取和類別的劃分。
8.根據權利要求7所述的融合視覺顯著性的鳥類識別方法,其特征在于,所述特征提取網絡包括多個卷積模型,其中,在最后一個卷積模型中設置有注意力機制模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州辰創科技發展有限公司,未經廣州辰創科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211550489.0/1.html,轉載請聲明來源鉆瓜專利網。





