[發(fā)明專利]一種適用于機器視覺的自然場景數(shù)據(jù)集的構建方法在審
| 申請?zhí)枺?/td> | 201910561320.7 | 申請日: | 2019-06-26 |
| 公開(公告)號: | CN110414561A | 公開(公告)日: | 2019-11-05 |
| 發(fā)明(設計)人: | 王嘉樂;鄒煉;范賜恩;程謨凡;陳麗瓊;魏文瀾;張捷 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06F16/951;G06F16/55 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魯力 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然場景 數(shù)據(jù)集 卷積神經網絡 機器視覺 構建 下載 矩陣 生態(tài)系統(tǒng)類型 圖像數(shù)據(jù)集 分類類別 模糊類別 匹配判斷 識別系統(tǒng) 數(shù)據(jù)支撐 物體分類 原始圖像 歧義 分類 可用 混淆 互聯(lián) 圖像 驗證 合并 圖片 | ||
1.一種適用于機器視覺的自然場景數(shù)據(jù)集的構建方法,其特征在于,包括以下步驟:
步驟1:依據(jù)生態(tài)系統(tǒng)類型初步確定數(shù)據(jù)集中含有的類別與對應子類別;其中,生態(tài)系統(tǒng)類型分為:
陸地生態(tài)系統(tǒng):包括自然陸地生態(tài)系統(tǒng)和人工陸地生態(tài)系統(tǒng);
水生生態(tài)系統(tǒng):包括內陸水生生態(tài)系統(tǒng)、海洋生態(tài)系統(tǒng)和人工水生生態(tài)系統(tǒng);
地下生態(tài)系統(tǒng):包含洞穴生態(tài)系統(tǒng);
步驟2:將子類別名稱作為關鍵字在互聯(lián)網上進行搜索,至少搜索1000張與該子類別對應的圖片,完成圖片的收集;
步驟3:對所收集到的圖片進行初步的人工篩選,對不符合對應類別的圖片進行進一步篩選,得到含有場景類別標簽的數(shù)據(jù)集;
步驟4:將數(shù)據(jù)集分為訓練集和驗證集,利用深度卷積神經網絡對圖像進行分類,并利用混淆矩陣將預測結果與真實類別標簽結合生成相似度矩陣,依據(jù)相似度矩陣合并相似度過高的類別,得到最終的數(shù)據(jù)集,具體包括:
步驟4.1,按照80%/20%的比例對原始數(shù)據(jù)集隨機進行劃分得到訓練集和驗證集;
步驟4.2,將訓練集中的圖片轉化為224×224分辨率的圖片,選用13層的bn-inception網絡結構作為場景預測分類網絡;含有兩個卷積層和3×3池化層的原始bn-inception網絡將224×224分辨率的圖片轉化為28×28的特征圖,使得在后續(xù)10個inception層中能夠更快的進行處理,其中兩層步長為2,其余步長為1,因此28×28的特征圖最終變化為7×7的特征圖;最后利用全局均值池化層對跨空間維度的激活進行聚合;
步驟4.3,利用步驟4.2中所得到的模型對驗證集進行分類預測,得到分類結果,將預測結果與真實分類結合得到混淆矩陣C,該混淆矩陣顯示類別與類別之間的交叉錯誤,隱含地指示了它們之間的相似程度,在形式上,我們用以下方式定義這種相似性:
S=C+CT
其中C∈RN×N是混淆矩陣,N是自然場景類別的數(shù)目,Cij表示將第i類分類為第j類的概率,該值較大表示兩個類別之間的模糊度較高;按照該公式生成相似度矩陣S,該等式保證了相似性是對稱的度量,為合并兩個相似類別提供線索;
步驟4.4,設定一個合適的閾值τ,此處τ=0.5,將相似度超過該閾值τ的兩類進行合并;分析合并的合理性,若第i行和第j行合并為同一類型,更新對應的相似性矩陣,刪除第i和第j行和列,將作為新的行和列添加進去,重復該步驟直到最終的數(shù)據(jù)集不超過閾值或滿足其他要求,這樣得到的數(shù)據(jù)集更適用于機器視覺方面的處理。
2.根據(jù)權利要求1所述的一種適用于機器視覺的自然場景數(shù)據(jù)集的構建方法,其特征在于,所述生態(tài)系統(tǒng)子類別分類要滿足:
條件一、子類別屬于某一生態(tài)系統(tǒng);
條件二、子類別之間相互獨立。
3.根據(jù)權利要求1所述的一種適用于機器視覺的自然場景數(shù)據(jù)集的構建方法,其特征在于,子類別分為:
自然陸地生態(tài)系統(tǒng):極地與高山苔原、半沙漠、針葉林、落葉林、天然草原、荒地、常綠闊葉林、地中海型灌木叢、沙漠、山地、熱帶雨林;
人工陸地生態(tài)系統(tǒng):人工草地、農田、溫室、城市;
內陸水生生態(tài)系統(tǒng):沼澤、濕地、河流、湖泊;
海洋生態(tài)系統(tǒng):沿海、珊瑚礁、深海;
人工水生生態(tài)系統(tǒng):池塘;
包含洞穴生態(tài)系統(tǒng):洞穴。
4.根據(jù)權利要求1所述的一種適用于機器視覺的自然場景數(shù)據(jù)集的構建方法,其特征在于,步驟2所述類別名稱加上天氣形容詞,天氣形容詞包括:晴朗的、多云的、下雨的、下雪的。
5.根據(jù)權利要求1所述的一種適用于機器視覺的自然場景數(shù)據(jù)集的構建方法,其特征在于,步驟3所述不符合對應類別的圖片挑出匯總至未分類圖片,若總搜集圖片為M張,總類別為N類,當無法分類的圖片超過N/M時,構建新的類別,新的類別滿足步驟1中述的子類別分類條件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910561320.7/1.html,轉載請聲明來源鉆瓜專利網。





