[發明專利]一種適用于機器視覺的自然場景數據集的構建方法在審
| 申請號: | 201910561320.7 | 申請日: | 2019-06-26 |
| 公開(公告)號: | CN110414561A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 王嘉樂;鄒煉;范賜恩;程謨凡;陳麗瓊;魏文瀾;張捷 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06F16/951;G06F16/55 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魯力 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然場景 數據集 卷積神經網絡 機器視覺 構建 下載 矩陣 生態系統類型 圖像數據集 分類類別 模糊類別 匹配判斷 識別系統 數據支撐 物體分類 原始圖像 歧義 分類 可用 混淆 互聯 圖像 驗證 合并 圖片 | ||
本發明公開了一種適用于機器視覺的自然場景數據集的構建方法,包括如下步驟:基于生態系統類型確定數據集的分類類別;利用關鍵詞從互聯網上下載原始圖像;對下載的圖像進行初步匹配判斷,對模糊類別圖片進行再次分類,形成圖像數據集;利用卷積神經網絡對數據集進行驗證,再根據混淆矩陣對歧義類別進行合并。解決了自然場景分類難以像物體分類進行準確客觀定義的問題,為訓練深度卷積神經網絡提供了可靠的數據支撐,可用于自然場景識別系統。
技術領域
本發明涉及圖像處理技術領域,具體涉及一種適用于機器視覺的自然場景數據集的構建方法。
背景技術
在圖像處理技術領域,近幾年圖像識別受到了越來越多的關注,圖像識別技術是運動分析、立體視覺、數據融合等實用技術的基礎,其中目標識別由于卷積神經網絡和超大規模數據集的應用,在識別的準確率方面有了非常大的提升,而利用卷積神經網絡對圖像發生的場景進行識別卻難以獲得相同水平的準確度,這其中很大一部分原因是由于場景數據集自身分類不準確所導致的。
利用機器視覺對圖像中物體進行識別可以提供圖像中大概正在發生什么事情,而對圖像發生的場景進行識別則能使我們獲得更多與圖片有關的信息,同時通過場景猜想過去和未來可能會發生什么事件。隨著自動駕駛、無人車以及無人機技術的發展,對周圍環境進行準確檢測為安全提供了保障,因此一個標準的場景數據庫顯得尤為重要。
對于大多數場景數據庫,往往存在著以下兩個問題:1)類別與類別之間層次混亂,在某些數據集中存在“農田”和“平原”類別之間的混亂,其中平原是一種地貌類型,而農田也可以在平原上建立,兩者之間并非獨立;2)含義重復混淆,例如“林場”與“森林”只有在特殊情況下才會進行區分。
不同于物體數據集的構建過程中類別標簽有著客觀的評價,場景數據集經常由于主觀評價不同而對同一幅圖像有著不一樣的判定標準,這也導致了同一類別中圖像之間差異很大,限制了算法準確度的提升,因此在場景數據集中需要建立一個統一的分類準則。
對于一個自然場景,生物與環境幫助我們確定場景的具體類型,而生物與環境構成的統一整體在生態學研究中被稱為生態系統,這些生態系統具有最為多種的種類和大小,通過生態系統的分類來對自然場景數據集中的分類進行對應,使數據集的分類滿足一個統一的判定尺度。
判定一張圖像所屬的自然場景,需要結合圖像中的物體和背景;判定某一空間所屬的生態系統,需要結合該空間中的生物和環境;兩者在判定上有著極大的相似性,因此該發明提出將生態系統作為數據集類別的判定尺度,即生態系統中的類別對應自然場景數據集中的類別,這樣操作無論是從分類的主觀感受上還是客觀要求上都是基本一致的。
發明內容
為了解決上述問題,本發明提供了一種構建自然場景數據庫的方法,旨在改善現有數據集分類中缺陷,使得在構造自然場景數據集分類時有一個統一的分類準則,并且使最終的數據集能更好地適用于機器視覺領域。
為實現上述目的,本發明的技術方案具體包括以下步驟:
1.一種適用于機器視覺的自然場景數據集的構建方法,其特征在于,包括以下步驟:
步驟1:依據生態系統類型初步確定數據集中含有的類別與對應子類別;其中,生態系統類型分為:
陸地生態系統:包括自然陸地生態系統和人工陸地生態系統;
水生生態系統:包括內陸水生生態系統、海洋生態系統和人工水生生態系統;
地下生態系統:包含洞穴生態系統;
步驟2:將子類別名稱作為關鍵字在互聯網上進行搜索,至少搜索1000張與該子類別對應的圖片,完成圖片的收集;
步驟3:對所收集到的圖片進行初步的人工篩選,對不符合對應類別的圖片進行進一步篩選,得到含有場景類別標簽的數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910561320.7/2.html,轉載請聲明來源鉆瓜專利網。





