[發明專利]一種基于計算機的低質量分類圖像數據清洗方法有效
| 申請號: | 201710665692.5 | 申請日: | 2017-08-07 |
| 公開(公告)號: | CN107423815B | 公開(公告)日: | 2020-07-31 |
| 發明(設計)人: | 李玉鑑;余華擎 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 計算機 質量 分類 圖像 數據 清洗 方法 | ||
本發明公開了一種基于計算機的低質量分類圖像數據清洗方法,可以對從互聯網批量收集的低質量分類圖像數據進行有效清洗,從而獲得更高質量的圖像數據,用來訓練一個識別率更高的分類模型。具體過程包括:先直接利用低質量分類圖像數據訓練一個初步的卷積神經網絡,再用該網絡對數據本身進行識別,清洗掉模型識別為本類的偽概率低到一定程度的圖像或數量少于一定程度的圖像類別,重復上述過程直到獲得所有圖像數據類型的識別率達到預設的標準。對比實驗說明本發明能夠有效提升圖像數據的分類質量和識別水平。
技術領域
一種基于卷積神經網絡的低質量分類圖像數據的清洗方法,該方法可以對從互聯網批量收集的低質量分類圖像數據進行有效清洗,從而獲得更高質量的圖像數據,用來訓練一個識別率更高的分類模型,屬于人工神經網絡技術領域。
背景技術
人工神經網絡(Artificial Neural Network,即ANN),是20世紀80年代以來人工智能領域興起的研究熱點。它從信息處理角度對人腦神經元網絡進行抽象,建立某種簡單模型,按不同的連接方式組成不同的網絡。在工程與學術界也常直接簡稱為神經網絡或類神經網絡。神經網絡是一種運算模型,由大量的節點(或稱神經元)之間相互聯接構成。每個節點代表一種特定的輸出函數,稱為激勵函數(activation function)。每兩個節點間的連接都代表一個對于通過該連接信號的加權值,稱之為權重,這相當于人工神經網絡的記憶。網絡的輸出則依網絡的連接方式,權重值和激勵函數的不同而不同。而網絡自身通常都是對自然界某種算法或者函數的逼近,也可能是對一種邏輯策略的表達。
卷積神經網絡(Convolutional Neural Network,CNN)是一種前饋神經網絡,也是人工神經網絡的一種,它的人工神經元可以響應一部分覆蓋范圍內的周圍單元,對于大型圖像處理有出色表現。由于其獨特的網絡結構可以有效地降低反饋神經網絡的復雜性,目前卷積神經網絡已成為當前語音分析和圖像識別領域的研究熱點。它的權值共享網絡結構使之更類似于生物神經網絡,降低了網絡模型的復雜度,減少了權值的數量。該優點在網絡的輸入是多維圖像時表現的更為明顯,使圖像可以直接作為網絡的輸入,避免了傳統識別算法中復雜的特征提取和數據重建過程。卷積神經網絡相比于傳統的神經網絡,其特點如下:
1.稀疏連接(Sparse Connectivity)
卷積網絡通過在相鄰兩層之間強制使用局部連接模式來利用圖像的空間局部特性,在第m層的隱層單元只與第m-1層的輸入單元的局部區域有連接,第m-1層的這些局部區域被稱為空間連續的接受域。
2.權值共享(Shared Weights)
在卷積神經網絡中,每個稀疏過濾器通過共享權值都會覆蓋整個可視域,這些共享權值的單元構成一個特征映射,再加上與稀疏連接的配合,構成了特征提取層——卷積層。
3.池化層(Pooling Layer)
池化層是卷積神經網絡的另一個構建塊,它的功能是通過逐步減小表征的空間尺寸來減小參數量和網絡中的計算。池化層在每一個特征圖上獨立操作。
除此之外,卷積神經網絡也包含有傳統的神經網絡的元素,如全連接層以及常見的非線性激活函數sigmoid、tanh、ReLU等。
在卷積神經網絡取得巨大成功的今天,一個良好的數據集是訓練好的卷積神經網絡模型的關鍵所在。常見的數據集有PASCAL VOC、MNIST、ImageNet、CIFAR-10等,其中ImageNet有22K種共15M張高分辨率帶標簽圖像,圖像全被收集于網絡,人工標記,常被用于卷積神經網絡模型的分類性能檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710665692.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種采用深度卷積神經網絡建立動態網絡模型的方法
- 下一篇:空氣凈化器





