[發明專利]一種基于卷積神經網絡和遞歸自動編碼器模型的場景識別方法有效
| 申請號: | 201910470014.2 | 申請日: | 2019-05-29 |
| 公開(公告)號: | CN110188827B | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 花福軍;陸文斌;張應福;周正斌;李成偉 | 申請(專利權)人: | 創意信息技術股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 成都金英專利代理事務所(普通合伙) 51218 | 代理人: | 袁英 |
| 地址: | 610000 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 遞歸 自動 編碼器 模型 場景 識別 方法 | ||
本發明公開了一種基于卷積神經網絡和遞歸自動編碼器模型的場景識別方法,包括:構建卷積神經網絡,構建遞歸自動編碼器,數據預處理和場景預測分類;構建卷積神經網絡,是利用大規模場景數據集構建并改進卷積神經深度網絡;構建遞歸自動編碼器,是利用卷積神經網絡提取的圖像特征和場景標簽構建并改進遞歸自動編碼器;數據預處理,是將圖像進行數據增強的操作,同時將場景的文本標簽實現嵌入操作完成數據預處理;場景預測分類,構建預測圖像場景分類器,將圖像特征輸入訓練完成的模型中進行場景預測分類。本發明改進了傳統的圖像與文本信息的編碼模型,提出了一種新的卷積神經網絡和遞歸自動編碼器網絡的結合方法,能夠顯著的提升場景識別的效果。
技術領域
本發明涉及圖像場景理解領域,尤其涉及一種基于卷積神經網絡和遞歸自動編碼器模型的場景識別方法。
背景技術
如何準確、有效的識別輸入圖像中的場景,已經成為一個重要的研究課題。在傳統的圖像理解算法技術中,圖像分類,相似圖像索引是主要的研究方向。圖像分類問題需要更好的獲得輸入圖像的特征向量,并基于特征向量學習優化。傳統的算法中使用常見的圖像特征是HOG特征。HOG特征是將歸一化的圖像分割成若干個像素塊,計算每個像素塊的亮度梯度并將所有的像素塊的亮度梯度進行串聯。傳統的圖像分類算法包括KNN(k-NearestNeighbor)和SVM(Support Vector Machine)兩種主要的方法。
在傳統的圖像分類算法常使用的全局特征有Gabor特征,LBP特征,HOG梯度方向直方圖,GIST特征等特征,局部特征有SIFT特征(Scale Invariant Feature Transform),SURF特征(Speeded Up Robust Features),DAISY特征等。特征描述子和特征檢測子關系相對緊密,其中檢測子越多,圖像特征提取的時間越長,相應的噪聲也會增多,檢測子少的情況下,有效的特征匹配也會減少。
(1)KNN算法:
KNN算法的主旨思想是尋找與測試圖像中的最相似的圖像的,后在最相似的圖片組中進行交叉驗證,得出測試圖像最高的概率值得標簽值。兩張圖像的相似度之間的計算被稱為曼哈頓距離,計算所有的像素塊的差距,最后計算出兩張圖像的距離。通過度量圖像之間的差異,利用該種思想的分類器實現比較簡單,并且訓練學習的沒有大量的時間花銷,但測試時間復雜度巨大,效率偏低。
(2)SVM分類器:
SVM分類器是上世紀60年代被提出的一種按照監督學習方式對輸入數據進行二元分類的廣義線性分類器。經過多年的發展包括了多種衍生算法和模型,比如多分類SVM,最小二乘法SVM,支持向量回歸等模型。SVM在眾多模式識別的研究領域中被廣泛應用,比如圖像識別和文本分類等。SVM的經典結構的思路是使用一個超平面將不同的類別分開,并讓難區分的特征點盡可能的表現出最大的差距。
SVM模型展現出小樣本數據規模即可提取數據中的非線性關系結構,且解決在繁多的神經網絡結構中進行選擇和調優問題,高維問題得到解決。而SVM模型不具有普適性,需要具體問題具體解決,模型的核函數選擇繁瑣,并且計算復雜度高,不適用大規模數據等問題。
基于現有方法的缺陷,需要一種新的卷積神經網絡和遞歸自動編碼器網絡的結合方法,來實現顯著提升場景識別效果。
發明內容
為了解決上述問題,本發明提出一種基于卷積神經網絡和遞歸自動編碼器模型的場景識別方法。
一種基于卷積神經網絡和遞歸自動編碼器模型的場景識別方法,包括:構建卷積神經網絡,構建遞歸自動編碼器,數據預處理和場景預測分類;
所述構建卷積神經網絡,是利用大規模場景數據集構建并改進卷積神經深度網絡;
所述構建遞歸自動編碼器,是利用卷積神經網絡提取的圖像特征和場景標簽構建并改進遞歸自動編碼器;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創意信息技術股份有限公司,未經創意信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910470014.2/2.html,轉載請聲明來源鉆瓜專利網。





