[發(fā)明專利]視覺位置識別方法及裝置、計算機設備及可讀存儲介質在審
| 申請?zhí)枺?/td> | 202011436657.4 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112463999A | 公開(公告)日: | 2021-03-09 |
| 發(fā)明(設計)人: | 張鍥石;程俊;許震宇;任子良;康宇航;高向陽 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/532;G06F16/583;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市科進知識產(chǎn)權代理事務所(普通合伙) 44316 | 代理人: | 魏毅宏 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視覺 位置 識別 方法 裝置 計算機 設備 可讀 存儲 介質 | ||
本申請公開了一種視覺位置識別方法、視覺位置識別裝置、計算機設備及非易失性計算機可讀存儲介質。視覺位置識別方法包括:構建自編碼器模型,所述自編碼器模型包括順序連接的編碼器模型和解碼器模型;將訓練圖像輸入預訓練的VGG?16模型以輸出所述訓練圖像的第一信息;將所述訓練圖像輸入所述自編碼器模型以輸出所述訓練圖像的第二信息;計算所述第一信息與所述第二信息之間的差值;在所述差值小于預設值時確定所述自編碼器模型訓練完畢;在所述差值大于預設值時修改所述自編碼器模型的參數(shù),并返回所述將所述訓練圖像輸入所述自編碼器模型以輸出所述訓練圖像的第二信息的步驟;利用訓練完畢的所述自編碼器模型中的編碼器模型進行視覺位置識別。
技術領域
本申請涉及機器視覺技術領域,特別涉及一種視覺位置識別方法、視覺位置識別裝置、計算機設備及非易失性計算機可讀存儲介質。
背景技術
視覺位置識別在很多領域有重要的應用價值,例如,用于SLAM系統(tǒng)的閉環(huán)檢測,還可以用于基于視覺內容的圖像搜索,3D建模和車輛導航等。視覺位置識別面臨著許多挑戰(zhàn),例如氣候、光照引起的環(huán)境變化、動態(tài)物體遮擋、攝像機獲取內容的不同角度、系統(tǒng)的實時性等均會對視覺位置識別的準確率產(chǎn)生影響。
目前,可以通過基于深度學習的視覺定位方法進行視覺位置識別。但是,目前基于深度學習的視覺定位方法存在一些問題,比如,這些方法中的模型的健壯性是以大量的內存為代價的,這些內存被深度網(wǎng)絡的過多參數(shù)占用,從而導致特征提取時間長;此外,這些方法需要花費大量的精力來生成帶標簽的圖像來訓練模型。可以通過引入自編碼器來解決上述問題。自編碼器是一種無監(jiān)督學習的深度網(wǎng)絡模型。自編碼器由編碼器和解碼器兩部分組成。編碼器將模型的輸入壓縮到一個深層的表達,再由解碼器將其還原成輸入的表示。然而,目前的自編碼器通常使用傳統(tǒng)的手工特征作為自編碼器的約束條件,使得自編碼器不能較好地提取場景的有效信息,視覺位置識別的準確率不高。
發(fā)明內容
本申請實施方式提供了一種視覺位置識別方法、視覺位置識別裝置、計算機設備及非易失性計算機可讀存儲介質,以解決視覺位置識別的準確率不高的問題。
本申請實施方式的視覺位置識別方法包括:構建自編碼器模型,所述自編碼器模型包括順序連接的編碼器模型和解碼器模型;將訓練圖像輸入預訓練的VGG-16模型以輸出所述訓練圖像的第一信息;將所述訓練圖像輸入所述自編碼器模型以輸出所述訓練圖像的第二信息;計算所述第一信息與所述第二信息之間的差值;在所述差值小于預設值時確定所述自編碼器模型訓練完畢;在所述差值大于預設值時修改所述自編碼器模型的參數(shù),并返回所述將所述訓練圖像輸入所述自編碼器模型以輸出所述訓練圖像的第二信息的步驟;利用訓練完畢的所述自編碼器模型中的編碼器模型進行視覺位置識別。
在某些實施方式中,所述編碼器模型包括多個卷積層和多個池化層,所述解碼器模型包括多個全連接層。
在某些實施方式中,至少一個所述卷積層中添加有懲罰項;和/或至少兩個相鄰的所述全連接層之間設置有丟棄層。
在某些實施方式中,所述計算所述第一信息與所述第二信息之間的差值,包括:利用L2損失函數(shù)計算所述第一信息與所述第二信息之間的差值。
在某些實施方式中,所述視覺位置識別方法在所述利用訓練完畢的所述自編碼器模型中的編碼器模型進行視覺位置識別的步驟前,還包括:將測試圖像輸入訓練完畢的所述自編碼器模型中以獲得所述測試圖像的第三信息;將檢索圖像輸入訓練完畢的所述自編碼器圖像中以獲得所述檢索圖像的第四信息;根據(jù)所述第三信息和所述第四信息計算所述測試圖像與所述檢索圖像的相似度;根據(jù)所述相似度確定視覺位置識別結果;計算所述測試圖像的索引與所述檢索圖像的索引之間的索引差值;根據(jù)所述索引差值確定所述視覺識別結果的準確度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經(jīng)中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011436657.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





