[發(fā)明專利]一種基于卷積感知哈希算法的回環(huán)檢測方法有效
| 申請?zhí)枺?/td> | 202010675615.X | 申請日: | 2020-07-14 |
| 公開(公告)號: | CN111832484B | 公開(公告)日: | 2023-10-27 |
| 發(fā)明(設(shè)計)人: | 宋永端;方磊;賴俊峰;譚力琿;張杰;譙佩雯;張聰毅;包晗;楊魁龍;楊雅婷;陳穎睿 | 申請(專利權(quán))人: | 星際(重慶)智能裝備技術(shù)研究院有限公司 |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06V10/74;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 重慶信航知識產(chǎn)權(quán)代理有限公司 50218 | 代理人: | 吳彬 |
| 地址: | 400030 重慶市沙坪壩區(qū)*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 感知 算法 回環(huán) 檢測 方法 | ||
本發(fā)明公開了一種基于卷積感知哈希算法的回環(huán)檢測方法,其包括構(gòu)建建立地圖所需場景的圖像數(shù)據(jù)集,構(gòu)建并訓練卷積神經(jīng)網(wǎng)絡(luò),將訓練好的卷積神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于SLAM系統(tǒng)進行回環(huán)檢測。本發(fā)明基于卷積感知哈希算法的回環(huán)檢測方法通過貪婪算法解決卷積神經(jīng)網(wǎng)絡(luò)的輸出與哈希值之間的耦合問題,使用孿生網(wǎng)絡(luò)輸出的交叉熵作為損失函數(shù)訓練卷積神經(jīng)網(wǎng)絡(luò)獲得訓練好的卷積神經(jīng)網(wǎng)絡(luò)。本發(fā)明具有較高的準確率和召回率,根據(jù)不同場景訓練的網(wǎng)絡(luò),在應(yīng)對不同場景時具備優(yōu)秀的適應(yīng)能力,能夠很好的完成回環(huán)檢測的功能,輔助SLAM構(gòu)建正確的高精度地圖。
技術(shù)領(lǐng)域
本發(fā)明涉及即時定位與建圖(SLAM)中的回環(huán)檢測技術(shù)領(lǐng)域,更具體地,涉及一種基于深度卷積感知哈希的回環(huán)檢測方法。
背景技術(shù)
在視覺SLAM(simultaneous localization and mapping,即時定位與地圖構(gòu)建)中,視覺里程計僅考慮相鄰時間上的關(guān)鍵幀,如果上一時刻產(chǎn)生誤差,那么誤差必定會累積到下一時刻,使得整個SLAM出現(xiàn)累積誤差,長期的估計結(jié)果必然是不可靠的。SLAM后端雖然可以估計最大后驗誤差,但在只存在相鄰關(guān)鍵幀數(shù)據(jù)時,同樣無法消除累計誤差。
回環(huán)檢測的意義就是給出除了相鄰關(guān)鍵幀的約束外,時間更久遠的約束。當機器人察覺相機經(jīng)過了同一個地方,采集到了相似的數(shù)據(jù)這一情況,我們就可以提供更好的估計,得到一個全局已知的估計。回環(huán)檢測關(guān)系到SLAM估計的軌跡和地圖在長時間下的正確性,對機器人進行了重定位,能夠非常有效的提升SLAM建圖的精度。回環(huán)檢測目前采用的技術(shù)一般為詞袋法,通過識別圖片上的特征并保存為單詞,通過比較兩幀圖片上的特征數(shù)量來獲得兩幀圖像的相似度,當相似度達到一定閾值,認為兩幀是同一地點,認為發(fā)生回環(huán)。
詞袋的回環(huán)檢測算法完全依賴于外觀,沒有利用圖中任何的幾何信息,這容易導致外觀相似的圖像容易被當成回環(huán)。并且,由于詞袋不在乎單詞順序,只在意單詞有無的表達方式,更容易引發(fā)感知偏差。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能夠克服上述技術(shù)問題的卷積感知哈希算法的回環(huán)檢測方法,本發(fā)明所述方法的特征在于基于深度學習技術(shù),使用一種圖像編碼的技術(shù)來解決回環(huán)檢測精度低、效率低的問題。
本發(fā)明基于卷積感知哈希算法的回環(huán)檢測方法,包括以下步驟:
1)構(gòu)建建立地圖所需場景的圖像數(shù)據(jù)集,圖像數(shù)據(jù)集由兩組圖片組成,第一組圖片中全為相似的圖片,第二組圖片中全為不相似的圖片,將圖像數(shù)據(jù)集劃分為訓練集和測試集,訓練訓練集中包含第一組圖片的部分和第二組圖片的部分,訓練集用于卷積神經(jīng)網(wǎng)絡(luò)的訓練,測試集用于檢測訓練好的神經(jīng)網(wǎng)絡(luò)是否有效;
2)構(gòu)建并訓練卷積神經(jīng)網(wǎng)絡(luò),其包括以下步驟:
a)構(gòu)建兩個結(jié)構(gòu)相同的卷積神經(jīng)網(wǎng)絡(luò)模塊,每個卷積神經(jīng)網(wǎng)絡(luò)模塊包括卷積層、池化層以及全連接層;
b)從訓練集的兩組圖片中隨機選取兩張圖片構(gòu)成一組輸入圖片同時輸入所構(gòu)建的兩個卷積神經(jīng)網(wǎng)絡(luò)模塊,通過貪婪算法分別將兩個卷積神經(jīng)網(wǎng)絡(luò)模塊的輸出變換成兩個哈希碼,卷積神經(jīng)網(wǎng)絡(luò)模塊的輸出和哈希碼的連接方式如下:
其中,H是哈希碼,O是卷積神經(jīng)網(wǎng)絡(luò)的輸出,lr是超參數(shù),L是交叉熵;
再計算兩張圖像的最大似然估計,兩張圖像對應(yīng)的兩個哈希碼的最大似然函數(shù)如下:
通過最大似然函數(shù)計算損失函數(shù),損失函數(shù)設(shè)置如下:
其中,n是指哈希碼的位數(shù),i,j分別指兩張圖片,α是超參數(shù),hi是第i張圖像對應(yīng)的哈希碼,hj是第j張圖像對應(yīng)的哈希碼,si,j指輸入的兩張圖片是否歸屬為一類圖片;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于星際(重慶)智能裝備技術(shù)研究院有限公司,未經(jīng)星際(重慶)智能裝備技術(shù)研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010675615.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點和感知節(jié)點
- 感知無線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點和匯聚中心
- 感知無線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫
- 基于認知數(shù)據(jù)庫和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





