[發(fā)明專利]一種基于輔助信息的盲人導(dǎo)航方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110383885.8 | 申請(qǐng)日: | 2021-04-09 |
| 公開(公告)號(hào): | CN113091747B | 公開(公告)日: | 2022-08-05 |
| 發(fā)明(設(shè)計(jì))人: | 史業(yè)民;俞益洲;李一鳴;喬昕 | 申請(qǐng)(專利權(quán))人: | 北京深睿博聯(lián)科技有限責(zé)任公司;杭州深睿博聯(lián)科技有限公司 |
| 主分類號(hào): | G01C21/20 | 分類號(hào): | G01C21/20 |
| 代理公司: | 北京天方智力知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11719 | 代理人: | 路遠(yuǎn) |
| 地址: | 102209 北京市昌平區(qū)北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 輔助 信息 盲人 導(dǎo)航 方法 裝置 | ||
1.一種基于輔助信息的盲人導(dǎo)航方法,其特征在于,包括以下步驟:
獲取360度范圍內(nèi)N個(gè)不同方向的視頻圖像it,t=1,2,…,N;
利用第一卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述視頻圖像進(jìn)行特征提取,并將提取的特征輸入到第一LSTM進(jìn)行融合,得到圖像融合特征ot=LSTM(Conv(it)),Conv表示卷積運(yùn)算;
利用第二卷積神經(jīng)網(wǎng)絡(luò)對(duì)ot進(jìn)行分類,得到L個(gè)可能預(yù)測(cè)方向,每個(gè)可能預(yù)測(cè)方向與一個(gè)cl的方向相同,l=1,2,…,L,cl為分別位于L個(gè)相鄰扇區(qū)內(nèi)使其扇區(qū)內(nèi)softmax(Conv(ot))最大且最大值大于設(shè)定閾值的ot,softmax為激勵(lì)函數(shù);
對(duì)包含輔助導(dǎo)航信息的文本進(jìn)行特征提取、融合,得到文本融合特征,利用交叉注意力機(jī)制對(duì)文本融合特征和圖像融合特征進(jìn)行交叉融合,得到跨模態(tài)融合特征向量f;
將f與{c1,c2,…,cL}關(guān)聯(lián),選出與輔助導(dǎo)航信息最相符的cl,1≤l≤L,第l個(gè)可能預(yù)測(cè)方向就是最終的導(dǎo)航預(yù)測(cè)方向。
2.根據(jù)權(quán)利要求1所述的基于輔助信息的盲人導(dǎo)航方法,其特征在于,按以下方法得到跨模態(tài)融合特征向量f:
將包含輔助導(dǎo)航信息的文本輸入到Bert或Word2Vec模型中,得到文本嵌入特征E(wi),E表示嵌入模型,wi為第i個(gè)單詞或漢字,i=1,2,…,M,M為文本中單詞或漢字的數(shù)量;
將E(wi)輸入雙向LSTM,得到上下文相關(guān)的文本融合特征表示fiT=BiLSTM(E(wi)),BiLSTM表示進(jìn)行雙向LSTM運(yùn)算;
利用第一注意力模塊進(jìn)行文本跨模態(tài)融合,通過(guò)圖像特征篩選重要的文本特征
式中,Att表示注意力運(yùn)算,當(dāng)輸入長(zhǎng)度為n的特征序列{f1,f2,…,fn}和特征向量q時(shí),其輸出為:
αi=softmax(fiWattq)
式中,Watt為訓(xùn)練參數(shù);
按以下方法得到:
利用第二注意力模塊進(jìn)行圖像跨模態(tài)融合,通過(guò)文本特征篩選重要的圖像特征ftV:
將ftV輸入到第二LSTM得到
將和融合后得到:
3.根據(jù)權(quán)利要求2所述的基于輔助信息的盲人導(dǎo)航方法,其特征在于,確定最終導(dǎo)航預(yù)測(cè)方向的方法具體包括:
將f和{c1,c2,…,cL}輸入第三注意力模塊,得到注意力分布為:
α'i=softmax(ciWattf),i=1,2,…,L
如果ci=cl時(shí)αi'取最大值,則第l個(gè)可能預(yù)測(cè)方向?yàn)樽罱K的導(dǎo)航預(yù)測(cè)方向。
4.根據(jù)權(quán)利要求1所述的基于輔助信息的盲人導(dǎo)航方法,其特征在于,通過(guò)語(yǔ)音模塊獲取包含輔助導(dǎo)航信息的文本。
5.根據(jù)權(quán)利要求1所述的基于輔助信息的盲人導(dǎo)航方法,其特征在于,N=36,L=6。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京深睿博聯(lián)科技有限責(zé)任公司;杭州深睿博聯(lián)科技有限公司,未經(jīng)北京深睿博聯(lián)科技有限責(zé)任公司;杭州深睿博聯(lián)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110383885.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





