[發明專利]一種基于自然語言和語義地圖實現機器人自主導航的方法有效
| 申請號: | 201910981685.5 | 申請日: | 2019-10-16 |
| 公開(公告)號: | CN110825829B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 董敏;聶宏蓄;畢盛;楊塏泓 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G01C21/00;G06N3/0442;G06N3/0455;G06N3/08 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 語義 地圖 實現 機器人 自主 導航 方法 | ||
1.一種基于自然語言和語義地圖實現機器人自主導航的方法,其特征在于,包括以下步驟:
1)獲取機器人所處環境的語義地圖,包括出發點、目的地及其它位置之間的拓撲關系;其中,所述機器人所處環境的語義地圖是指用于描述機器人所處環境的拓撲地圖,包括表示環境中各個區域的頂點和表示頂點間相互通達關系的邊;
2)將獲取到的語義地圖中各個位置用頂點表示,用頂點間的邊表示頂點的通達關系,將每一對頂點之間的通達關系描述成三元組;
3)通過兩組雙層GRU編碼器分別提取已描述成三元組集合的語義地圖的特征和自然語言指令的特征,包括以下步驟:
3.1)每個包含N個三元組的語義地圖M及每個包含L個詞語的自然語言指令I分別描述為:
M={<p1,b1,q1,...,pN,bN,qN>}
I={l1,...,lL}
其中:地圖中的第i個三元組表示為<pi,bi,qi>,下標i=1,2,3,...,N表示N個三元組的索引號;自然語言指令中的第i個詞語表示為li,下標i=1,2,3,...,L表示自然語言指令中L個詞語的索引號;
3.2)將三元組通過embedding層用向量表示,將自然語言指令通過embedding層用向量表示,三元組的向量表示和自然語言指令的向量表示分別描述為:
EM={g1,...,gN}
EL={i1,...,iL}
其中:語義地圖中第i個三元組的embedding向量表示為gi,下標i=1,2,3,...,N表示N個三元組的embedding向量索引號;自然語言指令中第i個單詞的embedding向量表示為ii,下標i=1,2,3,...,L表示自然語言指令中L個單詞的embedding向量索引號;
3.3)將語義地圖的embedding向量和自然語言指令的embedding向量分別通過雙層GRU進行編碼,獲取特征向量,語義地圖和自然語言指令的特征向量分別描述為:
FM={fg1,....,fgN}
FL={fi1,...,fiL}
其中:第i個三元組的特征向量表示為fgi,下標i=1,2,3,...,N表示N個三元組的特征向量索引號;自然語言指令中第i個詞語的特征向量表示為fii,下標i=1,2,3,...,L表示自然語言指令中L個詞語的特征向量索引號;
4)通過注意力機制將語義地圖的特征和自然語言指令的特征融合,包括以下步驟:
4.1)對每一個三元組的特征向量,計算其關于自然語言指令中每個詞語對應特征向量的注意力,其過程描述為:
ei=[fgiWfi1,...,fgiWfiL]
ai=softmax(ei)
其中,W表示不同維度的特征向量相乘時的權重,ei表示語義地圖特征fgi關于自然語言指令的每一個特征向量的注意力向量,ai表示語義地圖特征fgi關于自然語言指令的每一個特征向量的權重,fil表示自然語言指令中第l個詞語的特征向量;
4.2)通過注意力權重將語義地圖特征和自然語言指令特征融合,其過程描述為:
R={R1,...,RN}
其中,Ri表示N個融合特征向量第i個融合的特征向量,aij表示第i個三元組特征對第j個自然語言指令特征的注意力權重,fij表示第j個自然語言指令特征;
5)通過雙層GRU解碼器逐步生成導航指令;
6)將解碼得到的導航指令轉換成機器人能夠執行的指令序列,機器人根據指令序列進行自主導航。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910981685.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:液晶顯示裝置
- 下一篇:一種基于分水嶺的極化SAR影像超像素分割方法





