[發明專利]一種基于跨傳感器遷移學習的室內單目導航方法及系統有效
| 申請號: | 202010330835.9 | 申請日: | 2020-04-24 |
| 公開(公告)號: | CN111578940B | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 高會軍;李湛;薛喜地;孫維超;楊學博;于興虎 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G01C21/20 | 分類號: | G01C21/20;G01C21/00;G01S17/86 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 劉鳳玲 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 傳感器 遷移 學習 室內 導航 方法 系統 | ||
本發明涉及一種基于跨傳感器遷移學習的室內單目導航方法及系統。所述方法包括:根據仿真單線激光雷達數據,采用確定性策略梯度的深度強化學習方法,確定自主導航模型;獲取實際環境中移動機器人在同一時刻的實際單線激光雷達數據和單目攝像頭數據;根據實際單線激光雷達數據,采用自主導航模型,確定移動機器人的航向角;根據同一時刻的移動機器人的航向角和相應時刻的單目攝像頭數據,采用Resnet18網絡和預訓練好的YOLO v3網絡,確定激光雷達單目視覺導航模型;根據待確定的單目攝像頭數據,采用激光雷達單目視覺導航模型,確定移動機器人當前時刻的航向角;根據當前時刻的航向角進行移動機器人的導航。本發明提高了搭載單目攝像頭的移動機器人導航的準確性。
技術領域
本發明涉及室內視覺導航領域,特別是涉及一種基于跨傳感器遷移學習的室內單目導航方法及系統。
背景技術
無人機、無人車等可移動機器人能夠為人類社會帶來極大的便利,以無人機為例,從最初的實驗性試飛到民用航拍,再到近些年來的自主導航甚至分布式定位及建圖,都極大提高了人們的工作效率。以小型無人機、無人車為代表的移動機器人體積小、機動性高等特點使其在室內及相似復雜環境中能夠更加方便地執行任務。因此,如果移動機器人能夠在復雜陌生室內環境中自主智能導航,將極大的擴展其應用范圍。然而,移動機器人的室內自主導航算法的研發具有很大的挑戰性,自從自主導航算法誕生以來,其在環境結構不確定、光線不穩定,以及室內的行人具有形態差異大、行走方向隨意性高等場景下自適應穩定導航一直是無人機、無人車等移動機器人自主導航領域中的難點之一。因此研究室內環境下的自主導航方法具有重大意義。
自然界的生物經過長期進化,環境的多變性反復強化了生物對環境的適應能力。生物科學研究表明,生物在適應一個環境時,是通過不斷與環境進行交互,并且獲得環境的反饋來不斷強化生物的某項能力。例如動物的行走、捕獵、群體運動等等,生物都是在不斷地試錯的過程中來不斷改善和提升自身的決策策略。該類型學習過程亦屬于演化進化的范疇,其特點是沒有對環境進行精確建模,僅僅是通過與環境的不斷交互,來獲取環境對自身的獎勵或者懲罰來不斷改進自身的策略。以無人機為例,對于其自主導航,亦可以用這種類型的學習方式來習得在未知環境中的自主導航能力。在此過程中,將無人機類比作生物,無人機不斷試錯學習的過程類比作生物的學習過程,生物能夠獲取到自然界反饋的回報,因此對于無人機在自主學習導航的過程中,可以人為的設定對于無人機學習自主導航有利的獎勵和懲罰來激勵無人機更快適應這個環境。這也是強化學習算法的基本思想,可以看出,強化學習屬于端到端的學習類型,輸入一個環境狀態,直接輸出一個決策動作。
目前,根據路徑規劃是否基于軌跡法,可將移動機器人導航算法分為兩大類,分別是基于軌跡規劃的方法和基于動作響應的(端到端決策)方法。對于基于軌跡規劃的方法,其優點在于通過動態規劃,可以求解出一條全局最優路徑,其結果更加可控,更加穩定,但是該類方法帶來的弊端是算法耗時長,比較依賴計算機的算力,而且往往基于軌跡規劃的算法的泛化能力會相對比較弱一些。對于基于動作響應的方法,此類方法的優點在于其為端到端決策類型的算法,通常算法決策耗時比較短,同時目前基于端到端的算法的泛化能力普遍要優于基于軌跡的方法,但是基于端到端的方法的短板也非常明顯,那就是其決策并不一定是全局最優解。
基于動作響應的導航算法又可分為自主學習類和非自主學習兩類,非自主學習類的算法諸如人工勢場法等算法,但由于當移動機器人距離障礙物過近或者離目標位置太遠將會導致局部震蕩等一系列問題,雖然后續有改進版本的人工勢場法,但也使得其參數變得很難整定,實際應用起來很難。對于自主學習類的移動機器人導航算法,目前主要是基于深度強化學習和深度學習的方法。目前應用深度強化學習進行室內導航較為成功的案例有諸如基于狀態值估計的Generalization through Simulation Integrating Simulatedand Real Data into Deep Reinforcement Learning forVisionBasedAutonomousFlight(GTS),該方法為移動機器人室內導航的端到端決策方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010330835.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種恒溫智能米缸
- 下一篇:一種串列式軋機軋制長鋼軌控制方法





