[發明專利]一種基于手機的機場地下停車位定位導航方法在審
| 申請號: | 202210207709.3 | 申請日: | 2022-03-03 |
| 公開(公告)號: | CN114550491A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 王慶;張凱;陽媛;張波 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G08G1/14 | 分類號: | G08G1/14;H04M1/72454;H04M1/72457;G06V10/22;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 蔣昱 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 手機 機場 地下 停車位 定位 導航 方法 | ||
1.一種基于手機的機場地下停車位定位導航方法,具體步驟如下,其特征在于
S11手機端的圖像采集單元采集圖像,通過可微分的RANSAC方法對獲取的RGB圖像進行坐標回歸,得到該張圖像中心點位姿預測,
上述可微分RANSAC方法包括:
S11-1場景坐標回歸,通過ResNet網絡預測二維RGB圖像的每個像素i對應的3維停車場的場景坐標yi(ω),其中ω為神經網絡ResNet模型的參數,通過該模型實現圖像2維像素點(xi,yi)到3維場景坐標的(R,T),R表示3個自由度的空間旋轉,T表示3個自由度的位移,其中表示用f(ω)表示2維圖像相機坐標系到相機6維姿態的映射,其中ω為ResNet神經網絡需要學習的參數,優化可學習的參數ω通過最小化訓練集上最終估計的期望姿勢損失l:
式中f*表示圖像I的位姿的真值,為了對神經網絡通過梯度下降法訓練優化參數ω,對參數ω求導,上述公式的偏導數為:
S11-2位姿假設采樣,每個假設f(ω)的生成都是由圖像對應的子集產生的,這個子集的大小為計算唯一解所需的最小映射數,這個最小子集為MJ,其中J={j1,L,jn},其中n為最小子集數量;假設f(ω)的場景回歸坐標為PnP問題,所以四個場景坐標足以定義一個獨特的相機姿態,所以n=4,由于每次隨機選取四個點進行預測的結果可能是錯誤的,所以通過隨機選擇4對的圖像到場景坐標進行預測,最終可以生成n個圖像的姿態預測f(ω)的集合,每一個生成的場景坐標假設f(ω)都取決于參數ω;
S11-3選擇最優位姿假設,對于有不同場景坐標回歸性能的假設f(ω),需要有評價機制選擇最優的假設,評價決定了相機姿態假設的選擇和最后細化假設的效果,以產生最終的估計,具體如下;
首先定義圖像的像素i和假設f(ω)的重投影誤差為:
ei(f,ω)=||Cf-1ki(ω)-pi||
式中pi為圖像的每個像素i的圖像坐標(xi,yi),C為相機投影矩陣,ki為內點,如果ei<τ,其中τ確定內點的誤差閾值;
場景坐標回歸工作依賴于對內點ki計數來對假設進行評分,為了實現神經網絡端到端的訓練,通過用sigmoid函數來構造一個可微函數:
式中ei表示重投影誤差,超參數β控制sigmoid的柔軟度;
評價函數p(f)對每個假設與所有場景坐標預測的一致性進行評分,指標為j的假設fj(ω)是根據評分值導出的概率分布P(j,ω,α)選擇的,得分高的假設更有可能被選中,選擇最終假設根據softmax分布P:
內點計數分數的大小可以根據場景的難度而有很大的不同,通常在不同環境下有很大數量級的不同,將評價分數保持在合理的范圍內對于擁有廣泛的分布P(j;ω,α)很重要,對穩定端到端訓練很重要,手動設置每個場景的超參數α是一項乏味的任務,在端到端訓練中自動適應α,通過熵來對超參數α大小進行選擇:
在端到端的訓練中訓練是通過argminα|S(α)-S*|梯度下降來確定參數α,選擇是在剛開始的端到端訓練迭代中建立目標熵,并在整個過程中保持穩定;
S11-4細化最優位姿假設,細化函數R是一個迭代過程,它在使用當前姿態估計確定內點像素和優化內點像素的估計之間交替進行,迭代過程如果要使用神經網絡,必須實現端到端的訓練,為了提高訓練得到模型的泛化性和精度,訓練過程分為兩步,第一步采用MAML方法把訓練過程分為內循環和外循環,使模型有一個較好的初始參數,第二部對細化過程可微化,最后可以使神經網絡模型輸出最終位姿R(yj(ω));
S21通過對手機拍攝獲得的圖像進行場景坐標回歸獲得當前人員的位姿,其中可微分的RANSAC的坐標回歸方法精度非常高,位姿精度誤差可以在5cm和5°之內,以通過圖像獲得的位置和姿態作為當前的初始位置。
S22獲取此時此刻手機內置的IMU的數據,根據獲得的初始位置姿態數據,也就是上一時刻的姿態數據進行推理更新,獲得當前時刻的位姿數據,
S23通過IMU進行位姿更新和導航過程中,并通過圖像的場景坐標回歸得到的位姿作為新的初始坐標,初始化IMU的迭代更新過程,通過高精度的視覺定位消除慣性傳感器的累計誤差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210207709.3/1.html,轉載請聲明來源鉆瓜專利網。





