[發(fā)明專利]單眼視覺同時定位與建圖(SLAM)的快速初始化有效
| 申請?zhí)枺?/td> | 201380056667.7 | 申請日: | 2013-10-18 |
| 公開(公告)號: | CN104781849B | 公開(公告)日: | 2018-05-25 |
| 發(fā)明(設(shè)計)人: | 格哈德·賴特邁爾;亞歷山德羅·穆洛尼 | 申請(專利權(quán))人: | 高通股份有限公司 |
| 主分類號: | G06T7/12 | 分類號: | G06T7/12;G06K9/00;G06T7/73 |
| 代理公司: | 北京律盟知識產(chǎn)權(quán)代理有限責任公司 11287 | 代理人: | 宋獻濤 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 參考圖像 后續(xù)圖像 初始化 單眼視覺 六自由度 細化 三維 視覺 追蹤 | ||
本發(fā)明描述用于快速視覺同時定位與建圖的設(shè)備和方法。在一個實施例中,立即根據(jù)第一參考圖像且在處理后續(xù)圖像之前初始化三維3D目標。在一個實施例中,處理一或多個后續(xù)參考圖像,且以六自由度來追蹤所述3D目標。在一個實施例中,基于所處理的所述一或多個后續(xù)圖像來細化所述3D目標。
本申請案主張2013年3月14日申請的美國申請案第13/831,405號的權(quán)利和優(yōu)先權(quán),所述美國申請案又主張2012年11月2日申請的美國臨時申請案第61/722,091號的權(quán)利和優(yōu)先權(quán),所述兩個申請案特此以全文引用的方式并入本文中。
技術(shù)領(lǐng)域
本文中所揭示的標的大體上涉及視覺同時定位與建圖。
背景技術(shù)
在增強現(xiàn)實系統(tǒng)和機器人導航中使用同時定位與建圖(SLAM)以從環(huán)境或場景建置目標。視覺SLAM(VSLAM)將攝像機或視覺傳感器數(shù)據(jù)或圖像用作輸入以建置環(huán)境的目標或模型。當結(jié)合增強現(xiàn)實(AR)系統(tǒng)來使用VSLAM時,可將虛擬物體插入到用戶對真實世界的視域中并在裝置(例如,移動裝置、蜂窩式電話或其類似者)上顯示所述虛擬物體。
使VSLAM追蹤或確定攝像機位置和定向(姿勢)的一個常見先決條件是使用已知的參考。例如,已知或先前所獲取的參考可為環(huán)境或被插入到真實世界中的人工標志的3維(3D)模型。傳統(tǒng)VSLAM也可要求第一參考圖像為在初始化和追蹤之前的環(huán)境中的平面表面的精確前視圖。否則,在無已知的參考或精確俘獲的初始圖像的情況下,物體可出現(xiàn)在錯誤位置處或環(huán)境的映射可完全失敗。
具有單一攝像機的利用VSLAM的追蹤系統(tǒng)也可依賴于根據(jù)由單一攝像機所俘獲的兩個單獨參考圖像來初始化3D目標。使用傳統(tǒng)技術(shù)基于兩個參考圖像來建立3D目標僅在所述兩個參考圖像之間的攝像機運動是適當?shù)那疫€維持兩個圖像中的場景間的足夠重疊的情況下才有可能。當在兩個經(jīng)特定地界定的參考圖像之間存在足夠的最小平移時,可將所述參考圖像確定為適當?shù)摹?/p>
傳統(tǒng)VSLAM實施方案也可依賴于直接用戶輸入來選擇兩個參考圖像或提供額外視覺目標以便可在將3D目標初始化之前記錄6自由度(6DoF)攝像機運動。
例如,一些追蹤方法要求用戶在無視覺反饋的情況下執(zhí)行特定非直觀運動序列,使得可使用3D重構(gòu)建方法來找出環(huán)境中的真實平面并根據(jù)此平面將3D目標初始化。
由于傳統(tǒng)VSLAM方法的以上限制,當前的增強現(xiàn)實用戶體驗可常常為令人沮喪的且感到不自然。此外,大多數(shù)用戶不太可能知道或理解進行傳統(tǒng)VSLAM初始化所必要的攝像機運動。典型用戶也常對于其為何應(yīng)不得不在增強現(xiàn)實系統(tǒng)可顯示場景的追蹤更新之前執(zhí)行特定運動而感到困惑。
因此,需要改善的VSLAM初始化和追蹤。
發(fā)明內(nèi)容
本文中所揭示的實施例可涉及一種用于視覺同時定位與建圖的方法。所述方法包含根據(jù)第一參考圖像且在處理后續(xù)圖像之前初始化三維目標。所述方法進一步包含:處理一或多個后續(xù)圖像;以6DoF來追蹤3D目標;和基于對所述一或多個后續(xù)圖像的處理來細化3D目標。
本文中所揭示的實施例也可涉及一種計算機可讀非暫時性存儲媒體,其具有用以執(zhí)行視覺同時定位與建圖的指令。所述媒體包含用于根據(jù)第一參考圖像且在處理后續(xù)圖像之前初始化三維目標的指令。所述媒體進一步包含用于執(zhí)行以下步驟的指令:處理一或多個后續(xù)圖像;以6DoF來追蹤3D目標;和基于對所述一或多個后續(xù)圖像的處理來細化3D目標。
本文中所揭示的實施例也可涉及一種設(shè)備,其包含用于根據(jù)第一參考圖像且在處理后續(xù)圖像之前初始化三維目標的裝置。所述設(shè)備進一步包含用于執(zhí)行以下步驟的指令:處理一或多個后續(xù)圖像;以6DoF來追蹤3D目標;和基于對所述一或多個后續(xù)圖像的處理來細化3D目標。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于高通股份有限公司,未經(jīng)高通股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380056667.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:停電通知與確定
- 下一篇:二維碼、二維碼的生成系統(tǒng)以及分析程序





