[發明專利]一種無標記平面物體識別的優化算法有效
| 申請號: | 201410151036.X | 申請日: | 2014-04-15 |
| 公開(公告)號: | CN103903013A | 公開(公告)日: | 2014-07-02 |
| 發明(設計)人: | 金城;賈瓊;馮瑞;薛向陽 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;盛志范 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標記 平面 物體 識別 優化 算法 | ||
1.一種無標記平面物體識別的優化算法,其特征在于依次分為3個階段:離線訓練階段,在線識別階段,增強現實階段;
一、離線訓練階段的具體步驟為:
(1)自動合成訓練樣本
直接以目標平面物體的一張無遮擋圖像作為素材,采用自動合成的方法生成訓練集;具體采用仿射變換的方法從目標平面物體的初始視圖生成新的隨機視圖,并加入白噪聲;這里合成訓練集大小為S,使用隨機方法合成的視圖,作為分類器的訓練樣本;
(2)篩選穩定的關鍵點集??
第一步:將關鍵點提取問題轉化為關鍵點類和非關鍵點類的二分類問題,對圖像上所有像素點進行快速分類:
選取待測像素點m,其以R為半徑的圓周上像素點,隨機挑選圓周上過直徑的兩個像素點,對其灰度值進行以下計算:
且???????????(1)
其中為經過預處理的圖像,m點為待測像素,d為單位向量,R為半徑,為該直徑與水平直徑的夾角,??為4;一旦隨機選定的直徑上像素點灰度值滿足上式,則m點立刻被分類為非關鍵點,同時直徑上兩個像素點也被分類為非關鍵點,若經過4次挑選測試后,m仍未被分類為非關鍵點,則該點有可能為關鍵點,將其加入關鍵點候選集合;
第二步:通過上一步將所有像素遍歷后,得到關鍵點候選集合;使用高斯-拉普拉斯金字塔評分機制對候選關鍵點評分,近似表達式為:
?????????????(2)
以此評分結果作為衡量模型圖像候選關鍵點特征穩定性和顯著性的基本標準;
其中,對原始圖像進行不同尺度的高斯卷積運算,并進行降采樣操作,得到不同尺度的圖像組成高斯金字塔,為金字塔的層數,這里是4;?
將高斯金字塔的尺度信息加入關鍵點候選的評分標準,調整評分如下:
???(3)
以此評分結果作為衡量候選關鍵點的最終標準;
通過統計每個關鍵點在訓練樣本中被檢測到的次數,將檢測次數最多的點集作為最終選定的關鍵點集;針對模型的關鍵點候選的評分標準為:
?(4)
其中表示第j個合成樣本中點是否在關鍵點候選集合,當其在候選集合內時值為1,反正則為0?;
(3)?采用半樸素貝葉斯分類器進行分類
(a).使用以關鍵點為中心的鄰域紋理作為該類的描述,該鄰域為邊長32像素的正方形面片;從自動合成的S個樣本中提取關鍵點以及面片,作為各類關鍵點的訓練樣本集;
(b).選擇基于隨機Ferns的半樸素貝葉斯分類器??
使用基于生成型模型的樸素貝葉斯模型建立分類器,依賴多個特征向量對一個類變量進行分類;
使用關鍵點鄰域面片上像素點對之間的灰度值明暗比較結果作為該關鍵點特征;這里使用隨機算法抽取像素點對,基于隨機像素位置的比較得到的特征值,組合成特征向量,最后使用分類器訓練出每個特征值對應的各關鍵點的分類后驗概率分布;
(c).分類器的核心算法如下:
設ck,?k=1,…,H,作為類的集合,將欲分類的面片由一組特征{fj},j=1,…,?N表示,fj表示面片上進行像素點對mj,1和mj,2測試的二進制特征值如式(5),其中表示灰度圖像:
?????????????????????(5)
分類器的目的是找到面片中概率最大的分類號C,如式(6):
?????????????????????????(6)
將面片輸入分類器中,以特征值代表面片,(6)式等價為(7)式:
???????????????????(7)
由貝葉斯公式知:
?????????????????(8)
其中,右式分母與分類無關,分子的P(C=ck)因子視作常數,因此(7)式近似為:
?????????????????(9)
將N個特征分成M組,假設M組之間的特征獨立性,匹配問題最終轉化為式(10):
????????????????????(10)
訓練階段將訓練樣本提取的面片輸入到分類器中分類,統計隨機森林每個葉子節點上各類的概率分布并對其歸一化,最終得到各類在各特征值下的后驗概率分布;
二、在線識別階段的具體步驟為:
(1)關鍵點提取
提取方法同離線訓練階段的篩選穩定的關鍵點集的關鍵點提取方法,以式(3)為關鍵點的度量標準;?
(2)分類器分類,將目標幀轉化為灰度圖,提取關鍵點
針對每個關鍵點,將其面片輸入訓練好的分類器中,據(10)式選擇后驗概率最大的類作為該關鍵點的匹配,以此概率作為匹配的基本得分;
(3)單應性矩陣估計,使用經典的擬合算法RANSAC即隨機抽樣一致性算法篩選內點集,并估計模型在目標中的位姿矩陣;
(a)擬合算法RANSAC定義如下:已知計算出目標物體到模型的轉換矩陣所有參數,所需最少匹配數為3;每次迭代從匹配全集中隨機選取3個匹配,解出一個初始單應性矩陣,進而從匹配全集中找到所有一定誤差允許范圍內滿足此單應性矩陣的所有匹配,稱為支撐集;當支撐集大小達到一定閾值時,則認為支撐集足夠大,所有匹配為內點,以此支撐集更新初始單應性矩陣;否則重新迭代;在RANSAC之后使用Levenberg-Marquardt最小二乘估計更新并得到最終單應性矩陣;
(b)改進的擬合算法ARANSAC,?將匹配的得分作為確定新的初始隨機范圍的依據;目標關鍵點在分類器中分類時,分值最高模型關鍵點被匹配;反之,所有與模型關鍵點的匹配中,目標關鍵點紋理最類似的得分更高;所以在全部最高得分的匹配中,內點的概率將高于其在匹配全集中的比例;
將全部得分中最高與最低分的一個中間值作為閾值,使用所有得分的算術平均值作為閾值,只有高于該閾值才作為初始集的候選匹配;對匹配全集參照得分進行排序,高于閾值的匹配進入候選集,其他匹配只用于支撐集;采用針對閾值的快速排序算法,遍歷匹配集合一次完成排序;此階段完成后,若成功檢測到目標,則得到待檢測圖像上目標平面物體的位姿矩陣;
三、在線增強現實階段?
使用OpenGL把一個3D物體實時增強于識別的無標記平面物體上,需要對以下幾個矩陣進行操作:(1)投影矩陣轉換;(2)模型矩陣轉換;其中:模型矩陣,是指對模型視景中模型的位置進行矩陣操作,即將模型以固定的姿態固定的位置至于場景中,之后即使場景發生改變,模型仍保持在場景的相對位置固定;投影矩陣,是指對當前場景進行投影變換,即人的視點在變換,看到的場景視圖就不同,現在就是對場景視圖進行從人眼角度的重新投影;
使用一張風景畫實時增強到目標物體的位姿上,其步驟如下:(1)識別階段中得到目標物體的位姿矩陣,將此設為投影矩陣;(2)設定模型矩陣,模型位于場景中中心部分,景深-90,風景畫平面法向量方向與z軸重合;(3)翻轉投影矩陣,因為之前求得的轉換矩陣和人眼觀察到的旋轉平移矩陣是互逆的;(4)場景景深z的范圍為100到1000000;(5)場景背景設置為實時輸入幀,將風景畫貼合在場景中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410151036.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分布式系統的系統測試方法及裝置
- 下一篇:直線引導裝置





