[發明專利]一種基于人腳圖像的腳型分類方法有效
| 申請號: | 201510329437.4 | 申請日: | 2015-06-15 |
| 公開(公告)號: | CN104966099B | 公開(公告)日: | 2018-03-20 |
| 發明(設計)人: | 謝鳳英;史蒙云;李陽;潘琛;孫婉盈 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京慧泉知識產權代理有限公司11232 | 代理人: | 王順榮,唐愛華 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖像 腳型 分類 方法 | ||
1.一種基于人腳圖像的腳型分類方法,其特征在于:其步驟如下:
步驟一:數據庫的建立
收集大量的人腳正面的圖像,對不同的腳進行腳型特征學習,收集過程包括以下三個方面:
(1)圖像獲取
將穿著純色襪子的腳踩在水平地面上,并要求地面背景色與襪子顏色有一預定的區分度;穿黑色的襪子踩在淺色的地板上,鏡頭在腳的正上方垂直向下進行拍攝,使腳的中軸線與圖像的垂直方向保持一致,并且保證腳掌部分全部包含在圖像中,同時確保圖像背景簡單,即圖像中只有腳目標和地面背景;
(2)數據收集
在保證采集背景與襪子顏色有區分度的情況下,變換不同的背景以及襪子顏色,對不同的人進行正面腳成像,共收集到300幅實驗樣本;
(3)樣本真值的產生
標準腳型分為羅馬腳、希臘腳和埃及腳,對一幅圖像的腳型類別進行人工分類,并按大多數原則來確定圖像的腳型類別,該類別即為該圖像的腳型真值;
步驟二:預處理去陰影
對于收集到的300幅實驗圖像,采用顯著性方法對腳掌部位進行增強,去除腳掌部位的陰影干擾;
步驟三:提取腳掌部位
該步驟中,采用大津閾值法實現圖像的分割,將腳掌從圖像中提取出來;
(1)圖像二值化
所述的“大津閾值法”,詳述如下:
假設t為目標與背景的分割閾值,像素灰度小于t的為目標,反之為背景像素;令目標像素點占圖像比例為w0,平均灰度為u0,背景像素點占圖像比例為w1,平均灰度為u1;
則圖像的總平均灰度為:
目標和背景之間的方差為:
根據大津閾值原理,在[0,255]范圍內,遍歷閾值t,當方差g最大時,即能得到最佳的分割閾值t*;
(2)噪聲和孔洞的去除
用t*對圖像二值化處理后,圖像背景中會出現噪聲,腳目標的內部也會出現孔洞;根據先驗知識,人腳對應了圖像中最大的連通區域,因此搜索圖像中最大的連通區域作為目標提取出來,而其他小的連通區域作為噪聲濾除,同時,對于目標內部的孔洞,采用種子填充的方法進行去除;
步驟四:提取腳掌輪廓的特征
提取2個斜率和2個面積比作為腳型分類的特征;
(1)提取關鍵點
關鍵點包括輪廓最右側點A、輪廓最上側點B、腳掌輪廓最左側點C、輪廓左上轉折點D;點A、B、C是分別通過水平搜索最上側點或者垂直搜索左右兩側最外側的點得到;對于B和C之間的任意輪廓點,對B點豎直方向直線和C點水平方向直線做垂線并圍成矩形,則D點是B和C之間所有輪廓點中圍成矩形面積最大的點;
(2)斜率特征提取
假設p和q是兩個關鍵點,且這兩點之間的邊緣點序列為(x1,y1),(x2,y2)…(xn,yn),用這個邊緣點序列擬合出一條直線:
y=kx+b
上面公式中,k為擬合直線的斜率,b為擬合直線的偏置值;
根據最小二乘法原理,k和b的值由下列公式求出:
其中,
n為該邊緣點序列的像素總個數;對關鍵點對(A,B)和(B,D),采用直線擬合方法,得到2條直線,而這2條直線的斜率特征即能用于后續的決策樹分類;
(3)面積特征提取
對A點和B點做水平線和豎直線,利用四條直線得到一個矩形,依次統計矩形所圍區域中腳內像素數sum_in和腳外像素數sum_out,計算腳外面積和腳內面積比:
Rate=sum_in/sum_out
同理,利用B點和D點亦能得到一個矩形,求得另一個面積比,這2個面積比特征與前面的兩個直線特征一起用于后續的決策樹分類;
步驟五:建立腳型分類模型
腳型分類問題是一個典型的模式分類問題,其中人腳圖像是待識別模式,其對應的腳型為類標號,采用C4.5決策樹方法來構建分類模型;
所述的“C4.5決策樹方法”,詳述如下:
設D為訓練樣本集,有sum個樣本,分別屬于C1,C2和C3三個類別,分別對應了羅馬腳、希臘腳和埃及腳三種腳型,共有四個屬性,包括兩條直線斜率和兩個面積比率;
(1)計算訓練樣本集類別信息熵
令cj為sum個樣本中類別屬于Cj的樣本數,則
樣本為Cj類的概率為:
樣本集類別信息熵為:
其中,k為類別數,本發明中有三種腳型,因此k=3;
(2)計算屬性V的信息增益率
選擇其中一個屬性V,其中V有互不重合的n個取值{v1′,v2′,v3′…vn′},將屬性V的每一個取值vi′,按照從小到大進行排列,得到新的取值序列{v1,v2,v3…vn},則共生成n-1個分割點,共有n-1個劃分方式,設第k個分割點取值為:
ak=(vk+vk+1)/2
它將該節點的數據集劃分為2個數據子集,用[v1,ak],(ak,vn]的數據樣本來表示屬性V的取值;
屬性V的n-1個劃分的每一個情況都作為該屬性的2個離散取值,重新構造該屬性的離散值,則此時V的取值為V={m0,m1},其中m0表示v取值小于等于ak的集合,m1表示v取值大于ak的集合,令di為V=mi(i=0,1)的樣本數,為是V=mi的樣本中屬于Cj的個數,接下來按以下步驟依次計算每個劃分對應的信息增益率;
a)計算屬性V每一個取值的信息熵
屬性V=mi中,屬于Cj類的概率為:
則屬性V的類別條件信息熵
b)計算V=mi的概率
c)計算類別條件信息熵
Entropy(V)=p0I(V=m0)+p1I(V=m1)
d)計算屬性V的信息增益
Gain(V)=I(C)-Entropy(V)
e)計算屬性V的信息熵為
Split(V)=-(p0logp0+p1logp1)
f)計算屬性V的信息增益率
選擇其中信息增益率最大的分割閾值a*作為屬性V的最佳分割閾值;
(3)遞歸執行(2),直到計算出每一個屬性V的信息增益率,選擇具有最大信息增益率的屬性V*,并在其最佳分割閾值a*處創建節點;
(4)第(3)步中的葉節點所包含的樣本如果屬于不同類型,則對該葉節點中的樣本遞歸執行第(1)至第(3)步,直到葉節點中只包含同類型數據;
步驟六:腳型分類預測
給定測試集,采用上述過程建立腳型分類模型,對于待分類的樣本,提取該樣本的關鍵點,計算兩個斜率和兩個面積特征,并將其輸入到訓練好的腳型分類模型,即能預測出該樣本的類別屬性;
在步驟二中所述的“顯著性方法”,詳述如下:
(1)顏色空間轉換
將圖像由RGB顏色空間轉換到Lab顏色空間,包括兩個步驟,首先將RGB顏色空間轉換成XYZ顏色空間,再由XYZ顏色空間轉換到Lab顏色空間;
①RGB顏色空間轉換成XYZ顏色空間的方法如下:
②XYZ顏色空間轉換成Lab顏色空間的方法如下:
L=116*f(Y)-16
a=500*[f(X)-f(Y)]
b=200*[f(Y)-f(Z)]
其中
上面公式中,L、a、b即為Lab色彩空間三個通道的值;
(2)獲取各通道均值
Lab顏色空間中,每一個像素點對應一組通道值即L值、a值和b值,遍歷整個圖像的所有像素點,計算出每個通道均值和
上面公式中,n為圖像中像素點個數;
(3)去除陰影
令(Li,ai,bi)為圖像中第i個像素在L、a、b三個通道的值,則根據顯著性公式,第i個像素的顯著值為
其中m∈{L,a,b}
計算圖像中像素的顯著值,并將其采用下面公式映射到[0,255]:
其中pmax和pmin分別為圖像所有像素中最大和最小的顯著值;
其中,在本步驟中所述的“RGB顏色空間”,是指由紅色、綠色以及藍色的強度表示圖像,“XYZ顏色空間”為由三色刺激值表示圖像,“Lab顏色空間”,是指由亮度值、從純黑到純白的強度、從黃色到藍色的強度來表示圖像。
2.根據權利要求1所述的一種基于人腳圖像的腳型分類方法,其特征在于:在步驟三中所述的“種子填充的方法”,詳述如下:
從腳掌區域中的一個孔洞內點開始,通過上、下、左、右四個方向由內向外逐個像素地用黑色填充直到遇到白色邊界為止。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510329437.4/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





