[發明專利]一種基于名片識別的社交關系管理方法有效

申請號：	201310521182.2	申請日：	2013-10-29
公開（公告）號：	CN103617422B	公開（公告）日：	2017-01-11
發明（設計）人：	高飛;梅凱城;張元鳴;胡偉江;陸佳煒;盧書芳;李澤界;胡小燕;張雪君;肖剛	申請（專利權）人：	浙江工業大學
主分類號：	G06K9/20	分類號：	G06K9/20;G06K9/46;G06F17/30
代理公司：	杭州天正專利事務所有限公司33201	代理人：	王兵,黃美娟
地址：	310014 浙***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于名片識別社交關系管理方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于名片識別的社交關系管理方法，包括以下四個步驟：?

步驟1、錄入名片信息，利用攝像頭或掃描儀進行名片圖像采集，根據名片圖像的特征劃分出文字塊并利用OCR引擎進行字符識別，根據關鍵字段進行分詞處理，對提取的信息歸類錄入，將其填入相應的表單，最后與用戶進行交互，對可能存在的無法識別信息進行人工確認與調整；?

步驟2、建立社交關系網絡；?

步驟3、實現智能檢索；?

步驟4、完成移動終端同步。?

2.如權利要求1所述的一種基于名片識別的社交關系管理方法，其特征在于：，?

步驟1）中根據名片圖像的特征劃分文字塊并利用OCR引擎進行字符識別的的具體步驟如下：?

1.1、灰度化。首先對攝像頭或掃描儀采集的名片圖像采用加權平均法進行灰度化。由于人眼對綠色的敏感最高，對藍色敏感最低，因此使用f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)能得到較合理的灰度圖像。其中(i,j)表示像素坐標，彩色圖像中紅、綠、藍三個分量分別為R(i,j)、G(i,j)、B(i,j)，f(i,j)則為該點的灰度值；?

1.2、邊緣提取。結合Sobel算子與LOG(Laplacian?of?Gauss)算子，形成修正LOG算法，即選取下列Sobel算子（S_x為水平方向的中心分差，S_y為垂直方向的中心分差，選取其中較大值作為梯度S）S=max{|S_x|,|S_y|}作為邊緣檢測的前提條件，減少多余的零交叉點。再利用此函數作為濾波器，進行LOG檢測。?LOG算子模板為它是LOG的數字形式，將其作為內核對圖像做卷積。σ為高斯分布的均方差；?

1.3、二值化。計算出閾值對灰度圖進行二值化。若灰度圖高為h，寬為w，求得閾值，即灰度平均值再根據閾值Threshold進行二值化：

1.4、傾斜檢測與矯正。通過霍夫變換（Hough?Transform）檢測名片框的邊緣線，獲得名片區域并判斷出名片的傾斜角度進行矯正。由于y=kx+b形式的直線方程無法表示x=c形式的直線(c為常數，即與x軸平行的直線，斜率k→∞)。故這里采用參數方程ρ=x*cosθ+y*sinθ，其中通過選取p₁(x₁,y₁)，p₂(x₂,y₂)兩監測點，可以得到傾斜角根據傾斜角θ對原圖與二值圖像同時進行仿射變換（使用齊次矩陣表示），P'=P·R，將-θ代入2D旋轉矩陣得到矯正矩陣由點矯正后得到。具體運算為：

1.5、圖像分割。根據名片圖像的特征劃分出文字塊。包括步驟如下：?

1.5.1、定義探測密度Density，為當前像素上下左右及斜對角線共8個方向上的相鄰像素中黑色像素的數量，計算公式為：?其中i∈[x-1,x+1]∩N^*,j∈[x-1,x+1]∩N^*，(x,y)為當前探測點坐標，N^*為正整數集；?

1.5.2、將名片區域的圖像轉化為密度矩陣，去掉余下噪點。操作方法如下：逐個判斷各個像素的密度，當Density<2時，對應矩陣元素記為0，即當作噪聲處理。當Density>=2時，對應矩陣元素記為1，表明該像素為文字塊一部分；?

1.5.3、通過轉換公式將矯正后的二值單色圖轉化為以下的二維數組形式：

1.5.4、根據密度矩陣，定位文字塊區域（此次有兩種策略分辨應用于快速識別模式與精準識別模式），然后依據區域對名片圖像進行分割?？焖僮R別策略：逐行判斷密度矩陣，每一行內“1”元素占單元個數的比例超過一定閾值，則視為文本行，低于此閾值則視為空白。精準識別策略：逐行判斷密度矩陣，將行內連續的“0”元素連結成“探測線”，根據“探測線”起始端的深淺、長度差異與末端位置特征判斷是否為文本區域。即去除長度小于閾值的探測線；然后標記出第一條探測線的末端與第二條探測線的始端；對所有行進行探測與標記后，由標記圍成的區域即文本區域；?

1.5.5、定義R_i∈{d(i,y)|y∈[0,h]∩N^*}，當且僅當?時記錄下j值。最后所得的一組區域[j₁,j₂]，[j₂,j₃]，[j₃,j₄]…即若干文字塊，其中h表示行數，w表示列數，N^*為正整數集，R_i為步驟3的二維數組中第i行的元素，Sum_j為R_i所在行所有元素之和。?

1.6、字符識別。利用OCR(Optical?Character?Recognition)技術提取出每一個文字塊的信息。這里采用MODI(Microsoft?Office?Document?Imaging)的OCR模塊對分割出的圖像逐一進行識別，將每一文字塊圖像都變成一組文字。即對文字塊[j₁,j₂]，[j₂,j₃]，[j₃,j₄]…逐一調用OCR識別引擎，得到與每個區域對應的字符集C_1,2,C_2,3,C_3,4…。?