[發明專利]一種基于名片識別的社交關系管理方法有效
| 申請號: | 201310521182.2 | 申請日: | 2013-10-29 |
| 公開(公告)號: | CN103617422B | 公開(公告)日: | 2017-01-11 |
| 發明(設計)人: | 高飛;梅凱城;張元鳴;胡偉江;陸佳煒;盧書芳;李澤界;胡小燕;張雪君;肖剛 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46;G06F17/30 |
| 代理公司: | 杭州天正專利事務所有限公司33201 | 代理人: | 王兵,黃美娟 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 名片 識別 社交 關系 管理 方法 | ||
1.一種基于名片識別的社交關系管理方法,包括以下四個步驟:?
步驟1、錄入名片信息,利用攝像頭或掃描儀進行名片圖像采集,根據名片圖像的特征劃分出文字塊并利用OCR引擎進行字符識別,根據關鍵字段進行分詞處理,對提取的信息歸類錄入,將其填入相應的表單,最后與用戶進行交互,對可能存在的無法識別信息進行人工確認與調整;?
步驟2、建立社交關系網絡;?
步驟3、實現智能檢索;?
步驟4、完成移動終端同步。?
2.如權利要求1所述的一種基于名片識別的社交關系管理方法,其特征在于:,?
步驟1)中根據名片圖像的特征劃分文字塊并利用OCR引擎進行字符識別的的具體步驟如下:?
1.1、灰度化。首先對攝像頭或掃描儀采集的名片圖像采用加權平均法進行灰度化。由于人眼對綠色的敏感最高,對藍色敏感最低,因此使用f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)能得到較合理的灰度圖像。其中(i,j)表示像素坐標,彩色圖像中紅、綠、藍三個分量分別為R(i,j)、G(i,j)、B(i,j),f(i,j)則為該點的灰度值;?
1.2、邊緣提取。結合Sobel算子與LOG(Laplacian?of?Gauss)算子,形成修正LOG算法,即選取下列Sobel算子(Sx為水平方向的中心分差,Sy為垂直方向的中心分差,選取其中較大值作為梯度S)S=max{|Sx|,|Sy|}作為邊緣檢測的前提條件,減少多余的零交叉點。再利用此函數作為濾波器,進行LOG檢測。?LOG算子模板為它是LOG的數字形式,將其作為內核對圖像做卷積。σ為高斯分布的均方差;?
1.3、二值化。計算出閾值對灰度圖進行二值化。若灰度圖高為h,寬為w,求得閾值,即灰度平均值再根據閾值Threshold進行二值化:
1.4、傾斜檢測與矯正。通過霍夫變換(Hough?Transform)檢測名片框的邊緣線,獲得名片區域并判斷出名片的傾斜角度進行矯正。由于y=kx+b形式的直線方程無法表示x=c形式的直線(c為常數,即與x軸平行的直線,斜率k→∞)。故這里采用參數方程ρ=x*cosθ+y*sinθ,其中通過選取p1(x1,y1),p2(x2,y2)兩監測點,可以得到傾斜角根據傾斜角θ對原圖與二值圖像同時進行仿射變換(使用齊次矩陣表示),P'=P·R,將-θ代入2D旋轉矩陣得到矯正矩陣由點矯正后得到。具體運算為:
1.5、圖像分割。根據名片圖像的特征劃分出文字塊。包括步驟如下:?
1.5.1、定義探測密度Density,為當前像素上下左右及斜對角線共8個方向上的相鄰像素中黑色像素的數量,計算公式為:?其中i∈[x-1,x+1]∩N*,j∈[x-1,x+1]∩N*,(x,y)為當前探測點坐標,N*為正整數集;?
1.5.2、將名片區域的圖像轉化為密度矩陣,去掉余下噪點。操作方法如下:逐個判斷各個像素的密度,當Density<2時,對應矩陣元素記為0,即當作噪聲處理。當Density>=2時,對應矩陣元素記為1,表明該像素為文字塊一部分;?
1.5.3、通過轉換公式將矯正后的二值單色圖轉化為以下的二維數組形式:
1.5.4、根據密度矩陣,定位文字塊區域(此次有兩種策略分辨應用于快速識別模式與精準識別模式),然后依據區域對名片圖像進行分割??焖僮R別策略:逐行判斷密度矩陣,每一行內“1”元素占單元個數的比例超過一定閾值,則視為文本行,低于此閾值則視為空白。精準識別策略:逐行判斷密度矩陣,將行內連續的“0”元素連結成“探測線”,根據“探測線”起始端的深淺、長度差異與末端位置特征判斷是否為文本區域。即去除長度小于閾值的探測線;然后標記出第一條探測線的末端與第二條探測線的始端;對所有行進行探測與標記后,由標記圍成的區域即文本區域;?
1.5.5、定義Ri∈{d(i,y)|y∈[0,h]∩N*},當且僅當?時記錄下j值。最后所得的一組區域[j1,j2],[j2,j3],[j3,j4]…即若干文字塊,其中h表示行數,w表示列數,N*為正整數集,Ri為步驟3的二維數組中第i行的元素,Sumj為Ri所在行所有元素之和。?
1.6、字符識別。利用OCR(Optical?Character?Recognition)技術提取出每一個文字塊的信息。這里采用MODI(Microsoft?Office?Document?Imaging)的OCR模塊對分割出的圖像逐一進行識別,將每一文字塊圖像都變成一組文字。即對文字塊[j1,j2],[j2,j3],[j3,j4]…逐一調用OCR識別引擎,得到與每個區域對應的字符集C1,2,C2,3,C3,4…。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310521182.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:滅弧室快速裝配機
- 下一篇:基于多重頻的非正側面陣機載雷達近程雜波抑制方法





