[發明專利]一種解析房產證照片內容的方法有效
| 申請號: | 201711305635.2 | 申請日: | 2017-12-11 |
| 公開(公告)號: | CN108038504B | 公開(公告)日: | 2019-12-27 |
| 發明(設計)人: | 俞中宏;張佳敏;蔡立俊;曾智磊;張德恩 | 申請(專利權)人: | 深圳房訊通信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/34;G06K9/46 |
| 代理公司: | 11574 北京律遠專利代理事務所(普通合伙) | 代理人: | 丁清鵬 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 解析 房產證 照片 內容 方法 | ||
1.一種解析房產證照片內容的方法,其特征在于,所述的解析房產證照片內容的方法包括以下步驟:
1)對不同版本房產證照片進行采集,在數據庫建立不同版本房產證模板
對不同版本的房產證做了識別的標簽-“模板”,房產證模板是一個Json數據,里面記錄了房產證的標準寬度,以及每個信息字段的名稱、位置和寬高;
2)拍攝待識別房產證照片,識別字段區域,計算模板匹配度,選取最高匹配度的版本作為待識別的房產證的版本;
a.識別字段區域,利用房產證邊框自動查找技術識別字段區域,具體步驟為:
(1)利用Opencv中自適應二值化算法將圖片從彩色、灰色照片轉換為黑白兩色圖片;
(2)利用Opencv中FindContours算法獲取圖片上所有的輪廓的輪廓集合,枚舉所有的點,計算任意兩個點的長度,找出最長的長度對應的兩個點,記作點1、點2;然后再枚舉剩余的點,與點1點2行成的三角形,找出三角形周長最大的點,記作點3;然后再次枚舉剩余的點,找出與點3距離最長的點,記作點4,點1、點2、點3、點4構成縮減后的輪廓;
(3)篩選出正確的輪廓;剔除凹四邊形的輪廓,選擇凸四邊形輪廓,并在四邊形的每個邊取5個點,共20個點進行底色驗證;
根據模板中獲取每個信息字段的坐標、寬高,得到該字段區域的四個頂點及四條邊上的中點;
b.使用8點驗證法對模板的每個字段進行驗證,確定有效模板信息字段的數量;
c.計算模板匹配度,模板匹配度=有效模板信息字段數/模板信息字段數,得到最高匹配度的版本模板,具體步驟為:
對模板的每個字段進行驗證,并計算模板匹配度,得出房產證版本信息;模板匹配度=有效模板信息字段數/模板信息字段數;模板信息字段指的是對應版本房產證中所包含的信息數;每個信息字段都進行8點驗證,通過8點驗證的,這個信息字段算作有效模板信息字段;8點驗證法:是根據模板中取得每個信息字段的坐標、寬高,得到該字段區域的四個頂點及四條邊上的中點,共8個點,確定8個點中某個點的坐標,驗證以這個點的坐標,半徑為10的范圍內的點是否有白點;只要這個半徑范圍內有白點就驗證通過;
3)對每個字段進行分割,通過圖像識別技術對字段進行識別,得到圖片里面的內容;獲取到了房產證圖片所屬的版本,為了獲取該版本房產證中的每個字段信息,將房產證圖片,按照模板進行切割,得到每個內容字段所對應的字段圖;然后通過OCR識別得出字段圖里面的文字信息,再通過卷積神經網絡算法識別出字段圖內的數字信息;然后對各個字段圖所識別出的內容進行匯總,得出房產證照片的所有準確信息;
卷積神經網絡算法主要用三種結構實現對輸入的局部平移不變性:局部接收域、權值共享和次子樣;在卷積層中,前一層的特征圖被一個可學習的卷積核進行卷積,再通過一個激活函數,既可以得到這一層的輸出特征圖;卷積的形式如式(1)所示:
1代表卷積神經網絡結構層數,K是卷積核,Mj表示的是輸入特征圖的集合,代表特征圖的選擇,b表示每個輸出圖的偏置值;
在子采樣層中,如果有N個輸入特征圖,就有N個輸出特征圖,只是每個輸出特征圖都變小了;子采樣層的形式如公式(2)所示:
down(.)表示一個子采樣函數,是對輸入圖像的一個n*n大小的區域求和;這樣輸出圖像在兩個維度上都縮小了n倍;每個輸出特征圖都對一個乘性偏置β和一個加性偏置b;
卷積網絡在本質上是一種輸入到輸出的映射,它能夠學習大量的輸入與輸出之間的映射關系,而不需要任何輸入和輸出之間的精確數學表達式;訓練算法分為兩個階段,第一階段,向前傳播階段:d.從樣本集中取一個樣本(X,YP),將X輸入網絡;e.計算相應的實際輸出Op為公式(3)所示:
Op=Fn(...(F2(F1(XpW(1) W(2))...)W(n))) (3)
第二階段向后傳播階段:f.計算實際輸出Op與相應的理想輸出YP的差;g.按極小化誤差的方法反向傳播調整權矩陣;
通過在線自動生成0-9序列號的工具,生成1000組數據,將這些圖片上的字符歸一化為48*48大小,用600組作為訓練集,400組作為測試集,對卷積網絡進行訓練。
2.根據權利要求1所述的一種解析房產證照片內容的方法在房產證信息識別中的應用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳房訊通信息技術有限公司,未經深圳房訊通信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711305635.2/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





