[發明專利]圖片審核方法和系統在審
| 申請號: | 201310058758.6 | 申請日: | 2013-02-25 |
| 公開(公告)號: | CN103116752A | 公開(公告)日: | 2013-05-22 |
| 發明(設計)人: | 郝雙 | 申請(專利權)人: | 新浪網技術(中國)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/54 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 黃啟行;方曉明 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 審核 方法 系統 | ||
1.一種圖片審核方法,其特征在于,包括:
對文本圖片進行光學字符識別OCR處理,提取該文本圖片中的文本信息;
對提取的文本信息進行關鍵字/詞的匹配,判斷其中是否包含要過濾的關鍵字/詞;若是,則對該文本圖片進行過濾處理。
2.如權利要求1所述的方法,其特征在于,在所述對文本圖片進行OCR處理,提取該文本圖片中的文本信息之前,還包括:
對所述文本圖片進行二值化處理。
3.如權利要求2所述的方法,其特征在于,在所述對所述文本圖片進行二值化處理之前,還包括:
對所述文本圖片進行灰度化處理。
4.如權利要求3所述的方法,其特征在于,在所述對文本圖片進行OCR處理,提取該文本圖片中的文本信息之前,還包括:對所述文本圖片進行去除噪聲處理。
5.如權利要求1-4任一所述的方法,其特征在于,所述對文本圖片進行OCR處理,提取該文本圖片中的文本信息具體包括:
對所述文本圖片的圖像進行字符切割;
對所述文字圖片中切割出的字符,按照設定單位進行劃分;并對每個設定單位內的字符進行識別:
對所述設定單位內的每個字符進行特征提取和特征匹配后,確定每個字符的候選字;
針對所述設定單位內的每個字符,確定該字符的每個候選字的相似度、以及該字符的每個候選字與該字符相鄰的字符的候選字之間的轉移概率;
根據確定出的相似度和轉移概率,確定出所述設定單位內的字符的識別結果;
根據每個設定單位內的字符的識別結果,確定該文本圖片中的文本信息。
6.如權利要求5所述的方法,其特征在于,所述根據確定出的相似度和轉移概率,確定出所述設定單位內的字符的識別結果具體包括:
確定該設定單位內的第1個字符的候選字的維特比概率為該候選字的相似度;
從該設定單位內的第2個字符起,對于當前字符的每個候選字,根據該候選字的相似度、以及該候選字與該當前字符相鄰的字符中的在前字符的候選字之間的轉移概率,確定出所述當前字符的每個候選字與所述在前字符的各候選字之間的維特比概率;
在確定出當前候選字與各在前候選字之間的維特比概率后,比較各維特比概率,從中選擇最大的維特比概率作為當前候選字的維特比概率;其中,所述當前候選字為所述當前字符的候選字之一,所述在前候選字為所述在前字符的候選字之一;
以所述當前候選字作為當前節點,選擇與該當前候選字之間的維特比概率最大的在前候選字作為與該當前候選字相鄰的在前節點;
確定候選路徑;其中,所述候選路徑中的每個節點為分別針對所述設定單位內的每個字符選擇出的候選字,同一候選路徑中的相鄰節點是根據每個候選字的在前節點確定的;
比較各候選路徑的最后節點的維特比概率,以最后節點的維特比概率最大的候選路徑作為所述識別結果。
7.如權利要求6所述的方法,其特征在于,所述根據該候選字的相似度、以及該候選字與該當前字符相鄰的字符中的在前字符的候選字之間的轉移概率,確定出所述當前字符的每個候選字與所述在前字符的各候選字之間的維特比概率,具體根據如下公式5或4:
Pv=P2×R×Pv'????(公式5)
logPv=b×logP2+c×logR+d×logPv'????(公式4)
其中,Pv為所述當前候選字與所述在前候選字之間的維特比概率;P1為所述當前候選字的出現概率,P2為所述在前候選字與所述當前候選字之間的轉移概率;R為所述當前候選字的相似度;Pv'為所述在前候選字的維特比概率;logPv、logP1、logP2、logR、logPv'分別為對Pv、P1、P2、R、Pv'取對數后得到的值;b、c、d分別為設置的權重值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新浪網技術(中國)有限公司,未經新浪網技術(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310058758.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種插拔型端子排接線式電子產品外殼
- 下一篇:一種PCB薄板顯影引渡橋





