[發明專利]基于圖像內容的關鍵詞搜索方法和裝置有效
| 申請號: | 200810080943.4 | 申請日: | 2008-02-29 |
| 公開(公告)號: | CN101520783A | 公開(公告)日: | 2009-09-02 |
| 發明(設計)人: | 黃開竹;鄭大念;孫俊;堀田悅伸;藤本克仁;直井聰 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 北京三友知識產權代理有限公司 | 代理人: | 李 輝;呂俊剛 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖像 內容 關鍵詞 搜索 方法 裝置 | ||
技術領域
本發明涉及一種快速并準確地從文檔圖像中搜索和定位關鍵詞的裝 置和方法。更具體地說,涉及用于在用戶輸入了感興趣的關鍵詞(例如, “北京”等)時從文檔圖像中自動、準確地搜索并定位關鍵詞的位置的 裝置和方法。
背景技術
傳統的在文檔圖像中定位關鍵詞的方法通常是利用OCR(光學字符 識別,Optical?Character?Recognition)技術來實現的。在傳統的定位關鍵 詞的方法中,首先對文檔圖像進行分割,然后對分割出來的單一字符區 域進行識別,將文檔圖像轉換為文本,并且在識別出的文本中搜索關鍵 詞以進行定位。例如,在美國專利申請US?6470336中公開了這種傳統的 在文檔圖像中定位關鍵詞的裝置和方法。
圖1示出了基于OCR技術的傳統裝置的基本結構及操作流程的方框 圖。
如圖1所示,傳統裝置包括圖像分割單元101、單字識別單元102 以及結果搜索單元103。首先,圖像分割單元101對所輸入的文檔圖像進 行版面分析和圖像分割,以獲得一系列的單一字符的圖像區域。隨后, 單字識別單元102利用OCR技術對通過圖像分割單元101獲得的單一字 符的圖像區域進行識別,以獲得各個圖像區域的識別結果。結果搜索單 元103在通過單字識別單元102獲得的識別結果中搜索關鍵詞,以確定 關鍵詞是否在識別結果中出現。如果出現則返回關鍵詞的出現位置,并 輸出搜索定位的結果。
這種傳統的方法存在很多問題。首先,圖像分割單元101很難準確 地對所輸入的文檔圖像進行分割。尤其是在手寫文檔圖像的情況下,由 于手寫體字符本身存在筆畫粘連,不同的人的書寫風格也不一致,并且 手寫體字符沒有固定的大小,因此很難界定單一字符區域,從而從手寫 文檔圖像中分割出單一字符的圖像區域非常困難,這極大地影響了后續 的單字識別的精度,傳統OCR技術很難處理手寫文檔也主要是因為這個 原因。其次,將所有的字符圖像區域識別成單一字符的方法非常耗時。 對于大字符集合(例如亞洲國家的語言,包括漢字、日文等),字符的種 類通常很多,例如漢字,一級漢字和二級漢字一共有6063種。對這種大 類別的識別問題,由于字符的種類繁多,并且近似字符也很多,導致精 度降低(尤其是對于手寫體識別)。同時,由于需要對每個字符圖像區域 進行識別,導致識別速度進一步下降,從而使得系統的識別效果不是很 好。
另外,傳統方法中還存在利用隱馬爾科夫模型來自動分割文檔圖像 并定位關鍵詞的方法,例如美國專利申請US?5745600和US?5592568中 所公開的方法。但是這些傳統方法缺乏有效的校驗措施,從而使得整體 識別率較低。
發明內容
鑒于上述傳統技術中的問題而提出本發明。本發明的一個目的是提 供一種高精度的基于圖像內容的關鍵詞搜索方法和裝置。
本發明的另一目的是提供一種快速的基于圖像內容的關鍵詞搜索方 法和裝置。
為了實現本發明的目的,本發明提供了一種利用整體匹配技術來選 擇候選關鍵詞圖像區域并利用單一字符識別作為校驗的方法。
根據本發明的一個方面,本發明提供了一種基于圖像內容的關鍵詞 搜索裝置,該關鍵詞搜索裝置在所輸入的文檔圖像中搜索并定位所輸入 的關鍵詞,該關鍵詞搜索裝置包括:整體匹配單元,該整體匹配單元從 所述文檔圖像中提取多個候選關鍵詞圖像區域,提取所述多個候選關鍵 詞圖像區域的圖像特征,將所述圖像特征與所述關鍵詞的特征進行匹配, 以獲得與所述多個候選關鍵詞圖像區域相對應的匹配距離;校驗單元, 該校驗單元對匹配距離小的前N個候選關鍵詞圖像區域進行識別,計算 識別候選和所述關鍵詞之間的校驗距離;過濾單元,該過濾單元計算所 述匹配距離和所述校驗距離的組合距離,并根據該組合距離濾除組合距 離大的候選關鍵詞圖像區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810080943.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





