[發明專利]圖像文本及形音義特征識別方法和裝置有效
| 申請號: | 201810480463.0 | 申請日: | 2018-05-18 |
| 公開(公告)號: | CN108664945B | 公開(公告)日: | 2021-08-10 |
| 發明(設計)人: | 徐慶 | 申請(專利權)人: | 徐慶;佛山市國方商標服務有限公司;佛山市國方商標識別科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/48 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 周清華 |
| 地址: | 528000 廣東省佛山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 文本 音義 特征 識別 方法 裝置 | ||
本發明涉及一種圖像文本及形音義特征識別方法和裝置,其中,圖像文本及形音義特征識別方法,包括以下步驟:對待處理圖像的圖像特征描述符進行分割,得到各最小單元;按照預設最小單元組合規則對各最小單元進行組合,得到各組合單元數據;基于組合單元數據檢索樣本圖像數據庫,得到匹配組合單元數據的樣本圖像,并獲取樣本圖像與待處理圖像的最小單元匹配率、最小單元不匹配率;選取出最小單元匹配率以及最小單元不匹配率滿足預設應用需求的樣本圖像,并將選取出的樣本圖像已記錄的文本及形音義特征作為待處理圖像的文本及形音義特征。本發明能夠基于海量知識數據信息,從形音義方面對待處理圖像進行文本識別和其形音義特征信息的推定獲取。
技術領域
本申請涉及圖像識別技術領域,特別是涉及一種圖像文本及形音義特征識別方法和裝置。
背景技術
對圖像的內容識別是數字圖像處理中的一項重要工作,傳統技術一般采用光學字符識別OCR(Optical Character Recognition,光學字符識別);OCR是一種基于計算機的將文本圖像轉化為機器可編輯文本的數字形式,能夠提取文本圖像文字信息。
在實現過程中,發明人發現傳統技術中至少存在如下問題:OCR對圖像的內容識別僅限于圖像中的文本圖像,無法識別獲取非文本圖像的內容,目前非文本圖像的內容主要靠人工判斷獲取;傳統技術易造成相同或近似圖像的漏檢。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠獲取圖像更多的文本及其形音義特征的圖像文本及形音義特征識別方法和裝置。
為了實現上述目的,一方面,本發明實施例提供了一種圖像文本及形音義特征識別方法,包括以下步驟:
對待處理圖像的圖像特征描述符進行分割,得到各最小單元;最小單元為對應圖像特征描述符所表示的任一圖像特征點的一個或多個字符串;
按照預設最小單元組合規則對各最小單元進行組合,得到各組合單元數據;
基于組合單元數據檢索樣本圖像數據庫,得到匹配組合單元數據的樣本圖像,并獲取樣本圖像與待處理圖像的最小單元匹配率、最小單元不匹配率;樣本圖像數據庫包含樣本圖像的各最小單元、樣本圖像的各組合單元數據和樣本圖像已記錄的文本及形音義特征;
選取出最小單元匹配率以及最小單元不匹配率滿足預設應用需求的樣本圖像,并將選取出的樣本圖像已記錄的文本及形音義特征作為待處理圖像的文本及形音義特征。
在其中一個實施例中,圖像特征描述符為采用相同或高度相似的字符串、對待處理圖像中具有相同感知內容或特征進行記錄,而采用不同的字符串、對待處理圖像中具有不同感知內容或特征進行記錄的圖像特征表示形式;圖像特征表示形式為描述待處理圖像的圖像特征的一組或多組字符串的集合;
預設最小單元組合規則包括圖像輪廓線的圖像特征描述符的最小單元組合規則和圖像骨架線的圖像特征描述符的最小單元組合規則;
組合單元數據為根據預設最小單元組合規則對各最小單元進行組合得到的、用于存儲以及作為檢索的關鍵詞的字符串數據;
樣本圖像包括商標圖樣、外觀設計圖樣、著作權登記的美術作品圖樣、各漢語文字圖樣、各非漢語文字圖樣以及自定義圖像;樣本圖像數據庫包括商標樣本圖像數據庫、商標構成要素樣本圖像數據庫、文字字典數據庫以及詞語詞典數據庫;形音義特征包括形狀特征、讀音特征以及含義特征;
對待處理圖像的圖像特征描述符進行分割,得到各最小單元的步驟之前還包括步驟:
提取待處理圖像的圖像特征描述符;
和/或
建立樣本圖像數據庫。
在其中一個實施例中,建立樣本圖像數據庫的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于徐慶;佛山市國方商標服務有限公司;佛山市國方商標識別科技有限公司,未經徐慶;佛山市國方商標服務有限公司;佛山市國方商標識別科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810480463.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





