[發明專利]基于哈希檢索的手寫英文單詞智能識別方法有效
| 申請號: | 201811519961.8 | 申請日: | 2018-12-12 |
| 公開(公告)號: | CN109344279B | 公開(公告)日: | 2021-08-10 |
| 發明(設計)人: | 馬磊;陳義學;陳霞;張華英 | 申請(專利權)人: | 山東山大鷗瑪軟件股份有限公司 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06K9/46;G06K9/62 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 劉曉政 |
| 地址: | 250101 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 檢索 手寫 英文單詞 智能 識別 方法 | ||
本發明公開提供了一種基于哈希檢索的手寫英文單詞智能識別方法,包括以下步驟:步驟(1):提取數據庫中每一張手寫英文單詞圖像的視覺特征和標簽信息,分別得到對應的視覺特征矩陣和標簽信息矩陣;步驟(2):根據標簽信息矩陣計算數據庫中圖像兩兩之間的相似性,得到相似性矩陣;步驟(3):利用視覺特征矩陣、標簽信息矩陣和相似性矩陣,獲得數據庫中每一張手寫英文單詞圖像的哈希碼;步驟(4):根據獲得的哈希碼,學習視覺特征到哈希碼的映射,即哈希函數;步驟(5):讀取待檢索的手寫英文單詞圖像,利用哈希碼檢索數據庫中圖像的哈希碼,完成圖像識別。
技術領域
本發明涉及字符識別領域,具體涉及一種基于哈希檢索的手寫英文單詞智能識別方法。
背景技術
隨著信息技術的飛速發展,機器識別手寫字符成為了研究的熱門領域,字符識別技術涉及到圖像處理、機器學習、模式識別等多個學科,并且廣泛應用于手寫文檔電子化,減少人工錄入成本,提高輸入效率。
目前應用于脫機手寫英文單詞識別的主要方法有三類:結構方法、統計方法和神經網絡方法。結構方法在實際應用中抗干擾能力差且復雜度高,這種技術已經逐漸衰弱。統計方法有很強的理論基礎,其中基于隱馬爾科夫模型的統計學方法具有很好的建模能力,對噪聲和變形也都有較好的適應性,已經被廣泛應用于脫機手寫字符的識別中,并取得了不錯的成果。近年來,深度學習發展迅速,由于神經網絡有較強的學習能力和容錯能力,很多基于神經網絡的方法被提出,主要分為兩大類:基于卷積神經網絡的和基于遞歸神經網絡的方法?;诰矸e神經網絡的方法一般用來做分類任務,利用卷積層提取圖片的本質特征,用多層的全連接作為分類器;基于遞歸神經網絡的方法利用遞歸神經網絡考慮時間序列的優勢,每一個時間戳生成一個字符,得到的字符序列就是識別結果。
但是,當前采用的脫機手寫英文單詞識別方法均存在手寫單詞形狀嚴重變形等問題,脫機手寫字符識別一直以來都是字符識別領域中的一個重點和難點。另外,基于檢索的手寫英文單詞識別中需要對單詞圖庫進行檢索對比,而且數據量巨大,傳統的檢索方法往往難以保證實時性。
發明內容
針對以上問題,本發明的目的在于提供一種基于哈希檢索的手寫英文單詞智能識別方法。基于哈希學習的檢索在計算機視覺、機器學習、信息檢索及相關領域已經得到了廣泛的應用。哈希學習方法將文檔、圖片、視頻或者其他類型的數據編碼成二進制碼,實際上是將數據從原始空間映射到海明空間中并且保持原始數據的相似性。有了二進制碼,由于在同一空間中成對比較的高效性,最近鄰搜索的任務可以在大規模數據集上進行。
本發明為實現上述目的,通過以下技術方案實現:一種基于哈希檢索的手寫英文單詞智能識別方法,包括以下步驟:
步驟(1):提取數據庫中每一張手寫英文單詞圖像的視覺特征和標簽信息,分別得到對應的視覺特征矩陣和標簽信息矩陣;
步驟(2):根據標簽信息矩陣計算數據庫中圖像兩兩之間的相似性,得到相似性矩陣;
步驟(3):利用視覺特征矩陣、標簽信息矩陣和相似性矩陣,獲得數據庫中每一張手寫英文單詞圖像的哈希碼;
步驟(4):根據獲得的哈希碼,學習視覺特征到哈希碼的映射,即哈希函數;
步驟(5):讀取待檢索的手寫英文單詞圖像,利用哈希碼檢索數據庫中圖像的哈希碼,完成圖像識別。
進一步,所述步驟(1)的具體過程為:
步驟(1.1):假設有n幅手寫英文單詞圖像,對每幅圖像提取d維的視覺特征,使用了預訓練好的VGG-19中conv5_4層的輸出作為提取的圖片特征,得到一個n×d視覺特征數據矩陣X=[x1,x2,...,xn]∈Rn×d,其中n表示實例的數量,d表示特征維度,c表示類別數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東山大鷗瑪軟件股份有限公司,未經山東山大鷗瑪軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811519961.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種視覺搜索方法、裝置及設備
- 下一篇:一種基于圖模型的流程圖檢索方法及系統





