[發明專利]基于哈希檢索的手寫英文單詞智能識別方法有效
| 申請號: | 201811519961.8 | 申請日: | 2018-12-12 |
| 公開(公告)號: | CN109344279B | 公開(公告)日: | 2021-08-10 |
| 發明(設計)人: | 馬磊;陳義學;陳霞;張華英 | 申請(專利權)人: | 山東山大鷗瑪軟件股份有限公司 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06K9/46;G06K9/62 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 劉曉政 |
| 地址: | 250101 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 檢索 手寫 英文單詞 智能 識別 方法 | ||
1.一種基于哈希檢索的手寫英文單詞智能識別方法,其特征在于,包括以下步驟:
步驟(1):提取數據庫中每一張手寫英文單詞圖像的視覺特征和標簽信息,分別得到對應的視覺特征矩陣和標簽信息矩陣;
步驟(2):根據標簽信息矩陣計算數據庫中圖像兩兩之間的相似性,得到相似性矩陣;
步驟(3):利用視覺特征矩陣、標簽信息矩陣和相似性矩陣,獲得數據庫中每一張手寫英文單詞圖像的哈希碼;
步驟(4):根據獲得的哈希碼,學習視覺特征到哈希碼的映射,即哈希函數;
步驟(5):讀取待檢索的手寫英文單詞圖像,利用哈希碼檢索數據庫中圖像的哈希碼,完成圖像識別;
所述步驟(3)包括:
步驟(3.1):利用視覺特征矩陣、標簽信息矩陣和相似性矩陣,設計哈希函數;
步驟(3.2):根據哈希函數設計優化算法,獲得數據庫中每一張手寫英文單詞圖像的哈希碼;
所述步驟(3.1)具體包括:首先考慮哈希碼是原始數據核化之后通過一個映射矩陣映射而來,即XW;其次考慮嵌入標簽信息,即假設標簽可以被映射成哈希碼,即LG;目標哈希函數為:
s.t.B∈{-1,1}n×r
其中S為相似性矩陣,X為視覺特征數據矩陣,L為標簽矩陣,W和G都為映射矩陣,T為轉置矩陣,B為最終要學習的哈希碼,||·||F表示Frobenius范數,γ為參數,μ、θ為平衡參數;
所述步驟(3.2)具體包括:使用迭代算法,每一次迭代分成多步,每一步都固定其他參數更新一個參數,直到收斂或者達到最大迭代次數;其中:每一次迭代分為三個步驟:
步驟(3.2.1):固定變量B和G,更新變量W;
步驟(3.2.2):固定變量W和B,更新變量G;
步驟(3.2.3):固定變量G和W,更新變量B;
所述步驟(3.2.1)中,當變量B和G固定時,目標哈希函數可以被改寫成公式1:
可以通過求公式1導數為零的解得到公式1的閉式解,得到公式2:
W=C-1(AG+θXTB)(GTDG+θIr×r)-1
其中A=XTSL,C=XTX,D=LTL,I為單位矩陣;
所述步驟(3.2.2)中,當變量W和B固定時,目標哈希函數可以重新寫作公式6:
相似地,計算公式6導數為零的解,得到公式7:
G=D-1(μLTB+ATW)(WTCW+μIr×r)-1;
所述步驟(3.2.3)中,當變量G和W固定時,目標哈希函數可以被改寫成公式3:
s.t.B∈{-1,1}n×r.
對于公式3進行如下變換得到公式4:
其中Tr(·)是跡,由于和是常數,公式4可以進一步簡化為公式5:
s.t.B∈{-1,1}n×r.
因此,B的閉式解如下:
B=sgn(μLG+θXW)
其中sgn(·)是元素級別的符號函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東山大鷗瑪軟件股份有限公司,未經山東山大鷗瑪軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811519961.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種視覺搜索方法、裝置及設備
- 下一篇:一種基于圖模型的流程圖檢索方法及系統





