[發(fā)明專利]文字檢索方法及文字檢索裝置有效
| 申請?zhí)枺?/td> | 201611225709.7 | 申請日: | 2016-12-27 |
| 公開(公告)號: | CN106649764B | 公開(公告)日: | 2020-04-17 |
| 發(fā)明(設計)人: | 王曉健;江世盛 | 申請(專利權)人: | 北京漢王數(shù)字科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 北京瑞盟知識產(chǎn)權代理有限公司 11300 | 代理人: | 劉昕;謝玉斌 |
| 地址: | 100093 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 檢索 方法 裝置 | ||
1.一種文字檢索方法,包括:
識別用戶打開的電子文檔中的表意文字描述序列;
將所識別的表意文字描述序列轉換為擴展表意文字描述序列,并基于所述擴展表意文字描述序列創(chuàng)建擴展表意文字描述序列庫,其中,所述擴展表意文字描述序列由二元表意文字描述符和基本部件構成,所述基本部件包括偏旁和不適合繼續(xù)拆分的字符;
判斷所輸入的待檢索文字是否為表意文字描述序列,其中,
當所述待檢索文字為表意文字描述序列時,將所述待檢索文字轉換為擴展表意文字描述序列,并在所述擴展表意文字描述序列庫中進行檢索;
當所述待檢索文字不是表意文字描述序列時,在所述電子文檔中檢索所述待檢索文字。
2.根據(jù)權利要求1所述的文字檢索方法,所述在所述擴展表意文字描述序列庫中進行檢索還包括判斷檢索是否成功,如果是,輸出檢索結果,如果否,在基于Unicode字符集預先創(chuàng)建的擴展表意文字描述序列字典中檢索所述待檢索文字對應的擴展表意文字描述序列,其中,
所述基于Unicode字符集預先創(chuàng)建的擴展表意文字描述序列字典是擴展表意文字描述序列形成的字典文件,不包括基本部件,字符的Unicode編碼與其擴展表意文字描述序列一一對應;
當檢索到與所述待檢索文字相對應的編碼字符時,在所述電子文檔中進行檢索,并輸出檢索結果;
當沒有檢索到與所述待檢索文字相對應的編碼字符時,確定所述待檢索文字并不存在于所述電子文檔中,并輸出檢索結果。
3.根據(jù)權利要求1所述的文字檢索方法,所述在所述電子文檔中檢索所述待檢索文字還包括:判斷檢索是否成功,如果是,則輸出檢索結果,如果否,在基于Unicode字符集預先創(chuàng)建的擴展表意文字描述序列字典中檢索所述待檢索文字對應的擴展表意文字描述序列,其中,
所述基于Unicode字符集預先創(chuàng)建的擴展表意文字描述序列字典是擴展表意文字描述序列形成的字典文件,不包括基本部件,字符的Unicode編碼與其擴展表意文字描述序列一一對應;
當檢索到與所述待檢索文字相對應的擴展表意文字描述序列時,在所述擴展表意文字描述序列庫中進行檢索,并輸出檢索結果;
當沒有檢索到與所述待檢索文字相對應的擴展表意文字描述序列時,確定所述待檢索文字未存在于所述電子文檔中,并輸出檢索結果。
4.根據(jù)權利要求1所述的文字檢索方法,所述創(chuàng)建擴展表意文字描述序列庫還包括通過將所述表意文字描述序列中的三元表意文字描述符替換為兩個二元表意文字描述符來獲得所述擴展表意文字描述序列。
5.根據(jù)權利要求4所述的文字檢索方法,所述創(chuàng)建擴展表意文字描述序列庫進一步包括:如果所述擴展表意文字描述序列中相鄰兩個二元表意文字描述符相同,則將所述相鄰兩個二元表意文字描述符后的表意文字描述序列前移至所述相鄰兩個二元表意文字描述符之間。
6.根據(jù)權利要求1-5任一項所述的文字檢索方法,其中,在所述擴展表意文字描述序列中,文字按照從左到右、從上到下的順序被依次拆分為由所述二元表意文字描述符和所述基本部件構成的表意文字描述序列。
7.根據(jù)權利要求2所述的文字檢索方法,其中,所述擴展表意文字描述序列字典中不包括所述基本部件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京漢王數(shù)字科技有限公司,未經(jīng)北京漢王數(shù)字科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611225709.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





