[發明專利]一種匹配關鍵詞的方法及裝置無效
| 申請號: | 201010104942.6 | 申請日: | 2010-01-29 |
| 公開(公告)號: | CN102081638A | 公開(公告)日: | 2011-06-01 |
| 發明(設計)人: | 柯宗貴;柯宗慶 | 申請(專利權)人: | 藍盾信息安全技術股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市國楓律師事務所 11366 | 代理人: | 楊思東 |
| 地址: | 510665 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 匹配 關鍵詞 方法 裝置 | ||
技術領域
本發明涉及計算機及互聯網領域,特別是涉及一種匹配關鍵詞的方法及裝置。?
背景技術
在檢查互聯網信息或文本文件的過程中,通常要分析頁面內容。現有的做法是搜索頁面中包含的一個或多個關鍵字。即用關鍵詞對頁面內容進行匹配,以尋找關鍵詞在頁面中的位置。?
但是,關鍵詞是作為一個整體參與匹配的,例如:“互聯網”,這種技術不能對漢字和非漢字字符夾雜情況下的關鍵詞進行檢索,并且不能檢索到目標關鍵詞的近似詞匯。?
發明內容
本發明提供了一種匹配關鍵詞的方法及裝置,用以解決現有技術不能對漢字和非漢字字符夾雜情況下的關鍵詞進行檢索,并且不能檢索到目標關鍵詞的近似詞匯的問題。?
本發明的匹配關鍵詞的方法,包括下列步驟:生成關鍵碼的步驟:將關鍵詞中的漢字逐一用漢語拼音編碼,生成關鍵碼;生成待檢索碼流的步驟:將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流;匹配的步驟:以關鍵碼對待檢索碼流進行匹配,得出匹配結果。?
本發明的匹配關鍵詞的裝置,包括:第一編碼模塊,用于將關鍵詞中的漢字逐一用漢語拼音編碼,生成關鍵碼;第二編碼模塊,用于將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流;匹配模塊,用于以所述關鍵碼對?待檢索碼流進行匹配,得出匹配結果。?
本發明有益效果如下:?
本發明可對漢字和非漢字字符夾雜情況下的關鍵詞進行檢索,并且可檢索到目標關鍵詞的近似詞匯。?
附圖說明
圖1為本發明實施例中的方法步驟流程圖;?
圖2為本發明實施例中的裝置結構示意圖。?
具體實施方式
為了完善現有關鍵詞檢索技術不能對漢字和非漢字字符夾雜情況下的關鍵詞進行檢索的缺陷,以及不能檢索到目標關鍵詞的近似詞匯的缺陷,本發明提出了一種匹配關鍵詞的方法及裝置,以下通過若干實施例具體說明。?
參見圖1所示,本發明實施例中的方法包括下列主要步驟:?
S1、將關鍵詞中的漢字逐一用漢語拼音編碼,生成關鍵碼。?
S2、將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流。?
S3、以關鍵碼對待檢索碼流進行匹配,得出匹配結果。?
更為具體的在步驟S1和S2中,關鍵詞中若包含英文字符,則在編碼過程中該英文字符作為關鍵碼的一部分予以保留,并且其在關鍵碼中的位置與在原關鍵詞中的位置相同。待檢索頁面中若包含英文字符,則在編碼過程中該英文字符同理作為待檢索碼流的一部分予以保留,并且其在待檢索碼流中的位置與在原待檢索頁面中的位置相同。?
更為具體的在步驟S2和S3中,對待檢索頁面內容的編碼和關鍵字的關鍵碼匹配是同時進行的。即在將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流的過程中,以關鍵碼實時跟蹤匹配,當匹配到相同的編碼時,將當前待檢索碼流尾部與關鍵碼相匹配的編碼對應的文字呈現給用戶。具體流程為?在生成關鍵碼后,按順序從待檢索頁面中獲取一個字符,該字符可為漢字也可為英文字符,若為漢字,則對該漢字用漢語拼音編碼,得到一串英文字符,若為英文字符,則直接將其作為待檢索碼流的一部分。在得到當前字符的編碼后,實時與關鍵碼進行匹配,若關鍵詞為一個字,則可能完整匹配,若關鍵詞為多個字或是中英夾雜,則可能按照關鍵碼從左到右的順序匹配到關鍵碼的片段,之后在下一字符編碼后,繼續進行匹配操作,若經過若干個字符編碼后,可得到連續的關鍵碼片段并可組成完整的關鍵碼,則判定匹配到一個關鍵碼;之后可將待檢索頁面中對應的文字實時以高亮方式或其它方式呈現給用戶。如此循環,直至將待檢索頁面的內容全部匹配完畢。?
在具體實現中,例如:關鍵詞為“互聯網Internet”。待檢索頁面中的文字內容為“隨著時代的發展,互聯網Internet已成為人們生活中必不可少的元素”。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于藍盾信息安全技術股份有限公司,未經藍盾信息安全技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010104942.6/2.html,轉載請聲明來源鉆瓜專利網。





