[發明專利]關鍵詞查找方法、裝置及終端有效
| 申請號: | 201610784659.X | 申請日: | 2016-08-29 |
| 公開(公告)號: | CN107798004B | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 黃建 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/284 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 石鳴宇 |
| 地址: | 518057 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞 查找 方法 裝置 終端 | ||
1.一種關鍵詞查找方法,其特征在于,包括:
在一個或多個與關鍵詞長度相同的字符串中獲取與所述關鍵詞的字符串屬性相同的一個或多個指定字符串;所述字符串屬性包括字符串的哈希值,字符串中字符編碼值;
判斷所述一個或多個指定字符串的相鄰字符是否屬于所述關鍵詞的取值范圍;所述關鍵詞的取值范圍指與關鍵詞中出現的字符種類的所屬的范圍;
在判斷結果為否的情況下,確定所述指定字符串為目標關鍵詞;
其中,判斷所述一個或多個指定字符串的相鄰字符是否屬于所述關鍵詞的取值范圍,包括:
在所述關鍵詞位于所述一個或多個與關鍵詞長度相同的字符串所在文本的頭部時,所述相鄰字符為與所述指定字符串的尾部相鄰的字符;
在所述關鍵詞位于所述一個或多個與關鍵詞長度相同的字符串所在文本的尾部時,所述相鄰字符為與所述指定字符串的頭部相鄰的字符。
2.根據權利要求1所述的方法,其特征在于,在一個或多個與關鍵詞長度相同的字符串中獲取與所述關鍵詞的字符串屬性相同的一個或多個指定字符串之前,所述方法還包括:
確定所述關鍵詞的取值范圍,并計算關鍵詞長度以及所述關鍵詞所在文本的長度;
從所述文本的首個字符開始,依據所述關鍵詞長度以及文本長度,將所述文本切分為所述一個或多個與關鍵詞長度相同的字符串;
計算所述一個或多個與關鍵詞長度相同的字符串的字符串屬性。
3.根據權利要求2所述的方法,其特征在于,將所述文本切分為所述一個或多個與關鍵詞長度相同的字符串,包括:
從所述文本的首個字符開始,按照預定步長,依次截取長度為所述關鍵詞長度的字符串;
當截取的字符串長度小于所述關鍵詞長度時,拋棄該字符串并結束截取。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
在判斷結果為是的情況下,確定所示指定字符串為干擾關鍵詞。
5.一種關鍵詞查找裝置,其特征在于,包括:
獲取模塊,用于在一個或多個與關鍵詞長度相同的字符串中獲取與所述關鍵詞的字符串屬性相同的一個或多個指定字符串;所述字符串屬性包括字符串的哈希值,字符串中字符編碼值;
判斷模塊,用于判斷所述一個或多個指定字符串的相鄰字符是否屬于所述關鍵詞的取值范圍;所述關鍵詞的取值范圍指與關鍵詞中出現的字符種類的所屬的范圍;
確定模塊,用于在判斷結果為否的情況下,確定所述指定字符串為目標關鍵詞;
其中,所述判斷模塊,還用于在所述關鍵詞位于所述一個或多個與關鍵詞長度相同的字符串所在文本的頭部時,所述相鄰字符為與所述指定字符串的尾部相鄰的字符;在所述關鍵詞位于所述一個或多個與關鍵詞長度相同的字符串所在文本的尾部時,所述相鄰字符為與所述指定字符串的頭部相鄰的字符。
6.根據權利要求5所述的裝置,其特征在于,所述裝置還包括:
處理模塊,用于確定所述關鍵詞的取值范圍,并計算關鍵詞長度以及所述關鍵詞所在文本的長度;
切分模塊,用于從所述文本的首個字符開始,依據所述關鍵詞長度以及文本長度,將所述文本切分為所述一個或多個與關鍵詞長度相同的字符串;
計算模塊,用于計算所述一個或多個與關鍵詞長度相同的字符串的字符串屬性。
7.根據權利要求6所述的裝置,其特征在于,所述切分模塊還用于:從所述文本的首個字符開始,按照預定步長,依次截取長度為所述關鍵詞長度的字符串;當截取的字符串長度小于所述關鍵詞長度時,拋棄該字符串并結束截取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610784659.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:與智能文本分段共享的可定制內容
- 下一篇:網站開發過程中的數據處理方法及裝置





