[發明專利]一種文本過濾方法及文本過濾系統有效
| 申請號: | 200910211715.0 | 申請日: | 2009-11-10 |
| 公開(公告)號: | CN102053993A | 公開(公告)日: | 2011-05-11 |
| 發明(設計)人: | 溫新賜;葉長程 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 逯長明;王寶筠 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 過濾 方法 系統 | ||
1.一種文本過濾方法,其特征在于,包括:
預先在文本過濾系統中定義語義關鍵詞,所述語義關鍵詞,至少由基本關鍵詞和邏輯關系符構成;
所述文本過濾系統獲得輸入文本后,根據預先定義的語義關鍵詞,在所述輸入文本中查找構成所述語義關鍵詞的基本關鍵詞;
如果在所述輸入文本中查找到與至少一個所述基本關鍵詞相匹配的文本內容,則進一步對查找到的文本內容進行語義匹配;所述語義匹配包括:根據構成所述語義關鍵詞的邏輯關系符,將所查找到的文本內容與所述語義關鍵詞進行匹配;
如果所述語義匹配成功,則對匹配成功的文本內容進行過濾處理。
2.根據權利要求1所述的方法,其特征在于,
所述基本關鍵詞,以字符為單位,按照樹形結構存儲于文本過濾系統中;其中,基本關鍵詞的首字符為根節點、末字符為葉子節點,具有相同首字符的基本關鍵詞共用同一個根節點;
所述在輸入文本中查找構成所述語義關鍵詞的基本關鍵詞,包括步驟:
獲取所述輸入文本中的一個字符c1;
以c1為當前字符、以所述樹形結構的根節點為當前節點,將當前字符與當前節點進行匹配;
如果當前字符與當前節點匹配成功,且當前節點具有子節點,則將當前字符的后一字符,與當前節點的子節點進行匹配;如果當前字符與當前節點匹配失敗,且當前節點具有兄弟節點,則將當前字符與當前節點的兄弟節點進行匹配;重復本步驟;
連接當前節點與根節點得到匹配路徑,并根據所述匹配路徑上匹配成功的葉子節點確定所查找到的基本關鍵詞。
3.根據權利要求2所述的方法,其特征在于,在將當前字符與當前節點進行匹配之前,還包括:
在字典中查找所述當前字符是否具有原型字符;
如果是,則將其轉換為相應的原型字符,并以所述原型字符為當前字符,與所述當前節點進行匹配。
4.根據權利要求1至3任一項所述的方法,其特征在于,
所述語義關鍵詞的構成還包括:過濾條件;
則所述語義匹配還包括:將所述輸入文本的屬性與所述過濾條件進行匹配。
5.根據權利要求1至3任一項所述的方法,其特征在于,
所述語義關鍵詞的構成還包括:過濾行為;
則所述對所查找到的文本內容進行過濾處理,包括:根據所述過濾行為,對所查找到的文本內容進行過濾處理。
6.一種文本過濾系統,其特征在于,包括:
關鍵詞存儲單元,用于存儲預先定義的語義關鍵詞,所述語義關鍵詞,至少由基本關鍵詞和邏輯關系符構成;
基本查找單元,用于在所述文本過濾系統獲得輸入文本后,根據預先定義的語義關鍵詞,在所述輸入文本中查找構成所述語義關鍵詞的基本關鍵詞;
語義匹配單元,用于在所述基本查找單元在所述輸入文本中查找到與至少一個所述基本關鍵詞相匹配的文本內容時,進一步對查找到的文本內容進行語義匹配;所述語義匹配單元包括:用于根據構成所述語義關鍵詞的邏輯關系符,將所查找到的文本內容與所述語義關鍵詞進行匹配的邏輯匹配子單元;
過濾處理單元,用于在所述語義匹配單元匹配成功時,對匹配成功的文本內容進行過濾處理。
7.根據權利要求6所述的系統,其特征在于,
所述關鍵詞存儲單元,以字符為單位,按照樹形結構存儲所述基本關鍵詞;其中,基本關鍵詞的首字符為根節點、末字符為葉子節點,具有相同首字符的基本關鍵詞共用同一個根節點;
所述基本查找單元,包括:
文本獲取子單元,用于獲取所述輸入文本中的一個字符c1;
字符匹配子單元,用于以c1為當前字符、以所述樹形結構的根節點為當前節點,將當前字符與當前節點進行匹配;
如果當前字符與當前節點匹配成功,且當前節點具有子節點,則將當前字符的后一字符,與當前節點的子節點進行匹配;如果當前字符與當前節點匹配失敗,且當前節點具有兄弟節點,則將當前字符與當前節點的兄弟節點進行匹配;重復本步驟;
確定子單元,用于連接當前節點與根節點得到匹配路徑,并根據所述匹配路徑上匹配成功的葉子節點確定所查找到的基本關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910211715.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動追蹤照準平臺
- 下一篇:基于角錐棱鏡軸系徑向跳動的測量裝置





