[發明專利]一種基于分詞和詞性分析的后綴樹聚類方法無效
| 申請號: | 201310129771.6 | 申請日: | 2013-04-15 |
| 公開(公告)號: | CN103226546A | 公開(公告)日: | 2013-07-31 |
| 發明(設計)人: | 陸月明;張吉偉;黨秋月 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分詞 詞性 分析 后綴 樹聚類 方法 | ||
【權利要求書】:
1.本發明提出一種基于分詞和詞性分析的后綴樹聚類方法,包括分詞方法、詞性分析、基于主要成分的后綴樹聚類,該發明應用于搜索引擎中。
本發明的主要特點有:
(1)該方法在分詞中,按名詞和動詞進行分詞,并去除其它詞性詞。
(2)該方法在詞性分析中,區分詞語的詞性,按詞性計算詞語的權重,確定詞語的重要成分。
(3)該方法在權重計算中,計算單個詞語的權重,再計算相同詞性詞語的權重和。
(4)該方法在聚類中,只針對某一詞性的詞語進行提取,具有降維的能力。
下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310129771.6/1.html,轉載請聲明來源鉆瓜專利網。





