[發明專利]互聯網信息分類方法和系統有效
| 申請號: | 201010268215.3 | 申請日: | 2010-08-30 |
| 公開(公告)號: | CN102385579B | 公開(公告)日: | 2018-06-15 |
| 發明(設計)人: | 張鵬;馬堯 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 鄭光 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞庫 預置 分類 互聯網信息 分詞 匹配 計算機技術領域 預置關鍵詞庫 方式獲取 分詞模塊 匹配模塊 統計結果 用戶評論 預存儲 評論 存儲 統計 | ||
1.一種互聯網信息分類方法,其特征在于,包括:
獲取用戶輸入的評論,并對所述評論進行分詞以獲取關鍵詞,所述評論為用戶輸入的用以發表對文章意見的一段文字;
將所述關鍵詞與預置的關鍵詞庫進行匹配,以獲取每一關鍵詞對應的情感值;所述預置的關鍵詞庫存儲有至少兩個分類,所述每一分類中分別預存儲有至少一個關鍵詞,以及所述關鍵詞對應的情感值;
根據每一關鍵詞對應的情感值獲得所述評論的情感值;
所述根據每一關鍵詞對應的情感值獲得所述評論的情感值包括:
當所述評論為一個句子時,分別計算所述句子的正面情感值和負面情感值,并以絕對值最大的一類情感值作為所述句子的情感值;
當用戶輸入的評論為一段文字時,將所述文字中每一句子中絕對值最大的一類情感值作為所述句子的情感值,將所有所述句子的結合權重值作為所述一段文字的情感值。
2.根據權利要求1所述的互聯網信息分類方法,其特征在于,所述根據每一關鍵詞對應的情感值獲得所述評論的情感值包括:
當用戶輸入的評論為一個詞時,將所述詞與所述預置關鍵詞庫模塊中的關鍵詞進行匹配以獲得所述評論對應的情感值。
3.根據權利要求1所述的互聯網信息分類方法,其特征在于,所述分別計算每一句子的正面情感值和負面情感值,包括:
通過以下公式計算所述每一句子的正面情感值和負面情感值:
其中EV(Sentence)為所述句子的正面情感值或者負面情感值;EV(wordi)為所述句子中每一個詞的正面情感值或者負面情感值,其中i=1~n,n為所述句子中正面情感值的關鍵詞總數或者負面情感值的關鍵詞總數;factor(wordi)為修飾所述關鍵詞的副詞的縮放因子。
4.一種互聯網信息分類系統,其特征在于,包括:
分詞模塊,用于獲取用戶輸入的評論,并對所述評論進行分詞以獲取關鍵詞,所述評論為用戶輸入的用以發表對文章意見的一段文字;
預置關鍵詞庫模塊,用于存儲至少兩個分類,所述每一分類中分別預存儲有至少一個關鍵詞,以及所述關鍵詞對應的情感值;
匹配模塊,用于將所述分詞模塊獲得的關鍵詞與預置關鍵詞庫模塊之中預置的關鍵詞進行匹配,以獲取每一關鍵詞對應的情感值;并以此計算評論的情感值;
所述匹配模塊,還用于:
當所述評論為一個句子時,分別計算所述句子的正面情感值和負面情感值,并以絕對值最大的一類情感值作為所述句子的情感值;
當用戶輸入的評論為一段文字時,將所述文字中每一句子中絕對值最大的一類情感值作為所述句子的情感值,將所有所述句子的結合權重值作為所述一段文字的情感值。
5.根據權利要求4所述的互聯網信息分類系統,其特征在于,所述匹配模塊包括:
第一匹配子單元,用于當用戶輸入的評論為一個詞時,將所述詞與所述預置關鍵詞庫模塊中的關鍵詞進行匹配以獲得所述評論對應的情感值。
6.根據權利要求5所述的互聯網信息分類系統,其特征在于,
第三獲取模塊,還用于通過以下公式計算所述一段文字中的每一句子的情感值:
其中EV(Sentence)為所述句子的正面情感值或者負面情感值;EV(wordi)為所述句子中每一個詞的正面情感值或者負面情感值,其中i=1~n,n為所述句子中正面情感值的關鍵詞總數或者負面情感值的關鍵詞總數;factor(wordi)為修飾所述關鍵詞的副詞的縮放因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010268215.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種減震門扣
- 下一篇:多通道小封裝收發器及組裝方法





