[發明專利]互聯網信息分類方法和系統有效
| 申請號: | 201010268215.3 | 申請日: | 2010-08-30 |
| 公開(公告)號: | CN102385579B | 公開(公告)日: | 2018-06-15 |
| 發明(設計)人: | 張鵬;馬堯 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 鄭光 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞庫 預置 分類 互聯網信息 分詞 匹配 計算機技術領域 預置關鍵詞庫 方式獲取 分詞模塊 匹配模塊 統計結果 用戶評論 預存儲 評論 存儲 統計 | ||
本發明提出了一種互聯網信息分類方法和系統,屬于計算機技術領域。本發明實施例的系統包括:分詞模塊、預置關鍵詞庫模塊、匹配模塊。方法包括:獲取用戶輸入的評論,并對所述評論進行分詞以獲取關鍵詞;將所述關鍵詞與預置的關鍵詞庫進行匹配,以獲取每一關鍵詞對應的情感值;該預置的關鍵詞庫存儲至少兩個分類的關鍵詞,所述每一分類中分別預存儲有至少一個關鍵詞,以及該關鍵詞對應的情感值;根據每一關鍵詞對應的情感值獲得所述評價的情感值。本發明實施例可以通過預置的關鍵詞庫及關鍵詞對應的情感值,獲取通過分詞并匹配的方式獲取用戶評論對應的情感值。這樣相比較現有技術中人工統計的方式,統計結果更加精確且效率高。
技術領域
本發明涉及計算機技術領域,特別涉及一種互聯網信息分類方法和系統。
背景技術
隨著互聯網技術的發展以及網絡的普及,越來越的網絡用戶不僅滿足于簡單的獲取資訊,而希望參與到其中,因此對互聯網發布的文章進行評論的功能應運而生。對文章進行評論是指,瀏覽新聞、博客等互聯網上發送的文章的用戶可以通過輸入一段文字,以發表自己對文章的意見。中文博大精深,根據《第一屆中國情感計算及智能交互學術會議》2003年第1卷中公開的許小穎等的論文《漢語情感系統中情感劃分的研究》中將中文的分成8類型,33個子類型,即如下表所示:
類型 子類型 喜 喜悅,激動,自信,安心,滿足 愛 喜愛,同情,敬佩,贊美,感動,信任,希望,諒解,感激,鼓勵 怒 憤怒 哀 愁悶,悲傷,失望,后悔,羞疚,委屈,否定 惡 不喜歡,煩厭,急躁,嫉妒,責備,鄙視,疑問 懼 慌懼 驚 駭驚 嘆 感嘆
表1
而在用戶發表的評論中包含了用戶閱讀完該文章后的感覺和心情。以騰訊新聞為例,每天僅位于評論排行榜前二十位的用戶評論就多達五萬條以上。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010268215.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種減震門扣
- 下一篇:多通道小封裝收發器及組裝方法





