[發明專利]一種基于新聞評論網頁的情感傾向性分析系統無效
| 申請號: | 200910086542.4 | 申請日: | 2009-06-05 |
| 公開(公告)號: | CN101593204A | 公開(公告)日: | 2009-12-02 |
| 發明(設計)人: | 高軍;王騰蛟;楊冬青;陶富民;常雷 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京紀凱知識產權代理有限公司 | 代理人: | 徐 寧;關 暢 |
| 地址: | 100871北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 新聞 評論 網頁 情感 傾向性 分析 系統 | ||
1、一種基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:它包括用戶輸入模塊、實體提取和層次關系發現模塊、同層實體情感提取模塊、實體特征提取模塊、實體定位模塊和情感輸出模塊;所述用戶輸入模塊包括用戶輸入的新聞網頁集合和情感分析規則;所述情感分析規則中包括參考實體和情感動詞;所述實體提取和層次關系發現模塊用于從所述新聞網頁中提取有效實體,并建立實體層次關系圖;所述同層實體情感提取模塊在所述實體層次關系圖中定位所述參考實體,利用參考實體、與參考實體同層次的有效實體和情感動詞,獲取新聞評論網頁;通過對所述情感動詞的新聞評論網頁聚類,獲得新聞評論網頁子集和對應的情感主題;
所述實體特征提取模塊用于獲取待測新聞評論網頁中的中間實體,并輸出所述中間實體的情感分析數據;所述實體定位模塊中,判斷所述中間實體是否存在于所述實體情感關系圖中,如果所述中間實體不存在于所述實體情感關系圖中,則直接在所述情感輸出模塊中輸出所述情感分析數據,反之在所述實體情感關系圖中定位所述中間實體;如果所述中間實體與所述參考實體同在一情感關系樹中,則在所述情感輸出模塊中輸出參考實體的情感分析數據,反之根據中間實體所在的新聞評論語句相同情感主題的所述新聞評論網頁子集合進行相似度判定,間接獲取所述參考實體的情感分析數據。
2、一種如權利要求1所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述實體提取和層次關系發現模塊中,通過表格結構處理和文本處理方法來提取所述有效實體。
3、一種如權利要求1所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述情感關系樹以所述參考實體或與參考實體同層次的有效實體為根節點,根節點之間存在所述情感主題的連接關系,通過文檔聚類發現情感主題。
4、一種如權利要求2所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述情感關系樹以所述參考實體或與參考實體同層次的有效實體為根節點,根節點之間存在所述情感主題的連接關系,通過文檔聚類發現情感主題。
5、一種如權利要求1或2或3或4所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述實體特征提取模塊中,通過實體抽取工具獲取中間實體。
6、一種如權利要求1或2或3或4所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述實體特征提取模塊中,通過情感分析工具得到所述中間實體的情感分析數據。
7、一種如權利要求5所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述實體特征提取模塊中,通過情感分析工具得到所述中間實體的情感分析數據。
8、一種如權利要求1或2或3或4或7所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述情感動詞為表明情感傾向的動詞,包括正向的和負向的動詞,或帶有權重的動詞。
9、一種如權利要求5所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述情感動詞為表明情感傾向的動詞,包括正向的和負向的動詞,或帶有權重的動詞。
10、一種如權利要求6所述的基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:所述情感動詞為表明情感傾向的動詞,包括正向的和負向的動詞,或帶有權重的動詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910086542.4/1.html,轉載請聲明來源鉆瓜專利網。





