[發(fā)明專利]一種面向網(wǎng)絡(luò)評論的觀點主題識別方法和系統(tǒng)無效
| 申請?zhí)枺?/td> | 200910227304.0 | 申請日: | 2009-12-04 |
| 公開(公告)號: | CN101727487A | 公開(公告)日: | 2010-06-09 |
| 發(fā)明(設(shè)計)人: | 李弼程;周杰;林琛;陳剛;李真 | 申請(專利權(quán))人: | 中國人民解放軍信息工程大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 450002 *** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 網(wǎng)絡(luò) 評論 觀點 主題 識別 方法 系統(tǒng) | ||
1.一種面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于,該方法包括以下步驟:
a.文本輸入
輸入評論源和所有評論文本;
b.文本預處理
對輸入的文本進行詞語切分和詞性標注,去除停用詞、標點符號和特定虛詞,并統(tǒng)計詞語的詞頻信息;
c.主題詞判決
計算詞語權(quán)重值,如果詞語權(quán)重值大于設(shè)定的閾值,則該詞語判斷為觀點主題詞;
d.主題構(gòu)建
將零散的觀點主題詞合并成為完整的觀點主題;
e.主題篩選
通過觀點主題過濾確定有效的觀點主題。
2.根據(jù)權(quán)利要求1所述的面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于:c步驟中,計算詞語權(quán)重時,權(quán)重因素包括整體詞頻權(quán)重、詞性權(quán)重、詞語出現(xiàn)的位置權(quán)重和詞語長度權(quán)重。
3.根據(jù)權(quán)利要求2所述面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于:計算整體詞頻權(quán)重時,引入同義詞林消除同義詞引起的主題分散問題。
4.根據(jù)權(quán)利要求2所述面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于:所述權(quán)重因素還包括詞語情感權(quán)重,計算詞語情感權(quán)重時,引入情感詞庫,詞語出現(xiàn)在包含情感詞的句子中的歸一化頻率為詞語情感權(quán)重。
5.根據(jù)權(quán)利要求3或4所述的面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于:所述的閾值可以設(shè)定為固定值或百分比,也可根據(jù)不同的話題選取不同的閾值,也可以根據(jù)詞語權(quán)重值的中位數(shù)或均值動態(tài)計算閾值。
6.根據(jù)權(quán)利要求5所述的面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于:d步驟中,以觀點主題詞為線索詞,并添加位置約束條件,采用位置相關(guān)的頻繁項挖掘算法,實現(xiàn)未登錄詞和詞組類型的觀點主題識別。
7.根據(jù)權(quán)利要求6所述的面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于:在所述的頻繁項挖掘算法中,根據(jù)實際情況限定線索詞周圍詞語的窗口長度。
8.根據(jù)權(quán)利要求7所述的面向網(wǎng)絡(luò)評論的觀點主題識別方法,其特征在于:觀點主題過濾包括詞性組合過濾、單字選擇過濾和包含關(guān)系過濾。
9.實現(xiàn)根據(jù)權(quán)利要求1所述方法的面向網(wǎng)絡(luò)評論的觀點主題識別系統(tǒng),其特征在于,該系統(tǒng)包括:
評論輸入模塊,用于輸入評論源和所有評論文本;預處理模塊,用于實現(xiàn)包括詞語切分、詞性標注、去除停用詞、標點符號和特定虛詞、統(tǒng)計詞語的詞頻信息的操作;主題詞判決模塊,用于根據(jù)權(quán)重計算公式計算詞語權(quán)重值并根據(jù)設(shè)定的閾值判別觀點主題詞;主題構(gòu)建模塊,用于將零散的觀點主題詞通過頻繁項挖掘算法合并成為完整的觀點主題;主題篩選模塊,用于通過詞性組合過濾、單字選擇過濾和包含關(guān)系過濾,最終確定有效的觀點主題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍信息工程大學,未經(jīng)中國人民解放軍信息工程大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910227304.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復網(wǎng)絡(luò)地址自動恢復的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





