[發明專利]Web主題傾向性挖掘與決策支持的方法有效
| 申請號: | 201310059170.2 | 申請日: | 2013-02-26 |
| 公開(公告)號: | CN103116644A | 公開(公告)日: | 2013-05-22 |
| 發明(設計)人: | 張振剛;徐浩;楊沛;丁卓 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 何淑珍 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | web 主題 傾向性 挖掘 決策 支持 方法 | ||
1.一種Web主題傾向性挖掘與決策支持的方法,其特征在于,包括步驟:
S1.網絡信息抽取與儲存,通過網絡挖掘技術,在互聯網上獲取信息,并將結果存入數據庫和本地文件系統;
S2.信息的觀點主題檢測與跟蹤,利用專題評論數據,檢測識別出感興趣的具有完整語義信息的觀點主題,并持續跟蹤和關注該觀點主題;
S3.觀點主題情感傾向性識別,對企業的熱點話題進行話題情感傾向性分類,挖掘出觀點主題的情感傾向性。
2.根據權利要求1所述的Web主題傾向性挖掘與決策支持的方法,其特征在于,所述步驟S1還包括:
S11.?自然語言處理對原始網絡信息進行預處理,包括:中文分詞、詞性標注、停用詞處理,命名實體識別。
3.根據權利要求2所述的Web主題傾向性挖掘與決策支持的方法,其特征在于,所述步驟S2中觀點主題檢測與跟蹤的過程具體包括:
S21.從網絡上采集到的信息,經過基于模板的信息分類,過濾噪聲信息;
S22.將過濾后的相關信息,采用基于時間函數的增量聚類方法,實現子話題的檢測,并將結果存儲到數據庫子話題表中;
S23.根據子話題的結果,提取出子話題的摘要和關鍵詞,并修改子話題表相關信息;
S24.在根據子話題的信息,再次根據間窗口相似度比較的增量聚類方法,進行話題檢測,并提取關鍵詞,得到話題信息存入數據庫;
S25.根據話題中信息的時間和話題中信息的數量,發現熱點話題,并呈現給用戶。
4.根據權利要求3所述的Web主題傾向性挖掘與決策支持的方法,其特征在于,所述步驟S22中子話題的檢測的過程具體包括:
S221.順序處理相關信息中的每篇文檔;
S222.利用層次聚類方法對未處理過的文檔進行聚類;
S223.若不存在歷史聚類,則根據當前聚類結果,存儲子話題;
S224.若存在歷史聚類,則對歷史子話題和新聚類出的子話題,再次進行層次聚類;
S225.將新產生的子話題存入數據庫;
S226.更新子話題與文檔的關系;
S227.計算新產生和更新過的子話題的關鍵詞、多文檔摘要等信息存入數據庫。
5.根據權利要求3所述的Web主題傾向性挖掘與決策支持的方法,其特征在于,所述步驟S24中話題的檢測的過程具體包括:
S241.順序處理每個子話題;
S242.第一個子話題的向量自動成為第一個聚類的聚類中心;
S243.如果相似度大于某個閾值,則該子話題被分配給這個聚類;
S244.當一篇子話題分配給某個聚類的時候,重新計算這個聚類的聚類中心;
S245.若某子話題沒有分配給任何的聚類,則該子話題成為一個新的聚類,同時也是這個聚類的聚類中心;
S246.將新產生的話題,添加到數據庫;
S247.更新話題的信息。
6.根據權利要求1所述的Web主題傾向性挖掘與決策支持的方法,其特征在于,所述步驟S3中網絡主題情感傾向性識別的過程具體包括:
S31.訓練話題情感分類模型,讀取標注好的話題語料和情感詞典,利用SVM分類算法,通過訓練得到話題情感分類模型;
S32.子話題情感分類,對子話題抽取情感特征,利用話題情感分類模型及SVM分類算法獲取子話題分類結果;
S33.話題情感分類,利用子話題情感分類的結果,構建基于子話題的圖模型,根據圖模型輸出話題情感分類結果。
7.根據權利要求6所述的Web主題傾向性挖掘與決策支持的方法,其特征在于,所述步驟S31中訓練話題情感分類模型的過程具體包括:
S311.?讀入標注好的話題情感分類語料;
S312.?通過自然語言處理,得到經中文分詞和詞性標注好的語料;
S313.?根據情感詞典和語法模式庫,從語料中抽取情感特征,構造話題分類訓練數據集;
S314.?分類器讀取訓練數據集,利用SVM分類算法,通過訓練得到話題情感分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310059170.2/1.html,轉載請聲明來源鉆瓜專利網。





