[發明專利]一種提取網絡事件關鍵詞以及情緒傾向的方法及裝置有效
| 申請號: | 201611155167.0 | 申請日: | 2016-12-14 |
| 公開(公告)號: | CN108228612B | 公開(公告)日: | 2022-03-18 |
| 發明(設計)人: | 賀達 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F40/30 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提取 網絡 事件 關鍵詞 以及 情緒 傾向 方法 裝置 | ||
1.一種提取網絡事件關鍵詞以及情緒傾向的方法,其特征在于,所述方法包括:
利用爬蟲技術爬取文本數據,所述文本數據包括網絡媒體發布的文本數據;
分析所述文本數據對應的文本關鍵詞以及文本情緒傾向,得到所述文本數據與文本關鍵詞以及文本情緒傾向的關聯關系,包括:利用TF-IDF算法分別提取每篇文本數據的文本關鍵詞;利用NLP技術分析每篇文本數據的文本情緒傾向;分別建立文本數據與對應的文本關鍵詞以及文本數據與對應的文本情緒傾向的關聯關系;將含有所述關聯關系的文本數據保存在全文搜索引擎中;
獲取事件的查詢條件,所述查詢條件用于檢索與所述事件相關的文本數據;
利用所述查詢條件檢索到的文本數據計算所述事件的核心關鍵詞,包括:在所述全文搜索引擎中檢索符合所述查詢條件的文本數據,所述文本數據中存儲有文本關鍵詞以及文本情緒傾向的關聯關系;提取與所述文本數據相關聯的文本關鍵詞;統計所述文本關鍵詞在所述文本數據中的詞頻,將詞頻大于閾值的文本關鍵詞確定為所述事件的核心關鍵詞;
在檢索到的文本數據中提取含有所述核心關鍵詞的文本數據所對應的文本情緒傾向,計算所述事件的情緒傾向。
2.根據權利要求1所述的方法,其特征在于,所述在檢索到的文本數據中提取含有所述核心關鍵詞的文本數據所對應的文本情緒傾向,計算所述事件的情緒傾向包括:
將符合所述查詢條件的文本數據按照所述核心關鍵詞分類;
利用文本數據與文本情緒傾向的關聯關系,提取所有同類文本數據的文本情緒傾向;
統計所述文本情緒傾向得到所述事件的情緒傾向。
3.根據權利要求1或2所述的方法,其特征在于,所述在檢索到的文本數據中提取含有所述核心關鍵詞的文本數據所對應的文本情緒傾向,計算所述事件的情緒傾向包括:
根據所述核心關鍵詞在文本數據中的詞頻確定所述文本數據的權重值;
提取與所述文本數據對應的文本情緒傾向;
利用所述權重值和所述文本情緒傾向計算所述事件的情緒傾向。
4.一種提取網絡事件關鍵詞以及情緒傾向的裝置,其特征在于,所述裝置包括:
第一獲取單元,用于利用爬蟲技術爬取文本數據,所述文本數據包括網絡媒體發布的文本數據;
分析單元,用于分析所述第一獲取單元獲取的文本數據對應的文本關鍵詞以及文本情緒傾向,得到所述文本數據與文本關鍵詞以及文本情緒傾向的關聯關系;
所述分析單元包括:
第一分析模塊,用于利用TF-IDF算法分別提取每篇文本數據的文本關鍵詞;第二分析模塊,用于利用NLP技術分析每篇文本數據的文本情緒傾向;關聯模塊,用于分別建立文本數據與所述第一分析模塊提取的對應的文本關鍵詞以及文本數據與所述第二分析模塊分析的對應的文本情緒傾向的關聯關系;存儲模塊,用于將含有所述關聯模塊得到的關聯關系的文本數據保存在全文搜索引擎中;
第二獲取單元,用于獲取事件的查詢條件,所述查詢條件用于檢索與所述事件相關的文本數據;
第一計算單元,用于利用所述第二獲取單元獲取的查詢條件檢索到的文本數據計算所述事件的核心關鍵詞;
所述第一計算單元包括:
查詢模塊,用于在所述全文搜索引擎中檢索符合所述查詢條件的文本數據,所述文本數據中存儲有文本關鍵詞以及文本情緒傾向的關聯關系;
提取模塊,用于提取與所述查詢模塊檢索出的文本數據相關聯的文本關鍵詞;
計算模塊,用于統計所述提取模塊提取的文本關鍵詞在所述文本數據中的詞頻,將詞頻大于閾值的文本關鍵詞確定為所述事件的核心關鍵詞;
第二計算單元,用于在檢索到的文本數據中提取含有所述第一計算單元計算出的核心關鍵詞的文本數據所對應的文本情緒傾向,計算所述事件的情緒傾向。
5.根據權利要求4所述的裝置,其特征在于,所述第二計算單元包括:
分類模塊,用于將符合所述查詢條件的文本數據按照所述核心關鍵詞分類;
第一提取模塊,用于利用文本數據與文本情緒傾向的關聯關系,提取所述分類模塊所劃分的所有同類文本數據的文本情緒傾向;
第一計算模塊,用于統計所述第一提取模塊提取的文本情緒傾向得到所述事件的情緒傾向。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611155167.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:單據信息抄寫方法和裝置
- 下一篇:數據的讀取方法及裝置





