[發明專利]一種提取網絡事件關鍵詞以及情緒傾向的方法及裝置有效
| 申請號: | 201611155167.0 | 申請日: | 2016-12-14 |
| 公開(公告)號: | CN108228612B | 公開(公告)日: | 2022-03-18 |
| 發明(設計)人: | 賀達 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F40/30 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提取 網絡 事件 關鍵詞 以及 情緒 傾向 方法 裝置 | ||
本發明公開了一種提取網絡事件關鍵詞以及情緒傾向的方法及裝置,涉及數據分析技術領域,主要目的在于通過對網絡熱門事件的文本數據進行處理,得到能夠準確反映熱門事件的關鍵詞以及通過關鍵詞所表達的情緒傾向。本發明主要的技術方案為:利用爬蟲技術爬取文本數據;分析所述文本數據對應的文本關鍵詞以及文本情緒傾向,得到所述文本數據與文本關鍵詞以及文本情緒傾向的關聯關系;獲取事件的查詢條件;利用所述查詢條件檢索到的文本數據計算所述事件的核心關鍵詞;在檢索到的文本數據中提取含有所述核心關鍵詞的文本數據所對應的文本情緒傾向,計算所述事件的情緒傾向。本發明主要用于網絡事件的關鍵詞以及情緒傾向的計算。
技術領域
本發明涉及數據分析技術領域,尤其涉及一種提取網絡事件關鍵詞以及情緒傾向的方法及裝置。
背景技術
隨著科技的發展,互聯網已經成為生活中不可獲取的一部分,大量的信息通過互聯網進行傳播,相對于傳統的新聞媒體而言,互聯網媒體不僅具有傳統新聞媒體發表新聞事件的功能,同時互聯網媒體也給了廣大通過互聯網獲取新聞信息的網民一個表達自身對于新聞事件的看法和評論的渠道。而通過網民對于新聞事件的看法和評論的收集、整理就能夠分析出網民對于新聞時間的關注程度以及對應的情緒傾向等數據,從而為更好的發揮新聞媒體輿論導向能力提供數據支持。
但是,目前這些網民反饋的信息以及新聞事件因為不同新聞媒體報道的渠道不同,會分散在各個新聞媒體網站中,同時,對于熱門事件,網民的觀點表達會較為豐富,信息數據量較大,通過傳統的人工對評論數據進行篩選和歸納總結很難全面的反映對于一個新聞事件網民真實的整體的情緒傾向和觀點表達。因此,目前對于熱門事件的相關數據分析一般所采用的分析方法為:通過網絡爬蟲從主流媒體爬取新聞報道數據和網民在新聞報道下的評論數據,針對熱門事件,通過使用事件相關的關鍵詞進行篩選得到和熱門事件相關的議論文本,再對議論文本進行分詞,將分詞結果進行詞頻統計得到高頻詞,將高頻詞作為事件的歸納關鍵詞。然而利用這種方法所計算得到的關鍵詞往往會將很多的常見詞提取出來使得這些關鍵詞不能很好的表達文本的核心觀點,而更為重要的是其不能通過所得到的關鍵詞得到文本對熱門事件的情緒傾向。
發明內容
有鑒于此,本發明提供一種提取網絡事件關鍵詞以及情緒傾向的方法及裝置,主要目的在于通過對網絡熱門事件的文本數據進行處理,得到能夠準確反映熱門事件的關鍵詞以及通過關鍵詞所表達的情緒傾向。
為達到上述目的,本發明主要提供如下技術方案:
一方面,本發明提供了一種提取網絡事件關鍵詞以及情緒傾向的方法,該方法包括:
利用爬蟲技術爬取文本數據,所述文本數據包括網絡媒體發布的文本數據;
分析所述文本數據對應的文本關鍵詞以及文本情緒傾向,得到所述文本數據與文本關鍵詞以及文本情緒傾向的關聯關系;
獲取事件的查詢條件,所述查詢條件用于檢索與所述事件相關的文本數據;
利用所述查詢條件檢索到的文本數據計算所述事件的核心關鍵詞;
在檢索到的文本數據中提取含有所述核心關鍵詞的文本數據所對應的文本情緒傾向,計算所述事件的情緒傾向。
優選的,所述分析所述文本數據對應的文本關鍵詞以及文本情緒傾向,得到所述文本數據與文本關鍵詞以及文本情緒傾向的關聯關系包括:
利用TF-IDF算法分別提取每篇文本數據的文本關鍵詞;
利用NLP技術分析每篇文本數據的文本情緒傾向;
分別建立文本數據與對應的文本關鍵詞以及文本數據與對應的文本情緒傾向的關聯關系;
將含有所述關聯關系的文本數據保存在全文搜索引擎中。
優選的,所述利用所述查詢條件檢索到的文本數據計算所述事件的核心關鍵詞包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611155167.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:單據信息抄寫方法和裝置
- 下一篇:數據的讀取方法及裝置





