[發(fā)明專利]網(wǎng)絡(luò)輿情的分析方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201810544762.6 | 申請(qǐng)日: | 2018-05-31 |
| 公開(公告)號(hào): | CN108959383A | 公開(公告)日: | 2018-12-07 |
| 發(fā)明(設(shè)計(jì))人: | 吳壯偉 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27;G06K9/62 |
| 代理公司: | 深圳市沃德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 詞匯集合 網(wǎng)絡(luò)輿情 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 熱度 預(yù)處理 采集 分析裝置 聚類分析 聚類算法 評(píng)分模型 預(yù)警能力 預(yù)警信息 詞向量 話題 預(yù)設(shè) 判定 分析 輸出 監(jiān)控 | ||
1.一種網(wǎng)絡(luò)輿情的分析方法,其特征在于,所述方法包括:
確定輿情事件,通過分布式網(wǎng)絡(luò)爬蟲從預(yù)設(shè)的數(shù)據(jù)渠道采集與所述輿情事件相關(guān)的輿情文章;
對(duì)所述輿情文章進(jìn)行分詞處理,獲取所述輿情文章中的詞匯集合以表征輿情文章;
采用聚類算法詞匯集合進(jìn)行聚類分析,生成輿情事件的多個(gè)類型的觀點(diǎn),并根據(jù)所述觀點(diǎn)包含的詞匯集合計(jì)算該觀點(diǎn)的詞向量;
從觀點(diǎn)包含的詞匯集合中提取一個(gè)或者多個(gè)詞匯集合,將提取的詞匯集合表征的輿情文章作為該觀點(diǎn)的核心話題;
將觀點(diǎn)的詞向量輸入到預(yù)先訓(xùn)練好的情感評(píng)分模型中,輸出觀點(diǎn)的情感得分,并根據(jù)觀點(diǎn)包含的詞匯集合對(duì)應(yīng)的輿情文章在各數(shù)據(jù)渠道的熱度和各數(shù)據(jù)渠道的預(yù)設(shè)權(quán)重計(jì)算觀點(diǎn)的熱度;
根據(jù)所述情感得分和所述熱度計(jì)算觀點(diǎn)的輿情指數(shù),并判定輿情指數(shù)的絕對(duì)值大于預(yù)設(shè)閾值的觀點(diǎn)為異常觀點(diǎn),根據(jù)所述異常觀點(diǎn)和該異常觀點(diǎn)的核心話題生成預(yù)警信息并輸出。
2.如權(quán)利要求1所述的網(wǎng)絡(luò)輿情的分析方法,其特征在于,所述對(duì)所述輿情文章進(jìn)行分詞處理,獲取所述輿情文章中的詞匯集合以表征輿情文章的步驟包括:
提取輿情文章的正文數(shù)據(jù),通過正則表達(dá)式去除正文數(shù)據(jù)中的非中文字符;
通過分詞工具對(duì)去除非中文字符后的正文數(shù)據(jù)進(jìn)行分詞處理,將正文數(shù)據(jù)轉(zhuǎn)換為以空格分割的詞匯集合;
對(duì)所述詞匯集合進(jìn)行去停用詞處理,得到所述詞匯集合。
3.如權(quán)利要求1所述的網(wǎng)絡(luò)輿情的分析方法,其特征在于,所述采用聚類算法詞匯集合進(jìn)行聚類分析,生成輿情事件的多個(gè)類型的觀點(diǎn),并根據(jù)所述觀點(diǎn)包含的詞匯集合計(jì)算該觀點(diǎn)的詞向量的步驟包括:
獲取中文維基百科語料庫(kù),基于所述語料庫(kù),根據(jù)詞頻-逆文本頻率指數(shù)TF-IDF算法選擇詞匯集合中的多個(gè)詞匯作為關(guān)鍵詞;
基于所述語料庫(kù)生成中文語料的詞向量模型,通過所述詞向量模型計(jì)算關(guān)鍵詞的詞向量,根據(jù)關(guān)鍵詞的詞向量計(jì)算詞匯集合的詞向量;
根據(jù)詞匯集合的詞向量和Kmeans算法對(duì)所述輿情事件的所有詞匯集合進(jìn)行聚類,以將所述輿情事件的詞匯集合分為多個(gè)類型的觀點(diǎn);
對(duì)觀點(diǎn)包含的詞匯集合的關(guān)鍵詞進(jìn)行匯總,根據(jù)匯總的關(guān)鍵詞的詞向量計(jì)算觀點(diǎn)的詞向量。
4.如權(quán)利要求3所述的網(wǎng)絡(luò)輿情的分析方法,其特征在于,所述從觀點(diǎn)包含的詞匯集合中提取一個(gè)或者多個(gè)詞匯集合,將提取的詞匯集合表征的輿情文章作為該觀點(diǎn)的核心話題的步驟包括:
根據(jù)觀點(diǎn)的詞向量和該觀點(diǎn)包含的詞匯集合的詞向量,計(jì)算詞匯集合與其對(duì)應(yīng)的觀點(diǎn)之間的相似度;
將相似度大于預(yù)設(shè)閾值的一個(gè)或者多個(gè)詞匯集合表征的輿情文章,作為觀點(diǎn)的核心話題。
5.如權(quán)利要求1至4中任一項(xiàng)所述的網(wǎng)絡(luò)輿情的分析方法,其特征在于,所述情感評(píng)分模型的訓(xùn)練步驟包括:
獲取添加有標(biāo)簽數(shù)據(jù)的輿情文本數(shù)據(jù),構(gòu)成樣本庫(kù);
結(jié)合TF-IDF算法提取樣本庫(kù)中的輿情文本數(shù)據(jù)的關(guān)鍵詞,并通過訓(xùn)練好的詞向量模型計(jì)算關(guān)鍵詞的詞向量;
將樣本庫(kù)中的輿情文本數(shù)據(jù)的詞向量和標(biāo)簽數(shù)據(jù)作為訓(xùn)練樣本,輸入到預(yù)設(shè)的深度神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,以確定模型參數(shù),并將確定了模型參數(shù)的深度神經(jīng)網(wǎng)絡(luò)模型作為所述情感評(píng)分模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810544762.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種基于社會(huì)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情行為分析方法
- 一種網(wǎng)絡(luò)輿情大數(shù)據(jù)分析一體機(jī)
- 一種企業(yè)網(wǎng)絡(luò)輿情潛在風(fēng)險(xiǎn)的評(píng)估方法及系統(tǒng)
- 網(wǎng)絡(luò)輿情監(jiān)控方法、裝置和設(shè)備
- 一種基于GPT-2模型的網(wǎng)絡(luò)輿情引導(dǎo)方法及裝置
- 一種網(wǎng)絡(luò)輿情多角色模擬處置系統(tǒng)
- 網(wǎng)絡(luò)輿情云平臺(tái)數(shù)據(jù)分析模型交換方法、系統(tǒng)及平臺(tái)
- 網(wǎng)絡(luò)輿情云平臺(tái)用戶單位變更配置的方法及系統(tǒng)
- 輿情云平臺(tái)接入的輿情系統(tǒng)資源配置的優(yōu)化方法及子系統(tǒng)
- 一種網(wǎng)絡(luò)輿情監(jiān)控方法及系統(tǒng)
- 用于生產(chǎn)組合物的監(jiān)測(cè)設(shè)備
- 用于生產(chǎn)組合物的監(jiān)測(cè)設(shè)備
- 用于視頻編碼和解碼的裝置和方法
- 用于興趣點(diǎn)識(shí)別的系統(tǒng)和方法
- 自適應(yīng)云計(jì)算信道處理方法及存儲(chǔ)介質(zhì)
- 用于將操作系統(tǒng)存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的BIOS代碼
- 一種電子名片自動(dòng)匹配的方法、系統(tǒng)、移動(dòng)裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 相機(jī)組同步曝光控制方法及系統(tǒng)、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、相機(jī)組控制系統(tǒng)
- 炒鍋翻炒方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及智能炒菜機(jī)
- 用于計(jì)算機(jī)系統(tǒng)啟動(dòng)操作的系統(tǒng)及方法
- 預(yù)測(cè)視頻內(nèi)容熱度的方法和裝置
- 一種熱度迭代計(jì)算方法
- 帖子智能排位方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 電視節(jié)目播放方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種空調(diào)器的膨脹閥的控制方法及其系統(tǒng)、空調(diào)器
- 一種視頻熱度級(jí)別預(yù)測(cè)方法及裝置
- 一種分布式存儲(chǔ)系統(tǒng)數(shù)據(jù)熱度統(tǒng)計(jì)方法、裝置
- 一種基于熱度的日志結(jié)構(gòu)文件系統(tǒng)數(shù)據(jù)管理方法
- 熱度排行榜的更新方法、裝置、服務(wù)器及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 基于深度學(xué)習(xí)的數(shù)據(jù)熱度統(tǒng)計(jì)方法及裝置





