[發(fā)明專利]輿情推薦方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201811346051.4 | 申請日: | 2018-11-13 |
| 公開(公告)號: | CN109189934A | 公開(公告)日: | 2019-01-11 |
| 發(fā)明(設(shè)計)人: | 吳壯偉 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/9535;G06F16/9536 |
| 代理公司: | 深圳市精英專利事務(wù)所 44242 | 代理人: | 劉貽盛 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聚類 語料 檢索關(guān)鍵詞 熱度 計算機(jī)設(shè)備 存儲介質(zhì) 更新 外網(wǎng) 向量 標(biāo)簽 文本 關(guān)鍵詞集合 模型獲取 外網(wǎng)網(wǎng)址 文本資源 外部 分詞 錄入 預(yù)設(shè) 檢索 歸屬 分類 | ||
本發(fā)明公開了輿情推薦方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)。該方法由根據(jù)初始語料分詞得到的關(guān)鍵詞集合從外網(wǎng)網(wǎng)址的文本資源中爬取外部語料,獲取各文本一一對應(yīng)的外網(wǎng)全文文章向量;將各外網(wǎng)全文文章向量根據(jù)預(yù)先聚類的聚類群進(jìn)行分類,得到更新后聚類群;獲取更新后聚類群中各聚類群所對應(yīng)語料數(shù)據(jù),根據(jù)語料數(shù)據(jù)及預(yù)設(shè)的輿情熱度模型獲取更新后聚類群中每一聚類群的輿情熱度值;接收所錄入的檢索關(guān)鍵詞,若在更新后聚類群中存在有聚類群的標(biāo)簽與檢索關(guān)鍵詞相同,將對應(yīng)聚類群的輿情內(nèi)容和輿情熱度值進(jìn)行顯示。該方法實現(xiàn)了對外部語料中各文本對應(yīng)判斷聚類群歸屬后自動打標(biāo)簽,而且可根據(jù)檢索關(guān)鍵詞快速且精準(zhǔn)從聚類群中檢索得到目標(biāo)輿情內(nèi)容。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)采集技術(shù)領(lǐng)域,尤其涉及一種輿情推薦方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)。
背景技術(shù)
目前的輿情系統(tǒng),集成了輿情監(jiān)測、輿情采集、輿情智能分析、輿情處理、輿情預(yù)警等功能,幫助用戶全面掌握輿情動態(tài)。但是,目前的輿情系統(tǒng)大多數(shù)是不提供檢索功能和標(biāo)簽自動標(biāo)注功能,或者這部分工作是人工編輯的。而隨著網(wǎng)絡(luò)大數(shù)據(jù)的興起,原先的輿情系統(tǒng)已不能滿足在海量輿情數(shù)據(jù)進(jìn)行精準(zhǔn)檢索數(shù)據(jù)的需求。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種輿情推薦方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì),旨在解決現(xiàn)有技術(shù)中輿情系統(tǒng)不提供檢索功能,導(dǎo)致不能滿足在海量輿情數(shù)據(jù)進(jìn)行精準(zhǔn)檢索的問題。
第一方面,本發(fā)明實施例提供了一種輿情推薦方法,其包括:
獲取從預(yù)設(shè)的內(nèi)網(wǎng)網(wǎng)址中所爬取初始語料進(jìn)行關(guān)鍵詞提取得到的關(guān)鍵詞集合,根據(jù)關(guān)鍵詞集合從外網(wǎng)網(wǎng)址的文本資源中爬取外部語料,獲取與所述外部語料所包括的多篇文本中各文本一一對應(yīng)的外網(wǎng)全文文章向量;
將所述外部語料中各文本對應(yīng)的外網(wǎng)全文文章向量根據(jù)預(yù)先聚類所得到的聚類群進(jìn)行分類,得到更新后聚類群;
獲取更新后聚類群中每一聚類群所對應(yīng)語料數(shù)據(jù),根據(jù)所述語料數(shù)據(jù)及預(yù)設(shè)的輿情熱度模型獲取更新后聚類群中每一聚類群的輿情熱度值;以及
接收所錄入的檢索關(guān)鍵詞,若在更新后聚類群中存在有聚類群的標(biāo)簽與所述檢索關(guān)鍵詞相同,將對應(yīng)聚類群的輿情內(nèi)容和輿情熱度值進(jìn)行顯示。
第二方面,本發(fā)明實施例提供了一種輿情推薦裝置,其包括:
外網(wǎng)全文文章向量獲取單元,用于根據(jù)關(guān)鍵詞集合從外網(wǎng)網(wǎng)址的文本資源中爬取外部語料,獲取與所述外部語料所包括的多篇文本中各文本一一對應(yīng)的外網(wǎng)全文文章向量;
外網(wǎng)文章聚類單元,用于將所述外部語料中各文本對應(yīng)的外網(wǎng)全文文章向量根據(jù)預(yù)先聚類所得到的聚類群進(jìn)行分類,得到更新后聚類群;
輿情熱度值計算單元,用于獲取更新后聚類群中每一聚類群所對應(yīng)語料數(shù)據(jù),根據(jù)所述語料數(shù)據(jù)及預(yù)設(shè)的輿情熱度模型獲取更新后聚類群中每一聚類群的輿情熱度值;
檢索單元,用于接收所錄入的檢索關(guān)鍵詞,若在更新后聚類群中存在有聚類群的標(biāo)簽與所述檢索關(guān)鍵詞相同,將對應(yīng)聚類群的輿情內(nèi)容和輿情熱度值進(jìn)行顯示。
第三方面,本發(fā)明實施例又提供了一種計算機(jī)設(shè)備,其包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)上述第一方面所述的輿情推薦方法。
第四方面,本發(fā)明實施例還提供了一種存儲介質(zhì),其中所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,所述計算機(jī)程序當(dāng)被處理器執(zhí)行時使所述處理器執(zhí)行上述第一方面所述的輿情推薦方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811346051.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 預(yù)測視頻內(nèi)容熱度的方法和裝置
- 一種熱度迭代計算方法
- 帖子智能排位方法、裝置以及計算機(jī)可讀存儲介質(zhì)
- 電視節(jié)目播放方法、裝置、設(shè)備及可讀存儲介質(zhì)
- 一種空調(diào)器的膨脹閥的控制方法及其系統(tǒng)、空調(diào)器
- 一種視頻熱度級別預(yù)測方法及裝置
- 一種分布式存儲系統(tǒng)數(shù)據(jù)熱度統(tǒng)計方法、裝置
- 一種基于熱度的日志結(jié)構(gòu)文件系統(tǒng)數(shù)據(jù)管理方法
- 熱度排行榜的更新方法、裝置、服務(wù)器及計算機(jī)存儲介質(zhì)
- 基于深度學(xué)習(xí)的數(shù)據(jù)熱度統(tǒng)計方法及裝置





