[發(fā)明專利]一種通過資訊發(fā)掘當(dāng)前熱點事件的方法和裝置有效
| 申請?zhí)枺?/td> | 201910861856.0 | 申請日: | 2019-09-12 |
| 公開(公告)號: | CN110704603B | 公開(公告)日: | 2022-09-09 |
| 發(fā)明(設(shè)計)人: | 陳翟翟;樊國鵬;朱留鋒 | 申請(專利權(quán))人: | 武漢燈塔之光科技有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/33;G06F16/35;G06F40/289;G06Q40/06 |
| 代理公司: | 深圳市六加知識產(chǎn)權(quán)代理有限公司 44372 | 代理人: | 向彬 |
| 地址: | 430000 湖北省武漢市東湖新技術(shù)開發(fā)*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 通過 資訊 發(fā)掘 當(dāng)前 熱點 事件 方法 裝置 | ||
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,具體涉及一種通過資訊發(fā)掘當(dāng)前熱點事件的方法和裝置,其中方法包括:根據(jù)用戶檢索條件獲取最近預(yù)設(shè)時間段內(nèi)的多篇資訊新聞,并通過計算得到每篇資訊新聞的一個或多個關(guān)鍵詞;根據(jù)每篇資訊新聞對應(yīng)的一個或多個關(guān)鍵詞,計算得到每篇資訊新聞對應(yīng)的資訊向量;對各資訊向量進(jìn)行聚類計算后得到一個或多個簇,對應(yīng)最近預(yù)設(shè)時間段內(nèi)的一個或多個熱點事件,并將各熱點事件展現(xiàn)給用戶。本發(fā)明可對近期的海量資訊匯總得到每篇資訊的關(guān)鍵詞,再計算每篇資訊的資訊向量,最后對資訊向量聚類計算,快速得到當(dāng)前的熱點事件并呈現(xiàn)給用戶,可幫助用戶快速定位當(dāng)前熱點事件,并為用戶投資提供有效參考。
【技術(shù)領(lǐng)域】
本發(fā)明屬于信息處理技術(shù)領(lǐng)域,具體涉及一種通過資訊發(fā)掘當(dāng)前熱點事件的方法和裝置。
【背景技術(shù)】
隨著互聯(lián)網(wǎng)和國內(nèi)證券市場的快速發(fā)展,互聯(lián)網(wǎng)資訊更新更加頻繁,市場上會在短時間內(nèi)爆發(fā)出非常多的資訊信息,過多的資訊信息使得投資者應(yīng)接不暇,如何在后臺的海量資訊集合中準(zhǔn)確快速地獲取到熱點資訊并及時展現(xiàn)給用戶,變得非常困難。
目前通常是采用人工配置資訊的方式,對于實時熱點關(guān)鍵詞,通過大量的人工手動挑選若干與之相關(guān)的資訊并展現(xiàn)給用戶。但是,由于實時熱點更新頻繁,人工配置代價比較高,而且人工配置過程相對緩慢,不足以在短時間內(nèi)得到很好的效果,達(dá)不到及時將內(nèi)容觸達(dá)用戶的速度性要求,也就無法及時為用戶投資提供有效參考。鑒于此,克服上述現(xiàn)有技術(shù)所存在的缺陷是本技術(shù)領(lǐng)域亟待解決的問題。
【發(fā)明內(nèi)容】
本發(fā)明需要解決的技術(shù)問題是:
目前互聯(lián)網(wǎng)資訊更新非常頻繁,單純采用人力分析獲取熱點資訊的話會導(dǎo)致配置代價較高,配置過程緩慢,無法及時篩選出當(dāng)前熱點事件并呈現(xiàn)給用戶,也就無法為用戶投資提供有效參考。
本發(fā)明通過如下技術(shù)方案達(dá)到上述目的:
第一方面,本發(fā)明提供一種通過資訊發(fā)掘當(dāng)前熱點事件的方法,包括:
根據(jù)用戶檢索條件獲取最近預(yù)設(shè)時間段內(nèi)的多篇資訊新聞,并通過計算得到每篇資訊新聞的一個或多個關(guān)鍵詞;
根據(jù)每篇資訊新聞對應(yīng)的一個或多個關(guān)鍵詞,計算得到每篇資訊新聞對應(yīng)的資訊向量;
對各資訊向量進(jìn)行聚類計算后得到一個或多個簇,對應(yīng)最近預(yù)設(shè)時間段內(nèi)的一個或多個熱點事件,并將各熱點事件展現(xiàn)給用戶;
其中,一個簇表示一個熱點事件,每個簇內(nèi)包含一篇或多篇資訊新聞。
優(yōu)選的,所述根據(jù)用戶檢索條件獲取最近預(yù)設(shè)時間段內(nèi)的多篇資訊新聞,并通過計算得到每篇資訊新聞的一個或多個關(guān)鍵詞,具體包括:
根據(jù)用戶輸入的檢索條件,從一個或多個資訊平臺獲取最近預(yù)設(shè)時間段內(nèi)的多篇資訊新聞,并對各資訊新聞進(jìn)行清洗,去除無用標(biāo)簽和臟數(shù)據(jù);
分別對每篇資訊新聞中的文本進(jìn)行分詞操作,去除無效詞,并在剩下的詞匯中選取一個或多個詞匯作為本篇資訊新聞的關(guān)鍵詞;
其中,所述檢索條件包括近期時間節(jié)點、熱度星級和檢索詞中的一項或多項;所述無效詞包括停用詞、臟詞和噪音詞中的一項或多項。
優(yōu)選的,所述在剩下的詞匯中選取一個或多個詞匯作為本篇資訊新聞的關(guān)鍵詞,具體為:
對于剩下的每個詞匯,將該詞匯在全資訊中出現(xiàn)的概率和在本篇新聞資訊中出現(xiàn)的概率進(jìn)行比較;如果該詞匯在本篇新聞資訊中出現(xiàn)的概率高于在全資訊中出現(xiàn)的概率,則將該詞匯作為本篇資訊新聞的一個關(guān)鍵詞。
優(yōu)選的,所述根據(jù)每篇資訊新聞對應(yīng)的一個或多個關(guān)鍵詞,計算得到每篇資訊新聞對應(yīng)的資訊向量,具體為:
根據(jù)每篇資訊新聞對應(yīng)的一個或多個關(guān)鍵詞,獲取每篇資訊新聞對應(yīng)的一個或多個關(guān)鍵詞向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢燈塔之光科技有限公司,未經(jīng)武漢燈塔之光科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910861856.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于物聯(lián)網(wǎng)的考古發(fā)掘現(xiàn)場監(jiān)測動態(tài)監(jiān)控平臺
- 生物基因組簡單重復(fù)序列的發(fā)掘方法及設(shè)備
- 基于物聯(lián)網(wǎng)的考古發(fā)掘現(xiàn)場監(jiān)測動態(tài)監(jiān)控平臺
- 一種基于多視角影像與激光掃描的考古發(fā)掘探方序列三維可視化方法
- 一種互聯(lián)網(wǎng)信息發(fā)掘方法
- 基于矩陣分解算法的偏好發(fā)掘方法及裝置
- 一種漏洞發(fā)掘裝置
- 一種土建基坑發(fā)掘裝置
- 范例學(xué)習(xí)驅(qū)動的內(nèi)容關(guān)聯(lián)網(wǎng)站發(fā)掘方法
- 一種基于大數(shù)據(jù)分析的少兒興趣發(fā)掘和增強(qiáng)系統(tǒng)
- 車輛當(dāng)前位置監(jiān)視方法和裝置及車輛當(dāng)前位置發(fā)送裝置
- 寬松當(dāng)前性約束
- 陸上汽車的當(dāng)前橫擺角及當(dāng)前側(cè)滑角的測定
- 當(dāng)前視窗關(guān)閉裝置及方法
- 當(dāng)前設(shè)備定位廣告分發(fā)
- 飛機(jī)當(dāng)前位置預(yù)估方法
- 根據(jù)相關(guān)網(wǎng)頁和當(dāng)前行為確定用戶當(dāng)前興趣的方法和系統(tǒng)
- 電子地圖的當(dāng)前位置表達(dá)方法及當(dāng)前位置表達(dá)裝置
- 當(dāng)前地毯類型辨識方法
- 當(dāng)前地毯類型辨識系統(tǒng)





