[發(fā)明專利]一種自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011580056.0 | 申請(qǐng)日: | 2020-12-28 |
| 公開(kāi)(公告)號(hào): | CN112597280A | 公開(kāi)(公告)日: | 2021-04-02 |
| 發(fā)明(設(shè)計(jì))人: | 尹揚(yáng) | 申請(qǐng)(專利權(quán))人: | 上海朝陽(yáng)永續(xù)信息技術(shù)股份有限公司 |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/335;G06F16/35 |
| 代理公司: | 上海翰信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 31270 | 代理人: | 張維東 |
| 地址: | 201203 上海市浦東新區(qū)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自動(dòng) 發(fā)現(xiàn) 熱點(diǎn) 關(guān)鍵詞 熱點(diǎn)新聞 方法 | ||
本發(fā)明涉及一種自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法,包括以下步驟:提取各新聞的主題關(guān)鍵詞;計(jì)算預(yù)設(shè)周期內(nèi)各主題關(guān)鍵詞所對(duì)應(yīng)新聞數(shù)量與預(yù)設(shè)周期內(nèi)新增的新聞數(shù)量的比值,以得到預(yù)設(shè)周期內(nèi)各主題關(guān)鍵詞所對(duì)應(yīng)新聞的占比;計(jì)算各主題關(guān)鍵詞在預(yù)設(shè)歷史時(shí)間段內(nèi)的占比平均值和占比標(biāo)準(zhǔn)差;根據(jù)各主題關(guān)鍵詞在預(yù)設(shè)歷史時(shí)間段內(nèi)的占比平均值和占比標(biāo)準(zhǔn)差計(jì)算各主題關(guān)鍵詞的熱度值;若熱度值大于預(yù)設(shè)熱門閾值,則判斷熱度值所對(duì)應(yīng)的主題關(guān)鍵詞為熱點(diǎn)關(guān)鍵詞;根據(jù)所述熱點(diǎn)關(guān)鍵詞查找對(duì)應(yīng)熱點(diǎn)新聞。本發(fā)明通過(guò)自動(dòng)獲取、計(jì)算和篩查得到熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞,節(jié)省了人工成本,也降低了中小企業(yè)和個(gè)人及時(shí)自動(dòng)獲取熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的門檻。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,特別涉及一種自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法。
背景技術(shù)
當(dāng)今的互聯(lián)網(wǎng)時(shí)代,每天都會(huì)產(chǎn)生海量的新聞資訊信息,并且這些資訊信息每時(shí)每刻都在通過(guò)互聯(lián)網(wǎng)以極快的速度在全世界各地傳播。如何在這些海量的信息中快速獲得有價(jià)值的熱點(diǎn)信息,在金融投資、管理決策等領(lǐng)域變得至關(guān)重要。
目前已有的熱點(diǎn)新聞發(fā)現(xiàn)方法主要有人工編輯的方法和通過(guò)用戶行為數(shù)據(jù)計(jì)算得到熱點(diǎn)信息的方法。對(duì)于人工編輯的方法,需要聘用專業(yè)的編輯,每天閱讀、整理和編輯海量的新聞,費(fèi)時(shí)費(fèi)力,人工成本高昂。通過(guò)用戶行為數(shù)據(jù)計(jì)算則是類似百度、谷歌這樣的大型互聯(lián)網(wǎng)搜索公司所采用的通過(guò)用戶搜索記錄排序、點(diǎn)擊量、頁(yè)面訪問(wèn)量以及分享率等大量的用戶行為數(shù)據(jù)計(jì)算得到當(dāng)前人們關(guān)注的熱點(diǎn),但對(duì)于大多數(shù)公司和個(gè)人,沒(méi)有足夠的用戶行為數(shù)據(jù)通過(guò)類似的方法得到當(dāng)前的熱點(diǎn)信息。
因此有必要提供一種自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法,以解決現(xiàn)有中小企業(yè)難以自動(dòng)獲取熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞,導(dǎo)致在投資和決策等中失去先機(jī)的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法,以解決現(xiàn)有中小企業(yè)難以自動(dòng)獲取熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞,導(dǎo)致在投資和決策等中失去先機(jī)的問(wèn)題。
為了解決現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明提供了一種自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法,包括以下步驟:
提取各新聞的主題關(guān)鍵詞;
計(jì)算預(yù)設(shè)周期內(nèi)各主題關(guān)鍵詞所對(duì)應(yīng)新聞數(shù)量與預(yù)設(shè)周期內(nèi)新增的新聞數(shù)量的比值,以得到預(yù)設(shè)周期內(nèi)各主題關(guān)鍵詞所對(duì)應(yīng)新聞的占比;
計(jì)算各主題關(guān)鍵詞在預(yù)設(shè)歷史時(shí)間段內(nèi)的占比平均值和占比標(biāo)準(zhǔn)差;
根據(jù)各主題關(guān)鍵詞在預(yù)設(shè)歷史時(shí)間段內(nèi)的占比平均值和占比標(biāo)準(zhǔn)差計(jì)算各主題關(guān)鍵詞的熱度值;
若熱度值大于預(yù)設(shè)熱門閾值,則判斷熱度值所對(duì)應(yīng)的主題關(guān)鍵詞為熱點(diǎn)關(guān)鍵詞;
根據(jù)所述熱點(diǎn)關(guān)鍵詞查找對(duì)應(yīng)熱點(diǎn)新聞。
可選的,在所述自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法中,熱度值的計(jì)算公式為:Hot(w)=(Proportion(w)-Mean(w))/Std(w),其中,w為待計(jì)算熱度值的主題關(guān)鍵詞,Hot(w)為該主題關(guān)鍵詞的熱度值,Proportion(w)為預(yù)設(shè)周期內(nèi)該主題關(guān)鍵詞所對(duì)應(yīng)新聞當(dāng)前的占比,Mean(w)為該主題關(guān)鍵詞在預(yù)設(shè)歷史時(shí)間段內(nèi)的占比平均值,Std(w)為該主題關(guān)鍵詞在預(yù)設(shè)歷史時(shí)間段內(nèi)的占比標(biāo)準(zhǔn)差。
可選的,在所述自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法中,占比平均值的計(jì)算方式為:
M=(P1+P2+……Pn)/n,其中,M為任一主題關(guān)鍵詞在預(yù)設(shè)歷史時(shí)間段內(nèi)的占比平均值,P1到Pn為在預(yù)設(shè)歷史時(shí)間段內(nèi)計(jì)算的該主題關(guān)鍵詞所對(duì)應(yīng)新聞的占比,n為在預(yù)設(shè)歷史時(shí)間段內(nèi)該主題關(guān)鍵詞所對(duì)應(yīng)新聞的占比的個(gè)數(shù)。
可選的,在所述自動(dòng)發(fā)現(xiàn)熱點(diǎn)關(guān)鍵詞和熱點(diǎn)新聞的方法中,占比標(biāo)準(zhǔn)差的計(jì)算方式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海朝陽(yáng)永續(xù)信息技術(shù)股份有限公司,未經(jīng)上海朝陽(yáng)永續(xù)信息技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011580056.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 知識(shí)發(fā)現(xiàn)裝置、知識(shí)發(fā)現(xiàn)程序和知識(shí)發(fā)現(xiàn)方法
- 規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置
- 發(fā)現(xiàn)協(xié)議
- 對(duì)等發(fā)現(xiàn)
- 小區(qū)發(fā)現(xiàn)
- 漏洞發(fā)現(xiàn)裝置、漏洞發(fā)現(xiàn)方法以及漏洞發(fā)現(xiàn)程序
- 使用發(fā)現(xiàn)節(jié)點(diǎn)的設(shè)備發(fā)現(xiàn)
- 漏洞發(fā)現(xiàn)裝置、漏洞發(fā)現(xiàn)方法以及存儲(chǔ)介質(zhì)
- 用于提供虛擬場(chǎng)景的裝置及方法
- 接入語(yǔ)音服務(wù)的方法、裝置和數(shù)據(jù)載體
- 使用多機(jī)器學(xué)習(xí)核的光刻熱點(diǎn)檢測(cè)
- 一種釣魚(yú)熱點(diǎn)的檢測(cè)方法及系統(tǒng)
- 一種基于大數(shù)據(jù)識(shí)別釣魚(yú)熱點(diǎn)的方法和設(shè)備
- 一種快速分享熱點(diǎn)的方法及設(shè)備
- 一種信息獲取的方法、設(shè)備以及介質(zhì)
- 一種熱點(diǎn)切換的方法及設(shè)備
- 熱點(diǎn)開(kāi)啟方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 熱點(diǎn)區(qū)域定位方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種城市交通出行問(wèn)題熱點(diǎn)分級(jí)方法及裝置
- 一種基于無(wú)線熱點(diǎn)實(shí)現(xiàn)定位的方法與設(shè)備
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 用于選擇用于網(wǎng)絡(luò)發(fā)布的關(guān)鍵詞的方法和設(shè)備
- 關(guān)鍵詞質(zhì)量度的檢測(cè)方法和裝置
- 關(guān)鍵詞排名的檢測(cè)方法和裝置
- 關(guān)鍵詞相似度獲取方法、裝置及服務(wù)器
- 關(guān)鍵詞推薦方法及裝置
- 一種關(guān)鍵詞檢索管理系統(tǒng)
- 一種信息推薦方法、電子設(shè)備、存儲(chǔ)介質(zhì)及系統(tǒng)
- 關(guān)鍵詞廣告投放自動(dòng)化否定關(guān)鍵詞方法及裝置
- 一種長(zhǎng)尾關(guān)鍵詞識(shí)別方法、關(guān)鍵詞搜索方法及計(jì)算機(jī)設(shè)備





