[發(fā)明專利]確定文章的流行度的方法、裝置、設(shè)備和可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010012780.7 | 申請日: | 2020-01-07 |
| 公開(公告)號: | CN111241392A | 公開(公告)日: | 2020-06-05 |
| 發(fā)明(設(shè)計(jì))人: | 廖東亮;王藝如;黎功福;徐進(jìn) | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/216;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 王娟 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 確定 文章 流行 方法 裝置 設(shè)備 可讀 存儲 介質(zhì) | ||
本公開提供了一種確定文章的流行度的方法、裝置、設(shè)備和存儲介質(zhì)。所述確定文章的流行度的方法包括:獲取所述文章的歷史閱讀序列向量和文本向量;對所述文章的歷史閱讀序列向量進(jìn)行處理,獲取所述文章的閱讀增長趨勢特征向量;對所述文章的歷史閱讀序列向量進(jìn)行處理,獲取所述文章的閱讀短期波動特征向量;對所述文章的文本向量進(jìn)行處理,獲取所述文章的文本特征向量;基于所述文章的閱讀增長趨勢特征向量、閱讀短期波動特征向量和文本特征向量確定所述文章的流行度。
技術(shù)領(lǐng)域
本公開涉及人工智能領(lǐng)域,具體的涉及一種確定文章的流行度的方法、裝置、設(shè)備和可讀存儲介質(zhì)。
背景技術(shù)
目前,網(wǎng)絡(luò)上的在線文章的數(shù)量巨大且質(zhì)量差別很大。為了使得閱讀者可以快速地確定期望看到的文章,需要諸如閱讀平臺提供相應(yīng)地文章推薦服務(wù)。文章發(fā)布初期,閱讀平臺可以對其進(jìn)行評估,確定該文章在未來一定時間段內(nèi)的流行度趨勢,從而可以有針對性地提供推薦服務(wù),例如,將流行度高的文章推薦給閱讀用戶,或者過濾掉流行度低的文章。由此,預(yù)測文章的流行程度對于文章推薦、廣告推廣和信息檢索等應(yīng)用場景都具有重要意義。然而,在線文章的流行度在很大程度上會受到外界因素的影響而產(chǎn)生難以預(yù)測的短期性波動,而文章的內(nèi)容、質(zhì)量以及元數(shù)據(jù)通常包含多種模態(tài),增加了建模的復(fù)雜性,加大了文章的流行度預(yù)測的難度。
發(fā)明內(nèi)容
本公開提供了一種用于確定文章的流行度的方法,基于文章的歷史閱讀序列向量和文本向量來確定文章的閱讀增長趨勢特征向量、閱讀短期波動特征向量和文本特征向量,并基于確定的所述文章的閱讀增長趨勢特征向量、閱讀短期波動特征向量和文本特征向量來確定所述文章的流行度。
根據(jù)本公開的一方面,提供了一種確定文章的流行度的方法,包括:獲取所述文章的歷史閱讀序列向量和文本向量;對所述文章的歷史閱讀序列向量進(jìn)行處理,獲取所述文章的閱讀增長趨勢特征向量;對所述文章的歷史閱讀序列向量進(jìn)行處理,獲取所述文章的閱讀短期波動特征向量;對所述文章的文本向量進(jìn)行處理,獲取所述文章的文本特征向量;基于所述文章的閱讀增長趨勢特征向量、閱讀短期波動特征向量和文本特征向量確定所述文章的流行度。
根據(jù)本公開的一些實(shí)施例,所述確定文章的流行度的方法還包括:獲取所述文章的元數(shù)據(jù)向量,其中,所述元數(shù)據(jù)向量是由所述文章的元數(shù)據(jù)確定的,所述元數(shù)據(jù)包括以下中的至少一種:所述文章的內(nèi)容類別、發(fā)布時間、文本長度、包含的視頻數(shù)量、發(fā)布者的熱門度;將所述元數(shù)據(jù)向量轉(zhuǎn)換成密集向量,其中,所述確定所述文章的流行度包括:基于所述文章的閱讀增長趨勢特征向量、閱讀短期波動特征向量、文本特征向量和密集向量確定所述文章的流行度。
根據(jù)本公開的一些實(shí)施例,所述元數(shù)據(jù)包括所述文章的內(nèi)容類別、發(fā)布時間、文本長度、包含的視頻數(shù)量、發(fā)布者的熱門度,所述方法還包括:基于所述文章的內(nèi)容類別確定獨(dú)熱編碼特征向量作為所述元數(shù)據(jù)向量的第一部分,基于所述文章的發(fā)布時間、文本長度、包含的視頻數(shù)量、發(fā)布者的熱門度確定數(shù)值特征向量作為所述元數(shù)據(jù)向量的第二部分;將所述獨(dú)熱編碼特征向量轉(zhuǎn)換成第一密集向量;將所述數(shù)值特征向量轉(zhuǎn)換成第二密集向量;對所述第一密集向量和第二密集向量進(jìn)行組合,作為所述密集向量。
根據(jù)本公開的一些實(shí)施例,獲取所述文章的歷史閱讀序列向量包括:以預(yù)定時間間隔為單位,基于所述文章自第一時刻至第二時刻期間內(nèi)每個預(yù)定時間間隔內(nèi)的閱讀數(shù)量來確定所述歷史閱讀序列向量{v1,v2,…vi,...,vt},其中,vi表示所述文章在第i個預(yù)定時間間隔內(nèi)的閱讀數(shù)量,所述歷史閱讀序列向量包括t個時間特征,其中,對所述文章的歷史閱讀序列向量進(jìn)行處理,獲取所述文章的閱讀增長趨勢特征向量包括:利用循環(huán)神經(jīng)網(wǎng)絡(luò)對所述歷史閱讀序列向量{v1,v2,...,vt}進(jìn)行處理,確定所述文章的閱讀增長趨勢特征向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010012780.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于自治計(jì)算的流行病傳播網(wǎng)絡(luò)建模與推斷
- 流行病預(yù)測方法、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種智能服裝定制平臺
- 一種熱點(diǎn)內(nèi)容列表的生成方法及裝置
- 流行季預(yù)測模型的參數(shù)調(diào)整方法、裝置、設(shè)備及存儲介質(zhì)
- 疾病流行季等級的確定方法、裝置、設(shè)備及可讀存儲介質(zhì)
- 一種汽車行星齒輪變速裝置
- 一種流行商品的屬性獲取方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于云計(jì)算的流行病監(jiān)控系統(tǒng)
- 基于多平臺的網(wǎng)絡(luò)事件流行度預(yù)測方法與系統(tǒng)





