[發(fā)明專利]獲取目標(biāo)類別的文章的方法和裝置在審
| 申請?zhí)枺?/td> | 202010612869.7 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111667023A | 公開(公告)日: | 2020-09-15 |
| 發(fā)明(設(shè)計)人: | 康戰(zhàn)輝 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00;G06F16/9535 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 張所明 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 獲取 目標(biāo) 類別 文章 方法 裝置 | ||
本申請?zhí)峁┝艘环N獲取目標(biāo)類別的文章的方法和裝置,屬于文章搜索技術(shù)領(lǐng)域。該方法包括獲取目標(biāo)時間段內(nèi)的m篇文章;根據(jù)m篇文章的標(biāo)題,將m篇文章劃分至k個候選文章集合中,同一個候選文章集合中的文章和同一個新聞事件相關(guān);根據(jù)各新聞事件對應(yīng)的候選文章集合中的文章數(shù)量,在各新聞事件對應(yīng)的候選文章集合中,將文章數(shù)量不少于數(shù)量閾值的候選文章集合,確定為目標(biāo)文章集合;根據(jù)目標(biāo)文章集合中文章的內(nèi)容,篩選出屬于目標(biāo)類別的文章,作為目標(biāo)文章集合的待發(fā)布文章;將待發(fā)布文章發(fā)布在目標(biāo)應(yīng)用程序中。人們通常會對由熱門新聞事件衍生的文章感興趣,將由熱門新聞事件衍生的文章發(fā)布在目標(biāo)應(yīng)用程序上,可以大大提高目標(biāo)應(yīng)用程序的活躍度。
技術(shù)領(lǐng)域
本申請涉及文章搜索技術(shù)領(lǐng)域,特別涉及一種獲取目標(biāo)類別的文章的方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)和終端技術(shù)的快速發(fā)展,終端上可以安裝各種應(yīng)用程序,例如,醫(yī)學(xué)應(yīng)用程序即是一種比較常見的應(yīng)用程序。
醫(yī)學(xué)應(yīng)用程序中發(fā)布有很多醫(yī)學(xué)文章,可以對用戶進行醫(yī)學(xué)科普,但是用戶通常是生病了或者不舒服的時候才會想起醫(yī)學(xué)應(yīng)用程序,導(dǎo)致醫(yī)學(xué)應(yīng)用程序的活躍度不高。
發(fā)明內(nèi)容
本申請實施例提供了一種獲取目標(biāo)類別的文章的方法和裝置,可以克服醫(yī)學(xué)應(yīng)用程序的活躍度不高的問題。所述技術(shù)方案如下:
一方面,提供了一種獲取目標(biāo)類別的文章的方法,所述方法包括:
獲取目標(biāo)時間段內(nèi)的m篇文章,其中m為正整數(shù);
根據(jù)所述m篇文章的標(biāo)題,將所述m篇文章劃分至k個候選文章集合中,同一個候選文章集合中的文章和同一個新聞事件相關(guān),其中k為正整數(shù),且小于或等于m;
根據(jù)各新聞事件對應(yīng)的候選文章集合中的文章數(shù)量,在各新聞事件對應(yīng)的候選文章集合中,將文章數(shù)量不少于數(shù)量閾值的候選文章集合,確定為目標(biāo)文章集合;
根據(jù)所述目標(biāo)文章集合中各個文章的內(nèi)容,以及完成訓(xùn)練的分類模型,篩選出屬于所述目標(biāo)類別的文章,作為所述目標(biāo)文章集合中的待發(fā)布文章;
將所述目標(biāo)文章集合中的待發(fā)布文章,發(fā)布在目標(biāo)應(yīng)用程序中。
另一方面,提供了一種獲取目標(biāo)類別的文章的裝置,所述裝置包括:
獲取模塊,用于獲取目標(biāo)時間段內(nèi)的m篇文章,其中m為正整數(shù);
聚類模塊,用于根據(jù)所述m篇文章的標(biāo)題,將所述m篇文章劃分至k個候選文章集合中,同一個候選文章集合中的文章和同一個新聞事件相關(guān),其中k為正整數(shù),且小于或等于m;
第一篩選模塊,用于根據(jù)各新聞事件對應(yīng)的候選文章集合中的文章數(shù)量,在各新聞事件對應(yīng)的候選文章集合中,將文章數(shù)量不少于數(shù)量閾值的候選文章集合,確定為目標(biāo)文章集合;
第二篩選模塊,用于根據(jù)所述目標(biāo)文章集合中各個文章的內(nèi)容,以及完成訓(xùn)練的分類模型,篩選出屬于所述目標(biāo)類別的文章,作為所述目標(biāo)文章集合中的待發(fā)布文章;
發(fā)布模塊,用于將所述目標(biāo)文章集合中的待發(fā)布文章,發(fā)布在目標(biāo)應(yīng)用程序中。
另一方面,提供了一種計算機設(shè)備,所述計算機設(shè)備包括處理器和存儲器,所述存儲器中存儲有至少一條指令,所述至少一條指令由所述處理器加載并執(zhí)行以實現(xiàn)上述所述的獲取目標(biāo)類別的文章的方法。
另一方面,提供了一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一條指令,所述至少一條指令由處理器加載并執(zhí)行以實現(xiàn)上述所述的獲取目標(biāo)類別的文章的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010612869.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





