[發明專利]基于時效的數據處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011217879.7 | 申請日: | 2020-11-04 |
| 公開(公告)號: | CN113407714A | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 石磊;馬連洋 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/38 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧;張海秀 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 時效 數據處理 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供了一種基于時效的數據處理方法、裝置、電子設備及存儲介質,涉及云技術及人工智能技術領域。該方法包括:獲取待處理內容,待處理內容包括文本內容;確定文本內容的文本特征;根據文本內容的文本特征,確定待處理內容的第一時效類別;若第一時效類別為第一類別,則基于第一類別對應的時效確定待處理內容的時效;若第一時效類別為第二類別,則基于文本內容中的時間關鍵詞確定待處理內容的時效,第二類別對應的時效大于第一類別對應的時效;根據待處理內容的時效進行處理。本申請實施例提升了待處理內容的時效的準確度,可以使應用程序推薦給用戶的信息是沒有過時的有效信息,提高用戶體驗。
技術領域
本申請涉及云技術及人工智能技術領域,具體而言,本申請涉及一種基于時效的數據處理方法、裝置、電子設備及存儲介質。
背景技術
目前絕大部分的應用程序具有信息推薦的功能,每一個信息具有其對應的時效,因此,準確地確定信息的時效,可以很大程度上防止應用程序推薦過時的信息。
現有技術中,可以根據文章中包含的時間關鍵詞確定文章的時效,具體地,若文章包含時間關鍵詞,則該文章為短時效文章,若文章不包含時間關鍵詞,該文章為長時效文章,時間關鍵詞可以為最近、前幾天、這段時間等。另外,還可以根據文章的類型確定文章的時效,例如,體育類文章的時效為3天,電影類文章的時效為7天等。可見,現有的確定文章時效的方式比較粗糙,容易導致文章的時效不準確,進而導致應用程序推薦給用戶過時的信息,影響用戶體驗。
發明內容
本申請提供了一種能夠準確確定文章時效的基于時效的數據處理方法、裝置、電子設備及存儲介質。
第一方面,提供了一種基于時效的數據處理方法,該方法包括:
獲取待處理內容,待處理內容包括文本內容;
確定文本內容的文本特征;
根據文本內容的文本特征,確定待處理內容的第一時效類別;
若第一時效類別為第一類別,則基于第一類別對應的時效確定待處理內容的時效;
若第一時效類別為第二類別,則基于文本內容中的時間關鍵詞確定待處理內容的時效,第二類別對應的時效大于第一類別對應的時效;
根據待處理內容的時效進行處理。
第二方面,提供了一種基于時效的數據處理裝置,該裝置包括:
內容獲取模塊,用于獲取待處理內容,待處理內容包括文本內容;
時效類別確定模塊,用于確定文本內容的文本特征、根據文本內容的文本特征,確定待處理內容的第一時效類別;
時效確定模塊,用于當第一時效類別為第一類別,則基于第一類別對應的時效確定待處理內容的時效、以及當第一時效類別為第二類別,則基于文本內容中的時間關鍵詞確定待處理內容的時效,第二類別對應的時效大于第一類別對應的時效;
內容處理模塊,用于根據待處理內容的時效進行處理。
在一種可能的實現方式中,裝置還包括關鍵詞提取模塊;
關鍵詞提取模塊,用于提取文本內容中的時間關鍵詞、以及時間關鍵詞的上下文信息;
時效確定模塊在基于文本內容中的時間關鍵詞確定待處理內容的時效時,具體用于:
根據時間關鍵詞和時間關鍵詞的上下文信息,確定待處理內容的第二時效類別,第二時效類別為第一類別或第二類別;
基于第二時效類別對應的時效,確定待處理內容的時效。
在一種可能的實現方式中,時效確定模塊在根據時間關鍵詞和時間關鍵詞的上下文信息,確定待處理內容的第二時效類別時,具體用于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011217879.7/2.html,轉載請聲明來源鉆瓜專利網。





