[發明專利]信息處理方法、裝置、電子設備和存儲介質有效
| 申請號: | 202110403695.8 | 申請日: | 2021-04-15 |
| 公開(公告)號: | CN112800234B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 李卓聰 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/205;G06N20/00 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 李漢亮 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例公開了一種信息處理方法、裝置、電子設備和存儲介質;本申請實施例可以獲取未發布內容的標簽信息、文本描述信息以及類別信息;分別對標簽信息進行詞特征提取、對文本描述信息進行句特征提取、以及對類別信息進行類別特征提取,得到該未發布內容的標簽特征信息、句特征信息和類別特征信息;計算標簽特征信息、文本特征信息和類別特征信息兩兩之間的交叉關系,得到交叉特征信息;對標簽特征信息、文本特征信息和類別特征信息進行深度非線性轉換處理,得到深度特征信息;基于交叉特征信息和深度特征信息對未發布內容進行預測處理,得到未發布內容的用戶行為數據。該方案可以有效地提高信息處理的準確性。
技術領域
本申請涉及計算機技術領域,具體涉及一種信息處理方法、裝置、電子設備和存儲介質。
背景技術
隨著人工智能(Artificial Intelligence,AI)的發展,將神經網絡應用于自然語言處理系統(Natural Language Processing,NLP) 已經成為互聯網應用中的一個重要的研究方向。在基于深度神經網絡的自然語言處理方法中,資訊推薦問題是非?;A且重要的問題。在資訊推薦中,由于資訊每天生產的數目過多,對于沒有曝光過的資訊,每天只能隨機抽取一部分資訊進行曝光。因此,存在較多資訊沒有曝光行為,從而導致獲取不到資訊的點擊率和閱讀時長等用戶行為統計數據,無法對受用戶歡迎未曝光的資訊實現有效曝光。
發明內容
本申請實施例提供一種信息處理方法、裝置、電子設備和存儲介質,可以有效地提高信息處理的準確性。
本申請實施例提供一種信息處理方法,包括:
獲取未發布內容的標簽信息、文本描述信息以及類別信息;
分別對所述標簽信息進行詞特征提取、對所述文本描述信息進行句特征提取、以及對所述類別信息進行類別特征提取,得到所述未發布內容的標簽特征信息、句特征信息和類別特征信息;
計算所述標簽特征信息、文本特征信息和類別特征信息兩兩之間的交叉關系,得到所述未發布內容的交叉特征信息;
對所述標簽特征信息、文本特征信息和類別特征信息進行深度非線性轉換處理,得到所述未發布內容的深度特征信息;
基于所述交叉特征信息和所述深度特征信息對未發布內容進行預測處理,得到所述未發布內容的用戶行為數據。
相應的,本申請實施例還提供一種信息處理裝置,包括:
獲取單元,用于獲取未發布內容的標簽信息、文本描述信息以及類別信息;
提取單元,用于分別對所述標簽信息進行詞特征提取、對所述文本描述信息進行句特征提取、以及對所述類別信息進行類別特征提取,得到所述未發布內容的標簽特征信息、句特征信息和類別特征信息;
計算單元,用于計算所述標簽特征信息、文本特征信息和類別特征信息兩兩之間的交叉關系,得到所述未發布內容的交叉特征信息;
轉換單元,用于對所述標簽特征信息、文本特征信息和類別特征信息進行深度非線性轉換處理,得到所述未發布內容的深度特征信息;
預測單元,用于基于所述交叉特征信息和所述深度特征信息對未發布內容進行預測處理,得到所述未發布內容的用戶行為數據。
可選的,在一些實施例中,所述提取單元可以包括第一提取子單元、第二提取子單元和第三提取子單元,如下:
所述第一提取子單元,用于利用訓練后詞向量模型,對所述標簽信息進行詞特征提取,得到所述未發布內容的標簽特征信息;
所述第二提取子單元,用于利用訓練后語言模型,對所述文本描述信息進行句特征提取,得到所述未發布內容的句特征信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110403695.8/2.html,轉載請聲明來源鉆瓜專利網。





