[發(fā)明專利]信息處理方法、裝置、電子設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 201910957683.2 | 申請日: | 2019-10-09 |
| 公開(公告)號: | CN110659701B | 公開(公告)日: | 2022-08-12 |
| 發(fā)明(設(shè)計)人: | 何天琪;程建波;彭南博 | 申請(專利權(quán))人: | 京東科技控股股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/82;G06V10/774;G06F16/31;G06N3/04;G06N3/08 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 呂朝蕙 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息處理 方法 裝置 電子設(shè)備 介質(zhì) | ||
本公開提供了一種信息處理方法,包括:獲取樣本數(shù)據(jù),該樣本數(shù)據(jù)表征目標(biāo)用戶、目標(biāo)物品及目標(biāo)用戶在第一時刻對目標(biāo)物品執(zhí)行p種預(yù)定操作的操作信息;獲取目標(biāo)用戶的用戶信息及目標(biāo)物品的第一物品信息;將用戶信息及第一物品信息輸入特征提取模型,提取得到特征向量;采用預(yù)測模型處理特征向量,得到目標(biāo)用戶對目標(biāo)物品執(zhí)行p種預(yù)定操作中每種預(yù)定操作的預(yù)測置信度;以及根據(jù)操作信息及預(yù)測置信度,優(yōu)化特征提取模型。其中,用戶信息和/或第一物品信息包括以下至少兩種類型的信息:特征信息、圖像信息和文本信息,p為大于1的自然數(shù)。本公開還提供了一種信息處理裝置、一種電子設(shè)備及一種計算機可讀存儲介質(zhì)。
技術(shù)領(lǐng)域
本公開涉及計算機技術(shù)領(lǐng)域,更具體地,涉及一種信息處理方法、裝置、電子設(shè)備及介質(zhì)。
背景技術(shù)
近年來,隨著電子商務(wù)的迅速發(fā)展和用戶交互信息的爆炸式增長,從多類型、多維度的信息中提取用戶特征成為影響推薦系統(tǒng)效果的重要因素。
在實現(xiàn)本公開構(gòu)思的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在以下問題:現(xiàn)有的特征提取方法包括基于傳統(tǒng)機器學(xué)習(xí)算法進行提取和基于時間序列深度學(xué)習(xí)算法進行提取。其中,基于傳統(tǒng)機器學(xué)習(xí)算法進行提取(如協(xié)同過濾)僅能利用用戶的交互信息,無法處理文本和圖像等非結(jié)構(gòu)化信息,從而存在大量數(shù)據(jù)浪費,特征提取效果較差的缺陷。基于時間序列深度學(xué)習(xí)算法需要人為在時間維度進行特征處理,處理方式相對固定,需要非常強的專家先驗知識,并不能很好的處理時間序列類特征。
發(fā)明內(nèi)容
有鑒于此,本公開提供了一種能夠融合多種不同類型數(shù)據(jù)進行特征提取的信息處理方法、裝置、電子設(shè)備及介質(zhì)。
本公開的一個方面提供了一種信息處理方法,包括:獲取樣本數(shù)據(jù),該樣本數(shù)據(jù)表征目標(biāo)用戶、目標(biāo)物品及目標(biāo)用戶在第一時刻對目標(biāo)物品執(zhí)行p種預(yù)定操作的操作信息;獲取目標(biāo)用戶的用戶信息及目標(biāo)物品的第一物品信息;將用戶信息及第一物品信息輸入特征提取模型,提取得到特征向量;采用預(yù)測模型處理特征向量,得到目標(biāo)用戶對目標(biāo)物品執(zhí)行p種預(yù)定操作中每種預(yù)定操作的預(yù)測置信度;以及根據(jù)操作信息及預(yù)測置信度,優(yōu)化特征提取模型,其中,用戶信息和/或第一物品信息包括以下至少兩種類型的信息:特征信息、交互記錄信息、圖像信息和文本信息,p為大于1的自然數(shù)。
根據(jù)本公開的實施例,上述特征提取模型包括針對至少兩種類型的信息的至少兩個提取子模型,以分別提取得到至少兩種類型的信息的特征子向量,特征向量根據(jù)至少兩種類型的信息的特征子向量得到。
根據(jù)本公開的實施例,上述用戶信息包括:用戶特征信息及在第一時刻之前的交互記錄信息,該交互記錄信息包括n個預(yù)定操作所針對物品的n個第二物品信息及n個預(yù)定操作所針對的n個第一時間信息;物品信息包括物品特征信息,n為大于1的自然數(shù)。上述提取得到特征向量包括:將第一物品信息包括的第一物品特征信息及用戶特征信息分別輸入第一轉(zhuǎn)換模型,得到針對第一物品特征信息的第一特征子向量以及針對用戶特征信息的第二特征子向量;將n個第二物品信息包括的n個第二物品特征信息及n個第一時間信息配對組合,得到n個第一輸入信息;以及根據(jù)n個第一時間信息表征的n個第二時刻的先后順序,將n個第一輸入信息依次輸入第一循環(huán)神經(jīng)網(wǎng)絡(luò)模型,得到第三特征子向量。其中,特征向量根據(jù)第一特征子向量、第二特征子向量以及第三特征子向量得到;針對特征信息的提取子模型包括第一轉(zhuǎn)換模型和第一循環(huán)神經(jīng)網(wǎng)絡(luò)模型。
根據(jù)本公開的實施例,上述物品信息還包括物品圖像信息;上述提取得到特征向量還包括:將n個第二物品信息包括的n個第二物品圖像信息依次輸入卷積神經(jīng)網(wǎng)絡(luò)模型,得到針對n個第二物品圖像信息的n個第一向量;將n個第一向量及n個第一時間信息配對組合,得到n個第二輸入信息;根據(jù)n個第一時間信息表征的n個第二時刻的先后順序,將n個第二輸入信息依次輸入第二循環(huán)神經(jīng)網(wǎng)絡(luò)模型,得到第四特征子向量;以及將第一物品信息包括的第一物品圖像信息輸入卷積神經(jīng)網(wǎng)絡(luò)模型中,得到第五特征子向量。其中,特征向量還根據(jù)第四特征子向量和第五特征子向量得到;針對圖像信息的提取子模型包括卷積神經(jīng)網(wǎng)絡(luò)模型和第二循環(huán)神經(jīng)網(wǎng)絡(luò)模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于京東科技控股股份有限公司,未經(jīng)京東科技控股股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910957683.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





