[發(fā)明專利]數(shù)據(jù)處理方法、裝置、設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010225311.3 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111831901A | 公開(公告)日: | 2020-10-27 |
| 發(fā)明(設(shè)計)人: | 馮浩;王鵬;徐江;劉純一;李奘 | 申請(專利權(quán))人: | 北京嘀嘀無限科技發(fā)展有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/906;G06F16/75;G06F16/78;G06N3/04;G06N3/08 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 丁君軍 |
| 地址: | 100193 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)處理 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本公開涉及一種數(shù)據(jù)處理方法、裝置、設(shè)備和存儲介質(zhì)。在此描述的方法包括獲取與多種類型的用戶數(shù)據(jù)相對應(yīng)的多個量化表示,并且對多個量化表示中的至少一個量化表示進(jìn)行掩碼,其中用戶數(shù)據(jù)至少指示用戶的用戶簡檔和用戶行為。方法還包括以經(jīng)掩碼的至少一個量化表示和多個量化表示中未經(jīng)掩碼的其他量化表示為輸入、并以未經(jīng)掩碼的至少一個量化表示為輸出,訓(xùn)練用于確定用戶意圖的模型。根據(jù)本公開的實(shí)施例,通過使用無用戶意圖標(biāo)簽的大量用戶數(shù)據(jù)來訓(xùn)練用戶意圖確定模型,使得模型能夠更好地學(xué)習(xí)到用戶特征之間的交互和表示,由此能夠提高用戶意圖確定模型的準(zhǔn)確性。
技術(shù)領(lǐng)域
本公開總體上涉及計算機(jī)領(lǐng)域,更特別地涉及一種數(shù)據(jù)處理方法、裝置、設(shè)備和計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)用戶對于個性化和精細(xì)化的產(chǎn)品或業(yè)務(wù)需求日益增長。為了實(shí)現(xiàn)個性化,需要快速準(zhǔn)確地識別用戶意圖,其中用戶意圖可以指代用戶的興趣或需求、用戶想要達(dá)成的目標(biāo)、或者用戶想要完成的任務(wù),等等。例如,搜索引擎通過挖掘用戶的搜索意圖來提供個性化的搜索結(jié)果,客服系統(tǒng)通過理解用戶意圖來提供更高效的客服服務(wù),視頻網(wǎng)站根據(jù)用戶的用戶意圖來推薦更符合用戶興趣的視頻內(nèi)容等。
發(fā)明內(nèi)容
根據(jù)本公開的一些實(shí)施例,提供了一種數(shù)據(jù)處理方法、裝置、設(shè)備以及計算機(jī)可讀存儲介質(zhì)。
在本公開的第一方面,提供了一種數(shù)據(jù)處理方法。方法包括獲取與多種類型的用戶數(shù)據(jù)相對應(yīng)的多個量化表示,并且對多個量化表示中的至少一個量化表示進(jìn)行掩碼,其中用戶數(shù)據(jù)至少指示用戶的用戶簡檔和用戶行為。方法還包括以經(jīng)掩碼的至少一個量化表示和多個量化表示中未經(jīng)掩碼的其他量化表示為輸入、并以未經(jīng)掩碼的至少一個量化表示為輸出,訓(xùn)練用于確定用戶意圖的模型。
在本公開的第二方面,提供了一種用于確定用戶意圖的方法。方法包括獲得與用戶有關(guān)的數(shù)據(jù)作為輸入,并且使用根據(jù)第一方面所訓(xùn)練的模型基于輸入來確定用戶意圖。
在本公開的第三方面,提供了一種數(shù)據(jù)處理裝置。裝置包括獲取模塊、掩碼模塊以及訓(xùn)練模塊。獲取模塊被配置為獲取與多種類型的用戶數(shù)據(jù)相對應(yīng)的多個量化表示,其中用戶數(shù)據(jù)至少指示用戶的用戶簡檔和用戶行為。掩碼模塊被配置為對多個量化表示中的至少一個量化表示進(jìn)行掩碼。訓(xùn)練模塊被配置為以經(jīng)掩碼的至少一個量化表示和多個量化表示中未經(jīng)掩碼的其他量化表示為輸入、并以未經(jīng)掩碼的至少一個量化表示為輸出,訓(xùn)練用于確定用戶意圖的模型。
在本公開的第四方面,提供了一種用于確定用戶意圖的裝置。裝置包括獲得模塊,被配置為獲得與用戶有關(guān)的數(shù)據(jù)作為輸入,以及使用模塊,被配置為使用根據(jù)第三方面所訓(xùn)練的模型基于輸入確定用戶意圖。
在本公開的第五方面,提供了一種電子設(shè)備,包括存儲器和處理器,其中存儲器用于存儲計算機(jī)可執(zhí)行指令,計算機(jī)可執(zhí)行指令被處理器執(zhí)行以實(shí)現(xiàn)根據(jù)本公開的第一方面和/或第二方面的方法。
在本公開的第六方面,提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)可執(zhí)行指令,其中計算機(jī)可執(zhí)行指令被處理器執(zhí)行實(shí)現(xiàn)根據(jù)本公開的第一方面和/或第二方面的方法。
根據(jù)本公開的各種實(shí)施例,通過使用無用戶意圖標(biāo)簽的用戶數(shù)據(jù)來訓(xùn)練用戶意圖確定模型,使得模型能夠更好地學(xué)習(xí)到用戶特征之間的交互和表示,由此提高用戶意圖確定模型的準(zhǔn)確性。
附圖說明
結(jié)合附圖并參考以下詳細(xì)說明,本公開各實(shí)現(xiàn)方式的特征、優(yōu)點(diǎn)及其他方面將變得更加明顯。在此以示例性而非限制性的方式示出了本公開的若干實(shí)現(xiàn)方式,在附圖中:
圖1示出了根據(jù)本公開的實(shí)施例的用于確定用戶意圖的示例環(huán)境;
圖2示出了根據(jù)本公開的實(shí)施例的數(shù)據(jù)處理方法的流程圖;
圖3示出了根據(jù)本公開的實(shí)施例的無用戶意圖標(biāo)簽數(shù)據(jù)集中的數(shù)據(jù)的示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京嘀嘀無限科技發(fā)展有限公司,未經(jīng)北京嘀嘀無限科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010225311.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





