[發(fā)明專利]計算機(jī)實現(xiàn)的信息處理方法及裝置有效

申請?zhí)枺?/td>	201610326891.9	申請日：	2016-05-17
公開（公告）號：	CN107392217B	公開（公告）日：	2021-01-01
發(fā)明（設(shè)計）人：	單憶南;K·拉加塞圖帕蒂;尹航;畢鵬	申請（專利權(quán)）人：	上海點融信息科技有限責(zé)任公司
主分類號：	G06K9/62	分類號：	G06K9/62;G06N20/00;G06Q10/04;G06Q40/02
代理公司：	北京市金杜律師事務(wù)所 11256	代理人：	酆迅
地址：	200122 上海市***	國省代碼：	上海;31
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	計算機(jī) 實現(xiàn) 信息處理方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

一種計算機(jī)實現(xiàn)的數(shù)據(jù)處理方法和裝置。方法包括：基于M個已完結(jié)用戶事件各自的事件狀態(tài)特征向量和各自的標(biāo)簽，構(gòu)建權(quán)重模型，權(quán)重模型的輸出權(quán)重值指示將預(yù)測的未完結(jié)用戶事件的狀態(tài)概率；響應(yīng)于接收到N個未完結(jié)用戶事件的數(shù)據(jù)，計算各自的事件狀態(tài)特征向量，并利用權(quán)重模型分別計算N個未完結(jié)用戶事件各自的權(quán)重值；基于M個已完結(jié)用戶事件的預(yù)定權(quán)重值和計算的N個未完結(jié)用戶事件各自的權(quán)重值，對這些用戶事件進(jìn)行樣本擴(kuò)展，構(gòu)建擴(kuò)展樣本集合；獲取擴(kuò)展樣本集合中的每個用戶事件各自的評分特征向量和各自的標(biāo)簽，構(gòu)建評分模型；以及接收新用戶事件的數(shù)據(jù)，利用評分模型對新用戶事件進(jìn)行評分并根據(jù)評分進(jìn)行相應(yīng)的數(shù)據(jù)處理。

技術(shù)領(lǐng)域

本公開涉及計算機(jī)信息處理領(lǐng)域，尤其涉及計算機(jī)實現(xiàn)的利用機(jī)器學(xué)習(xí)的用戶事件預(yù)測方法和裝置。

背景技術(shù)

在機(jī)器學(xué)習(xí)領(lǐng)域，要精確地學(xué)習(xí)一個模型，至少需要模型參數(shù)個數(shù)的數(shù)百倍的樣本。機(jī)器學(xué)習(xí)需要的訓(xùn)練樣本量是非常大的，而在很多應(yīng)用情境中，可利用的訓(xùn)練樣本數(shù)量不多。例如，在對用戶事件進(jìn)行評分的場景中，通常需要大量的訓(xùn)練樣本以提高預(yù)測或評分模型的置信度。然而，現(xiàn)實中可使用的訓(xùn)練樣本不足，影響了預(yù)測或評分模型的利用效果。

發(fā)明內(nèi)容

為了解決上面所提出的問題，本公開提供一種利用機(jī)器學(xué)習(xí)來充分利用現(xiàn)有的正在進(jìn)行中的用戶事件，以改進(jìn)對預(yù)測或評分模型的訓(xùn)練過程的技術(shù)方案。

根據(jù)本公開的第一方面，提供一種計算機(jī)實現(xiàn)的數(shù)據(jù)處理方法，包括：基于M個已完結(jié)用戶事件各自的事件狀態(tài)特征向量和各自的標(biāo)簽，構(gòu)建權(quán)重模型，其中M是大于1的整數(shù)，權(quán)重模型的輸出權(quán)重值指示將預(yù)測的未完結(jié)用戶事件的狀態(tài)概率；響應(yīng)于接收到N個未完結(jié)用戶事件的數(shù)據(jù)，計算N個未完結(jié)用戶事件各自的事件狀態(tài)特征向量，并利用權(quán)重模型分別計算N個未完結(jié)用戶事件各自的權(quán)重值，其中N是大于1的整數(shù)；基于M個已完結(jié)用戶事件的預(yù)定權(quán)重值和經(jīng)計算的N個未完結(jié)用戶事件各自的權(quán)重值，對M個已完結(jié)用戶事件和N個未完結(jié)用戶事件進(jìn)行樣本擴(kuò)展，以構(gòu)建擴(kuò)展樣本集合；獲取擴(kuò)展樣本集合中的每個用戶事件各自的評分特征向量和各自的標(biāo)簽，以構(gòu)建評分模型；以及接收新用戶事件的數(shù)據(jù)，利用評分模型對新用戶事件進(jìn)行評分，并根據(jù)評分對新用戶事件進(jìn)行相應(yīng)的數(shù)據(jù)處理。

根據(jù)本公開的實施例，其中事件狀態(tài)特征向量表征用戶事件的行為數(shù)據(jù)特征，并且至少包括以下中的一項或多項：用戶事件的不同行為狀態(tài)的占比，用戶事件的行為狀態(tài)轉(zhuǎn)移的占比。

根據(jù)本公開的實施例，其中基于M個已完結(jié)用戶事件的預(yù)定權(quán)重值和經(jīng)計算的N個未完結(jié)用戶事件各自的權(quán)重值，對M個已完結(jié)用戶事件和N個未完結(jié)用戶事件進(jìn)行樣本擴(kuò)展以構(gòu)建擴(kuò)展樣本集合包括：將N個未完結(jié)用戶事件各自的權(quán)重值劃分區(qū)間；以及根據(jù)M個已完結(jié)用戶事件的預(yù)定權(quán)重值和不同的區(qū)間，將M個已完結(jié)用戶事件和N個未完結(jié)用戶事件以相對應(yīng)的預(yù)定比例擴(kuò)展樣本量，形成擴(kuò)展樣本集合。

根據(jù)本公開的實施例，方法還包括：調(diào)試權(quán)重模型，以獲取合適的權(quán)重閾值；以及響應(yīng)于N個未完結(jié)用戶事件各自的權(quán)重值與權(quán)重閾值的比較結(jié)果，丟棄相應(yīng)權(quán)重值小于權(quán)重閾值的未完結(jié)用戶事件。

根據(jù)本公開的實施例，還通過以下步驟來構(gòu)建權(quán)重模型：基于M個已完結(jié)用戶事件各自的事件狀態(tài)特征向量和各自的至少部分的評分特征向量以及各自的標(biāo)簽，構(gòu)建權(quán)重模型。

根據(jù)本公開的實施例，其中構(gòu)建權(quán)重模型的用戶事件還包括Q個已進(jìn)行進(jìn)度超過第一閾值且相應(yīng)的事件狀態(tài)特征向量的值高于預(yù)定閾值的用戶事件，其中Q是大于1的整數(shù)。

根據(jù)本公開的實施例，方法還包括：在將事件狀態(tài)特征向量用于權(quán)重模型之前，對事件狀態(tài)特征向量的值進(jìn)行編碼以投影到更高維度空間。

根據(jù)本公開的實施例，其中N個未完結(jié)用戶事件包括用戶事件已進(jìn)行進(jìn)度超過第二閾值的用戶事件。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海點融信息科技有限責(zé)任公司，未經(jīng)上海點融信息科技有限責(zé)任公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610326891.9/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：基于光譜空間映射與純化的對象光譜特征提取方法
下一篇：一種基于圖像的車輛定損方法、裝置及電子設(shè)備

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】