[發明專利]基于數據源的業務定制裝置、方法及計算機可讀存儲介質有效
| 申請號: | 201710313995.0 | 申請日: | 2017-05-05 |
| 公開(公告)號: | CN107038256B | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 王健宗;黃章成;吳天博;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據源 業務定制 用戶群體 計算機可讀存儲介質 業務定制系統 用戶生成內容 存儲器 群體 處理器 標簽 處理器執行 標簽識別 映射關系 存儲 終端 | ||
1.一種基于數據源的業務定制裝置,其特征在于,所述基于數據源的業務定制裝置包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的基于數據源的業務定制系統,所述基于數據源的業務定制系統被所述處理器執行時實現如下步驟:
S1,獲取預定的各數據源中的用戶生成內容;
S2,利用預先訓練生成的用戶群體標簽識別模型對所述用戶生成內容進行識別,以識別出各數據源對應的用戶群體標簽;
S3,根據預定的用戶群體標簽與群體業務的映射關系確定各所述數據源對應的群體業務,將各所述數據源與對應的群體業務發送給預定的終端,以對各所述數據源進行群體業務定制;
所述用戶群體標簽識別模型基于最大熵準則進行建立,所述用戶群體標簽識別模型的模型函數包括用戶行為屬性分布函數,用戶行為屬性分布函數用以描述各用戶對應的行為屬性的概率分布狀況,所述用戶行為屬性分布函數為:
x為用戶,y為用戶標簽,fj(x,y)為用戶x的第j個特征的屬性,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}為用戶的行為屬性的概率分布,Z(x)是正規化因子;
所述基于數據源的業務定制系統被所述處理器執行步驟S1之前,還包括:
S01,獲取預設數量的數據源中的用戶生成內容,以獲取的每一數據源中的用戶生成內容為一群體數據樣本,并為每一群體數據樣本標注對應的用戶群體標簽;
S02,將所述群體數據樣本分為預設的第一比例的訓練集及預設的第二比例的驗證集,所述第一比例及第二比例之和小于等于1;
S03,利用所述訓練集中的群體數據樣本對預定的用戶群體標簽識別模型進行訓練,并在訓練完成后利用所述驗證集對訓練后的用戶群體標簽識別模型的準確率進行驗證;
S04,若所述準確率大于預設閾值,則模型訓練結束,以訓練后的用戶群體標簽識別模型作為所述步驟S2中的用戶群體標簽識別模型,或者,若準確率小于等于預設閾值,則增加數據源的數量,并基于增加后的數據源重新進行訓練。
2.根據權利要求1所述的基于數據源的業務定制裝置,其特征在于,所述用戶群體標簽識別模型的模型函數還包括最優化函數,所述最優化函數為:
p(xi,yi)為用戶xi的標簽yi在用戶群體標簽中出現的概率,為用戶的行為屬性的似然函數,為正則化因子,β為控制所述最優化函數正則化程度的參數。
3.根據權利要求1或2所述的基于數據源的業務定制裝置,其特征在于,所述用戶群體標簽識別模型的識別過程包括對所述用戶的行為屬性的概率分布進行求解迭代,以及在每一迭代的過程中還包括微分模式迭代。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710313995.0/1.html,轉載請聲明來源鉆瓜專利網。





