[發(fā)明專利]一種推薦系統(tǒng)數(shù)據(jù)抽象與自動(dòng)化特征工程的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910829720.1 | 申請(qǐng)日: | 2019-09-04 |
| 公開(公告)號(hào): | CN110531959B | 公開(公告)日: | 2020-12-04 |
| 發(fā)明(設(shè)計(jì))人: | 張發(fā)恩;馮元;吳騰虎 | 申請(qǐng)(專利權(quán))人: | 深圳創(chuàng)新奇智科技有限公司 |
| 主分類號(hào): | G06F8/10 | 分類號(hào): | G06F8/10 |
| 代理公司: | 廣州鼎賢知識(shí)產(chǎn)權(quán)代理有限公司 44502 | 代理人: | 丁雨燕 |
| 地址: | 518054 廣東省深圳市南山區(qū)*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 推薦 系統(tǒng) 數(shù)據(jù) 抽象 自動(dòng)化 特征 工程 方法 | ||
1.一種推薦系統(tǒng)數(shù)據(jù)抽象與自動(dòng)化特征工程的方法,其特征在于:對(duì)于任意場(chǎng)景的推薦系統(tǒng)數(shù)據(jù),只需要了解將該推薦系統(tǒng)數(shù)據(jù)進(jìn)行適配后生成的字段內(nèi)的關(guān)鍵詞和指定的處理函數(shù),即可使用通用的數(shù)據(jù)處理和特征工程代碼,完成特征的生成,具體包括如下步驟:
步驟a、數(shù)據(jù)抽象化,基于字段設(shè)置原則,把甲方提供的原始數(shù)據(jù)適配成標(biāo)準(zhǔn)抽象數(shù)據(jù);
步驟b、對(duì)標(biāo)準(zhǔn)抽象數(shù)據(jù)配置schema,并開發(fā)相應(yīng)的通用處理函數(shù),經(jīng)過自動(dòng)化特征工程從而生成特征數(shù)據(jù);
步驟a中的字段設(shè)置原則為:適配完成的標(biāo)準(zhǔn)抽象數(shù)據(jù)包括三類用以生成統(tǒng)計(jì)特征的關(guān)鍵詞,分別為當(dāng)前字段的對(duì)象描述、類別描述和類別描述處理后的下標(biāo)值描述,對(duì)象描述包括用戶user或商品product,類別描述包括用以進(jìn)行獨(dú)熱處理的種類category、用以表示用戶或商品分類的tag,下標(biāo)值為自然數(shù);
配置schema的次數(shù)為兩次,第一次配置schema后將標(biāo)準(zhǔn)抽象數(shù)據(jù)配置成用于表示屬性的靜態(tài)數(shù)據(jù)和基于統(tǒng)計(jì)生成的統(tǒng)計(jì)數(shù)據(jù),第二次配置schema后將靜態(tài)數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù)配置成特征數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的一種推薦系統(tǒng)數(shù)據(jù)抽象與自動(dòng)化特征工程的方法,其特征在于:通用處理函數(shù)包括最小值最大值函數(shù)、歸一化函數(shù)、z-score函數(shù)、線性比例變換函數(shù)、高斯標(biāo)準(zhǔn)化函數(shù)的一種或多種。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳創(chuàng)新奇智科技有限公司,未經(jīng)深圳創(chuàng)新奇智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910829720.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





