[發(fā)明專利]一種特征篩選方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201610127861.5 | 申請(qǐng)日: | 2016-03-07 |
| 公開(公告)號(hào): | CN107169571A | 公開(公告)日: | 2017-09-15 |
| 發(fā)明(設(shè)計(jì))人: | 席炎;張柯;謝樹坤;黃俊;付子豪;楊強(qiáng)鵬;李文鵬;王曉光;余舟華 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06N99/00 | 分類號(hào): | G06N99/00 |
| 代理公司: | 北京國(guó)昊天誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司11315 | 代理人: | 黃熊 |
| 地址: | 英屬開曼群島大開*** | 國(guó)省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 特征 篩選 方法 裝置 | ||
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種特征篩選方法及裝置。
背景技術(shù)
目前,人們可以利用構(gòu)建的業(yè)務(wù)模型,實(shí)現(xiàn)業(yè)務(wù)功能。這里所說的業(yè)務(wù)功能,比如是輸出表示用戶信用等級(jí)或用戶消費(fèi)能力的數(shù)據(jù),等等。在業(yè)務(wù)模型構(gòu)建完畢后,可以將數(shù)據(jù)賦值給業(yè)務(wù)模型包含的變量,以觸發(fā)業(yè)務(wù)模型輸出相應(yīng)的結(jié)果。
需要說明的是,業(yè)務(wù)模型,一般是指包含“與期望業(yè)務(wù)模型實(shí)現(xiàn)的業(yè)務(wù)功能相關(guān)的變量”的數(shù)學(xué)模型(比如計(jì)算公式)。其中,與期望業(yè)務(wù)模型實(shí)現(xiàn)的業(yè)務(wù)功能相關(guān)的變量,是根據(jù)與所述業(yè)務(wù)功能相關(guān)的特征確定的。具體而言,在現(xiàn)有技術(shù)中,技術(shù)人員可以依靠以往的業(yè)務(wù)經(jīng)驗(yàn),采用人工一一分析特征并進(jìn)行選取的方式,選取出與所述業(yè)務(wù)功能比較相關(guān)的特征,進(jìn)而根據(jù)該些特征,確定與所述業(yè)務(wù)功能相關(guān)的變量。
例如,以所要構(gòu)建的業(yè)務(wù)模型為用戶信用評(píng)估模型為例,技術(shù)人員可以通過一一分析與用戶信用相關(guān)的特征,選取出與期望該用戶信用評(píng)價(jià)模型實(shí)現(xiàn)的業(yè)務(wù)功能相關(guān)的包括用戶的工作單位性質(zhì)、用戶的償還能力以及用戶的人脈關(guān)系在內(nèi)的特征,并根據(jù)該些特征,確定分別對(duì)應(yīng)于用戶的工作單位性質(zhì)、用戶的償還能力以及用戶的人脈關(guān)系的變量e、f、g,進(jìn)而實(shí)現(xiàn)業(yè)務(wù)模型的構(gòu)建。比如,構(gòu)建的業(yè)務(wù)模型可以為:用戶信用評(píng)價(jià)分?jǐn)?shù)A=αe+βf+γg。其中,α、β、γ是分別為變量e、f、g設(shè)置的權(quán)重值。
采用上述人工選取特征的方式,效率較低。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供一種特征篩選方法,用以解決現(xiàn)有技術(shù)存在的特征篩選效率較低的問題。
本申請(qǐng)實(shí)施例還提供一種特征篩選裝置,用以解決現(xiàn)有技術(shù)存在的特征篩選效率較低的問題。
本申請(qǐng)實(shí)施例采用下述技術(shù)方案:
一種特征篩選方法,包括:
確定特征集合中特征的機(jī)器學(xué)習(xí)算法權(quán)值;其中,特征的機(jī)器學(xué)習(xí)算法權(quán)值為:以選取作為樣本的特征的值為輸入,以特征歷史上被選取作為確定業(yè)務(wù)模型包含的變量的特征的概率值為輸出訓(xùn)練指定機(jī)器學(xué)習(xí)算法后,得到的機(jī)器學(xué)習(xí)算法的權(quán)值;根據(jù)所述特征的機(jī)器學(xué)習(xí)算法權(quán)值,從所述特征集合中篩選用于確定業(yè)務(wù)模型包含的變量的特征;所述業(yè)務(wù)模型包含的變量用于實(shí)現(xiàn)業(yè)務(wù)模型的業(yè)務(wù)功能。
一種特征篩選裝置,包括:
機(jī)器學(xué)習(xí)算法權(quán)值確定單元,用于確定特征集合中特征的機(jī)器學(xué)習(xí)算法權(quán)值;其中,特征的機(jī)器學(xué)習(xí)算法權(quán)值為:以選取作為樣本的特征的值作為輸入,以特征歷史上被選取作為確定業(yè)務(wù)模型包含的變量的特征的概率值為輸出訓(xùn)練指定機(jī)器學(xué)習(xí)算法后,得到的機(jī)器學(xué)習(xí)算法的權(quán)值;特征篩選單元,用于根據(jù)所述部分或全部特征的機(jī)器學(xué)習(xí)算法權(quán)值,從所述特征集合中篩選用于確定業(yè)務(wù)模型包含的變量的特征;所述業(yè)務(wù)模型包含的變量用于實(shí)現(xiàn)業(yè)務(wù)模型的業(yè)務(wù)功能。
本申請(qǐng)實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果:
由于可以通過確定特征的機(jī)器學(xué)習(xí)算法權(quán)值,并根據(jù)機(jī)器學(xué)習(xí)算法權(quán)值,實(shí)現(xiàn)對(duì)用于確定業(yè)務(wù)模型包含的變量的特征的選取,無需技術(shù)人員采用人工篩選的方式選取特征,因此避免了現(xiàn)有技術(shù)中采用人工篩選特征的方式導(dǎo)致篩選效率較低的問題。
附圖說明
此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1為本申請(qǐng)實(shí)施例提供的一種特征篩選方法的具體流程示意圖;
圖2為本申請(qǐng)實(shí)施例提供的一種使用組合機(jī)器學(xué)習(xí)算法對(duì)特征進(jìn)行篩選的流程示意圖;
圖3為本申請(qǐng)實(shí)施例提供的一種篩選用于構(gòu)建信用評(píng)級(jí)模型特征的方法的具體流程示意圖;
圖4為本申請(qǐng)實(shí)施例提供的一種特征篩選裝置的具體結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
以下結(jié)合附圖,詳細(xì)說明本申請(qǐng)各實(shí)施例提供的技術(shù)方案。
實(shí)施例1
本申請(qǐng)實(shí)施例提供了一種特征篩選方法,用以解決現(xiàn)有技術(shù)存在的特征篩選效率較低的問題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610127861.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





