[發(fā)明專利]一種特征模型的生成、應(yīng)用方法及裝置有效
| 申請?zhí)枺?/td> | 201610430985.0 | 申請日: | 2016-06-16 |
| 公開(公告)號: | CN107515876B | 公開(公告)日: | 2020-12-04 |
| 發(fā)明(設(shè)計)人: | 陳鈺雯 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 朱佳 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 特征 模型 生成 應(yīng)用 方法 裝置 | ||
本發(fā)明涉及計算機(jī)領(lǐng)域,特別涉及一種特征模型的生成、應(yīng)用方法及裝置,用以提高目標(biāo)特征模型的精準(zhǔn)度。該方法為:將特征數(shù)據(jù)輸入目標(biāo)特征模型,獲得相應(yīng)的描述信息,其中,所述目標(biāo)特征模型用于描述一應(yīng)用場景且是基于多個子特征模型生成的,所述多個特征模型是基于所述應(yīng)用場景對應(yīng)的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是調(diào)整所述特征集合中特征的重要度后得到的,顯然,不同的子特征模型在描述目標(biāo)特征模型對應(yīng)的應(yīng)用場景時的側(cè)重點(diǎn)不同,使得最終生成的目標(biāo)特征模型可以從不同角度更全面地描述上述待分析的應(yīng)用場景,從而增加了目標(biāo)特征模型的精準(zhǔn)度,進(jìn)而提高了特征數(shù)據(jù)分析的準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)領(lǐng)域,特別涉及一種特征模型的生成、應(yīng)用方法及裝置。
背景技術(shù)
在數(shù)據(jù)分析過程中,為了更好地確定待分析對象的特點(diǎn),一個重要的步驟便是特征的選取,特征的選取結(jié)果在很大程度上將會影響后期建模的效果,進(jìn)而影響數(shù)據(jù)分析的結(jié)果。
現(xiàn)有技術(shù)下,在進(jìn)行建模時,特征的選取一般采用兩種方式:
第一種方式為:
選中提取出的所有特征,刪除一些區(qū)分度不強(qiáng)的特征,通過訓(xùn)練樣本對剩下的所有特征進(jìn)行統(tǒng)一訓(xùn)練,從而建立統(tǒng)一的模型(如,采用決策樹方式進(jìn)行建模。
然而,采用第一種方式,通常只會選取出區(qū)分度最強(qiáng)的特征以及特征組合,因此,建立的模型也會著重描述這些特征及特征組合的特點(diǎn),而一些次強(qiáng)的特征及特征組合可能被忽略,從而影響建模結(jié)果的精準(zhǔn)度。
第二種方式為:
先對提取出的特征進(jìn)行分組。然后,每一組特征分別采用相應(yīng)的訓(xùn)練樣本進(jìn)行訓(xùn)練,分別生成相應(yīng)的子模型,最后,再將所有子模型統(tǒng)一組成一個模型(如,采用隨機(jī)森林方式進(jìn)行建模,或者,采用boosting方式進(jìn)行建模)。
然而,采用第二種方式,可能會在特征隨機(jī)分組過程中,拆散區(qū)分度很強(qiáng)的特征組合,從而影響建模結(jié)果的精準(zhǔn)度。并且由于特征分組是隨機(jī)的,建模型結(jié)果是否理想只能靠統(tǒng)計學(xué)保證,這同樣會影響建模結(jié)果的準(zhǔn)確性。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種特征模型的生成、應(yīng)用方法及裝置,用以提高建模結(jié)果的精準(zhǔn)度。
本發(fā)明實(shí)施例提供的具體技術(shù)方案如下:
一種特征模型的應(yīng)用方法,包括:獲取特征數(shù)據(jù),所述特征數(shù)據(jù)中包含有至少一個特征;獲取目標(biāo)特征模型,所述目標(biāo)特征模型用于描述一應(yīng)用場景,是基于多個子特征模型生成的,其中,所述多個特征模型是基于所述應(yīng)用場景對應(yīng)的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是調(diào)整所述特征集合中特征的重要度后得到的,一個特征的重要度表征所述一個特征對建模準(zhǔn)確度的影響程度;將特征數(shù)據(jù)輸入目標(biāo)特征模型,獲得所述特征數(shù)據(jù)在所述應(yīng)用場景下的描述信息。
可選的,獲取所述目標(biāo)特征模型之前,進(jìn)一步包括:生成所述目標(biāo)特征模型,具體包括:針對待分析的應(yīng)用場景進(jìn)行特征提取,獲得特征集合;基于獲得的特征集合,生成多個子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是調(diào)整所述特征集合中特征的重要度后得到的;基于獲得的所有子特征模型,生成對應(yīng)所述待分析的應(yīng)用場景的目標(biāo)特征模型。
可選的,基于獲得的特征集合,生成多個子特征模型,包括:循環(huán)執(zhí)行以下操作,直到確定滿足預(yù)設(shè)的停止執(zhí)行條件:基于當(dāng)前的特征集合包含的所有特征建立相應(yīng)的子特征模型;計算獲得的子特征模型中每一個特征當(dāng)前的重要度;在所述當(dāng)前的特征集合中,刪除當(dāng)前的重要度符合預(yù)設(shè)篩選條件的特征;判斷是否滿足預(yù)設(shè)的停止條件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610430985.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:數(shù)據(jù)查詢方法及裝置
- 下一篇:敏感主題詞集的生成方法和裝置
- 在線應(yīng)用平臺上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場
- 使用應(yīng)用的方法和應(yīng)用平臺
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠(yuǎn)程應(yīng)用進(jìn)行應(yīng)用安裝
- 應(yīng)用檢測方法及應(yīng)用檢測裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)





