[發(fā)明專利]一種用于機器學(xué)習(xí)模型的特征生成方法、裝置和電子設(shè)備有效
| 申請?zhí)枺?/td> | 201510977436.0 | 申請日: | 2015-12-23 |
| 公開(公告)號: | CN106909931B | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計)人: | 魏溪含 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京清源匯知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11644 | 代理人: | 馮德魁 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 機器 學(xué)習(xí) 模型 特征 生成 方法 裝置 電子設(shè)備 | ||
本申請公開了一種用于機器學(xué)習(xí)模型的特征生成方法、裝置和電子設(shè)備,一種數(shù)據(jù)預(yù)測方法、裝置和電子設(shè)備,以及一種信息推薦方法、裝置和電子設(shè)備。其中所述用于機器學(xué)習(xí)模型的特征生成方法包括:獲取待處理對象的對特定目標(biāo)產(chǎn)生影響的基礎(chǔ)特征;根據(jù)獲取到的基礎(chǔ)特征,通過預(yù)先生成的特征構(gòu)造模型,生成所述待處理對象的對特定目標(biāo)產(chǎn)生影響的組合特征;其中,所述特征構(gòu)造模型根據(jù)已標(biāo)注特定目標(biāo)的歷史對象集學(xué)習(xí)獲得。采用本申請?zhí)峁┑姆椒ǎ軌蛲ㄟ^自主學(xué)習(xí)的方式生成特征構(gòu)造模型,并且通過特征構(gòu)造模型自動生成待處理對象的組合特征,從而達(dá)到降低人工工作量的效果。
技術(shù)領(lǐng)域
本申請涉及機器學(xué)習(xí)技術(shù)領(lǐng)域,具體涉及一種用于機器學(xué)習(xí)模型的特征生成方法、裝置和電子設(shè)備。本申請同時涉及一種數(shù)據(jù)預(yù)測方法、裝置和電子設(shè)備,以及一種信息推薦方法、裝置和電子設(shè)備。
背景技術(shù)
根據(jù)機器學(xué)習(xí)模型包括的層數(shù),可以將模型分為淺層模型和深層模型兩大類別,例如,邏輯回歸模型和支持向量機為淺層模型,而具有多個隱層的人工神經(jīng)網(wǎng)絡(luò)則為深層模型。下面通過對比方式,對上述兩種不同類型的機器學(xué)習(xí)模型的各自特點進(jìn)行簡要說明。
一方面,淺層模型的預(yù)測準(zhǔn)確度通常高于深層模型。相對于淺層模型而言,由于深層模型包括的層數(shù)較多,因而深層模型在訓(xùn)練過程中的計算量較大。在實際應(yīng)用中,為了避免深層模型訓(xùn)練過程中計算量過大的問題,深層模型輸入層可包括的特征數(shù)量通常不超過幾百個特征,而淺層模型可包括的特征數(shù)量能夠達(dá)到千萬數(shù)量級。可見,由于淺層模型實際可依據(jù)的特征數(shù)量更多,因此淺層模型的預(yù)測準(zhǔn)確度通常高于深層模型。
另一方面,淺層模型的樣本特征通常為人工特征,而深層模型的樣本特征可以通過深度學(xué)習(xí)的方式自動提取。淺層模型有一個重要特點,就是假設(shè)靠人工經(jīng)驗來抽取樣本特征,而強調(diào)模型主要是負(fù)責(zé)分類或預(yù)測。而深層模型不僅負(fù)責(zé)分類或預(yù)測,還能夠用于自動提取樣本特征,例如,利用深層模型進(jìn)行圖像識別時,深層模型同時能夠自動化的無監(jiān)督學(xué)習(xí)獲得圖像的特征。
綜上所述,淺層模型的預(yù)測準(zhǔn)確度高于深層模型,但模型的樣本特征為人工特征;深層模型的樣本特征可以自動提取,但預(yù)測準(zhǔn)確度低于淺層模型。在實際應(yīng)用中,根據(jù)具體應(yīng)用場景,選取淺層模型或深層模型作為預(yù)測模型。
目前,淺層模型中的樣本特征主要依賴于人力進(jìn)行提取。在淺層模型確定的前提下,特征的好壞就成為整個系統(tǒng)性能的瓶頸。根據(jù)特征獲取的難易程度,可以將淺層模型的樣本特征分為基礎(chǔ)特征和組合特征兩大類。其中,基礎(chǔ)特征是指能夠直接獲取到的樣本基本屬性,例如,一個商品信息的單價、歷史銷量、庫存等屬性。組合特征是指在多個基礎(chǔ)特征基礎(chǔ)上計算生成的復(fù)合特征。通過組合特征能夠挖掘出不同基礎(chǔ)特征之間更深層次的關(guān)系,因此,依據(jù)組合特征往往能夠提高模型的預(yù)測精確度。
在利用淺層模型進(jìn)行預(yù)測時,通常一個開發(fā)團(tuán)隊中更多的人力是投入到發(fā)掘更好的特征上去的,即:從各種組合特征中找到有價值的組合特征。要發(fā)現(xiàn)一個好的特征,就要求開發(fā)人員對待解決的問題要有很深入的理解。而達(dá)到這個程度,往往需要依靠專家知識,并且需要反復(fù)地摸索,不僅對人的技能有要求,還將耗費大量的人力資源。因此,人工設(shè)計樣本特征,不是一個可擴展的途徑。
綜上所述,現(xiàn)有技術(shù)存在無法自動生成組合特征的問題。
發(fā)明內(nèi)容
本申請?zhí)峁┮环N用于機器學(xué)習(xí)模型的特征生成方法、裝置和電子設(shè)備,以解決現(xiàn)有技術(shù)存在無法自動生成組合特征的問題。本申請另外提供一種數(shù)據(jù)預(yù)測方法、裝置和電子設(shè)備,以及一種信息推薦方法、裝置和電子設(shè)備。
本申請?zhí)峁┮环N用于機器學(xué)習(xí)模型的特征生成方法,包括:
獲取待處理對象的對特定目標(biāo)產(chǎn)生影響的基礎(chǔ)特征;
根據(jù)獲取到的基礎(chǔ)特征,通過預(yù)先生成的特征構(gòu)造模型,生成所述待處理對象的對特定目標(biāo)產(chǎn)生影響的組合特征;
其中,所述特征構(gòu)造模型根據(jù)已標(biāo)注特定目標(biāo)的歷史對象集學(xué)習(xí)獲得。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510977436.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:立體玩具(五光十色可愛玩具)
- 下一篇:立體玩具(粉紅少女小吊墜)
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





