[發(fā)明專利]一種模型訓(xùn)練及基于模型訓(xùn)練的預(yù)測(cè)方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201810973101.5 | 申請(qǐng)日: | 2018-08-24 |
| 公開(kāi)(公告)號(hào): | CN109242165A | 公開(kāi)(公告)日: | 2019-01-18 |
| 發(fā)明(設(shè)計(jì))人: | 曾偉雄 | 申請(qǐng)(專利權(quán))人: | 蜜小蜂智慧(北京)科技有限公司 |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06Q40/02;G06N3/04;G06K9/62 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100082 北京市西城*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 子模型 樣本數(shù)據(jù) 模型訓(xùn)練 置信度 負(fù)樣本 正樣本 標(biāo)簽 模型預(yù)測(cè) 訓(xùn)練模型 預(yù)測(cè) 兩層 輸出 更新 | ||
本發(fā)明公開(kāi)了一種模型訓(xùn)練及基于模型訓(xùn)練的預(yù)測(cè)方法及裝置,所述方法包括:依次針對(duì)包含至少兩層子模型的待訓(xùn)練模型的每層子模型,識(shí)別該層子模型是否為最后一層子模型;如果否,將訓(xùn)練集中已包含正或負(fù)樣本標(biāo)簽的每個(gè)樣本數(shù)據(jù)輸入到該層子模型中,對(duì)該層子模型進(jìn)行訓(xùn)練;并基于訓(xùn)練完成的該層子模型輸出訓(xùn)練集中每個(gè)樣本數(shù)據(jù)對(duì)應(yīng)正樣本數(shù)據(jù)的置信度,采用訓(xùn)練集中對(duì)應(yīng)正樣本數(shù)據(jù)的置信度大于該層子模型對(duì)應(yīng)的置信度閾值的樣本數(shù)據(jù),對(duì)訓(xùn)練集中的樣本數(shù)據(jù)進(jìn)行更新;如果是,將訓(xùn)練集中已包含正或負(fù)樣本標(biāo)簽的每個(gè)樣本數(shù)據(jù)輸入到該層子模型中,對(duì)該層子模型進(jìn)行訓(xùn)練,用以提高模型預(yù)測(cè)的精度。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)科學(xué)技術(shù)領(lǐng)域,尤其涉及一種模型訓(xùn)練及基于模型訓(xùn)練的預(yù)測(cè)方法及裝置。
背景技術(shù)
隨著經(jīng)濟(jì)與信息化的高速發(fā)展,大數(shù)據(jù)應(yīng)運(yùn)而生,大數(shù)據(jù)指的是一種規(guī)模達(dá)到在獲取、存儲(chǔ)、管理、分析等方面大大超出傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,通過(guò)對(duì)大數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),可以為企業(yè)的業(yè)務(wù)和決策等提供強(qiáng)有力的支持。面對(duì)大數(shù)據(jù)時(shí)代海量的數(shù)據(jù),傳統(tǒng)由人工進(jìn)行的數(shù)據(jù)分析和數(shù)據(jù)價(jià)值挖掘已不適用,而人工智能技術(shù)的出現(xiàn)為大數(shù)據(jù)的數(shù)據(jù)分析和數(shù)據(jù)價(jià)值挖掘提供的了一種較佳的解決方案。
現(xiàn)有的人工智能模型的應(yīng)用,通常是用戶選取合適的訓(xùn)練樣本數(shù)據(jù),其中訓(xùn)練樣本數(shù)據(jù)中包括大量的正樣本數(shù)據(jù)和負(fù)樣本數(shù)據(jù),通過(guò)模型對(duì)應(yīng)的人工智能學(xué)習(xí)算法對(duì)模型進(jìn)行訓(xùn)練,訓(xùn)練好的模型能夠?qū)斎氲臄?shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)輸入的數(shù)據(jù)為正樣本數(shù)據(jù),還是負(fù)樣本數(shù)據(jù)。以信用卡交易數(shù)據(jù)為例,訓(xùn)練集中發(fā)生交易欺詐的信用卡交易數(shù)據(jù)為正樣本數(shù)據(jù),未發(fā)生交易欺詐的信用卡交易數(shù)據(jù)為負(fù)樣本數(shù)據(jù),通過(guò)訓(xùn)練集中大量正樣本數(shù)據(jù)和負(fù)樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練完成后,輸入信用卡交易數(shù)據(jù)后,訓(xùn)練完成的模型能夠?qū)斎氲男庞每ń灰讛?shù)據(jù)是否存在交易欺詐進(jìn)行預(yù)測(cè)。
然而現(xiàn)有模型只有一層,面對(duì)較為復(fù)雜或者包含特征較多的數(shù)據(jù),一層的模型不能對(duì)數(shù)據(jù)中包含的特征進(jìn)行充分的學(xué)習(xí),預(yù)測(cè)結(jié)果的準(zhǔn)確性不高。仍以信用卡交易數(shù)據(jù)為例,信用卡交易發(fā)生交易欺詐的概率大約為萬(wàn)分之五(5BP),如果某銀行某天有10萬(wàn)筆信用卡交易,則大概有50筆信用卡交易存在交易欺詐,因涉及金融交易領(lǐng)域,需確保每筆信用卡交易準(zhǔn)確無(wú)誤,為了防止對(duì)欺詐交易的遺漏,通常要通過(guò)模型從10萬(wàn)筆信用卡交易數(shù)據(jù)中篩選出2500筆信用卡交易數(shù)據(jù),進(jìn)行人工復(fù)核,才能找出50筆存在交易欺詐的信用卡交易數(shù)據(jù),需要耗費(fèi)巨大的人力,因此急需一種模型訓(xùn)練方案,用以提高模型預(yù)測(cè)的精度。
發(fā)明內(nèi)容
本發(fā)明提供一種模型訓(xùn)練及基于模型訓(xùn)練的預(yù)測(cè)方法及裝置,用以解決現(xiàn)有技術(shù)中存在模型預(yù)測(cè)的精度不高問(wèn)題。
第一方面,本發(fā)明公開(kāi)了一種模型訓(xùn)練方法,所述方法包括:
依次針對(duì)待訓(xùn)練模型的每層子模型,識(shí)別該層子模型是否為所述待訓(xùn)練模型的最后一層子模型,其中所述待訓(xùn)練模型包含至少兩層子模型;
如果否,將訓(xùn)練集中已包含正樣本或負(fù)樣本標(biāo)簽的每個(gè)樣本數(shù)據(jù)輸入到該層子模型中,對(duì)該層子模型進(jìn)行訓(xùn)練;并基于訓(xùn)練完成的該層子模型輸出訓(xùn)練集中每個(gè)樣本數(shù)據(jù)對(duì)應(yīng)正樣本數(shù)據(jù)的置信度,采用所述訓(xùn)練集中對(duì)應(yīng)正樣本數(shù)據(jù)的置信度大于該層子模型對(duì)應(yīng)的置信度閾值的樣本數(shù)據(jù),對(duì)所述訓(xùn)練集中的樣本數(shù)據(jù)進(jìn)行更新;
如果是,將訓(xùn)練集中已包含正樣本或負(fù)樣本標(biāo)簽的每個(gè)樣本數(shù)據(jù)輸入到該層子模型中,對(duì)該層子模型進(jìn)行訓(xùn)練。
進(jìn)一步地,所述將訓(xùn)練集中已包含正樣本或負(fù)樣本標(biāo)簽的每個(gè)樣本數(shù)據(jù)輸入到該層子模型中,對(duì)該層子模型進(jìn)行訓(xùn)練之前,所述方法還包括:
判斷所述訓(xùn)練集中樣本數(shù)據(jù)的數(shù)量是否大于設(shè)定的數(shù)量閾值;
如果是,進(jìn)行后續(xù)步驟;
如果否,發(fā)出告警信息。
第二方面,本發(fā)明公開(kāi)了一種基于上述模型訓(xùn)練方法的預(yù)測(cè)方法,所述方法包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蜜小蜂智慧(北京)科技有限公司,未經(jīng)蜜小蜂智慧(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810973101.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 基于日志特征分析的機(jī)群負(fù)載模型及其建模方法
- 一種三模型博弈的產(chǎn)生式對(duì)抗網(wǎng)絡(luò)模型的建立方法及裝置
- 一種衛(wèi)星總體、結(jié)構(gòu)、熱控三維協(xié)同設(shè)計(jì)方法和系統(tǒng)
- 一種大數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)管理控制方法
- 一種教學(xué)原子模型球
- 補(bǔ)貨決策模型訓(xùn)練和補(bǔ)貨決策方法、系統(tǒng)、設(shè)備及介質(zhì)
- 數(shù)據(jù)處理和模型運(yùn)行方法、裝置和計(jì)算機(jī)設(shè)備
- 一種模型的聯(lián)合訓(xùn)練方法、設(shè)備及存儲(chǔ)介質(zhì)
- 一種加載顯示處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 生成模型的方法、裝置和電子設(shè)備
- 生物樣本庫(kù)應(yīng)用管理系統(tǒng)
- 一種模型訓(xùn)練方法及裝置
- 一種評(píng)價(jià)尺度穩(wěn)定的數(shù)據(jù)標(biāo)記分配、統(tǒng)計(jì)的方法及系統(tǒng)
- 情報(bào)數(shù)據(jù)處理的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)融合方法及裝置
- 一種數(shù)據(jù)標(biāo)注方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 樣本數(shù)據(jù)預(yù)測(cè)方法、裝置和計(jì)算機(jī)可讀介質(zhì)
- 分層抽樣方法、裝置和用于分層抽樣的裝置
- 數(shù)據(jù)樣本擴(kuò)充的方法、裝置和電子設(shè)備
- 自動(dòng)化的模型訓(xùn)練方法、裝置、設(shè)備及介質(zhì)
- 變換模型訓(xùn)練方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 信息處理裝置和方法以及利用模型分類的裝置
- 一種模型訓(xùn)練的方法和裝置
- 模型訓(xùn)練方法、模型訓(xùn)練裝置和實(shí)體抽取方法
- 選擇模型訓(xùn)練方法、模型選擇方法、裝置及電子設(shè)備
- 模型訓(xùn)練方法及裝置
- 模型的訓(xùn)練方法、模型的預(yù)測(cè)方法以及模型的控制系統(tǒng)
- 一種模型生成及電池劣化推測(cè)裝置、方法、介質(zhì)及設(shè)備
- 模型訓(xùn)練方法、模型訓(xùn)練平臺(tái)、電子設(shè)備和存儲(chǔ)介質(zhì)
- 識(shí)別文本檢錯(cuò)方法及裝置
- 基于雙循環(huán)圖的虛假評(píng)論檢測(cè)方法
- 多進(jìn)制LDPC碼的置信度量化方法、裝置及解碼器
- 一種置信度的優(yōu)化方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種用戶畫像置信度的優(yōu)化方法及裝置
- 一種聲紋識(shí)別的方法及設(shè)備
- 數(shù)據(jù)處理方法及裝置、存儲(chǔ)介質(zhì)、電子裝置
- 翻譯模型的性能確定方法、置信度確定方法及裝置
- 一種測(cè)距方法及測(cè)距系統(tǒng)
- 根據(jù)置信度顯示結(jié)節(jié)的方法及計(jì)算設(shè)備





