[發(fā)明專利]分類模型訓(xùn)練方法以及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202210635079.X | 申請(qǐng)日: | 2022-06-07 |
| 公開(kāi)(公告)號(hào): | CN115034300A | 公開(kāi)(公告)日: | 2022-09-09 |
| 發(fā)明(設(shè)計(jì))人: | 鮑夢(mèng)瑤;劉佳偉;章鵬;張謙;賈茜 | 申請(qǐng)(專利權(quán))人: | 螞蟻區(qū)塊鏈科技(上海)有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 吳肖肖 |
| 地址: | 200010 上海市*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類 模型 訓(xùn)練 方法 以及 裝置 | ||
本說(shuō)明書(shū)實(shí)施例提供分類模型訓(xùn)練方法以及裝置,其中所述分類模型訓(xùn)練方法包括:獲取訓(xùn)練樣本數(shù)據(jù)以及目標(biāo)樣本標(biāo)簽,并根據(jù)所述訓(xùn)練樣本數(shù)據(jù)以及所述目標(biāo)樣本標(biāo)簽訓(xùn)練獲得中間分類器,其中,所述訓(xùn)練樣本數(shù)據(jù)包括目標(biāo)項(xiàng)目的歷史待審核項(xiàng)目數(shù)據(jù),將所述訓(xùn)練樣本數(shù)據(jù)及所述目標(biāo)樣本標(biāo)簽輸入所述中間分類器,獲得所述訓(xùn)練樣本數(shù)據(jù)對(duì)應(yīng)的樣本測(cè)試結(jié)果,根據(jù)所述樣本測(cè)試結(jié)果,確定所述訓(xùn)練樣本數(shù)據(jù)的訓(xùn)練樣本標(biāo)簽,根據(jù)所述訓(xùn)練樣本數(shù)據(jù)以及所述訓(xùn)練樣本標(biāo)簽,訓(xùn)練獲得目標(biāo)分類模型,其中,所述目標(biāo)分類模型用于對(duì)所述目標(biāo)項(xiàng)目的待審核項(xiàng)目數(shù)據(jù)進(jìn)行分類,并輸出對(duì)應(yīng)的分類結(jié)果,所述分類結(jié)果用于確定所述待審核項(xiàng)目數(shù)據(jù)的合規(guī)審核結(jié)果。
技術(shù)領(lǐng)域
本說(shuō)明書(shū)實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種分類模型訓(xùn)練方法。本說(shuō)明書(shū)一個(gè)或者多個(gè)實(shí)施例同時(shí)涉及一種分類模型訓(xùn)練裝置,一種計(jì)算設(shè)備,以及一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著信息技術(shù)快速發(fā)展,大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。大數(shù)據(jù)為用戶帶來(lái)信息共享、便捷生活的同時(shí),還存在著個(gè)人隱私泄漏等諸多數(shù)據(jù)安全的問(wèn)題。
目前出現(xiàn)越來(lái)越多的應(yīng)用程序,以為用戶提供多樣化的服務(wù),但為保證應(yīng)用程序能夠通過(guò)合理的方式收集用戶的相關(guān)屬性信息,用戶在使用應(yīng)用程序前,應(yīng)用程序通常會(huì)向用戶展示隱私協(xié)議,以使得用戶閱讀并了解相關(guān)的隱私協(xié)議內(nèi)容,做到向用戶告知隱私協(xié)議內(nèi)容的目的,但應(yīng)用程序在向用戶展示隱私協(xié)議之前,需對(duì)該隱私協(xié)議的內(nèi)容進(jìn)行合規(guī)自查,以確定其內(nèi)容是否符合規(guī)定的合規(guī)條件,而目前的合規(guī)自查方式,多是借助機(jī)器學(xué)習(xí)模型來(lái)實(shí)現(xiàn),但由于機(jī)器學(xué)習(xí)模型需要借助大量有標(biāo)簽的樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練,以保證其輸出結(jié)果的準(zhǔn)確性,而目前樣本數(shù)據(jù)的標(biāo)簽多是通過(guò)人工標(biāo)注生成,對(duì)于龐大的樣本數(shù)據(jù)集,人工標(biāo)注不僅會(huì)耗費(fèi)大量時(shí)間,影響模型訓(xùn)練的效率,而且對(duì)人員的監(jiān)管合規(guī)行業(yè)經(jīng)驗(yàn)的要求也較高,人工標(biāo)注過(guò)程中,往往會(huì)存在信息獲取滯后、信息真實(shí)性不易核驗(yàn)等問(wèn)題,使得人工標(biāo)注生成的標(biāo)簽,其準(zhǔn)確性較低,利用這部分標(biāo)簽進(jìn)行模型訓(xùn)練,會(huì)對(duì)模型訓(xùn)練結(jié)果的準(zhǔn)確性產(chǎn)生影響。因此亟需一種有效的方法以解決此類問(wèn)題。
發(fā)明內(nèi)容
有鑒于此,本說(shuō)明書(shū)實(shí)施例提供了一種分類模型訓(xùn)練方法。本說(shuō)明書(shū)一個(gè)或者多個(gè)實(shí)施例同時(shí)涉及一種分類模型訓(xùn)練裝置,一種計(jì)算設(shè)備,以及一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),以解決現(xiàn)有技術(shù)中存在的技術(shù)缺陷。
根據(jù)本說(shuō)明書(shū)實(shí)施例的第一方面,提供了一種分類模型訓(xùn)練方法,包括:
獲取訓(xùn)練樣本數(shù)據(jù)以及目標(biāo)樣本標(biāo)簽,并根據(jù)所述訓(xùn)練樣本數(shù)據(jù)以及所述目標(biāo)樣本標(biāo)簽訓(xùn)練獲得中間分類器,其中,所述訓(xùn)練樣本數(shù)據(jù)包括目標(biāo)項(xiàng)目的歷史待審核項(xiàng)目數(shù)據(jù);
將所述訓(xùn)練樣本數(shù)據(jù)及所述目標(biāo)樣本標(biāo)簽輸入所述中間分類器,獲得所述訓(xùn)練樣本數(shù)據(jù)對(duì)應(yīng)的樣本測(cè)試結(jié)果;
根據(jù)所述樣本測(cè)試結(jié)果,確定所述訓(xùn)練樣本數(shù)據(jù)的訓(xùn)練樣本標(biāo)簽;
根據(jù)所述訓(xùn)練樣本數(shù)據(jù)以及所述訓(xùn)練樣本標(biāo)簽,訓(xùn)練獲得目標(biāo)分類模型,其中,所述目標(biāo)分類模型用于對(duì)所述目標(biāo)項(xiàng)目的待審核項(xiàng)目數(shù)據(jù)進(jìn)行分類,并輸出對(duì)應(yīng)的分類結(jié)果,所述分類結(jié)果用于確定所述待審核項(xiàng)目數(shù)據(jù)的合規(guī)審核結(jié)果。
可選地,所述獲取訓(xùn)練樣本數(shù)據(jù)以及目標(biāo)樣本標(biāo)簽,包括:
獲取訓(xùn)練樣本數(shù)據(jù)以及初始樣本標(biāo)簽,并根據(jù)所述訓(xùn)練樣本數(shù)據(jù)以及所述初始樣本標(biāo)簽訓(xùn)練獲得初始分類器,其中,所述訓(xùn)練樣本數(shù)據(jù)包括目標(biāo)項(xiàng)目的歷史待審核項(xiàng)目數(shù)據(jù);
將所述訓(xùn)練樣本數(shù)據(jù)及所述初始樣本標(biāo)簽輸入所述初始分類器,獲得所述訓(xùn)練樣本數(shù)據(jù)對(duì)應(yīng)的第一樣本測(cè)試結(jié)果;
根據(jù)所述第一樣本測(cè)試結(jié)果,確定所述訓(xùn)練樣本數(shù)據(jù)的目標(biāo)樣本標(biāo)簽。
可選地,所述將所述訓(xùn)練樣本數(shù)據(jù)及所述目標(biāo)樣本標(biāo)簽輸入所述中間分類器,獲得所述訓(xùn)練樣本數(shù)據(jù)對(duì)應(yīng)的樣本測(cè)試結(jié)果,包括:
將所述訓(xùn)練樣本數(shù)據(jù)及所述目標(biāo)樣本標(biāo)簽輸入第一中間分類器,獲得所述訓(xùn)練樣本數(shù)據(jù)對(duì)應(yīng)的第二樣本測(cè)試結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于螞蟻區(qū)塊鏈科技(上海)有限公司,未經(jīng)螞蟻區(qū)塊鏈科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210635079.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





