[發(fā)明專利]基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法、裝置、設(shè)備和介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110233577.7 | 申請(qǐng)日: | 2021-03-03 |
| 公開(公告)號(hào): | CN113792883A | 公開(公告)日: | 2021-12-14 |
| 發(fā)明(設(shè)計(jì))人: | 李怡欣;張一凡;王虎;黃志翔;彭南博 | 申請(qǐng)(專利權(quán))人: | 京東科技控股股份有限公司 |
| 主分類號(hào): | G06N20/00 | 分類號(hào): | G06N20/00;G06K9/62 |
| 代理公司: | 北京英賽嘉華知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 聯(lián)邦 學(xué)習(xí) 模型 訓(xùn)練 方法 裝置 設(shè)備 介質(zhì) | ||
本申請(qǐng)公開了一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法、裝置、設(shè)備和介質(zhì),該方法的一具體實(shí)施方式包括:在專家經(jīng)驗(yàn)標(biāo)簽庫中獲取第一訓(xùn)練標(biāo)簽集合和第二訓(xùn)練標(biāo)簽,專家經(jīng)驗(yàn)標(biāo)簽庫包括多個(gè)基于專家經(jīng)驗(yàn)設(shè)置的訓(xùn)練標(biāo)簽,第一訓(xùn)練標(biāo)簽集合中包括多個(gè)不同的第一訓(xùn)練標(biāo)簽;對(duì)于各個(gè)數(shù)據(jù)端,在第一訓(xùn)練標(biāo)簽集合中確定該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,并基于該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,對(duì)該數(shù)據(jù)端中的模型進(jìn)行訓(xùn)練;獲取各個(gè)數(shù)據(jù)端根據(jù)訓(xùn)練好的模型發(fā)送的訓(xùn)練數(shù)據(jù);根據(jù)訓(xùn)練數(shù)據(jù)和第二訓(xùn)練標(biāo)簽,對(duì)整合模型進(jìn)行訓(xùn)練,以使訓(xùn)練好的整合模型對(duì)各個(gè)數(shù)據(jù)端發(fā)送的數(shù)據(jù)進(jìn)行整合。該實(shí)施方式能夠提升模型訓(xùn)練效果。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及人工智能領(lǐng)域,尤其涉及基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法、裝置、設(shè)備和介質(zhì)。
背景技術(shù)
目前,對(duì)于機(jī)器學(xué)習(xí)而言,數(shù)據(jù)尤為重要。通過聚合多方數(shù)據(jù)進(jìn)行聯(lián)邦學(xué)習(xí),能夠提高機(jī)器學(xué)習(xí)中模型訓(xùn)練的效果。
現(xiàn)在常見的基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法通常是基于單個(gè)標(biāo)簽進(jìn)行訓(xùn)練,如果單個(gè)標(biāo)簽的標(biāo)簽內(nèi)容設(shè)置較為不合理,會(huì)導(dǎo)致模型訓(xùn)練的效果不佳。
發(fā)明內(nèi)容
提供了一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法、裝置、設(shè)備和介質(zhì)。
第一方面,本公開的實(shí)施例提供了一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法,應(yīng)用于業(yè)務(wù)端,包括:在專家經(jīng)驗(yàn)標(biāo)簽庫中獲取第一訓(xùn)練標(biāo)簽集合和第二訓(xùn)練標(biāo)簽,專家經(jīng)驗(yàn)標(biāo)簽庫包括多個(gè)基于專家經(jīng)驗(yàn)設(shè)置的訓(xùn)練標(biāo)簽,第一訓(xùn)練標(biāo)簽集合中包括多個(gè)不同的第一訓(xùn)練標(biāo)簽;對(duì)于各個(gè)數(shù)據(jù)端,在第一訓(xùn)練標(biāo)簽集合中確定該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,并基于該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,對(duì)該數(shù)據(jù)端中的模型進(jìn)行訓(xùn)練;獲取各個(gè)數(shù)據(jù)端根據(jù)訓(xùn)練好的模型發(fā)送的訓(xùn)練數(shù)據(jù);根據(jù)訓(xùn)練數(shù)據(jù)和第二訓(xùn)練標(biāo)簽,對(duì)整合模型進(jìn)行訓(xùn)練,以使訓(xùn)練好的整合模型對(duì)各個(gè)數(shù)據(jù)端發(fā)送的數(shù)據(jù)進(jìn)行整合。
在一些實(shí)施例中,基于該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,對(duì)該數(shù)據(jù)端中的模型進(jìn)行訓(xùn)練,包括:獲取該數(shù)據(jù)端中的模型進(jìn)行數(shù)據(jù)壓縮處理后輸出的壓縮數(shù)據(jù);基于壓縮數(shù)據(jù)和該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,向該數(shù)據(jù)端中的模型返回相應(yīng)的優(yōu)化方向,以使該數(shù)據(jù)端中的模型根據(jù)優(yōu)化方向進(jìn)行訓(xùn)練。
在一些實(shí)施例中,基于壓縮數(shù)據(jù)和該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,向該數(shù)據(jù)端中的模型返回相應(yīng)的優(yōu)化方向,包括:響應(yīng)于確定該數(shù)據(jù)端中的模型未訓(xùn)練好,基于各個(gè)數(shù)據(jù)端中其它數(shù)據(jù)端訓(xùn)練好的模型、壓縮數(shù)據(jù)和該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,向該數(shù)據(jù)端中的模型返回相應(yīng)的優(yōu)化方向。
在一些實(shí)施例中,基于壓縮數(shù)據(jù)和該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,向該數(shù)據(jù)端中的模型返回相應(yīng)的優(yōu)化方向,包括:響應(yīng)于確定該數(shù)據(jù)端未掉線且未出現(xiàn)延遲,基于壓縮數(shù)據(jù)和該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,向該數(shù)據(jù)端中的模型返回相應(yīng)的優(yōu)化方向。
在一些實(shí)施例中,獲取各個(gè)數(shù)據(jù)端根據(jù)訓(xùn)練好的模型發(fā)送的訓(xùn)練數(shù)據(jù),包括:在各個(gè)數(shù)據(jù)端中確定未掉線且未出現(xiàn)延遲的目標(biāo)數(shù)據(jù)端;獲取目標(biāo)數(shù)據(jù)端根據(jù)訓(xùn)練好的模型發(fā)送的訓(xùn)練數(shù)據(jù)。
在一些實(shí)施例中,基于壓縮數(shù)據(jù)和該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,向該數(shù)據(jù)端中的模型返回相應(yīng)的優(yōu)化方向,包括:確定該數(shù)據(jù)端對(duì)應(yīng)的至少一個(gè)同組數(shù)據(jù)端;獲取各個(gè)同組數(shù)據(jù)端發(fā)送的壓縮處理后的同組數(shù)據(jù);利用該數(shù)據(jù)端對(duì)應(yīng)的協(xié)同器,整合同組數(shù)據(jù)和壓縮數(shù)據(jù),得到整合數(shù)據(jù);基于整合數(shù)據(jù)和該數(shù)據(jù)端對(duì)應(yīng)的第一訓(xùn)練標(biāo)簽,向該數(shù)據(jù)端中的模型返回相應(yīng)的優(yōu)化方向。
在一些實(shí)施例中,根據(jù)訓(xùn)練數(shù)據(jù)和第二訓(xùn)練標(biāo)簽,對(duì)整合模型進(jìn)行訓(xùn)練,包括:從訓(xùn)練數(shù)據(jù)中選取樣本數(shù)據(jù),并執(zhí)行以下訓(xùn)練步驟:將樣本數(shù)據(jù)輸入初始模型,得到初始模型輸出的輸出結(jié)果;基于輸出結(jié)果和第二訓(xùn)練標(biāo)簽,確定初始模型的損失函數(shù)的損失值;響應(yīng)于損失值滿足預(yù)設(shè)收斂條件,將初始模型作為訓(xùn)練好的整合模型。
在一些實(shí)施例中,上述方法還包括:響應(yīng)于損失值不滿足預(yù)設(shè)收斂條件,調(diào)整初始模型中的相關(guān)參數(shù),并在訓(xùn)練數(shù)據(jù)中重新選取樣本數(shù)據(jù),繼續(xù)執(zhí)行訓(xùn)練步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于京東科技控股股份有限公司,未經(jīng)京東科技控股股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110233577.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種Agent聯(lián)邦快速設(shè)計(jì)流程建模方法
- 基于聯(lián)邦模式的動(dòng)態(tài)產(chǎn)品協(xié)同開發(fā)平臺(tái)及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動(dòng)態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機(jī)制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種應(yīng)用于異構(gòu)計(jì)算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





