[發明專利]面向自然語言模型的聯邦小樣本學習方法、系統及設備在審
| 申請號: | 202310208694.7 | 申請日: | 2023-03-07 |
| 公開(公告)號: | CN116127018A | 公開(公告)日: | 2023-05-16 |
| 發明(設計)人: | 徐夢煒;蔡棟琪;周傲;馬驍;王尚廣 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F18/214;G06F18/241 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 牛崢;王麗琴 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 自然語言 模型 聯邦 樣本 學習方法 系統 設備 | ||
1.一種面向自然語言模型的聯邦小樣本學習方法,其特征在于,所述方法包括:
a、云端服務器選擇一增強策略;
b、云端服務器基于所述增強策略,將自然語言模型發送給兩個端側設備集群,以使所述兩個端側設備集群分別采用聯邦學習方式及采用預設的聯邦小樣本學習方式,對所述自然語言模型進行當前迭代輪的協同微調,得到下一迭代輪的所述自然語言模型;
c、云端服務器基于所述增強策略,將所述下一迭代輪的所述自然語言模型作為當前迭代輪的所述自然語言模型,發送給所述兩個端側設備集群,以使所述兩個端側設備集群分別采用聯邦學習方式及采用預設的聯邦小樣本學習方式,對所述當前迭代輪的所述自然語言模型進行協同微調,得到下一迭代輪的所述自然語言模型;
d、云端服務器確定經過所述協同微調的迭代輪數量是否小于設定的迭代輪閾值,如果是,返回步驟c執行,如果否,執行步驟e;
e、云端服務器計算所述下一迭代輪的所述自然語言模型的目標結果精確率是否小于預設的精確率閾值,如果是,將所述下一迭代輪的所述自然語言模型作為微調后的所述自然語言模型,如果否,返回步驟a繼續執行。
2.如權利要求1所述的方法,其特征在于,在所述步驟a之前,還包括得到至少一增強策略的過程:
云端服務器將初始化的所述自然語言模型發送給隨機選取的兩個端側設備集群,以使所述隨機選取的兩個端側設備集群分別采用聯邦學習方式及預設的聯邦小樣本學習方式,對所述初始化的所述自然語言模型進行預設數量的迭代輪的微調;
對于每一迭代輪,對比經過所述隨機選取的兩個端側設備集群微調的所述初始化的所述自然語言模型,選擇具有高目標結果精確率的所述初始化的所述自然語言模型;
將預設數量的迭代輪的所述選擇的所述初始化的所述自然語言模型,基于具有的目標結果精確率進行從高到低的順序排列后,根據設定個數的排序高的所述選擇的所述初始化的所述自然語言模型,分別建立對應的增強策略;
步驟a所述的云端服務器選擇一增強策略為排序最高的所述建立的增強策略、或者任一排序高的所述建立的增強策略。
3.如權利要求1或2所述的方法,其特征在于,步驟a所述的云端服務器選擇一增強策略包括:自然語言模型的相關超參數;
所述相關超參數包括:協同微調的端側設備范圍及數量、以及協同微調的各個端側設備采用的訓練數據數量中的一項或多項組合;
所述預設的聯邦小樣本學習方式為:基于偽標簽方式及提示學習方式進行融合的聯邦小樣本學習方式。
4.如權利要求3所述的方法,其特征在于,在執行所述步驟e之前,還包括:
云端服務器計算每一所述迭代輪的所述自然語言模型的數據增強效率值,判斷設定數值的迭代輪的所述數據增強效率值的下降率是否超過預設的下降閾值,如果是,返回步驟a執行;如果否,執行步驟e。
5.如權利要求3所述的方法,其特征在于,所述以使所述兩個端側設備集群分別采用聯邦學習方式及采用預設的聯邦小樣本學習方式,對所述自然語言模型進行當前迭代輪的協同微調,得到下一迭代輪的所述自然語言模型包括:
在當前迭代輪,對于所述兩個端側設備集群的每一集群中的至少一端側設備,對接收的所述自然語言模型采用對應的聯邦學習方式或預設的聯邦小樣本學習方式進行微調后,將得到的局部模型參數返回給所述云端服務器;
所述云端服務器不斷聚合所述端側設備發送的局部模型參數,不斷得到全局模型參數,基于全局模型參數不斷更新所述自然語言模型,再次發送給所述兩個端側設備集群的每一集群中的至少一端側設備,進行更新后的自然語言模型的微調,直到當前迭代輪結束。
6.如權利要求3所述的方法,其特征在于,所述以使所述兩個端側設備集群分別采用聯邦學習方式及采用預設的聯邦小樣本學習方式,對所述自然語言模型進行當前迭代輪的協同微調,得到下一迭代輪的所述自然語言模型包括:
對于所述兩個端側設備集群的每一集群中的至少一端側設備,設置自身的樣本過濾器,對自身樣本經過所述樣本過濾器過濾后,輸入到所述自然語言模型進行微調。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310208694.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種無接觸式智能醫療垃圾桶
- 下一篇:一種PCB盲槽產品及其制作方法





