[發明專利]學生模型訓練方法、裝置、設備、介質和程序產品有效
| 申請號: | 202011506263.1 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112508120B | 公開(公告)日: | 2023-10-10 |
| 發明(設計)人: | 楊喜鵬;譚嘯;孫昊 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 學生 模型 訓練 方法 裝置 設備 介質 程序 產品 | ||
1.一種學生模型訓練方法,包括:
獲取圖像訓練樣本輸入至學生模型后得到的學生特征數據;
獲取所述圖像訓練樣本輸入至訓練好的教師模型后得到的教師特征數據;所述教師特征數據與所述學生特征數據相關聯;
根據所述學生特征數據,確定目標權重數據;
根據所述學生特征數據、所述教師特征數據和所述目標權重數據,指導對所述學生模型的后續訓練。
2.根據權利要求1所述的方法,其中,所述根據所述學生特征數據,確定目標權重數據,包括:
根據所述學生特征數據和所述教師特征數據,確定目標權重數據。
3.根據權利要求2所述的方法,其中,所述根據所述學生特征數據和所述教師特征數據,確定目標權重數據,包括:
根據所述學生特征數據,確定所述學生模型的學生權重數據;
根據所述教師特征數據,確定所述教師模型的教師權重數據;
根據所述學生權重數據和所述教師權重數據,確定所述目標權重數據。
4.根據權利要求3所述的方法,其中,所述學生權重數據和所述教師權重數據為相同屬性的權重數據。
5.根據權利要求3所述的方法,其中,所述學生權重數據為通道權重數據、空間權重數據或混合權重數據;
所述教師權重數據為通道權重數據、空間權重數據或混合權重數據。
6.根據權利要求4所述的方法,其中,所述根據所述學生權重數據和所述教師權重數據,確定所述目標權重數據,包括:
根據所述學生權重數據和所述教師權重數據的加權均值,確定所述目標權重數據。
7.根據權利要求4所述的方法,若所述學生權重數據包括至少兩個不同屬性的權重數據;相應的,所述教師權重數據包括至少兩個相應屬性的權重數據;則所述根據所述學生權重數據和所述教師權重數據,確定所述目標權重數據,包括:
針對每組相同屬性的學生權重數據和教師權重數據,分別確定候選權重數據;
根據各所述候選權重數據,確定所述目標權重數據。
8.根據權利要求7所述的方法,其中,所述根據各所述候選權重數據,確定所述目標權重數據,包括:
分別對各所述候選權重數據進行重構,以使各所述候選權重數據的矩陣大小一致;根據重構后的各所述候選權重數據的加權均值,確定所述目標權重數據;
或者,
將各所述候選權重數據相乘,得到目標權重數據;其中,所述目標權重數據與所述學生特征數據矩陣大小一致。
9.根據權利要求1所述的方法,若所述目標權重數據至少兩個屬性的權重數據,則所述根據所述學生特征數據、所述教師特征數據和所述目標權重數據,指導對所述學生模型的后續訓練,包括:
根據至少兩個屬性的目標權重數據,生成綜合權重數據;
根據所述學生特征數據、所述教師特征數據和所述綜合權重數據,指導對所述學生模型的后續訓練。
10.根據權利要求9所述的方法,其中,所述根據至少兩個屬性的目標權重數據,生成綜合權重數據,包括:
分別對各所述目標權重數據進行重構,以使各所述目標權重數據的矩陣大小一致;根據重構后的各所述目標權重數據的加權均值,確定所述綜合權重數據;
或者,
將各所述目標權重數據相乘,得到所述綜合權重數據;其中,所述綜合權重數據與所述學生特征數據矩陣大小一致。
11.根據權利要求1-10任一項所述的方法,其中,所述根據所述學生特征數據、所述教師特征數據和所述目標權重數據,指導對所述學生模型的后續訓練,包括:
確定所述學生特征數據和所述教師特征數據之間的特征距離;
根據所述目標權重數據和所述特征距離,確定目標損失;
根據所述目標損失,指導對所述學生模型的后續訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011506263.1/1.html,轉載請聲明來源鉆瓜專利網。





