[發明專利]模型訓練、詞條分類方法、裝置、設備、存儲介質及程序有效
| 申請號: | 202110474693.8 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113190154B | 公開(公告)日: | 2023-10-13 |
| 發明(設計)人: | 黃雪原;張錚 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F3/0484 | 分類號: | G06F3/0484;G06F16/35;G06F40/279 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張芳;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 詞條 分類 方法 裝置 設備 存儲 介質 程序 | ||
1.一種分類模型的訓練方法,包括:
獲取預設的多個對象類別,以及所述多個對象類別中不同對象類別之間的交集關系,具有交集關系的不同對象類別所指示的對象中存在重疊部分;
根據所述多個對象類別中不同對象類別之間的交集關系,以及所述多個對象類別對應的訓練樣本,進行子模型訓練,得到所述分類模型;其中,所述分類模型包括多個所述子模型,具有交集關系的對象類別所對應的子模型不同。
2.根據權利要求1所述的方法,其中,根據所述多個對象類別中不同對象類別之間的交集關系,以及所述多個對象類別對應的訓練樣本,進行子模型訓練,得到所述分類模型,包括:
針對第i個對象類別,在i取值為1時,在所述分類模型中生成新的子模型,將所述新的子模型作為所述第i個對象類別對應的待訓練子模型;
在所述i依次取2、.....、N時,根據所述多個對象類別中不同對象類別之間的交集關系,確定第i個對象類別對應的待訓練子模型,所述N為所述多個對象類別中對象類別的數量;
根據所述第i個對象類別對應的訓練樣本,對所述第i個對象類別對應的待訓練子模型進行訓練,得到所述第i個對象類別對應的子模型。
3.根據權利要求2所述的方法,其中,根據所述多個對象類別中不同對象類別之間的交集關系,確定第i個對象類別對應的待訓練子模型,包括:
從前i-1個對象類別中獲取與所述第i個對象類別具有交集關系的參考對象類別;
根據所述參考對象類別對應的子模型,確定所述第i個對象類別對應的待訓練子模型,所述第i個對象類別對應的待訓練子模型與所述參考對象類別對應的子模型不同。
4.根據權利要求3所述的方法,其中,根據所述參考對象類別對應的子模型,確定所述第i個對象類別對應的待訓練子模型,包括:
將所述分類模型當前包括的子模型中,除所述參考對象類別對應的子模型之外的其余子模型,作為候選子模型;
根據所述候選子模型的數量,確定所述第i個對象類別對應的待訓練子模型。
5.根據權利要求4所述的方法,其中,根據所述候選子模型的數量,確定所述第i個對象類別對應的待訓練子模型,包括:
若所述候選子模型的數量等于1,則將所述候選子模型確定為所述第i個對象類別對應的待訓練子模型;或者,
若所述候選子模型的數量大于1,則獲取各候選子模型分別對應的對象類別的數量,并將最大數量對應的候選子模型,確定為所述第i個對象類別對應的待訓練子模型;或者,
若所述候選子模型的數量等于零,則在所述分類模型中生成新的子模型,將所述新的子模型作為所述第i個對象類別對應的待訓練子模型。
6.根據權利要求2至5任一項所述的方法,其中,根據所述第i個對象類別對應的訓練樣本,對所述第i個對象類別對應的待訓練子模型進行訓練,得到所述第i個對象類別對應的子模型,包括:
獲取多個第一訓練樣本,以及多個第二訓練樣本;其中,所述第一訓練樣本的人工標注類別為所述第i個對象類別,所述第二訓練樣本的人工標注類別為與所述第i個對象類別具有交集關系的對象類別;
根據所述多個第一訓練樣本和所述多個第二訓練樣本,對所述第i個對象類別對應的待訓練子模型進行訓練,得到所述第i個對象類別對應的子模型。
7.根據權利要求6所述的方法,其中,根據所述多個第一訓練樣本和所述多個第二訓練樣本,對所述第i個對象類別對應的待訓練子模型進行訓練,得到所述第i個對象類別對應的子模型,包括:
獲取所述第i個對象類別對應的待訓練子模型的訓練數據集,所述訓練數據集中包括所述多個對象類別對應的初始樣本;
將所述多個第一訓練樣本替換掉所述訓練數據集中的所述第i個對象類別對應的初始樣本;
將所述多個第二訓練樣本替換掉所述訓練數據集中的與所述第i個對象類別具有交集關系的對象類別對應的初始樣本;
利用替換后的所述訓練數據集,對所述第i個對象類別對應的待訓練子模型進行訓練,得到所述第i個對象類別對應的子模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110474693.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種抗惡劣環境的干式變壓器
- 下一篇:一種心內科用聽診器





