[發(fā)明專利]異質集成模型篩選方法和電子設備有效
| 申請?zhí)枺?/td> | 202110738688.3 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113407680B | 公開(公告)日: | 2023-06-02 |
| 發(fā)明(設計)人: | 李龍威;簡仁賢;馬永寧 | 申請(專利權)人: | 竹間智能科技(上海)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F18/21;G06F18/241;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 鐘揚飛 |
| 地址: | 200030 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 集成 模型 篩選 方法 電子設備 | ||
本申請?zhí)峁┝艘环N異質集成模型篩選方法和電子設備,其中,該方法包括:根據(jù)待選模型集中的各個待選模型的預測得分,分別確定任意兩個待選模型的初始相關系數(shù);根據(jù)該初始相關系數(shù),從該待選模型集中篩選出包含指定數(shù)量的目標模型的目標模型集。能夠提高模型篩選的效率。
技術領域
本申請涉及機器學習技術領域,具體而言,涉及一種異質集成模型篩選方法和電子設備。
背景技術
集成模型是指將多個目標模型通過特定的組合方式組成一個模型。當集成模型中的多個目標模型是基于不同的算法時,則該集成模型可以被稱為異質集成模型,例如,在做文本分類時,將textcnn(卷積文本分類)、cbow(詞袋模型)等不同算法組合成一個模型,則該集成模型可以被稱為是異質集成模型。
針對異質集成模型中的目標模型的選取方式有:基于相關技術人員的經(jīng)驗,人工篩選出多個目標模型;或者將能夠獲得的所有已訓練好的目標模型。上述兩種方式,如果備選的目標模型有很多時,可能會存在人工工作量較大,或者異質集成模型的計算量較大的問題。
發(fā)明內容
有鑒于此,本申請實施例的目的在于提供一種異質集成模型篩選方法和電子設備。能夠緩解異質集成篩選遇到的問題。
第一方面,本申請實施例提供了一種異質集成模型篩選方法,包括:
根據(jù)待選模型集中的各個待選模型的預測得分,分別確定任意兩個待選模型的初始相關系數(shù);
根據(jù)所述初始相關系數(shù),從所述待選模型集中篩選出包含指定數(shù)量的目標模型的目標模型集。
在一可選的實施方式中,所述方法還包括:
使用訓練數(shù)據(jù)集對初始待選模型進行訓練,獲得到待選模型集;
使用驗證數(shù)據(jù)集對所述待選模型集中的待選模型進行驗證,獲得到各個所述待選模型的預測得分。
在一可選的實施方式中,在所述使用訓練數(shù)據(jù)集對初始待選模型進行訓練,獲得到待選模型集之前,所述方法還包括:
將目標數(shù)據(jù)集按照預設比例劃分成訓練數(shù)據(jù)集和驗證數(shù)據(jù)集。
在一可選的實施方式中,所述使用驗證數(shù)據(jù)集對所述待選模型集中的待選模型進行驗證,獲得到各個所述待選模型的預測得分,包括:
使用驗證數(shù)據(jù)集中的第j條樣本驗證第i個待選模型,獲得到所述第i個待選模型對第j條樣本的多個標簽的預測得分;
根據(jù)所述第j條樣本的標注標簽的預測得分,確定出所述第i個待選模型對第j條樣本的預測得分;
重復上述兩個步驟,直到所述驗證數(shù)據(jù)集中的所有樣本被所述待選模型集中的所有待選模型驗證完成。
在一可選的實施方式中,所述根據(jù)所述初始相關系數(shù),從所述待選模型集中篩選出包含指定數(shù)量的目標模型的目標模型集,包括:
根據(jù)所述初始相關系數(shù)從所述待選模型集中篩選出第一指定數(shù)量的目標模型;
根據(jù)第一指定數(shù)量的所述目標模型,構建初始集成模型;
確定出所述初始集成模型的中間預測得分;
根據(jù)所述中間預測得分以及所述待選模型集中的除所述第一指定數(shù)量的目標模型外的待選模型的預測得分,確定出所述待選模型集中的除了所述第一指定數(shù)量的目標模型外的待選模型與所述初始集成模型的中間相關系數(shù);
根據(jù)所述中間相關系數(shù),從所述待選模型集中除所述第一指定數(shù)量的目標模型外的待選模型中篩選出第二指定數(shù)量的目標模型,以得到目標模型集,其中,所述第一指定數(shù)量與所述第二指定數(shù)量之和等于指定數(shù)量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于竹間智能科技(上海)有限公司,未經(jīng)竹間智能科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110738688.3/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





