[發明專利]分類模型訓練方法和裝置、分類方法和裝置在審
| 申請號: | 202210190043.5 | 申請日: | 2022-02-28 |
| 公開(公告)號: | CN114548307A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 李碩;王天祺;劉昊騁;田建;徐靖宇;徐世界 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 模型 訓練 方法 裝置 | ||
本公開提供了一種分類模型訓練方法和裝置,涉及大數據、機器學習等技術領域。具體實現方案為:基于分類建模任務,確定待構建模型的建模信息;基于建模信息,在歷史模型庫中選取至少一個預訓練模型;基于選取的樣本,得到預訓練模型的輸出結果;基于輸出結果和樣本,對待構建模型進行訓練,得到訓練完成的分類模型。該實施方式提升了分類模型分類效果。
技術領域
本公開涉及計算機技術領域,具體涉及大數據、機器學習等技術領域,尤其涉及一種分類模型訓練方法和裝置、分類方法和裝置、電子設備、計算機可讀存儲介質以及計算機程序產品。
背景技術
分類模型在建模時,可以采用將歷史樣本和本次建模樣本混合訓練的建模方式,該方式建模耗時長,且建模效果不佳;還可以采用目標樣本的建模方式,在這個方式中在目標樣本是一些小樣本的場景下,由于無法使用復雜算法,建模效果不佳。
發明內容
本公開提供了一種分類模型訓練方法和裝置、分類方法和裝置、電子設備、計算機可讀存儲介質以及計算機程序產品。
根據第一方面,提供了一種分類模型訓練方法,該方法包括:基于分類建模任務,確定待構建模型的建模信息;基于建模信息,在歷史模型庫中選取至少一個預訓練模型;基于選取的樣本,得到預訓練模型的輸出結果;基于輸出結果和樣本,對待構建模型進行訓練,得到訓練完成的分類模型。
根據第二方面,提供了一種分類方法,該方法包括:獲取待分類數據;將待分類數據輸入采用如第一方面任一實現方式描述的方法生成的分類模型中,輸出待分類數據的分類結果。
根據第三方面,提供了一種分類模型訓練裝置,該裝置包括:確定單元,被配置成基于分類建模任務,確定待構建模型的建模信息;選取單元,被配置成基于建模信息,在歷史模型庫中選取至少一個預訓練模型;得到單元,被配置成基于選取的樣本,得到預訓練模型的輸出結果;訓練單元,被配置成基于輸出結果和樣本,對待構建模型進行訓練,得到訓練完成的分類模型。
根據第四方面,又提供了一種分類裝置,該裝置包括:獲取單元,被配置成被配置成獲取待分類數據;輸入單元,被配置成將待分類數據輸入采用如第三方面任一實現方式描述的裝置生成的分類模型中,得到待分類數據的分類結果。
根據第五方面,提供了一種電子設備,該電子設備包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器,其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行如第一方面或第二方面任一實現方式描述的方法。
根據第六方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,計算機指令用于使計算機執行如第一方面或第二方面任一實現方式描述的方法。
根據第七方面,提供了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現如第一方面或第二方面任一實現方式描述的方法。
本公開的實施例提供的分類模型訓練方法和裝置,首先,基于分類建模任務,確定待構建模型的建模信息;其次,基于建模信息,在歷史模型庫中選取至少一個預訓練模型;再次,基于選取的樣本,得到預訓練模型的輸出結果;最后,基于輸出結果和樣本,對待構建模型進行訓練,得到訓練完成的分類模型。由此,將歷史模型庫中預訓練模型的輸出結果加入到新建的分類模型的特征池中,高效地利用了歷史樣本和歷史建模結果,提升了分類模型的分類效果。
本公開的實施例提供的分類方法和裝置,獲取待分類數據;將待分類數據輸入采用本實施例的分類模型訓練方法生成的分類模型中,得到待分類數據的分類結果。由此,采用分類模型訓練方法得到的分類模型進行分類,可以對待分類數據進行可靠的分類,保證了數據分類的有效性。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210190043.5/2.html,轉載請聲明來源鉆瓜專利網。





