[發明專利]文本分類模型訓練、文本分類方法、裝置、設備及介質在審
| 申請號: | 202110961278.5 | 申請日: | 2021-08-20 |
| 公開(公告)號: | CN113641823A | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 張家銘 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 侯軍洋 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 分類 模型 訓練 方法 裝置 設備 介質 | ||
本公開提供了一種文本分類模型訓練、文本分類方法、裝置、設備及介質,涉及數據處理技術領域,進一步涉及深度學習和云計算等人工智能技術,包括:根據目標文本的歷史存儲關聯數據生成目標文本樣本數據;將第一目標文本樣本數據輸入至文本分類模型的第一文本分類器,得到第一目標文本分類結果;將第二目標文本樣本數據輸入至文本分類模型的第二文本分類器,得到第二目標文本分類結果;根據第一目標文本分類結果和第二目標文本分類結果確定目標文本樣本數據的目標文本分類結果,以對所述文本分類模型進行訓練。本公開實施例能夠提高文本分類模型的分類效果和泛化能力,從而提高文本分類模型的準確率,進而提高文本分類的準確率。
技術領域
本公開涉及數據處理技術領域,具體涉及深度學習和云計算等人工智能技術。
背景技術
人工智能(Artificial Intelligence,AI))是計算機科學的一個綜合技術,通過研究各種智能機器的設計原理與實現方法,使機器具有感知、推理與決策的功能。人工智能技術是一門綜合學科,涉及領域廣泛,例如自然語言處理技術以及機器學習/深度學習等幾大方向,隨著技術的發展,人工智能技術將在更多的領域得到應用,并發揮越來越重要的價值。文本分類模型是人工智能領域的重要應用之一,文本分類模型可以識別出文本所屬的類別。文本分類模型在新聞推薦、意圖識別系統等中都有廣泛的應用,即文本分類模型是這些復雜系統的基礎組件。
發明內容
本公開實施例提供了一種文本分類模型訓練、文本分類方法、裝置、設備及介質,提高文本分類模型的分類效果和泛化能力,從而提高文本分類模型的準確率,進而提高文本分類的準確率。
第一方面,本公開實施例提供了一種文本分類模型訓練方法,包括:
根據目標文本的歷史存儲關聯數據生成目標文本樣本數據;其中,所述目標文本樣本數據包括第一目標文本樣本數據和第二目標文本樣本數據;所述第二目標文本樣本數據屬于所述第一目標文本樣本數據的子集;
將所述第一目標文本樣本數據輸入至文本分類模型的第一文本分類器,得到第一目標文本分類結果;
將所述第二目標文本樣本數據輸入至文本分類模型的第二文本分類器,得到第二目標文本分類結果;
根據所述第一目標文本分類結果和所述第二目標文本分類結果確定所述目標文本樣本數據的目標文本分類結果,作為所述文本分類模型的訓練結果。
第二方面,本公開實施例提供了一種文本分類方法,包括:
獲取目標文本的目標文本待分類數據;
將所述目標文本待分類數據輸入至文本分類模型中,得到所述目標文本的分類結果;
其中,所述文本分類模型通過第一方面所述的文本分類模型訓練方法訓練得到。
第三方面,本公開實施例提供了一種文本分類模型訓練裝置,包括:
目標文本樣本數據生成模塊,用于根據目標文本的歷史存儲關聯數據生成目標文本樣本數據;其中,所述目標文本樣本數據包括第一目標文本樣本數據和第二目標文本樣本數據;所述第二目標文本樣本數據屬于所述第一目標文本樣本數據的子集;
第一目標文本分類結果獲取模塊,用于將所述第一目標文本樣本數據輸入至文本分類模型的第一文本分類器,得到第一目標文本分類結果;
第二目標文本分類結果獲取模塊,用于將所述第二目標文本樣本數據輸入至文本分類模型的第二文本分類器,得到第二目標文本分類結果;
目標文本分類結果獲取模塊,用于根據所述第一目標文本分類結果和所述第二目標文本分類結果確定所述目標文本樣本數據的目標文本分類結果,作為所述文本分類模型的訓練結果。
第四方面,本公開實施例提供了一種文本分類裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110961278.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種業務代碼提交方法、處理方法、裝置及電子設備
- 下一篇:一種電液控制單元





