[發明專利]一種非均衡樣本的分類方法、裝置、設備及存儲介質有效
| 申請號: | 202011617671.4 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112732913B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 陳昊 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/36;G06F18/214;G06F18/22 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 均衡 樣本 分類 方法 裝置 設備 存儲 介質 | ||
1.一種非均衡樣本的分類方法,其特征在于,包括:
從預設的語料庫獲取訓練語料,其中,所述訓練語料包括第一訓練語料和第二訓練語料,所述第一訓練語料為少數類訓練語料,所述第二訓練語料為多數類訓練語料;
通過所述第一訓練語料對預設的第一分類模型進行訓練,得到初始第一分類模型;
基于預設調整規則對所述初始第一分類模型的損失函數進行調整,將所述第二訓練語料導入損失函數調整后的所述初始第一分類模型,并基于反向傳播算法對初始第一分類模型進行迭代更新,得到第一分類模型;
接收語料分類指令,獲取與所述語料分類指令相對應的待分類語料,并通過所述第一分類模型對所述待分類語料進行分類;
所述訓練語料的語種類型為第一語種,在所述從預設的語料庫獲取訓練語料的步驟之后,還包括:
計算所述第一訓練語料和所述第二訓練語料的語料相似度,并比對所述語料相似度與預設相似度閾值的大小;
若所述語料相似度大于或等于預設相似度閾值,則將所述訓練語料翻譯為第二語種,其中,在所述第二語種的語種環境下,所述第一訓練語料和所述第二訓練語料的語料相似度小于預設相似度閾值;
基于預設調整規則對所述初始第一分類模型的損失函數進行調整,將所述第二訓練語料導入損失函數調整后的所述初始第一分類模型,并基于反向傳播算法對初始第一分類模型進行迭代更新,得到第一分類模型的步驟,具體包括:
基于預設調整規則對所述初始第一分類模型的損失函數進行反轉,得到第二損失函數;
將所述第二訓練語料導入損失函數反轉后的所述初始第一分類模型,獲取分類結果;
基于第二損失函數計算所述分類結果與預設分類結果的誤差,得到分類誤差;
將分類誤差與預設分類誤差閾值進行比較,若分類誤差小于或等于預設分類誤差閾值,則通過反向傳播算法對損失函數反轉后的初始第一分類模型進行迭代更新,直到分類誤差大于預設分類誤差閾值為止;
輸出分類誤差大于預設分類誤差閾值的第一分類模型;
所述基于預設調整規則對所述初始第一分類模型的損失函數進行反轉,得到第二損失函數,具體包括:
使用數值1減去所述初始第一分類模型的損失函數,得到所述第二損失函數。
2.如權利要求1所述的非均衡樣本的分類方法,其特征在于,所述預設的第一分類模型為包括編碼層和解碼層,所述通過所述第一訓練語料對預設的第一分類模型進行訓練,得到初始第一分類模型的步驟,具體包括:
通過所述編碼層提取所述第一訓練語料的語料特征,并對所述語料特征進行矢量編碼,得到特征矢量;
將所述特征矢量與預先存儲在所述解碼層中的特征標簽進行特征映射,獲取特征映射結果;
基于所述特征映射結果對所述預設的第一分類模型進行迭代,得到初始第一分類模型。
3.如權利要求2所述的非均衡樣本的分類方法,其特征在于,所述基于所述特征映射結果對所述預設的第一分類模型進行迭代,得到初始第一分類模型的步驟,具體包括:
構建所述初始第一分類模型的損失函數,得到第一損失函數,其中,所述第一損失函數包含對抗因子;
基于第一損失函數計算所述特征映射結果與預設映射結果的誤差,得到映射誤差;
基于所述映射誤差和反向傳播算法對所述預設的第一分類模型進行迭代,得到初始第一分類模型。
4.如權利要求2所述的非均衡樣本的分類方法,其特征在于,在所述基于預設調整規則對所述初始第一分類模型的損失函數進行調整,將所述第二訓練語料導入損失函數調整后的所述初始第一分類模型,并基于反向傳播算法對初始第一分類模型進行迭代更新,得到第一分類模型的步驟之后,還包括:
對所述第一訓練語料進行矢量化處理,得到所述第一訓練語料的語料矢量;
對所述語料矢量和所述特征矢量進行矢量拼接,得到語料特征矩陣;
將所述語料特征矩陣導入預設的第二分類模型,通過所述第二分類模型的卷積核對所述語料特征矩陣進行卷積運算,獲取卷積運算結果;
基于所述卷積運算結果對所述第二分類模型進行迭代更新,輸出訓練完成的所述第二分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011617671.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種隱藏式旋扭及開關、鎖具
- 下一篇:一種液壓破碎錘活塞環改進工藝





