[發明專利]文本分類方法、裝置、計算機設備和介質在審
| 申請號: | 202011389826.3 | 申請日: | 2020-12-01 |
| 公開(公告)號: | CN112445914A | 公開(公告)日: | 2021-03-05 |
| 發明(設計)人: | 趙婧;王健宗;程寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/335;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市力道知識產權代理事務所(普通合伙) 44507 | 代理人: | 張傳義 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 分類 方法 裝置 計算機 設備 介質 | ||
1.一種文本分類方法,其特征在于,包括:
獲取待分類文本,對所述待分類文本進行項集挖掘,得到所述待分類文本對應的高效用項集,其中,所述高效用項集包括至少兩個詞組;
對所述高效用項集中的每個詞組進行向量化,得到所述待分類文本對應的詞向量矩陣;
將所述詞向量矩陣輸入文本分類模型中進行分類預測,得到所述待分類文本對應的文本類別。
2.根據權利要求1所述的文本分類方法,其特征在于,所述對所述待分類文本進行項集挖掘,得到所述待分類文本對應的高效用項集,包括:
對所述待分類文本進行分詞處理,得到所述待分類文本對應的多個詞組;
對所述多個詞組進行組合,得到所述待分類文本對應的多個項集;
確定每個所述項集對應所述待分類文本的效用值,將對應的效用值不小于預設效用閾值的項集,確定為所述待分類文本對應的所述高效用項集。
3.根據權利要求2所述的文本分類方法,其特征在于,所述對所述待分類文本進行分詞處理,得到所述待分類文本對應的多個詞組,包括:
基于預設的分詞庫,對所述待分類文本中的每個語句進行分詞處理,得到所述待分類文本對應的多個所述詞組;
所述對所述待分類文本進行分詞處理,得到所述待分類文本對應的多個詞組之后,還包括:
基于預設的停用詞庫,對多個所述詞組進行過濾處理,得到過濾處理后的多個所述詞組。
4.根據權利要求2所述的文本分類方法,其特征在于,所述確定每個所述項集對應所述待分類文本的效用值,包括:
將每個所述項集中每個所述詞組在所述待分類文本的每個語句中出現的次數,確定為每個所述詞組對應每個所述語句的第一效用值;
將每個所述項集中的各個詞組對應各個所述語句的第一效用值之和,確定為每個所述項集對應每個所述語句的第二效用值;
將每個所述項集對應各個所述語句的第二效用值之和,確定為每個所述項集對應所述待分類文本的所述效用值。
5.根據權利要求1所述的文本分類方法,其特征在于,所述對所述高效用項集中的每個詞組進行向量化,得到所述待分類文本對應的詞向量矩陣,包括:
從區塊鏈中獲取詞向量模型;
將每個所述詞組輸入所述詞向量模型進行向量化,得到所述待分類文本對應的所述詞向量矩陣。
6.根據權利要求1所述的文本分類方法,其特征在于,所述文本分類模型包括卷積層、池化層、全連接層以及歸一化層;所述將所述詞向量矩陣輸入文本分類模型中進行分類預測,得到所述待分類文本對應的文本類別,包括:
將所述詞向量矩陣輸入所述卷積層中進行卷積處理,得到所述詞向量矩陣對應的特征圖像;
將所述特征圖像輸入所述池化層進行池化處理,得到池化處理后的所述特征圖像;
將池化處理后的所述特征圖像輸入所述全連接層進行進行全連接處理,并通過所述歸一化層對全連接處理的結果進行歸一化處理,得到所述待分類文本對應的文本類別。
7.根據權利要求1所述的文本分類方法,其特征在于,所述將所述詞向量矩陣輸入文本分類模型中進行分類預測之前,還包括:
獲取預設數量的原始文本對應的高效用項集的詞向量矩陣,并根據所述原始文本對應的真實類別對每個詞向量矩陣進行類別標注,將類別標注后的所述詞向量矩陣作為訓練樣本;
將所述訓練樣本輸入所述文本分類模型中進行分類訓練,得到所述訓練樣本對應的預測類別;
基于預設的損失函數,根據所述訓練樣本對應的預測類別以及所述訓練樣本對應的真實類別,計算損失函數值;
基于預設的梯度下降算法,根據所述損失函數值調整所述文本分類模型中的參數并進行下一輪訓練,直至得到的損失函數值小于預設損失閾值時,結束訓練,得到訓練后的所述文本分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011389826.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:抗油抗鹽起泡劑
- 下一篇:一種電動汽車限速控制方法、裝置及介質





