[發明專利]文本分類方法、裝置、設備及存儲介質有效
| 申請號: | 202010162814.0 | 申請日: | 2020-03-10 |
| 公開(公告)號: | CN111444340B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 王興光;薛強;李鵬 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/335;G06F16/9535 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 賈允 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 分類 方法 裝置 設備 存儲 介質 | ||
本申請公開了一種文本分類方法、裝置、設備及存儲介質,該方法包括:獲取待分類文本;將該待分類文本輸入到分類模型進行分類處理,得到待分類文本的預測結果,該分類模型包括多個不同的向量提取模型和與每個向量提取模型一一對應的輸出子模型,每個向量提取模型用于從待分類文本中提取不同的融合詞向量,輸出子模型用于對融合詞向量進行分類得到預測結果,該預測結果包括多個標簽種類。該技術方案由于使用了多個不同的向量提取模型,能夠更全面地提取待分類文本地文本信息,并通過輸出子模型對多個融合詞向量進行分類以得到預測結果,使得能夠對待分類文本的多標簽的分類結果準確度更高。
技術領域
本發明一般涉及自然語言處理技術領域,具體涉及一種文本分類方法、裝置、設備及存儲介質。
背景技術
隨著網絡信息技術的不斷發展,互聯網上在線文本信息數量急劇增加,為了從海量信息中分析用戶感興趣的內容,需要對文本信息進行處理,其中,文本分類是處理較大規模文本信息的關鍵技術,在信息處理中起著至關重要的作用,文本分類是對文本數據按照一定的分類體系或標準進行自動分類,得到一個或多個對應的標簽。
目前,傳統技術的文本分類方法可以是基于深度學習的CNN模型,通過使用不同長度卷積核的卷積神經網絡提取文本信息,對提取的各個文本信息進行拼接,將拼接后的文本信息通過多個全連接層以得到對應的分類結果。
然而,相關技術中對文本數據的提取不夠全面,且得到的分類結果準確度低。
發明內容
鑒于現有技術中的上述缺陷或不足,期望提供一種文本分類方法、裝置、設備及存儲介質,能夠全面的提取文本數據,并提高了文本分類的準確性。
第一方面,本申請實施例提供了一種文本分類方法,該方法包括:
獲取待分類文本;
將待分類文本輸入到分類模型,得到待分類文本的預測結果進行分類處理,該分類模型包括多個不同的向量提取模型和每個向量提取模型一一對應的輸出子模型,每個向量提取模型用于從待分類文本中提取不同的融合詞向量,輸出子模型用于對融合詞向量進行分類得到預測結果,該預測結果包括多個標簽種類。
第三方面,本申請提供了一種文本分類裝置,該裝置包括:
獲取模塊,用于獲取待分類文本;
處理模塊,用于將待分類文本輸入到分類模型進行分類處理,得到待分類文本的預測結果,分類模型包括多個不同的向量提取模型和與每個向量提取模型一一對應的輸出子模型,每個向量提取模型用于從待分類文本中提取不同的融合詞向量,輸出子模型用于對融合詞向量進行分類得到預測結果,預測結果包括多個標簽種類。
第五方面,本申請實施例提供一種設備,包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,該處理器執行該程序時實現如上述第一方面的文本分類方法。
第六方面,本申請實施例提供一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序用于實現如上第一方面的文本分類方法。
本申請實施例中提供的文本分類方法、裝置、設備及存儲介質,通過獲取待分類文本,并將分類文本輸入到分類模型進行分類處理,得到待分類文本的預測結果,該分類模型包括多個不同的向量提取模型和與每個向量提取模型一一對應的輸出子模型,其中,每個向量提取模型用于從待分類文本中提取不同的融合詞向量,輸出子模型用于對融合詞向量進行分類得到多個標簽種類的預測結果。該技術方案由于使用了多個不同的向量提取模型,能夠提取到多個不同的融合詞向量,從而更全面地提取待分類文本的文本信息,并通過輸出子模型對多個融合詞向量進行分類以得到預測結果,使得能夠對待分類文本的多標簽的分類結果準確度更高。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010162814.0/2.html,轉載請聲明來源鉆瓜專利網。





