[發明專利]基于人工智能的分類方法、裝置、終端和存儲介質有效
| 申請號: | 202010546795.1 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111708888B | 公開(公告)日: | 2023-10-24 |
| 發明(設計)人: | 劉志煌 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/284;G06F18/2411 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 分類 方法 裝置 終端 存儲 介質 | ||
本發明實施例公開了一種基于人工智能的分類方法、裝置、終端和存儲介質,其中,方法包括,獲取目標文本數據,并對目標文本數據進行分詞處理,得到至少一個分詞詞組,根據至少一個分詞詞組和類別特征詞庫檢測目標文本數據所屬的分類類別,當檢測到目標文本數據所屬至少兩個分類類別時,確定至少一個分詞詞組中每個分詞詞組的權重,以及確定每個分詞詞組的向量;基于每個分詞詞組的權重對所每個分詞詞組的向量進行處理,得到目標文本數據的向量;將目標文本數據的向量輸入至分類器中,得到針對目標文本數據的分類結果。通過實施上述方法,可以基于文本中不同詞組的權重以及向量確定文本所屬的類別,提升對于文本分類的準確性。
技術領域
本發明涉及計算機技術領域,尤其涉及一種基于人工智能的分類方法、裝置、終端和存儲介質。
背景技術
隨著網絡中不同類別的文本數據的與日俱增,碎片化的文本數據需要被歸類整理才能挖掘提取其中隱藏的有用信息,如對商戶的標簽文本進行分類后,則可知道每個商戶的產品類型,因此,對文本數據進行高效的分類具有極高的研究價值。
當前,針對文本數據進行分類處理的方式主要為基于關鍵詞匹配的方式對文本數據進行分類,即提取文本數據中的關鍵詞,并基于關鍵詞確定文本數據對應的類別,然而,由于文本數據中可能存在多個關鍵詞以及每個關鍵詞的重要性存在差異,因此很難從不同關鍵詞對應的多個類別中確定出文本數據對應的準確類別,導致對于文本數據的分類準確性較低。
發明內容
本發明實施例提供了一種基于人工智能的分類方法、裝置、終端和存儲介質,可以基于文本中不同詞組的權重構建文本向量,并基于文本向量確定文本的類別,提升對于文本分類的準確性。
一方面,本發明實施例提供了一種基于人工智能的分類方法,所述方法包括:
獲取目標文本數據,并對所述目標文本數據進行分詞處理,得到至少一個分詞詞組;
根據所述至少一個分詞詞組和類別特征詞庫檢測所述目標文本數據所屬的分類類別,其中,所述類別特征詞庫是根據多個訓練文本樣本集中各個訓練詞組的頻率信息確定每個分類類別的類別特征詞,并基于每個分類類別的類別特征詞構建的,每個訓練文本樣本集中包括至少一個訓練文本數據,并且不同的訓練文本樣本集對應不同的分類類別;
當檢測到所述目標文本數據所屬至少兩個分類類別時,確定所述至少一個分詞詞組中每個分詞詞組的權重,以及確定所述每個分詞詞組的向量;
基于所述每個分詞詞組的權重對所述每個分詞詞組的向量進行處理,得到所述目標文本數據的向量;
將所述目標文本數據的向量輸入至分類器中,得到針對所述目標文本數據的分類結果。
一方面,本發明實施例提供了一種基于人工智能的分類方法裝置,所述裝置包括:
獲取模塊,用于獲取目標文本數據;
處理模塊,用于對所述目標文本數據進行分詞處理,得到至少一個分詞詞組;
檢測模塊,用于根據所述至少一個分詞詞組和類別特征詞庫檢測所述目標文本數據所屬的分類類別,其中,所述類別特征詞庫是根據多個訓練文本樣本集中各個訓練詞組的頻率信息確定每個分類類別的類別特征詞,并基于每個分類類別的類別特征詞構建的,每個訓練文本樣本集中包括至少一個訓練文本數據,并且不同的訓練文本樣本集對應不同的分類類別;
確定模塊,用于當檢測到所述目標文本數據所屬至少兩個分類類別時,確定所述至少一個分詞詞組中每個分詞詞組的權重,以及確定所述每個分詞詞組的向量;
所述處理模塊,還用于基于所述每個分詞詞組的權重對所述每個分詞詞組的向量進行處理,得到所述目標文本數據的向量;
輸入模塊,用于將所述目標文本數據的向量輸入至分類器中,得到針對所述目標文本數據的分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010546795.1/2.html,轉載請聲明來源鉆瓜專利網。





