[發明專利]用于文本分類的方法及裝置、電子設備、存儲介質在審
| 申請號: | 202110800737.1 | 申請日: | 2021-07-15 |
| 公開(公告)號: | CN113420138A | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 李嘉琛;付驍弈 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/35;G06F40/194;G06F40/242 |
| 代理公司: | 北京康盛知識產權代理有限公司 11331 | 代理人: | 陶俊潔 |
| 地址: | 200000 上海市徐匯區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 文本 分類 方法 裝置 電子設備 存儲 介質 | ||
1.一種用于文本分類的方法,其特征在于,包括:
獲取待分類文本;所述待分類文本包括多個待分類文本子句;
利用預設的關鍵詞詞典從各所述待分類文本子句中查詢出文本類型標簽對應的關鍵詞;所述關鍵詞詞典中存儲有關鍵詞與文本類型標簽之間的對應關系;
根據所述關鍵詞確定所述待分類文本對應的分類標簽;
確定各所述待分類文本子句與所述分類標簽之間的關聯評分;
根據各所述關聯評分確定所述待分類文本的分類結果及分類依據。
2.根據權利要求1所述的方法,其特征在于,根據所述關鍵詞確定所述待分類文本對應的分類標簽,包括:
將所述關鍵詞對應的文本類型標簽確定為所述待分類文本對應的分類標簽。
3.根據權利要求1所述的方法,其特征在于,確定各所述待分類文本子句與所述分類標簽之間的關聯評分,包括:
只存在一個分類標簽的情況下,獲取各所述待分類文本子句中查詢出的關鍵詞第一數量,獲取各所述待分類文本子句的長度;根據第一預設算法利用各所述關鍵詞第一數量和各所述長度進行計算,獲得各所述待分類文本子句與所述分類標簽之間的關聯評分;或,
存在多個分類標簽的情況下,分別獲取各所述待分類文本子句中各所述分類標簽對應的關鍵詞第二數量,分別獲取各所述待分類文本子句的長度;根據所述第一預設算法利用各所述關鍵詞第二數量和各所述長度進行計算,獲得各所述待分類文本子句與各所述分類標簽之間的關聯評分。
4.根據權利要求1所述的方法,其特征在于,根據各所述關聯評分確定所述待分類文本的分類依據,包括:
將最高的關聯評分對應的待分類文本子句確定為所述待分類文本的分類依據;或,
根據第二預設算法利用所述關聯評分進行迭代計算,獲得各所述待分類文本子句的迭代分數;根據所述迭代分數確定所述待分類文本的分類依據。
5.根據權利要求4所述的方法,其特征在于,根據所述迭代分數確定所述待分類文本的分類依據,包括:
將迭代分數最高的待分類文本子句確定為所述待分類文本的分類依據。
6.根據權利要求1至5任一項所述的方法,其特征在于,根據各所述關聯評分確定所述待分類文本的分類結果,包括:
將最高的關聯評分對應的分類標簽確定為所述待分類文本的分類結果。
7.一種用于文本分類的裝置,其特征在于,包括:
獲取模塊,被配置為獲取待分類文本;所述待分類文本包括多個待分類文本子句;
查詢模塊,被配置為利用預設的關鍵詞詞典從各所述待分類文本子句中查詢出文本類型標簽對應的關鍵詞;所述關鍵詞詞典中存儲有關鍵詞與文本類型標簽之間的對應關系;
第一確定模塊,被配置為根據所述關鍵詞確定所述待分類文本對應的分類標簽;
第二確定模塊,被配置為確定各所述待分類文本子句與所述分類標簽之間的關聯評分;
第三確定模塊,被配置為根據各所述關聯評分確定所述待分類文本的分類結果及分類依據。
8.一種用于文本分類的裝置,包括處理器和存儲有程序指令的存儲器,其特征在于,所述處理器被配置為在運行所述程序指令時,執行如權利要求1至6任一項所述的方法。
9.一種電子設備,其特征在于,包括如權利要求8所述的用于文本分類的裝置。
10.一種存儲介質,存儲有程序指令,其特征在于,所述程序指令在運行時,執行如權利要求1至6任一項所述的用于文本分類的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110800737.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:扭矩放大器行星架
- 下一篇:一種海上風電裝配式鋼結構風機承臺





