[發(fā)明專利]用于文本分類的方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110800737.1 | 申請(qǐng)日: | 2021-07-15 |
| 公開(公告)號(hào): | CN113420138A | 公開(公告)日: | 2021-09-21 |
| 發(fā)明(設(shè)計(jì))人: | 李嘉琛;付驍弈 | 申請(qǐng)(專利權(quán))人: | 上海明略人工智能(集團(tuán))有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/33;G06F16/35;G06F40/194;G06F40/242 |
| 代理公司: | 北京康盛知識(shí)產(chǎn)權(quán)代理有限公司 11331 | 代理人: | 陶俊潔 |
| 地址: | 200000 上海市徐匯區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 文本 分類 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,公開一種用于文本分類的方法,包括:獲取待分類文本;待分類文本包括多個(gè)待分類文本子句;利用預(yù)設(shè)的關(guān)鍵詞詞典從各待分類文本子句中查詢出文本類型標(biāo)簽對(duì)應(yīng)的關(guān)鍵詞;關(guān)鍵詞詞典中存儲(chǔ)有關(guān)鍵詞與文本類型標(biāo)簽之間的對(duì)應(yīng)關(guān)系;根據(jù)關(guān)鍵詞確定待分類文本對(duì)應(yīng)的分類標(biāo)簽;確定各待分類文本子句與分類標(biāo)簽之間的關(guān)聯(lián)評(píng)分;根據(jù)各關(guān)聯(lián)評(píng)分確定待分類文本的分類結(jié)果及分類依據(jù)。由于能夠確定出待分類文本的分類依據(jù),從而便于用戶根據(jù)分類依據(jù)對(duì)文本分類結(jié)果進(jìn)行校驗(yàn)。本申請(qǐng)還公開一種用于文本分類的裝置及電子設(shè)備、存儲(chǔ)介質(zhì)。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,例如涉及一種用于文本分類的方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)。
背景技術(shù)
得益于計(jì)算機(jī)技術(shù)的發(fā)展,用戶能夠獲取的信息越來越廣泛,數(shù)據(jù)量相應(yīng)地也愈發(fā)龐大,為了更加高效快捷的獲取實(shí)際所需的目標(biāo)數(shù)據(jù),需要對(duì)海量的數(shù)據(jù)進(jìn)行處理,比如,對(duì)文本進(jìn)行分類。現(xiàn)有技術(shù)通常通過訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型作為文本分類器直接輸出文本的分類結(jié)果。
在實(shí)現(xiàn)本公開實(shí)施例的過程中,發(fā)現(xiàn)相關(guān)技術(shù)中至少存在如下問題:現(xiàn)有技術(shù)中在對(duì)文本進(jìn)行分類時(shí),由于文本分類器直接輸出分類結(jié)果,缺乏文本的分類依據(jù),導(dǎo)致不便于用戶對(duì)文本分類結(jié)果進(jìn)行校驗(yàn)。
發(fā)明內(nèi)容
為了對(duì)披露的實(shí)施例的一些方面有基本的理解,下面給出了簡單的概括。所述概括不是泛泛評(píng)述,也不是要確定關(guān)鍵/重要組成元素或描繪這些實(shí)施例的保護(hù)范圍,而是作為后面的詳細(xì)說明的序言。
本公開實(shí)施例提供了一種用于文本分類的方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì),以能夠便于用戶對(duì)文本分類結(jié)果進(jìn)行校驗(yàn)。
在一些實(shí)施例中,所述用于文本分類的方法,包括:獲取待分類文本;所述待分類文本包括多個(gè)待分類文本子句;利用預(yù)設(shè)的關(guān)鍵詞詞典從各所述待分類文本子句中查詢出文本類型標(biāo)簽對(duì)應(yīng)的關(guān)鍵詞;所述關(guān)鍵詞詞典中存儲(chǔ)有關(guān)鍵詞與文本類型標(biāo)簽之間的對(duì)應(yīng)關(guān)系;根據(jù)所述關(guān)鍵詞確定所述待分類文本對(duì)應(yīng)的分類標(biāo)簽;確定各所述待分類文本子句與所述分類標(biāo)簽之間的關(guān)聯(lián)評(píng)分;根據(jù)各所述關(guān)聯(lián)評(píng)分確定所述待分類文本的分類結(jié)果及分類依據(jù)。
在一些實(shí)施例中,所述用于文本分類的裝置包括:獲取模塊,被配置為獲取待分類文本;所述待分類文本包括多個(gè)待分類文本子句;查詢模塊,被配置為利用預(yù)設(shè)的關(guān)鍵詞詞典從各所述待分類文本子句中查詢出文本類型標(biāo)簽對(duì)應(yīng)的關(guān)鍵詞;所述關(guān)鍵詞詞典中存儲(chǔ)有關(guān)鍵詞與文本類型標(biāo)簽之間的對(duì)應(yīng)關(guān)系;第一確定模塊,被配置為根據(jù)所述關(guān)鍵詞確定所述待分類文本對(duì)應(yīng)的分類標(biāo)簽;第二確定模塊,被配置為確定各所述待分類文本子句與所述分類標(biāo)簽之間的關(guān)聯(lián)評(píng)分;第三確定模塊,被配置為根據(jù)各所述關(guān)聯(lián)評(píng)分確定所述待分類文本的分類結(jié)果及分類依據(jù)。
在一些實(shí)施例中,所述用于文本分類的裝置包括:處理器和存儲(chǔ)有程序指令的存儲(chǔ)器,所述處理器被配置為在執(zhí)行所述程序指令時(shí),執(zhí)行上述用于文本分類的方法。
在一些實(shí)施例中,所述電子設(shè)備包括上述的用于文本分類的裝置。
在一些實(shí)施例中,所述存儲(chǔ)介質(zhì)存儲(chǔ)有程序指令,所述程序指令在運(yùn)行時(shí),執(zhí)行上述的用于文本分類的方法。
本公開實(shí)施例提供的用于文本分類的方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì),可以實(shí)現(xiàn)以下技術(shù)效果:通過獲取待分類文本;待分類文本包括多個(gè)待分類文本子句;利用預(yù)設(shè)的關(guān)鍵詞詞典從各待分類文本子句中查詢出文本類型標(biāo)簽對(duì)應(yīng)的關(guān)鍵詞;關(guān)鍵詞詞典中存儲(chǔ)有關(guān)鍵詞與文本類型標(biāo)簽之間的對(duì)應(yīng)關(guān)系;根據(jù)關(guān)鍵詞確定待分類文本對(duì)應(yīng)的分類標(biāo)簽;確定各待分類文本子句與分類標(biāo)簽之間的關(guān)聯(lián)評(píng)分;根據(jù)各關(guān)聯(lián)評(píng)分確定待分類文本的分類結(jié)果及分類依據(jù)。由于能夠確定出待分類文本的分類依據(jù),從而便于用戶根據(jù)分類依據(jù)對(duì)文本分類結(jié)果進(jìn)行校驗(yàn)。
以上的總體描述和下文中的描述僅是示例性和解釋性的,不用于限制本申請(qǐng)。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海明略人工智能(集團(tuán))有限公司,未經(jīng)上海明略人工智能(集團(tuán))有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110800737.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





