[發(fā)明專(zhuān)利]基于人工智能的文本分類(lèi)方法、裝置、電子設(shè)備及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202111093400.8 | 申請(qǐng)日: | 2021-09-17 |
| 公開(kāi)(公告)號(hào): | CN113792146A | 公開(kāi)(公告)日: | 2021-12-14 |
| 發(fā)明(設(shè)計(jì))人: | 孫金輝;馬駿;王少軍 | 申請(qǐng)(專(zhuān)利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06N3/02;G06N3/08 |
| 代理公司: | 深圳市賽恩倍吉知識(shí)產(chǎn)權(quán)代理有限公司 44334 | 代理人: | 鐘良;陳實(shí)順 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 文本 分類(lèi) 方法 裝置 電子設(shè)備 介質(zhì) | ||
1.一種基于人工智能的文本分類(lèi)方法,其特征在于,所述方法包括:
解析接收到的文本分類(lèi)請(qǐng)求,構(gòu)建一個(gè)搜索空間,其中,所述搜索空間中包含有多個(gè)文本增強(qiáng)策略;
采用預(yù)設(shè)的搜索策略從所述搜索空間中隨機(jī)選取一個(gè)文本增強(qiáng)策略,作為目標(biāo)文本增強(qiáng)策略,其中,所述預(yù)設(shè)的搜索策略中包含有一個(gè)控制器;
使用所述目標(biāo)文本增強(qiáng)策略對(duì)文本分類(lèi)請(qǐng)求中原始文本集中的每個(gè)文本進(jìn)行文本增強(qiáng),得到第一增強(qiáng)文本集;
將所述原始文本集和所述第一增強(qiáng)文本集輸入至預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,得到第一文本分類(lèi)模型;
將所述文本分類(lèi)請(qǐng)求中的驗(yàn)證集輸入至所述第一文本分類(lèi)模型中進(jìn)行驗(yàn)證,并計(jì)算驗(yàn)證通過(guò)率;
根據(jù)所述驗(yàn)證通過(guò)率確定所述文本分類(lèi)請(qǐng)求對(duì)應(yīng)的目標(biāo)文本分類(lèi)模型和最優(yōu)文本增強(qiáng)策略;
采用所述最優(yōu)文本增強(qiáng)策略對(duì)所述文本分類(lèi)請(qǐng)求中的待分類(lèi)文本集進(jìn)行文本增強(qiáng),得到第三增強(qiáng)文本集,將所述第三增強(qiáng)文本集和所述待分類(lèi)文本集輸入至所述目標(biāo)文本分類(lèi)模型中,得到文本分類(lèi)結(jié)果。
2.如權(quán)利要求1所述的基于人工智能的文本分類(lèi)方法,其特征在于,所述解析接收到的文本分類(lèi)請(qǐng)求,構(gòu)建一個(gè)搜索空間包括:
解析接收到的文本分類(lèi)請(qǐng)求,獲取四類(lèi)超參數(shù):類(lèi)別標(biāo)簽、操作類(lèi)型、應(yīng)用類(lèi)型的概率值及每個(gè)文本中應(yīng)用操作的詞的比例;
對(duì)所述四類(lèi)超參數(shù)進(jìn)行組合運(yùn)算,得到多個(gè)文本增強(qiáng)策略,其中,每個(gè)所述文本增強(qiáng)策略由所述四類(lèi)超參數(shù)組成;
基于所述多個(gè)文本增強(qiáng)策略構(gòu)建一個(gè)搜索空間。
3.如權(quán)利要求2所述的基于人工智能的文本分類(lèi)方法,其特征在于,所述操作類(lèi)型包括以下一種或者多種方式的組合:同義詞替換、隨機(jī)插入、隨機(jī)交換、隨機(jī)刪除。
4.如權(quán)利要求2所述的基于人工智能的文本分類(lèi)方法,其特征在于,所述采用預(yù)設(shè)的搜索策略從所述搜索空間中隨機(jī)選取一個(gè)文本增強(qiáng)策略,作為目標(biāo)文本增強(qiáng)策略包括:
將所述多個(gè)文本增強(qiáng)策略輸入至所述預(yù)設(shè)的搜索策略的控制器中,所述控制器從所述多個(gè)文本增強(qiáng)策略中隨機(jī)選取任意一類(lèi)超參數(shù)中的一個(gè)超參數(shù)作為所述控制器當(dāng)前時(shí)間步的輸入?yún)?shù),將所述當(dāng)前時(shí)間步的輸入?yún)?shù)輸入至所述控制器中,輸出當(dāng)前時(shí)間步的輸出值;
所述控制器從所述多個(gè)文本增強(qiáng)策略中隨機(jī)選取剩余的任意一類(lèi)超參數(shù)中的一個(gè)超參數(shù)作為下一個(gè)時(shí)間步的輸入?yún)?shù),將所述下一個(gè)時(shí)間步的第一輸入?yún)?shù)和所述當(dāng)前時(shí)間步的輸出值作為下一個(gè)時(shí)間步的目標(biāo)輸入?yún)?shù),將所述下一個(gè)時(shí)間步的目標(biāo)輸入?yún)?shù)輸入至所述控制器中,輸出下一個(gè)時(shí)間步的輸出值;
循環(huán)執(zhí)行所述四類(lèi)超參數(shù)的選擇及輸入?yún)?shù)的確定,直至得到每個(gè)所述超參數(shù)對(duì)應(yīng)的輸出參數(shù),并將所述四類(lèi)超參數(shù)對(duì)應(yīng)的四個(gè)輸出值確定為目標(biāo)文本增強(qiáng)策略。
5.如權(quán)利要求1所述的基于人工智能的文本分類(lèi)方法,其特征在于,所述使用所述目標(biāo)文本增強(qiáng)策略對(duì)文本分類(lèi)請(qǐng)求中原始文本集中的每個(gè)文本進(jìn)行文本增強(qiáng),得到第一增強(qiáng)文本集包括:
識(shí)別所述目標(biāo)文本增強(qiáng)策略中的每個(gè)超參數(shù)對(duì)應(yīng)的輸出值;
基于每個(gè)所述超參數(shù)對(duì)應(yīng)的輸出值對(duì)所述原始文本集中的每個(gè)文本進(jìn)行文本增強(qiáng),得到第一增強(qiáng)文本。
6.如權(quán)利要求5所述的基于人工智能的文本分類(lèi)方法,其特征在于,所述根據(jù)所述驗(yàn)證通過(guò)率確定所述文本分類(lèi)請(qǐng)求對(duì)應(yīng)的目標(biāo)文本分類(lèi)模型和最優(yōu)文本增強(qiáng)策略包括:
當(dāng)所述驗(yàn)證通過(guò)率滿(mǎn)足所述文本分類(lèi)請(qǐng)求中的預(yù)設(shè)收斂條件時(shí),將所述第一文本分類(lèi)模型確定為目標(biāo)文本分類(lèi)模型及將所述目標(biāo)文本增強(qiáng)策略確定為最優(yōu)文本增強(qiáng)策略。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111093400.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 數(shù)據(jù)分類(lèi)的方法和裝置
- 一種圖像分類(lèi)方法及裝置
- 報(bào)文分類(lèi)方法及網(wǎng)絡(luò)設(shè)備
- 一種短文本多標(biāo)簽分類(lèi)方法及裝置
- 一種高正確率的自然語(yǔ)言分類(lèi)器系統(tǒng)
- 多分類(lèi)模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種基于神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)方法和裝置
- 一種塑料大小分類(lèi)機(jī)





