[發(fā)明專利]一種基于注意力機(jī)制的文本分類方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110360121.7 | 申請(qǐng)日: | 2021-04-02 |
| 公開(公告)號(hào): | CN113204640B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計(jì))人: | 于舒娟;蔡夢(mèng)夢(mèng);吳夢(mèng)潔;毛新濤;黃橙;徐欽晨;張昀;王秀梅 | 申請(qǐng)(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F40/284;G06N3/047;G06N3/048;G06N3/0464;G06N3/08 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 朱小兵 |
| 地址: | 210044 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 機(jī)制 文本 分類 方法 | ||
本發(fā)明提出了一種基于注意力機(jī)制的文本分類方法。所述方法使用基于DenseNet的神經(jīng)網(wǎng)絡(luò)模型;在訓(xùn)練神經(jīng)網(wǎng)絡(luò)之前,利用語(yǔ)義編碼來(lái)初始化DenseNet的卷積過(guò)濾器的權(quán)重,使網(wǎng)絡(luò)在訓(xùn)練之前對(duì)重要的語(yǔ)義信息進(jìn)行辨識(shí),從而在卷積層能捕獲每個(gè)句子的有效位置信息;通過(guò)局部注意力密集連接的模塊進(jìn)行文本信息的特征提取。本發(fā)明文本分類方法具有更強(qiáng)的特征提取能力,并保留文本信息的內(nèi)容,在包括情感分類和主題分類等多個(gè)文本分類的任務(wù)時(shí),效果顯著,有效地提高了分類的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明屬于自然語(yǔ)言處理中的文本分類領(lǐng)域,提出了一種基于注意力機(jī)制的文本分類方法。
背景技術(shù)
伴隨著信息數(shù)據(jù)量的快速增長(zhǎng),自然語(yǔ)言處理在人工智能技術(shù)興起的浪潮中有了快速地發(fā)展。文本分類是自然語(yǔ)言處理的基本任務(wù),用于自然語(yǔ)言處理的各個(gè)領(lǐng)域,如信息檢索,信息過(guò)濾和語(yǔ)義分析等方面,但是面對(duì)大數(shù)據(jù)時(shí)代涌現(xiàn)出的海量的短文本信息,如何劃分新領(lǐng)域所屬的類別,其訓(xùn)練的樣本往往是不充分的。深度學(xué)習(xí)(Deep?learning)[徐翼龍,李文法,周純潔.基于深度學(xué)習(xí)的自然語(yǔ)言處理綜述.中國(guó)計(jì)算機(jī)用戶協(xié)會(huì)網(wǎng)絡(luò)應(yīng)用分會(huì),2018.]不僅可以實(shí)現(xiàn)機(jī)器學(xué)習(xí)的自動(dòng)化,減少了面對(duì)不同問(wèn)題的人工設(shè)計(jì)成本,還增強(qiáng)了對(duì)數(shù)據(jù)中潛在信息的提取和分析能力。
深度學(xué)習(xí)主要通過(guò)深度神經(jīng)網(wǎng)絡(luò)(DNN)結(jié)構(gòu)學(xué)習(xí)提取不同水平和不同維度的有效表示特征,以此提高在不同抽象層次上對(duì)數(shù)據(jù)的解釋能力。DNN主要包括有循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)。基于RNN的模型視文本為詞序列,并可以捕獲文本分類的詞間依賴關(guān)系和文本結(jié)構(gòu)。與RNN不同,CNN的卷積和池化結(jié)構(gòu)能夠很好地提取局部特征信息,因此也成功的應(yīng)用到NLP中。Collobert等人首次將具有端到端訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)用于自然語(yǔ)言處理[Ronan?Collobert?and?Jason?Weston.2008.Aunified?architecture?fornatural?language?processing:Deep?neural?networks?with?multitask?learning.InProceedings?of?the?25th?International?Conference?on?Machine?Learning.ACM,NewY?ork,NY,USA,ICML’08,pages?160–167.]。文章[Shen?Li,Zhe?Zhao,Tao?Liu,Renfen?Hu,and?Xiaoyong?Du.2017.Initializing?convolutional?filters?with?semanticfeatures?for?text?classification.In?Proceedings?of?the?2017?Conference?onEmpirical?Methods.]優(yōu)化了傳統(tǒng)的CNN,提出了一種新的CNN權(quán)重初始化技術(shù),在訓(xùn)練開始時(shí)對(duì)語(yǔ)義特征進(jìn)行編碼的卷積過(guò)濾器用于文本分類。隨著CNN網(wǎng)絡(luò)層數(shù)的不斷增加,網(wǎng)絡(luò)出現(xiàn)了梯度消失和模型降級(jí)(model?degradation)等新問(wèn)題。文獻(xiàn)[Le,H.T.,Cerisara,C.,Denis,A.(2017).Do?Convolutional?Networks?need?to?be?Deep?for?TextClassification?arXiv?preprint?arXiv:1707.04108.]提出了DenseNet模型通過(guò)將所有輸入層連接到輸出層,不僅改善了不同層的信息流問(wèn)題,進(jìn)一步減少了梯度消失和模型降級(jí)問(wèn)題的產(chǎn)生。針對(duì)文本數(shù)據(jù)比較復(fù)雜,使用DenseNet只是通過(guò)增加網(wǎng)絡(luò)層數(shù)對(duì)文本信息進(jìn)行簡(jiǎn)單的特征提取,這不僅會(huì)導(dǎo)致網(wǎng)絡(luò)參數(shù)冗余,甚至?xí)霈F(xiàn)網(wǎng)絡(luò)退化現(xiàn)象。因此通過(guò)在神經(jīng)網(wǎng)絡(luò)DenseNet模型中加入注意力機(jī)制,能夠進(jìn)一步提取文本信息更深層次的特征,也可以自動(dòng)選擇和關(guān)注更為重要的文本特征,進(jìn)一步提高文本分類的準(zhǔn)確性。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110360121.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





