[發明專利]一種基于上下文感知自適應卷積網絡的文本分類方法在審
| 申請號: | 202211299842.2 | 申請日: | 2022-10-24 |
| 公開(公告)號: | CN115563974A | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 蔡伊娜;鄭文麗;程立勛;章建方;包先雨;郭云;彭智彬 | 申請(專利權)人: | 深圳市檢驗檢疫科學研究院;中國標準化研究院;深圳大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 北京中仟知識產權代理事務所(普通合伙) 11825 | 代理人: | 丁瑞 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 上下文 感知 自適應 卷積 網絡 文本 分類 方法 | ||
1.一種基于上下文感知自適應卷積網絡的文本分類方法,其特征在于,包括如下具體步驟:
S1、采用多層卷積層從數據集中提取特征,作為文本特征;
S2、將文本特征經過K種不同的卷積得到不同的特征圖,具體表達公式為:
其中表示經過不同卷積之后所得到的特征集合;
通過特征提取模塊進一步學習,提出更多潛在的特征信息,具體式為:
其中表示通過特征提取模塊所得到的特征,θ表示模塊T所需要優化的參數;
S3、通過損失函數對特征提取模塊學習時引入的干擾因素進行去除;
S4、通過自適應卷積學習模塊對K個卷積核的重要性機進行學習,得到帶有權重的上下文特征;
通過批量歸一化、修正線性單元處理,學習到K種不同卷積對文本分類任務有幫助的卷積核,從而學習出隱含的上下文信息,具體公式為:
αi=h(mi·fi)
式中:θ為網絡參數,σ為sigmoid激活函數,h(·)為卷積核全連接操作;
此時將特征提取模塊的特征與對應權重相乘,得到具有分類信息的問題特征Yi,表示如下:
式中:pi為語義特征,通過softmax函數,得到分類預測結果,分類損失表示如下:
其中yi為分類真值,T(·)為預測函數,它將輸出模型對語句的分類預測結果,另外we為網絡的參數,N代表數據集的樣本總數。
2.根據權利要求1所述的一種基于上下文感知自適應卷積網絡的文本分類方法,其特征在于,S3中去除干擾因素的具體步驟如下:
S31:通過聚類方法學習到一個類中心,并懲罰特征與其對應的中心之間的距離,公式表示為:
S32:通過損失函數對特征進行懲罰,其式表示為:
3.根據權利要求2所述的一種基于上下文感知自適應卷積網絡的文本分類方法,其特征在于,S31式中:μ為聚類算法對輸入特征計算得到的平均向量,也稱質心。
4.根據權利要求2所述的一種基于上下文感知自適應卷積網絡的文本分類方法,其特征在于,S32式中為一致性一致性損失函數,為L2范數,N為小批量文本的樣本數目,K為不同卷積分支數,能夠得到具有不同信息的K個特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市檢驗檢疫科學研究院;中國標準化研究院;深圳大學,未經深圳市檢驗檢疫科學研究院;中國標準化研究院;深圳大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211299842.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:紅外加熱燈及在燈管上涂覆反射層的方法
- 下一篇:一種儲能老化系統及方法





