[發明專利]一種基于混合雙向循環膠囊網絡模型的中文文本分類方法在審
| 申請號: | 202010104287.8 | 申請日: | 2020-02-20 |
| 公開(公告)號: | CN111259157A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 程良倫;鄧健峰 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 黃忠 |
| 地址: | 510060 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 混合 雙向 循環 膠囊 網絡 模型 中文 文本 分類 方法 | ||
本申請公開了一種基于混合雙向循環膠囊網絡模型的中文文本分類方法,包括:構建混合雙向循環膠囊網絡模型,混合雙向循環膠囊網絡模型包括BiGRU網絡和膠囊網絡;將基于獲取的待分類中文文本得到的第一字符向量輸入到混合雙向循環膠囊網絡模型,使得BiGRU網絡基于第一字符向量提取待分類中文文本的上下文特征,膠囊網絡對上下文特征進行處理,輸出待分類中文文本的分類結果,從而解決了現有的文本分類方法存在梯度爆炸以及容易在池化層丟失信息,無法獲取文本全局信息,使得文本分類準確率不高的技術問題。
技術領域
本申請涉及文本分類技術領域,尤其涉及一種基于混合雙向循環膠囊網絡模型的中文文本分類方法。
背景技術
隨著信息化時代的發展,研究者們可以通過收集的大量文本數據進行處理和知識挖掘,建立知識圖譜,大多數知識圖譜是通用型知識圖譜,如dbpedia、yago等,特定領域的知識圖譜需要特定主題的文本數據,由于收集的文本數據主題雜亂無章,無法為計算機所“理解”,也就無法對特定領域知識進行挖掘,可以通過對原始文本進行主題分類來解決該問題?,F有技術中采用循環神經網絡進行文本分類存在梯度爆炸,而采用卷積神經網絡進行文本分類,存在容易在池化層丟失信息,無法獲取文本全局信息,使得文本分類準確率不高的問題。
發明內容
本申請提供了一種基于混合雙向循環膠囊網絡模型的中文文本分類方法,用于解決現有的文本分類方法存在梯度爆炸以及容易在池化層丟失信息,無法獲取文本全局信息,使得文本分類準確率不高的技術問題。
有鑒于此,本申請第一方面提供了一種基于混合雙向循環膠囊網絡模型的中文文本分類方法,包括:
構建混合雙向循環膠囊網絡模型,所述混合雙向循環膠囊網絡模型包括BiGRU網絡和膠囊網絡;
將基于獲取的待分類中文文本得到的第一字符向量輸入到所述混合雙向循環膠囊網絡模型,使得所述BiGRU網絡基于所述第一字符向量提取所述待分類中文文本的上下文特征,所述膠囊網絡對所述上下文特征進行處理,輸出所述待分類中文文本的分類結果。
優選地,所述將基于獲取的待分類中文文本得到的第一字符向量輸入到所述混合雙向循環膠囊網絡模型,包括:
基于Word2Vec模型將獲取的所述待分類中文文本映射為所述第一字符向量;
將所述第一字符向量輸入到所述混合雙向循環膠囊網絡模型。
優選地,所述基于Word2Vec模型將獲取的所述待分類中文文本映射為所述第一字符向量,之前還包括:
對獲取的所述待分類中文文本進行預處理。
優選地,所述將基于獲取的待分類中文文本得到的第一字符向量輸入到所述混合雙向循環膠囊網絡模型,使得所述BiGRU網絡基于所述第一字符向量提取所述待分類中文文本的上下文特征,所述膠囊網絡對所述上下文特征進行處理,輸出所述待分類中文文本的分類結果,之前還包括:
獲取待訓練中文文本;
將基于所述待訓練中文文本得到的第二字符向量輸入到所述混合雙向循環膠囊網絡模型,對所述混合雙向循環膠囊網絡模型進行訓練;
當所述混合雙向循環膠囊網絡模型達到收斂條件時,得到訓練好的所述混合雙向循環膠囊網絡模型。
優選地,所述將基于所述待訓練中文文本得到的第二字符向量輸入到所述混合雙向循環膠囊網絡模型,包括:
基于Word2Vec模型將所述待訓練中文文本映射為所述第二字符向量;
將所述第二字符向量輸入到所述混合雙向循環膠囊網絡模型。
優選地,所述基于Word2Vec模型將所述待訓練中文文本映射為所述第二字符向量,之前還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010104287.8/2.html,轉載請聲明來源鉆瓜專利網。





