[發明專利]基于卷積神經網絡的文本分類方法及相關設備在審
| 申請號: | 201910042629.5 | 申請日: | 2019-01-17 |
| 公開(公告)號: | CN109918500A | 公開(公告)日: | 2019-06-21 |
| 發明(設計)人: | 徐亮;金戈;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/27;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉立天 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞向量 向量 卷積神經網絡 待分類文本 映射關系 文本分類 文本分類模型 人工智能領域 準確度 融合 申請 轉換 | ||
1.一種基于卷積神經網絡的文本分類方法,其特征在于,包括以下步驟:
獲取詞與詞向量之間的映射關系以及字與字向量之間的映射關系;
獲取待分類文本,并根據所述詞與詞向量之間的映射關系以及字與字向量之間的映射關系將所述待分類文本轉換成詞向量及字向量;
將所述詞向量及字向量輸入卷積神經網絡文本分類模型,并通過所述卷積神經網絡文本分類模型對所述詞向量及字向量進行融合,獲得所述待分類文本的類型。
2.如權利要求1所述的基于卷積神經網絡的文本分類方法,其特征在于,所述獲取詞與詞向量之間的映射關系以及字與字向量之間的映射關系,包括:
獲取文本訓練數據,對所述文本訓練數據進行分詞,獲得詞數據;
對所述文本訓練數據進行分字,獲得字數據;
對所述詞數據和字數據通過word2vec模型進行轉換,獲得詞向量和字向量,并分別建立詞與詞向量之間的映射關系及字與字向量之間的映射關系。
3.如權利要求1所述的基于卷積神經網絡的文本分類方法,其特征在于,所述獲取待分類文本,并根據所述詞與詞向量之間的映射關系以及字與字向量之間的映射關系將所述待分類文本轉換成詞向量及字向量,包括:
獲取待分類文本,將所述待分類文本進行分詞,獲得詞數據,并根據所述詞與詞向量之間的映射關系將所述詞數據轉換為詞向量;
對所述待分類文本進行分字,獲得字數據,并根據所述字與字向量之間的映射關系將所述字數據轉換為字向量。
4.如權利要求1所述的基于卷積神經網絡的文本分類方法,其特征在于,所述將所述詞向量及字向量輸入卷積神經網絡文本分類模型,并通過所述卷積神經網絡文本分類模型對所述詞向量及字向量進行融合,獲得所述待分類文本的類型包括:
將所述詞向量及字向量輸入卷積神經網絡文本分類模型的卷積層,通過所述卷積層對所述詞向量及字向量進行卷積運算分別獲得所述詞向量及字向量的特征,并發送給全連接層;
通過所述全連接層對所述詞向量及字向量的特征進行融合,獲得詞向量和字向量的融合信息,根據所述詞向量和字向量的融合信息獲得所述待分類文本的類型。
5.如權利要求4所述的基于卷積神經網絡的文本分類方法,其特征在于,所述將所述詞向量及字向量輸入卷積神經網絡文本分類模型的卷積層,通過所述卷積層對所述詞向量及字向量進行卷積運算分別獲得所述詞向量及字向量的特征,并發送給全連接層,包括:
將所述詞向量及字向量輸入卷積神經網絡文本分類模型的卷積層,通過所述卷積層的卷積運算分別獲得所述詞向量及字向量的特征,并發送給注意力層;
通過所述注意力層分別對所述詞向量和字向量進行權重分配后發送給全連接層。
6.如權利要求1所述的基于卷積神經網絡的文本分類方法,其特征在于,所述將所述詞向量及字向量輸入卷積神經網絡文本分類模型,并通過所述卷積神經網絡文本分類模型對所述詞向量及字向量進行融合,獲得所述待分類文本的類型,包括:
將所述詞向量及字向量輸入卷積神經網絡文本分類模型的第一卷積層,通過所述第一卷積層對所述詞向量及字向量進行卷積運算后發送至第一全連接層;
通過所述第一全連接層對所述詞向量和字向量進行融合后,獲得第一融合信息,并將所述第一融合信息發送至第二卷積層;
通過所述第二卷積層對所述第一融合信息進行卷積運算后發送至第二全連接層,通過所述第二全連接層進行融合后獲得第二融合信息,并根據所述第二融合信息獲得所述待分類文本的類型。
7.如權利要求6所述的基于卷積神經網絡的文本分類方法,其特征在于,所述通過所述第二全連接層進行融合后獲得第二融合信息,并根據所述第二融合信息獲得所述待分類文本的類型,包括:
通過所述第二全連接層進行融合后獲得第二融合信息,并將所述第二融合信息發送給輸出層;
通過所述輸出層的softmax函數根據所述第二融合信息獲取每個文本類型的概率,在所述概率中獲取最大的概率,并將所述最大的概率對應的文本類型作為所述待分類文本的類型進行輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910042629.5/1.html,轉載請聲明來源鉆瓜專利網。





