[發明專利]基于A-BiLSTM神經網絡的文本分類方法和裝置在審
| 申請號: | 201910633814.1 | 申請日: | 2019-07-15 |
| 公開(公告)號: | CN110457471A | 公開(公告)日: | 2019-11-15 |
| 發明(設計)人: | 占小杰;方豪;王少軍 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/27;G06N3/04;G06N3/08 |
| 代理公司: | 11444 北京匯思誠業知識產權代理有限公司 | 代理人: | 馮曉平<國際申請>=<國際公布>=<進入 |
| 地址: | 518000廣東省深圳市福田區福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 后向 前向 深度特征 詞語 向量 詞向量 計算目標 目標文本 文本 人工智能領域 方法和裝置 輸出 分詞處理 記憶網絡 文本分類 分類 | ||
本發明公開了一種基于A?BiLSTM神經網絡的文本分類方法和裝置,涉及人工智能領域。該方法包括:將目標文本進行分詞處理,得到N個詞語;計算N個詞語中每個詞語對應的詞向量;將第t+T個詞語對應的詞向量、A?BiLSTM神經網絡的前向第t個節點至前向第t+T?1個節點的輸出作為A?BiLSTM神經網絡的前向第t+T個節點的輸入,計算目標文本的前向深度特征表示向量;將第t+T個詞語對應的詞向量、A?BiLSTM神經網絡的后向第t個節點至后向第t+T?1個節點的輸出作為A?BiLSTM神經網絡的后向第t+T個節點的輸入,計算目標文本的后向深度特征表示向量;根據前向深度特征表示向量和后向深度特征表示向量對目標文本進行分類。本發明實施例提供的技術方案能夠解決長短期記憶網絡對文本進行分類的準確性差的問題。
【技術領域】
本發明涉及人工智能領域,尤其涉及一種基于A-BiLSTM神經網絡的文本分類方法和裝置。
【背景技術】
LSTM(Long Short-Term Memory)是長短期記憶網絡,是一種時間遞歸神經網絡,適合于處理和預測時間序列中間隔和延遲相對較長的重要事件。
LSTM已經在科技領域有了多種應用。基于LSTM的系統可以學習翻譯語言、控制機器人、圖像分析、文檔摘要、語音識別、手寫識別、控制聊天機器人、預測疾病、點擊率和股票、合成音樂等等。
在將LSTM應用于文本分類的過程中時,文本的上下文之間往往具有一定聯系,例如“我生長在中國,……,我會說中文”,顯然,“中文”與“中國”之間具有一定聯系,而LSTM處理文本的某一個詞語時,不考慮該詞語的上下文環境,從而可能遺漏重要信息,導致文本分類的準確性差。
【發明內容】
有鑒于此,本發明實施例提供了一種基于A-BiLSTM神經網絡的文本分類方法和裝置,用以解決長短期記憶網絡對文本進行分類的準確性差的問題。
一方面,本發明實施例提供了一種基于A-BiLSTM神經網絡的文本分類方法,所述方法包括:獲取目標文本;將所述目標文本進行分詞處理,得到N個詞語,N為大于2的自然數;計算所述N個詞語中每個詞語對應的詞向量;將第t+T個詞語對應的詞向量、A-BiLSTM神經網絡的前向第t個節點至前向第t+T-1個節點的輸出作為所述A-BiLSTM神經網絡的前向第t+T個節點的輸入,T為預設自然數并且T≥2,t為自然數并且t+T≤N,計算所述目標文本的前向深度特征表示向量;將第t+T個詞語對應的詞向量、所述A-BiLSTM神經網絡的后向第t個節點至后向第t+T-1個節點的輸出作為所述A-BiLSTM神經網絡的后向第t+T個節點的輸入,計算所述目標文本的后向深度特征表示向量;根據所述前向深度特征表示向量和所述后向深度特征表示向量對所述目標文本進行分類。
進一步地,所述根據所述前向深度特征表示向量和所述后向深度特征表示向量對所述目標文本進行分類,包括:將所述前向深度特征表示向量和所述后向深度特征表示向量進行連接處理,得到的向量作為所述目標文本的深度特征表示向量;將所述目標文本的深度特征表示向量輸入分類器函數,所述分類器函數對所述目標文本進行分類得到分類結果;將所述分類結果作為所述目標文本的類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910633814.1/2.html,轉載請聲明來源鉆瓜專利網。





