[發明專利]一種基于深度量子神經網絡的社交文本情感分析系統在審
| 申請號: | 202111350644.X | 申請日: | 2021-11-15 |
| 公開(公告)號: | CN114461791A | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 劉宇鵬;馮賢杰 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04;G06N3/08;G06N10/20 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 張換男 |
| 地址: | 150080 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 量子 神經網絡 社交 文本 情感 分析 系統 | ||
一種基于深度量子神經網絡的社交文本情感分析系統,它屬于量子計算與自然語言處理的交叉技術領域。本發明解決了現有深度學習方法存在的存儲開銷大、時間復雜度高以及預測精度低的問題。本發明提出了可調參量子深度學習方法用于社交文本情感分析,利用的量子計算只需要存儲輸入和輸出,而不需要存儲中間的結果,那么就節省了二進制編碼的存儲空間,解決了二進制編碼的存儲開銷大的問題,而且,量子并行計算不需要逐步計算每一個深度神經網絡的經典計算,所以降低了深度神經網絡的時間復雜度。本發明采用分階段的訓練可以獲得更優的模型,與現有方法相比,本發明方法具有較高的預測精度和較強的魯棒性。本發明可以應用于對社交文本情感進行分析。
技術領域
本發明屬于量子計算與自然語言處理的交叉技術領域,具體涉及一種基于深度量子神經網絡的社交文本情感分析系統。
背景技術
社交媒體話題的情感分析旨在探索社交網絡上人們對于某一話題或事件的觀點和態度。互聯網的普及使得人們得知信息渠道增多并且便利。新浪作為國內較大的社交網絡平臺,其日活躍用戶量已經超過了2.24億人,平均每日發布的評論總數達兩億條之多。社交媒體海量數據中蘊含著豐富的實時信息。人們可以將生活動態和觀點推送到社交媒體平臺上,也可以對熱門事件進行評論。這些帶有主觀色彩的數據給情感分析的研究帶來了很大的便利。
社交文本數據具有實時性和時效性,抓住社交文本信息的時效性,分析最新的話題數據,才能更大的發揮數據的價值。目前針對社交文本情感分析的研究大多致力于運用深度學習方法提高情感分析器的分析性能,但是深度學習方法是基于二進制編碼的,導致編碼是0或1,這將導致大量的時間消耗、存儲開銷以及較高的時間復雜度,尤其是在數據量龐大和神經網絡參數過多的情況下,這一問題就更加明顯。而且,現有深度學習方法對社交文本情感預測的精度較低。
發明內容
本發明的目的是為解決現有深度學習方法存在的存儲開銷大、時間復雜度高以及預測精度低的問題,而提出了一種基于深度量子神經網絡的社交文本情感分析系統。
本發明為解決上述技術問題所采取的技術方案是:
一種基于深度量子神經網絡的社交文本情感分析系統,所述系統包括數據獲取模塊、數據處理模塊、文本序列信息獲取模型和情感分析模型,其中:
所述數據獲取模塊用于獲取情感分類數據集,所述情感分類數據集中包括評論文本以及評論文本對應的標簽;
所述數據處理模塊用于對獲取的情感分類數據集中的評論文本進行分詞,獲得評論文本詞序列,再將評論文本詞序列映射到詞向量空間中,獲得向量化的文本序列信息;
所述文本序列信息獲取模型利用數據處理模塊獲得的評論文本詞序列和對應的向量化文本序列信息進行訓練,訓練好的文本序列信息獲取模型的輸出即為向量化的文本序列信息;
所述情感分析模型中包括量子長短時記憶神經網絡和網絡融合模塊,所述量子長短時記憶神經網絡包括Input層、QLSTM層和全連接層,其中,QLSTM層包含t個QLSTM 單元;
所述量子長短時記憶神經網絡利用情感分類數據集中的數據對應的向量化文本序列信息以及標簽進行預訓練,共獲得預訓練好的n個量子長短時記憶神經網絡后,所述網絡融合模塊將預訓練好的n個量子長短時記憶神經網絡融合,將融合后的量子長短時記憶神經網絡的輸出作為情感分析模型的輸出;
對待分析的評論文本進行分詞后,獲得待分析的評論文本詞序列;將待分析的評論文本詞序列輸入到訓練好的文本序列信息獲取模型,獲得待分析評論文本對應的向量化文本序列信息;
再將待分析評論文本對應的向量化文本序列信息輸入情感分析模型,輸出對待分析評論文本的情感分析結果。
進一步地,所述數據獲取模塊獲取的數據還包括目標數據集,所述目標數據集的數據格式與情感分類數據集的數據格式相同,即目標數據集中包括評論文本以及評論文本對應的標簽;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111350644.X/2.html,轉載請聲明來源鉆瓜專利網。





