[發明專利]基于圖卷積網絡的文本情感分析方法、系統和電子裝置在審
| 申請號: | 202010856600.3 | 申請日: | 2020-08-24 |
| 公開(公告)號: | CN112035661A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 鄒月嫻;蒲璐汶 | 申請(專利權)人: | 北京大學深圳研究生院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06N3/04 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽 |
| 地址: | 518055 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖卷 網絡 文本 情感 分析 方法 系統 電子 裝置 | ||
本申請涉及一種基于圖卷積網絡的文本情感分析方法、系統和電子裝置,其中所述方法包括:對輸入的文本序列進行分詞;按照所述文本序列順序將每個所述分詞轉化為對應的詞嵌入;提取每個所述詞嵌入的正向語義特征和反向語義特征,將相同位置的所述正向語義特征和反向語義特征組合起來,獲得每個詞嵌入的上下文語義特征;根據所述每個詞嵌入的上下文語義特征,計算任意兩個詞嵌入之間的語義關系值,獲得連接矩陣;根據所述連接矩陣解析所述文本序列的依存句法樹;以所述依存句法樹為圖進行圖卷積運算,獲得所述依存句法樹ROOT節點的依存向量;將所述依存句法樹中ROOT節點位置的依存向量進行情感極性分類打分,確定所述文本序列的情感極性類別。
技術領域
本申請涉及文本情感分析技術領域,具體而言,涉及一種基于圖卷積網絡的文本情感分析方法、系統和電子裝置。
背景技術
情感分析技術是隨著20世紀初互聯網的快速發展,而逐漸興起的,并且已經從學術研究領域逐步拓展到工業應用領域。文本情感分析作為一種文本分類任務,早期采用的是基于詞典的方法,預先構建足夠大的情感詞典,再利用規則來判別文本的情感傾向。但是情感詞典的構建過程需要人工對各類型詞語進行整理,且由于新詞不斷出現使得需要對情感詞典進行不斷的維護,導致該類方法人力投入巨大;同時由于其忽略了文本的順序性,其性能表現也差強人意。第二類方法是基于機器學習的方法,如支持向量機(Support VectorMachine,SVM)、樸素貝葉斯( Bayes,NB)等。這種方法的性能表現依賴于特征的選取,因此該類方法的可移植性較低。第三類是基于深度學習的方法,主要是運用卷積神經網絡(Convolution Neural Network,CNN)、(Recurrent Neural Network,RNN)兩種深度神經網絡實現分類。該類方法可以從海量文本中,自動捕捉深層次的語義特征,且不需要構建和維護情感詞典,不需要人工構造特征,實現端到端的文本情感分析任務。其中,CNN通過擴大卷積核尺寸,有效捕捉不同位置的情感信息,進而獲得文本的局部情感特征,但是對于長距離的語義關系的提取能力較弱。RNN無法對非相鄰詞語之間的語義關系進行直接建模,因此其對樣本數據較長或者語言場景較復雜時,有效情感信息之間的間隔有大有小,長短不一,RNN的性能也受到限制。并且部分方法在其計算過程還使用了情感詞典(HowNet),影響方法在領域遷移上的靈活性。
發明內容
本申請的目的是解決現有的文本情感分析技術對于長距離的語義關系的提取能力較弱,無法對非相鄰詞語之間的語義關系進行直接建模,在領域遷移上的靈活性較差的問題。
為實現上述目的,本申請提供了一種基于圖卷積網絡的文本情感分析方法、系統和電子裝置。
第一方面,本申請實施例提出一種基于圖卷積網絡的文本情感分析方法,包括對輸入的文本序列進行分詞;按照所述文本序列順序將每個所述分詞轉化為對應的詞嵌入;提取每個所述詞嵌入的正向語義特征和反向語義特征,將相同位置的所述正向語義特征和反向語義特征組合起來,獲得每個詞嵌入的上下文語義特征;根據所述每個詞嵌入的上下文語義特征,計算任意兩個詞嵌入之間的語義關系值,獲得連接矩陣;根據所述連接矩陣解析所述文本序列的依存句法樹;以所述依存句法樹為圖進行圖卷積運算,獲得所述依存句法樹ROOT節點的依存向量;將所述依存句法樹中ROOT節點位置的依存向量進行情感極性分類打分,確定所述文本序列的情感極性類別。
在一個可能的實施方式中,所述按照所述文本序列順序將每個所述分詞轉化為對應的詞嵌入,包括:按照所述文本序列順序將每個所述分詞中離散的高頻詞轉為低維連續向量,將所述每個分詞中離散的低頻詞轉為特殊符號對應的低維連續向量,所述低維連續向量為每個所述分詞對應的詞嵌入;詞嵌入層使用Glove向量進行初始化,維度為300。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學深圳研究生院,未經北京大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010856600.3/2.html,轉載請聲明來源鉆瓜專利網。





