[發明專利]一種情感傾向預測方法、裝置、系統及存儲介質在審
| 申請號: | 201910941635.4 | 申請日: | 2019-09-30 |
| 公開(公告)號: | CN110674301A | 公開(公告)日: | 2020-01-10 |
| 發明(設計)人: | 祝文博;雷欣;李志飛 | 申請(專利權)人: | 出門問問信息科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/284;G06N3/04 |
| 代理公司: | 11734 北京樂知新創知識產權代理事務所(普通合伙) | 代理人: | 江宇 |
| 地址: | 100044 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感傾向 神經網絡 圖形結構 文本信息 相似度 預測 鄰接矩陣 計算機存儲介質 情感分類模型 語義 數據轉化 預測結果 長文本 轉化 聚合 | ||
本發明公開了一種基于圖神經網絡(GNN)的情感傾向預測方法、裝置、系統及計算機存儲介質。基于圖神經網絡的情感傾向預測方法包括:首先,獲取一段文本信息;然后,將文本信息轉化為以詞為節點,以詞之間的相似度為邊的圖形結構數據;接下來,將該圖形結構數據轉化為由詞之間相似度構成的鄰接矩陣;隨后通過情感分類模型對鄰接矩陣進行情感傾向預測。這種情感傾向預測方法在處理長文本時,通過詞和詞之間地相似度,將文本信息轉化為圖形結構數據,一方面能夠利用圖神經網絡的優勢包含盡可能多的語義;另一方面通過將相近的詞聚合在一起,也更易于提取到最有代表意義的情感傾向特征,使預測結果更為準確。
技術領域
本發明涉及人工智能(Artificial Intelligence,AI)技術領域,尤其涉及一種基于圖神經網絡GNN的情感傾向預測方法、裝置、系統及計算機存儲介質。
背景技術
情感分類是自然語言處理中一種常見的任務。具體來說,就是給出一段文本信息,使用情感分類模型預測該文本信息的情感傾向。
目前,情感傾向預測方法大多基于詞向量序列和卷積神經網絡實現的。這種情感傾向預測方法,在前期對文本信息中的句子進行轉化時,主要使用如下方法:首先,對句子進行分詞,將提取到的詞語轉化為詞向量;然后,將詞向量按照詞在句子中的位置順序排列,構成句子矩陣。同理,將句子矩陣按照句子在文本中的位置順序排列,構成文本矩陣。由此可見,這一過程類似于編碼的過程,并沒有太多提煉或精簡的過程。而且,在這樣得到的文本矩陣中,詞的排列順序和組合方式僅與語序相關而與語義無關。
使用這種情感傾向預測方法對長文本信息進行處理時就會變得比較困難。因為當文本信息很長時,基于詞向量序列的文本矩陣就會是個非常大的矩陣,且與情感傾向相關的詞也會分散在文本矩陣的各個位置。這就會導致以下問題:1)當句子矩陣的大小超出神經網絡能夠處理的矩陣大小時,只能舍棄部分詞向量,截取部分矩陣進行處理。這等同于,在進行情感傾向預測時,只用到了一句話的前段、中斷或后段,此時發生語義缺失的可能性極大;2)即使句子矩陣的大小未超出神經網絡能夠處理的矩陣大小,由于情感傾向相關的詞可能會分散在矩陣的各個位置,單個卷積窗口的大小所能覆蓋的范圍也會限制情感傾向特征提煉的準確性。
發明內容
眾所周知,圖神經網絡GNN的一個基本思想是基于節點的局部鄰節點信息對節點進行向量轉化(embedding),就是通過神經網絡來聚合每個節點及其周圍節點的信息。因此圖神經網絡具有以下特點:1)節點在每一層都會有向量轉化;2)模型可以達到任意深度;3)第零層節點的向量轉化是其自身的輸入特征向量。
于是,本發明人就創造性地想到是否可以利用圖神經網絡的以上優勢將長文本轉化為以詞為節點,以詞之間相似性為邊的一種圖形結構,利用圖神經網絡模型進行情感傾向預測,這樣不但可以去除重復的詞,使文本矩陣得到精簡包含更多不同的詞,還能夠使詞按照語義聚合,更易于準確地提取相關情感傾向特征。
基于以上發明思路,本發明實施例提供了一種基于圖神經網絡的情感傾向預測方法、裝置、系統及計算機存儲介質。
根據本發明實施例第一方面,提供一種基于圖神經網絡的情感傾向預測方法,該方法包括:獲取文本信息;將文本信息轉化為以詞為節點,以詞之間的相似度為邊的圖形結構數據;將圖形結構數據轉化為由詞之間相似度構成的鄰接矩陣;通過情感分類模型對鄰接矩陣進行情感傾向預測。
根據本發明一實施方式,將文本信息轉化為以詞為節點,以詞之間的相似度為邊的圖形結構數據,包括:提取文本信息中的詞;獲取所提取的詞之間的相似度;以所提取的詞為節點,以詞之間的相似度作為邊構造圖形結構數據。
根據本發明一實施方式,獲取所提取的詞之間的相似度,包括:通過詞向量轉化工具獲取所提取的詞之間的相似度。
根據本發明一實施方式,獲取所提取的詞之間的相似度,包括:通過使用詞相似度計算方法進行建模獲取所提取的詞之間的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于出門問問信息科技有限公司,未經出門問問信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910941635.4/2.html,轉載請聲明來源鉆瓜專利網。





