[發明專利]一種基于詞向量和情感詞性的情感分類方法在審
| 申請號: | 202010637245.0 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111881676A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 夏正友;郭嘉欣;滕淵濤 | 申請(專利權)人: | 南京航空航天大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06K9/62;G06N3/02;G06F16/951;G06F16/955 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 姜慧勤 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 向量 情感 詞性 分類 方法 | ||
本發明公開了一種基于詞向量和情感詞性的情感分類方法,具體為:從網絡爬取若干句評語,并分為訓練集和測試集;將訓練集每句評語中包含的非文本信息去除;對僅包含文本信息的訓練集的每句評語進行詞性分類,區分出非情感相關詞和情感相關詞,同時根據該評語對應的星級、評分或評價對該評語的情感詞性進行分類;采用CBOW模型對非情感相關詞進行訓練,得到包含語義信息的詞向量;采用改進的CBOW模型對情感相關詞進行訓練,得到包含語義信息和情感信息的詞向量;利用上述詞向量來訓練分類器,得到訓練好的分類器;利用訓練好的分離器對測試集詞向量進行情感分類,得到分類結果。本發明在情感分析任務時可以減少了人工干預并豐富了詞向量包含的信息。
技術領域
本發明涉及一種基于詞向量和情感詞性的情感分類方法,屬于情感分類技術領域。
背景技術
近年來,隨著互聯網的普及和不斷發展,人們享受著越來越便捷的電子商務、網絡社交、電子娛樂等服務。隨著網絡越來越融入人們的生活當中,每一個網絡用戶都越來越積極地在網絡平臺發表對于文化娛樂產品、商品、新聞、事件等事務的觀點和看法,也就產生了大量的有價值的評論信息。而隨著網上評價信息的爆炸式增長,除了以往通過紙媒、電視、親朋推薦等方式,越來越多的人在購物、旅游、娛樂前選擇通過上網來獲取相關信息,來對消費目標有一個提前的認知。因此,通過情感分析的方法幫助用戶快速獲取、整理和分析相關評價信息,對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理這一任務變得越來越重要。
情感分析目標是預測一句話、一段文字或一篇文章的情感信息,比如“積極”或者“消極”。情感分析是自然語言處理領域中最受關注的研究課題之一,在自然語言處理任務的各個方面都得到了廣泛的應用。如何在諸如社會媒體分析、電子商務、網絡社交等方面應用情感分析,并獲得有效的信息是研究人員的一項重要的持續性的課題。近年來,對短文本的情感分析獲得了更多的關注?,F有的方法大多都利用人工標注的情感極性來構建情感分類,主要工作是設計有效的特征獲取更好的性能。比如,Mohanmmad等人在對推特進行情感分類中嘗試使用不同情感詞典和人工加注的特征來構建最高執行系,AK Jain和Y Pandey等人通過使用斯坦福POS詞性標記器標記句子中賜予的詞性,并選取對句子情感極性影響較大的詞性所對應的詞語,以此得到整個句子的情感極性。但是,特征選取需要過多的人工時間,所以,研究如何從數據中發現信息,減少學習算法對與特征提取的依賴成了一個新的研究方向。通過學習文檔,獲得密集的單詞表示或詞向量成了人們研究的新方向。一些人通過將詞向量應用于CNN和RNN等深度學習,進行情感分類的工作。Mikolov等人提出CBOW(Continuous Bag of Words)和Skip-Gram(Continuous Skip-Gram)兩個神經網絡語言模型,總稱為Word2Vec。能夠在較短時間內,通過大量無標注的語料庫學習到高質量的詞向量。Tang等人提出三種神經網絡結構,將情感信息引入損失函數學習具有特定情感的詞向量,在Twitter英文情感分析中取得不錯的效果這些研究將詞向量作為一種預先訓練獲得的數據并進行微調從而進行情感分析任務。
在先前的國內外相關的情感分析方法中,主要是基于詞典的分析方法和基于機器學習的方法。采取基于詞典的方法需要大量的人工過程,而且由于應用場景不同,單一的詞典并不具有足夠的泛用性,往往需要建立不同的詞典,同時,伴隨著網絡用語的不斷出現,已經建立好的詞典還需要再次進行更新,這都使得人工成本大大增加。基于機器學習的方法直接依靠大量數據進行學習,但卻缺少監督,學習到的結果不易解讀。
發明內容
本發明所要解決的技術問題是:提供一種基于詞向量和情感詞性的情感分類方法,加入詞性作為參考,在情感詞以外加入部分含有情感信息的非情感詞共同組成情感分析的加強學習部分。在詞向量學習的過程中引入情感作為監督,在詞向量學習的過程中加入一層隱藏層,使得詞向量在學習過程中可以同時學習到語義信息和情感信息,從而得到更加有利于情感分析的詞向量。
本發明為解決上述技術問題采用以下技術方案:
一種基于詞向量和情感詞性的情感分類方法,包括如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010637245.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:應用程序的處理方法、終端設備及計算機存儲介質
- 下一篇:一種電力電氣柜





