[發明專利]一種基于情感詞向量的汽車在線評論情感分析方法在審
| 申請號: | 202110425629.0 | 申請日: | 2021-04-20 |
| 公開(公告)號: | CN112966526A | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 劉露;姚志林;費玉璽;包鐵;彭濤 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/9536;G06Q30/02;G06N3/04;G06N3/08 |
| 代理公司: | 北京華際知識產權代理有限公司 11676 | 代理人: | 曹書華 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 情感 向量 汽車 在線 評論 分析 方法 | ||
本發明公開的屬于汽車在線評論技術領域,具體為一種基于情感詞向量的汽車在線評論情感分析方法,其包括:輸入層;特征學習層;注意力層;情感分類層。該基于情感詞向量的汽車在線評論情感分析方法,在已構建的特定汽車評論文本數據集上進行上述方法的實驗分析,使得該模型能夠更好的抽取關于汽車評論文本的特征,提升該模型在汽車領域文本評論情感傾向分析的準確率;通過設計對比實驗,在汽車領域的文本評論分類準確率以及F1值相較于傳統的情感分類方法取得了有效改善,具有一定的應用價值。
技術領域
本發明涉及汽車在線評論技術領域,具體為一種基于情感詞向量的汽車在線評論情感分析方法。
背景技術
隨著我國的經濟水平飛速發展,互聯網在國內的普及度日益提高,而與此同時人民生活質量也在不斷改善。日益向好的發展趨勢促使汽車這一種重要的交通運輸工具,也逐漸進入了千家萬戶。同時,汽車制造業正逐漸向智能化、信息化轉變,而人們消費意識的提高,對于汽車這一類大型商品的綜合要求也在不斷發生著變化,因此對于汽車服務商而言,了解用戶的個性化需求,精準掌握市場動向,從而制定合理的企業營銷策略具有重大意義。
目前,在國內已經出現了多個具有一定專業性的汽車門戶網站,這些網站的用戶保持著極高的活躍度和積極性,由此便產生了海量的用戶在線評論數據。對于汽車服務商而言,不同的用戶對于某一汽車商品的評價具有極高的商業價值信息,而面對如此多的評論數據,如果僅依靠人工進行文本的分析和挖掘,無疑是一件非常龐大且繁復的工作。如果能夠自動從汽車評論文本中學習文本特征,從而實現情感信息提取,并通過分類模型對汽車評論做出情感傾向的判斷,進而能夠對評論中的正面評價和負面評價進行挖掘,便可以獲取更深層次的關鍵信息,從而更為客觀的了解用戶的需求,極大的減少了汽車企業了解市場動向的人力成本和時間成本,給予了企業更為靈活的決策方案。
目前國內外針對情感分析任務的主流研究方法主要有3種,分別是(1)基于情感詞典和規則的分類方法;(2)基于傳統機器學習的分類方法;(3)基于深度學習的分類方法。這三種流行方法在一定程度上都存在各自缺陷:
(1)基于詞典的方法是利用情感知識來盡可能完整地創建相應的情感詞典,然后依據規則進行文本對照,進而計算得到文本的情感類型。情感詞典被用于融合語言資源,其中每個單詞與指示其情感極性的分數相關。但是由于情感詞典自身不能考慮上下文對與單詞關聯的極性值的影響,因此它們只能在識別大型數據集中的粗略意見傾向上獲得良好的性能。
(2)基于機器學習的情感分類方法大體可分為有監督式和半監督式的兩類機器學習算法,雖然這其中不乏性能較為優異的分類模型,但由于這些分類模型的性能通常取決于標注數據集的質量,而高質量的標注數據集往往需要付出大量的人工成本才能得到。這樣便造成了機器學習方法更多的受限于復雜的特征工程,并且依賴人工數據集的設計,導致分類在某一領域表現良好但在其他領域卻不盡然,因此在大規模推廣方面存在阻力。
(3)相對于前兩種情感分析方法,深度學習技術在自動化的捕獲文本特征方面取得了巨大進步,但就目前的模型應用現狀來看,詞向量的表征能力對模型的分類效果至關重要。而目前性能表現突出的詞向量預訓練模型如Bert,在情感信息表征能力上仍存在不足,致使在解決情感分析任務時,語言模型往往僅能夠學習文本數據的語義信息,而忽略了文本中所蘊含的情感信息,這對模型來說無疑是巨大的損失。
基于對上述問題的思考及分析,本發明在深度學習技術的基礎上,保留其自動化捕獲文本特征能力的同時,提出改進創新方式,設計一種基于情感詞向量的汽車在線評論情感分析方法。
本發明首先在傳統詞向量訓練模型中進行改進,考慮在預訓練階段加入情感信息作為先驗知識,讓模型在捕獲文本特征的同時,能通過學習目標詞的上下文,并將其所蘊含的情感信息準確預測出來,最終通過大規模的預訓練任務,提升模型的表征能力。其次,在自動學習文本語義特征的基礎上嘗試加入注意力機制Attention,將Attention所具有的特定選擇能力加入到文本特征抽取過程中,提升基礎模型對特征情感詞的關注度,從而有效改善文本情感分析算法的性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110425629.0/2.html,轉載請聲明來源鉆瓜專利網。





