[發明專利]一種文本情感傾向計算方法在審
| 申請號: | 202010769900.8 | 申請日: | 2020-08-03 |
| 公開(公告)號: | CN112035602A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 于霄 | 申請(專利權)人: | 北京宏博知微科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/247;G06F40/289;G06F40/30;G06K9/62 |
| 代理公司: | 北京聯瑞聯豐知識產權代理事務所(普通合伙) 11411 | 代理人: | 張學府 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 傾向 計算方法 | ||
本發明公開了一種文本情感傾向計算方法,具體包括以下步驟:S1、首先通過文本數據采集模塊對網上的商品評價的文本數據進行采集;S2、將采集后的文本數據進行存儲在語料庫中,作為訓練集;S3、當對文本信息數據進行情感分析時,通過情感詞識別模塊對文本中具有情感傾向的詞語進行自動識別抽取,本發明涉及文本情感傾向識別技術領域。該文本情感傾向計算方法,通過將人和計算機的優點相結合,既提高了對文本情感度判斷的準確度,同時也減輕了人的工作量,降低了耗費的時間,通過情感詞識別模塊的設置,使得在商品評價語料庫進行分詞時,能夠對文本中具有情感傾向的詞語進行自動識別抽取,提高了工作效率。
技術領域
本發明涉及文本情感傾向識別技術領域,具體為一種文本情感傾向計算方法。
背景技術
文本情感分析又稱意見挖掘、傾向性分析等,簡單而言,是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,互聯網(如博客和論壇以及社會服務網絡如大眾點評)上產生了大量的用戶參與的、對于諸如人物、事件、產品等有價值的評論信息,這些評論信息表達了人們的各種情感色彩和情感傾向性,如喜、怒、哀、樂和批評、贊揚等,基于此,潛在的用戶就可以通過瀏覽這些主觀色彩的評論來了解大眾輿論對于某一事件或產品的看法,情感分析或意見挖掘是人們的觀點,情緒,評估對諸如產品,服務,組織等實體的態度,該領域的發展和快速起步得益于網絡上的社交媒體,例如產品評論,論壇討論,微博,微信的快速發展,因為這是人類歷史上第一次有如此巨大數字量的形式記錄,情緒分析已經成長為自然語言處理(NLP)中最活躍的研究領域之一。
目前在對商品評價的文本中,通過計算機能夠自動實現對文本情感傾向度的計算,但其缺點是計算機對基準詞的依賴性較大,準確性較低,而通過人工的方法對情感傾向度進行判斷時,其情感傾向度判斷的準確性較高,但人的主觀性較強,且耗費的時間較長,工作量較大,因此,目前需要一種能夠將兩者優點相結合的操作方法。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種文本情感傾向計算方法,解決了計算機對基準詞的依賴性較大,準確性較低,而人的主觀性較強,且耗費的時間較長,工作量較大,因此,目前需要一種能夠將兩者優點相結合的操作方法的問題。
(二)技術方案
為實現以上目的,本發明通過以下技術方案予以實現:一種文本情感傾向計算方法,具體包括以下步驟:
S1、首先通過文本數據采集模塊對網上的商品評價的文本數據進行采集;
S2、將采集后的文本數據進行存儲在語料庫中,作為訓練集;
S3、當對文本信息數據進行情感分析時,通過情感詞識別模塊對文本中具有情感傾向的詞語進行自動識別抽取,然后通過信息處理模塊對情感詞的極性進行分類,同時將情感詞中的同義詞進行排序組合在一起;
S4、然后通過遞階層次構建模塊構建一個以情感詞為底層的遞階層次結構,其中該遞階層次結構中的底層為對該商品屬性評價中的情感詞,底層的上一層為網上對商品評價中對商品的某種屬性評價較多的是商品屬性;
S5、根據構建好的遞階層次結構,將底層的元素相對于上一層元素的重要性進行比較,構建判斷矩陣,然后根據判斷矩陣,通過計算模塊計算底層元素相對于上一層元素的情感傾向強度值,最后計算每個情感詞對應的情感傾向強度值的綜合平均值,確定文本信息的情感傾向強度值,根據情感傾向強度值即可確定文本信息的情感傾向。
優選的,所述步驟S3中通過情感詞識別模塊識別抽取的具有情感傾向的詞語可為名詞、動詞和形容詞。
優選的,所述步驟S3中情感詞的極性分為褒義、貶義和中性。
優選的,所述步驟S4中遞階層次結構具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京宏博知微科技有限公司,未經北京宏博知微科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010769900.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種獲取參與事件的渠道信息獲取方法
- 下一篇:一種可檢測并控制溫度的榨油機





