[發(fā)明專利]文檔情感的判斷方法和裝置有效
| 申請?zhí)枺?/td> | 201611256003.7 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN108255803B | 公開(公告)日: | 2022-03-01 |
| 發(fā)明(設計)人: | 趙鈺 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/216;G06F16/35 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 韓建偉;張永明 |
| 地址: | 100083 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 情感 判斷 方法 裝置 | ||
本發(fā)明公開了一種文檔情感的判斷方法和裝置。其中,該方法包括:對文檔進行語句識別,得到多條語句;提取出多條語句中包括的所有評價對象;基于每條語句包括的所有評價對象以及該條語句中每個評價對象對應的情感詞,得到該條語句對應于其包括的每個評價對象的分值;基于每條語句對應于其包括的每個評價對象的分值得到文檔對應于每個評價對象的情感類型,其中,情感類型包括如下之一:正面情感、中立情感,負面情感。本發(fā)明解決了現有技術中的情感判斷方法對于包含多個評價對象的文檔,情感判斷準確度低的技術問題。
技術領域
本發(fā)明涉及自然語言處理領域,具體而言,涉及一種文檔情感的判斷方法和裝置。
背景技術
情感判斷是自然語言處理的關鍵任務之一,目前,無論是基于詞匯還是基于語料,處理文檔的情感分析方法很多,但受限于實際問題的復雜程序和文檔較復雜的特征情感判斷的限制,沒有一個萬能的算法可以在各種具體問題中都能夠具有較好的情感判斷準確率。而技術選型尤其是評價對象與情感的匹配過程需要大量人為主觀性的參與。因此,如何能夠更好的進行情感判斷仍然是領域內一大難題。
現有的情感判斷方法中并不存在一個萬能的算法,能夠幫助解決各式各樣的情感分析問題,因此,有人提出Frequent phrase+rules(常用詞匯+語法)等一系列方法,旨在詞匯和語料的基礎上對不同評價對象且不同傾向的文檔進行分析,然后再對分析結果聚合得出結論。這種方法在很大程度上彌補了同一篇文檔存在不同評價對象的不足,但是這種方法對于評價對象缺失的文檔不能有效解決,從而會造成情感與語料或詞匯不匹配而導致情感判斷缺失的情況。
針對現有技術中的情感判斷方法對于包含多個評價對象的文檔,情感判斷準確度低的問題,目前尚未提出有效的解決方案。
發(fā)明內容
本發(fā)明實施例提供了一種文檔情感的判斷方法和裝置,以至少解決現有技術中的情感判斷方法對于包含多個評價對象的文檔,情感判斷準確度低的技術問題。
根據本發(fā)明實施例的一個方面,提供了一種文檔情感的判斷方法,包括:對文檔進行語句識別,得到多條語句;提取出多條語句中包括的所有評價對象;基于每條語句包括的所有評價對象以及該條語句中每個評價對象對應的情感詞,得到該條語句對應于其包括的每個評價對象的分值;基于每條語句對應于其包括的每個評價對象的分值得到文檔對應于每個評價對象的情感類型,其中,情感類型至少包括如下之一:正面情感、中立情感,負面情感。
進一步地,基于每條語句包括的所有評價對象以及該條語句中每個評價對象對應的情感詞,得到該條語句對應于其包括的每個評價對象的分值包括:判斷每條語句是否包含至少一個評價對象;若包含,則提取該條語句中每個評價對象對應的所有情感詞;根據該條語句中每個評價對象對應的每個情感詞的情感類型,得到該條語句對應于每個評價對象的分值。
進一步地,根據該條語句中每個評價對象對應的每個情感詞的情感類型,得到該條語句對應于每個評價對象的分值包括:根據該條語句中每個評價對象對應的每個情感詞的情感類型,得到該條語句中每個評價對象對應于每個情感詞的分值;對該條語句中每個評價對象對應的所有情感詞的分值進行累加,得到該語句對應于每個評價對象的分值。
進一步地,根據該條語句中每個評價對象對應的每個情感詞的情感類型,得到該條語句中每個評價對象對應于每個情感詞的分值包括:如果該條語句中每個評價對象對應的每個情感詞的情感類型為正面情感,則確定該條語句中每個評價對象對應于該情感詞的分值為第一預設值;如果該條語句中每個評價對象對應的每個情感詞的情感類型為中立情感,則確定該條語句中每個評價對象對應于該情感詞的分值為第二預設值;如果該條語句中每個評價對象對應的每個情感詞的情感類型為負面情感,則確定該語句中每個評價對象對應于該情感詞的分值為第三預設值。
進一步地,如果任意一條語句不包含任意一個評價對象,則確定該語句對應于其包括的每個評價對象的分值為第四預設值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611256003.7/2.html,轉載請聲明來源鉆瓜專利網。





