[發明專利]一種確定文檔情感傾向性的方法及裝置有效
| 申請號: | 201510671710.1 | 申請日: | 2015-10-16 |
| 公開(公告)號: | CN106598935B | 公開(公告)日: | 2019-04-23 |
| 發明(設計)人: | 史立華;崔維福;何鑫 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/36 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 文檔 情感 傾向性 方法 裝置 | ||
1.一種確定文檔情感傾向性的方法,其特征在于,所述方法包括:
分別獲取一個具有字典樹結構的情感詞典和一個具有字典樹結構的修飾詞典,其中,所述情感詞典中包含帶有情感標定值的情感詞,所述修飾詞典中包含帶有修飾程度標定值的修飾詞;
將待測文檔以字為單位分別與所述情感詞典及所述修飾詞典中字典樹的各節點進行匹配,獲取相匹配的情感詞或修飾詞;
根據情感詞與修飾詞之間的修飾關系、情感詞的情感標定值以及修飾詞的修飾程度標定值計算所述待測文檔的情感標定值;
根據所述待測文檔的情感標定值在預置的情感趨向映射區間中的位置,確定所述待測文檔的情感趨向。
2.根據權利要求1所述的方法,其特征在于,獲取一個具有字典樹結構的情感詞典包括:
根據不同的領域創建至少一個情感詞典,所述情感詞典中包含指定領域中的情感詞;
將所述情感詞典中的情感詞按照正面、中性、負面三類進行劃分,并根據情感詞的情感程度標記情感標定值;
將所述情感詞以字為單位構建字典樹,得到具有字典樹結構的情感詞典;
在所述至少一個情感詞典中獲取一個所述待測文檔所屬領域的情感詞典。
3.根據權利要求1所述的方法,其特征在于,獲取一個具有字典樹結構的修飾詞典包括:
根據不同的領域創建至少一個修飾詞典,所述修飾詞典中包含用于修飾指定領域中情感詞的修飾詞;
根據所述修飾詞的修飾程度標記修飾程度標定值;
將所述修飾詞以字為單位構建字典樹,得到具有字典樹結構的修飾詞典;
在所述至少一個修飾詞典中獲取一個所述待測文檔所屬領域的修飾詞典。
4.根據權利要求1所述的方法,其特征在于,所述將待測文檔以字為單位分別與所述情感詞典及所述修飾詞典中字典樹的各節點進行匹配,獲取相匹配的情感詞或修飾詞包括:
將所述待測文檔分解為單個的字;
根據所述字在待測文檔中的排列順序分別與所述情感詞典以及修飾詞典中字典樹的各節點進行匹配;
當存在與所述字相匹配的節點時,在所述節點的子節點中匹配與所述字相鄰的后一個字;
將匹配成功的字組成情感詞或修飾詞,并獲取所述情感詞的情感標定值或所述修飾詞的修飾程度標定值。
5.根據權利要求1或4所述的方法,其特征在于,所述根據情感詞與修飾詞之間的修飾關系、情感詞的情感標定值以及修飾詞的修飾程度標定值計算所述待測文檔的情感標定值包括:
根據所述情感詞和所述修飾詞在所述待測文檔中的位置判斷所述情感詞與所述修飾詞是否相鄰;
若相鄰,則將所述情感詞與所述修飾詞組成情感詞組,并將情感詞的情感標定值與修飾詞的修飾程度標定值的乘積設置為所述情感詞組的情感標定值;
將所述情感詞組的情感標定值與單獨的情感詞的情感標定值累加,計算出所述待測文檔的情感標定值。
6.根據權利要求1-4中任一項所述的方法,其特征在于,在所述根據所述待測文檔的情感標定值在預置的情感趨向映射區間中的位置,確定所述待測文檔的情感趨向之前,所述方法還包括:
設置正面情感閾值和負面情感閾值;
將大于所述正面情感閾值的情感標定值區間劃分為正趨向區間,將小于所述負面情感閾值的情感標定值區間劃分為負趨向區間,將正面情感閾值和負面情感閾值之間的區間范圍劃分為中性區間。
7.根據權利要求2所述的方法,其特征在于,所述將所述情感詞典中的情感詞按照正面、中性、負面三類進行劃分,并根據情感詞的情感程度標記情感標定值,包括:
將正面情感詞的情感標定值取大于零的值;
將負面情感詞的情感標定值取小于零的值;
將中性情感詞的情感標定值取為零。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510671710.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電子書數據的顯示方法、裝置及終端設備
- 下一篇:字母詞的提取方法及裝置





