[發明專利]情感標識的辨識方法和情感標識的辨識系統有效
| 申請號: | 201610228512.2 | 申請日: | 2016-04-13 |
| 公開(公告)號: | CN107291686B | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 劉克松;楊建武;張丹;蔡慧慧;馬路 | 申請(專利權)人: | 北京大學;北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30 |
| 代理公司: | 北京友聯知識產權代理事務所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感 標識 辨識 方法 系統 | ||
1.一種情感標識的辨識方法,適用于終端,其特征在于,包括:
根據情感標識的使用頻率確定種子詞和所述種子詞對應的文本集合;
在所述對應的文本集合中確定候選詞語;
根據預設的似然比模型確定所述候選詞語與所述種子詞的相關性數值,以根據所述相關性數值確定所述候選詞語對應的情感標識;
將所述種子詞記作s,同時將所述候選詞語記作w,確定所述文本集合中的所述種子詞的相鄰文本段落;
計算所述候選詞語屬于所述相鄰文本段落的條件概率,并記作P(w|s);
計算所述候選詞語屬于所述文本集合的概率,并記作P(w),并將所述候選詞語出現在所述文本集合的次數記作k;
根據第一公式計算所述候選詞語的依賴性系數,所述依賴性系數記作M(w,s),
其中,所述第一公式為
確定所述依賴性系數大于零的候選詞語,以確定為參考情感詞語,并根據所述依賴性系數從大到小的順序對所述參考情感詞語進行排序;
創建所述參考情感詞語的二維矩陣,所述二維矩陣的行對應于所述參考情感詞語向量或所述種子詞向量,所述二維矩陣的列對應于所述文本集合的向量;
確定所述二維矩陣的特征值,所述二維矩陣的左特征向量矩陣和右特征向量矩陣,以及所述二維矩陣的特征值組成的對角矩陣;
根據所述左特征向量矩陣、所述右特征向量矩陣、所述對角矩陣和第二公式計算所述二維矩陣的低秩近似矩陣,
其中,所述第二公式為C=U×∑×VT,所述C表征所述低秩近似矩陣,所述U表征所述左特征向量矩陣,所述VT表征所述右特征向量矩陣,所述∑表征所述特征值組成的對角矩陣;
根據第三公式分別對所述參考情感詞語和所述種子詞進行空間變化處理,以變換至語義空間進行識別,
其中,所述第三公式為所述x為所述w時,T(w)表征所述參考情感詞語在所述語義空間中的向量表示,所述x為所述s時,T(s)表征所述種子詞在所述語義空間中的向量表示,所述表征所述參考情感詞語向量的轉置向量或所述種子詞向量的轉置向量,所述U表征所述左特征向量矩陣,所述∑-1表征所述對角矩陣的逆矩陣;
根據第四公式計算所述參考情感詞語與所述種子詞的相關性系數,
其中,所述第四公式為R(w,s)=T(w)T×T(s),所述T(w)T表征所述T(w)的轉置矩陣,所述R(w,s)表征所述相關性系數。
2.一種情感標識的辨識系統,適用于終端,其特征在于,包括:
確定單元,用于根據情感標識的使用頻率確定種子詞和所述種子詞對應的文本集合;
所述確定單元還用于:在所述對應的文本集合中確定候選詞語;
所述確定單元還用于:根據預設的似然比模型確定所述候選詞語與所述種子詞的相關性數值,以根據所述相關性數值確定所述候選詞語對應的情感標識;
所述確定單元還用于:將所述種子詞記作s,同時將所述候選詞語記作w,確定所述文本集合中的所述種子詞的相鄰文本段落;
所述確定單元還用于:計算所述候選詞語屬于所述相鄰文本段落的條件概率,并記作P(w|s);
所述確定單元還用于:計算所述候選詞語屬于所述文本集合的概率,并記作P(w),并將所述候選詞語出現在所述文本集合的次數記作k;
所述確定單元還用于:根據第一公式計算所述候選詞語的依賴性系數,所述依賴性系數記作M(w,s),
其中,所述第一公式為
所述確定單元還用于:確定所述依賴性系數大于零的候選詞語,以確定為參考情感詞語,并根據所述依賴性系數從大到小的順序對所述參考情感詞語進行排序;
創建單元,用于創建所述參考情感詞語的二維矩陣,所述二維矩陣的行對應于所述參考情感詞語向量或所述種子詞向量,所述二維矩陣的列對應于所述文本集合的向量;
所述確定單元還用于:確定所述二維矩陣的特征值,所述二維矩陣的左特征向量矩陣和右特征向量矩陣,以及所述二維矩陣的特征值組成的對角矩陣;
所述確定單元還用于:根據所述左特征向量矩陣、所述右特征向量矩陣、所述對角矩陣和第二公式計算所述二維矩陣的低秩近似矩陣,
其中,所述第二公式為C=U×∑×VT,所述C表征所述低秩近似矩陣,所述U表征所述左特征向量矩陣,所述VT表征所述右特征向量矩陣,所述∑表征所述特征值組成的對角矩陣;
空間變化單元,用于根據第三公式分別對所述參考情感詞語和所述種子詞進行空間變化處理,以變換至語義空間進行識別,
其中,所述第三公式為所述x為所述w時,T(w)表征所述參考情感詞語在所述語義空間中的向量表示,所述x為所述s時,T(s)表征所述種子詞在所述語義空間中的向量表示,所述表征所述參考情感詞語向量的轉置向量或所述種子詞向量的轉置向量,所述U表征所述左特征向量矩陣,所述∑-1表征所述對角矩陣的逆矩陣;
所述確定單元還用于:根據第四公式計算所述參考情感詞語與所述種子詞的相關性系數,
其中,所述第四公式為R(w,s)=T(w)T×T(s),所述T(w)T表征所述T(w)的轉置矩陣,所述R(w,s)表征所述相關性系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學;北大方正集團有限公司;北京北大方正電子有限公司,未經北京大學;北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610228512.2/1.html,轉載請聲明來源鉆瓜專利網。





