[發明專利]對單詞情感值進行自動標定的方法在審
| 申請號: | 201711105704.5 | 申請日: | 2017-11-10 |
| 公開(公告)號: | CN107766331A | 公開(公告)日: | 2018-03-06 |
| 發明(設計)人: | 王津;彭博;張學杰;張驥先;楊旭濤 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京國坤專利代理事務所(普通合伙)11491 | 代理人: | 郭偉紅 |
| 地址: | 650031*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 單詞 情感 進行 自動 標定 方法 | ||
1.一種對單詞情感值進行自動標定的方法,其特征在于,具體按照以下步驟進行:
步驟1,訓練出詞庫中所有單詞的詞向量,通過人工標記的方法初始化少量單詞,記作種子單詞vj,其余單詞為待標定單詞vi;被初始化的種子單詞vj的情緒值為valvj、激勵值為arovj;
步驟2,利用word2vec工具計算每個種子單詞vj和每個待標定單詞vi的詞向量之間的余弦夾角值,得到每個種子單詞vj和每個待標定單詞vi之間的相似度;
步驟3,以種子單詞vj和待標定單詞vi作為節點,以種子單詞vj和待標定單詞vi之間的相似度作為連邊權重,構建權重圖模型;
步驟4,預測待標定單詞vi的情緒值valvi和激勵值arovi。
2.根據權利要求1所述的一種對單詞情感值進行自動標定的方法,其特征在于,所述步驟4中,預測待標定單詞vi的情緒值valvi,通過式(3)進行不斷迭代更新至收斂:
其中,α是衰變因子或置信水平,取值在0-1之間,隨機數取值在1-9之間,Sim(vi,vj)代表待標定單詞vi和種子單詞vj之間的相似度,valvj代表被初始化的種子單詞的情緒值,t代表迭代的步數,代表第t步迭代待標定單詞的情緒值,代表第t-1步迭代待標定單詞的情緒值。
3.根據權利要求1所述的一種對單詞情感值進行自動標定的方法,其特征在于,所述步驟4中,預測待標定單詞的激勵值arovi的方法,通過式(4)進行不斷迭代更新至收斂:
其中,α是衰變因子或置信水平,取值在0-1之間;隨機數取值在1-9之間,Sim(vi,vj)代表待標定單詞vi和種子單詞vj之間的相似度,arovj代表被初始化的種子單詞的激勵值,t代表迭代的步數,代表第t步迭代待標定單詞的激勵值,代表第t-1步迭代待標定單詞的激勵值。
4.根據權利要求1所述的一種對單詞情感值進行自動標定的方法,其特征在于,所述步驟4中,預測待標定單詞vi的情緒值valvi和激勵值arovi采用矩陣運算方法,具體為:將所有待標定單詞、種子單詞的情緒值用向量V表示,將所有待標定單詞、種子單詞的激勵值用向量A表示,設所有待標定單詞和種子單詞之間的相似度構成鄰接矩陣S,
其中,Sim(vi,vj)表示待標定單詞vi和種子單詞vj之間的相似度,1≤i<N,1≤j<N;
設定向量I=(1,1T,,1,向.量..D,=(1d1,)d2,...,dN)T,其中,α是衰變因子或置信水平,取值在0-1之間;假設向量X=(x1,x2,...,xN)T,向量Y=(y1,y2,...,yN)T,則函數運算M(X,Y)=(x1×y1,x2×y2,...,xN×yN)T,函數運算U(X,Y)=(x1/y1,x2/y2,...,xN/yN)T;
利用式(5)計算第t步迭代包含種子單詞和待標定單詞在內所有詞匯的情緒值向量Vt和激勵值向量At;
Vt=M[(I-D)T,Vt-1]+M[DT,U(SVt-1,S×I)],
At=M[(I-D)T,At-1]+M[DT,U(SAt-1,S×)](5)
其中,Vt-1代表第t-1步迭代包含種子單詞vj和待標定單詞vi在內所有詞匯的情緒值向量,At-1代表第t-1步迭代包含種子單詞vj和待標定單詞vi在內所有詞匯的激勵值向量;
待多次迭代收斂后,待標定單詞vi的情緒值valvi為情緒值向量Vt的第i維相應數值;待標定單詞vi的激勵值arovi為激勵值向量At的第i維相應數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711105704.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:保健救心草拌花生米的涼拌菜
- 下一篇:一種補腎滋陰壯陽黑色膳食纖維代餐食品





