[發明專利]一種情感詞情感強度確定方和裝置有效
| 申請號: | 201810272426.0 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN108491393B | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 楊濤;李建麗;王肅;盧洪志 | 申請(專利權)人: | 國信優易數據股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 趙志遠 |
| 地址: | 100070 北京市豐臺區南四環*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 情感 強度 確定 裝置 | ||
1.一種情感詞情感強度確定方法,其特征在于,該方法包括:
獲得預先生成的情感詞集,其中,所述情感詞集包括多個情感詞,所述情感詞集表現為詞向量矩陣,每個情感詞都以詞向量的方式存在;
計算所述情感詞集中每兩個情感詞之間的相關度;其中,所述相關度是基于每兩個情感詞的詞向量之間的距離,和/或每個詞向量到詞向量空間的中心的距離的差值,和/或每個詞向量的特征值的差值確定的;
針對情感詞集中的每個情感詞,基于該情感詞與所述情感詞集中第一預設數目情感詞中的各情感詞之間的相關度,計算得到該情感詞的情感權值,所述情感權值用于衡量該情感詞所表征的情感強度。
2.如權利要求1所述的方法,其特征在于,所述基于該情感詞與所述情感詞集中第一預設數目情感詞中的各情感詞之間的相關度,計算得到該情感詞的情感權值,包括:
對該情感詞與所述情感詞集中第一預設數目情感詞中的各情感詞之間的相關度進行加權計算,得到該情感詞的情感權值。
3.如權利要求1所述的方法,其特征在于,采用如下方式構建情感詞集:
從預設平臺獲取語料;
對所述語料進行分詞處理并將詞轉化為詞向量進行表示,得到初始詞集;
確定表征情感的情感種子詞;
針對每個情感種子詞,計算所述初始詞集中的各詞與該情感種子詞之間的相關度,按照相關度從高到低的順序選擇第二預設數目的詞構建情感詞集。
4.如權利要求1所述的方法,其特征在于,在所述針對情感詞集中的每個情感詞,基于該情感詞與所述情感詞集中第一預設數目情感詞中的各情感詞之間的相關度,計算得到該情感詞的情感權值之前,還包括如下步驟:
對情感詞集中的情感詞進行去重處理;
去除情感詞集中的無用詞。
5.如權利要求2所述的方法,其特征在于,所述對該情感詞與所述情感詞集中第一預設數目情感詞中的各情感詞之間的相關度進行加權計算,包括:
計算該情感詞與所述情感詞集中第一預設數目情感詞中的各情感詞之間的相關度之和的平均值。
6.一種情感詞情感強度確定裝置,其特征在于,該裝置包括:
獲取模塊,用于獲得預先生成的情感詞集,其中,所述情感詞集包括多個情感詞,所述情感詞集表現為詞向量矩陣,每個情感詞都以詞向量的方式存在;
處理模塊,用于計算所述情感詞集中每兩個情感詞之間的相關度;針對情感詞集中的每個情感詞,基于該情感詞與所述情感詞集中第一預設數目情感詞中的各情感詞之間的相關度,計算得到該情感詞的情感權值,所述情感權值用于衡量該情感詞所表征的情感強度;其中,所述相關度是基于每兩個情感詞的詞向量之間的距離,和/或每個詞向量到詞向量空間的中心的距離的差值,和/或每個詞向量的特征值的差值確定的。
7.如權利要求6所述的裝置,其特征在于,還包括:構建模塊,所述構建模塊用于:
從預設平臺獲取語料;
對所述語料進行分詞處理并將詞轉化為詞向量表示,得到初始詞集;
確定表征情感的情感種子詞;
針對每個情感種子詞,計算所述初始詞集中的各詞與該情感種子詞之間的相關度,按照相關度從高到低的順序選擇第二預設數目的詞構建情感詞集。
8.一種計算機設備包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現上述權利要求1至5任一項所述的方法的步驟。
9.一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,其特征在于,所述計算機程序被處理器運行時執行上述權利要求1至5任一項所述的方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信優易數據股份有限公司,未經國信優易數據股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810272426.0/1.html,轉載請聲明來源鉆瓜專利網。





