[發明專利]一種情感類型識別方法及相關裝置有效
| 申請號: | 201710076549.2 | 申請日: | 2017-02-13 |
| 公開(公告)號: | CN106919661B | 公開(公告)日: | 2020-07-24 |
| 發明(設計)人: | 管鶴鳴;段向陽;張志浩;李明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F40/30;G06F40/289 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 情感 類型 識別 方法 相關 裝置 | ||
1.一種情感類型識別方法,其特征在于,所述方法應用于預先訓練的情感類型識別模型,所述方法包括:
獲取待識別語句;
對組成所述待識別語句的基本元素進行識別,確定所述待識別語句中的特征基本元素;
結合所述待識別語句的上下文語句,確定所述待識別語句的語境;
依據所述待識別語句的語境,確定所述待識別語句中與敏感詞匯結構不同但語音相同或相似,或與敏感詞匯結構相似,但語音不同的特征基本元素在所述語境中的特征語義;
依據所述待識別語句中的特征基本元素對應的特征語義,對所述待識別語句進行情感分析,確定所述待識別語句的情感類型。
2.根據權利要求1所述的方法,其特征在于,所述情感類型識別模型的訓練過程包括:
將標注有不同情感類型的樣本語句,進行統計分析,獲取每種情感類型的樣本語句對應的特征基本元素以及所述特征基本元素的特征語義;
依據每種情感類型的樣本語句對應的特征基本元素以及所述特征基本元素的特征語義,進行模型訓練,得到情感類型識別模型。
3.根據權利要求2所述的方法,其特征在于,所述將標注有不同情感類型的樣本語句,進行統計分析,獲取每種情感類型的樣本語句對應的特征基本元素以及所述特征基本元素的特征語義的過程包括:
對每種情感類型的樣本語句進行基本元素的劃分;
分別獲取每種情感類型的樣本語句中每個基本元素各自對應的語義集;
對每種情感類型的樣本語句進行統計分析,獲取每種情感類型的樣本語句中的特征基本元素;
結合每種情感類型的樣本語句的語境,從每種情感類型的樣本語句中每個基本元素各自對應的語義集中,確定每種情感類型的樣本語句中的特征基本元素對應的特征語義。
4.根據權利要求3所述的方法,其特征在于,所述對每種情感類型的樣本語句進行統計分析,獲取每種情感類型的樣本語句中的特征基本元素的過程包括:
分別對每種情感類型的樣本語句中的基本元素的出現次數進行統計;
將每種情感類型的樣本語句中出現次數大于預設次數的基本元素,作為該種情感類型的樣本語句中的特征基本元素。
5.根據權利要求1所述的方法,其特征在于,所述確定所述待識別語句中的特征基本元素的過程包括:
對組成所述待識別語句的基本元素進行識別,確定所述待識別語句的語句類型;
獲取預先訓練的與所述待識別語句的語句類型對應的特征基本元素集合,所述特征基本元素集合中包含有預先訓練的與所述待識別語句的語句類型對應的特征基本元素;
從所述待識別語句中確定與特征基本元素集合中的特征基本元素相匹配的基本元素,作為所述待識別語句的特征基本元素。
6.根據權利要求1所述的方法,其特征在于,所述結合所述待識別語句的上下文語句,確定所述待識別語句的語境的過程包括:
獲取所述待識別語句的上下文語句;
對所述待識別語句的上下文語句中的基本元素進行識別;
確定所述待識別語句的上下文語句中的基本元素對應的語境特征;
依據所述待識別語句的上下文語句中的基本元素對應的語境特征,確定所述待識別語句的語境。
7.根據權利要求1所述的方法,其特征在于,所述依據所述待識別語句中的特征基本元素對應的特征語義,對所述待識別語句進行情感分析,確定所述待識別語句的情感類型的過程包括:
在預先訓練的特征基本元素的特征語義與情感類型對照關系中,對所述待識別語句中的特征基本元素的特征語義進行匹配識別,確定所述待識別語句中的特征基本元素的特征語義對應的情感類型,并將其作為所述待識別語句的情感類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710076549.2/1.html,轉載請聲明來源鉆瓜專利網。





