[發明專利]語句情感分類方法及相關設備在審
| 申請號: | 202010137265.1 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111460812A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 于鳳英;王健宗 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 劉麗華;孫芬 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 情感 分類 方法 相關 設備 | ||
1.一種語句情感分類方法,其特征在于,所述方法包括:
獲取第一語句樣本集,所述第一語句樣本集中的每個第一語句樣本包含一個缺失詞;
對于每個第一語句樣本,利用特征提取模型將所述第一語句樣本中缺失詞之前的詞語依詞序轉化為第一詞向量序列,將所述第一語句樣本中所述缺失詞之后的詞語依反向詞序轉化為第二詞向量序列,根據預設詞匯編碼表將所述第一語句樣本中的所述缺失詞轉化為所述第一語句樣本的標簽向量;
利用所述特征提取模型將所述第一詞向量序列編碼為第一編碼序列,將所述第二詞向量序列編碼為第二編碼序列;
利用所述特征提取模型根據所述第一編碼序列、所述第二編碼序列計算所述第一語句樣本的缺失詞向量;
根據所述第一語句樣本的缺失詞向量和所述第一語句樣本的標簽向量訓練所述特征提取模型,得到第一特征提取模型,新建第二特征提取模型,使所述第二特征提取模型的神經網絡結構與所述第一特征提取模型的神經網絡結構一致,用所述第一特征提取模型的權值更新所述第二特征提取模型的權值;
用帶有屬性標簽的第二語句樣本訓練由所述第一特征提取模型和全連接層構成的屬性分類模型;
用所述屬性分類模型識別多個待識別語句的屬性詞,將每個待識別語句與識別出的每個待識別語句的屬性詞連接,得到連接屬性詞的所述多個待識別語句;
用帶有情感標簽的連接屬性詞的所述多個待識別語句訓練由所述第二特征提取模型和深度學習模型構成的情感分類模型;
用所述屬性分類模型識別待處理語句的屬性詞,情感分類模型對連接屬性詞的所述待處理語句進行分類,輸出所述待處理語句的屬性詞和所述待處理語句的情感類型。
2.如權利要求1所述的方法,其特征在于,所述特征提取模型包括輸入層、前向隱藏層、后向隱藏層和輸出層。
3.如權利要求1所述的方法,其特征在于,所述利用特征提取模型將所述第一語句樣本中缺失詞之前的詞語依詞序轉化為第一詞向量序列,將所述第一語句樣本中所述缺失詞之后的詞語依反向詞序轉化為第二詞向量序列包括:
將所述第一語句樣本中的所述缺失詞前的詞語依詞序轉化為第一編碼向量序列,將所述第一語句樣本中的所述缺失詞后的詞語依詞序轉化為第二編碼向量序列;
將所述第一語句樣本中的所述缺失詞前的詞語的位置編號轉化為第一位置向量序列,將所述第一語句樣本中的所述缺失詞后的詞語的位置編號轉化為第二位置向量序列;
將所述第一編碼向量序列和所述第一位置向量序列轉化為第一詞向量序列,將所述第二編碼向量序列和所述第二位置向量序列轉化為第二詞向量序列。
4.如權利要求1所述的方法,其特征在于,所述特征提取模型將所述第一詞向量序列編碼為第一編碼序列包括:
所述特征提取模型的第1層前向隱藏子層的第1個編碼模塊根據初始化的權值矩陣集中的第一個權值矩陣子集將所述第一詞向量序列的第1個詞向量編碼為所述第一編碼序列的第一個中間向量序列的第1個向量Z1,1,所述初始化的權值矩陣集包括N個權值矩陣子集,所述第一編碼序列的中間向量序列與所述第二編碼序列的中間向量序列按順序一一對應,所述特征提取模型的第n層的前向隱藏子層和第n層的后向隱藏子層共享第n個權值矩陣子集,每個權值矩陣子集包括多組權值矩陣和第四權值矩陣,每組權值矩陣包括V權值矩陣、Q權值矩陣、K權值矩陣;
從所述第1層前向隱藏子層的第2個編碼模塊開始,所述第1層前向隱藏子層的第u個編碼模塊根據第一個權值矩陣子集逐個將所述第一詞向量序列的第u-1個詞向量和所述第一詞向量序列的第u個詞向量編碼為所述第一編碼序列的第一個中間向量序列的第u個向量Z1,u,得到所述第一編碼序列的第一個中間向量序列Z1={Z1,1,…,Z1,u,…,Z1,U},其中,所述第一編碼序列的第一個中間向量序列的第u個向量與所述第一詞向量序列的第u個詞向量一一對應;
從所述特征提取模型的第2層前向隱藏子層開始,逐個用所述第n層前向隱藏子層根據第n個權值矩陣子集將所述第一編碼序列的第n-1個中間向量序列Zn-1編碼為所述第一編碼序列的第n個中間向量序列Zn。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010137265.1/1.html,轉載請聲明來源鉆瓜專利網。





