[發明專利]情感分析模型的訓練方法、情感分析方法、裝置和設備有效
| 申請號: | 202110186764.4 | 申請日: | 2021-02-10 |
| 公開(公告)號: | CN112860894B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 李嘉鵬 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06F40/284;G06F40/289;G06N3/0442;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 范芳茗 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感 分析 模型 訓練 方法 裝置 設備 | ||
1.一種情感分析模型的訓練方法,包括:
獲取樣本數據,所述樣本數據包括針對對象的第一評價文本和所述第一評價文本的標簽,所述標簽包括第一評價文本對所述對象的至少一個方面的情感極性;
生成第一評價文本相對于所述至少一個方面中每個方面的特征向量;
使用情感分析模型基于所生成的特征向量之間的關系,評估第一評價文本對所述對象的所述至少一個方面中每個方面的情感極性,作為評估結果;
根據所述評估結果與所述第一評價文本的標簽之間的差異,調整情感分析模型的參數;
其中,所述生成第一評價文本相對于所述至少一個方面中每個方面的特征向量包括:
根據所述第一評價文本中的每個詞生成第一詞向量;
根據表示所述對象的每個方面的詞生成第二詞向量;
針對每個方面,將每個第一詞向量與針對該方面的第二詞向量拼接成拼接向量,并根據拼接向量中各個第一詞向量的權重,生成第一評價文本相對于該方面的特征向量;
其中,所述情感分析模型包括第一網絡層、第二網絡層和第三網絡層,所述評估第一評價文本對所述對象的所述至少一個方面中每個方面的情感極性包括:
使用第一網絡層生成表征各個特征向量之間的關系的第一關系矩陣;
針對每個方面,使用第二網絡層基于第一關系矩陣和針對該方面的特征向量生成第二關系矩陣,并根據第一關系矩陣、第二關系矩陣和針對該方面的特征向量,生成針對該方面的目標向量;
使用第三網絡層對每個目標向量進行分類,分類結果表示第一評價文本對于該目標向量所對應的方面的情感極性為積極、消極和中立中的一者;
其中,所述第二網絡層包括第一子網絡層和第二子網絡層,所述使用第二網絡層基于第一關系矩陣和針對該方面的特征向量生成第二關系矩陣包括:
使用第一子網絡層對針對該方面的特征向量進行編碼,得到目標特征向量;
計算目標特征向量與第一關系矩陣之間的乘積;
為第一關系矩陣中的各個特征向量分配權重;
使用第二子網絡層基于所述乘積和第一關系矩陣中的各個特征向量的權重,生成所述第二關系矩陣;
其中,所述第二網絡層還包括第三子網絡層,所述根據第一關系矩陣、第二關系矩陣和針對該方面的特征向量,生成針對該方面的目標向量包括:
使用第三子網絡層對第一關系矩陣進行編碼,得到編碼后的第一關系矩陣;
計算編碼后的第一關系矩陣和第二關系矩陣的乘積,得到目標關系向量;
將目標特征向量和目標關系向量相加,得到所述目標向量。
2.根據權利要求1所述的方法,其中,所述根據拼接向量中各個第一詞向量的權重,生成第一評價文本相對于該方面的特征向量包括:
對拼接向量進行編碼;
為編碼后的拼接向量中的各個第一詞向量分配權重;
基于編碼后的各個拼接向量以及各個第一詞向量的權重,生成第一評價文本相對于該方面的特征向量。
3.根據權利要求1所述的方法,其中,所述使用第一網絡層生成表征各個特征向量之間的關系的第一關系矩陣包括:
對各個特征向量進行編碼,生成編碼后的特征向量;
基于編碼后的各個特征向量,生成所述第一關系矩陣。
4.根據權利要求1所述的方法,其中,所述第一評價文本是多個,所述調整情感分析模型的參數包括:針對每個第一評價文本,
執行特征向量的所述生成和情感極性的所述評估,在所評估的情感極性與樣本數據中的情感極性之間的差異不符合預設條件的情況下,調整情感分析模型的參數并返回執行特征向量的所述生成的步驟,直至所述差異符合預設條件。
5.根據權利要求4所述的方法,在所述差異符合預設條件之后,還包括:
獲取測試數據,所述測試數據包括針對對象的第二評價文本以及第二評價文本對所述對象的至少一個方面的情感極性;
生成第二評價文本相對于各個方面的特征向量;
使用情感分析模型基于第二評價文本相對于各個方面的特征向量之間的關系,評估第二評價文本對所述對象的各個方面的情感極性;
根據所評估的第二評價文本對每個方面的情感極性與測試數據中第二評價文本對該方面的情感極性之間的差異,計算所述情感分析模型的評估準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110186764.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于機器學習的交互式圖像分割方法
- 下一篇:一種有機物氣化爐的電氣控制系統





