[發明專利]語義關系識別模型的訓練方法、裝置及終端有效
| 申請號: | 201910493678.0 | 申請日: | 2019-06-06 |
| 公開(公告)號: | CN110188202B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 高參;何伯磊;肖欣延 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06F40/295 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 王珺;徐瑞紅 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 關系 識別 模型 訓練 方法 裝置 終端 | ||
1.一種語義關系識別模型的訓練方法,其特征在于,包括:
將樣本數據集輸入至初始預訓練模型中,輸出樣本句子的表示信息,所述樣本數據集包括多個樣本語義單元;所述樣本數據集包括篇章數據集和情感數據集,所述樣本句子的表示信息包括到篇章句子的表示信息和情感句子的表示信息;
獲取多個特征詞,并將多個特征詞進行拼接,得到拼接特征詞的表示信息;
將所述樣本句子的表示信息和所述拼接特征詞的表示信息輸入至初始分類器中,輸出所述樣本語義單元之間的語義關系類別;
調整所述初始預訓練模型以及所述初始分類器,得到新預訓練模型和新分類器;
根據所述新預訓練模型和所述新分類器建立語義關系識別模型;
所述樣本數據集包括篇章數據集,將樣本數據集輸入至初始預訓練模型中,得到樣本句子的表示信息,包括:
將篇章數據集輸入至深度雙向預訓練模型中,得到篇章句子向量;
根據第一函數系數和所述篇章句子向量進行線性整流處理,得到篇章句子的表示信息;
所述樣本數據集還包括情感數據集,將樣本數據集輸入至初始預訓練模型中,得到樣本句子的表示信息,包括:
將情感數據集輸入至所述深度雙向預訓練模型中,得到情感句子向量;
根據第二函數系數和所述情感句子向量進行線性整流處理,得到情感句子的表示信息。
2.根據權利要求1所述的方法,其特征在于,將所述樣本句子的表示信息和所述拼接特征詞的表示信息輸入至初始分類器中,輸出所述樣本語義單元之間的語義關系類別,包括:
將所述篇章句子的表示信息和所述拼接特征詞的表示信息進行拼接,得到第一拼接信息;
根據第三函數系數和所述第一拼接信息進行歸一化指數處理,得到多個語義關系類別的第一概率分布;
對所述第一概率分布和對所述篇章數據集進行獨熱編碼的概率分布進行交叉熵運算,得到第一語義關系類別。
3.根據權利要求2所述的方法,其特征在于,將所述樣本句子的表示信息和所述拼接特征詞的表示信息輸入至初始分類器中,輸出所述樣本語義單元之間的語義關系類別,包括:
將所述情感句子的表示信息和所述拼接特征詞的表示信息進行拼接,得到第二拼接信息;
根據第四函數系數和所述第二拼接信息進行歸一化指數處理,得到多個語義關系類別的第二概率分布;
對所述第二概率分布和對所述情感數據集進行獨熱編碼的概率分布進行交叉熵運算,得到第二語義關系類別。
4.根據權利要求3所述的方法,其特征在于,調整所述初始預訓練模型以及所述初始分類器,得到新預訓練模型和新分類器,包括:
調整所述初始預訓練模型的模型參數,以及所述第一函數系數、所述第二函數系數、所述第三函數系數以及所述第四函數系數,得到所述新預訓練模型和所述新分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910493678.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信息匹配方法及設備
- 下一篇:文本聚合方法、裝置、設備及存儲介質





