[發(fā)明專利]領域要素識別模型訓練方法、裝置及電子設備有效
| 申請?zhí)枺?/td> | 202010107938.9 | 申請日: | 2020-02-21 |
| 公開(公告)號: | CN111339759B | 公開(公告)日: | 2023-07-25 |
| 發(fā)明(設計)人: | 高原;戴岱;肖欣延 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/242 | 分類號: | G06F40/242;G06F40/295;G06N3/045;G06N3/0442;G06N3/047;G06N3/088;G06N3/0895;G06N5/022 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 王艷斌 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 領域 要素 識別 模型 訓練 方法 裝置 電子設備 | ||
1.一種領域要素識別模型訓練方法,其特征在于,包括:
利用預設的規(guī)則對訓練數據集進行標注,以生成所述訓練數據集中每個訓練數據對應的第一參考實體標注信息;
利用預設的要素識別模型,對所述訓練數據集進行識別處理,以確定每個訓練數據對應的預測實體標注信息;
所述每個訓練數據對應的第一參考實體標注信息包括參考實體標注序列及每個參考實體對應的下一個分詞,所述每個訓練數據對應的預測實體標注信息包括預測實體標注序列及每個預測實體對應的下一個預測詞;
根據所述每個訓練數據對應的預測實體標注序列與參考實體標注序列的差異,確定所述預設的要素識別模型的第一損失值;
根據所述每個訓練數據對應的每個預測實體對應的下一個預測詞與參考實體對應的下一個分詞的差異,確定所述預設的要素識別模型的第二損失值;
根據所述第一損失值及所述第二損失值,對所述預設的要素識別模型進行更新。
2.如權利要求1所述的方法,其特征在于,所述預設的要素識別模型為雙向長短期記憶-條件隨機場模型;
所述利用預設的要素識別模型,對所述訓練數據集進行識別處理之后,還包括:
根據所述預設的要素識別模型的條件隨機場層的狀態(tài)信息,確定第一訓練數據對應的多個候選預測實體標注序列;
根據所述第一訓練數據對應的多個候選預測實體標注序列的概率,確定所述多個候選預測實體標注序列的置信度;
若所述多個候選預測實體標注序列的置信度小于置信度閾值,則確定所述第一訓練數據為待人工標注訓練數據,以對所述待人工標注訓練數據進行人工標注。
3.如權利要求2所述的方法,其特征在于,所述根據所述第一訓練數據對應的多個候選預測實體標注序列的概率,確定所述多個候選預測實體標注序列的置信度,包括:
根據每個候選預測實體標注序列的概率,確定所述多個候選預測實體標注序列的熵值;
根據所述多個候選預測實體標注序列的熵值,確定所述多個候選預測實體標注序列的置信度。
4.如權利要求2或3所述的方法,其特征在于,所述確定所述第一訓練數據為待人工標注數據之后,還包括:
獲取待人工標注訓練數據及待人工標注訓練數據對應的第二參考實體標注信息,其中,所述第二參考實體標注信息為所述待人工標注訓練數據的人工標注結果;
利用所述預設的要素識別模型對所述待人工標注訓練數據進行識別處理,以確定所述待人工標注訓練數據對應的預測實體標注信息;
根據所述待人工標注訓練數據對應的預測實體標注信息與所述第二參考實體標注信息的差異,對所述預設的要素識別模型進行更新。
5.一種領域要素識別模型訓練裝置,其特征在于,包括:
標注模塊,用于利用預設的規(guī)則對訓練數據集進行標注,以生成所述訓練數據集中每個訓練數據對應的第一參考實體標注信息;
第一確定模塊,用于利用預設的要素識別模型,對所述訓練數據集進行識別處理,以確定每個訓練數據對應的預測實體標注信息;
第一更新模塊,用于根據所述每個訓練數據對應的預測實體標注信息與第一參考實體標注信息的差異,對所述預設的要素識別模型進行更新;
所述每個訓練數據對應的第一參考實體標注信息包括參考實體標注序列及每個參考實體對應的下一個分詞,所述每個訓練數據對應的預測實體標注信息包括預測實體標注序列及每個預測實體對應的下一個預測詞;
所述第一更新模塊,具體用于:
根據所述每個訓練數據對應的預測實體標注序列與參考實體標注序列的差異,確定所述預設的要素識別模型的第一損失值;
根據所述每個訓練數據對應的每個預測實體對應的下一個預測詞與參考實體對應的下一個分詞的差異,確定所述預設的要素識別模型的第二損失值;
根據所述第一損失值及所述第二損失值,對所述預設的要素識別模型進行更新。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010107938.9/1.html,轉載請聲明來源鉆瓜專利網。





