[發明專利]一種模型訓練和信息推薦的方法及裝置在審
| 申請號: | 202210410169.9 | 申請日: | 2022-04-19 |
| 公開(公告)號: | CN115017905A | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 李如寐;王禮文;王思睿;武威 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 鄧超 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 信息 推薦 方法 裝置 | ||
本說明書公開了一種模型訓練和信息推薦的方法及裝置,可以在訓練識別模型時,獲取樣本文本以及樣本文本的標注信息,將該樣本文本以及該樣本文本所屬業務場景下存在的關鍵詞類型輸入到待訓練的識別模型中,以使該識別模型在該關鍵詞類型的約束下,輸出針對該樣本文本的識別結果,并以最小化該識別結果與該標注信息之間的偏差為優化目標,對該識別模型進行訓練,將樣本文本所屬業務場景下存在的關鍵詞類型輸入到的識別模型中,作為該識別模型對該樣本文本進行識別的約束,以使該識別模型在訓練時不僅可以結合標注信息來進行自我學習,還可以依賴于輸入該識別模型的關鍵詞類型的約束,對該樣本文本進行識別,從而能夠提高該識別模型的準確性。
技術領域
本說明書涉及命名實體識別領域,尤其涉及一種模型訓練的方法及裝置。
背景技術
當前,在自然語言處理領域(Natural Language Processing,NLP)中,命名實體識別(Named Entity Recognition,NER)可以包括在語句中抽取出命名實體(Named Entity,NE)、確定出命名實體的類型等任務,命名實體可以理解為是語句中的特定詞語。
在現有技術中,可以通過有監督訓練的方式,對神經網絡模型進行訓練,從而通過神經網絡模型進行命名實體識別,這種方式依賴于大量的訓練樣本對的訓練,但是,存在某些業務場景并沒有大量的訓練樣本,導致訓練得到的模型可能無法準確地進行識別。
因此,如何在訓練樣本較少的業務場景中,提高命名實體識別的準確性,則是一個亟待解決的問題。
發明內容
本說明書提供一種模型訓練和信息推薦的方法及裝置,以部分的解決現有技術存在的上述問題。
本說明書采用下述技術方案:
本說明書提供了一種模型訓練的方法,包括:
獲取樣本文本以及所述樣本文本的標注信息,所述標注信息中至少包括所述樣本文本中包含的關鍵詞的實際類型;
將所述樣本文本以及所述樣本文本所屬業務場景下存在的關鍵詞類型輸入到待訓練的識別模型中,以使所述識別模型在所述關鍵詞類型的約束下,輸出針對所述樣本文本的識別結果;
以最小化所述識別結果與所述標注信息之間的偏差為優化目標,對所述識別模型進行訓練。
可選地,將所述樣本文本以及所述樣本文本所屬業務場景下存在的關鍵詞類型輸入到待訓練的識別模型中,以使所述識別模型在所述關鍵詞類型的約束下,輸出針對所述樣本文本的識別結果,具體包括:
將預設的指令、所述關鍵詞類型以及所述樣本文本輸入到所述識別模型中,以使所述識別模型在所述關鍵詞類型的約束下,根據所述指令的類型,輸出針對所述樣本文本的識別結果。
可選地,將預設的指令、所述關鍵詞類型以及所述樣本文本輸入到所述識別模型中,以使所述識別模型在所述關鍵詞類型的約束下,根據所述指令的類型,輸出針對所述樣本文本的識別結果,具體包括:
將攜帶有所述樣本文本中包含的關鍵詞的第一指令、所述關鍵詞類型以及所述樣本文本輸入到所述識別模型中輸入到所述識別模型中,以使所述識別模型輸出從所述樣本文本中識別出的關鍵詞的類型,作為識別結果,所述第一指令用于確定出所述樣本文本中包含的關鍵詞所屬的類型。
可選地,將預設的指令、所述關鍵詞類型以及所述樣本文本輸入到所述識別模型中,以使所述識別模型在所述關鍵詞類型的約束下,根據所述指令的類型,輸出針對所述樣本文本的識別結果,具體包括:
將第二指令、所述關鍵詞類型以及所述樣本文本輸入到所述識別模型中輸入到所述識別模型中,以使所述識別模型輸出從所述樣本文本中識別出的關鍵詞以及識別出的關鍵詞的類型,作為識別結果,所述第二指令用于確定出所述樣本文本中包含的關鍵詞以及所述樣本文本中包含的關鍵詞所屬的類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210410169.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種在Mo粉表面化學鍍銅的新方法
- 下一篇:用于測量材料光譜透射比的裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





