[發明專利]實體標注模型的訓練方法、實體標注方法以及裝置有效
| 申請號: | 201811314682.8 | 申請日: | 2018-11-06 |
| 公開(公告)號: | CN111143571B | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 李寬;楊春勇;權圣 | 申請(專利權)人: | 馬上消費金融股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何倚雯 |
| 地址: | 401120 重慶市渝北區*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 標注 模型 訓練 方法 以及 裝置 | ||
本申請公開了一種實體標注模型的訓練方法、實體標注方法以及裝置,訓練方法包括:將已標注語料以及目標領域的未標注語料輸入到深度序列模型;通過深度序列模型根據已標注語料的實體類型對目標領域的未標注語料進行實體類型的標注,得到目標領域的未標注語料的標注實體類型;通過深度序列模型對目標領域的未標注語料進行實體類型預測,得到目標領域的未標注語料的預測實體類型;將標注實體類型與預測實體類型進行比對,根據比對結果確定對深度序列模型是否進行再訓練,并得到實體標注模型,實體標注模型為訓練完成的深度序列模型。通過上述方式,能夠在不需要大量人工標注語料的前提下,實現不同領域的無監督實體標注。
技術領域
本申請涉及人工智能模型應用技術領域,特別是涉及一種實體標注模型的訓練方法、實體標注方法以及裝置。
背景技術
命名實體識別是自然語言處理中的一項基本任務,可以識別出文本中的人名、地名等實體。隨著現在人工智能的高速發展,以命名實體識別為基礎的知識抽取、自動回答等應用對命名識別性能也提出了更高的要求。
傳統的命名實體識別主要基于有監督的學習,需要專家或標注人員對實體類型進行定義以及對大量的語料進行標注,費時費力,無法滿足現有的命名實體識別在不同領域的需求。
發明內容
本申請主要解決的技術問題是提供一種實體標注模型的訓練方法、實體標注方法及裝置,能夠在不需要大量人工標注語料的前提下,實現不同領域的無監督實體標注。
為解決上述技術問題,本申請采用的第一個技術方案是:提供一種實體標注模型的訓練方法,包括:將已標注語料以及目標領域的未標注語料輸入到深度序列模型;通過深度序列模型根據已標注語料的實體類型對目標領域的未標注語料進行實體類型的標注,得到目標領域的未標注語料的標注實體類型;通過深度序列模型對目標領域的未標注語料進行實體類型預測,得到目標領域的未標注語料的預測實體類型;將標注實體類型與預測實體類型進行比對,根據比對結果確定對深度序列模型是否進行再訓練,并得到實體標注模型,所述實體標注模型為訓練完成的所述深度序列模型。
為解決上述技術問題,本申請采用的第二個技術方案是:提供一種實體標注方法,實體標注方法基于實體標注模型,實體標注模型是通過已標注語料以及目標領域的未標注語料對深度序列模型進行迭代優化得到的,包括:接收到待標注的語料;通過實體標注模型對待標注的語料進行實體抽取,并對實體的類型進行標注;輸出待標注的語料的預測實體類型標注。
為解決上述技術問題,本申請采用的第三個技術方案是:提供一種實體標注模型的訓練裝置,包括語料輸入模塊、實體類型標注模塊、答案預測模塊以及模型優化模塊,語料輸入模塊用于將已標注語料以及目標領域的未標注語料輸入到深度序列模型;實體類型標注模塊用于通過深度序列模型根據已標注語料的實體類型對目標領域的未標注語料進行實體類型的標注,得到目標領域的未標注語料的標注實體類型;答案預測模塊用于通過深度序列模型對目標領域的未標注語料進行實體類型預測,得到目標領域的未標注語料的預測實體類型;
模型優化模塊用于將標注實體類型與預測實體類型進行比對,根據比對結果確定對深度序列模型是否進行再訓練,并得到實體標注模型,所述實體標注模型為訓練完成的所述深度序列模型。
為解決上述技術問題,本申請采用的第四個技術方案是:提供一種智能裝置,智能裝置包括實體標注模型,實體標注模型是通過已標注語料以及目標領域的未標注語料對深度序列模型進行迭代優化得到的,包括:語料接收模塊、實體類型標注模塊以及輸出模塊;語料接收模塊用于接收到待標注的語料;實體類型標注模塊用于通過實體標注模型對待標注的語料進行實體抽取,并對實體的類型進行標注;輸出模塊用于輸出待標注的語料的預測實體類型標注。
為解決上述技術問題,本申請采用的第五個技術方案是:提供一種智能終端,智能終端包括相互耦接的人機交互控制電路以及處理器及可在處理器上運行的計算機程序,處理器執行計算機程序時上述任一項實體標注模型的訓練方法或執行上述任一項的實體標注方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于馬上消費金融股份有限公司,未經馬上消費金融股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811314682.8/2.html,轉載請聲明來源鉆瓜專利網。





