[發明專利]一種實體識別方法及相關設備有效
| 申請號: | 201910158600.3 | 申請日: | 2019-03-01 |
| 公開(公告)號: | CN109902303B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 林浚瑋;邵軼男;王巨宏;陳偉 | 申請(專利權)人: | 騰訊科技(深圳)有限公司;哈爾濱工業大學(深圳) |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F16/901;G06N3/0442;G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實體 識別 方法 相關 設備 | ||
1.一種實體識別方法,其特征在于,所述方法包括:
獲取多條標注語料,所述多條標注語料中每條標注語料攜帶標注信息;
按照預設的實體標注規則建立超圖模型,所述超圖模型包括多個父節點,所述多個父節點包括第一父節點和第二父節點,所述多個父節點中的每個父節點對應多種類型的子節點,所述預設的實體標注規則包括:連接所述第一父節點的第一種類型的子節點與所述第一父節點的第二種類型的子節點;以及連接所述第一父節點的第二種類型的子節點與所述第一父節點的第三種類型的子節點和第六種類型的子節點中的至少一個;以及連接所述第一父節點的第三種類型的子節點與所述第二父節點的第四種類型的子節點和第五種類型的子節點中的至少一個;以及連接所述第一父節點的第四種類型的子節點與所述第二父節點的第四種類型的子節點和第五種類型的子節點中的至少一個;以及連接所述第一父節點的第六種類型的子節點和第五種類型的子節點與所述第一父節點的第七種類型的子節點;以及連接所述第一父節點和所述第二父節點;
根據所述標注信息和所述實體標注規則,確定所述每條標注語料對應的標注路徑圖,所述標注路徑圖由所述標注語料中的多個字或單詞的標注路徑組合構成;
根據所述超圖模型和預設的神經網絡模型,建立待訓練模型,所述待訓練模型包括多個訓練參數;所述超圖模型包括所述每條標注語料的多條標注路徑;所述標注路徑圖包括所述多條標注路徑中的目標標注路徑;
根據所述神經網絡模型確定所述多條標注路徑中每條標注路徑的第一特征分數、以及根據所述超圖模型確定所述每條標注路徑的第二特征分數;
將所述第一特征分數和所述第二特征分數的和作為所述每條標注路徑的得分;
根據所述每條標注路徑的得分,調節所述多個訓練參數以使所述目標標注路徑的得分為所述多條標注路徑中的最高得分;
將所述最高得分對應的多個訓練參數作為所述待訓練模型的設置參數,得到實體識別模型;
根據所述實體識別模型,識別輸入語料中的至少一個命名實體。
2.如權利要求1所述的方法,其特征在于,所述超圖模型對應至少一種第一語料特征;所述神經網絡模型對應至少一種第二語料特征;
所述根據所述神經網絡模型確定所述多條標注路徑中每條標注路徑的第一特征分數、以及根據所述超圖模型確定所述每條標注路徑的第二特征分數包括:
根據所述至少一種第一語料特征中每種第一語料特征,確定所述每條標注路徑的第一特征分量值、以及根據所述至少一種第二語料特征中每種第二語料特征,確定所述每條標注路徑的第二特征分量值;
將所述第一特征分量值的和作為所述第一特征分數、以及將所述第二特征分量值的和作為所述第二特征分數。
3.如權利要求2所述的方法,其特征在于,所述至少一種第二語料特征包括狀態轉移特征、單詞特征、語言模式特征、詞性標簽特征、詞袋特征和單詞模式特征中的至少一項。
4.如權利要求1所述的方法,其特征在于,所述根據所述實體識別模型,識別輸入語料中的至少一個命名實體包括:
將所述輸入語料輸入所述實體識別模型,得到所述輸入語料的標注路徑;
根據所述標注路徑,確定所述輸入語料對應的標注標簽;
根據所述標注標簽,識別所述至少一個命名實體。
5.如權利要求1-4任一項所述的方法,其特征在于,所述根據所述實體識別模型,識別輸入語料中的至少一個命名實體之后,還包括:
接收用戶輸入的選擇指令,所述選擇指令攜帶實體類型信息;
從所述至少一個命名實體中抽取與所述實體類型信息相匹配的命名實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司;哈爾濱工業大學(深圳),未經騰訊科技(深圳)有限公司;哈爾濱工業大學(深圳)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910158600.3/1.html,轉載請聲明來源鉆瓜專利網。





