[發明專利]命名實體識別方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202110285605.X | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN113051920A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 于興文 | 申請(專利權)人: | 的盧技術有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/242 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 羅運紅 |
| 地址: | 210038 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 命名 實體 識別 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種命名實體識別方法,其特征在于,所述方法包括:
獲取待識別自然語言信息;
對所述待識別自然語言信息進行轉化處理,獲得字向量信息;
基于預先構建的關鍵詞典,對所述待識別自然語言信息中的詞匯進行檢索,確定存在標簽信息的關鍵詞匯;
將所述關鍵詞匯對應的標簽信息進行向量化,獲得詞典標簽信息;
采用相對位置編碼的方式對所述字向量信息和所述詞典標簽信息進行融合,獲得蘊含詞典標簽信息的自然語言字向量;
根據所述蘊含詞典標簽信息的自然語言字向量進行前后文信息挖掘,獲得所述待識別自然語言信息中每個字對應的命名實體標簽。
2.根據權利要求1所述的方法,其特征在于,所述對所述待識別自然語言信息進行轉化處理,獲得字向量信息的步驟,包括:
對所述待識別自然語言信息進行轉化處理,獲得數字標識信息;
將所述數字標識信息輸入ALBERT模型進行編碼,獲得字向量信息。
3.根據權利要求1所述的方法,其特征在于,所述采用相對位置編碼的方式對所述字向量信息和所述詞典標簽信息進行融合,獲得蘊含詞典標簽信息的自然語言字向量的步驟,包括:
根據所述關鍵詞匯,獲取所述關鍵詞匯在所述待識別自然語言信息的位置;
根據所述關鍵詞匯在所述待識別自然語言信息的位置、所述字向量信息和所述詞典標簽信息,獲得蘊含詞典標簽信息的自然語言字向量。
4.根據權利要求3所述的方法,其特征在于,所述根據所述關鍵詞匯在所述待識別自然語言信息的位置、所述字向量信息和所述詞典標簽信息,獲得蘊含詞典標簽信息的自然語言字向量,包括:
將所述關鍵詞匯在所述待識別自然語言信息的位置、所述字向量信息和所述詞典標簽信息,輸入到Transformer模型中進行信息融合,輸出蘊含詞典標簽信息的自然語言字向量。
5.根據權利要求1所述的方法,其特征在于,所述根據所述蘊含詞典標簽信息的自然語言字向量進行前后文信息挖掘,獲得所述待識別自然語言信息中每個字對應的命名實體標簽的步驟,包括:
將所述蘊含詞典標簽信息的自然語言字向量輸入條件隨機場模型,進行前后文信息挖掘,輸出所述待識別自然語言信息中每個字對應的命名實體標簽。
6.根據權利要求1所述的方法,其特征在于,所述將所述關鍵詞匯對應的標簽信息進行向量化,獲得詞典標簽信息的步驟,包括:
將所述關鍵詞匯對應的標簽信息進行數字化編碼,獲得數字化標簽信息;
對所述數字化標簽信息進行向量化,獲得詞典標簽信息。
7.一種命名實體識別裝置,其特征在于,所述裝置包括:
信息獲取模塊,用于獲取待識別自然語言信息;
信息轉化模塊,用于對所述待識別自然語言信息進行轉化處理,獲得字向量信息;
檢索模塊,用于基于預先構建的關鍵詞典,對所述待識別自然語言信息中的詞匯進行檢索,確定存在標簽信息的關鍵詞匯;
向量化模塊,用于將所述關鍵詞匯對應的標簽信息進行向量化,獲得詞典標簽信息;
融合模塊,用于采用相對位置編碼的方式對所述字向量信息和所述詞典標簽信息進行融合,獲得蘊含詞典標簽信息的自然語言字向量;
信息挖掘模塊,用于根據所述蘊含詞典標簽信息的自然語言字向量進行前后文信息挖掘,獲得所述待識別自然語言信息中每個字對應的命名實體標簽。
8.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至6中任一項所述方法的步驟。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于的盧技術有限公司,未經的盧技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110285605.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種阻斷耐藥性傳播的抗菌敷料
- 下一篇:一種電纜防堆疊壓彎的卷收機構





