[發(fā)明專利]嵌套實體識別方法、裝置、電子設備和存儲介質無效
| 申請?zhí)枺?/td> | 202010566433.9 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111753545A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設計)人: | 鄭新;李直旭;顧宏曄;陳志剛;吳自成;陳濤;黃磊 | 申請(專利權)人: | 科大訊飛(蘇州)科技有限公司;訊飛智元信息科技有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/242;G06F40/289;G06F40/30;G06K9/62 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 215021 江蘇省蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 嵌套 實體 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種嵌套實體識別方法,其特征在于,包括:
確定待識別文本;
將所述待識別文本輸入至嵌套實體識別模型,得到所述嵌套實體識別模型輸出的簡單實體識別結果和嵌套實體識別結果;
其中,所述嵌套實體識別模型是基于樣本文本,以及所述樣本文本對應的樣本簡單實體識別結果和樣本嵌套實體識別結果訓練得到的;
所述嵌套實體識別模型用于基于所述待識別文本,確定所述簡單實體識別結果,并基于所述待識別文本以及所述簡單實體識別結果,確定所述嵌套實體識別結果。
2.根據權利要求1所述的嵌套實體識別方法,其特征在于,所述將所述待識別文本輸入至嵌套實體識別模型,得到所述嵌套實體識別模型輸出的簡單實體識別結果和嵌套實體識別結果,具體包括:
將所述待識別文本的第一文本向量輸入至所述嵌套實體識別模型的簡單實體識別層,得到所述簡單實體識別層輸出的所述簡單實體識別結果;
將所述簡單實體識別結果輸入至所述嵌套實體識別模型的注意力層,得到所述注意力層輸出的簡單實體注意力向量;
將所述簡單實體注意力向量以及所述待識別文本的第二文本向量輸入至所述嵌套實體識別模型的嵌套實體識別層,得到所述嵌套實體識別層輸出的所述嵌套實體識別結果。
3.根據權利要求2所述的嵌套實體識別方法,其特征在于,所述第一文本向量包括所述待識別文本中每個字的字向量,以及所述待識別文本中每個字的詞典特征向量和/或詞性特征向量。
4.根據權利要求3所述的嵌套實體識別方法,其特征在于,所述待識別文本中每個字的詞典特征向量是將所述待識別文本與預先構建的領域詞典匹配得到的;
其中,任一字的詞典特征向量表示所述任一字在所述領域詞典中匹配的實體的類型以及所述任一字在所述匹配的實體中的位置。
5.根據權利要求2至4任一項所述的嵌套實體識別方法,其特征在于,所述將所述簡單實體注意力向量以及所述待識別文本的文本向量輸入至所述嵌套實體識別模型的嵌套實體識別層,得到所述嵌套實體識別層輸出的所述嵌套實體識別結果,之后還包括:
將所述簡單實體識別結果和/或所述嵌套實體識別結果輸入至所述嵌套實體識別模型的結果矯正層,得到所述結果矯正層輸出的矯正后的簡單實體識別結果和/或嵌套實體識別結果。
6.根據權利要求5所述的嵌套實體識別方法,其特征在于,所述將所述簡單實體識別結果或所述嵌套實體識別結果輸入至所述嵌套實體識別模型的結果矯正層,得到所述結果矯正層輸出的矯正后的簡單實體識別結果或嵌套實體識別結果,具體包括:
將所述簡單實體識別結果或所述嵌套實體識別結果輸入至所述結果矯正層,由所述結果矯正層基于實體標簽規(guī)則,對所述簡單實體識別結果或所述嵌套實體識別結果進行結果矯正,得到所述結果矯正層輸出的矯正后的簡單實體識別結果或矯正后的嵌套實體識別結果。
7.根據權利要求5所述的嵌套實體識別方法,其特征在于,所述將所述簡單實體識別結果和所述嵌套實體識別結果輸入至所述嵌套實體識別模型的結果矯正層,得到所述結果矯正層輸出的矯正后的簡單實體識別結果和嵌套實體識別結果,具體包括:
將所述簡單實體識別結果和所述嵌套實體識別結果輸入至所述結果矯正層,由所述結果矯正層在判斷獲知所述簡單實體識別結果和所述嵌套實體識別結果存在沖突時,對所述簡單實體識別結果或所述嵌套實體識別結果進行結果矯正,得到所述結果矯正層輸出的矯正后的簡單實體識別結果和嵌套實體識別結果;
所述簡單實體識別結果和所述嵌套實體識別結果存在沖突的情況包括所述簡單實體識別結果與所述嵌套實體識別結果之間存在重復實體、邊界相同但實體類型不同的實體以及邊界交叉的實體中的至少一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛(蘇州)科技有限公司;訊飛智元信息科技有限公司,未經科大訊飛(蘇州)科技有限公司;訊飛智元信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010566433.9/1.html,轉載請聲明來源鉆瓜專利網。





