[發(fā)明專(zhuān)利]嵌套實(shí)體識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 202010566433.9 | 申請(qǐng)日: | 2020-06-19 |
| 公開(kāi)(公告)號(hào): | CN111753545A | 公開(kāi)(公告)日: | 2020-10-09 |
| 發(fā)明(設(shè)計(jì))人: | 鄭新;李直旭;顧宏曄;陳志剛;吳自成;陳濤;黃磊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 科大訊飛(蘇州)科技有限公司;訊飛智元信息科技有限公司 |
| 主分類(lèi)號(hào): | G06F40/295 | 分類(lèi)號(hào): | G06F40/295;G06F40/242;G06F40/289;G06F40/30;G06K9/62 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 215021 江蘇省蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 嵌套 實(shí)體 識(shí)別 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明實(shí)施例提供一種嵌套實(shí)體識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),其中方法包括:確定待識(shí)別文本;將待識(shí)別文本輸入至嵌套實(shí)體識(shí)別模型,得到嵌套實(shí)體識(shí)別模型輸出的簡(jiǎn)單實(shí)體識(shí)別結(jié)果和嵌套實(shí)體識(shí)別結(jié)果;其中,嵌套實(shí)體識(shí)別模型是基于樣本文本,以及樣本文本對(duì)應(yīng)的樣本簡(jiǎn)單實(shí)體識(shí)別結(jié)果和樣本嵌套實(shí)體識(shí)別結(jié)果訓(xùn)練得到的;嵌套實(shí)體識(shí)別模型用于基于待識(shí)別文本,確定簡(jiǎn)單實(shí)體識(shí)別結(jié)果,并基于待識(shí)別文本以及簡(jiǎn)單實(shí)體識(shí)別結(jié)果,確定嵌套實(shí)體識(shí)別結(jié)果。本發(fā)明實(shí)施例提供的嵌套實(shí)體識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),僅需一個(gè)模型即可實(shí)現(xiàn)嵌套實(shí)體及其內(nèi)部簡(jiǎn)單實(shí)體的識(shí)別,且展現(xiàn)出了嵌套實(shí)體及其內(nèi)部簡(jiǎn)單實(shí)體之間的嵌套關(guān)系。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,尤其涉及一種嵌套實(shí)體識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù)
實(shí)體識(shí)別作為自然語(yǔ)言處理過(guò)程中的重要步驟,被廣泛應(yīng)用到信息抽取、信息檢索、信息推薦等任務(wù)中。由于自然語(yǔ)言存在多樣性,大量文本中存在著嵌套實(shí)體。此處,嵌套實(shí)體是指整體上構(gòu)成一個(gè)實(shí)體,同時(shí)其內(nèi)部還包含了若干個(gè)簡(jiǎn)單實(shí)體的情況。因此,為了正確識(shí)別出嵌套實(shí)體,需要識(shí)別出文本中的嵌套實(shí)體與其內(nèi)部的簡(jiǎn)單實(shí)體之間的嵌套關(guān)系。
然而,現(xiàn)有技術(shù)通常采用序列標(biāo)注模型進(jìn)行實(shí)體識(shí)別,而現(xiàn)有的序列標(biāo)注模型僅能輸出一個(gè)序列標(biāo)記結(jié)果,無(wú)法既識(shí)別出嵌套實(shí)體又識(shí)別出其內(nèi)部的簡(jiǎn)單實(shí)體。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種嵌套實(shí)體識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),用以解決現(xiàn)有序列標(biāo)注方法無(wú)法既識(shí)別出嵌套實(shí)體又識(shí)別出其內(nèi)部的簡(jiǎn)單實(shí)體的問(wèn)題。
第一方面,本發(fā)明實(shí)施例提供一種嵌套實(shí)體識(shí)別方法,包括:
確定待識(shí)別文本;
將所述待識(shí)別文本輸入至嵌套實(shí)體識(shí)別模型,得到所述嵌套實(shí)體識(shí)別模型輸出的簡(jiǎn)單實(shí)體識(shí)別結(jié)果和嵌套實(shí)體識(shí)別結(jié)果;
其中,所述嵌套實(shí)體識(shí)別模型是基于樣本文本,以及所述樣本文本對(duì)應(yīng)的樣本簡(jiǎn)單實(shí)體識(shí)別結(jié)果和樣本嵌套實(shí)體識(shí)別結(jié)果訓(xùn)練得到的;
所述嵌套實(shí)體識(shí)別模型用于基于所述待識(shí)別文本,確定所述簡(jiǎn)單實(shí)體識(shí)別結(jié)果,并基于所述待識(shí)別文本以及所述簡(jiǎn)單實(shí)體識(shí)別結(jié)果,確定所述嵌套實(shí)體識(shí)別結(jié)果。
可選地,所述將所述待識(shí)別文本輸入至嵌套實(shí)體識(shí)別模型,得到所述嵌套實(shí)體識(shí)別模型輸出的簡(jiǎn)單實(shí)體識(shí)別結(jié)果和嵌套實(shí)體識(shí)別結(jié)果,具體包括:
將所述待識(shí)別文本的第一文本向量輸入至所述嵌套實(shí)體識(shí)別模型的簡(jiǎn)單實(shí)體識(shí)別層,得到所述簡(jiǎn)單實(shí)體識(shí)別層輸出的所述簡(jiǎn)單實(shí)體識(shí)別結(jié)果;
將所述簡(jiǎn)單實(shí)體識(shí)別結(jié)果輸入至所述嵌套實(shí)體識(shí)別模型的注意力層,得到所述注意力層輸出的簡(jiǎn)單實(shí)體注意力向量;
將所述簡(jiǎn)單實(shí)體注意力向量以及所述待識(shí)別文本的第二文本向量輸入至所述嵌套實(shí)體識(shí)別模型的嵌套實(shí)體識(shí)別層,得到所述嵌套實(shí)體識(shí)別層輸出的所述嵌套實(shí)體識(shí)別結(jié)果。
可選地,所述第一文本向量包括所述待識(shí)別文本中每個(gè)字的字向量,以及所述待識(shí)別文本中每個(gè)字的詞典特征向量和/或詞性特征向量。
可選地,所述待識(shí)別文本中每個(gè)字的詞典特征向量是將所述待識(shí)別文本與預(yù)先構(gòu)建的領(lǐng)域詞典匹配得到的;
其中,任一字的詞典特征向量表示所述任一字在所述領(lǐng)域詞典中匹配的實(shí)體的類(lèi)型以及所述任一字在所述匹配的實(shí)體中的位置。
可選地,所述將所述簡(jiǎn)單實(shí)體注意力向量以及所述待識(shí)別文本的文本向量輸入至所述嵌套實(shí)體識(shí)別模型的嵌套實(shí)體識(shí)別層,得到所述嵌套實(shí)體識(shí)別層輸出的所述嵌套實(shí)體識(shí)別結(jié)果,之后還包括:
將所述簡(jiǎn)單實(shí)體識(shí)別結(jié)果和/或所述嵌套實(shí)體識(shí)別結(jié)果輸入至所述嵌套實(shí)體識(shí)別模型的結(jié)果矯正層,得到所述結(jié)果矯正層輸出的矯正后的簡(jiǎn)單實(shí)體識(shí)別結(jié)果和/或嵌套實(shí)體識(shí)別結(jié)果。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于科大訊飛(蘇州)科技有限公司;訊飛智元信息科技有限公司,未經(jīng)科大訊飛(蘇州)科技有限公司;訊飛智元信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010566433.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體關(guān)系識(shí)別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于實(shí)體對(duì)齊的屬性融合方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





