[發(fā)明專利]一種多神經(jīng)網(wǎng)絡(luò)協(xié)作的軍事領(lǐng)域命名實(shí)體識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010315730.6 | 申請(qǐng)日: | 2020-04-21 |
| 公開(kāi)(公告)號(hào): | CN111680511A | 公開(kāi)(公告)日: | 2020-09-18 |
| 發(fā)明(設(shè)計(jì))人: | 尹學(xué)振;趙慧;陳沁蕙;李欣妍 | 申請(qǐng)(專利權(quán))人: | 華東師范大學(xué) |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海德禾翰通律師事務(wù)所 31319 | 代理人: | 陳艷娟 |
| 地址: | 200241 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 神經(jīng)網(wǎng)絡(luò) 協(xié)作 軍事 領(lǐng)域 命名 實(shí)體 識(shí)別 方法 | ||
1.一種多神經(jīng)網(wǎng)絡(luò)協(xié)作的軍事領(lǐng)域命名實(shí)體識(shí)別方法,其特征在于,包含以下步驟:
步驟A:獲取公開(kāi)的文本數(shù)據(jù),形成原始數(shù)據(jù)集;
步驟B:結(jié)合領(lǐng)域知識(shí),提出考慮實(shí)體模糊邊界的軍事領(lǐng)域?qū)嶓w標(biāo)注策略,制定軍事領(lǐng)域命名實(shí)體分類標(biāo)準(zhǔn);
步驟C:針對(duì)所述原始數(shù)據(jù)集進(jìn)行文本預(yù)處理,結(jié)合步驟B中實(shí)體標(biāo)注策略及實(shí)體分類標(biāo)準(zhǔn)構(gòu)建軍事語(yǔ)料集MilitaryCorpus;
步驟D:利用深度學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)的框架,訓(xùn)練基于BERT-BiLSTM-CRF網(wǎng)絡(luò)結(jié)構(gòu)的多神經(jīng)網(wǎng)絡(luò)協(xié)作軍事領(lǐng)域命名實(shí)體識(shí)別模型,以進(jìn)行針對(duì)文本數(shù)據(jù)的軍事領(lǐng)域命名實(shí)體識(shí)別任務(wù)。
2.如權(quán)利要求1所述的多神經(jīng)網(wǎng)絡(luò)協(xié)作的軍事領(lǐng)域命名實(shí)體識(shí)別方法,其特征在于,所述文本數(shù)據(jù)來(lái)源于微博。
3.如權(quán)利要求1所述的多神經(jīng)網(wǎng)絡(luò)協(xié)作的軍事領(lǐng)域命名實(shí)體識(shí)別方法,其特征在于,步驟B包括:
步驟B1:除通用的人員名稱、時(shí)間、地名外,針對(duì)軍事領(lǐng)域特殊的軍銜和軍職、軍事機(jī)構(gòu)、軍事設(shè)施、軍事事件、武器裝備5種類別的實(shí)體給出定義:將表示用于軍事目的的建筑、場(chǎng)地和設(shè)施標(biāo)注為軍事設(shè)施實(shí)體;將表示軍事有關(guān)的院校、軍事行政單位、政府機(jī)關(guān)、作戰(zhàn)部隊(duì)或組織標(biāo)注為軍事機(jī)構(gòu)實(shí)體;將表示與軍事領(lǐng)域相關(guān)的軍事演習(xí)、武裝沖突、武裝襲擊、政治事件標(biāo)注為軍事事件實(shí)體;槍械、火炮、飛行器、彈藥、坦克、艦艇、導(dǎo)彈、生化武器、核武器標(biāo)注為武器裝備實(shí)體;
步驟B2:結(jié)合專業(yè)知識(shí)和文獻(xiàn)資料,提出考慮模糊邊界的實(shí)體標(biāo)注規(guī)則:
規(guī)則1:英文字母,短橫線,數(shù)字與武器裝備相連,將英文字母,短橫線,數(shù)字與武器裝備整體標(biāo)注為武器裝備實(shí)體;
規(guī)則2:軍事機(jī)構(gòu)與武器裝備相連,若武器裝備為軍事機(jī)構(gòu)獨(dú)有,則分別標(biāo)注為軍事機(jī)構(gòu)實(shí)體和武器裝備實(shí)體;若武器裝備不是軍事機(jī)構(gòu)獨(dú)有,軍事機(jī)構(gòu)和武器裝備的整體標(biāo)注為武器裝備實(shí)體;
規(guī)則3:軍事機(jī)構(gòu)與軍事機(jī)構(gòu)相連,以最低的機(jī)構(gòu)級(jí)別為準(zhǔn),將多個(gè)軍事機(jī)構(gòu)相連的整體標(biāo)注為軍事機(jī)構(gòu)實(shí)體;
規(guī)則4:軍事機(jī)構(gòu)或軍事地名與軍銜相連,將相連的整體標(biāo)注為軍銜和軍職實(shí)體;
規(guī)則5:軍事地名/軍事機(jī)構(gòu)與軍事設(shè)施相連,若軍事設(shè)施為具有具體名稱的軍事設(shè)施,則分別標(biāo)注為軍事地名/軍事機(jī)構(gòu)實(shí)體和軍事設(shè)施實(shí)體;若軍事設(shè)施沒(méi)有具體名稱則將相連的整體標(biāo)注為軍事設(shè)施實(shí)體。
4.如權(quán)利要求1所述的多神經(jīng)網(wǎng)絡(luò)協(xié)作的軍事領(lǐng)域命名實(shí)體識(shí)別方法,其特征在于,步驟C包括:
步驟C1:對(duì)所述的原始數(shù)據(jù)集進(jìn)行清洗,刪除不含軍事信息的數(shù)據(jù),刪除數(shù)據(jù)中的特殊符號(hào);所述特殊符號(hào)包括:表情、顏文字;
步驟C2:結(jié)合步驟B的考慮實(shí)體模糊邊界的軍事領(lǐng)域?qū)嶓w標(biāo)注策略,及軍事領(lǐng)域命名實(shí)體分類標(biāo)準(zhǔn),針對(duì)步驟C1處理后的文本進(jìn)行字級(jí)別的標(biāo)注,形成軍事領(lǐng)域命名實(shí)體語(yǔ)料集MilitaryCorpus。
5.如權(quán)利要求1所述的多神經(jīng)網(wǎng)絡(luò)協(xié)作的軍事領(lǐng)域命名實(shí)體識(shí)別方法,其特征在于,步驟D包括:
步驟D1:對(duì)軍事語(yǔ)料進(jìn)行句子級(jí)別的劃分,根據(jù)文本序列中的每一個(gè)字xijk生成特征向量ck,基于Transformer的雙向編碼器將所述特征向量ck轉(zhuǎn)換成帶有字特征和位置特征的字向量Ek;
步驟D2:將字向量序列輸入雙向長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)提取出上下文特征并生成特征矩陣Pk;
步驟D3:CRF層根據(jù)特征向量ck捕獲相鄰標(biāo)簽之間的依賴關(guān)系,并通過(guò)所述相鄰標(biāo)簽之間的依賴關(guān)系確定整個(gè)句子優(yōu)化的標(biāo)簽序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東師范大學(xué),未經(jīng)華東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010315730.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 一種基于業(yè)務(wù)規(guī)則的跨部門流程協(xié)同方法
- 基站協(xié)作的動(dòng)態(tài)連接方法、基站和協(xié)作多輸入多輸出系統(tǒng)
- 一種協(xié)作多點(diǎn)傳輸系統(tǒng)的信號(hào)發(fā)送方法及其裝置
- 協(xié)作方法、網(wǎng)絡(luò)和用戶終端
- 應(yīng)用程序協(xié)作系統(tǒng)、應(yīng)用程序協(xié)作方法以及應(yīng)用程序協(xié)作程序
- 協(xié)作多點(diǎn)傳輸方法、裝置和系統(tǒng)
- 一種面向智能終端的內(nèi)容下載應(yīng)用激勵(lì)方法及其系統(tǒng)
- 一種協(xié)作多點(diǎn)傳輸調(diào)度方法及裝置
- 一種協(xié)作實(shí)現(xiàn)方法和裝置
- 一種區(qū)塊鏈及智能合約系統(tǒng)協(xié)作層設(shè)計(jì)
- 一種特種燃料發(fā)動(dòng)機(jī)引動(dòng)力的多功能軍事坦克
- 一種基于大空間虛擬現(xiàn)實(shí)的多兵軍事訓(xùn)練考核系統(tǒng)
- 一種基于通用內(nèi)核本體的軍事領(lǐng)域本體構(gòu)建方法
- 一種軍事人員數(shù)據(jù)管理系統(tǒng)和方法
- 一種結(jié)合詞典的軍事想定文書實(shí)體信息抽取方法及裝置
- 一種用于軍事態(tài)勢(shì)建模的軍事對(duì)象表達(dá)裝置
- 一種基于多源數(shù)據(jù)融合模型的軍事訓(xùn)練水平綜合評(píng)估方法
- 一種軍事案例數(shù)據(jù)管理方法
- 一種軍事知識(shí)圖譜構(gòu)建方法及系統(tǒng)
- 多源軍事裝備知識(shí)關(guān)聯(lián)組織方法





