[發(fā)明專利]一種基于LSTM-CRF的中醫(yī)臨床醫(yī)案癥狀命名實(shí)體抽取系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202111279393.0 | 申請(qǐng)日: | 2021-10-29 |
| 公開(公告)號(hào): | CN113962227A | 公開(公告)日: | 2022-01-21 |
| 發(fā)明(設(shè)計(jì))人: | 林麗開;李剛;丁海雁 | 申請(qǐng)(專利權(quán))人: | 南京醫(yī)路云數(shù)字科技研究院有限公司 |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06N3/04;G06F16/35 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 210000 江蘇省南京市江北新*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 lstm crf 中醫(yī) 臨床 醫(yī)案 癥狀 命名 實(shí)體 抽取 系統(tǒng) | ||
本發(fā)明屬于中醫(yī)臨床技術(shù)領(lǐng)域,尤其為一種基于LSTM?CRF的中醫(yī)臨床醫(yī)案癥狀命名實(shí)體抽取系統(tǒng),包括LSTM?CRF網(wǎng)絡(luò)模型,所述LSTM?CRF網(wǎng)絡(luò)模型包括輸入層、特征提取層、LSTM層和CRF層;所述輸入層用于獲取中醫(yī)臨床醫(yī)案癥狀的文本信息;所述特征提取層用于對(duì)輸入的文本信息的每一個(gè)字進(jìn)行特征提取,并制定特征模板;所述LSTM層用于自動(dòng)提取文字的特征;所述CRF層用于文字級(jí)別的序列標(biāo)注,生成最優(yōu)標(biāo)注序列;本發(fā)明的命名實(shí)體抽取系統(tǒng),利用新型的LSTM?CRF網(wǎng)絡(luò)模型,并將輸入的詞條信息分成獨(dú)立的文字,并且將文字按照偏旁部首的不同進(jìn)行分類,大大提升了分詞和字性標(biāo)記的性能,識(shí)別能力大大提高,對(duì)于復(fù)雜實(shí)體也能夠較為精準(zhǔn)的識(shí)別和標(biāo)記,降低了系統(tǒng)的錯(cuò)誤率。
技術(shù)領(lǐng)域
本發(fā)明屬于中醫(yī)臨床技術(shù)領(lǐng)域,具體涉及一種基于LSTM-CRF的中醫(yī)臨床醫(yī)案癥狀命名實(shí)體抽取系統(tǒng)。
背景技術(shù)
中醫(yī)的臨床本身是以中醫(yī)理論為依托,即運(yùn)用中醫(yī)理論有效地指導(dǎo)中醫(yī)臨床實(shí)踐,從診法到辨證直至選方用藥都離不開中醫(yī)理論。
隨著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,深度學(xué)習(xí)不僅占據(jù)了模式識(shí)別等領(lǐng)域的統(tǒng)治地位,而且已應(yīng)用到自然語(yǔ)言處理的各個(gè)方面,如中文命名實(shí)體識(shí)別,在對(duì)中醫(yī)臨床醫(yī)案癥狀命名進(jìn)行識(shí)別時(shí),構(gòu)件了內(nèi)嵌條件隨機(jī)場(chǎng)的長(zhǎng)短時(shí)神經(jīng)網(wǎng)絡(luò)模型,使用長(zhǎng)短時(shí)神經(jīng)網(wǎng)絡(luò)模型隱含層的上下文向量作為輸出層標(biāo)注的特征,使用內(nèi)嵌的條件隨機(jī)場(chǎng)模型表示標(biāo)注之間的約束關(guān)系。
在智慧醫(yī)療的大背景下,促進(jìn)中醫(yī)醫(yī)學(xué)的發(fā)展已成為國(guó)家發(fā)展戰(zhàn)略,而中醫(yī)臨床醫(yī)案癥狀是中醫(yī)醫(yī)學(xué)的核心之一,也是準(zhǔn)確適應(yīng)“對(duì)癥下藥”措施以及進(jìn)一步查詢和分析的關(guān)鍵,如何從海量中醫(yī)臨床醫(yī)案癥狀集中自動(dòng)識(shí)別專有詞匯并加以歸類,是中醫(yī)醫(yī)學(xué)數(shù)字化發(fā)展的關(guān)鍵,從醫(yī)案中識(shí)別病名、藥方等常見(jiàn)醫(yī)學(xué)術(shù)語(yǔ),一直以來(lái)都是醫(yī)學(xué)領(lǐng)域研究的重點(diǎn),其對(duì)醫(yī)學(xué)的發(fā)展、經(jīng)驗(yàn)知識(shí)的獲得以及輔助醫(yī)生臨床決策等都起到了至關(guān)重要的作用。
隨著科學(xué)技術(shù)的發(fā)展,以及人們對(duì)深度神經(jīng)網(wǎng)絡(luò)研究的伸入,利用深度學(xué)習(xí)方法進(jìn)行實(shí)體識(shí)別,逐步取代了傳統(tǒng)的人工分類方法,其準(zhǔn)確率和識(shí)別效率都更高,但是,傳統(tǒng)用于中醫(yī)臨床醫(yī)案癥狀命名實(shí)體識(shí)別的識(shí)別類型還局限于一些如病名的簡(jiǎn)單實(shí)體,對(duì)于復(fù)雜實(shí)體來(lái)說(shuō),識(shí)別精度和效率會(huì)大打折扣。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中存在的上述問(wèn)題,本發(fā)明提供了一種基于LSTM-CRF的中醫(yī)臨床醫(yī)案癥狀命名實(shí)體抽取系統(tǒng),具有識(shí)別精度高的特點(diǎn)。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于LSTM-CRF的中醫(yī)臨床醫(yī)案癥狀命名實(shí)體抽取系統(tǒng),包括LSTM-CRF網(wǎng)絡(luò)模型,所述LSTM-CRF網(wǎng)絡(luò)模型包括輸入層、特征提取層、LSTM層和CRF層;所述輸入層用于獲取中醫(yī)臨床醫(yī)案癥狀的文本信息;所述特征提取層用于對(duì)輸入的文本信息的每一個(gè)字進(jìn)行特征提取,并制定特征模板;所述LSTM層用于自動(dòng)提取文字的特征;所述CRF層用于文字級(jí)別的序列標(biāo)注,生成最優(yōu)標(biāo)注序列。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述特征提取層提取的文字特征包括文字的字符特征、字性特征、偏旁部首特征以及字意特征,對(duì)輸入文字信息的每一個(gè)字進(jìn)行標(biāo)注,生成單個(gè)字的輸出特征,所有字的輸出特征組成特征序列。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述特征提取層中,是依據(jù)中醫(yī)臨床醫(yī)案癥狀類別標(biāo)簽和BMEWO標(biāo)記法對(duì)輸入的每一個(gè)字進(jìn)行標(biāo)注。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述特征提取層包括兩個(gè)LSTM深度網(wǎng)絡(luò),且兩個(gè)LSTM深度網(wǎng)絡(luò)拼接成雙向LSTM深度網(wǎng)絡(luò)。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述雙向LSTM深度網(wǎng)絡(luò)包括輸入門、忘記門和輸出門,其中:
輸入門,根據(jù)網(wǎng)絡(luò)需要制定有用的信息輸入,阻斷無(wú)用的信息輸入;
忘記門,選擇有價(jià)值的信息保存在網(wǎng)絡(luò)中;
輸出門,控制序列輸出對(duì)當(dāng)前標(biāo)注有用的信息,防止對(duì)當(dāng)前標(biāo)注無(wú)用的信息輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京醫(yī)路云數(shù)字科技研究院有限公司,未經(jīng)南京醫(yī)路云數(shù)字科技研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111279393.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于高階長(zhǎng)短期記憶網(wǎng)絡(luò)的系統(tǒng)和方法
- 基于深度學(xué)習(xí)LSTM的空調(diào)故障診斷方法
- 基于注意力機(jī)制的時(shí)間序列預(yù)測(cè)方法、裝置及存儲(chǔ)介質(zhì)
- 一種基于PCA-LSTM網(wǎng)絡(luò)的廢水處理智能監(jiān)控方法
- 一種基于FAF-LSTM深度神經(jīng)網(wǎng)絡(luò)的居民負(fù)荷預(yù)測(cè)方法及系統(tǒng)
- 用于預(yù)測(cè)血糖水平的循環(huán)神經(jīng)網(wǎng)絡(luò)裝置和系統(tǒng)
- 基于情景LSTM結(jié)構(gòu)網(wǎng)絡(luò)的微博情感分析方法
- 語(yǔ)音信號(hào)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 基于約束并行LSTM分位數(shù)回歸的電力負(fù)荷概率預(yù)測(cè)方法
- 基于深度網(wǎng)絡(luò)AS-LSTM的命名實(shí)體識(shí)別系統(tǒng)及識(shí)別方法
- 鑒定利用促腎上腺皮質(zhì)激素釋放因子受體來(lái)調(diào)節(jié)肌肉質(zhì)量或功能的化合物的方法
- 一種實(shí)現(xiàn)漫游計(jì)費(fèi)的方法及系統(tǒng)
- 一種基于分組數(shù)據(jù)流計(jì)費(fèi)的處理方法及系統(tǒng)
- 一種基于分組數(shù)據(jù)流計(jì)費(fèi)的系統(tǒng)及處理方法
- 一種CRF識(shí)別器的訓(xùn)練及技術(shù)及其屬性名關(guān)系對(duì)抽取方法
- 一種命名實(shí)體識(shí)別方法、裝置及系統(tǒng)
- 一種CRF的監(jiān)查方法及裝置
- 一種數(shù)據(jù)分析方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 生成CRF表單的移動(dòng)終端界面的方法和裝置
- 促腎上腺皮質(zhì)素釋放因子-結(jié)合蛋白抑制劑及其用途
- 中醫(yī)健康管理系統(tǒng)及智能終端
- 基于中醫(yī)體質(zhì)辨識(shí)的健康管理系統(tǒng)及智能終端
- 一種中醫(yī)古代文獻(xiàn)半監(jiān)督學(xué)習(xí)方法和系統(tǒng)
- 一種中醫(yī)健康狀態(tài)多維辨識(shí)系統(tǒng)
- 中醫(yī)體質(zhì)類型檢測(cè)方法及裝置
- 一種基于證素的中醫(yī)輔助診斷系統(tǒng)
- 基于DAELA-LSTM神經(jīng)網(wǎng)絡(luò)的痛經(jīng)中醫(yī)辨證系統(tǒng)
- 一種基于中醫(yī)養(yǎng)生功法的健康數(shù)據(jù)管理平臺(tái)
- 一種面向中醫(yī)古籍文獻(xiàn)的分詞方法和裝置
- 數(shù)據(jù)處理方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)





