[發(fā)明專利]基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實體識別方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710906128.8 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN107818083A | 公開(公告)日: | 2018-03-20 |
| 發(fā)明(設(shè)計)人: | 趙淦森;劉創(chuàng)輝;王欣明;夏慧敏;梁會營;劉廣建;莊序填;席云;伍昱燊;余達(dá)明;唐華;龐雄文;聶瑞華 | 申請(專利權(quán))人: | 華南師范大學(xué);廣州市婦女兒童醫(yī)療中心(廣州市婦幼保健院;廣州市兒童醫(yī)院;廣州市婦嬰醫(yī)院) |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司44205 | 代理人: | 胡輝 |
| 地址: | 510631 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 三層 條件 隨機(jī) 疾病 數(shù)據(jù) 命名 實體 識別 方法 系統(tǒng) | ||
1.基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實體識別方法,其特征在于,包括以下步驟:
獲取兒童疾病文本數(shù)據(jù),將兒童疾病文本數(shù)據(jù)輸入三層條件隨機(jī)場模型的第一層進(jìn)行記錄信息識別,輸出第一層識別文本數(shù)據(jù);
將第一層識別文本數(shù)據(jù)輸入三層條件隨機(jī)場模型的第二層進(jìn)行簡單命名實體識別,輸出第二層識別文本數(shù)據(jù);
將第二層識別文本數(shù)據(jù)輸入三層條件隨機(jī)場模型的第三層進(jìn)行復(fù)雜命名實體識別,輸出最終命名實體識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實體識別方法,其特征在于,所述記錄信息為兒童疾病文本數(shù)據(jù)中記錄有疾病數(shù)據(jù)命名實體的句子信息,所述三層條件隨機(jī)場模型的第二層對簡單部位名稱和基本疾病名稱進(jìn)行實體識別,所述三層條件隨機(jī)場模型的第三層對部位名稱、疾病名稱以及癥狀名稱進(jìn)行實體識別。
3.根據(jù)權(quán)利要求1所述的基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實體識別方法,其特征在于,所述獲取兒童疾病文本數(shù)據(jù),將兒童疾病文本數(shù)據(jù)輸入三層條件隨機(jī)場模型的第一層進(jìn)行記錄信息識別,輸出第一層識別文本數(shù)據(jù)這一步驟具體包括以下步驟:
獲取兒童疾病文本數(shù)據(jù),從兒童疾病文本數(shù)據(jù)中獲取第一訓(xùn)練集和第一測試集;
對第一訓(xùn)練集和第一測試集進(jìn)行句子標(biāo)識;
獲取第一訓(xùn)練特征并生成第一訓(xùn)練特征函數(shù),獲取第一測試特征并生成第一測試特征函數(shù);
對第一訓(xùn)練集進(jìn)行參數(shù)估計,結(jié)合第一訓(xùn)練特征和第一訓(xùn)練特征函數(shù)進(jìn)行三層條件隨機(jī)場模型的第一層條件隨機(jī)場學(xué)習(xí);
根據(jù)三層條件隨機(jī)場模型的第一層條件隨機(jī)場學(xué)習(xí)結(jié)果生成第一條件隨機(jī)場訓(xùn)練模型;
用第一條件隨機(jī)場訓(xùn)練模型對第一訓(xùn)練集進(jìn)行記錄信息識別,并輸出記錄信息識別文本數(shù)據(jù),所述記錄信息識別文本數(shù)據(jù)作為三層條件隨機(jī)場模型的第二層訓(xùn)練集的輸入;
結(jié)合第一測試特征和第一測試特征函數(shù),利用第一條件隨機(jī)場訓(xùn)練模型對第一測試集進(jìn)行測試,輸出記錄信息測試文本數(shù)據(jù),所述記錄信息測試文本數(shù)據(jù)作為三層條件隨機(jī)場模型的第二層測試集的輸入。
4.根據(jù)權(quán)利要求3所述的基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實體識別方法,其特征在于,所述第一訓(xùn)練特征或第一測試特征包括句子特征、句子邊界特征以及第一上下文特征。
5.根據(jù)權(quán)利要求3所述的基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實體識別方法,其特征在于,所述對第一訓(xùn)練集和第一測試集進(jìn)行句子標(biāo)識這一步驟包括對第一訓(xùn)練集進(jìn)行句子語料標(biāo)注的步驟,所述對第一訓(xùn)練集進(jìn)行句子語料標(biāo)注的步驟具體包括以下步驟:
獲取8種標(biāo)簽:MB、ME、C、R、G、K、H和O;其中,MB、ME、C、R、G、K、H和O分別代表病歷記錄開頭、病歷記錄結(jié)尾、診斷屬性、入院情況屬性、病程與診療結(jié)果屬性、出院情況屬性、出院醫(yī)囑屬性和其他;
用所述8種標(biāo)簽對第一訓(xùn)練集進(jìn)行標(biāo)注。
6.根據(jù)權(quán)利要求3所述的基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實體識別方法,其特征在于,所述將第一層識別文本數(shù)據(jù)輸入三層條件隨機(jī)場模型的第二層進(jìn)行簡單命名實體識別,輸出第二層識別文本數(shù)據(jù)這一步驟具體包括以下步驟:
從記錄信息識別文本數(shù)據(jù)中獲取第二訓(xùn)練集,從記錄信息測試文本數(shù)據(jù)中獲取第二測試集;
對第二訓(xùn)練集和第二測試集進(jìn)行簡單命名實體標(biāo)識;
獲取第二訓(xùn)練特征并生成第二訓(xùn)練特征函數(shù),獲取第二測試特征并生成第二測試特征函數(shù);
對第二訓(xùn)練集進(jìn)行參數(shù)估計,結(jié)合第二訓(xùn)練特征和第二訓(xùn)練特征函數(shù)進(jìn)行三層條件隨機(jī)場模型第二層的條件隨機(jī)場學(xué)習(xí);
根據(jù)三層條件隨機(jī)場模型第二層的條件隨機(jī)場學(xué)習(xí)結(jié)果生成第二條件隨機(jī)場訓(xùn)練模型;
用第二條件隨機(jī)場訓(xùn)練模型對第二訓(xùn)練集進(jìn)行簡單命名實體識別,并輸出簡單識別文本數(shù)據(jù),所述簡單識別文本數(shù)據(jù)作為三層條件隨機(jī)場模型的第三層訓(xùn)練集的輸入;
結(jié)合第二測試特征和第二測試特征函數(shù),利用第二條件隨機(jī)場訓(xùn)練模型對第二測試集進(jìn)行測試,輸出簡單測試文本數(shù)據(jù),所述簡單測試文本數(shù)據(jù)作為三層條件隨機(jī)場模型的第三層測試集的輸入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南師范大學(xué);廣州市婦女兒童醫(yī)療中心(廣州市婦幼保健院、廣州市兒童醫(yī)院、廣州市婦嬰醫(yī)院),未經(jīng)華南師范大學(xué);廣州市婦女兒童醫(yī)療中心(廣州市婦幼保健院、廣州市兒童醫(yī)院、廣州市婦嬰醫(yī)院)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710906128.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 限制條件解決方法、限制條件解決裝置、以及限制條件解決系統(tǒng)
- 制造條件設(shè)定系統(tǒng)及制造條件設(shè)定方法
- 成形條件確定方法及成形條件確定系統(tǒng)
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫面
- 攝影條件設(shè)定設(shè)備、攝影條件設(shè)定方法和攝影條件設(shè)定程序
- 生理條件監(jiān)視系統(tǒng)、生理條件傳感器和生理條件儀表
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫面
- 條件訪問設(shè)備
- 用于條件切換的裝置、方法、介質(zhì)和系統(tǒng)
- 基于條件分布的條件生成對抗網(wǎng)絡(luò)
- 隨機(jī)數(shù)生成設(shè)備及控制方法、存儲器存取控制設(shè)備及通信設(shè)備
- 隨機(jī)接入方法、用戶設(shè)備、基站及系統(tǒng)
- 真隨機(jī)數(shù)檢測裝置及方法
- 隨機(jī)元素生成方法及隨機(jī)元素生成裝置
- 數(shù)據(jù)交互方法、裝置、服務(wù)器和電子設(shè)備
- 一種隨機(jī)數(shù)發(fā)生器的多隨機(jī)源管理方法
- 用于彩票行業(yè)的隨機(jī)數(shù)獲取方法及系統(tǒng)
- 隨機(jī)接入方法、裝置及存儲介質(zhì)
- 偽隨機(jī)方法、系統(tǒng)、移動終端及存儲介質(zhì)
- 模型訓(xùn)練方法、裝置和計算設(shè)備





