[發明專利]醫學文本表型信息的語義結構化處理方法在審
| 申請號: | 202011277020.5 | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112270965A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 蔣太交;鄧立宗 | 申請(專利權)人: | 蘇州系統醫學研究所 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G06F40/279;G06F40/30;G06F40/242 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 蔣慧妮 |
| 地址: | 215000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫學 文本 表型 信息 語義 結構 處理 方法 | ||
1.醫學文本表型信息的語義結構化處理方法,其特征在于:包括如下步驟:
S1、構建表型語義結構單元;所述表型語義包括表型概念及其關聯屬性集合;
S11、建立標準化屬性及其取值集合庫;
S12、基于S11中建立的標準化屬性及其取值集合庫,獲取疾病臨床指南中存在的表型概念和屬性術語,并將與表型概念共同出現在一個句子中的屬性設置為表型的潛在關聯屬性;
S13、對潛在關聯屬性進行判別,確認關聯的真實性,構建初始版本的表型語義結構單元;
S2、表型語義結構單元的自動識別;
S21、先進行表型概念識別;
S22、根據表型概念的上下文預測其關聯屬性,
S23、填充預定義的表型語義結構單元的屬性槽。
2.根據權利要求1所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述處理方法還包括,
S3、表型語義結構單元的交互校對
S31、使用BRAT文本標注工具可視化展示表型語義結構單元的自動識別結果;
S32、若識別結果有誤,進行人工修改標注核實。
3.根據權利要求1所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述S1中表型語義結構單元包括12種屬性,且根據不同屬性刻畫表型特征分為三類:
第一類,刻畫表型存在情況細節特征的屬性:包括表型的存在情況、人群頻率、發病年齡、發病性別和重癥輕癥;
第二類,刻畫表型具體表現細節特征的屬性:包括表型的緩急程度、嚴重程度、顏色外觀和感覺性質;
第三類,刻畫表型位置分布細節特征的屬性:包括表型的分布特征、偏側性和四分區。
4.根據權利要求1所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述S21表型概念的識別包括如下步驟:
S211、建立不同屬性標準取值的觸發詞數據庫,所述觸發詞包括詞語形式和數字形式的提示詞;
S212、對句子中屬性觸發詞進行識別,所述屬性觸發詞是指表型語義結構單元中某一屬性標準取值在醫學文本中的提示詞;
S213、分析判斷表型概念是否位于觸發詞的作用范圍內,若表型概念位于觸發詞范圍內,則找到該觸發詞對應的屬性槽,并更改該屬性槽的取值為該觸發詞對應的標準取值;若表型概念在觸發詞范圍外,則維持該屬性槽的取值為默認值;除存在情況屬性的默認取值為“存在”外,其余11個屬性的默認取值為“None”。
5.根據權利要求1所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述S1還包括表型語義結構單元調整優化步驟,
S14、通過對醫學文檔的迭代標注,檢驗表型語義結構單元對醫學文本中表型知識的表達力,以對表型語義結構單元進行調整和優化。
6.根據權利要求4所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述S211中包括56種不同屬性標準取值的觸發詞。
7.根據權利要求1所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述S21中表型概念的識別基于詞典掃描醫學文本中字符串的方法進行表型概念的識別;對于英文醫學文本,使用MetaMap工具,自動識別醫學文本中的表型概念;對于中文醫學文本,使用結巴分詞工具,通過將人類表型本體中文版配置為自定義詞典,實現中文醫學文本中表型概念的抽提。
8.根據權利要求1所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述S11中標準化屬性包括從國內外的醫學本體和臨床信息標準中搜集的342個屬性。
9.根據權利要求5所述的醫學文本表型信息的語義結構化處理方法,其特征在于:所述S14中醫學文檔包括臨床指南、疾病百科。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州系統醫學研究所,未經蘇州系統醫學研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011277020.5/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





