[發明專利]一種確定醫療數據屬性數據的方法和裝置有效
| 申請號: | 201810645565.3 | 申請日: | 2018-06-21 |
| 公開(公告)號: | CN108831560B | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 杜麗萍;胡可云 | 申請(專利權)人: | 北京嘉和海森健康科技有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F16/33 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 醫療 數據 屬性 方法 裝置 | ||
1.一種確定醫療數據屬性數據的方法,其特征在于,包括:
根據目標醫療本體和對應的預設醫療本體屬性,獲得第一屬性數據,所述第一屬性數據包括第一屬性值和其他屬性值,所述目標醫療本體是從醫療本體詞典中確定的,所述醫療本體詞典基于醫療命名實體識別技術得到的,所述第一屬性數據來源于多個實際醫療文本信息;
統計包括所述第一屬性值的實際醫療文本信息數量和包括所述其他屬性值的實際醫療文本信息數量;
根據所述包括所述第一屬性值的實際醫療文本信息數量和所述包括所述其他屬性值的實際醫療文本信息數量,獲得所述第一屬性值的分值;
若所述第一屬性值的分值大于第一目標閾值,確定所述第一屬性值為所述目標醫療本體的預設醫療本體屬性數據;
其中,所述第一目標閾值的獲得步驟包括:
根據所述第一屬性值的數量和所述其他屬性值的數量,獲得所述其他屬性值的分值;
根據所述第一屬性值的分值、所述其他屬性值的分值和期望公式,獲得所述第一屬性值的分值與所述其他屬性值的分值的期望作為所述第一目標閾值。
2.根據權利要求1所述的方法,其特征在于,所述目標醫療本體包括目標疾病、目標癥狀、目標檢查、目標體征、目標手術、目標藥品、目標檢驗、目標病因、目標誘因或目標過敏原。
3.根據權利要求1所述的方法,其特征在于,所述根據所述包括所述第一屬性值的實際醫療文本信息數量和所述包括所述其他屬性值的實際醫療文本信息數量,獲得所述第一屬性值的分值,包括:
根據所述包括所述第一屬性值的實際醫療文本信息數量、所述包括所述其他屬性值的實際醫療文本信息數量和概率公式,獲得所述第一屬性值對應的概率;
根據所述第一屬性值對應的概率和預設算法,獲得所述第一屬性值的分值。
4.根據權利要求1所述的方法,其特征在于,還包括:
根據目標醫療本體和對應的預設醫療本體屬性,獲得第二屬性值和所述第二屬性值對應的權重,所述第二屬性值來源于不同數據源的醫療知識文本信息,所述第二屬性值與所述第一屬性值和所述其他屬性值均不同;
根據所述第二屬性值對應的權重和預設算法,獲得所述第二屬性值的分值;
若所述第二屬性值的分值大于第二目標閾值,確定所述第二屬性值屬于所述目標醫療本體的預設醫療本體屬性。
5.根據權利要求1所述的方法,其特征在于,所述根據目標醫療本體和對應的預設醫療本體屬性,獲得第一屬性數據,包括:
根據目標醫療本體,獲取所述多個實際醫療文本信息;
根據所述預設醫療本體屬性,確定所述多個實際醫療文本信息中對應所述預設醫療本體屬性的多個實際醫療段落信息;
根據所述預設醫療本體屬性和對應的典型過濾規則,利用自然語言技術抽取所述多個實際醫療段落信息,獲得所述第一屬性數據。
6.根據權利要求5所述的方法,其特征在于,所述根據所述預設醫療本體屬性和對應的典型過濾規則,利用自然語言技術抽取所述多個實際醫療段落信息,獲得所述第一屬性數據,包括:
根據所述典型過濾規則,過濾所述多個實際醫療段落信息中與所述預設醫療本體屬性相異的數據;
根據所述預設醫療本體屬性,利用分詞、詞性標注和命名實體識別技術抽取過濾后的多個實際醫療段落信息,獲得所述第一屬性數據。
7.根據權利要求5所述的方法,其特征在于,在所述獲取多個實際醫療文本信息之后,還包括:
對所述多個實際醫療文本信息進行數據清洗;
對數據清洗后的多個實際醫療文本信息進行數據規范。
8.一種確定醫療數據屬性數據的裝置,其特征在于,包括:
第一獲得單元,用于根據目標醫療本體和對應的預設醫療本體屬性,獲得第一屬性數據,所述第一屬性數據包括第一屬性值和其他屬性值,所述目標醫療本體是從醫療本體詞典中確定的,所述醫療本體詞典基于醫療命名實體識別技術得到的,所述第一屬性數據來源于多個實際醫療文本信息;
統計單元,用于統計包括所述第一屬性值的實際醫療文本信息數量和包括所述其他屬性值的實際醫療文本信息數量;
第二獲得單元,用于根據所述包括所述第一屬性值的實際醫療文本信息數量和所述包括所述其他屬性值的實際醫療文本信息數量,獲得所述第一屬性值的分值;
確定單元,用于若所述第一屬性值的分值大于第一目標閾值,確定所述第一屬性值為所述目標醫療本體的預設醫療本體屬性數據;
所述裝置還包括:
第一目標閾值獲得單元,用于根據所述第一屬性值的數量和所述其他屬性值的數量,獲得所述其他屬性值的分值;根據所述第一屬性值的分值、所述其他屬性值的分值和期望公式,獲得所述第一屬性值的分值與所述其他屬性值的分值的期望作為所述第一目標閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘉和海森健康科技有限公司,未經北京嘉和海森健康科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810645565.3/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





