[發明專利]疾病蘊含訓練集的構造方法及裝置有效
| 申請號: | 202010215876.3 | 申請日: | 2020-03-24 |
| 公開(公告)號: | CN111599478B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 任禾 | 申請(專利權)人: | 云知聲智能科技股份有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16H70/00 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 陳國軍 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 疾病 蘊含 訓練 構造 方法 裝置 | ||
本發明提供了疾病蘊含訓練集的構造方法,包括:基于預先存儲的疾病數據集,建立疾病知識樹結構;基于建立的疾病知識樹結構,構造相應的蘊含關系和不蘊含關系;根據所述蘊含關系和不蘊含關系,構造疾病蘊含訓練集。通過對疾病知識樹結構進行加工處理得到蘊含和不蘊含關系,并實現自動構造疾病蘊含數據集的目的,其速度快,可大大減少人工的工作量。
技術領域
本發明涉及醫療疾病技術領域,特別涉及疾病蘊含訓練集的構造方法及裝置。
背景技術
疾病蘊含關系對分析疾病之間的關系十分重要,一般對疾病蘊含關系是采用單純的人工進行構建的,但是人工構建不僅需要大量的專業知識,還需要大量的專業人員對目前10萬量級的疾病術語進行人工標注,工作量很大,耗時耗力,而且,還可能存在人為疏忽,導致構造的疾病蘊含關系不合理,因此智能化構造疾病蘊含訓練集就顯得尤為重要。
發明內容
本發明提供疾病蘊含訓練集的構造方法及裝置,用以通過對疾病知識樹結構進行加工處理得到蘊含和不蘊含關系,并實現自動構造疾病蘊含數據集的目的,其速度快,可大大減少人工的工作量。
本發明提供疾病蘊含訓練集的構造方法,包括:
步驟S1:基于預先存儲的疾病數據集,建立疾病知識樹結構;
步驟S2:基于建立的疾病知識樹結構,構造相應的蘊含關系和不蘊含關系;
步驟S3:根據所述蘊含關系和不蘊含關系,構造疾病蘊含訓練集。
在一種可能實現的方式中,在執行所述步驟S1之后,且在執行所述步驟S2之前,包括:
步驟S11:獲取所述疾病知識樹結構中的第一節點對應的第一預設詞匯;
步驟S12:確定所獲取的所述第一預設詞匯對應的祖先節點的第二預設詞匯;
步驟S13:判斷所述第一預設詞匯是否與所述第二預設詞匯相同,若是,保留所述第二預設詞匯對應的祖先節點,并消除第一預設詞匯對應的第一節點;否則,不執行任何操作。
在一種可能實現的方式中,在執行所述步驟S13之后,且在執行所述步驟S2之前,還包括:
步驟S131:獲取所述疾病知識樹結構中的第三預設詞匯對應的待消除節點;
步驟S132:確定所有所述第三預設詞匯在所述疾病知識樹結構中的位置權重;
步驟S133:根據所確定的位置權重結果,獲取第三預設詞匯的最大位置權重;
步驟S134:根據所獲取的最大位置權重,保留所述最大位置權重對應的待消除節點,同時消除其余待消除節點。
在一種可能實現的方式中,在執行所述步驟S134之后,且在執行所述步驟S2之前,還包括:
步驟1341:在所述步驟S134的基礎上獲取所述疾病知識樹結構中的剩余節點,確定所述剩余節點中的每個非葉子節點的節點長度,并將節點長度大于預設長度、且符合疾病命名規則的非葉子節點標記為描述性節點,其余非葉子節點標記為非描述性節點,其中,所述描述性節點不作為構造疾病蘊含訓練集的候選節點;
步驟S1342:獲取所述疾病知識樹結構中的葉子節點,根據所述葉子節點和與所述葉子節點相關的非描述性節點,構造節點蘊含關系規則;
同時,根據所述剩余節點,構造新的疾病知識樹結構。
在一種可能實現的方式中,在執行所述步驟S2的過程中,根據所述新的疾病知識樹結構,構造相應的蘊含關系,其步驟包括:
步驟S21:獲取所述新的疾病知識樹結構中的葉子節點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司,未經云知聲智能科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010215876.3/2.html,轉載請聲明來源鉆瓜專利網。





