[發明專利]中醫知識圖譜構建方法、裝置、電子設備及存儲介質在審
| 申請號: | 202310088044.3 | 申請日: | 2023-02-09 |
| 公開(公告)號: | CN116383396A | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 王亞強;羅靜;舒紅平 | 申請(專利權)人: | 成都信息工程大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F18/214;G06F18/24;G06F16/28;G16H20/90;G16H70/20 |
| 代理公司: | 北京元本知識產權代理事務所(普通合伙) 11308 | 代理人: | 曹廣生 |
| 地址: | 610225 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中醫 知識 圖譜 構建 方法 裝置 電子設備 存儲 介質 | ||
本發明公開了一種中醫知識圖譜構建方法、裝置、電子設備及存儲介質。方法包括基于數據集的數據特征確定待抽取實體以及待抽取的實體間關系;基于待抽取實體和待抽取的實體間關系多次對數據集進行實體抽取和關系抽取,針對多次抽取得到的實體和實體關系,選取抽象的具有概括意義的正面或負面例子來構建中醫知識圖譜指南;參考中醫知識圖譜指南,為數據集迭代進行實體抽取和關系抽取提高了抽取的效率,并在多次迭代過程中更新中醫知識圖譜指南;在迭代抽取過程中,計算標注一致性值,若標注一致性值達到預設閾值,則停止迭代,開始正式抽取實體和實體間關系,從而構建中醫知識圖譜。該方法可以有效地解決中醫知識實體和關系的認知統一問題,提高多人協同交互抽取實體和實體關系的一致性。
技術領域
本發明屬于數據處理領域,涉及一種中醫知識圖譜構建方法、裝置、電子設備及存儲介質。
背景技術
構建一個可靠的,高度關聯的中醫知識圖譜,需要知識圖譜中知識三元組的認知一致性達成統一;同時,在知識三元組認知統一之后,還需要保證所構建的知識圖譜的可靠性,控制出錯率,提升所構建的知識圖譜的質量。
目前,由于中醫領域知識的領域性,在知識圖譜的構建過程中經常存在專家盲點,即不同專家對同一實體概念的認知或表述往往也會存在不一致;而且目前醫學概念知識本體庫LinkBase、TAMBIS中存在很多冗余的醫學實體概念以及實體間關系,這樣會導致所構建的知識圖譜存在重復的實體及關系,不利于知識圖譜的檢索;另一方面,現有的中醫知識圖譜的構建需要投入大量的人工和時間成本,且構建過程中工作人員之間交互性不強,這樣構建的中醫知識圖譜的可靠性不高,不能給予醫生的臨床輔助決策和提高醫生的工作效率。
發明內容
本發明所要解決的技術問題是提供一種中醫知識圖譜構建方法,該方法能提高中醫知識圖譜構建的準確性。
發明的技術解決方案如下:
第一方面,提出一種中醫知識圖譜構建方法,包括:
獲取與中醫相關的數據集,并基于所述數據集的數據特征確定待抽取實體以及待抽取實體關系;其中,所述實體關系表征至少兩個待抽取實體之間的關系;
基于所述待抽取實體和所述待抽取實體關系多次對所述數據集進行實體抽取和關系抽取,基于多次抽取得到的實體和實體關系,選取抽象的具有概括意義的例子來構建中醫知識圖譜指南;
根據所述中醫知識圖譜指南,對所述數據集迭代進行實體抽取和關系抽取,并基于每輪抽取得到的實體和實體關系更新中醫知識圖譜指南;其中,每輪實體抽取和關系抽取時,多人獨立分別對所述數據集進行實體抽取和關系抽取;
獲取每輪實體抽取和關系抽取時,任意兩次抽取得到的實體和實體關系之間的標注一致性值,若所述標注一致性值達到預設閾值,則停止迭代進行實體抽取和關系抽取,并停止更新中醫知識圖譜指南,得到目標中醫知識圖譜指南;
參考所述目標中醫知識圖譜指南,對所述數據集進行實體抽取和實體關系,并基于抽取得到的實體和實體關系構建中醫知識圖譜。
進一步地,所述獲取與中醫相關的數據集,并基于所述數據集的數據特征確定待抽取實體以及待抽取實體關系,包括:
基于所述數據集的特征,隨機在所述數據集中抽取多條數據;
獲取不同成員針對所述多條數據進行待抽取實體以及待抽取實體關系所對應得到的各成員的實體和實體關系;
從所述各成員的實體和實體關系中進行選擇,得到一致性的所述待抽取實體以及所述待抽取實體關系。
進一步地,所述待抽取實體包括身體部位、癥狀、疾病、中藥名以及藥物克數;所述待抽取實體關系包括身體部位-癥狀關系、疾病-癥狀關系、疾病-中藥名關系、中藥名-藥物克數關系。
進一步地,所述基于所述待抽取實體和所述待抽取實體關系多次對所述數據集進行實體抽取和關系抽取,基于多次抽取得到的實體和實體關系,選取抽象的具有概括意義的例子來構建中醫知識圖譜指南,包括:
從所述數據集中抽取第一樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都信息工程大學,未經成都信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310088044.3/2.html,轉載請聲明來源鉆瓜專利網。





