[發明專利]一種知識庫的構建方法和系統有效
| 申請號: | 202011106914.8 | 申請日: | 2019-01-15 |
| 公開(公告)號: | CN112233736B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 安寧;楊矯云;吉品;江思源 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G16H10/00 | 分類號: | G16H10/00;G16H50/70;G06F16/36;G06N5/04 |
| 代理公司: | 北京海虹嘉誠知識產權代理有限公司 11129 | 代理人: | 何志欣 |
| 地址: | 230009 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識庫 構建 方法 系統 | ||
1.一種知識庫的構建方法,其步驟至少包括:文獻單元(1)構建原始文獻庫,其特征在于,
所述構建方法還包括設置用于構建數據集的數據單元(2)、用于計算病癥之間的平均因果效應的因果單元(3)和用于存儲所述原始文獻庫、所述數據集和/或所述平均因果效應以構建能夠讀取和/或顯示的知識庫的知識單元(4);
所述文獻單元(1)能夠獲取眾多含有多種病癥的相關文獻并對其進行分類形成若干文獻單元體以構建原始文獻庫,以使得所述數據單元(2)能夠基于所述文獻單元體獲取主要特征參數并基于所述主要特征參數構建數據集;
所述構建方法的相關文獻分類至少包括以下步驟:
所述文獻單元(1)計算單詞/詞組的關聯性強度并基于所述關聯性強度修正聯合出現概率以獲取該文獻的關聯約化坐標;
所述文獻單元(1)構建所述文獻的關聯約化坐標,并基于全部的所述相關文獻的所述關聯約化坐標和所述關聯性強度構建的分類函數將所述相關文獻按照迭代算法的形式進行分類以形成若干所述文獻單元體,其中,所述分類函數能夠基于所述相關文獻的樣本量進行深度學習,從而增強所述文獻單元(1)的精度;
在所述數據單元(2)獲取了所述文獻單元體的情況下,所述數據單元(2)按照病癥對配對形成所述病癥對的方式獲取所述數據集;所述數據單元(2)對每一個所述相關文獻以自然語言處理的句法分析方式提取所述病癥對之間的關系,用以建立所述病癥對的關系知識庫,所述病癥對之間的關系包括正向關系、反向關系和垂直關系;
所述數據單元(2)基于關系知識表在所述文獻單元體內對包含有所述病癥對的文獻進行檢索以融合的方式獲取所述病癥對的關系信度值用以建立所述病癥對的關系信度值庫,其中,所述病癥對之間的關系包括正向關系信度值、反向關系信度值和垂直關系信度值;
所述因果單元(3)基于所述主要特征參數和所述數據集構建貝葉斯網絡,以通過數據模式分析病癥之間的平均因果效應,從而所述知識單元(4)能夠基于所述相關文獻以形成所述病癥之間的所述平均因果效應的對應關系的方式構建所述知識庫;
所述因果單元(3)按照如下方式構建貝葉斯網絡,
S31:基于所述關系知識庫構建貝葉斯網絡評價函數:
logP(G,D,KL)=logP(G)+logP(D|G)+logP(KL|G)
其中,G為貝葉斯網格,其取值包括了以L=(L1,L2……Ln)某一組病癥的具體病癥集合為節點的有向無環圖,P(G)為先驗分布,
結構G中任意一條邊表示為Lm→Ln,KL(Lm→Ln)為關系信度值,
S32:基于所述關系知識庫構建無向圖結構約束;對于所述數據集D,對所述數據集D中的任意病癥對Lm和Ln,通過檢索病癥對所述關系知識庫獲得屬性對Lm和Ln的病癥對編號,根據所述病癥對編號檢索文獻中病癥對Lm和Ln關系信度值表中的Lm→Ln的關系信度值和Ln→Lm的關系信度值,
S33:基于所述貝葉斯網絡評價函數和所述無向圖結構約束構建貝葉斯網絡;
對于期刊文獻,L1→L2的正向關系信度值還可以按照如下定義:
其中,C(Xi)為文獻Xi的可信度,公式為:C(Xi)=(IFi+1)×(CIi+1),Xi表示第i篇文獻,IFi為文獻Xi所在期刊的標準化后的影響因子,CIi為標準化后的引用量; 若沒有文獻存在L1和L2的關系,則KL(L1→L2)=0,KL(L2→L1)=0,KL(L1⊥L2)=1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011106914.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:矩形勻化光斑激光熔覆頭
- 下一篇:軸類備件用鋼及其軋后分段冷卻方法





