[發明專利]特征提取方法、電子裝置及醫療案例相似度模型構建方法在審
| 申請號: | 202010182104.4 | 申請日: | 2020-03-16 |
| 公開(公告)號: | CN111310857A | 公開(公告)日: | 2020-06-19 |
| 發明(設計)人: | 楊斌;李琴;吳一多;馬婷婷;張建 | 申請(專利權)人: | 青島百洋智能科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 青島清泰聯信知識產權代理有限公司 37256 | 代理人: | 徐艷艷 |
| 地址: | 266000 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 提取 方法 電子 裝置 醫療 案例 相似 模型 構建 | ||
本發明涉及一種特征提取方法、電子裝置及醫療案例相似度模型構建方法,所述特征提取方法含有以下步驟:根據含有本體屬性的醫療診療案例數據集構建樣本訓練集,樣本總量為P,特征數量為N,設定近鄰的樣本數量為k;通過構建的改進的ReliefF算法模型計算每個特征相應的權重,并根據每個特征權重的大小對特征進行排序;以權重大于0為條件初步進行特征選擇;對初步選擇后的特征按照從大到小重新排序,利用FWKNN模型計算準確率,選擇準確率最高的特征組合作為最終特征。本發明不改變本體類型數據的特性,選擇的最終特征精確性高,應用于醫療案例相似度模型的構建時,提高了醫療案例相似度模型的準確率。
技術領域
本發明屬于數據處理技術領域,涉及醫療數據處理技術,具體地說,涉及一種醫療輔助決策模型的特征提取方法、電子裝置及醫療案例相似度模型構建方法。
背景技術
基于知識圖譜的建模方法是從知識理論的角度建立模型,已經呈為醫療智能輔助決策支撐模型構建的一種重要人工智能(英文:Artificial Intelligence,簡稱:AI)方法。知識圖譜模型的重要特征是概念知識以本體形式存在,即概念以樹層級結構進行存儲,因此,有些真實世界的醫療病例世界,實際上是本體概念的實例化存在,這些數據具有本體屬性,當應用這些數據進行機器學習模型構建的時候,作為本體類型的數據,而非數值型或枚舉型的數據,能更好地表達數據的特性,特別是在計算相似度時,本體類型的數據具有本體相似度計算方法。當應用知識圖譜和機器學習算法在構建醫療人工智能模型時,真實世界數據中會出現數值型、枚舉型、本體型三種數據類型存在,在計算案例相似度時,需要根據數據不同的屬性分別計算local相似度。在進行機器學習的相似度計算模型構建之前,需要進行數據特征(屬性)的選擇,其中包含了本體類型(通過樹層級結構描述)和結構數據類型的數據,特征選擇的算法必須滿足在算法計算過程中一直保持各特征的原有數據類型的特性。
目前,實現本體類型和結構數據類型的融合的特征選擇算法較少,在傳統的機器學習的特征選擇算法中,如Filter方法、Wrapprer方法、Embedded方法等,一般將數據處理成數值類型和枚舉類型,有些算法直接將本體類型的數據當作枚舉類型來對待,這種做法實際上并未保持本體類型數據的特征,不能在數據處理過程中保持本體類型數據的特性。KNN的特征權重計算方法也有一些常規算法,如Pearson相關系數方法、卡方檢驗特征權重算法、GA特征權重學習算法、決策樹GainRatio、RF誤差權重方法等,這些方法的計算過程一般不包含本體類型的數據,因此也是必須將本體類型的數據轉換成枚舉型的數據類型,不能在數據處理過程中保持本體類型數據的特性。鑒于醫療數據包括了本體類型的數據和結構數據類型的數據,現有特征提取及特征權重計算方法無法滿足本體類型數據和結構數據類型融合的多類型數據的特征選擇,不能有效保持醫療數據的本體特性,通過該方法構建的醫療輔助決策模型推薦結果并不準確。
發明內容
本發明針對現有技術存在的上述問題,提供了一種醫療輔助決策模型的特征提取方法、電子裝置及醫療案例相似度模型構建方法,能夠提高醫療輔助決策模型的推薦結果準確率。
為了達到上述目的,本發明提供了一種醫療輔助決策模型的特征提取方法,含有以下步驟:
根據含有本體屬性的醫療診療案例數據集構建樣本訓練集,樣本總量為P,特征數量為N,設定近鄰的樣本數量為k;
通過構建的改進的ReliefF算法模型計算每個特征相應的權重,并根據每個特征權重的大小對特征進行排序;所述改進的ReliefF算法模型表示為:
式中,W(F)為特征F的權重,diff(F,R1,R2)為樣本R1,R2在特征F上的距離差,Hj為第j個樣本H,Mj(C)為類的第j個樣本M,q為權重系數;其中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島百洋智能科技股份有限公司,未經青島百洋智能科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010182104.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種獲得牛初始態誘導多能干細胞的方法
- 下一篇:一種模塊化拼接的便攜式安檢門





