在審
| 申請號: | 202111095906.2 | 申請日: | 2021-09-18 |
| 公開(公告)號: | CN113779275A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 董萍 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G16H50/20;G16H50/70 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 醫療 數據 特征 提取 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能及數字醫療領域,公開了一種基于醫療數據的特征提取方法、裝置、設備及存儲介質,該方法可應用于智能診療系統,包括:對智能診療系統產生的醫療數據進行解析,得到特征變量;提取特征變量的變量值,并根據變量值對特征變量進行分箱,計算各分箱中特征變量的信息價值,通過信息價值對特征變量進行篩選,得到醫療數據的特征。本發明實現了對醫療數據的特征提取的自動化,提高了特征提取的效率,節省了時間成本。此外,本發明還涉及區塊鏈領域,意圖觸發話術文本和基礎話術意圖集可存儲于區塊鏈中。
技術領域
本發明涉及人工智能領域,尤其涉及一種基于醫療數據的特征提取方法、裝置、設備及存儲介質。
背景技術
隨著大數據的發展,數據業務的發展越來越成熟。許多業務處理依賴于對數據進行分析和識別。因此,人工智能模型的建模穩定性以及對數據的識別準確性是確保對各類業務進行正常業務處理的關鍵。而在人工智能模型的建模階段,特征數據對人工智能模型的穩定性和擬合程度影響較大。而隨著數字化技術在醫療領域的應用,醫療數據量越來越大,蘊含著許多有價值的信息資源,并且醫療數據的特征提取具有廣泛的應用領域,包括:醫療活動輔助診斷、醫療質量管理、醫學信息處理、醫藥研發、生物醫學、醫學圖像等。
目前,對于數據的特征提取的方法是對海量數據按照維度進行不斷篩選,即通過特征選擇的算法過濾掉數據的無用的特征,但是這些方法會拋棄掉對數據有用的部分特征,或者數據特征維度高,因而獲得的數據特征性能差,導致特征提取效率低。
發明內容
本發明的主要目的在于解決現有技術中醫療數據的特征提取效率低的技術問題。
本發明第一方面提供了一種基于醫療數據的特征提取方法,所述基于醫療數據的特征提取方法包括:獲取智能診療系統產生的醫療數據,并對所述醫療數據進行解析,得到多個特征變量;提取所述特征變量中的變量值,并根據所述變量值對所述特征變量進行分箱處理,得到多個分箱;對各所述分箱中的變量值進行相關性分析,根據相關性分析的結果對所述變量值進行分類,并計算各所述分箱的特征權重;根據所述特征權重和預設的信息價值計算公式,計算各所述特征變量信息價值;根據所述信息價值對各所述特征變量進行篩選,得到所述醫學數據的特征。
可選的,在本發明的第一方面的第一種實現方式中,所述對提取所述特征變量中的變量值,并根據所述變量值對所述特征變量進行分箱處理,得到多個分箱包括:提取所述特征變量中各變量值,并判斷所述變量值是否為缺失值;若所述變量值為缺失值,則將所述變量中的所有缺失值設定為第一組分箱,并對所述第一組分箱設置第一分箱編碼;剔除所述變量中的所述缺失值,得到剩余值,判斷所述剩余值是否為同一固定值;若所述剩余值為同一固定值,則將所述第剩余特征值設定為第二組分箱,并對所述第二組分箱設置第二分箱編碼。
可選的,在本發明的第一方面的第二種實現方式中,若判斷所述剩余值不為同一固定值時,所述對各所述變量進行分箱處理,得到多個分箱還包括:對所述剩余值設置分位點;根據所述分位點對所述剩余值進行分箱處理,得到第三組分箱;對所述第三組分箱設置第三分箱編碼。
可選的,在本發明的第一方面的第三種實現方式中,所述對各所述分箱中的變量值進行相關性分析,根據相關性分析的結果對所述變量值進行分類,并計算各所述分箱的特征權重包括:對各所述分箱中的變量值進行相關性分析,計算各所述分箱中各變量與預設的正向維度之間的相關度,得到正向相關值,并將所述正向相關值與預設的正向相關閾值進行比較,得到第一比較結果;計算各所述分箱中各變量值與預設的反向維度之間的相關度,得到反向相關值,并將所述反向相關值與預設的反向相關閾值進行比較,得到第二比較結果;根據所述第一比較結果和所述第二比較結果,將各所述分箱中各變量劃分為正向變量和反向變量;根據所述正向變量和所述反向變量分別計算各所述分箱的特征權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111095906.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種液力傳動裝置
- 下一篇:測試用例的構建方法、裝置、設備及存儲介質
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





