[發明專利]用于估計醫療資源需求的系統和方法有效
| 申請號: | 201710184344.6 | 申請日: | 2017-03-24 |
| 公開(公告)號: | CN107680661B | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 甄毅;費洪亮;譚樹龍;范偉 | 申請(專利權)人: | 百度(美國)有限責任公司 |
| 主分類號: | G16H40/20 | 分類號: | G16H40/20;G06Q10/06 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 估計 醫療 資源 需求 系統 方法 | ||
1.一種用于估計資源需求的方法,所述方法包括:
從多個源提取數據;
使用所述數據來生成記錄;
向每個記錄分配標簽以獲得經標記的記錄;
通過將與用于識別實體的標簽關聯的一種或多種技術應用于經標記的記錄來識別每個經標記的記錄內的一個或多個實體;
根據所述經標記的記錄來生成兩個或更多個實體之間的實體特征和關系;
對于每個實體,將所述兩個或更多個實體之間的實體特征和關系轉換成所述實體的向量化表示;
使用實體的向量化數據和資源數據來訓練第一數據集合上的模型集合;
使用數據的評估集合來評估所述模型集合中的每個模型;以及
基于評估來選擇模型。
2.根據權利要求1所述的方法,還包括:使用所述第一數據集合和所述數據的評估集合來重新訓練所選擇的模型。
3.根據權利要求1所述的方法,其中,從多個源提取所述數據的步驟包括:基于源的身份來向所述源應用用于提取數據的模板。
4.根據權利要求3所述的方法,其中,所述模板包括一個或多個規則集合,所述一個或多個規則集合特定于源,用于從所述源提取數據。
5.根據權利要求1所述的方法,其中,提取所述數據的步驟包括:
評估源的可靠性因子;以及
響應于確定所述源的低可靠性因子,排除來自該源的數據以提高數據可靠性。
6.根據權利要求1所述的方法,其中,生成實體特征和關系的步驟包括:組合來自所述多個源中的至少兩個源的數據。
7.根據權利要求1所述的方法,其中,生成實體特征和關系的步驟包括:將來自所述多個源中的兩個或更多個源的數據關聯和對齊中的至少一者。
8.根據權利要求1所述的方法,其中,所述資源數據被表示為一個或多個基于規則的限制,所述一個或多個基于規則的限制被用作所述模型中的約束。
9.根據權利要求1所述的方法,其中,提取所述數據的步驟包括:將個人可識別信息轉換成非個人可識別信息以保持數據隱私。
10.根據權利要求1所述的方法,其中,生成實體特征和關系的步驟包括:生成一個或多個關系矩陣,其中,條目表示實體之間的關系。
11.根據權利要求10所述的方法,還包括:向所述一個或多個關系矩陣應用矩陣分解以生成實體的向量化表示。
12.一種用于估計醫療資源需求的方法,所述方法包括:
接收與醫療使用相關的至少一個實體和一個或多個約束的集合的表示來作為醫療資源需求模型的輸入;
使用經訓練的醫療資源需求模型來處理所述輸入,所述經訓練的醫療資源需求模型已經使用從多個不同類型的源提取的數據訓練,以及根據所述經訓練的醫療資源需求模型已經從記錄系統地生成了實體的實體特征表示,所述記錄是從提取自多個不同源的數據獲得的,通過應用與分配給所述記錄的標簽關聯的一種或多種技術來識別記錄內的實體;以及
輸出醫療資源估計。
13.根據權利要求12所述的方法,還包括:對于記錄中的至少一部分,執行包括以下操作的步驟:
響應于識別記錄中的缺失值,輸入針對所述缺失值的值并且向所述記錄添加所述缺失值;
響應于識別個人可識別信息,將記錄中的個人可識別信息轉換成非個人可識別信息;以及
執行數據對齊,其中,來自所述多個不同源中兩個或更多個源的記錄經由所述記錄內的一個或多個匹配數據元素被鏈接。
14.根據權利要求12所述的方法,其中,與醫療使用相關的一個或多個約束的集合包括醫療后勤信息和醫療知識,所述醫療知識通過將醫療使用信息轉換成一個或多個方程獲得。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度(美國)有限責任公司,未經百度(美國)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710184344.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:通過光學輻射的方式在透明物質中制造切面
- 下一篇:一種指標配置加工方法和系統





