[發明專利]基于無分詞深度學習的臨床決策支持方法在審
| 申請號: | 202110965560.0 | 申請日: | 2021-08-23 |
| 公開(公告)號: | CN113658688A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 王一 | 申請(專利權)人: | 上海赴源科技服務有限公司 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G06N3/04;G06N3/08 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 201208 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分詞 深度 學習 臨床 決策 支持 方法 | ||
1.一種基于無分詞深度學習的臨床決策支持方法,其特征在于,具體步驟如下:
S1、由歷史病歷庫導入已診斷的病歷數據;
S2、對已診斷的病歷數據進行特征提取,提取全體k-字符短語以生成短語包,作為訓練樣本;
或者,對生成的短語包進一步進行詞向量轉換,作為訓練樣本;
其中,所述的k-字符短語由以下規則確定:
將已診斷的病歷數據所包含的文本設為T,T中共包含n個字符,以wi表示T中的第i個字符,其中1≤i≤n,自wi起始的k-字符短語為自wi起始的連續k個字符,即:wiwi+1...wi+k-1,其中k為小于等于n的正整數,若wi靠近T的尾部導致無法提取某一長度的k-字符短語,則放棄該k-字符短語;
所述短語包包含全體k-字符短語,所述全體k-字符短語包括:自w1起始的全體k-字符短語,自w2起始的全體k-字符短語,自w3起始的全體k-字符短語,依次類推,直至自wn起始的全體k-字符短語;
S3、將訓練樣本輸入多層前饋神經網絡,進行端對端訓練,生成臨床決策支持模型;
S4、導入待診斷的病歷數據,對待診斷的病歷數據執行與步驟S2相同的特征提取處理后,將生成的短語包輸入步驟S3生成的臨床決策支持模型,輸出診斷建議結果。
2.根據權利要求1所述的臨床決策支持方法,其特征在于,步驟S2中所述文本中包含的字符為中文字符,或者為非中文字符;
其中,k小于等于10,或小于等于9,或小于等于8,或小于等于7,或小于等于6,或小于等于5,或小于等于4。
3.根據權利要求2所述的臨床決策支持方法,其特征在于,步驟S1中所述的已診斷的病歷數據,包括從醫院的醫療信息管理系統提取已診斷的電子病歷;對已診斷的電子病歷進行去結構化,刪掉個人敏感信息等信息,得到電子病歷的純文本內容;并將其中每個診斷結論相關的原始數據合成一個獨立文本集。
4.根據權利要求2所述的臨床決策支持方法,其特征在于,步驟S2中所述的詞向量轉換方法,具體為:
對于短語包中包含的每一個k-字符短語,查詢詞向量數據庫,如果找到該單詞,則將該k-字符短語的詞向量設置為已知詞向量,否則將該k-字符短語的詞向量隨機初始化為均值為0,標準差為0.1的正態分布。
5.根據權利要求1-4之一所述的臨床決策支持方法,其特征在于,步驟S3中所述多層前饋神經網絡分為輸入層、隱藏層、輸出層,其中:
所述輸入層,其輸入對象是前一步驟生成的短語包;
所述隱藏層,由至少1個連接的隱藏層組成,每個層包含至少64個隱藏單元;
所述輸出層,利用分類器對病歷中提取特征進行分類,獲取已診斷的或待診斷的病歷的各個病癥的患病概率。
6.根據權利要求5所述的臨床決策支持方法,其特征在于,步驟S3中所述的隱藏層,由至少2個連接的隱藏層組成;或者由至少3個連接的隱藏層組成;
每個層包含至少128個隱藏單元;或者包含至少256個隱藏單元;或者包含至少512個隱藏單元。
7.根據權利要求6所述的臨床決策支持方法,其特征在于,步驟S3中所述的隱藏層通過訓練樣本短語包中的逐條短語或向量賦予不同的權重進行加權計算,并加上一個偏置項,通過激活函數輸出一個特征hi,即hi=f(w×Xi:j+bi),其中w為權重,f為非線性函數,bi為偏置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海赴源科技服務有限公司,未經上海赴源科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110965560.0/1.html,轉載請聲明來源鉆瓜專利網。





