[發明專利]數據處理方法、醫學用語處理系統和醫學診療系統有效
| 申請號: | 201710642037.8 | 申請日: | 2017-07-31 |
| 公開(公告)號: | CN107480135B | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 張振中 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/30;G06F16/33;G16H50/20 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 黃威;喻嶸 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 醫學 用語 處理 系統 診療 | ||
1.一種數據處理方法,應用于診療系統中,其特征在于,包括:
獲取用戶輸入的語句信息;
利用預設算法將所述語句信息劃分為多個信息片段,所述多個信息片段包括第一信息片段;
建立各個信息片段的高斯分布;
利用相似度模型計算所述第一信息片段與數據庫中的詞語之間的相似度;其中,所述數據庫用于存儲關于醫學詞語的信息;
所述利用相似度模型計算所述第一信息片段與數據庫中的詞語之間的相似度,包括:根據計算得到的第一信息片段和所述數據庫中的詞語的高斯分布的協方差和期望值,建立相似度模型;所述相似度模型的表達式為
其中,d為常數,u信息片段的高斯分布的期望,∑為信息片段的高斯分布的協方差,w1和w2為兩個信息片段,N為信息片段的矩陣形式的多維高斯分布;
計算所述第一信息片段與所述數據庫中的詞語之間的相似度;
獲取至少一個用于描述所述第一信息片段的第二信息片段;
所述獲取至少一個用于描述所述第一信息片段的第二信息片段包括:
根據所述數據庫中的詞語與所述第一信息片段的相似度,對所述數據庫中的詞語進行排序,得到相似度最大的預設數目個詞語;
將所述預設數目個詞語作為所述第二信息片段;
其中建立各信息片段的高斯分布包括:
以矩陣的形式表示各個所述信息片段的高斯分布;
利用隨機梯度下降算法計算各個所述信息片段的高斯分布的協方差和期望值;
基于計算得到的協方差和期望值建立高斯分布。
2.根據權利要求1所述的方法,其中,所述利用預設算法將所述語句信息劃分為多個信息片段包括:
利用自然語言處理算法按照詞性將所述語句信息劃分成多個信息片段。
3.根據權利要求1所述的方法,其中利用隨機梯度下降算法計算各個所述信息片段的高斯分布的協方差和期望值包括:
通過求解目標函數最小化的方式計算所述協方差和期望值,其中目標函數的表達式為:
L(w,cp,cn)=max(0,1-S1(w,cp)+S1(w,cn));
其中,w表示信息片段的信息,cp表示在語句中出現在w的上下文中的信息片段,cn表示在語句中沒有出現在w的上下文中的詞語,函數S1(w,cn)表示w和cn相似度函數,S1(w,cp)表示w和cp的相似度,max()表示最大值函數。
4.根據權利要求1所述的方法,其中,所述以矩陣的形式表示各個所述信息片段的高斯分布包括:
所述高斯分布為多維高斯分布,并且所述矩陣形式的多維高斯分布的表達式為N(μw,∑w),
其中,∑w表示信息片段w的高斯分布的協方差,uw表示信息片段w的高斯分布的期望。
5.根據權利要求1所述的方法,其中,所述數據庫包括:醫學文獻、醫學知識庫和電子病歷中的至少一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710642037.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理方法和系統
- 下一篇:一種應用于電影劇本中情感曲線分析的方法





