[發明專利]數據處理方法、醫學用語處理系統和醫學診療系統有效

申請號：	201710642037.8	申請日：	2017-07-31
公開（公告）號：	CN107480135B	公開（公告）日：	2022-01-07
發明（設計）人：	張振中	申請（專利權）人：	京東方科技集團股份有限公司
主分類號：	G06F40/216	分類號：	G06F40/216;G06F40/30;G06F16/33;G16H50/20
代理公司：	北京金信知識產權代理有限公司 11225	代理人：	黃威;喻嶸
地址：	100015 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	數據處理方法醫學用語處理系統診療
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種數據處理方法，應用于診療系統中，其特征在于，包括：

獲取用戶輸入的語句信息；

利用預設算法將所述語句信息劃分為多個信息片段，所述多個信息片段包括第一信息片段；

建立各個信息片段的高斯分布；

利用相似度模型計算所述第一信息片段與數據庫中的詞語之間的相似度；其中，所述數據庫用于存儲關于醫學詞語的信息；

所述利用相似度模型計算所述第一信息片段與數據庫中的詞語之間的相似度，包括：根據計算得到的第一信息片段和所述數據庫中的詞語的高斯分布的協方差和期望值，建立相似度模型；所述相似度模型的表達式為

其中，d為常數，u信息片段的高斯分布的期望，∑為信息片段的高斯分布的協方差，w₁和w₂為兩個信息片段，N為信息片段的矩陣形式的多維高斯分布；

計算所述第一信息片段與所述數據庫中的詞語之間的相似度；

獲取至少一個用于描述所述第一信息片段的第二信息片段；

所述獲取至少一個用于描述所述第一信息片段的第二信息片段包括：

根據所述數據庫中的詞語與所述第一信息片段的相似度，對所述數據庫中的詞語進行排序，得到相似度最大的預設數目個詞語；

將所述預設數目個詞語作為所述第二信息片段；

其中建立各信息片段的高斯分布包括：

以矩陣的形式表示各個所述信息片段的高斯分布；

利用隨機梯度下降算法計算各個所述信息片段的高斯分布的協方差和期望值；

基于計算得到的協方差和期望值建立高斯分布。

2.根據權利要求1所述的方法，其中，所述利用預設算法將所述語句信息劃分為多個信息片段包括：

利用自然語言處理算法按照詞性將所述語句信息劃分成多個信息片段。

3.根據權利要求1所述的方法，其中利用隨機梯度下降算法計算各個所述信息片段的高斯分布的協方差和期望值包括：

通過求解目標函數最小化的方式計算所述協方差和期望值，其中目標函數的表達式為：

L(w,c_p,c_n)＝max(0,1-S₁(w,c_p)+S₁(w,c_n))；

其中，w表示信息片段的信息，c_p表示在語句中出現在w的上下文中的信息片段，c_n表示在語句中沒有出現在w的上下文中的詞語，函數S₁(w,c_n)表示w和c_n相似度函數，S₁(w,c_p)表示w和c_p的相似度，max()表示最大值函數。

4.根據權利要求1所述的方法，其中，所述以矩陣的形式表示各個所述信息片段的高斯分布包括：

所述高斯分布為多維高斯分布，并且所述矩陣形式的多維高斯分布的表達式為N(μ_w,∑_w),

其中，∑_w表示信息片段w的高斯分布的協方差，u_w表示信息片段w的高斯分布的期望。

5.根據權利要求1所述的方法，其中，所述數據庫包括：醫學文獻、醫學知識庫和電子病歷中的至少一種。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司，未經京東方科技集團股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710642037.8/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】