[發明專利]數據處理方法、醫學用語處理系統和醫學診療系統有效
| 申請號: | 201710642037.8 | 申請日: | 2017-07-31 |
| 公開(公告)號: | CN107480135B | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 張振中 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/30;G06F16/33;G16H50/20 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 黃威;喻嶸 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 醫學 用語 處理 系統 診療 | ||
本發明實施例提供了一種數據處理方法、醫學用語處理系統和醫學診療系統,其中所述方法包括:獲取用戶輸入的語句信息;利用預設算法將所述語句信息劃分為多個信息片段,所述多個信息片段包括第一信息片段;建立各個信息片段的高斯分布;利用相似度模型計算所述第一信息片段與數據庫中的詞語之間的相似度;獲取至少一個用于描述所述第一信息片段的第二信息片段。本發明能夠提供大眾用語對應的醫學用語,方便用戶診療。
技術領域
本發明實施例涉及醫學技術領域,特別涉及一種數據處理方法、醫學用語處理系統和醫學診療系統。
背景技術
我國每年就診人數多,導致醫院一直超負荷運行,給就診人員以效率低下的感覺。如果使用人工智能系統來提高健康醫療服務的效率和自動化程度,就能一定程度上緩解這一情況。然而在使用人工智能系統來提高醫療服務效率時,通常會面臨一個嚴重的問題:由于病人缺乏一定的醫學知識以及語言的復雜性,病人在自述疾病癥狀時錯誤太多(如描述錯誤、用詞錯誤、有意無意忽略),此時單純匹配書面癥狀和醫學名詞會導致誤診。一個簡單的例子,醫學文獻中描述感冒產生的癥狀時使用“鼻塞”,而現實中病人在描述癥狀時會用到“鼻子堵了”和“鼻腔不通氣”。從這個例子中可以看到,醫學用語和大眾用語之間存在一定的差異,如果單純地依靠字面詞形匹配會導致誤診情況的發生。因此,如果能夠提供一種能夠根據病人提供的信息提供相關的醫學專業用語,則能大大的提供就診效率以及避免誤診的情況。
發明內容
本發明實施例提供了一種能夠根據輸入的語句而獲得與該語句相近的醫學專業用語的數據處理方法、醫學用語處理系統和醫學診療系統。
為了解決上述技術問題,本發明實施例提供了如下的技術方案:
一種數據處理方法,應用于診療系統中,其特征在于,包括:
獲取用戶輸入的語句信息;
利用預設算法將所述語句信息劃分為多個信息片段,所述多個信息片段包括第一信息片段;
建立各個信息片段的高斯分布;
利用相似度模型計算所述第一信息片段與數據庫中的詞語之間的相似度;
獲取至少一個用于描述所述第一信息片段的第二信息片段。
作為優選實施例,所述利用預設算法將所述語句信息劃分為多個信息片段包括:
利用自然語言處理算法按照詞性將所述語句信息劃分成多個信息片段。
作為優選實施例,其中建立各信息片段的高斯分布包括:
以矩陣的形式表示各個所述信息片段的高斯分布;
利用隨機梯度下降算法計算各個所述信息片段的高斯分布的協方差和期望值;
基于計算得到的協方差和期望值建立高斯分布。
作為優選實施例,其中,所述以矩陣的形式表示各個所述信息片段的高斯分布包括:
所述高斯分布為多維高斯分布,并且所述矩陣形式的多維高斯分布的表達式為N(μw,∑w),
其中,∑w表示信息片段w的高斯分布的協方差,uw表示信息片段w的高斯分布的期望。
作為優選實施例,其中利用隨機梯度下降算法計算各個所述信息片段的高斯分布的協方差和期望值包括:
通過求解目標函數最小化的方式計算所述協方差和期望值,其中目標函數的表達式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710642037.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理方法和系統
- 下一篇:一種應用于電影劇本中情感曲線分析的方法





