[發明專利]一種電子病歷查詢語句的構造方法有效
| 申請號: | 201410394537.0 | 申請日: | 2014-08-12 |
| 公開(公告)號: | CN104268144B | 公開(公告)日: | 2017-08-29 |
| 發明(設計)人: | 王文斌;顧君忠 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/24 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙)31215 | 代理人: | 徐筱梅,張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電子 病歷 查詢 語句 構造 方法 | ||
1.一種電子病歷查詢語句的構造方法,其特征在于該方法包括以下具體步驟:
a)、電子病歷語料預處理
對電子病歷語料文本進行分詞,去掉停用詞之后,得到語料中出現的所有詞;利用公式(1)計算每個詞t在每篇病歷中的平均出現次數;
其中,λ表示詞t的平均出現次數,n表示電子病歷語料集合的大小,ki表示詞t在第i篇病歷中出現的次數;通過計算得到每個詞t對應的λ;
b)、醫學術語抽取及篩選
首先,抽取原始查詢語句中出現的醫學術語;再在抽取出的醫學術語中去掉醫學停用詞,剩下的醫學術語的集合記為QUMLS={Q1,Q2,...,Qn},其中Qi表示第i個醫學術語,每個醫學術語有可能由多個詞組成;
c)、醫學術語權重計算
計算每個醫學術語Qi的權重wi,具體包括:
i)、計算組成醫學術語的詞的出現概率p(t);使用泊松分布來擬合詞t的概率分布;那么p(t)使用公式(2)來計算;
其中,T表示詞t的出現次數,λ表示詞t的平均出現次數,e表示自然常數;
ii)、計算醫學術語Qi在電子病歷語料中出現的概率p(Qi);醫學術語Qi中每個詞的出現是相互獨立事件,p(Qi)使用公式(3)計算;
iii)、計算每個醫學術語Qi的權重wi,使用自信息的定義,即公式(4)計算;
d)、新查詢語句構造
使用原始查詢語句、Q1,Q2,...,Qn以及對應的w1,w2,...,wn構造新的查詢語句,具體包括:
i)、對于原始查詢語句,組成原始查詢語句的詞之間的權重平均分配,得到查詢子句1;
ii)、對于醫學術語Qi內部,醫學術語Qi中每個詞的權重平均分配;
iii)、對于醫學術語Qi之間,每個醫學術語Qi分配到的權重是得到查詢子句2;
iv)、將查詢子句1和查詢子句2,按照μ∶(1-μ)的比例分配權重,得到新查詢語句,其中μ的取值范圍是[0,1]。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410394537.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網頁展現方法和裝置
- 下一篇:基于可拒絕策略的元搜索結果排序方法





