[發明專利]一種基于語義相似性的個性化中醫診療信息和中藥信息智能匹配方法有效
| 申請號: | 201811027747.0 | 申請日: | 2018-09-04 |
| 公開(公告)號: | CN110929511B | 公開(公告)日: | 2021-12-17 |
| 發明(設計)人: | 李梢;周武愛;賴新星;吳敏 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06N3/08;G16H20/10;G06F16/332 |
| 代理公司: | 北京金恒聯合知識產權代理事務所 11324 | 代理人: | 李強 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 相似性 個性化 中醫 診療 信息 中藥 智能 匹配 方法 | ||
1.一種基于語義相似性的個性化中醫診療信息和中藥信息智能匹配方法,其特征在于包括:
1)基于中西醫術語語料庫和中藥相關術語語料庫,采用ICTCLAS分別將胃炎個性化中醫診療信息、中藥的適應癥和禁忌癥信息分詞,分別得分詞結果a、b和c,
其中a、b和c均過濾掉無關詞即停用詞;
2)首先,計算適應癥匹配得分,包括:基于訓練完成的神經網絡模型,計算a中每個詞和b中每個詞之間的相似性,累加相似性作為適應癥語義相似性得分,相似性的定義為余弦相似性,在神經網絡模型的訓練過程中,詞向量的維度為m=200,則兩個詞之間的相似性定義為詞向量之間的夾角余弦值:
其中:
A、B都為詞向量,維度都為200,
當b所含動詞能夠和a中的癥狀信息匹配時,則匹配成功;將所有動詞信息加權求和,作為適應癥關鍵動詞匹配得分;
當b中直接包含了a中的關鍵證候術語時,則適應癥匹配得分乘以關鍵證候術語出現之后的擴增權重;
當b中直接包含了a中的關鍵疾病術語時,則適應癥匹配得分乘以關鍵疾病術語出現之后的擴增權重;
3)其次,計算禁忌癥懲罰得分,包括:計算a中的詞和c中的詞兩兩之間的相似性,得到相似性矩陣,相似性矩陣的行數為a的長度,列數為c的長度,相似性矩陣中的值表示詞之間的相似性,相似性仍然采用余弦相似性計算,
其中,當相似性矩陣的元素的最大值超過了一個預定的懲罰閾值時,即認為a出現了c里的某一條禁忌,把適應癥匹配得分乘以一個預定的懲罰權重,否則不做更改;
4)根據匹配的打分規則計算最終的個性化中醫診療信息和中藥信息的匹配得分Score,根據Score將所有中藥從高到低排序,包括:
令:
其中,
a:胃炎個性化中醫診療信息分詞結果,
b:中藥適應癥信息分詞結果,
c:中藥禁忌癥信息分詞結果,
Score:匹配得分,
a和b在神經網絡模型中的語義相似性得分之和,
n是匹配上的動詞的個數,vi是第i個匹配上的動詞,wi是第i個動詞的權重,
Z:關鍵證候術語出現之后的擴增權重,Z1,
D:關鍵疾病術語出現之后的擴增權重,D1,
max(similaritymatrix(a,c)):a和c相似性矩陣中的最大值,
J:禁忌癥術語匹配成功與否的閾值,
Jw:禁忌癥術語出現之后的懲罰權重,Jw1,
δ(max(similaritymatrix(a,c)),J)*Jw:如果a和c的相似性矩陣中的最大值超過指定閾值,即認為胃炎個性化中醫診療信息包含了中藥禁忌癥里的某一條禁忌,則對該中藥的最終得分進行懲罰,否則不做更改,即:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811027747.0/1.html,轉載請聲明來源鉆瓜專利網。





