[發明專利]一種中醫證型識別方法及系統有效
| 申請號: | 202210116011.0 | 申請日: | 2022-02-07 |
| 公開(公告)號: | CN114154514B | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 單梁;孟志國;李玉強;丁文靜 | 申請(專利權)人: | 北京三子健康科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F40/247;G06F40/194;G06F16/35 |
| 代理公司: | 北京秉文同創知識產權代理事務所(普通合伙) 11859 | 代理人: | 陳少麗;張文武 |
| 地址: | 100176 北京市大興區北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中醫 識別 方法 系統 | ||
1.一種中醫證型識別方法,其特征在于,包括:
獲取待識別文本;
利用預先建立的證型分詞模型對所述待識別文本進行分詞處理得到匹配的多個標準詞和與所述多個標準詞對應的多個類別語義符,并根據多個所述類別語義符按照所述待識別文本中詞的順序組合得到待識別證型縮寫;
如果在組成模型表中查找到所述待識別證型縮寫,則將多個所述標準詞按照所述待識別文本中詞的順序組合得到初步證型名稱;如果在所述組成模型表中未查找到所述待識別證型縮寫,則認為所述待識別文本中不存在中醫證型的文本;
根據所述初步證型名稱從預先建立的元素向量矩陣中獲取相應的證型向量V;
如果在預先建立的證型向量矩陣中遍歷到與所述證型向量V的余弦相似度滿足預設相似度閾值的證型向量R,則將所述證型向量R對應的證型名稱作為所述證型向量V的目標證型名稱;
如果在預先建立的證型向量矩陣中遍歷到的所述證型向量R與所述證型向量V的余弦相似度不滿足預設相似度閾值,則計算所述證型向量R的單位向量與所述證型向量V之差得到差異向量D;
如果所述差異向量D的坐標中不存在負值,則將所述證型向量R對應的證型名稱作為所述證型向量V的相似證型名稱。
2.根據權利要求1所述的一種中醫證型識別方法,其特征在于,所述獲取待識別文本的步驟之前還包括:
對已知中醫證型進行元素切分得到多個證型元素;
對每個所述證型元素進行分類標注;
根據所述證型元素的分類標注信息對多個所述證型元素進行分類整理并建立多個類別元素表,所述類別元素表中包括每個證型元素的標準詞和對應的同義詞;
整合多個所述類別元素表得到所述元素向量矩陣,其中,所述元素向量矩陣中用1標識證型元素所處的位置。
3.根據權利要求2所述的一種中醫證型識別方法,其特征在于,所述類別元素表包括病位元素表、物質基礎元素表、物質基礎狀態元素表、影響因素元素表和影響方式元素表。
4.根據權利要求2所述的一種中醫證型識別方法,其特征在于,所述根據所述證型元素的分類標注信息對多個所述證型元素進行分類整理并建立多個類別元素表的步驟之后還包括:
根據所述證型元素的分類標注信息為每個所述證型元素分配相應的類別語義符;
基于多個所述類別元素表和每個所述證型元素分配的類別語義符建立所述證型分詞模型。
5.根據權利要求4所述的一種中醫證型識別方法,其特征在于,所述根據所述初步證型名稱從預先建立的元素向量矩陣中獲取相應的證型向量V的步驟包括:
在所述元素向量矩陣中查找所述初步證型名稱所包含的每個證型元素對應的向量;
將查找到的每個所述證型元素對應的向量相加得到所述證型向量V。
6.根據權利要求5所述的一種中醫證型識別方法,其特征在于,所述如果在預先建立的證型向量矩陣中遍歷到與所述證型向量V的余弦相似度滿足預設相似度閾值的證型向量R,則將所述證型向量R對應的證型名稱作為所述證型向量V的目標證型名稱的步驟之后還包括:
將所述待識別文本更新至所述證型向量R的原始文本列表中,并將所述目標證型名稱對應的向量更新為所述證型向量R和所述證型向量V相加的和。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三子健康科技有限公司,未經北京三子健康科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210116011.0/1.html,轉載請聲明來源鉆瓜專利網。





