[發明專利]一種基于詞共現的中藥處方向量空間模型方法及裝置有效
| 申請號: | 201810288330.3 | 申請日: | 2018-03-30 |
| 公開(公告)號: | CN108647236B | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 袁鋒;陳陽;陳守強;趙麗麗;常曉瑋 | 申請(專利權)人: | 山東管理學院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 楊哲 |
| 地址: | 250000*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 詞共現 中藥 處方 向量 空間 模型 方法 裝置 | ||
本發明公開了一種基于詞共現的中藥處方向量空間模型方法及裝置,該方法包括:預處理中藥處方數據,保留藥方與相應證型對應關系,構建藥方事務集;掃描整個藥方事務集,計算各個中藥頻率以及藥對的詞共現頻率,并根據此計算藥對詞共現的支持度和置信度;當藥對詞共現的支持度和置信度大于對應預設閾值時,將該藥對加入共現詞集合,直至遍歷事務集;將共現詞集合中屬于中藥處方藥對庫的藥對構建語義向量空間模型。本發明有效表示中藥處方潛在語義信息,從而提高中藥處方聚類效果。
技術領域
本發明屬于中藥處方聚類的技術領域,尤其是涉及一種基于詞共現的中藥處方向量空間模型方法及裝置。
背景技術
中醫文獻作為中醫學的主要知識資源,信息量非常龐大,文獻工作者們在進行研究時,往往需要人工對這些資料進行收集、分類、加工、檢索、統計和推理,勞動強度大,效率低。計算機技術的發展給中醫文獻研究提供了新思路和新方法。利用計算機技術來輔助人們完成對中醫文獻的部分整理工作,將能在很大程度減輕人們的負擔,更好的促進中醫藥的研究和發展。
中醫藥信息的數字化工作開始于20世紀80年代,經過二十多年的發展已經取得了初步的成果。到目前為止已經有數十個中醫藥大學、學院及研究所建設了各種規模不同的中醫藥信息數據庫近百個,初步實現了中醫藥信息數字化。現有的中藥處方數據庫的存在的主要不足是:對中藥處方的核心信息處方中的藥物及其用量信息沒有細化,這給方劑數據的進一步利用造成了很大困難。目前專門討論中藥處方分類聚類方面的研究相對比較少。文本分類(Text Categorization)是利用計算機實現文本自動分類的技術。文本分類中常常采用向量空間模型(Vector Space Mode)來表示文檔,并且已經有了比較成熟的分類器算法。可以利用文本分類技術對中醫方劑進行自動分類,從而更好地組織和管理方劑。
然而,現有基于向量空間模型的中藥處方分類方法存在如下問題:
由于向量空間模型忽略了詞間的關聯性,在中藥處方研究中僅僅以單個中藥為基礎表示,不能很好地表示潛在語義信息,因此中藥處方的聚類效果得不到有效地提高。
綜上所述,現有技術中如何表示中藥處方潛在語義信息從而提高中藥處方聚類效果的問題,尚缺乏行之有效的解決方案。
發明內容
針對現有技術中存在的不足,解決現有技術中如何表示中藥處方潛在語義信息從而提高中藥處方聚類效果的問題,本發明提出了一種基于詞共現的中藥處方向量空間模型方法及裝置,具體涉及到中醫藥方中共現詞的抽取,中藥藥對與共現詞的關聯性,及處方的功能主治與詞共現的關聯性,設計了權值計算方法,通過基于詞共現的中醫藥方向量空間模型,有效表示中藥處方潛在語義信息,從而提高中藥處方聚類效果。
本發明的第一目的是提供一種基于詞共現的中藥處方向量空間模型方法。
為了實現上述目的,本發明采用如下一種技術方案:
一種基于詞共現的中藥處方向量空間模型方法,該方法包括:
預處理中藥處方數據,保留藥方與相應證型對應關系,構建藥方事務集;
掃描整個藥方事務集,計算各個中藥頻率以及藥對的詞共現頻率,并根據此計算藥對詞共現的支持度和置信度;
當藥對詞共現的支持度和置信度大于對應預設閾值時,將該藥對加入共現詞集合,直至遍歷事務集;
將共現詞集合中屬于中藥處方藥對庫的藥對構建語義向量空間模型。
作為進一步的優選方案,所述預處理中藥處方數據包括:對中藥處方數據中的同義詞、近義詞和錯別字進行修訂。
作為進一步的優選方案,在本方法中,根據預處理中藥處方數據中藥方與相應證型對應關系,構建中藥方劑藥對,并根據中藥方劑藥對構建藥方事務集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東管理學院,未經山東管理學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810288330.3/2.html,轉載請聲明來源鉆瓜專利網。





