[發明專利]一種基于多視圖主題建模技術的異常處方篩選方法有效
| 申請號: | 201810992868.2 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109448808B | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 趙俊峰;詹思延;謝冰;卓琳;唐爽;劉少欽 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G16H20/10 | 分類號: | G16H20/10;G16H70/40;G06F16/335;G06K9/62 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100871 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視圖 主題 建模 技術 異常 處方 篩選 方法 | ||
1.一種基于多視圖主題建模技術的異常處方篩選方法,其步驟為:
1)將醫療數據整理成處方數據,其中每條處方數據中包含處方中的診斷特征和用藥特征;
2)將所述處方數據輸入MV-LDA模型中,對所述MV-LDA模型進行訓練;其中,MV-LDA模型包括K個主題,每個主題中包含診斷特征視圖和用藥特征視圖;主題k中的診斷特征視圖由一個診斷特征集合和集合中每個診斷特征的所對應的概率值組成,相應的,用藥特征視圖由一個用藥特征集合和集合中每個用藥特征所對應的概率值組成;
3)對于一待識別處方數據,利用訓練好的MV-LDA模型對該待識別處方數據進行推斷,得到該待識別處方數據的基于診斷特征的主題分布和基于用藥特征的主題分布;然后計算兩主題分布的相似度,如果相似度低于設定閾值,則判斷該待識別處方數據是異常處方。
2.如權利要求1所述的方法,其特征在于,使用吉布斯采樣進行MV-LDA模型的求解,計算MV-LDA模型中的參數,得到訓練好的MV-LDA模型。
3.如權利要求2所述的方法,其特征在于,使用吉布斯采樣進行MV-LDA模型求解的方法為:對于處方數據m,對該處方數據m中的A類特征進行抽樣,為A類特征中的特征xa分配主題k的概率為:其中,C表示矩陣,VA是A類特征類別數量,xA為A類特征對應的主題個數,代表訓練數據集所有處方數據中xa分配給主題k的計數,K表示主題的個數,k表示K個主題中的第k個主題;代表所有分配給主題k的任意A類特征的計數,βA是Dirichlet先驗;z為給特征xa分配的主題,z-i表示給其余特征分配的主題,表示處方數據m中的所有特征中分配了主題k的數目,表示處方數據m中的所有特征的數目,M為訓練數據集中處方數據的總數,α是Dirichlet先驗;A類特征為診斷特征或用藥特征;然后根據給xa所分配的主題k得到MV-LDA模型中的參數取值。
4.如權利要求3所述的方法,其特征在于,A類特征的主題特征分布為其中,表示A類特征的主題特征分布在主題為k、特征為x的情況下的取值。
5.如權利要求1所述的方法,其特征在于,采用KL散度、歐幾里得距離、余弦相似度、皮爾遜相關性或向量點乘方法計算所述相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810992868.2/1.html,轉載請聲明來源鉆瓜專利網。





