[發(fā)明專利]一種基于支持向量機的醫(yī)療影像檢查疾病分類方法有效
| 申請?zhí)枺?/td> | 201510242216.3 | 申請日: | 2015-05-12 |
| 公開(公告)號: | CN104834940A | 公開(公告)日: | 2015-08-12 |
| 發(fā)明(設計)人: | 何必仕;倪杭建;徐哲 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 浙江杭州金通專利事務所有限公司 33100 | 代理人: | 王佳健 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 支持 向量 醫(yī)療 影像 檢查 疾病 分類 方法 | ||
1.一種基于支持向量機的醫(yī)療影像檢查疾病分類方法,其特征在于該方法包括以下步驟:
步驟1:首先對RIS數(shù)據(jù)庫中的檢查文本數(shù)據(jù)使用k-means聚類方法聚成十大類,聚成十個類別后,借助國際疾病類型分類標準ICD-10將這十個類別進行疾病類型編碼;將編碼后的十大類文本數(shù)據(jù)作為醫(yī)療影像疾病標準語料庫,并以此作為分類的訓練數(shù)據(jù)以及測試數(shù)據(jù);
步驟2:從十大類檢查文本數(shù)據(jù)中抽取其中一部分記錄作為分類的訓練模型,而將剩余的檢查文本數(shù)據(jù)作為測試樣本,用于檢測分類模型的分類精度;文本分類使用支持向量機方法:
步驟3:針對檢查文本分類過程中支持向量機分類器的建立過程進行優(yōu)化;
使用訓練樣本完成支持向量機分類器的建立后,將剩余的樣本作為測試樣本來檢測分類器的分類精度;在完成測試集的分類后,通過建立分類結果的混淆矩陣,來判斷哪些檢查文本被錯分,找出這些錯分的文本并將其加入到原屬類別的訓練樣本中,以此來組成新的訓練樣本,最后再將新的訓練樣本通過步驟2來進行訓練支持向量機分類器。
2.根據(jù)權利要求1所述的一種基于支持向量機的醫(yī)療影像檢查疾病分類方法,其特征在于:步驟1中所述K-means聚類的具體步驟按照以下步驟來完成:
1)對選出的檢查文本數(shù)據(jù)先進行預處理,主要對檢查文本數(shù)據(jù)進行詞性的標注,構成統(tǒng)計詞典,對文本數(shù)據(jù)進行詞條切分,并使用中文分詞程序ICTCLAS完成分詞;
2)建立檢查文本數(shù)據(jù)的空間向量并降維;該步驟主要是將檢查文本數(shù)據(jù)轉化成計算機能識別的形式,采用空間向量模型來表示文本信息;由于生成的向量空間模型其維數(shù)一般都很大,需要經(jīng)過稀疏降維處理;
3)檢查文本數(shù)據(jù)聚類處理;采用平面劃分的聚類過程如下:
(1)確定生成的簇的數(shù)目k;
(2)生成k個原始聚類中心S=(s1,s2,...,sn);
(3)對D中的每個文件di,依次計算與聚類中心S中sj的相似度sim(di,sj);
(4)從上面計算出的相似度中選出最大相似度,并將di歸入到sj中;
(5)重復(3)、(4)兩個步驟若干次,直到所有檢查文本數(shù)據(jù)都完成聚類;
(6)將聚類完成的十個大類按照國際疾病分類標準ICD-10進行編碼并確定其疾病類型。
3.根據(jù)權利要求1所述的一種基于支持向量機的醫(yī)療影像檢查疾病分類方法,其特征在于:步驟2中向量機方法,其具體建立支持向量機分類器過程如下所示:
1)檢查文本預處理;首先要對訓練樣本進行文本預處理,使用ICTCLAS漢語分詞系統(tǒng)對訓練樣本進行分詞處理;
2)檢查文本表示;將上述預處理完成的文本轉換成計算機能明白的形式,使用向量空間表示模型;其向量空間模型表示為V=(t1,w1;t2,w2;...;tn,wn),其中(t1,t2,...,tn)表示特征詞條,(w1,w2,...,wn)表示特征詞條對應的權重;
3)對檢查文本中的特征詞條進行降維處理,即特征選擇處理;特征選擇的使用互信息,首先計算出所有檢查文本中特征詞條與類別之間的互信息值,然后設定一個閾值,將大于該閾值的特征詞條留下,而刪除小于該閾值的特征詞條;
4)支持向量機分類器的建立;構建支持向量機分類器方法最關鍵的是找出一個最優(yōu)超平面將樣本數(shù)據(jù)分為兩類,最優(yōu)超平面不僅能將兩類正確分開,而且要使分類間距最大;當分類線性方程為g(x)=w·x+b,對它進行歸一化處理使其滿足|g(x)|≥1,當條件等于1的時候可以求得其分類間隔為2/||w||,要使分類間隔最大等價于||w||最小;轉化為求解的最小值,針對該最優(yōu)求解,引入Lagrange函數(shù)來解決該約束最優(yōu)化問題,轉化為目標函數(shù):
由Lagrange極值定理可以求得最優(yōu)解w*和b*(其中yi∈{+1,-1}正表示屬于該類,負表示不屬于該類);最后即可得到最優(yōu)分類函數(shù)為:
如果f(x)大于0表示該樣本屬于yi類,小于0則表示不屬于yi類;
5)構造多類SVM分類器;采用的是二叉樹方法來構造;其主要思想是將第i類作為+1類,第i+1到i+n類為-1類,隨著i的遞增依次建立多個分類器即可;對待分類樣本x時,從第一個分類器開始,如果大于0則表示屬于第一類并停止決策,否則繼續(xù)使用第二個分類器,以此類推直到判斷出x所屬類別為止。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經(jīng)杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510242216.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





