[發明專利]一種基于支持向量機的醫療影像檢查疾病分類方法有效
| 申請號: | 201510242216.3 | 申請日: | 2015-05-12 |
| 公開(公告)號: | CN104834940A | 公開(公告)日: | 2015-08-12 |
| 發明(設計)人: | 何必仕;倪杭建;徐哲 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 浙江杭州金通專利事務所有限公司 33100 | 代理人: | 王佳健 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 支持 向量 醫療 影像 檢查 疾病 分類 方法 | ||
技術領域
本發明涉及醫療影像檢查疾病自動分類領域,具體涉及一種基于支持向量機的醫療影像檢查疾病自動分類方法。
背景技術
隨著數字醫療的快速發展,醫療數據成爆炸式增長。以醫療影像信息系統RIS為例,長年運行積累了大量的檢查、隨訪和會診記錄,其中大部分內容為文本數據。針對這些海量文本數據,研究圍繞疾病的聚類、分類對于醫療管理決策有著重要意義。
目前,對于醫療影像檢查的疾病分類,一般是通過影像醫生人工分類,由于影像醫生日常診斷繁忙,常常無暇顧及。因此,事后實現自動分類具有應用價值。經過文獻檢索可知,霍洪波等在文章The?Automatic?Classification?Research?to?Medical?Imaging?Disease?Based?onNayesion?Algorithm提出了基于樸素貝葉斯算法的影像檢查文本自動分類方法。樸素貝葉斯方法存在不足之處:首先樸素貝葉斯分類法是假設在各個分類屬性之間是相互獨立的,而在實際情況下,各類屬性之間不可能是相互獨立的,這給分類準確率帶來了一定的影響;其次,該方法是假設在無限訓練樣本存在的情況下建立的,而實際情況下訓練樣本不可能無限大。
針對樸素貝葉斯分類方法存在的上述問題,本發明采用優化的支持向量機分類方法,解決小樣本訓練問題、高維、非線性以及分類精度低等問題。
發明內容
本發明的目的主要是為了克服常用分類器對樣本量、高維以及訓練過程存在的問題,提出了一種優化的支持向量機文本分類方法,解決醫療影像檢查基于文本數據的疾病自動分類。
本發明主要按照以下技術方法實現:首先對醫療影像信息系統RIS數據庫中的檢查文本用K-means聚類,生成標準醫療影像疾病語料庫,該語料庫作為分類器訓練樣本以及測試樣本。其次,再使用訓練樣本對支持向量機分類器進行訓練,生成分類標準后再使用該分類模型對分類樣本分類。最后針對分類結果存在的不足之處,提出支持向量機分類器優化的訓練過程。
本發明的具體步驟是:
步驟1:首先對RIS數據庫中的檢查文本數據使用k-means聚類方法聚成十大類,聚成十個類別后,借助國際疾病類型分類標準ICD-10將這十個類別進行疾病類型編碼。將編碼后的十大類文本數據作為醫療影像疾病標準語料庫,并以此作為分類的訓練數據以及測試數據。K-means聚類的具體步驟可以按照以下步驟來完成:
1)對選出的檢查文本數據先進行預處理,主要對檢查文本數據進行詞性的標注,構成統計詞典,對文本數據進行詞條切分,并使用中文分詞程序ICTCLAS完成分詞。
2)建立檢查文本數據的空間向量并降維。該步驟主要是將檢查文本數據轉化成計算機能識別的形式,采用空間向量模型來表示文本信息。由于生成的向量空間模型其維數一般都很大,需要經過稀疏降維處理。
3)檢查文本數據聚類處理。采用平面劃分的聚類過程如下:
(1)確定生成的簇的數目k;
(2)生成k個原始聚類中心S=(s1,s2,...,sn);
(3)對D中的每個文件di,依次計算與聚類中心S中sj的相似度sim(di,sj);
(4)從上面計算出的相似度中選出最大相似度,并將di歸入到sj中;
(5)重復(3)、(4)兩個步驟若干次,直到所有檢查文本數據都完成聚類;
(6)將聚類完成的十個大類按照國際疾病分類標準ICD-10進行編碼并確定其疾病類型。
步驟2:從十大類檢查文本數據中抽取其中一部分記錄作為分類的訓練模型,而將剩余的檢查文本數據作為測試樣本,用于檢測分類模型的分類精度。文本分類使用支持向量機方法,具體建立支持向量機分類器(SVM分類器)過程如下所示:
1)檢查文本預處理。首先要對訓練樣本進行文本預處理,由于在文本聚類過程中已經檢查過文本的是否缺失以及是否存在臟數據等情況,故該步驟無需重復以上步驟。只需使用ICTCLAS漢語分詞系統對訓練樣本進行分詞處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510242216.3/2.html,轉載請聲明來源鉆瓜專利網。





