[發明專利]基于視覺詞匯表與多特征匹配的Skyline的醫學大數據檢索方法在審
| 申請號: | 201611150453.8 | 申請日: | 2016-12-14 |
| 公開(公告)號: | CN106777090A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 李媛媛;季長清;肖鵬;鄧武;張雪;楊書惠 | 申請(專利權)人: | 大連交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 大連智高專利事務所(特殊普通合伙)21235 | 代理人: | 畢進 |
| 地址: | 116028 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 視覺 詞匯表 特征 匹配 skyline 醫學 數據 檢索 方法 | ||
技術領域
本發明專利屬于智慧醫療與大數處理交叉領域,是一種基于視覺詞匯表與多特征匹配的Skyline的醫學大數據檢索系統,該系統將度量空間Skyline查詢應用到基于內容的醫學圖像檢索技術當中,涉及到大規模醫療數據分析、云計算環境下的海量數據處理,涉及到智能數據處理與應用開發。
背景技術
隨著互聯網的發展和醫療數字化設備的普及,醫療圖像數據呈指數級增長,相關的圖像數據的檢索技術也越來越受到人們的關注,海量數據不僅具有數據量大的特點,它們還蘊含著巨大的商業價值。例如分析醫學癌癥用戶的腫瘤生長情況,可以指導醫生進行相關的個性化治療方案推薦;分析腦活動,心率的記錄可以給醫院廠家和病人帶來診療指導或家庭監護的病前預警。然而,海量醫學影像數據的爆炸式增長,使得傳統的單機數據分析處理技術已經越來越不適應當前密集型數據分析和處理的需為了在保證圖像檢索精度的前提下,提高醫學圖像檢索效率,度量空間Skyline查詢(MetricSkylineQuery)算法在圖像處理領域得到了很好的應用。該算法可以通過對度量空間中的數據剪枝來提高圖像檢索效率。
現有圖像數據的度量空間Skyline算法大多數是基于一般文本語義進行度量空間建模。在醫學為背景的語義圖像檢索方法中,盡管圖像的語義信息豐富,但也存在著語義信息復雜、語義理解主觀、語義提取和表達困難等缺點,這些缺點影響了度量空間建模和醫學圖像檢索效果;另外,由于語義信息的模糊性,大部分算法為了提高了查詢精度,根據語義需要選擇多張圖像參與查詢,這又大大增加了查詢過程的計算量。計算量大成為度量空間Skyline查詢的一大瓶頸,這點在海量醫學圖像數據處理上尤其突出。
近年來,基于內容的圖像檢索技術得到了迅速的發展,并逐漸成為圖像檢索領域的主流技術。針對已有醫學圖像數據的度量空間算法選擇圖像語義信息進行檢索的缺點,從醫學圖像內容入手,在度量空間上選取圖像的底層特征作為研究對象。為了提高檢索精度,為了節省計算開銷、加快相似度距離計算速度,從多特征融合角度設計度量空間Skyline算法,基于此,我們設計并實現了該發明專利。
發明內容
根據上述背景技術中存在的缺陷和不足,本發明將度量空間Skyline查詢應用到基于內容的醫學大規模圖像檢索技術當中,并提出了一種基于視覺詞匯表與Skyline多特征融合的醫學大規模圖像檢索方法(BigFeatureFusionbySkyline,BSKFF),利用Skyline操作進行多特征的融合,設計了一種新的基于視覺詞匯的醫學大數據檢索系統,更好的解決了醫學大規模圖象數據檢索問題。
為了實現上述目的,本專利所采用的技術方案是:
一種基于視覺詞匯表與多特征匹配的Skyline的醫學大數據檢索方法,其特征在于,包括如下步驟:
S1.提取醫學圖像的底層特征,分別對底層特征集合進行聚類,構建視覺詞匯表,以此,將圖像庫中的圖像量化為一個視覺單詞出現頻率的向量,得到分區特征向量;
S2.計算查詢圖像和圖像庫中的任意圖像在每個特征上的相似度距離,以構造不同特征的圖像相似度向量;
S3.調用基于Skyline的多特征融合方法進行分布式檢索計算決策。
進一步的,所述步驟S1.提取醫學圖像的特征數據,給定一個查詢圖像,提取該圖像的底層特征,包括如下步驟:
S1.1.Color特征的提取;
S1.2.SIFT特征的提取;
S1.3.構建視覺詞匯表;
S1.4.圖像量化表示。
進一步的,所述步驟S2中構造不同特征的圖像相似度向量的方法是:一個包含n幅醫學圖像的圖像庫和查詢圖像q,醫學圖像被表達為特征向量,查詢圖像q和圖像庫I中的任意圖像oi在第t個特征上的相似度距離,其表示為兩向量的L1距離:
其中表示圖像oi的第t個特征描述子向量,是圖像oi的第t維底層特征的k維向量;
基于公式1.3,得到查詢醫學圖像q和醫學圖像庫I中的任意圖像oi在每個特征上的相似度距離,圖像q和oi的相似度向量如定義1.2所示:
定義1.2:設為包含n幅圖像的圖像庫,q為查詢圖像,查詢圖像q與圖像庫I中任意圖像oi的相似度向量表示為m維向量:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連交通大學,未經大連交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611150453.8/2.html,轉載請聲明來源鉆瓜專利網。





