[發明專利]一種用于深度學習評定血管網絡發育水平的數據集增強方法有效
| 申請號: | 201810261472.0 | 申請日: | 2018-03-28 |
| 公開(公告)號: | CN108596840B | 公開(公告)日: | 2021-10-29 |
| 發明(設計)人: | 方路平;趙沈佳;潘清;盛邱煬;陸飛 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/136;G06T7/11 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 深度 學習 評定 血管 網絡 發育 水平 數據 增強 方法 | ||
一種用于深度學習評定血管網絡發育水平的數據集增強方法,包括以下步驟:a對原始圖像進行預處理;b對預處理之后的圖像進行數據擴增;c在原始圖像空間范圍中劃分等面積的N個矩形區域;d在每個區域中隨機選取相同比例數量的圖片生成數據集。本發明提供了一種數據集分布更加全面、均衡、增強模型魯棒性的用于深度學習評定血管網絡發育水平的數據集增強方法。
技術領域
本發明涉及一種數據集增強方法,可為應用深度學習對血管網絡進行分類提供圖像數據集,屬于深度學習技術領域。
背景技術
評定胚胎發育階段和發育情況對于生理和臨床研究具有重要的意義。局部的血管網絡形態與拓撲模式可用于評定胚胎的生長發育情況。深度學習方法可以通過學習各種發育階段的局部血管網絡形態與拓撲模式對胚胎發育水平做出評定,比傳統方法具有更好的性能。
由于胚胎血管網絡結構具有空間異質性,即不同空間位置的血管網絡形態結構差異性很大,因此需要截取不同空間位置的局部血管網絡圖像輸入深度學習模型,確保模型的性能。在完整血管網絡圖像中按行掃描截取局部圖像的方法不能獲得足夠多的圖像數據。在完整血管網絡圖像中隨機截取局部圖像的方法能夠確保數據集具有足夠大的規模,適用于深度學習,但難以確保所選圖像均勻覆蓋完整的胚胎血管網絡區域,且部分選取的圖像之間相似度過高,因而會造成所選數據集不能完整地代表胚胎血管網絡的結構特征,影響模型的性能。
“一種用于深度學習評定血管網絡發育水平的數據集增強方法”便能夠解決血管網絡圖片的數據量不足,圖像數據擴增之后圖片之間過于相似以及數據集選圖空間分布不均勻的問題。該方法用于深度學習對血管網絡分類的數據集增強。
發明內容
為了克服現有技術中圖像數據集數量不足以及數據擴增之后圖片相似度過高、數據集選圖空間分布不均勻的不足,本發明提供了一種數據集分布更加全面、均衡,增強模型魯棒性的用于深度學習評定血管網絡發育水平的數據集增強方法。
為了解決上述技術問題,本發明采用以下技術方案:
一種用于深度學習評定血管網絡發育水平的數據集增強方法,包括以下步驟:
a.對原始圖像進行預處理;
b.對預處理之后的圖像進行數據擴增;
c.在原始圖像空間范圍中劃分等面積的N個矩形區域;
d.在每個區域中隨機選取相同比例數量的圖片生成數據集。
進一步,所述步驟a中,預處理包括以下步驟:
a1去除圖像周圍無效信息的區域;
a2對用不同放大鏡倍數生成的圖像進行縮放處理,使其達到同樣的比例尺標準;
a3對圖像做二值化處理,去除噪聲點干擾。
通過以上步驟能夠有效地減少原始血管網絡圖像中無效的區域和噪聲點。
再進一步,所述步驟b中,數據擴增包括以下步驟:
b1設定一個圖片覆蓋率的閾值E,該閾值的設定是為了避免擴增圖片的重疊區域過大;
b2在預處理之后的圖像中進行均勻隨機取點。以均勻隨機取到的坐標點作為擴增圖片的中心點生成圖片,計算該圖像與每一張已存在的圖像的覆蓋率,假定均勻隨機取點的坐標為(X,Y),以該點作為圖片的中心點生成正方形的圖片,圖片的邊長為C,另一點坐標為(X′,Y′),圖片的邊長為C,則兩圖重疊面積為:
計算得這兩張圖的覆蓋率為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810261472.0/2.html,轉載請聲明來源鉆瓜專利網。





