[發明專利]用于食管癌模型訓練的圖片的篩選方法、系統及存儲介質在審
| 申請號: | 202110264294.9 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN112950601A | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 肖瀟;劉敬家 | 申請(專利權)人: | 成都微識醫療設備有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06K9/62;G16H50/20 |
| 代理公司: | 成都云縱知識產權代理事務所(普通合伙) 51316 | 代理人: | 劉沙粒;伍星 |
| 地址: | 610000 四川省成都市中國(四川)自*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 食管癌 模型 訓練 圖片 篩選 方法 系統 存儲 介質 | ||
用于食管癌模型訓練的圖片的篩選方法、系統及存儲介質,該方法包括以下步驟:輸入待篩選的靜態圖片;根據所述靜態圖片的特征,采用聚類算法對靜態圖片進行聚類,得到若干類靜態圖片;采用距離函數對各聚類中的靜態圖片進行篩選,得到相似程度低的靜態圖片作為用于建立食管癌識別模型的訓練樣本。本發明在輸入靜態圖片時能夠允許采用更大的樣本量以解決模型泛化能力差的問題,同時,通過聚類算法對大樣本的靜態圖片進行聚類,再通過距離函數篩選各聚類中相似程度低的靜態圖片,最終在樣本覆蓋率不受顯著影響的前提下實現了從大樣本到小樣本的轉變,得到適于訓練識別窄帶成像下的食管鱗癌病變圖片。
技術領域
本發明涉及智能醫療技術領域,具體涉及用于食管癌模型訓練的圖片的篩選方法、系統及存儲介質。
背景技術
食管癌是世界上常見的消化道惡性腫瘤之一,其病理類型主要包括食管鱗狀細胞癌(ESCC)和食管腺癌(EADC),而我國食管癌患者中約九成為食管鱗狀細胞癌。上消化道內鏡檢查結合組織病理學是食管鱗癌診斷的金標準。對于難以發現的病變主要依靠色素內鏡以及電子染色內鏡發現,然后靶向活檢,通過組織病理學進行診斷。
隨著圖像識別技術的發展,通過篩選、歸類病變圖片,訓練和深度學習病變和非病變圖片的特征以建立深度學習模型,利用深度學習模型能夠替代傳統依靠經驗豐富的內鏡醫師肉眼瀏覽圖片進行診斷的方式,實現對內鏡檢查過程中采集的靜態圖片和動態視頻做出提示和判定,進而輔助內鏡醫師快速地診斷癌前病變。
為了提高深度學習模型的判斷準確性,通常需要構建大量的神經網絡。然而,神經網絡的復雜化通常會造成過擬合,陷入局部最優,即在訓練圖片上的表現很好,但對于未見到的圖片表現很差,泛化能力差。目前,增加樣本病變圖片的數量是避免模型過擬合的主要途徑。但是,若要樣本數據完全覆蓋住樣本空間,需要的數據量將呈指數增加。大樣本訓練的模型不僅計算量激增,而且不同類別的數據量差別大,若控制不好樣本的均衡同樣會造成模型泛化能力差,同時樣本數據內部,各種樣本例如陰性樣本和陽性樣本互相干擾導致模型的敏感性和特異性低,造成模型訓練以失敗而告終。
發明內容
本發明的目的在于提供用于食管癌模型訓練的圖片的篩選方法、系統及存儲介質,該方法采用距離函數從由聚類算法分類好的大樣本中篩選得到適于訓練識別窄帶成像下的食管鱗癌病變的小樣本,從而摒棄直接采用大樣本進行模型訓練的方式,有效地減少了由于大樣本訓練導致的模型泛化能力差、敏感性和特異性低的問題,實現降低樣本數據之間的非主觀影響,以篩選更有利于識別窄帶成像下的食管鱗癌癌前病變及早期食道鱗狀細胞癌模型訓練的小樣本,更好地完成該食管鱗狀細胞癌輔助診斷軟件的訓練與開發。
本發明通過下述技術方案實現:
用于食管癌模型訓練的圖片的篩選方法,包括以下步驟:
輸入待篩選的靜態圖片;
根據所述靜態圖片的特征,采用聚類算法對靜態圖片進行聚類,得到若干類靜態圖片;
采用距離函數對各聚類中的靜態圖片進行篩選,得到相似程度低的靜態圖片作為用于建立食管癌識別模型的訓練樣本。
本技術方案中,靜態圖片選自癌前病變或ESCC食管視頻,以及正常食管的視頻。所述視頻可以是放大視頻,也可以是非放大視頻。所述視頻的光源可以是白光,也可以窄帶成像光。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都微識醫療設備有限公司,未經成都微識醫療設備有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110264294.9/2.html,轉載請聲明來源鉆瓜專利網。





