[發明專利]多圖像目標檢測的訓練方法、檢測方法及相關產品有效
| 申請號: | 202210847260.7 | 申請日: | 2022-07-19 |
| 公開(公告)號: | CN114937086B | 公開(公告)日: | 2022-11-01 |
| 發明(設計)人: | 史曉宇;和超;張大磊 | 申請(專利權)人: | 北京鷹瞳科技發展股份有限公司 |
| 主分類號: | G06T7/73 | 分類號: | G06T7/73;G06V10/764;G06V10/774;G06V10/82;G06N3/08;G06N3/04 |
| 代理公司: | 北京維昊知識產權代理事務所(普通合伙) 11804 | 代理人: | 陳姍姍 |
| 地址: | 100081 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 目標 檢測 訓練 方法 相關 產品 | ||
本申請公開了一種目標檢測模型的訓練方法、多圖像中檢測固定位置目標的方法及相關產品。目標檢測模型用于對多個圖像中固定位置目標進行檢測,所述訓練方法包括:在訓練過程的每次迭代中,接收多個訓練圖像作為所述目標檢測模型的輸入;利用所述目標檢測模型從所述多個訓練圖像中提取特征圖并輸出響應點;在標簽分配中,聯合所述多個訓練圖像中固定位置目標的先驗信息為所述響應點賦予標簽;以及基于賦予的所述標簽,計算損失函數。本申請的目標檢測模型在訓練時以多圖像為輸入,使得模型能夠學習多個圖像之間的一致性關系,從而提高檢測性能。
技術領域
本申請一般地涉及目標檢測領域。更具體地,本申請涉及目標檢測模型的訓練方法、多圖像中檢測固定位置目標的方法、計算裝置和計算機可讀存儲介質。
背景技術
在工作生活中,經常需要使用圖像采集設備采集序列圖像、視頻或連續多張圖像。在此過程中,可能會出現鏡頭出現污損,光學儀器內部侵入污漬等問題,從而導致成像圖像中在某一位置出現固定的臟污干擾。或者在監控場景中,需要判別在一定時間內,某個位置是否出現了遺留物或出現了危險物品等。這些不同場景下的問題本質上都屬于同一類問題,稱為“多圖像中固定位置目標檢測”。
利用多圖像檢測其中的固定位置目標具有很高的實用意義。例如,在醫學圖像采集過程中,尤其是使用便攜式設備采集圖像過程中,很容易出現鏡頭的污損。這種污損可以是鏡頭表面附著了灰塵、顆粒等物質,從而在成像中形成了某種陰影目標。也可以是操作員誤觸鏡頭帶來的指紋、油漬等,從而在成像中形成了反光。又或者是儀器制造不夠精密,在使用一定時間后,儀器內部進入了灰塵,使得成像光路受到干擾,形成了暗影目標。這些偽影和干擾,在不同的醫學場景下,對醫療人員的診斷以及智能設備的識別都形成了不同程度的干擾。有效地通過檢測的方式來確定圖像中某些疑似偽影的目標是否為真的污損,有著很強的實際意義。
現有的檢測方法大多針對單圖像輸入,在這種使用單圖像檢測實現多圖中固定位置目標的檢測方案中,由于訓練時檢測網絡的輸入為單圖像輸入,因此只能通過后處理來確定固定位置目標。這種單圖像輸入附加后處理的方法受限于單個檢測網絡的性能以及后處理的超參數設計。當固定位置目標特征非常明顯且和其他目標的類間差距很大時,目標檢測技術可以輕易地檢測得到目標,后處理部分也不會面臨復雜的相似目標密集檢測或相似目標遮擋等問題。然而,在醫療圖像場景中,尤其是眼底照相圖像識別疾病的場景中,很容易出現和固定位置目標相似的普通目標,從而使得依賴單圖像檢測的方式需要非常高的檢測精度才能夠完成對固定位置目標的定位。
例如,在眼底圖像中,深層的出血和雜質的偽影很相似,使得單圖像檢測很容易造成誤檢。對于通過兩張圖像A和B來判斷固定位置目標的情形,可能會出現A漏檢-B預測固定位置目標,A錯檢出血為雜質-B沒有錯檢,A預測雜質-B預測出血等多種情況。這些問題是單圖像檢測本身的問題,而在其附加的后處理中,由于已經脫離了圖像特征本身,是無法判斷上述幾個例子到底應該如何決策的。
因此亟需一種多圖像中檢測固定位置目標的方案,其能夠提高檢測精度。進一步地,也期望這種檢測方案能夠區分固定位置目標和普通目標。
發明內容
為了至少部分地解決背景技術中提到的一個或多個技術問題,本申請的方案提供了一種目標檢測模型的訓練方法、多圖像中檢測固定位置目標的方法、計算裝置和計算機可讀存儲介質。
在第一方面中,本申請公開一種目標檢測模型的訓練方法,所述目標檢測模型用于對多個圖像中固定位置目標進行檢測,其特征在于,所述訓練方法包括:在訓練過程的每次迭代中,接收多個訓練圖像作為所述目標檢測模型的輸入;利用所述目標檢測模型從所述多個訓練圖像中提取特征圖并輸出響應點;在標簽分配中,聯合所述多個訓練圖像中固定位置目標的先驗信息為所述響應點賦予標簽;以及基于賦予的所述標簽,計算損失函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京鷹瞳科技發展股份有限公司,未經北京鷹瞳科技發展股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210847260.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于近視預測的方法及其相關產品
- 下一篇:一種一體式成型充電槍
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





