[發明專利]目標檢測模型的訓練方法、裝置、電子設備及存儲介質有效
| 申請號: | 201910315195.1 | 申請日: | 2019-04-18 |
| 公開(公告)號: | CN109961107B | 公開(公告)日: | 2022-07-19 |
| 發明(設計)人: | 李永波;李伯勛;俞剛 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V40/16;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 100190 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 模型 訓練 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供了一種目標檢測模型的訓練方法、裝置、電子設備及存儲介質,目標檢測模型包括第一分類網絡,該方法包括:設置至少一個第二分類網絡,其中,訓練時第二分類網絡的輸入與第一分類網絡的輸入相同;基于總損失函數對目標檢測模型進行訓練,直至總損失函數收斂,其中,總損失函數包括目標檢測模型的損失函數和第二分類網絡的損失函數。與現有的目標檢測模型的訓練方式相比,本申請實施例的方案,在對目標檢測模型進行訓練時,通過增設第二分類網絡,并基于第二分類網絡的損失函數和模型的損失函數在對目標檢測模型進行訓練,能夠有效加強模型對對誤檢和虛警的學習,從而提升了目標檢測模型的檢測精度。
技術領域
本申請涉及圖像處理技術領域,具體而言,本申請涉及一種目標檢測模型的訓練方法、裝置、電子設備及存儲介質。
背景技術
目標檢測的任務是找出圖像中所感興趣的目標,例如,在目標是人臉時,人臉檢測則意在檢測場景中的人臉及其對應位置。目標檢測是計算機視覺領域的重要問題之一,在安防檢測、人機交互等領域有長遠的研究價值和廣泛的應用需求。
近些年來,隨著深度神經網絡和硬件設備的發展,目標檢測技術獲得了快速發展,但是,目標檢測技術在實際應用過程中常常伴隨大量的虛警,即將某些非目標區域認定為目標區域,嚴重影響了目標檢測技術的推廣與使用。因此,如何抑制目標檢測網絡中的虛警,提升目標檢測的精度,是該領域非常重要的問題。
發明內容
本申請的目的旨在至少能解決上述的技術缺陷之一,特別是目標檢測過程中虛警率高的技術缺陷。
第一方面,本申請實施例提供了一種目標檢測模型的訓練方法,目標檢測模型包括第一分類網絡,該方法包括:
設置至少一個第二分類網絡,其中,訓練時第二分類網絡的輸入與第一分類網絡的輸入相同;
基于總損失函數對目標檢測模型進行訓練,直至總損失函數收斂,其中,總損失函數包括目標檢測模型的損失函數和第二分類網絡的損失函數。
本申請的可選實施例中,目標檢測模型包括單級檢測網絡結構。
本申請的可選實施例中,單級檢測網絡結構包括RetinaNet網絡結構。
本申請的可選實施例中,第二分類網絡包括級聯的卷積層和全連接層,其中,卷積層的輸入與RetinaNet網絡結構的Backbone(骨干)網絡的輸出連接。
本申請的可選實施例中,第二分類網絡的損失函數包括基于第二分類網絡的輸出確定的第一損失函數,以及基于第一分類網絡的輸出和第二分類網絡的輸出確定的第二損失函數中的至少一項。
本申請實施例中,第一損失函數為:
LC1=-(1-α)*p1γlog(1-p1)*(1-y)-α*(1-p1)γlog(p1)*y
其中,LC1表示第一損失函數,α為權重因子,p1為第二分類網絡的輸出結果,y表示樣本標簽,γ為調節因子。
本申請的可選實施例中,第二損失函數為:
LC2=-(y*(1-M)+(1-y)*M)*
(α*p1γlog(p1)*M-(1-α)*(1-p1)γlog(1-p1)*(1-M))
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910315195.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:軌跡分類模型的訓練方法和裝置、電子設備
- 下一篇:非接觸安全付款系統





