[發明專利]一種基于無偏嵌入零樣本學習的電芯缺陷分類方法在審
| 申請號: | 201811088628.6 | 申請日: | 2018-09-18 |
| 公開(公告)號: | CN109472284A | 公開(公告)日: | 2019-03-15 |
| 發明(設計)人: | 宋明黎;雷杰;宋杰 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06T7/00 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 嵌入 視覺 語義 電芯 缺陷分類 缺陷類別 樣本學習 嵌入的 圖像塊 標注 標簽 高清攝像頭 測試階段 方式獲取 分類結果 滑動窗口 目標數據 網絡模型 端對端 分類器 銜接子 源數據 子網絡 概率 映射 分配 內積 源類 投影 送入 采集 預測 網絡 監督 學習 圖片 | ||
一種基于無偏嵌入零樣本學習的電芯缺陷分類方法,包括:1)從通過高清攝像頭采集的電芯圖片中,采用滑動窗口的方式獲取合適大小的包含缺陷的圖像塊,將較為常見的缺陷類別分配為帶標簽的源數據,將少見的缺陷類別分配為無標簽的目標數據;2)使用有標注的源類數據和未標注的目標類數據來端對端地訓練準全監督學習網絡模型QFSL;3)測試階段,對于輸入的圖像塊,通過視覺嵌入子網絡得到它的視覺嵌入,接著利用視覺?語義銜接子網絡,完成從視覺嵌入到語義嵌入的映射,然后通過內積計算得到投影得到的視覺嵌入和語義嵌入的得分,最后送入Softmax分類器產生了所有類別的預測概率,將概率最高的那個類別作為分類結果。
技術領域
本發明屬于工業缺陷識別領域,針對電芯缺陷分類場景中部分缺陷的數據比較少或難以獲取的問題,提出了一種基于無偏嵌入零樣本學習的電芯缺陷分類方法。
背景技術
電芯缺陷識別是電池生產過程中重要的一環。在工業化快速發展的現代社會,傳統的使用人工查驗的方式存在諸多弊端:(1)人工耗費大。人工排查缺陷的方式需要耗費大量人力和時間才能匹配電池市場的需求;(2)評價缺乏客觀性。人工對缺陷的判斷主要依賴于個人經驗,這對于不同工人是難以統一的,因而最后的判斷是比較主觀的;(3)對工人視力損害大。由于缺陷的排查需要通過一些細微的區域進行判斷,會長時間耗費眼力,容易引起視覺疲勞。這些因素的存在,使得傳統的方式已無法適應工業場景中準確高效的需求。
隨著計算機視覺、深度學習領域的快速發展,基于大數據學習的分類模型成為一個有效的替代方案。通常情況下,該方案需要對各種缺陷手機大量訓練樣本學習,聯合訓練分類器,從而完成對缺陷類別的識別。在電芯缺陷場景中,主要的缺陷的類別包含凹坑、單層隔離膜破損、隔離膜翻折、劃傷、極耳打折、膠污、破損漏金屬、氣泡、碳粉條、碳粉臟污、壓傷、異物、油污共13種類別,其中一部分類別的出現的概率相對較低,相應的樣本量偏少,不足夠來直接用于缺陷分類器的訓練。此外,有些缺陷是隨著分類的進行逐漸被挖掘出來的,及缺陷的類別會出現新的種類。這種情況下的分類需要采用零樣本學習的策略,但是大多數現有的零樣本學習方法都存在強偏問題:在訓練階段,輸入通常被投影到由源類確定的語義嵌入空間中的幾個固定的點。這樣就導致了在測試階段中,在目標數據集中的新類圖像傾向于被分到源類當中。
發明內容
針對電芯缺陷分類場景中部分類別可用的樣本量偏少的現狀,本發明提出了一種同時利用帶有標注的源類數據和不帶標注的目標類數據,采用直推式無偏嵌入策略的零樣本學習方法,對電芯缺陷進行有效分類。
為實現上述目的,本發明所述的基于無偏嵌入零樣本學習的電芯缺陷分類方法包括如下步驟:
1)通過高清攝像頭采集電芯缺陷圖片,對缺陷區域進行取樣切塊,將較為常見的缺陷類別分配為帶標簽的源數據,將少見的缺陷類別分配為無標簽的目標數據,并將數據劃分為訓練集和測試集;
2)構建準全監督學習網絡模型QFSL,包括視覺嵌入子網絡、視覺-語義銜接子網絡、得分子網絡和分類器四個模塊;
3)使用訓練集中的圖像塊訓練QFSL模型,定義損失函數,利用隨機梯度下降算法SGD對模型參數進行優化;
4)將測試集中圖像塊輸入給QFSL模型,得到輸入在源類別及目標類別上的預測概率,將概率最高的那個類別作為分類結果。
進一步,所述的電芯缺陷包含凹坑、單層隔離膜破損、隔離膜翻折、劃傷、極耳打折、膠污、破損漏金屬、氣泡、碳粉條、碳粉臟污、壓傷、異物、油污共13種類別,其中隔離膜翻折、極耳打折、破損漏金屬和異物的數據比較少,不足以訓練傳統的分類器,作為目標數據類別,其余的類別作為源數據類別。
進一步,所述的視覺嵌入子網絡采用在ImageNet數據集上預訓練的GoogLeNet將原始圖像映射到視覺嵌入空間;其中,視覺嵌入子網絡的參數用Wθ表示,視覺嵌入子網絡模塊會與其它模塊一起優化,網絡的第一個全連接層的輸出作為視覺嵌入。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811088628.6/2.html,轉載請聲明來源鉆瓜專利網。





