[發明專利]在標簽含噪情況下基于質量嵌入的圖像分類方法及系統有效
| 申請號: | 201710599924.1 | 申請日: | 2017-07-21 |
| 公開(公告)號: | CN107463953B | 公開(公告)日: | 2019-11-19 |
| 發明(設計)人: | 張婭;姚江超;王嘉杰;王延峰 | 申請(專利權)人: | 上海媒智科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 31317 上海恒慧知識產權代理事務所(特殊普通合伙) | 代理人: | 徐紅銀<國際申請>=<國際公布>=<進入 |
| 地址: | 200030 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 情況 基于 質量 嵌入 圖像 分類 方法 系統 | ||
本發明提供一種在標簽含噪情況下基于質量嵌入的圖像分類方法及系統,包括:網絡圖片標簽收集步驟;標簽質量因子嵌入步驟:在有監督的圖像分類模型中引入標簽質量因子,用于控制帶噪標簽的預測值生成和吸收來自錯誤標簽的誤差回傳信息;利用最大化對數似然函數,設計加入標簽質量因子之后的優化目標函數;網絡模型構建步驟:利用深度神經網絡對優化目標函數進行建模;網絡參數訓練步驟:將訓練圖片和帶噪聲的標簽輸入網絡模型,使用變種的隨機梯度下降法端到端的聯動訓練模型,同時更新模型參數;圖像分類步驟。本發明將圖片真實標簽、用戶提供標簽和圖片標簽質量三個變量統一建模,形成對含噪標簽的監督學習,能得到較為準確的圖像分類結果。
技術領域
本發明涉及計算機視覺和數據挖掘領域,具體地,特別涉及標簽含有噪聲情況下的圖片標簽學習方法及系統。
背景技術
圖像識別是人工智能領域的一項基礎而重要的任務,其應用跨越了自然科學,醫藥學,工業等多個領域。隨著深度學習的迅猛發展,利用卷積神經網絡訓練得到的圖像分類器獲得了空前成功。然而深度學習框架下的圖像分類學習依賴于大規模高品質的訓練數據,包括清晰的圖像和精確的標簽。這樣的訓練數據往往來自于人工收集和標注,這將消耗大量的人力物力,使得處理新領域的圖像識別問題變得相對昂貴和低效。
由于網絡技術,社交媒體的迅速發展以及人們對網絡自媒體的熱愛,互聯網絡中存在數不勝數的圖片數據。圖片社交平臺如Flickr和網易LOFTER擁有近千百萬的用戶提供的圖片數據以及標簽信息。如果能將這些圖片和標簽數據用于深度神經網絡模型的訓練,將大大提升數據集的種類和數量,幫助深度神經網絡更快速的遷移到不同領域的圖像識別問題中。
使用互聯網用戶上傳的圖片和標簽作為訓練數據可以很好的解決人工標記數據的局限,但是也會帶來相應的問題和挑戰。大型人工標記數據集提供的圖片數據品質好且標簽完備,因此基于此類數據集訓練得到的神經網絡分類器模型準確率高。相比之下,網絡圖片以及用戶標簽存在質量不佳標簽不準確的特性。如果利用存在大量噪聲的圖片標簽數據,會大大降低模型的預測可靠度。因此,研究如何充分利用網絡圖片以及用戶提供標簽這一取之不盡的數據資源,進行有效的圖片標簽學習得到了更多的關注。
傳統的利用帶噪標簽進行圖片標簽學習的方法有設計魯棒的損失函數、統計查詢、模擬噪聲特性等等。其中一些方法需要一部分干凈的標簽數據來輔助訓練圖像分類器;另外一些嘗試建立模型模擬數據噪聲的分布,圖片中真實標簽與用戶提供標簽之間的差異帶來的噪聲,卻沒有考慮的圖片質量好壞,以及用戶提供標簽的準確程度,其分類識別的的效果達不到預期。
發明內容
本發明的目的是克服現有技術的不足,提供一種在標簽含噪情況下基于質量嵌入的圖像分類方法及系統,以解決現有技術中使用帶噪聲的標簽圖片訓練圖像分類器時不考慮圖片標簽本身質量的問題。
根據本發明的一個方面,提供一種在標簽含噪情況下基于質量嵌入的圖像分類方法,包括:
網絡圖片標簽收集步驟:從網絡圖片分享平臺上獲取大量圖片和用戶提供的標簽信息,按照所需種類進行過濾和整理,以便用于圖像分類器的訓練;
標簽質量因子嵌入步驟:在有監督的圖像分類模型中引入標簽質量因子,用于控制帶噪標簽的預測值生成和吸收來自錯誤標簽的誤差回傳信息;利用最大化對數似然函數,設計加入標簽質量因子之后的優化目標函數;
網絡模型構建步驟:利用深度神經網絡對優化目標函數進行建模,得到整體網絡模型,其包括四個子模型,分別為編碼模型、采樣模型、解碼模型和分類模型;
網絡參數訓練步驟:將網絡圖片標簽收集步驟得到的訓練圖片和帶噪聲的標簽輸入網絡模型構建步驟得到的整體網絡模型,使用變種的隨機梯度下降法端到端的聯動訓練上述四個子模型,同時更新四個子模型的模型參數;
圖像分類步驟:對于要求分類的新圖片,輸入至訓練好的分類模型,得到對圖片真實標簽的預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海媒智科技有限公司,未經上海媒智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710599924.1/2.html,轉載請聲明來源鉆瓜專利網。





