[發明專利]圖像分類方法及裝置、電子設備、計算機程序及存儲介質在審
| 申請號: | 201810866704.5 | 申請日: | 2018-08-01 |
| 公開(公告)號: | CN109325512A | 公開(公告)日: | 2019-02-12 |
| 發明(設計)人: | 丁明宇;王哲;石建萍;盧志武 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京思源智匯知識產權代理有限公司 11657 | 代理人: | 毛麗琴 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義特征 待處理圖像 計算機程序 比對結果 存儲介質 電子設備 圖像分類 標注 圖像 圖像語義特征 語義 圖像特征 編碼器 比對 聚類 轉導 分類 轉化 學習 | ||
本發明實施例公開了一種圖像分類方法及裝置、電子設備、計算機程序及存儲介質,其中,方法包括:根據預先訓練的轉導式語義編碼器,將待處理圖像的圖像特征轉化為語義特征;將所述語義特征與未標注圖像語義特征庫中的語義特征進行比對,得到比對結果;根據所述比對結果確定所述待處理圖像的類別。本發明實施例可以實現對未標注圖像的分類或者聚類,不需要預先學習所有類別的圖像,提高了效率,降低了成本。
技術領域
本發明涉及計算機視覺技術,尤其是一種圖像分類方法及裝置、電子設備、計算機程序及存儲介質。
背景技術
近年來,隨著深度學習的興起和ImageNet等大規模數據集的出現,計算機視覺任務的趨勢是將分類任務擴展到更大規模的數據集上,并擴展類別的數量。但是,絕大多數現有的分類模型都是基于監督學習的,需要大量標記好的訓練數據,然而對于稀有類別的數據收集和對大量數據的標記是很困難的,需要消耗大量的人力和時間資源。
發明內容
本發明實施例提供一種圖像分類技術方案。
根據本發明實施例的一個方面,提供一種圖像分類方法,包括:
根據預先訓練的轉導式語義編碼器,將待處理圖像的圖像特征轉化為語義特征;
將所述語義特征與未標注圖像語義特征庫中的語義特征進行比對,得到比對結果;
根據所述比對結果確定所述待處理圖像的類別。
可選地,在本發明上述方法實施例中,所述根據預先訓練的轉導式語義編碼器,將待處理圖像的圖像特征轉化為語義特征之前,還包括:
對所述待處理圖像進行特征提取,得到所述待處理圖像的圖像特征。
可選地,在本發明上述任一方法實施例中,所述將所述語義特征與未標注圖像語義特征庫中的語義特征進行比對,得到比對結果,包括:
將所述語義特征與所述未標注圖像語義特征庫中的語義特征進行比對,得到至少一個相似度;
將相似度大于預設閾值的所述語義特征庫中的語義特征作為比對結果。
可選地,在本發明上述任一方法實施例中,所述根據所述比對結果確定所述待處理圖像的類別,包括:
將所述比對結果對應的類別作為所述待處理圖像的類別。
可選地,在本發明上述任一方法實施例中,所述根據預先訓練的轉導式語義編碼器,將待處理圖像的圖像特征轉化為語義特征之前,還包括:
根據已標注圖像和所述未標注圖像訓練所述轉導式語義編碼器。
可選地,在本發明上述任一方法實施例中,所述根據已標注圖像和所述未標注圖像訓練所述轉導式語義編碼器,包括:
根據所述已標注圖像的第一圖像特征及其第一語義特征,得到所述第一圖像特征與所述第一語義特征之間的正向映射和反向映射;
根據所述正向映射和所述反向映射獲取所述轉導式語義編碼器的第一目標函數;
根據所述正向映射將所述未標注圖像的第二圖像特征轉化為第二語義特征;
將所述第二語義特征與所述未標注圖像語義特征庫中的語義特征進行比對,獲取相似度大于預設閾值的語義特征;
根據所述第二語義特征和所述相似度大于預設閾值的語義特征得到所述轉導式語義編碼器的第二目標函數;
根據所述第一目標函數和所述第二目標函數優化所述正向映射,得到收斂的正向映射。
可選地,在本發明上述任一方法實施例中,所述根據預先訓練的轉導式語義編碼器,將待處理圖像的圖像特征轉化為語義特征,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810866704.5/2.html,轉載請聲明來源鉆瓜專利網。





