[發明專利]一種無監督學習物體外觀的算法有效
| 申請號: | 201910049159.5 | 申請日: | 2019-01-18 |
| 公開(公告)號: | CN111461150B | 公開(公告)日: | 2023-07-21 |
| 發明(設計)人: | 李曉強;戴松民 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06N3/0475;G06N3/088;G06N3/094;G06T7/11;G06T7/194 |
| 代理公司: | 北京中創博騰知識產權代理事務所(普通合伙) 11636 | 代理人: | 李梅 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 監督 學習 物體 外觀 算法 | ||
1.一種無監督學習物體外觀的算法,其特征在于,具體步驟如下:
步驟一,準備一張包含目標類別物體的圖片;
步驟二,對步驟一的圖片進行數據預處理;
步驟三,對步驟二的圖片使用生成對抗網絡訓練學習前景外觀和分割掩模;
所述步驟一中準備一張包含目標類別物體圖片的方式為從互聯網上找一張目標類別物體擁擠在一起的圖片,人工將該目標類別物體堆放在背景上,讓目標類別物體空間分布隨機并覆蓋住背景;
所述步驟二中數據預處理的方式為根據圖中目標類別物體的尺寸選擇一個窗口,?從原圖中根據該窗口的大小隨機采樣出足夠數量的圖片方塊并且統一縮放到固定尺寸;
所述生成對抗訓練學習前景外觀和分割的方式為:
第一,人工觀察所切出來的真實圖片塊中包含的目標類別物體數量,估計
目標類別物體數量上限N;
第二,從m維度標準正態分布中獨立地隨機采樣N個向量,分別經過同一個四通道圖片生成器進行解碼,得到N個具有獨立外觀的四通道圖片;將每個這樣的圖片進行在整個圖像范圍內隨機平移后,按次序疊加成一張包含多個隨機堆疊目標類別物體的合成圖片塊;
第三,采樣一個批次的合成圖片塊作為負樣本,同時采樣同樣多的真實圖片塊作為正樣本,以二分類的方式訓練判別器一次;
第四,根據判別器的分類得分,以對分類得分梯度上升和A通道面積梯度下降的方式對生成器執行一次權重更新,以提高合成圖片塊的真實程度;
第五,重復第二至第四步,直到生成器生成的物體達到所需的效果。
2.根據權利要求1所述的無監督學習物體外觀的算法,其特征在于,所述背景采用純色背景。
3.根據權利要求1-2中任意一項所述的無監督學習物體外觀的算法,其特征在于,所述窗口的大小為1.5倍最大目標類別物體的寬度,圖片方塊的數量不少于1萬個。
4.根據權利要求3所述的無監督學習物體外觀的算法,其特征在于,所述一個批次的合成圖片塊的數量為32張。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910049159.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于高壓質量流量計的歧管裝置和歧管組件
- 下一篇:信號增強裝置及其使用方法





