[發明專利]一種基于跨域快速遷移的視覺揀選方法及裝置有效
| 申請號: | 202110514446.6 | 申請日: | 2021-05-08 |
| 公開(公告)號: | CN113221916B | 公開(公告)日: | 2023-07-07 |
| 發明(設計)人: | 張正;趙書光;盧光明 | 申請(專利權)人: | 哈爾濱工業大學(深圳) |
| 主分類號: | G06V10/44 | 分類號: | G06V10/44;G06V10/74;G06V10/774;G06V10/80 |
| 代理公司: | 深圳市添源創鑫知識產權代理有限公司 44855 | 代理人: | 覃迎峰 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 快速 遷移 視覺 揀選 方法 裝置 | ||
1.一種基于跨域快速遷移的視覺揀選方法,其特征在于,所述方法包括:
基于學習的域隨機化,采集仿真域的參數數據,具體包括:結合真實域的引導信息,對于仿真域的參數z,以先驗分布p(z)為初始條件,基于強化學習技術求解分布pφ(z),其中,φ表示該分布可學習的參數;所述域隨機化從兩方面對仿真域的參數進行隨機化采樣:視覺參數,主要包括場景中物體數量,目標紋理,背景顏色,光照,隨機化噪聲;動力學參數:主要包含物體質量、摩擦系數、高度;
獲取仿真域數據特征和真實域數據特征;
針對不同的仿真域數據設計其學習模型的適應層;
在所述適應層使用基于相似性度量加權融合算法和基于注意力機制的對抗學習算法對特征加以約束;
其中,基于相似性度量加權融合算法計算適應層的跨域特征之間的多種相似性度量作為損失,所述損失作用于所述適應層,以及,
基于注意力機制的對抗學習算法使用對抗網絡模塊區分特征所屬領域,并計算對抗損失,該損失使跨域特征無法區分,即學習跨域不變特征;
根據不同的任務將特征映射到相應的任務結果空間,并最終輸出任務相關結果;
其中,所述基于相似性度量加權融合算法的損失函數為:
其中,Ltask(fs,fa,fc,xs,xt,d)在源域上的任務損失函數,xs,ys分別為仿真域的數據及其標簽,xt為真實域的數據,模型的編碼器、適應層和解碼器分別記為fs,fa,fc,為針對k種不同相似度的域適應定義相應的損失函數,λi為不同相似度度量對應的權重,di是第i種相似性度量,d={d1,d2,...,dk}是所有相似性度量量的集合。
2.根據權利要求1所述的方法,其特征在于:基于強化學習技術求解分布pφ(z)所求解的問題表示如下:
其中p(z)為先驗分布,pφ(z)為基于強化學習技術求解的分布,φ表示該分布可學習的參數,第一項LDR()表示設計價值函數,保證分布pφ(z)最終能得到多樣化的樣本,第二項D()基于分布距離度量,保證預測的分布與參考分布之間的相似性,減少結果的不穩定性,α是一個平衡超參數,用來平衡兩個度量之間的重要程度。
3.根據權利要求1所述的方法,其特征在于:所述對抗網絡模塊fd,用于辨別數據來自仿真域或真實域,令yd為域標簽,代表數據所屬領域,令辨別器fd的損失函數為Ld(fs,fa,fd,xs,xt,yd),則該模型的整體損失函數如下:
L'all(fs,fa,fc,fd,xs,xt,ys,yd)=Ltask(fs,fa,fc,xs,ys)+λLd(fs,fa,fd,xs,xt,yd)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學(深圳),未經哈爾濱工業大學(深圳)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110514446.6/1.html,轉載請聲明來源鉆瓜專利網。





