[發(fā)明專利]基于張量分解的壓縮表示學習方法有效
| 申請?zhí)枺?/td> | 202010095808.8 | 申請日: | 2020-02-17 |
| 公開(公告)號: | CN111340186B | 公開(公告)日: | 2022-10-21 |
| 發(fā)明(設計)人: | 林宙辰;耿正陽;陳鴻旭;陳鑫 | 申請(專利權)人: | 之江實驗室 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310023 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 張量 分解 壓縮 表示 學習方法 | ||
1.一種基于張量分解的壓縮表示學習方法,其特征在于,該方法用于語義分割任務,包括以下步驟:
步驟1,采集圖像并標注正確的分割結果作為輸入數(shù)據(jù);
步驟2,建立語義分割問題的損失函數(shù);
步驟3,在主干網(wǎng)絡中加入壓縮表示學習模塊,抽取壓縮表示,包括:
選擇深度殘差網(wǎng)絡ResNet-101作為主干網(wǎng)絡,ResNet經(jīng)過ImageNet分類任務的預訓練;將ResNet卷積層c5層的步長stride設置為1,使得整個網(wǎng)絡在空間上的下采樣是8;在經(jīng)過ImageNet預訓練的ResNet-101頂端放置3*3卷積批歸一化ReLU激活函數(shù),將通道數(shù)目從2048降低到512維;
在深度殘差網(wǎng)絡抽取的表示Z的基礎上,放置壓縮表示學習模塊進一步抽取壓縮表示,得到表示Y,再被另一個3*3卷積批歸一化ReLU激活函數(shù)降低到256維,最后由全卷積神經(jīng)網(wǎng)絡FCN進行逐像素分類并插值恢復原始尺寸;
其中,壓縮表示學習模塊由下層線性變換Wl、矩陣分解模型M、上層線性變換Wu依次連接構成,包括以下步驟:
(1)將矩陣化的表示Z經(jīng)過下層線性變換Wl的處理得到變換后的表示X=WlZ;
(2)將變換后的表示X輸入矩陣分解模型M,分解為字典矩陣D和重構系數(shù)矩陣C的乘積,表示為如下形式:
其中,為重構的低秩矩陣,且滿足如下條件:
其中,r表示秩的上界;
(3)重構的低秩矩陣經(jīng)過上層線性變換Wu處理變換回原始維度,得到輸出H(Z):
H(Z)=WuM(WlZ)
(4)通過殘差連接得到壓縮表示Y:
Y=ReLU(Z+BN(H(Z)))
其中,BN函數(shù)表示批歸一化,ReLU為激活函數(shù);
步驟4,對輸入數(shù)據(jù)做預處理,劃分為訓練數(shù)據(jù)集和預測數(shù)據(jù)集;
步驟5,確定網(wǎng)絡訓練的超參數(shù);
步驟6,進行網(wǎng)絡訓練:利用訓練數(shù)據(jù)集對步驟3得到的網(wǎng)絡進行訓練;訓練好的深度神經(jīng)網(wǎng)絡用于執(zhí)行語義分割任務。
2.根據(jù)權利要求1所述基于張量分解的壓縮表示學習方法,其特征在于,該方法在矩陣分解模型M和上層線性變換Wu間加入拓展模塊;所述拓展模塊由新的線性變換Wc、批歸一化、ReLU激活函數(shù)構成,具體為:
(2.1)執(zhí)行步驟(1)~(3),得到M(WlZ);
(2.2)步驟(2.1)得到的M(WlZ)依次經(jīng)過拓展模塊和上層線性變換Wu處理變換回原始維度,得到輸出H(Z):
H(Z)=Wu·BN(ReLU(Wc·M(WlZ)))
(2.3)通過殘差連接得到壓縮表示Y:
Y=ReLU(Z+H(Z))。
3.根據(jù)權利要求1所述基于張量分解的壓縮表示學習方法,其特征在于,所述下層線性變換Wl、上層線性變換Wu由單步梯度優(yōu)化算法學習得到;所述單步梯度優(yōu)化算法為將隨機梯度下降方法中隨時間反向傳播算法的輸出y關于輸入x的梯度截斷成如下單步梯度形式:
其中,hs表示第s個時間步的隱狀態(tài)。
4.根據(jù)權利要求1所述基于張量分解的壓縮表示學習方法,其特征在于,所述矩陣分解模型采用改進的矢量量化模型、改進的概念分解模型或改進的非負矩陣分解模型。
5.根據(jù)權利要求4所述基于張量分解的壓縮表示學習方法,其特征在于,所述改進的矢量量化模型采用軟k-均值聚類算法求解字典矩陣D和重構系數(shù)矩陣C,具體為:初始化D和C后重復執(zhí)行K次如下公式:
其中,cosine函數(shù)用于求余弦相似度,softmax用于逐列計算歸一化概率值,t是溫度常數(shù),diag函數(shù)用于構建對角矩陣;1n是長度為n且元素均為1的向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于之江實驗室,未經(jīng)之江實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010095808.8/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





