[發明專利]構建網絡結構的方法與裝置、及圖像生成方法與裝置在審
| 申請號: | 202010109969.8 | 申請日: | 2020-02-23 | 
| 公開(公告)號: | CN111340190A | 公開(公告)日: | 2020-06-26 | 
| 發明(設計)人: | 周鵬;張曉鵬;謝凌曦;倪冰冰;田奇 | 申請(專利權)人: | 華為技術有限公司 | 
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 | 
| 代理公司: | 北京龍雙利達知識產權代理有限公司 11329 | 代理人: | 陳洪艷;王君 | 
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 構建 網絡 結構 方法 裝置 圖像 生成 | ||
1.一種構建網絡結構的方法,其特征在于,包括:
獲取任務的類別;
基于所述類別,使用網絡結構構建模型生成與所述類別對應的目標網絡結構,其中,所述網絡結構構建模型能夠生成多個網絡結構,所述多個網絡結構用于實現多個不同類別的任務;
根據所述目標網絡結構執行所述任務,得到執行結果;
基于所述執行結果,調整所述網絡結構構建模型的參數,以使得所述網絡結構構建模型生成的網絡結構執行任務得到的執行結果更準確。
2.根據權利要求1所述的方法,其特征在于,所述網絡結構構建模型包括控制器、類別向量和操作向量,所述控制器用于根據所述類別生成網絡結構參數,所述網絡結構參數用于指示所述目標網絡結構中每一層執行的操作,所述類別向量用于描述所述多個不同類別,所述操作向量用于描述所述多個網絡結構的全部候選操作;
其中,所述基于所述執行結果,調整所述網絡結構構建模型的參數,包括:
使用強化學習方法,基于獎勵更新所述控制器、所述類別向量和所述操作向量,所述獎勵是根據所述處理結果確定的。
3.根據權利要求2所述的方法,其特征在于,所述控制器由長短期記憶網絡LSTM構成。
4.根據權利要求1至3中任一項所述的方法,其特征在于,所述根據所述目標網絡結構執行所述任務,得到執行結果,包括:
使用目標神經網絡執行所述任務,得到所述執行結果,所述目標神經網絡包括所述目標網絡結構。
5.根據權利要求2或3所述的方法,其特征在于,所述網絡結構構建模型還包括生成器,所述生成器包括多個操作層,所述多個操作層中的每一個操作層包括多個候選操作;
其中,在所述根據所述目標網絡結構執行所述任務之前,所述方法還包括:
使用所述生成器根據所述網絡結構參數在所述每一個操作層包括的多個候選操作中選擇目標操作,以生成包括多個操作層的所述目標網絡結構。
6.根據權利要求5所述的方法,其特征在于,在所述多個操作層中的至少一個操作層中,至少存在兩個候選操作包含相同的參數。
7.根據權利要求5或6所述的方法,其特征在于,在獲取b個任務的類別的情況下,所述根據所述目標網絡結構執行所述任務,得到執行結果,包括:
通過以下多個步驟執行所述b個任務:
(1)將b個維度為din的輸入特征中每一個輸入特征,分別執行所述生成器中第1個操作層包括的N個候選操作,得到b個維度為Nxdout的向量,將所述b個維度為Nxdout的向量連接后得到1個維度為bxNxdout的中間特征;
(2)根據所述第1個操作層包括的N個候選操作,將所述b個任務對應的b個網絡參數轉換為的一位有效編碼矩陣,所述一位有效編碼矩陣的維度為bxNx1;
(3)對維度為bxNxdout的所述中間特征與維度為bxNxdout的所述一位有效編碼矩陣進行廣播乘法,得到維度為bxNxdout的矩陣;
(4)將所述bxNxdout的矩陣中維度N對應的每一行中的多個元素相加,得到所述第1個操作層的輸出特征,所述第1個操作層的輸出特征的維度為bxdout;
(5)對于所述第1個操作層的輸出特征,根據所述生成器中第2個操作層包括的N個候選操作,繼續執行上面的步驟(1)至(4),直至生成所述生成器中第P個操作層的輸出特征,所述第P個操作層的輸出特征為所述執行結果;
其中,b、N和P均為正整數,P為所述生成器中操作層的個數。
8.根據權利要求1至7中任一項所述的方法,其特征在于,所述任務包括:圖像處理,語音處理和/或文本處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010109969.8/1.html,轉載請聲明來源鉆瓜專利網。





