[發明專利]圖形圖像復制模型的訓練方法、存儲介質及計算設備有效
| 申請號: | 201811138051.5 | 申請日: | 2018-09-28 |
| 公開(公告)號: | CN109447240B | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 方林;陳海波 | 申請(專利權)人: | 深蘭科技(上海)有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04 |
| 代理公司: | 上海晨皓知識產權代理事務所(普通合伙) 31260 | 代理人: | 成麗杰 |
| 地址: | 200050 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖形圖像 復制 模型 訓練 方法 存儲 介質 計算 設備 | ||
本發明實施例涉及深度學習技術領域,公開了一種圖形圖像復制模型的訓練方法,包括:獲取包含多個真實樣本的樣本集合;從樣本集合中每次隨機取出兩個真實樣本作為樣本對,并將樣本對輸入待訓練的神經網絡模型中進行結伴學習。本發明實施方式提供了圖形圖像復制模型的訓練方法、存儲介質及計算設備,實現了少樣本訓練神經網絡,降低了訓練神經網絡的樣本收集成本。
技術領域
本發明實施例涉及深度學習技術領域,特別涉及圖形圖像復制模型的訓練方法、存儲介質及計算設備。
背景技術
在機器學習和相關領域,人工神經網絡的計算模型靈感來自動物的中樞神經系統(尤其是腦),并且被用于估計或可以依賴于大量的輸入和一般的未知近似函數。人工神經網絡通常呈現為相互連接的“神經元”,神經元即一個函數,它可以對一個或多個輸入信號進行函數變換然后產生一個唯一的輸出。多個神經元彼此連接,一個神經元的輸出是另一個神經元的輸入,由此構成的網絡就是“神經元網絡”。在訓練一個神經元網絡時,我們一般采用以下方法:輸入一個樣本,產生一個輸出,然后根據輸出和期望輸出(即我們希望的輸出結果)之間的差異,調整神經元網絡的參數(即神經元所代表的函數的參數,如果有的話),從而達到優化整個網絡,促使網絡的輸出逐漸逼近期望值的目的。
然而,發明人發現現有技術中至少存在如下問題:神經網絡訓練的一個特點就是需要大量的真實樣本,往往需要耗費大量的人力、物力以及財力,隨著人工成本的增加,樣本收集的成本也越來越高。
發明內容
本發明實施方式的目的在于提供一種圖形圖像復制模型的訓練方法、存儲介質及計算設備,實現了少樣本訓練神經網絡,降低了訓練神經網絡的樣本收集成本。
為解決上述技術問題,本發明的實施方式提供了一種圖形圖像復制模型的訓練方法,包括:獲取包含多個真實樣本的樣本集合;從樣本集合中每次隨機取出兩個真實樣本作為樣本對,并將樣本對輸入待訓練的神經網絡模型中進行結伴學習。
本發明的實施方式還提供了一種計算機可讀存儲介質,存儲有計算機程序,所述計算機程序被處理器執行時實上述圖形圖像復制模型的訓練方法。
本發明的實施方式還提供了一種電子設備,包括:至少一個處理器;以及,與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行上述的圖形圖像復制模型的訓練方法。
本發明實施方式相對于現有技術而言提供了一種模型訓練的方法,包括:獲取包含多個真實樣本的樣本集合;從樣本集合中每次隨機取出兩個真實樣本作為樣本對,并將樣本對同時輸入待訓練的神經網絡模型中進行結伴學習。通過每次隨機地從樣本集合中取出兩個真實樣本作為樣本對,根據排列組合原理可以得知在樣本集合中真實樣本數量足夠多的情況下,實際的樣本對數量遠遠多于樣本集合中真實樣本的數量。因此,在訓練神經網絡時,將每次取出的樣本對輸入待訓練的神經網絡模型中一起進行訓練——結伴學習,大大減少了訓練模型時對真實樣本數量的依賴,無需大量真實樣本也可以實現多樣本對訓練,實現了少樣本訓練,同時大大降低了訓練神經網絡時收集真實樣本的成本。
另外,待訓練的神經網絡模型為復制模型;將樣本對輸入待訓練的神經網絡模型中進行結伴學習的步驟,具體包括:將每次取出的兩個真實樣本同時輸入復制模型中,得到兩個復制樣本;將兩個真實樣本和兩個復制樣本輸入損失函數中,得到損失函數值;以每次得到的損失函數值為依據訓練復制模型。該方案提出了一種利用樣本對訓練復制模型的實現方式,兩個樣本結伴學習訓練復制模型,不存在現有的利用對抗學習的方法訓練生成器時出現的模型坍塌問題。且對抗學習在訓練時需要生成器和辨別器達成一致,在實際中難以達成妥協,通用性不高,而兩個樣本結伴學習訓練復制模型的訓練方法較為簡單,不存在難以達成妥協的情況,通用性較高。
另外,損失函數具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深蘭科技(上海)有限公司,未經深蘭科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811138051.5/2.html,轉載請聲明來源鉆瓜專利網。





