[發(fā)明專利]用稀疏數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的系統(tǒng)和方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810589639.6 | 申請(qǐng)日: | 2018-06-08 |
| 公開(kāi)(公告)號(hào): | CN109034385A | 公開(kāi)(公告)日: | 2018-12-18 |
| 發(fā)明(設(shè)計(jì))人: | C·J·蒙克貝里;J·N·T·黑塞爾格倫;J·T·萊赫蒂寧;T·O·艾拉 | 申請(qǐng)(專利權(quán))人: | 輝達(dá)公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08 |
| 代理公司: | 北京市磐華律師事務(wù)所 11336 | 代理人: | 高偉;婁曉丹 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 神經(jīng)網(wǎng)絡(luò)模型 目標(biāo)向量 輸出向量 輸入向量 稀疏 訓(xùn)練神經(jīng)網(wǎng)絡(luò) 樣本子集 計(jì)算機(jī)可讀介質(zhì) 目標(biāo)數(shù)據(jù) 輸出數(shù)據(jù) 稀疏數(shù)據(jù) 訓(xùn)練數(shù)據(jù) 樣本產(chǎn)生 減小 | ||
公開(kāi)了用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的方法、計(jì)算機(jī)可讀介質(zhì)和系統(tǒng)。所述方法包括步驟:從包括輸入向量和稀疏目標(biāo)向量的一組訓(xùn)練數(shù)據(jù)中選擇輸入向量,其中每個(gè)稀疏目標(biāo)向量包括對(duì)應(yīng)于神經(jīng)網(wǎng)絡(luò)模型的輸出向量?jī)?nèi)的樣本子集的目標(biāo)數(shù)據(jù)。所述方法還包括步驟:通過(guò)神經(jīng)網(wǎng)絡(luò)模型處理輸入向量以針對(duì)輸出向量?jī)?nèi)的樣本產(chǎn)生輸出數(shù)據(jù),以及調(diào)整神經(jīng)網(wǎng)絡(luò)模型的參數(shù)值以針對(duì)樣本子集減小輸出向量與稀疏目標(biāo)向量之間的差。
本申請(qǐng)要求于2017年6月12日提交的題為“用稀疏數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)(TRAININGNEURAL NETWORKS WITH SPARSE DATA)”的62/518,435號(hào)美國(guó)臨時(shí)申請(qǐng)(代理人案卷號(hào)NVIDP1167+/17-HE-0122-US01)的權(quán)益,其全部?jī)?nèi)容通過(guò)引用并入本文。
技術(shù)領(lǐng)域
本發(fā)明涉及訓(xùn)練神經(jīng)網(wǎng)絡(luò),并且更具體地涉及使用稀疏數(shù)據(jù)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
背景技術(shù)
通常使用反向傳播來(lái)訓(xùn)練用于圖像處理的神經(jīng)網(wǎng)絡(luò),以將神經(jīng)網(wǎng)絡(luò)模型的輸出(即,預(yù)測(cè))與目標(biāo)圖像進(jìn)行匹配。例如,神經(jīng)網(wǎng)絡(luò)模型可以被訓(xùn)練成升檔(upscale)圖像,從低分辨率圖像生成高分辨率圖像,或被訓(xùn)練成去噪圖像,從有噪聲圖像產(chǎn)生干凈的輸出圖像。假設(shè)可微函數(shù)g被描述為具有可訓(xùn)練參數(shù)集Θ的神經(jīng)網(wǎng)絡(luò),其將輸入向量x={x1,x2,...,xn}映射到輸出向量
神經(jīng)網(wǎng)絡(luò)通過(guò)最小化損失函數(shù)來(lái)訓(xùn)練,
量化目標(biāo)y={y1,y2,...,ym}與神經(jīng)網(wǎng)絡(luò)輸出之間的誤差。
對(duì)于圖像處理網(wǎng)絡(luò)來(lái)說(shuō),L2標(biāo)準(zhǔn)經(jīng)常被用作損失函數(shù)。生成和存儲(chǔ)訓(xùn)練所需的輸入和目標(biāo)對(duì)(x,y)的大數(shù)據(jù)集常常是一個(gè)重大挑戰(zhàn)。例如,圖像處理網(wǎng)絡(luò)通常用成千上百萬(wàn)圖像訓(xùn)練圖像處理網(wǎng)絡(luò)。在離線渲染場(chǎng)景下用路徑追蹤圖像訓(xùn)練時(shí),經(jīng)常花費(fèi)數(shù)周來(lái)生成參考圖像和許多兆兆字節(jié)的數(shù)據(jù)存儲(chǔ)。計(jì)算精確的目標(biāo)圖像是耗時(shí)的并且需要很大的數(shù)據(jù)存儲(chǔ)和傳輸能力。具有解決這些問(wèn)題和/或與現(xiàn)有技術(shù)相關(guān)的其他問(wèn)題的需求。
發(fā)明內(nèi)容
公開(kāi)了用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的方法、計(jì)算機(jī)可讀介質(zhì)和系統(tǒng)。該方法包括從包括輸入向量和稀疏目標(biāo)向量的訓(xùn)練數(shù)據(jù)集中選擇輸入向量的步驟,其中每個(gè)稀疏目標(biāo)向量包括對(duì)應(yīng)于神經(jīng)網(wǎng)絡(luò)模型的輸出向量?jī)?nèi)的樣本子集的目標(biāo)數(shù)據(jù)。該方法還包括通過(guò)神經(jīng)網(wǎng)絡(luò)模型處理輸入向量以針對(duì)輸出向量?jī)?nèi)的樣本產(chǎn)生輸出數(shù)據(jù)以及調(diào)整神經(jīng)網(wǎng)絡(luò)模型的參數(shù)值以針對(duì)樣本子集減小輸出向量與稀疏目標(biāo)向量之間的差的步驟。
附圖說(shuō)明
圖1A示出了根據(jù)一個(gè)實(shí)施例的用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法的流程圖;
圖1B示出了使用稀疏輸入數(shù)據(jù)和地面實(shí)況訓(xùn)練目標(biāo)的現(xiàn)有技術(shù)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的示意圖;
圖1C示出了根據(jù)一個(gè)實(shí)施例的使用稀疏輸入數(shù)據(jù)和稀疏地面實(shí)況訓(xùn)練目標(biāo)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練的示意圖;
圖1D示出了根據(jù)一個(gè)實(shí)施例的用于使用稀疏目標(biāo)向量來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的系統(tǒng)的框圖;
圖1E示出了根據(jù)一個(gè)實(shí)施例的使用稀疏輸入數(shù)據(jù)和稀疏地面實(shí)況訓(xùn)練目標(biāo)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練的另一個(gè)示意圖;
圖1F示出了根據(jù)一個(gè)實(shí)施例的用于使用稀疏輸入數(shù)據(jù)和稀疏地面實(shí)況訓(xùn)練目標(biāo)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法的流程圖;
圖2A示出了根據(jù)一個(gè)實(shí)施例的用于使用稀疏目標(biāo)向量來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的系統(tǒng)的框圖;
圖2B示出了用于使用輸入數(shù)據(jù)和稀疏地面實(shí)況訓(xùn)練目標(biāo)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法的另一個(gè)流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于輝達(dá)公司,未經(jīng)輝達(dá)公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810589639.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無(wú)標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 一種詞向量嵌入方法及裝置
- 一種詞向量的生成方法及相關(guān)設(shè)備
- 一種中文文本的分類方法及系統(tǒng)
- 文本翻譯方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種多目標(biāo)推薦優(yōu)化方法及可讀介質(zhì)
- 一種智能客服問(wèn)題檢索方法、終端以及存儲(chǔ)介質(zhì)
- 目標(biāo)檢測(cè)框架的優(yōu)化方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 信息生成方法、裝置和電子設(shè)備
- 目標(biāo)對(duì)象控制方法及裝置
- 基于和弦的歌曲旋律生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 脈沖寬度調(diào)制的脈沖控制方法
- 一種神經(jīng)網(wǎng)絡(luò)運(yùn)算裝置
- 基于人工智能的對(duì)話處理方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 超聲圖像分割方法和計(jì)算機(jī)設(shè)備
- 模型訓(xùn)練方法、翻譯方法、相關(guān)裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于OS-ELM融合視覺(jué)和慣性信息的室內(nèi)定位方法
- 意圖識(shí)別方法
- 一種代碼摘要生成方法和裝置
- 一種客戶信息數(shù)據(jù)處理系統(tǒng)
- 文本分類方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 多個(gè)輸入的多重?cái)噭?dòng)器
- 一種神經(jīng)網(wǎng)絡(luò)運(yùn)算裝置
- 用于多源混合操作的裝置、方法和系統(tǒng)
- 基于人工智能的對(duì)話處理方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于APHash的電路輸入向量特征化方法
- 水體質(zhì)量預(yù)測(cè)方法、終端設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 驗(yàn)證實(shí)施置換相關(guān)函數(shù)的組件的硬件設(shè)計(jì)
- 計(jì)算機(jī)執(zhí)行的、利用神經(jīng)網(wǎng)絡(luò)進(jìn)行語(yǔ)言處理的方法及裝置
- 一種缺失文本生成方法及系統(tǒng)
- 特征融合方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)以及程序產(chǎn)品





