[發(fā)明專利]深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法和裝置在審
| 申請?zhí)枺?/td> | 201810554459.4 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN109902798A | 公開(公告)日: | 2019-06-18 |
| 發(fā)明(設(shè)計(jì))人: | 張煒晨;歐陽萬里;徐東;李文;吳小飛;劉健莊;錢莉 | 申請(專利權(quán))人: | 華為技術(shù)有限公司;悉尼大學(xué) |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 協(xié)同 對抗 目標(biāo)領(lǐng)域 網(wǎng)絡(luò) 任務(wù)模型 損失函數(shù) 訓(xùn)練樣本 不變性 區(qū)分性 學(xué)習(xí)域 方法和裝置 目標(biāo)函數(shù) 神經(jīng)網(wǎng)絡(luò) 網(wǎng)絡(luò)訓(xùn)練 置信度 自適應(yīng) 低層 權(quán)重 預(yù)測 高層 應(yīng)用 | ||
本發(fā)明提出了一種協(xié)同對抗網(wǎng)絡(luò),在協(xié)同對抗網(wǎng)絡(luò)的低層設(shè)置損失函數(shù),用于學(xué)習(xí)域區(qū)分性特征,并且與協(xié)同對抗網(wǎng)絡(luò)的最后一層(即高層)設(shè)置的域不變性損失函數(shù)形成協(xié)同對抗目標(biāo)函數(shù),實(shí)現(xiàn)同時(shí)學(xué)習(xí)域區(qū)分性特征與域不變性特征。進(jìn)一步地,提出了一種增強(qiáng)協(xié)同對抗網(wǎng)絡(luò),在協(xié)同對抗網(wǎng)絡(luò)的基礎(chǔ)上,將目標(biāo)領(lǐng)域的數(shù)據(jù)加入?yún)f(xié)同對抗網(wǎng)絡(luò)的訓(xùn)練中,以及根據(jù)任務(wù)模型的精度,設(shè)置自適應(yīng)閾值對目標(biāo)領(lǐng)域的訓(xùn)練樣本進(jìn)行選擇,并根據(jù)域區(qū)分網(wǎng)絡(luò)的置信度,對目標(biāo)領(lǐng)域的訓(xùn)練樣本設(shè)置權(quán)重。通過該協(xié)同對抗網(wǎng)絡(luò)訓(xùn)練的任務(wù)模型能夠提高應(yīng)用在目標(biāo)領(lǐng)域中的預(yù)測精度。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器學(xué)習(xí)領(lǐng)域,特別涉及遷移學(xué)習(xí)領(lǐng)域中基于對抗網(wǎng)絡(luò)的訓(xùn)練方法和裝置。
背景技術(shù)
人工智能(Artificial Intelligence,AI)是利用數(shù)字計(jì)算機(jī)或者數(shù)字計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)。換句話說,人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式作出反應(yīng)的智能機(jī)器。人工智能也就是研究各種智能機(jī)器的設(shè)計(jì)原理與實(shí)現(xiàn)方法,使機(jī)器具有感知、推理與決策的功能。人工智能領(lǐng)域的研究包括機(jī)器人,自然語言處理,計(jì)算機(jī)視覺,決策與推理,人機(jī)交互,推薦與搜索,AI基礎(chǔ)理論等。
深度學(xué)習(xí)是近年來人工智能領(lǐng)域發(fā)展的一個(gè)關(guān)鍵推動(dòng)力,尤其是在計(jì)算機(jī)視覺的多種任務(wù)方面,如目標(biāo)分類/檢測/識別/分割中,取得了令人矚目的效果;但是,深度學(xué)習(xí)的成功需要依賴于大量的已標(biāo)注的數(shù)據(jù)。然而,標(biāo)注大量的數(shù)據(jù),是一項(xiàng)極其耗時(shí)耗力的工作。目前針對相同或相似的任務(wù),可以將依據(jù)源領(lǐng)域中公開的數(shù)據(jù)集或已標(biāo)注的數(shù)據(jù)訓(xùn)練好的任務(wù)模型直接應(yīng)用到目標(biāo)領(lǐng)域的任務(wù)預(yù)測,目標(biāo)領(lǐng)域是相對于源領(lǐng)域而言的,目標(biāo)領(lǐng)域一般沒有已標(biāo)注的數(shù)據(jù)或者沒有足夠的已標(biāo)注的數(shù)據(jù),源領(lǐng)域中公開的數(shù)據(jù)集和已標(biāo)注的數(shù)據(jù)可以稱作源領(lǐng)域數(shù)據(jù),相應(yīng)的,目標(biāo)領(lǐng)域中未標(biāo)注的數(shù)據(jù)可以稱作目標(biāo)領(lǐng)域數(shù)據(jù)。由于目標(biāo)領(lǐng)域數(shù)據(jù)與源領(lǐng)域數(shù)數(shù)據(jù)的分布不相同,直接使用依據(jù)源領(lǐng)域數(shù)據(jù)訓(xùn)練好的模型的效果不佳。
非監(jiān)督域適應(yīng)(unsupervised domain adaption)是一種典型的遷移學(xué)習(xí)方法,可用于解決上述問題。與直接將依據(jù)源領(lǐng)域數(shù)據(jù)訓(xùn)練好的模型用于目標(biāo)領(lǐng)域的任務(wù)預(yù)測不同,非監(jiān)督域適應(yīng)方法不僅利用源領(lǐng)域數(shù)據(jù)進(jìn)行訓(xùn)練,同時(shí)將未標(biāo)注的目標(biāo)領(lǐng)域數(shù)據(jù)融合到訓(xùn)練當(dāng)中,使訓(xùn)練的模型在目標(biāo)領(lǐng)域數(shù)據(jù)上有較好的預(yù)測效果。目前,現(xiàn)有技術(shù)中性能比較好的非監(jiān)督域適應(yīng)方法是基于領(lǐng)域?qū)沟姆潜O(jiān)督域適應(yīng)方法,如圖1所示的一種基于領(lǐng)域?qū)沟姆潜O(jiān)督域適應(yīng)訓(xùn)練圖像分類器的方法,其特點(diǎn)是在學(xué)習(xí)圖像分類任務(wù)的同時(shí)使用領(lǐng)域區(qū)分器(英文全稱:Domain Discriminator)和梯度方向(Gradient Reversal)方法學(xué)習(xí)域不變性特征。主要步驟是:(1)使用卷積神經(jīng)網(wǎng)絡(luò)特征提取器(Convolutional NeuralNetwork Feature Extractor,CNN Feature Extractor)提取的特征除了輸入到圖像分類器中,還用于建立一個(gè)領(lǐng)域區(qū)分器,領(lǐng)域區(qū)分器可以對輸入的特征可以輸出領(lǐng)域類別;(2)使用梯度反向方法,在反向傳播過程中修改梯度方向,從而使得卷積神經(jīng)網(wǎng)絡(luò)特征提取器學(xué)習(xí)的特征具有域不變性;(3)將以上得到卷積神經(jīng)網(wǎng)絡(luò)特征提取器和得到的分類器,用于目標(biāo)領(lǐng)域的圖像分類預(yù)測。
發(fā)明內(nèi)容
為了解決基于領(lǐng)域?qū)沟姆潜O(jiān)督域適應(yīng)方法存在的丟失具有域區(qū)分性的低層特征的問題。本申請?zhí)峁┝艘环N基于協(xié)同對抗網(wǎng)絡(luò)的訓(xùn)練方法,能夠保留具有域區(qū)分性的低層特征,從而提高任務(wù)模型的精度。進(jìn)一步提供了一種增加協(xié)同領(lǐng)域?qū)沟姆椒ǎ瑢⒛繕?biāo)領(lǐng)域中的數(shù)據(jù)用于訓(xùn)練任務(wù)模型,提高訓(xùn)練出的任務(wù)模型在目標(biāo)領(lǐng)域的適配性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司;悉尼大學(xué),未經(jīng)華為技術(shù)有限公司;悉尼大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810554459.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 移動(dòng)通信終端的協(xié)同方法及其界面系統(tǒng)
- 業(yè)務(wù)協(xié)同流程配置、業(yè)務(wù)協(xié)同方法及裝置
- 一種基于健康檔案共享平臺的跨醫(yī)院協(xié)同檢查信息系統(tǒng)
- 一種協(xié)同控制方法、協(xié)同控制系統(tǒng)及變頻器
- 基于協(xié)同網(wǎng)關(guān)的跨域協(xié)同交互方法
- 一種生產(chǎn)協(xié)同管理方法及系統(tǒng)
- 云邊協(xié)同方法、裝置、系統(tǒng)、設(shè)備和介質(zhì)
- 一種智能辦公協(xié)同操作方法及系統(tǒng)
- 一種用于無人裝備的時(shí)間協(xié)同航跡規(guī)劃方法
- 基于大數(shù)據(jù)的智慧辦公協(xié)同方法及系統(tǒng)
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強(qiáng)度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動(dòng)生成方法、裝置、存儲介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)
- 智能交通領(lǐng)域雙模式多目標(biāo)的成像控制方法及其裝置
- 一種面向領(lǐng)域服務(wù)目標(biāo)的知識庫構(gòu)建方法
- 領(lǐng)域?qū)蛹壷械哪繕?biāo)領(lǐng)域的無效
- 基于領(lǐng)域適應(yīng)的改進(jìn)SSD監(jiān)控視頻目標(biāo)檢測方法
- 一種目標(biāo)領(lǐng)域指標(biāo)評估方法、裝置及系統(tǒng)
- 目標(biāo)領(lǐng)域知識庫的生成、問題解答方法及裝置
- 一種基于領(lǐng)域適配的水聲目標(biāo)輻射噪聲識別方法
- 基于目標(biāo)領(lǐng)域自監(jiān)督學(xué)習(xí)的無監(jiān)督領(lǐng)域適應(yīng)方法和系統(tǒng)
- 目標(biāo)領(lǐng)域的擴(kuò)充語料生成方法、裝置和電子設(shè)備
- 一種無源領(lǐng)域自適應(yīng)目標(biāo)檢測方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





