[發(fā)明專利]面向圖像大數(shù)據(jù)的類增量分類方法、系統(tǒng)、裝置及介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110223442.2 | 申請(qǐng)日: | 2021-03-01 |
| 公開(公告)號(hào): | CN112990280B | 公開(公告)日: | 2023-08-25 |
| 發(fā)明(設(shè)計(jì))人: | 羅榮華;黃圳銘 | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G06V10/764 | 分類號(hào): | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/047;G06N3/048;G06N3/096 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 黎揚(yáng)鵬 |
| 地址: | 511458 廣東省廣州市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 圖像 數(shù)據(jù) 增量 分類 方法 系統(tǒng) 裝置 介質(zhì) | ||
本發(fā)明公開了一種面向圖像大數(shù)據(jù)的類增量分類方法、系統(tǒng)、裝置及介質(zhì),其中方法包括初始化訓(xùn)練階段和增量學(xué)習(xí)階段;所述初始化訓(xùn)練階段包括:構(gòu)建圖像的初始數(shù)據(jù)集;根據(jù)所述初始數(shù)據(jù)集訓(xùn)練初始分類模型;所述增量學(xué)習(xí)階段包括:根據(jù)所述初始數(shù)據(jù)集和圖像的新數(shù)據(jù)構(gòu)建增量學(xué)習(xí)數(shù)據(jù)集;根據(jù)所述初始分類模型獲取增量學(xué)習(xí)新模型,根據(jù)增量學(xué)習(xí)數(shù)據(jù)集和蒸餾算法訓(xùn)練所述增量學(xué)習(xí)新模型,得到能夠識(shí)別新舊類別的模型;其中,所述蒸餾算法使模型的類間距離擴(kuò)大及類內(nèi)距離縮小。本發(fā)明通過蒸餾算法更新增量學(xué)習(xí)模型,使模型的類間距離擴(kuò)大及類內(nèi)距離縮小,能夠在有限的存儲(chǔ)空間和計(jì)算資源下,提升模型對(duì)新舊數(shù)據(jù)識(shí)別性能,可廣泛應(yīng)用于大數(shù)據(jù)應(yīng)用領(lǐng)域。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)應(yīng)用領(lǐng)域,尤其涉及一種面向圖像大數(shù)據(jù)的類增量分類方法、系統(tǒng)、裝置及介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的云計(jì)算、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)等新興信息技術(shù)和應(yīng)用模式的快速發(fā)展,促使人類社會(huì)的數(shù)據(jù)種類和規(guī)模正以前所未有的速度增長(zhǎng),推動(dòng)人類社會(huì)邁入信息爆炸的大數(shù)據(jù)時(shí)代。而與之相隨的是計(jì)算機(jī)運(yùn)算能力的不斷提升,推動(dòng)了機(jī)器學(xué)習(xí)的研究與發(fā)展,尤其是深度學(xué)習(xí)領(lǐng)域更是掀起一股研究熱潮,被廣泛應(yīng)用在金融、智能制造、醫(yī)療健康等各個(gè)領(lǐng)域?!按髷?shù)據(jù)+機(jī)器學(xué)習(xí)”技術(shù)成為了當(dāng)今社會(huì)耳熟能詳?shù)娜斯ぶ悄芗夹g(shù),而在2016年,Google的AlphaGo橫空出世,讓我們見識(shí)到“大數(shù)據(jù)+機(jī)器學(xué)習(xí)”的巨大威力和其廣闊的前景。
雖然目前“大數(shù)據(jù)+機(jī)器學(xué)習(xí)”技術(shù)在各行各業(yè)獲得廣泛應(yīng)用并取得顯著成果,但是目前大多數(shù)機(jī)器算法是基于靜態(tài)、封閉的理想環(huán)境下進(jìn)行訓(xùn)練,它們將歷史數(shù)據(jù)作為一個(gè)整體進(jìn)行批量學(xué)習(xí),這種批量學(xué)習(xí)靈活性較差,只能面向靜態(tài)的批量大數(shù)據(jù),而訓(xùn)練得到的模型也只能識(shí)別在訓(xùn)練集中出現(xiàn)過的類別,對(duì)于未出現(xiàn)在訓(xùn)練集中的類別模型則無法給出分類結(jié)果。然而在實(shí)際的應(yīng)用中,各行各業(yè)產(chǎn)生的大數(shù)據(jù),如傳感器數(shù)據(jù)、圖像、視頻數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)以及傳統(tǒng)行業(yè)的業(yè)務(wù)數(shù)據(jù)等,更多地是一種動(dòng)態(tài)的流數(shù)據(jù)形態(tài)。數(shù)據(jù)的內(nèi)容與特征處于不斷變化,具有海量性、時(shí)變性、無限性等特點(diǎn)。這就需要模型不斷在新到來的數(shù)據(jù)上學(xué)習(xí)新的類別。
而基于批量學(xué)習(xí)需要一次性獲得訓(xùn)練數(shù)據(jù),對(duì)于不斷產(chǎn)生的新數(shù)據(jù),需要將新舊數(shù)據(jù)混合對(duì)模型重新進(jìn)行訓(xùn)練,該方式存在空間存儲(chǔ)和計(jì)算資源消耗以及時(shí)間成本問題,隨著新數(shù)據(jù)的不斷到來,所需要保存的數(shù)據(jù)量不斷擴(kuò)大,龐大的訓(xùn)練集會(huì)導(dǎo)致模型的訓(xùn)練速度下降,計(jì)算成本劇增甚至數(shù)據(jù)無法一次性載入內(nèi)存,從而無法進(jìn)行完整的批量學(xué)習(xí)。如果讓模型直接在新數(shù)據(jù)上訓(xùn)練,模型則會(huì)存在對(duì)舊數(shù)據(jù)災(zāi)難性遺忘問題。因此,如何在有限的存儲(chǔ)空間和計(jì)算機(jī)資源下,讓已訓(xùn)練好的模型在紛至沓來的新數(shù)據(jù)上較強(qiáng)的學(xué)習(xí)能力,同時(shí)保持對(duì)舊數(shù)據(jù)識(shí)別的準(zhǔn)確率是一個(gè)亟待解決的難題。
發(fā)明內(nèi)容
為至少一定程度上解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一,本發(fā)明的目的在于提供一種面向圖像大數(shù)據(jù)的類增量分類方法、系統(tǒng)、裝置及介質(zhì)。
本發(fā)明所采用的技術(shù)方案是:
一種面向圖像大數(shù)據(jù)的類增量分類方法,包括初始化訓(xùn)練階段和增量學(xué)習(xí)階段;
所述初始化訓(xùn)練階段包括:
構(gòu)建圖像的初始數(shù)據(jù)集;
根據(jù)所述初始數(shù)據(jù)集訓(xùn)練初始分類模型;
所述增量學(xué)習(xí)階段包括:
根據(jù)所述初始數(shù)據(jù)集和圖像的新數(shù)據(jù)構(gòu)建增量學(xué)習(xí)數(shù)據(jù)集;
根據(jù)所述初始分類模型獲取增量學(xué)習(xí)新模型,根據(jù)增量學(xué)習(xí)數(shù)據(jù)集和蒸餾算法訓(xùn)練所述增量學(xué)習(xí)新模型,得到能夠識(shí)別新舊類別的模型;
其中,所述蒸餾算法使模型的類間距離擴(kuò)大及類內(nèi)距離縮小。
進(jìn)一步,所述訓(xùn)練初始分類模型的過程中,采用HM-Softmax作為分類損失函數(shù);
所述分類損失函數(shù)的公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110223442.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種電渦流緩速器
- 下一篇:一種電力設(shè)施隔離圍欄
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 基于FTP協(xié)議的行業(yè)數(shù)據(jù)庫(kù)數(shù)據(jù)實(shí)時(shí)同步系統(tǒng)
- 一種基于國(guó)家基礎(chǔ)地理信息數(shù)據(jù)的增量式地圖更新方法
- 一種遠(yuǎn)程復(fù)制多快照間增量去重的實(shí)現(xiàn)方法及裝置
- 一種增量數(shù)據(jù)獲取方法及裝置
- 一種增量包生成方法、版本升級(jí)方法、裝置以及系統(tǒng)
- 礦物增量劑連續(xù)研磨裝置
- 一種增量升級(jí)包生成、增量更新方法及裝置
- 一種增量索引更新方法及系統(tǒng)
- 一種高分辨率的增量碼道檢測(cè)方法
- 一種圖譜的增量更新方法、裝置及系統(tǒng)





