[發(fā)明專利]基于自監(jiān)督學習的圖像分類方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201911213999.7 | 申請日: | 2019-12-02 |
| 公開(公告)號: | CN110909820B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設計)人: | 劉嵩;舒琦慧 | 申請(專利權(quán))人: | 齊魯工業(yè)大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/762;G06V10/774;G06V10/82 |
| 代理公司: | 濟南圣達知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250353 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 監(jiān)督 學習 圖像 分類 方法 系統(tǒng) | ||
1.基于自監(jiān)督學習的圖像分類方法,其特征是,包括:
獲取待分類的無標簽圖像;對所有待分類的無標簽圖像進行預處理;
對所有待分類的無標簽圖像進行預處理;具體步驟包括:采用Otsu閾值分割法對所有待分類的無標簽圖像進行分割,將每一個待分類的無標簽圖像分割為背景圖像和目標圖像;
所述采用Otsu閾值分割法對所有待分類的無標簽圖像進行分割,將每一個待分類的無標簽圖像分割為背景圖像和目標圖像;具體步驟包括:將彩色圖像轉(zhuǎn)換為灰度圖像;將灰度圖像進行二值化處理,得到分割后的目標圖像;
對預處理后的每一個無標簽圖像進行特征提取;每一個無標簽圖像均得到與之對應的特征;
對預處理后的每一個無標簽圖像進行特征提取;是指:對預處理后的每一個無標簽圖像,利用卷積受限玻爾茲曼機CRBM模型進行特征提取;
所述卷積受限玻爾茲曼機CRBM模型,選用三層的卷積受限玻爾茲曼機CRBM模型進行特征提取;
卷積受限玻爾茲曼機CRBM模型的能量函數(shù)為:
其中,“*”為卷積操作符,wk表示第k個卷積核的權(quán)重,表示第k個隱含層中的第i行第j個單元,vij表示可視層中第i行第j個單元,bk為第k個可視層到隱含層單元的偏置,c為隱含層到可視層單元的共享偏置;
基于能量函數(shù)的CRBM聯(lián)合概率分布為:
其中,Z為歸一化參數(shù),CRBM同樣采用層內(nèi)無連接,層間全連接的方式構(gòu)建而成,所以可視層與隱含層間的條件概率分布彼此獨立;
可視層與隱含層的條件概率分布函數(shù)分別為:
P(vij=1|h)=σ((∑kwk*hk)ij+c)???????????????????(4);
從所有待分類的無標簽圖像中劃分出一部分作為訓練集;
對訓練集中所有無標簽圖像的特征進行聚類處理;對訓練集中所有無標簽圖像的特征進行聚類處理,是指:選用模糊C均值算法FCM,對訓練集中所有無標簽圖像的特征進行聚類處理;
用模糊C均值算法將數(shù)據(jù)集中提取的特征聚為10類;給數(shù)據(jù)打上偽標簽,根據(jù)聚類中心與隸屬度的關(guān)系,將數(shù)據(jù)的特征向量分為10類,每一個特征的類別歸屬于自身隸屬度與聚類中心最近的聚類中心所對應的類別,然后為聚類中心打上偽標簽;
選用模糊C均值算法對提取的特征聚類,根據(jù)聚類中心與隸屬度的關(guān)系確定預訓練提取的特征的類別,并對每個類別中的特征打上對應的偽標簽;
模糊C均值算法的目標函數(shù)表達式為:
uij∈[0,1],
i∈[1,C],j∈[1,N]???????????(5)
式(5)中:xj表示第j個樣本點,vi表示第i個聚類中心,uij表示第j個樣本點相對于第i個聚類中心的隸屬度,‖xj-vi‖2表示第j個樣本點與第i個聚類中心之間的距離,γ表示熵的正則化參數(shù),隸屬度矩陣U∈RN×C由uij組成,聚類中心矩陣V∈Rd×C由vi組成;
根據(jù)拉格朗日法則,求解(5)式得到最優(yōu)聚類中心V和隸屬度U的迭代公式為:
根據(jù)聚類結(jié)果確定每個特征所對應的類別,并對每個類別中的所有特征均打上對應的偽標簽;特征的偽標簽即為特征所對應無標簽圖像的偽標簽;
所述對每個類別中的所有特征均打上對應的偽標簽,是指:每一個特征的類別歸屬于自身隸屬度與聚類中心最近的聚類中心所對應的類別;
基于訓練集中每一個無標簽圖像所提取的特征和每一個無標簽圖像的偽標簽,對預訓練的神經(jīng)網(wǎng)絡進行再訓練;得到再訓練后的神經(jīng)網(wǎng)絡;
將所有待分類的無標簽圖像的特征均輸入到優(yōu)化訓練后的神經(jīng)網(wǎng)絡中,輸出每一個待分類的無標簽圖像的偽標簽;
預訓練的神經(jīng)網(wǎng)絡,是指預訓練的神經(jīng)網(wǎng)絡VGG16,預訓練的神經(jīng)網(wǎng)絡的訓練步驟包括:將已知圖像類別的ImageNet數(shù)據(jù)集,輸入到神經(jīng)網(wǎng)絡VGG16中,對神經(jīng)網(wǎng)絡VGG16進行訓練,得到預訓練后的神經(jīng)網(wǎng)絡VGG16。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于齊魯工業(yè)大學,未經(jīng)齊魯工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911213999.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





