[發明專利]一種基于質量節點模型的學習方法有效
| 申請號: | 202010818346.8 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN112132147B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 周迪;肖海林;曹廣;張仲非;劉鵬;韋文生 | 申請(專利權)人: | 浙江大學;浙江宇視科技有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06V30/24;G06V30/194;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 楊天嬌 |
| 地址: | 310012 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 質量 節點 模型 學習方法 | ||
1.一種基于質量節點模型的學習方法,其特征在于,所述基于質量節點模型的學習方法,包括:
步驟1、從文字圖片庫的所有文字類別中隨機抽取W類,在W類對應的每類中抽取若干個帶標注樣本形成樣本集S,在W類對應的每類剩余的帶標注樣本中隨機抽取一個或多個帶標注樣本形成樣本集Q,每個帶標注樣本均作為有質量的點;
步驟2、取樣本集S中每一個帶標注樣本輸入卷積神經網絡中,將卷積神經網絡輸出的每個帶標注樣本的特征向量作為典型向量;
步驟3、將樣本集Q中的所有帶標注樣本分別輸入卷積神經網絡中,得到卷積神經網絡輸出的每個帶標注樣本的特征向量,根據質量節點模型計算每個帶標注樣本與各類別之間的引力如下:
式中,Fq,k表示類別k對樣本集Q中帶標注樣本q的引力,Mk總代表樣本集S中類別k的所有帶標注樣本的質量總和,Nk表示樣本集S中類別k的帶標注樣本的個數,Ms,k,i代表樣本集S中類別k的第i個帶標注樣本的質量,mq代表樣本集Q中帶標注樣本q的質量,Zs,k,i表示樣本集S中類別k的第i個成員的典型向量,Zq表示樣本集Q中帶標注樣本q的特征向量,d2()表示歐氏距離的平方;
步驟4、根據樣本集Q中所有帶標注樣本與各類別之間的引力計算損失函數,利用隨機梯度下降法優化損失函數,得到優化后的卷積神經網絡;
步驟5、取優化后的卷積神經網絡,對待分類的文字圖像輸出待分類特征向量,根據待分類特征向量計算待分類的文字圖像與對應各類別之間的引力,選取引力最大的類別作為分類預測結果輸出。
2.如權利要求1所述的基于質量節點模型的學習方法,其特征在于,所述每個帶標注樣本均作為有質量的點,包括:
所有帶標注樣本作為有質量的點,不同字體的帶標注樣本具有不同的質量,并且質量的大小與字體的標準程度正相關。
3.如權利要求1所述的基于質量節點模型的學習方法,其特征在于,所述卷積神經網絡包括B個串接的卷積塊,每個卷積塊包括一個卷積核為3*3的卷積層、一個批量正則化處理、一個ReLU激活函數、一個池化核為2*2的最大池化層。
4.如權利要求1所述的基于質量節點模型的學習方法,其特征在于,所述步驟4根據樣本集Q中所有帶標注樣本與各類別之間的引力計算損失函數,利用隨機梯度下降法優化損失函數,得到優化后的卷積神經網絡,包括:
若樣本集Q中帶標注樣本q屬于類別k,則帶標注樣本q受到W個類別的總引力為Fq總:
Fq總=Fq,k–∑j(j≠k)Fq,j
式中,Fq,k為類別k對樣本集Q中帶標注樣本q的引力,該引力為正引力,Fq,j表示類別j對樣本集Q中帶標注樣本q的引力,該引力為負引力,其中j表示W個類別中除類別k之外的其余類別;
因此計算損失函數為
式中,為卷積神經網絡的神經網絡參數,D為樣本集Q中帶標注樣本的個數;
利用隨機梯度下降法優化損失函數,得到本次優化后的神經網絡參數;
將本次優化后得到的神經網絡參數輸入卷積神經網絡,重復步驟1~步驟4,不斷訓練神經網絡參數,直至優化至損失函數的損失最小,得到最優的神經網絡參數,確定優化后的卷積神經網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學;浙江宇視科技有限公司,未經浙江大學;浙江宇視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010818346.8/1.html,轉載請聲明來源鉆瓜專利網。





