[發明專利]一種基于反正切損失函數的目標分類方法在審
| 申請號: | 202310052143.6 | 申請日: | 2023-02-02 |
| 公開(公告)號: | CN116028866A | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 趙振兵;陳浩天;聶禮強;戴永東;翟永杰;趙文清 | 申請(專利權)人: | 華北電力大學(保定);山東大學;國網江蘇省電力有限公司泰州供電分公司 |
| 主分類號: | G06F18/241 | 分類號: | G06F18/241;G06F18/214;G06N3/045;G06N3/08 |
| 代理公司: | 北京鑫瑞森知識產權代理有限公司 11961 | 代理人: | 王前明 |
| 地址: | 071003 河*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 正切 損失 函數 目標 分類 方法 | ||
本發明提供了一種基于反正切損失函數的目標分類方法,該方法包括:選擇數據集,并定義數據集的標簽,對孿生網絡的損失函數進行調整,用于減小同類樣本特征的距離,增大不同類別樣本特征的距離,得到調整后的孿生網絡,通過數據集對孿生網絡進行訓練,直至孿生網絡收斂,并對訓練后的孿生網絡進行測試。本發明提供的基于反正切損失函數的目標分類方法,能夠減少網絡訓練周期,能夠加速網絡收斂。
技術領域
本發明涉及孿生網絡目標分類技術領域,特別是涉及一種基于反正切損失函數的目標分類方法。
背景技術
深度學習已經在各個領域取得了非常優異的表現。傳統的基于深度學習的方法需要大量的樣本進行訓練,當樣本不充分時,模型性能將嚴重下降。現實中,并不都能獲得大量的樣本,且樣本往往呈現出類別多、樣本少的特點。為了解決上述問題,針對少樣本、多類別的分類方法研究逐漸深入,孿生網絡便是其中之一。
孿生網絡以兩個樣本為輸入,輸出其高維空間的特征,用來比較兩個樣本的相似程度,簡單來說,可以最小化同類樣本的距離,最大化不同類之間的距離。在使用基于孿生網絡進行目標分類任務時,由于其經典損失函數的不合理性,導致網絡訓練周期長、難以收斂。為解決該問題,提出一種基于反正切損失函數的目標分類方法是十分有必要的。
發明內容
本發明的目的是提供一種基于反正切損失函數的目標分類方法,能夠減少網絡訓練周期,能夠加速網絡收斂。
為實現上述目的,本發明提供了如下方案:
一種基于反正切損失函數的目標分類方法,包括如下步驟:
步驟1:選擇數據集,并定義數據集的標簽;
步驟2:對孿生網絡的損失函數進行調整,用于減小同類樣本特征的距離,增大不同類別樣本特征的距離,得到調整后的孿生網絡;
步驟3:通過數據集對孿生網絡進行訓練,直至孿生網絡收斂,并對訓練后的孿生網絡進行測試。
可選的,步驟1中,選擇數據集,并定義數據集的標簽,具體為:
選擇公共無標注數據集Omniglot,將其劃分為訓練集及測試集,并定義樣本標簽。
可選的,步驟2中,對孿生網絡的損失函數進行調整,用于減小同類樣本特征的距離,增大不同類別樣本特征的距離,得到調整后的孿生網絡,具體為:
結合二分類交叉熵損失函數及反正切函數,設計反正切損失函數為:
式中,yn為樣本標簽,用0表示同類樣本,1表示不同類的樣本,xn表示經過孿生網絡輸出的特征距離,通過將特征做差得到;
當孿生網絡輸入同類樣本時,此時標簽為0,反正切損失函數的表達式變為:
當孿生網絡輸入不同類別的樣本時,此時標簽為1,反正切損失函數的表達式變為:
根據反正切損失函數對孿生網絡的損失函數進行調整,得到調整后的孿生網絡。
可選的,步驟3中,通過數據集對孿生網絡進行訓練,直至孿生網絡收斂,并對訓練后的孿生網絡進行測試,具體為:
通過訓練集及測試集對調整后的孿生網絡進行訓練,直至孿生網絡收斂,繪制訓練集和測試集上的損失函數曲線及準確率曲線,對訓練后的孿生網絡進行測試,驗證反正切損失函數是否準確度量樣本的距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華北電力大學(保定);山東大學;國網江蘇省電力有限公司泰州供電分公司,未經華北電力大學(保定);山東大學;國網江蘇省電力有限公司泰州供電分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310052143.6/2.html,轉載請聲明來源鉆瓜專利網。





