[發明專利]基于統計概率的損失函數計算方法、電子設備、存儲介質在審
| 申請號: | 201811033070.1 | 申請日: | 2018-09-05 |
| 公開(公告)號: | CN109325528A | 公開(公告)日: | 2019-02-12 |
| 發明(設計)人: | 馬瑞;丁志祿 | 申請(專利權)人: | 浙江長興笛卡爾科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 廣州市越秀區哲力專利商標事務所(普通合伙) 44288 | 代理人: | 胡擁軍;糜婧 |
| 地址: | 313100 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 懲罰項 統計 損失函數 分類概率 分類結果 概率矩陣 向量 概率 電子設備 分類器 分類 可讀存儲介質 原始數據集 存儲介質 機器學習 類別提取 數據分類 整合 懲罰 | ||
1.基于統計概率的損失函數計算方法,其特征在于包括以下步驟:
數據分類,對原始數據集通過分類器進行分類,得到分類結果概率矩陣;
計算損失,通過損失函數計算所述分類結果概率矩陣中每一分類概率向量的損失,得到總體損失;
計算統計懲罰項,通過統計懲罰項計算方法計算所述分類結果概率矩陣中每一數據分類概率對應的統計懲罰項,得到總體統計懲罰項;
損失重構,將所述總體損失中每一所述分類概率向量對應的損失與所述總體統計懲罰項中每一所述分類概率向量對應的統計懲罰項進行整合,得到帶統計懲罰項的損失函數。
2.如權利要求1所述的基于統計概率的損失函數計算方法,其特征在于:所述數據分類中具體包括以下步驟:
將所述原始數據集表示為數據集向量,所述數據集向量公式如下:
其中,S為數據集向量,g為數據集向量S中數據個數,Si為數據集向量S中第i個數據,Si的公式如下:
其中,fj為Si中第j個特征;
采用分類算法對數據集向量S進行分類,得到分類結果概率矩陣,公式如下:
其中,CA為分類算法,Parameter為CA中需要訓練的參數,S為數據集向量,P為分類結果概率矩陣,為第g個數據屬于第n類的概率。
3.如權利要求2所述的基于統計概率的損失函數計算方法,其特征在于,所述計算損失中具體包括以下步驟:
獲取所述分類結果概率矩陣中第i個數據對應的分類概率向量,具體公式如下:
通過損失函數計算第i個數據對應的分類概率向量的損失,具體公式如下:
lossi=LF(ki,pi)
通過每一個數據對應的分類概率向量的損失生成總體損失,具體公式如下:
其中,pi為第i個數據對應的分類概率向量,lossi為第i個數據對應的分類概率向量的損失,Loss為總體損失,LF為損失函數,ki為數據Si的真實分類結果。
4.如權利要求3所述的基于統計概率的損失函數計算方法,其特征在于,所述計算統計懲罰項中具體包括以下步驟:
通過統計懲罰項計算方法計算每一所述分類概率向量中當前數據屬于除當前分類外其他分類的概率總和占當前數據屬于當前分類的概率的比值,具體公式如下:
其中,PF(p)為總體統計懲罰項,PF(pi)為數據Si在分類算法CA下的分類懲罰矩陣,具體公式如下:
其中,為數據Si屬于m分類概率對應的統計懲罰項,具體公式如下:
5.如權利要求4所述的基于統計概率的損失函數計算方法,其特征在于:所述損失重構中具體包括以下步驟:
將所述總體損失中第i個數據對應的分類概率向量的損失及第i個數據在分類算法CA下的分類懲罰矩陣進行整合,具體公式為:
PLF(lossi,PF(pi))
其中,PLF()為整合lossi與PF(pi)的復合函數;
將所述總體損失中每一數據對應的分類概率向量的損失與所述總體統計懲罰項中每一數據在分類算法CA下的分類懲罰矩陣進行整合,得到帶統計懲罰項的損失函數,具體公式如下:
PL=PLF(Loss,PF(p))
其中,PL為帶統計懲罰項的損失函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江長興笛卡爾科技有限公司,未經浙江長興笛卡爾科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811033070.1/1.html,轉載請聲明來源鉆瓜專利網。





