[發明專利]一種樣本均衡方法、裝置、設備及存儲介質在審
| 申請號: | 202210132426.7 | 申請日: | 2022-02-14 |
| 公開(公告)號: | CN114511760A | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 劉毅然 | 申請(專利權)人: | 中國農業銀行股份有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06K9/62 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 趙翠香 |
| 地址: | 100005 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 樣本 均衡 方法 裝置 設備 存儲 介質 | ||
1.一種樣本均衡方法,其特征在于,包括:
對獲取到的初始樣本集進行劃分,得到多數類樣本集和少數類樣本集;
根據所述多數類樣本集和所述少數類樣本集包含的樣本數量,確定樣本生成總數量;
基于所述少數類樣本集中少數類樣本的空間分布情況,確定各所述少數類樣本的識別難度;
根據各所述識別難度,結合所述樣本生成總數量,確定各所述少數類樣本對應的樣本生成分數量;
采用線性插值的方法,針對各所述少數類樣本生成對應樣本生成分數量個新樣本數據,以實現樣本均衡。
2.根據權利要求1所述的樣本均衡方法,其特征在于,所述根據所述多數類樣本集和所述少數類樣本集包含的樣本數量,確定樣本生成總數量,包括:
將所述多數類樣本集包含的樣本數量確定為多數類樣本數量,所述少數類樣本集包含的樣本數量確定為少數類樣本數量;
將所述多數類樣本數量與所述少數類樣本數量之和確定為樣本數量總值,所述多數類樣本數量與所述少數類樣本數量之差確定為樣本數量差值;
獲取過采樣閾值和平衡因子,當所述少數類樣本數量與所述樣本數量總值之比小于等于所述過采樣閾值時,將所述樣本數量差值和所述平衡因子之積確定為樣本生成總數量。
3.根據權利要求1所述的樣本均衡方法,其特征在于,所述基于所述少數類樣本集中少數類樣本的空間分布情況,確定各所述少數類樣本的識別難度,包括:
針對每個少數類樣本,從所述初始樣本集中確定所述少數類樣本的近鄰參數個近鄰樣本,形成近鄰樣本集;
將存在于所述多數類樣本集的近鄰樣本作為多數類近鄰樣本,形成多數類近鄰樣本集,將存在于所述少數類樣本集的近鄰樣本作為少數類近鄰樣本,形成少數類近鄰樣本集;
確定所述少數類樣本與所述多數類近鄰樣本集的多數類空間距離,以及所述少數類樣本與所述少數類近鄰樣本集的少數類空間距離;
根據所述多數類空間距離與所述少數類空間距離,確定所述少數類樣本的識別難度。
4.根據權利要求3所述的樣本均衡方法,其特征在于,所述確定所述少數類樣本與所述多數類近鄰樣本集的多數類空間距離,以及所述少數類樣本與所述少數類近鄰樣本集的少數類空間距離,包括:
分別將各所述多數類近鄰樣本與所述少數類樣本的空間距離作為各所述多數類近鄰樣本對應的多數樣本空間距離,確定所有多數樣本空間距離的平均值為所述多數類近鄰樣本集中的多數類空間距離;
分別將各所述少數類近鄰樣本與所述少數類樣本的空間距離作為各所述少數類近鄰樣本對應的少數樣本空間距離,確定所有少數樣本空間距離的平均值為所述少數類近鄰樣本集中的少數類空間距離。
5.根據權利要求4所述的樣本均衡方法,其特征在于,所述空間距離的計算方式包括:歐氏距離計算方式、曼氏距離計算方式、切比雪夫距離計算方式和/或閔可夫斯基距離計算方式。
6.根據權利要求3所述的樣本均衡方法,其特征在于,所述根據所述多數類空間距離與所述少數類空間距離,確定所述少數類樣本的識別難度,包括:
當所述多數類空間距離為零時,所述少數類樣本的識別難度為零;
當所述多數類空間距離不為零時,將所述少數類空間距離與所述多數類空間距離之比作為所述少數類樣本的識別難度。
7.根據權利要求1所述的樣本均衡方法,其特征在于,所述根據各所述識別難度,結合所述樣本生成總數量,確定各所述少數類樣本對應的樣本生成分數量,包括:
對各所述少數類樣本的識別難度進行歸一化,得到各所述少數類樣本的過采樣數量占比;
將各所述過采樣數量占比與所述樣本生成總數量之積,確定為對應少數類樣本的樣本生成分數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業銀行股份有限公司,未經中國農業銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210132426.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分級加氫站及加氫方法
- 下一篇:車輛起步控制方法及系統





