[發(fā)明專利]一種基于D-SMOTE的離散數(shù)據(jù)過采樣方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110025365.X | 申請(qǐng)日: | 2021-01-08 |
| 公開(公告)號(hào): | CN112685515B | 公開(公告)日: | 2022-08-12 |
| 發(fā)明(設(shè)計(jì))人: | 謝國;上官安琪;穆凌霞;費(fèi)蓉;姬文江;黑新宏;辛菁;馬佳琳;李思雨;陳文斌 | 申請(qǐng)(專利權(quán))人: | 西安理工大學(xué) |
| 主分類號(hào): | G06F16/28 | 分類號(hào): | G06F16/28;G06F16/245 |
| 代理公司: | 西安弘理專利事務(wù)所 61214 | 代理人: | 王敏強(qiáng) |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 smote 離散 數(shù)據(jù) 采樣 方法 | ||
1.一種基于D-SMOTE的離散數(shù)據(jù)過采樣方法,其特征在于,具體按照以下步驟實(shí)施:
步驟1、通過人為或記錄儀記錄交通事故樣本;
步驟2、確定所述步驟1得到的事故樣本中的最多類樣本與多個(gè)少類樣本,并通過隨機(jī)選取方式確定三角閉環(huán)空間;
所述步驟2具體如下:
步驟2.1、假設(shè)交通事故樣本有n類,其中,Ll是最多類樣本,Ls,s={1,...,n,s≠l}是多個(gè)少類樣本;
步驟2.2、確定少類樣本中閉環(huán)空間的三個(gè)頂點(diǎn)為xs、m1s、m2s,隨機(jī)選取少類樣本Ls中的樣本xs,并在xs周圍隨機(jī)選擇一個(gè)樣本m1s,將m1s周圍的少類樣本Ls的數(shù)量記為ks,其他類別樣本的數(shù)量記為k1s;
步驟2.3、如果ks=0,m1s代表噪聲,刪除該樣本;如果ks<<k1s,m1s代表邊緣樣本;如果ks>>k1s,m1s則是有效的樣本,并將m1s認(rèn)為是閉環(huán)空間的一個(gè)頂點(diǎn),閉環(huán)空間的另外一個(gè)頂點(diǎn)m2s的選取步驟與m1s一致,因此,三個(gè)頂點(diǎn)xs、m1s、m2s形成一個(gè)閉環(huán)空間;
步驟3、計(jì)算所述步驟2中最多類樣本與多個(gè)少類樣本之間的比值λ,將該比值作為少類樣本的采樣倍率;
所述步驟3具體如下:
少類樣本Ls的數(shù)量為Ns,最多類樣本Ll的數(shù)量為Nl,記λs為少類樣本Ls與最多類樣本Ll之間的采樣倍率,其中,λs=Nl/Ns;
步驟4、通過改進(jìn)插值公式,產(chǎn)生帶有離散特征的少類樣本數(shù)據(jù),
所述步驟4利用改進(jìn)的插值公式在閉環(huán)空間中生成新的少類樣本Ps,具體如下:
步驟4.1、在樣本m1s與樣本m2s之間生成新的樣本集,m1s與m2s之間需要通過改進(jìn)的插值公式產(chǎn)生新的事故樣本,改進(jìn)的插值公式如(2)所示:
其中,i=2,...,λs,s=1,...,n,s≠l,tis為樣本m1s與樣本m2s之間生成的第i個(gè)新樣本,rand(1,i/(i-1))為(1,i/(i-1))之間的隨機(jī)值,λs為采樣倍率;
步驟4.2、在樣本xs與樣本tis之間生成新的樣本集,xs與tis之間需要通過改進(jìn)的插值公式產(chǎn)生新的事故樣本,改進(jìn)的插值公式如(3)所示:
其中,his為樣本xs與樣本tis之間生成的第i個(gè)新樣本,λs是采樣倍率,i為采樣個(gè)數(shù),所生成的his與tis均為新的少類樣本Ps;
步驟4.3、新的少類樣本Ps能夠有效提高離散非均衡事故樣本的質(zhì)量,進(jìn)一步地提高后期事故預(yù)測效果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學(xué),未經(jīng)西安理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110025365.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種復(fù)合式麻花鉆
- 下一篇:一種透氣透水鞋底
- 一種針對(duì)非均衡數(shù)據(jù)分類的改進(jìn)SMOTE再抽樣方法
- 基于EasyEnsemble算法和SMOTE算法的不均衡數(shù)據(jù)分類方法
- 一種基于AdaBoost-SO的VANETs車輛事故風(fēng)險(xiǎn)預(yù)測模型
- 基于SMOTE算法和集成學(xué)習(xí)的惡意流量檢測方法
- 基于K-means改進(jìn)的SMOTE算法
- 一種基于改進(jìn)SMOTE算法的非平衡數(shù)據(jù)集處理方法及系統(tǒng)
- 基于C-K-SMOTE算法的不平衡數(shù)據(jù)集處理方法
- 一種用于橫向聯(lián)邦學(xué)習(xí)的優(yōu)化方法
- 一種基于決策樹和改進(jìn)SMOTE算法的哮喘病診斷系統(tǒng)
- 一種解決不平衡分類問題的新型過采樣方法及系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





