[發(fā)明專利]融合層疊泛化和代價(jià)敏感學(xué)習(xí)的社交網(wǎng)鏈路異常預(yù)測(cè)系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202010873940.7 | 申請(qǐng)日: | 2020-08-26 |
| 公開(公告)號(hào): | CN112073298B | 公開(公告)日: | 2021-08-17 |
| 發(fā)明(設(shè)計(jì))人: | 劉小洋;李祥;葉舒;苗琛香 | 申請(qǐng)(專利權(quán))人: | 重慶理工大學(xué) |
| 主分類號(hào): | H04L12/58 | 分類號(hào): | H04L12/58;H04L12/26;H04L12/24 |
| 代理公司: | 重慶天成卓越專利代理事務(wù)所(普通合伙) 50240 | 代理人: | 王宏松 |
| 地址: | 400054 *** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 融合 層疊 泛化 代價(jià) 敏感 學(xué)習(xí) 社交 網(wǎng)鏈路 異常 預(yù)測(cè) 系統(tǒng) | ||
1.一種融合層疊泛化和代價(jià)敏感學(xué)習(xí)的社交網(wǎng)絡(luò)鏈路異常預(yù)測(cè)系統(tǒng),其特征在于,包括社交網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù)特征獲取模塊、超參數(shù)確定模塊、結(jié)果預(yù)測(cè)模塊和數(shù)據(jù)展示模塊;
在社交網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù)特征獲取模塊中基模型包括:
給定數(shù)據(jù)集D=(x1,y1),(x2,y2),(x3,y3),……,(xN,yN),其中,yi∈{0,1};當(dāng)yi=0時(shí),yi表示負(fù)類;當(dāng)yi=1時(shí),yi表示正類;i=1,2,3,…,N;表示樣本特征空間,n表示各個(gè)樣本的特征個(gè)數(shù);N表示數(shù)據(jù)集D中樣本的個(gè)數(shù);
由于wTx+b取值是連續(xù)的,其中w表示列向量,維度為(n,1);T表示轉(zhuǎn)置;x表示列向量,維度為(n,1);b表示列向量,維度為(1,1);因此它不能擬合離散變量,用它來擬合條件概率P(Y=1|x);但是對(duì)于w≠0,wTx+b取值為實(shí)數(shù)R,不滿足概率取值為0到1,因此采用廣義線性模型;
由于單位階躍函數(shù)不可微,對(duì)數(shù)幾率函數(shù)是一個(gè)替代函數(shù):
于是有:
若y為x取正例的概率,則1-y為x取反例的概率;兩者比值稱為幾率odds,指該事件發(fā)生與不發(fā)生的概率比值,若事件發(fā)生的概率為P,則對(duì)數(shù)幾率:
將y視為類后驗(yàn)概率估計(jì),重寫公式有:
也就是說,輸出Y=1的對(duì)數(shù)幾率是由輸入x的線性函數(shù)表示的模型,這就是邏輯回歸模型;當(dāng)wT+b的值越接近正無窮,P(Y=1|x)概率值也就越接近1;因此先擬合決策邊界,再建立這個(gè)邊界與分類的概率聯(lián)系,從而得到了二分類情況下的概率;
邏輯回歸模型的數(shù)學(xué)形式確定后,剩下就是如何去求解模型中的參數(shù);在統(tǒng)計(jì)學(xué)中,使用極大似然估計(jì)法求解,即找到一組參數(shù),使得在這組參數(shù)下,數(shù)據(jù)的似然度最大;令:
p(xi)表示第i個(gè)樣本在已知特征為xi的情況下的為正類(Y=1)的概率;
yi就是二分類問題給定數(shù)據(jù)集D中的,即是yi=y(tǒng)1,y2,y3,...,yn,yi∈{0,1};
對(duì)等式兩邊同取對(duì)數(shù),寫成對(duì)數(shù)似然函數(shù):
在機(jī)器學(xué)習(xí)中有損失函數(shù)的概念,其衡量的是模型預(yù)測(cè)錯(cuò)誤的程度;取整個(gè)數(shù)據(jù)集上的平均對(duì)數(shù)似然損失,可以得到:
其中,N表示數(shù)據(jù)集D中樣本的個(gè)數(shù);
即在邏輯回歸模型中,最大化似然函數(shù)和最小化損失函數(shù)是等價(jià)的;
使用梯度下降法;優(yōu)化的目標(biāo)是找到一個(gè)方向,參數(shù)朝這個(gè)方向移動(dòng)之后使得損失函數(shù)的值能夠減小,這個(gè)方向往往由一階偏導(dǎo)或者二階偏導(dǎo)各種組合求得;邏輯回歸的損失函數(shù)是:
梯度下降是通過J(w)對(duì)w的一階導(dǎo)數(shù)來找下降方向,并且以迭代的方式來更新參數(shù),更新方式為:
表示第i個(gè)樣本權(quán)重參數(shù)的第k次迭代更新后的權(quán)重參數(shù);
α表示學(xué)習(xí)率,表示1次參數(shù)迭代更新的快慢;
表示第i個(gè)樣本權(quán)重參數(shù)的第k+1次迭代更新后的權(quán)重參數(shù);
wi表示第i個(gè)樣本的權(quán)重參數(shù);
所述社交網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù)特征獲取模塊的數(shù)據(jù)輸出端與超參數(shù)確定模塊的數(shù)據(jù)輸入端相連,超參數(shù)確定模塊的數(shù)據(jù)輸出端與結(jié)果預(yù)測(cè)模塊的數(shù)據(jù)輸入端相連,結(jié)果預(yù)測(cè)模塊的數(shù)據(jù)輸出端與數(shù)據(jù)展示模塊的數(shù)據(jù)輸入端相連;
所述社交網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù)特征獲取模塊用于獲取社交網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù),將獲取的社交網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù)中的相似性指標(biāo)作為基模型學(xué)習(xí)的特征;
所述超參數(shù)確定模塊用于確定基模型的超參數(shù);
所述結(jié)果預(yù)測(cè)模塊用于對(duì)基模型的預(yù)測(cè)結(jié)果進(jìn)行重新學(xué)習(xí);得到最終的預(yù)測(cè)結(jié)果;
所述數(shù)據(jù)展示模塊用于展示所述結(jié)果預(yù)測(cè)模塊輸出的結(jié)果。
2.根據(jù)權(quán)利要求1所述的融合層疊泛化和代價(jià)敏感學(xué)習(xí)的社交網(wǎng)絡(luò)鏈路異常預(yù)測(cè)系統(tǒng),其特征在于,在超參數(shù)確定模塊中,確定基模型中超參數(shù)的方法包括交叉驗(yàn)證、網(wǎng)格搜索、早停法之一。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶理工大學(xué),未經(jīng)重慶理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010873940.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- FPGA芯片的局部布局的優(yōu)化方法
- 一種代價(jià)估計(jì)的方法及設(shè)備
- 一種深度信息確定方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于GPU的雙目匹配算法的方法及處理裝置
- 視差圖的獲取方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 圖像立體匹配方法
- 圖像處理方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)
- 一種基于特定類的多目標(biāo)代價(jià)敏感屬性約簡(jiǎn)算法
- 一種礦區(qū)無人駕駛車輛的泊車方法及系統(tǒng)
- 一種礦區(qū)無人駕駛車輛的泊車方法及系統(tǒng)





