[發(fā)明專利]一種基于峭度的因果網(wǎng)絡(luò)推斷方法在審
| 申請?zhí)枺?/td> | 201710059700.1 | 申請日: | 2017-01-24 |
| 公開(公告)號: | CN106874433A | 公開(公告)日: | 2017-06-20 |
| 發(fā)明(設(shè)計)人: | 謝峰;郝志峰;蔡瑞初;溫雯;陳薇;陳炳豐 | 申請(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N5/04 |
| 代理公司: | 廣州市紅荔專利代理有限公司44214 | 代理人: | 吝秀梅,李彥孚 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 因果 網(wǎng)絡(luò) 推斷 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其是一種基于峭度的因果網(wǎng)絡(luò)推斷方法。
背景技術(shù)
目前,從觀察數(shù)據(jù)中發(fā)現(xiàn)因果關(guān)系得到廣泛的關(guān)注,并應(yīng)用在許多領(lǐng)域,例如神經(jīng)科學(xué),經(jīng)濟(jì)學(xué)和流行病學(xué)等。在沒有任何先驗知識的情況下,傳統(tǒng)的因果發(fā)現(xiàn)方法只能夠找到馬爾可夫等價類,需要借助干預(yù)實驗來獲得一個完整的網(wǎng)絡(luò),但實際情況下許多變量是不能夠做干預(yù)操作。
Shimizu等人提出的線性非高斯無環(huán)模型(LiNGAM)可以很好地解決這個問題,該模型能夠僅僅從觀察數(shù)據(jù)集中識別完整的因果網(wǎng)絡(luò)而得到越來越多研究。
針對線性非高斯無環(huán)模型(LiNGAM)模型的估計主要有三種思路:
第一種是將問題轉(zhuǎn)化為現(xiàn)有問題,例如借助獨立成分分析(ICA)技術(shù)來求解的
ICA-LiNGAM算法;
第二種是利用貝葉斯評分方法構(gòu)建因果網(wǎng)絡(luò),例如BayesLiNGAM算法;
第三種是使用兩兩獨立性來識別外生變量,逐層地估計因果次序,例如DirectLiNGAM算法和LR算法;
然而前兩種思路是將問題轉(zhuǎn)換成一個函數(shù)優(yōu)化問題,然后利用一些優(yōu)化算法來解決,但是它們都有對初始值敏感,容易陷入局部收斂的缺陷;對于第三種方法,將當(dāng)前變量與其余所有變量的殘差最獨立的一個作為外生變量是不可靠的衡量標(biāo)準(zhǔn);
使用近似變換方式估計LiNGAM模型會導(dǎo)致局部最優(yōu)問題或者獨立性不可靠問題,特別是當(dāng)干擾變量越接近高斯分布時,越難區(qū)分變量之間的因果關(guān)系。所以提出一種簡單直接的量化標(biāo)準(zhǔn)具有一定的研究價值和意義。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于峭度的因果網(wǎng)絡(luò)推斷方法,從而能夠穩(wěn)定、快速的識別因果網(wǎng)絡(luò)。
本發(fā)明的技術(shù)方案為:一種基于峭度的因果網(wǎng)絡(luò)推斷方法,通過基于峭度選擇外生變量、逐層找出因果次序和利用最小二乘法剪邊檢驗剪邊三個過程,其特征在于,包括以下步驟:
1)、設(shè)置觀察數(shù)據(jù)集X=[x1,x2,…xn],其中每個變量xi(i=1,2,...n)包含p個樣本數(shù)據(jù),設(shè)置因果次序集合K為空集合;
2)、計算每個變量xi(i=1,2,...n)的峭度值ki(i=1,2,...n),找出最大峭度值max ki所對應(yīng)的變量xm,那么變量xm即為外生變量,其計算式為:
其中,E(xi4)為變量xi四階中心距,(E(xi2))2為xi方差的平方;
3)、將其他變量與外生變量xm進(jìn)行最小二乘回歸,得到殘差rim,其計算為:
根據(jù)殘差rim得到殘差數(shù)據(jù)集Rm,從而得到更新后的觀察數(shù)據(jù)集X=Rm=(r1m,r2m,...rim);
4)、將外生變量xm按照從左至右的順序加入因果次序數(shù)集K中;
5)、然后按照步驟2、3、4)迭代地的計算觀察數(shù)據(jù)集X=Rm=(r1m,r2m,...rim)的外生變量,并將該外生變量加入到因果次序數(shù)集K中,并通過回歸方法計算更新后的觀察數(shù)據(jù)集X=Rm=(r1m,r2m,...rim)的殘差和殘差數(shù)據(jù)集,從而得到新的觀察數(shù)據(jù)集;
6)、按照步驟5)直至觀察數(shù)據(jù)集中剩下最后一個變量,然后將剩下的最后一個變量加入因果次序數(shù)集K中;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710059700.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于行為時間序列的社交網(wǎng)絡(luò)因果關(guān)系發(fā)現(xiàn)算法
- 一種自底向上的高維數(shù)據(jù)因果網(wǎng)絡(luò)學(xué)習(xí)方法
- 情態(tài)生成裝置以及計算機(jī)可讀取記錄介質(zhì)
- 對短文本進(jìn)行常識性因果推理的方法
- 一種基于動量動力學(xué)模型的行人間因果關(guān)系識別方法
- 因果句解析裝置、因果句解析系統(tǒng)、程序以及因果句解析方法
- 訂單歸因方法及裝置
- 一種基于因果推理對玻璃熔爐環(huán)境控制的方法及系統(tǒng)
- 一種結(jié)合知識圖譜和自動變分編碼的因果發(fā)現(xiàn)方法
- 一種基于弱證據(jù)聚合的常識因果推理方法及系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





