[發(fā)明專利]基于流特征的因果結(jié)構(gòu)學(xué)習(xí)方法有效
| 申請?zhí)枺?/td> | 201610032838.8 | 申請日: | 2016-01-18 |
| 公開(公告)號: | CN105719006B | 公開(公告)日: | 2019-07-19 |
| 發(fā)明(設(shè)計)人: | 楊靜;安寧;郭曉雪;丁會通;李廉 | 申請(專利權(quán))人: | 合肥工業(yè)大學(xué) |
| 主分類號: | G06N5/00 | 分類號: | G06N5/00 |
| 代理公司: | 安徽省合肥新安專利代理有限責(zé)任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 特征 因果 結(jié)構(gòu) 學(xué)習(xí)方法 | ||
本發(fā)明公開了一種基于流特征的因果結(jié)構(gòu)學(xué)習(xí)方法,其特征是按如下步驟進行:1、以流的方式產(chǎn)生分布任意的新特征;2、對每個新產(chǎn)生的特征,進行相關(guān)性分析;3、對特征集進行冗余校驗分析;4、基于每個特征進行搜索定向。重復(fù)1,2,3,4步驟,直至產(chǎn)生的特征數(shù)超過極限值,最終可以獲得對應(yīng)的因果結(jié)構(gòu)。本發(fā)明能夠從具有流特征的線性任意分布的數(shù)據(jù)中發(fā)現(xiàn)蘊含的因果結(jié)構(gòu)關(guān)系,同時降低學(xué)習(xí)的時間復(fù)雜度,從而滿足在線學(xué)習(xí)的時效性要求。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,具體地說是面向線性任意分布數(shù)據(jù)的基于流特征的因果結(jié)構(gòu)學(xué)習(xí)方法。
背景技術(shù)
隨著社會進步和科技發(fā)展,人們需要認識的事物變得越來越復(fù)雜,系統(tǒng)內(nèi)部的因果關(guān)系是客觀存在的,因果結(jié)構(gòu)學(xué)習(xí)就是從數(shù)據(jù)中挖掘蘊含的因果結(jié)構(gòu)關(guān)系,可以幫助人們認清復(fù)雜事物的本質(zhì)與規(guī)律。因果結(jié)構(gòu)學(xué)習(xí)滲入到生物、醫(yī)學(xué)、經(jīng)濟、自動控制、信息處理等各個學(xué)科,涉及到日常生活、工業(yè)生產(chǎn)、軍事國防等各個方面。
現(xiàn)實生活中很多變量的分布往往是非高斯的。例如:腦磁圖(MEG,magnetoencephalographic)源的值并不一定符合標準的高斯分布,不同的腦磁圖源間的因果關(guān)系使用非高斯的因果模型分析更為適合;銅陵礦區(qū)土壤元素樣品數(shù)據(jù)有些不符合高斯分布;股票指數(shù)并不一定符合高斯分布,使用非高斯的因果模型更能揭示不同區(qū)域股票指數(shù)間的因果關(guān)系;在證券投資中,投資收益率的分布也很多情況下是符合非高斯分布的;社會學(xué)中,研究變量的分布也并非一定符合高斯分布等等。
在很多情況下,數(shù)據(jù)還具有高維或流的特征。在圖像處理領(lǐng)域,圖像的特征維數(shù)非常高從而無法一次載入內(nèi)存;在火星的彈坑(Crater)檢測中,紋理特征也是非常龐大并且以流的方式順序產(chǎn)生;在統(tǒng)計關(guān)系學(xué)習(xí)領(lǐng)域,一個SQL查詢可能導(dǎo)致產(chǎn)生上百萬的特征,并且這些特征以流的方式順序產(chǎn)生;在生物學(xué)領(lǐng)域,基因表達數(shù)據(jù)也具有高維特性等等。并且,這些數(shù)據(jù)往往也是非線性非高斯的。
國內(nèi)外的學(xué)者也提出了一系列的因果結(jié)構(gòu)學(xué)習(xí)算法,典型的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法包括基于搜索打分(Search-And-Score)的方法、基于依賴分析(Constrained Based)的方法和兩者混合的方法,如SGS算法、PC算法、TPDA算法、K2算法]、OR算法、SC算法]、MMHC算法等等。然而,大多數(shù)的結(jié)構(gòu)學(xué)習(xí)算法是基于離散數(shù)據(jù)進行研究的,不能有效地處理連續(xù)數(shù)據(jù)。近年來,對連續(xù)數(shù)據(jù)進行因果發(fā)現(xiàn)研究已成為一個新的研究熱點,也涌現(xiàn)了很多方法。如L1MB算法,TC算法,ICA-LiNGAM算法,PClingam算法,HP算法,Two-Phase算法,DirectLiNGAM算法,PCB算法等。
目前經(jīng)典的因果結(jié)構(gòu)學(xué)習(xí)方法都不能有效的處理具有流特征的線性任意分布的連續(xù)數(shù)據(jù),這些方法的主要局限包括:
(1)面向線性任意分布的結(jié)構(gòu)學(xué)習(xí)算法多數(shù)屬于基于依賴分析的方法,該方法為了判斷兩特征間是否相關(guān),需要在大量的子集上進行獨立性測試,導(dǎo)致需要較多的獨立性測試,從而需要耗費很多的時間,計算復(fù)雜度比較大;
(2)面向線性任意分布的結(jié)構(gòu)學(xué)習(xí)算法一般假設(shè)可以事先獲得所有的數(shù)據(jù),不能處理具有流特征的數(shù)據(jù),即特征逐個流入,從而不能有效的處理動態(tài)、未知的特征空間下的因果結(jié)構(gòu)學(xué)習(xí)問題。
發(fā)明內(nèi)容
本發(fā)明為克服現(xiàn)有技術(shù)存在的不足之處,提出了一種基于流特征的因果結(jié)構(gòu)學(xué)習(xí)方法,以期能夠從具有流特征的線性任意分布的數(shù)據(jù)中發(fā)現(xiàn)蘊含的因果結(jié)構(gòu)關(guān)系,同時降低學(xué)習(xí)的時間復(fù)雜度,從而滿足在線學(xué)習(xí)的時效性要求。
本發(fā)明為解決技術(shù)問題采用如下技術(shù)方案:
本發(fā)明一種基于流特征的因果結(jié)構(gòu)學(xué)習(xí)方法的特點是按如下步驟進行:
步驟1、定義時刻t;并初始化t=0;定義特征個數(shù)極限值為max;
步驟2、定義特征集為EF,并初始化第t時刻的特征集為
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610032838.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于行為時間序列的社交網(wǎng)絡(luò)因果關(guān)系發(fā)現(xiàn)算法
- 一種自底向上的高維數(shù)據(jù)因果網(wǎng)絡(luò)學(xué)習(xí)方法
- 情態(tài)生成裝置以及計算機可讀取記錄介質(zhì)
- 對短文本進行常識性因果推理的方法
- 一種基于動量動力學(xué)模型的行人間因果關(guān)系識別方法
- 因果句解析裝置、因果句解析系統(tǒng)、程序以及因果句解析方法
- 訂單歸因方法及裝置
- 一種基于因果推理對玻璃熔爐環(huán)境控制的方法及系統(tǒng)
- 一種結(jié)合知識圖譜和自動變分編碼的因果發(fā)現(xiàn)方法
- 一種基于弱證據(jù)聚合的常識因果推理方法及系統(tǒng)
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





