[發明專利]一種無先驗知識條件下基于小數據集的貝葉斯網絡參數學習方法在審
| 申請號: | 201810633214.0 | 申請日: | 2018-06-20 |
| 公開(公告)號: | CN108846439A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 邸若海;高曉光;萬開方;郭志高 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N7/00 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 呂湘連 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 小數據 貝葉斯網絡 參數學習 先驗知識 問題提供 統計量 計算機技術領域 最大似然估計 參數問題 分布條件 個數確定 獲取數據 虛擬樣本 數據量 建模 排序 虛擬 參考 引入 應用 | ||
本發明公開了一種無先驗知識條件下基于小數據集的貝葉斯網絡參數學習方法,屬于計算機技術領域。該方法首先獲取數據統計量,而后根據小數據集的數據量和待求參數的狀態個數確定虛擬樣本量,利用最大似然估計方法計算待求的參數,對同一分布條件下的參數進行排序,找出較小的參數;最后計算貝葉斯網絡參數。本發明針對無先驗知識時小數據集條件下的貝葉斯網絡參數問題,通過在引入虛擬統計量來提高小數據集條件下的參數學習精度,克服了現有方法對先驗知識的依賴問題,不僅為小數據集條件下的參數學習問題提供了一條可行的解決途徑,而且也為其它領域中的小數據集建模問題提供了可參考的方法,具有較為廣泛的應用前景。
技術領域
本發明屬于計算機技術領域,涉及一種無先驗知識條件下基于小數據集的貝葉斯網絡參數學習方法,可用于無先驗認知條件下的針對實際問題的貝葉斯網絡參數建模和數據分析。
背景技術
貝葉斯網絡是圖論和概率論相結合的產物,有著強大的理論基礎,已經成為處理不確定問題的主流方法。在工業界,作為貝葉斯網絡的積極倡導者之一,微軟已在其office軟件的幫助系統中成功采用貝葉斯網絡,以期為用戶提供更好的服務。而在學術界,《Science》和《Nature》多次刊登相關的研究論文對貝葉斯網絡予以介紹,人工智能領域的一系列頂級期刊(Artificial Intelligence、Journal of Machine Learning Reasearch等)和頂級會議(IJCAI、ICML、UAI和AISTATS等)中有關貝葉斯網絡的論文也常年維持著較高的水平。在實際的問題中,數據是決定貝葉斯網絡模型優劣的關鍵。一般來說,數據越充足,構建的貝葉斯網絡越精確。遺憾的是,它與所要構建模型的精度密切相關,要獲得完全準確的模型所需的“充分”數據量一般難以得到。一方面,某些領域可獲得的數據比較少或者數據的代價比較昂貴,例如,地質災害預測、罕見疾病診斷、裝備故障診斷以及作戰指揮決策等。另一方面,數據量的增加是一個逐漸積累的過程,數據量的積累是一個由小變大、由少變多的過程,所以數據量必然會經歷不充分的階段。再者,在某些特定場合不得不在數據不充分的條件下完成決策。例如,在一些作戰過程中,為了達到“先敵決策、先敵打擊”的戰術目的,不得不在數據尚不充分的條件下盡早做出較為正確的決策。
針對基于小數據集的貝葉斯網絡參數學習問題,由于小數據集使得統計信息不準確,使得基于統計的方法都已失效。目前,主流的方法是通過引入專家知識來彌補數據量的不足,例如,郭志高等在文獻《小數據集條件下基于雙重約束的BN參數學習》中研究了在雙重約束條件下的參數學習方法。柴慧敏等在文獻《一種融合專家先驗知識的貝葉斯網絡參數學習方法》中研究了在參數先驗知識表示為正態分布時的參數學習方法。以上文獻表明,參數學習的過程必須要有專家知識的支撐。然而,當專家對一個實際問題沒有認知或者經驗的情況下,如何能夠保證參數學習的效果。本發明旨在給出一種無先驗約束條件下的基于小數據集的參數學習方法。
發明內容
本發明提供了一種無先驗約束條件下基于小數據集的貝葉斯網絡參數學習方法。具體包含以下幾個步驟:
步驟1:獲取數據統計量:
在小數據集條件下,通過統計獲取參數學習所需的對應的狀態統計量Nijk和Nij,為之后具體的參數計算做準備。其中,Nijk表示數據集中節點i取值為k,且其父節點取值為j的樣本個數,Nij為數據集中節點i的父節點取值為j的樣本個數。
步驟2:根據小數據集的數據量和待求參數的狀態個數確定虛擬樣本量:
設待求參數為θijk,其中k有r種取值狀態,設數據量為N,則
Nneed=n2logn2lognm+1 (1)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810633214.0/2.html,轉載請聲明來源鉆瓜專利網。





