[發明專利]一種基于BP神經網絡的預測裝置及設備有效
| 申請號: | 201210039243.7 | 申請日: | 2012-02-21 |
| 公開(公告)號: | CN102622418A | 公開(公告)日: | 2012-08-01 |
| 發明(設計)人: | 馬楠;王汕汕;周林;沈洪;曹國良 | 申請(專利權)人: | 北京聯合大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/02 |
| 代理公司: | 北京馳納智財知識產權代理事務所(普通合伙) 11367 | 代理人: | 謝亮;唐與芬 |
| 地址: | 100101 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 bp 神經網絡 預測 裝置 設備 | ||
技術領域
本發明主要涉及數據挖掘技術領域。
背景技術
一、數據挖掘技術:
隨著存儲設備和數據庫技術的發展,數據的存儲已經不是問題,相反,人們已經開始感到被大量的數據淹沒,因此,急需一種科學的方法將海量的數據轉化成對人們有實際意義的知識和規律,數據挖掘就是在這個背景下產生的技術。
20世紀80年代末,數據挖掘作為新興的研究領域悄然出現。數據挖掘的研究目的是在大型數據集中發現那些隱藏的、人們感興趣的具有特定規律的信息。隨著數據挖掘的發展,這種技術被應用在商業管理、政府辦公、科學研究和工程開發等眾多的領域中。
一般來說,基本的數據挖掘流程如下所示:
⑴定義問題:清晰地定義出業務問題,確定數據挖掘的目的。
⑵數據準備:數據準備包括:選擇數據--在大型數據庫和數據倉庫目標中提取數據挖掘的目標數據集;數據預處理--進行數據再加工,包括檢查數據的完整性及數據的一致性、去噪聲,填補丟失的域,刪除無效數據等。
⑶數據挖掘:根據數據功能的類型和數據的特點選擇相應的算法,在凈化和轉換過的數據集上進行數據挖掘。
⑷結果分析:對數據挖掘的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。
⑸知識的運用:將分析所得到的知識集成到業務信息系統的組織結構中去。
二、神經網絡算法:
近年來,神經網絡被廣泛運用于時間序列分析和金融預報,這是因為神經網絡具有非常強的非線性函數逼近能力,克服了傳統處理方法對于數據方面的缺陷,使之在預測領域得到成功的應用。
神經網絡是一種類似于大腦神經突觸結構并可以進行信息處理的數學模型,它是對人腦的抽象、簡化和模擬,反映了人腦的基本特性。
神經網絡(圖1)同時也是一種運算模型,由大量的節點(也稱為神經元)和相互之間的加權連接構成。每個節點代表一種特定的輸出函數,稱為激勵函數(activation?function)。每兩個節點間的連接都代表一個對于通過該連接信號的加權值,稱為權重(weight),這相當于神經網絡的記憶。網絡的輸出則根據網絡的連接方式、權重值和激勵函數的不同而不同。而網絡自身通常都是對自然界某種算法或者函數的逼近,也可能是對一種邏輯策略的表達。
神經網絡主要解決數據挖掘的分類和回歸任務,它可以找出輸入屬性和可預測屬性之間平滑連續的非線性關系。
三、BP神經網絡:
BP(Back?Propagation)網絡是1986年由Rumelhart和McCelland為首的科學家小組提出,是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡模型之一。BP網絡能學習和存貯大量的輸入-輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。它的學習規則是使用最速下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。BP神經網絡模型拓撲結構包括輸入層(input)、隱藏層(hide?layer)和輸出層(output?layer)。
神經網絡可以用作分類、聚類、預測等。神經網絡需要有一定量的歷史數據,通過歷史數據的訓練,網絡可以學習到數據中隱含的知識。在你的問題中,首先要找到某些問題的一些特征,以及對應的評價數據,用這些數據來訓練神經網絡。? 雖然BP網絡得到了廣泛的應用,但自身也存在一些缺陷和不足,主要包括以下幾個方面的問題。首先,由于學習速率是固定的,因此網絡的收斂速度慢,需要較長的訓練時間。對于一些復雜問題,BP算法需要的訓練時間可能非常長,這主要是由于學習速率太小造成的,可采用變化的學習速率或自適應的學習速率加以改進。其次,BP算法可以使權值收斂到某個值,但并不保證其為誤差平面的全局最小值,這是因為采用梯度下降法可能產生一個局部最小值。對于這個問題,可以采用附加動量法來解決。再次,網絡隱含層的層數和單元數的選擇尚無理論上的指導,一般是根據經驗或者通過反復實驗確定。因此,網絡往往存在很大的冗余性,在一定程度上也增加了網絡學習的負擔。最后,網絡的學習和記憶具有不穩定性。也就是說,如果增加了學習樣本,訓練好的網絡就需要從頭開始訓練,對于以前的權值和閾值是沒有記憶的。但是可以將預測、分類或聚類做的比較好的權值保存。
回顧各種數據挖掘預測算法的發展,我們可以看到其推廣的瓶頸在于不同的算法需要不同的訓練數據格式和特殊化的參數設置,而且其預測過程往往需要人為干預和設定,預測時需要提供大量的輔佐數據,預測結果也不夠直觀,這對于算法的推廣和使用均十分不利。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聯合大學,未經北京聯合大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210039243.7/2.html,轉載請聲明來源鉆瓜專利網。





