[發明專利]構造混合模型的方法有效
| 申請號: | 201210041495.3 | 申請日: | 2012-02-15 |
| 公開(公告)號: | CN102693265B | 公開(公告)日: | 2017-08-25 |
| 發明(設計)人: | R·E·凱蘭;B·拉登 | 申請(專利權)人: | 通用電氣公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N7/00 |
| 代理公司: | 中國專利代理(香港)有限公司72001 | 代理人: | 何欣亭,朱海煜 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 構造 混合 模型 方法 | ||
技術領域
本發明涉及構造混合模型的方法。
背景技術
數據挖掘是用于從數據中提取信息和值的技術。數據挖掘算法用于許多應用中,例如預測購物者對目標市場的消費習慣、檢測信用卡詐騙交易、預測顧客的網站的瀏覽路線、機器的故障檢測等。數據挖掘使用多年來由人工智能(AI)和統計建模團體所開發的一系列算法。存在許多不同類的算法,但是它們全部共有一些共同特征,例如(a)表示(隱式地或顯式地)數據域的知識的模型,(b)使用訓練數據來構造模型的模型構建或學習階段,以及(3)獲得新數據并且對數據應用模型以進行預測的推理工具。已知的示例是線性回歸模型,其中通過對第二變量的值進行加權并且對加權值與常數值進行求和,由第二變量來預測第一變量。加權和常數值是模型的參數。
混合模型是學術研究團體中的數據挖掘應用的常用模型,如G McLachlan和D Peel在有限混合模型(Finite Mixture Models)(John Wiley&Sons,(2000))中所述。存在混合模型的類的變化,例如混合專家(Mixture of Experts)和分層混合專家(Hierarchical Mixture of Experts)。還存在用于構建混合模型的有大量文獻證明的算法。一個示例是期望最大化(EM)。一般通過識別數據中的簇或成分并且將適當數學函數擬合每個簇,來構造這類混合模型。
發明內容
在一個方面,生成非暫時介質中存儲的數據集的一般混合模型(general mixture model)的方法包括下列步驟:提供用于定義數據集的子集的子集標準;在處理器中基于子集標準將數據集劃分為至少兩個子集;生成至少兩個子集的每個的子集混合模型;以及將至少兩個子集的每個的子集混合模型組合為一般混合模型。
附圖說明
附圖包括:
圖1是示出按照本發明的一個實施例的生成一般混合模型的方法的流程圖。
圖2是示出作為圖1所示方法的一部分的從子集混合模型過濾成分的方法的流程圖。
圖3是示出按照圖1的生成一般混合模型的方法的數據集的過濾的示例的圖表。
圖4是示出第一子集的子集混合模型的圖表。
圖5是示出第二子集的子集混合模型的圖表。
圖6是示出通過圖1公開的方法而構造的一般混合模型的圖表。
附圖標記說明
100生成一般混合模型的方法;102數據庫;104生成具有子集標識的子集;106存在至少一個子集?;108子集標準;110構建每個子集的混合模型;112存在至少兩個子集?;114子集模型是一般模型;116需要模型過濾?;118從模型中去除成分;120將子集模型組合;122需要簡化?;124組合子集模型是一般模型;126簡化組合模型;128簡化模型是一般模型;180第一子集數據;190第二子集數據;G1第一簇擬合函數;G2第二簇擬合函數;G3第三簇擬合函數;G4第四簇擬合函數;G5第五簇擬合函數;μ1第一簇的均值;μ2第二簇的均值;μ3第三簇的均值;μ4第四簇的均值;μ5第五簇的均值。
具體實施方式
為便于說明,以下描述中提出了大量具體細節,以便提供對本文所述技術的透徹理解。然而,本領域的技術人員將會清楚地知道,沒有這些具體細節也可實施示范實施例。在其它情況下,結構和裝置以簡圖形式示出,以便于示范實施例的描述。
下面參照附圖來描述示范實施例。這些附圖示出實現本文所述的模塊、方法和計算機程序產品的具體實施例的某些細節。但是,附圖不應當被理解為施加附圖中可存能在的任何限制。方法和計算機程序產品可在任何機器可讀介質上提供以用于實現其操作。實施例可使用現有的計算機處理器、或者通過為這個或另一個目的而結合的專用計算機處理器、或者通過硬連線系統來實現。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于通用電氣公司,未經通用電氣公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210041495.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:二次電池
- 下一篇:圖像處理系統和圖像處理方法





