[發明專利]簡化基于矩陣的Boosting算法的系統及方法有效
| 申請號: | 201010231583.0 | 申請日: | 2010-07-20 |
| 公開(公告)號: | CN102117380A | 公開(公告)日: | 2011-07-06 |
| 發明(設計)人: | 李政憲 | 申請(專利權)人: | 鴻富錦精密工業(深圳)有限公司;鴻海精密工業股份有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518109 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 簡化 基于 矩陣 boosting 算法 系統 方法 | ||
技術領域
本發明涉及一種數據處理技術,尤其涉及一種簡化基于矩陣的Boosting算法的系統及方法。
背景技術
隨著人類收集和存儲數據能力的快速提升,各行各業利用計算機技術對數據進行分析的需求日趨迫切。機器學習作為智能數據分析的重要技術手段,受到人們越來越多的關注,已成為計算機科學技術領域中最活躍的研究分支之一。所謂機器學習是研究如何讓計算機具備和人類一樣的學習能力,以使計算機具有決策、推理、認知、識別等智能,以便利用已知數據(樣本、實例等)和一定的學習規則,對未知或無法測量的數據進行預測和判斷。
Boosting算法是目前流行的一種機器學習算法,其主要用于對目標物體的偵測,如人臉識別等方面,可以提高回歸算法的性能。Boosting算法可以從已知數據中識別出特征數據。通過對特征數據的各種組合運算,經過不斷的偵錯與迭代,逐漸減少對預測結果或者判斷結果的假陽值(false?positive,也稱誤判率),從而獲得較為精確的預測結果或者判斷結果。
Boosting算法可以通過多種方法實現,如決策數、加權最小二乘法等。其中,像加權最小二乘法這樣的基于矩陣的Boosting算法最為簡單并且能夠在很短的時間得到相對精確的預測結果或者判斷結果。然而,這種基于矩陣的Boosting算法需要對所有的特征數據進行矩陣運算,因此,運算次數會根據特征數據的增加而增加,從而運算所需的時間及內存空間也會隨之增加。
發明內容
鑒于以上內容,有必要提出一種簡化基于矩陣的Boosting算法的系統,其通過對數據的分割運算,簡化基于矩陣的Boosting算法,以減少運算次數。
此外,還有必要提出一種簡化基于矩陣的Boosting算法的方法,其通過對數據的分割運算,簡化基于矩陣的Boosting算法,以減少運算次數。
一種簡化基于矩陣的Boosting算法的系統,包括:參數接收模塊,用于從一個用戶端電腦接收假陽值;數據載入模塊,用于從一個數據庫中載入已知數據,并從所載入的已知數據中識別出特征數據,以生成一個由特征數據組成的特征集合;數據分割模塊,用于將上述特征集合分割成多個包含數據個數相等的子集合;編號指定模塊,用于依序為每個子集合指定一個編號;編號組合組成模塊,用于從上述子集合的編號中隨機選擇編號,以生成多組編號組合,其中,每一組編號組合包含N個不相同的編號;選擇模塊,用于從上述接收的假陽值中選擇其中一個假陽值;數據選取模塊,用于從上述所生成的多組編號組合中選擇其中一組編號組合,從而選取所選擇的組編號組合中包括的編號所對應的子集合中的數據;Boosting算法運算模塊,用于根據上述選取的數據組成一個矩陣,并利用Boosting算法對該矩陣進行運算,從而計算出所選擇的編號組合對應的假陽值;編號組合選取模塊,用于在每一組編號組合都已經計算出其對應的假陽值的情況下,將計算出來的所有假陽值按照大小依次排列,從值小的一端按次序取出n個假陽值,并獲取該n個假陽值對應的n組編號組合;比較模塊,用于將該n個假陽值與上述選擇的假陽值進行比較,以判斷該n個假陽值中的最小值是否小于所選擇的假陽值;及記錄模塊,用于在上述n個假陽值中的最小值小于所選擇的假陽值的情況下,將該n個假陽值中的最小值記錄為該次Boosting運算的假陽值,并記錄該最小值所對應的編號組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鴻富錦精密工業(深圳)有限公司;鴻海精密工業股份有限公司,未經鴻富錦精密工業(深圳)有限公司;鴻海精密工業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010231583.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:發動機進氣氣流控制組件
- 下一篇:大跨度型鋼梁拔桿整體提升施工方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





