[發明專利]隨機森林模型的轉換方法及裝置有效
| 申請號: | 201610045227.7 | 申請日: | 2016-01-22 |
| 公開(公告)號: | CN106997330B | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 黃振 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F17/10 | 分類號: | G06F17/10 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 馬佑平;楊國權 |
| 地址: | 310051 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 隨機 森林 模型 轉換 方法 裝置 | ||
本發明公開了一種隨機森林模型的轉換方法及裝置。其中,該方法包括:將隨機森林模型中包含的每棵決策樹進行邏輯表達式轉換,得到每棵決策樹對應的等價邏輯表達式集;將所有決策樹的等價邏輯表達式集進行合并,得到隨機森林模型對應的等價邏輯表達式集,其中,隨機森林模型對應的等價邏輯表達式集為隨機森林的等價轉換形式。本發明解決了由于相關技術中隨機森林模型內部規則不可知造成的隨機森林算法在商務智能應用中受限的技術問題。
技術領域
本發明涉及計算機領域,具體而言,涉及一種隨機森林模型的轉換方法及裝置。
背景技術
在商務智能等涉及業務分析的場景中,如銀行防詐騙分析、電信用戶流失分析等場景中,決策樹受到業務人員的普遍歡迎。通過決策樹,不僅能從業務數據中挖掘出有效的、可能連業務人員也無法意識到的有效規則,而且更重要的,它還能通過業務語言展示這些規則,以便于業務人員結合自己的業務經驗,判斷決策樹所提煉出來的規則的合理性,并進一步判斷是否采用該規則。
但是,隨著數據規模和類型的大幅增長,大數據時代已經到來。面對如此之多的數據,決策樹的劣勢就顯現出來。首先,決策樹不適合基于大規模數據的計算,因為決策樹無法做到并行化,從而導致計算非常緩慢以致不可接受;其次,決策樹不適合基于超多維度的計算,容易導致深度決策樹計算非常緩慢,甚至會很容易出現過擬合現象。在這種背景下,隨機森林算法的價值被學術界和工業界所認識。隨機森林算法通過抽樣生成多棵決策樹,然后用組合投票的方式生成決策結果,不僅有效地避免了過擬合的問題,提高了推廣使用能力。更重要的是,它天然地適用于分布式計算方式,提高了數據處理能力。
但是,對商務智能來說,隨機森林模型有比較大的問題,這在一定程度上限制了隨機森林算法在商務智能中的推廣使用,那就是目前的隨機森林模型是一個黑匣子模型,業務人員無法了解其結果是如何輸出的,不知道其內在的規則是什么。如果業務人員無法知道其內在規則,將導致業務人員不敢輕易采用其輸出結果,無法結合業務經驗檢查其規則的合理性。
針對上述的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種隨機森林模型的轉換方法及裝置,以至少解決由于相關技術中隨機森林模型內部規則不可知造成的隨機森林算法在商務智能應用中受限的技術問題。
根據本發明實施例的一個方面,提供了一種隨機森林模型的轉換方法,包括:將隨機森林模型中包含的每棵決策樹進行邏輯表達式轉換,得到每棵決策樹對應的等價邏輯表達式集;將所有決策樹的等價邏輯表達式集進行合并,得到上述隨機森林模型對應的等價邏輯表達式集,其中,上述隨機森林模型對應的等價邏輯表達式集為上述隨機森林模型的等價轉換形式。
進一步地,將隨機森林模型中包含的每棵決策樹進行邏輯表達式轉換,得到每棵決策樹對應的等價邏輯表達式集包括:獲取上述隨機森林模型中包含的任意一棵決策樹;以獲取的決策樹的根節點為起點,通過遍歷該決策樹來依次訪問該決策樹的每個葉節點;將從上述根節點到上述每個葉節點之間的路徑轉換成各路徑對應的等價邏輯表達式;將上述各路徑對應的等價邏輯表達式存儲在表達式集中以得到該決策樹的等價邏輯表達式集。
進一步地,由上述每棵決策樹對應的等價邏輯表達式集構成上述隨機森林模型中包含的所有決策樹的等價邏輯表達式集的集合,其中,將所有決策樹的等價邏輯表達式集進行合并,得到上述隨機森林模型對應的等價邏輯表達式集包括:從上述集合中包含的所有等價邏輯表達式集中任意選出兩個等價邏輯表達式集;對選中的兩個等價邏輯表達式集進行合并,得到一個新的等價邏輯表達式集;更新上述集合,得到更新后的集合,其中,該步驟包括:將新得到的等價邏輯表達式集存儲到更新前的集合中,同時從上述更新前的集合中刪除上述選中的兩個等價邏輯表達式集;繼續從上述更新后的集合中選出兩個等價邏輯表達式集進行合并,直到等價邏輯表達式集的集合中只有一個等價邏輯表達式集為止,其中,當等價邏輯表達式集的集合中只有一個等價邏輯表達式集時,該等價邏輯表達式集為上述隨機森林模型對應的等價邏輯表達式集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610045227.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:炫彩球運動專用的系列便攜式器械
- 下一篇:一種改進的棋盒





