[發明專利]偏好代價敏感決策樹構造方法在審
| 申請號: | 201510277512.7 | 申請日: | 2015-05-27 |
| 公開(公告)號: | CN104850892A | 公開(公告)日: | 2015-08-19 |
| 發明(設計)人: | 袁鼎榮;周美琴;陳詩旭;馬順;劉令強;展雪梅;李艷紅 | 申請(專利權)人: | 廣西師范大學 |
| 主分類號: | G06N5/04 | 分類號: | G06N5/04 |
| 代理公司: | 桂林市持衡專利商標事務所有限公司 45107 | 代理人: | 陳躍琳 |
| 地址: | 541004 廣*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 偏好 代價 敏感 決策樹 構造 方法 | ||
技術領域
本發明涉及人工智能領域,具體涉及一種偏好代價敏感決策樹構造方法。
背景技術
決策樹決策方法是機器學習領域中的重要問題。早期的決策樹模型以ID3為代表,側重于分裂屬性選擇方法和優化剪枝策略兩方面的研究,并取得了長足的發展和廣泛的應用。初期的決策樹方法研究大多以提高分類精確性為最高目標,最大限度地減少誤分類,忽略了不同分類可能引起的代價問題。比如一只羊被錯誤地分入一群狼中可能的代價只是損失一只羊,而一只狼被錯誤地分入一群羊中可能的代價則是損失一群羊,因此Elkan等提出代價敏感決策樹問題。代價敏感問題在考慮分類精確性的同時,充分考慮不同分類可能帶來的代價大小,并且以最小代價為最高目標。但由于代價敏感問題的代價矩陣主要由專家給定,任何專家都摻雜一定主觀因素,存在個人偏好。比如診斷感冒病人時,醫生A偏好讓病人多喝水,而醫生B偏好讓病人吃藥,我們在考慮代價問題的同時,在決策過程中還需要考慮偏好可能帶來的影響。基于這種應用需求,本發明提出偏好代價敏感決策樹構造方法。
發明內容
本發明所要解決的技術問題是決策過程中個人主觀偏好對決策樹所形成的影響,提供一種偏好代價敏感決策樹構造方法。
為解決上述問題,本發明是通過以下技術方案實現的:
一種偏好代價敏感決策樹構造方法,包括如下步驟:
步驟1.用戶根據自己的偏好設置偏好類、偏好度和偏好代價矩陣;
步驟2.遍歷輸入的訓練樣本集的候選屬性列表,并計算每個候選屬性的分裂屬性選擇因子;
步驟3.選擇具有最大分裂屬性選擇因子的候選屬性作為偏好代價敏感決策樹的擴展結點;
步驟4.對應于具有最大分裂屬性選擇因子的候選屬性的每一個屬性值,在結點下生成一個分支;每個分支的樣本集合為所有屬性值等于對應分支的訓練樣本,這樣訓練樣本集就被分為j個子集,上述j為屬性值的個數;
步驟5.將每個子集Sj作為新的訓練樣本集,并循環執行步驟2-5,直至在一個結點中的所有樣本為空或屬于相同的類屬性。
步驟1中,偏好代價矩陣的設置過程如下:
設訓練數據集T中有m個不同的類別標識l1,l2,...,lm,定義其偏好代價矩陣C為:
C=(cij)
其中,cij表示偏好代價矩陣的元素,i∈{1,2,......,m},j∈{1,2,......,m};
當i=j時,表示lj被正確分類,此時cij=0;
當i≠j時,表示lj被錯誤分類,錯誤分類又分下面兩種情況:
當li為非偏好類時,此時cij=1,只表示產生一次錯誤分類;
當li為偏好類時,此時cij的值為預先給出的偏好代價值。
步驟2中,候選屬性A的分裂屬性選擇因子ASF(A)為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西師范大學,未經廣西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510277512.7/2.html,轉載請聲明來源鉆瓜專利網。





