[發明專利]一種基于三支決策的分類器構建方法在審
| 申請號: | 201611170422.9 | 申請日: | 2016-12-16 |
| 公開(公告)號: | CN106599924A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 張濤;李林 | 申請(專利權)人: | 北京靈眾博通科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京遠創理想知識產權代理事務所(普通合伙)11513 | 代理人: | 衛安樂 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 決策 分類 構建 方法 | ||
技術領域
本發明涉及一種分類器構建方法,特別是關于一種基于三支決策的分類器構建方法。
背景技術
三支決策將傳統的正域和負域二支決策語義拓展為正域、邊界域、負域的三支決策語義,認為在數據信息不充分和獲取數據信息代價較高額情況下,邊界域決策(延遲決策)是一類可行的決策形式。
經典的分類器,都是二支分類器,只考慮接受或者拒絕兩種情況,非此即彼,當信息充分時,二支分類器有很好的分類效果,但在實際應用中,信息常常缺乏精確性和完整性,因此二支分類器就會有較高的誤分率。雖然目前有研究將傳統二支分類器結合三支決策的思想進行改進,但本質上仍然以二支決策分類器為基礎,仍無法克服信息缺乏精確性、完整性及精確度的問題。
發明內容
針對上述問題,本發明的目的是提供一種基于三支決策的分類器構建方法,該方法具有較好的可解釋性,在信息不足或者不完備時,不會硬性的做出判斷,而是做出第三種選擇,即不承諾。
為實現上述目的,本發明采取以下技術方案:一種基于三支決策的分類器構建方法,其特征在于包括以下步驟:1)設論域U={x1,...xn,...,xN},xn是其中的某一對象,A={a1,...,ad,...,aD}是對象的D維特征集合,設V={V1,...,Vd,...,VD}為對象xn特征集合A的數值集合,其中為xn的特征ad的值,設集合類別X={X1,...,Xk,...,XK},表示對象類別;2)將高維數據降維映射到二維平面,降維映射后,每一個數列就表示一個特征,判斷區間也變為一維;3)對于某一測試數據,以該測試數據在各特征上的數值為中心,選取長度r為判斷半徑;4)對于一條待測數據對象xn,其特征ad的值為在特征ad上若以為中心,以長度r為半徑,劃分判斷區間Rd;5)分別計算該判斷區間內屬于不同類別的樣本的數目ck,0≤ck≤B,得到在特征ad上該數據屬于某一類別Xk的概率;6)根據概率判斷測試數據類別,完成分類。
進一步,所述步驟4)中,判斷區間
進一步,所述步驟4)中,判斷區間半徑r的選取過程如下:4.1)將測試數據歸一化后,全部特征的數值都分布在區間[0,1]上,根據實際需求的預設精度,首 先將半徑r的初始值rsta設定為0,步進rstp為0.01個單位,最大rend為1;4.2)經步驟4.1)計算后,選出分類最高精度P1,并且得到該精度下的r值:r=n1·0.01,式中,1≤n1≤100;此時有:n1·0.01≥(n1-1)·0.01,且n1·0.01≥(n1+1)·0.01;4.3)重設初始值rsta值和最大rend:
4.4)經步驟4.3)計算后,得出分類最高精度P2,如果有P2>P1,則此時:
r=(n1-1)·0.01+n2·0.001;4.5)根據上述步驟進行迭代,直至Pi+1≤Pi結束,得到最高分類精度Pi和此時半徑:
進一步,所述步驟5)中,在特征ad上該數據屬于某一類別Xk的概率為:
式中,B為判斷區間內所有類別樣本總數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京靈眾博通科技有限公司,未經北京靈眾博通科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611170422.9/2.html,轉載請聲明來源鉆瓜專利網。





