[發明專利]一種基于三支決策的分類器構建方法在審

申請號：	201611170422.9	申請日：	2016-12-16
公開（公告）號：	CN106599924A	公開（公告）日：	2017-04-26
發明（設計）人：	張濤;李林	申請（專利權）人：	北京靈眾博通科技有限公司
主分類號：	G06K9/62	分類號：	G06K9/62
代理公司：	北京遠創理想知識產權代理事務所(普通合伙)11513	代理人：	衛安樂
地址：	100000 北京市海***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于決策分類構建方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種分類器構建方法，特別是關于一種基于三支決策的分類器構建方法。

背景技術

三支決策將傳統的正域和負域二支決策語義拓展為正域、邊界域、負域的三支決策語義，認為在數據信息不充分和獲取數據信息代價較高額情況下，邊界域決策(延遲決策)是一類可行的決策形式。

經典的分類器，都是二支分類器，只考慮接受或者拒絕兩種情況，非此即彼，當信息充分時，二支分類器有很好的分類效果，但在實際應用中，信息常常缺乏精確性和完整性，因此二支分類器就會有較高的誤分率。雖然目前有研究將傳統二支分類器結合三支決策的思想進行改進，但本質上仍然以二支決策分類器為基礎，仍無法克服信息缺乏精確性、完整性及精確度的問題。

發明內容

針對上述問題，本發明的目的是提供一種基于三支決策的分類器構建方法，該方法具有較好的可解釋性，在信息不足或者不完備時，不會硬性的做出判斷，而是做出第三種選擇，即不承諾。

為實現上述目的，本發明采取以下技術方案：一種基于三支決策的分類器構建方法，其特征在于包括以下步驟：1)設論域U＝{x₁,...x_n,...,x_N}，x_n是其中的某一對象，A＝{a₁,...,a_d,...,a_D}是對象的D維特征集合，設V＝{V₁,...,V_d,...,V_D}為對象x_n特征集合A的數值集合，其中為x_n的特征a_d的值，設集合類別X＝{X₁,...,X_k,...,X_K}，表示對象類別；2)將高維數據降維映射到二維平面，降維映射后，每一個數列就表示一個特征，判斷區間也變為一維；3)對于某一測試數據，以該測試數據在各特征上的數值為中心，選取長度r為判斷半徑；4)對于一條待測數據對象x_n，其特征a_d的值為在特征a_d上若以為中心，以長度r為半徑，劃分判斷區間R_d；5)分別計算該判斷區間內屬于不同類別的樣本的數目c_k，0≤c_k≤B，得到在特征a_d上該數據屬于某一類別X_k的概率；6)根據概率判斷測試數據類別，完成分類。

進一步，所述步驟4)中，判斷區間

進一步，所述步驟4)中，判斷區間半徑r的選取過程如下：4.1)將測試數據歸一化后，全部特征的數值都分布在區間[0,1]上，根據實際需求的預設精度，首先將半徑r的初始值r_sta設定為0，步進r_stp為0.01個單位，最大r_end為1；4.2)經步驟4.1)計算后，選出分類最高精度P₁，并且得到該精度下的r值：r＝n₁·0.01，式中，1≤n₁≤100；此時有：n₁·0.01≥(n₁-1)·0.01，且n₁·0.01≥(n₁+1)·0.01；4.3)重設初始值r_sta值和最大r_end：