[發(fā)明專利]基于鄰域粗糙集和PCA融合的數(shù)據(jù)分類預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710237405.0 | 申請(qǐng)日: | 2017-04-12 |
| 公開(公告)號(hào): | CN107016416B | 公開(公告)日: | 2021-02-12 |
| 發(fā)明(設(shè)計(jì))人: | 王國(guó)胤;董建華;尚明生;嚴(yán)胡勇;王浩林;鄭志浩;史曉雨 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)院重慶綠色智能技術(shù)研究院 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 上海光華專利事務(wù)所(普通合伙) 31219 | 代理人: | 尹麗云 |
| 地址: | 400714 *** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 鄰域 粗糙 pca 融合 數(shù)據(jù) 分類 預(yù)測(cè) 方法 | ||
本發(fā)明提供一種基于鄰域粗糙集和PCA融合的數(shù)據(jù)分類預(yù)測(cè)方法,包括采集樣本數(shù)據(jù),形成樣本數(shù)據(jù)集;根據(jù)樣本數(shù)據(jù)集,計(jì)算鄰域粗糙集權(quán)重向量和主成分權(quán)重向量;通過對(duì)所述鄰域粗糙集權(quán)重向量和主成分權(quán)重向量進(jìn)行融合,獲取融合后的權(quán)重向量,并對(duì)數(shù)據(jù)進(jìn)行分類和預(yù)測(cè);本發(fā)明中的基于鄰域粗糙集和PCA融合的數(shù)據(jù)分類預(yù)測(cè)方法,通過將鄰域粗糙集權(quán)重和PCA權(quán)重融合,可以有效解決現(xiàn)有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)數(shù)據(jù)分類處理能力不足問題,通過對(duì)樣本數(shù)據(jù)集進(jìn)行數(shù)據(jù)決策評(píng)價(jià),為計(jì)算機(jī)數(shù)據(jù)處理系統(tǒng)能夠挖掘更加有價(jià)值的知識(shí)提供了基礎(chǔ)。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)數(shù)據(jù)處理領(lǐng)域,尤其涉及一種基于鄰域粗糙集和PCA融合的數(shù)據(jù)分類預(yù)測(cè)方法。
背景技術(shù)
近年來,信息化產(chǎn)業(yè)發(fā)展迅速,隨著云時(shí)代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關(guān)注,大數(shù)據(jù)并不在“大”,而在于“有用”,因此對(duì)大數(shù)據(jù)價(jià)值的挖掘比數(shù)量更為重要,如何在有限的時(shí)間范圍內(nèi)對(duì)數(shù)據(jù)進(jìn)行處理、分析,進(jìn)而獲得更多的知識(shí),是當(dāng)前計(jì)算機(jī)數(shù)據(jù)處理系統(tǒng)所面臨的嚴(yán)重挑戰(zhàn)。
由于信息的不確定性普遍存在,因此數(shù)據(jù)分類是機(jī)器學(xué)習(xí)的基本任務(wù),是圖像視覺分析、文本分析、語音識(shí)別、輿情預(yù)警別等領(lǐng)域的基礎(chǔ)工作。數(shù)據(jù)分類包含兩種形式,即:監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)。粗糙集理論是一種處理不確定性信息的數(shù)學(xué)工具,與概率論、模糊集等其他處理不確定性問題的理論和方法相比,是一種監(jiān)督學(xué)習(xí),對(duì)問題的描述和處理更傾向于符合決策屬性,能更好地描述實(shí)際問題中屬性值對(duì)決策屬性具有某種偏好的特性,并且,現(xiàn)實(shí)應(yīng)用中,數(shù)據(jù)缺失現(xiàn)象經(jīng)常發(fā)生,不完備信息的決策受到了越來越廣泛的重視,成為智能信息處理的重要研究?jī)?nèi)容。盡管現(xiàn)有技術(shù)中有很多方案分別從信息學(xué)角度提出了眾多評(píng)價(jià)、預(yù)測(cè)方法,但是都存在一些問題,比如通常需要完備的數(shù)據(jù)集、評(píng)價(jià)方法中參數(shù)的率定人為因素較強(qiáng)、評(píng)價(jià)過程中需要大量參數(shù)、面向不同的對(duì)象評(píng)價(jià)結(jié)果適用性差等等。基于粗糙集的數(shù)據(jù)評(píng)價(jià)則只能給予某種級(jí)別的評(píng)判,在不同樣本數(shù)據(jù)的定量化比較方面不如主成分分析。因此,亟需一種新的技術(shù)手段,能夠克服上述技術(shù)問題,以形成相對(duì)完整、一致的評(píng)價(jià)描述,從而實(shí)現(xiàn)更加準(zhǔn)確的識(shí)別和判斷。
發(fā)明內(nèi)容
鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明提供一種基于鄰域粗糙集和PCA融合的數(shù)據(jù)分類預(yù)測(cè)方法,以解決上述技術(shù)問題。
本發(fā)明提供的一種基于鄰域粗糙集和PCA融合的數(shù)據(jù)分類預(yù)測(cè)方法,包括:
采集樣本數(shù)據(jù),形成樣本數(shù)據(jù)集S;
根據(jù)樣本數(shù)據(jù)集,計(jì)算鄰域粗糙集權(quán)重向量和主成分權(quán)重向量;
通過對(duì)所述鄰域粗糙集權(quán)重向量和主成分權(quán)重向量進(jìn)行融合,獲取融合后的權(quán)重向量,形成新樣本數(shù)據(jù)集S’,并對(duì)原數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)。
進(jìn)一步,通過如下公式對(duì)所述鄰域粗糙集權(quán)重向量和主成分權(quán)重向量進(jìn)行融合,獲取融合后的權(quán)重向量:
其中,1/(k-1)為歸一化因子,m(Ai)為合成權(quán)重,R(Ai)為鄰域粗糙集權(quán)重向量中第i個(gè)鄰域粗糙集權(quán)重,P(Ai)為主成分權(quán)重向量中第i個(gè)主成分權(quán)重。
如果K≠1,則融合后的權(quán)重構(gòu)成權(quán)重分配向量,若K=1,則不存在融合后的權(quán)重向量。
融合后的權(quán)重向量D=m(A1),m(A2),…,m(Am),i=1,2……m。
進(jìn)一步,根據(jù)所述融合后的權(quán)重向量,通過如下步驟構(gòu)造新樣本數(shù)據(jù)集S’,
進(jìn)一步,所述新樣本數(shù)據(jù)集S’通過如下步驟獲取:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院重慶綠色智能技術(shù)研究院,未經(jīng)中國(guó)科學(xué)院重慶綠色智能技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710237405.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種防止翻車的快遞車
- 下一篇:平視顯示器
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





