[發明專利]一種面向殘疾人大數據的分析方法及系統在審
| 申請號: | 202010149602.9 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111459994A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 潘志文;邢云冰;陳益強;戴連君;張鈞 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/248 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 殘疾 人大 數據 分析 方法 系統 | ||
1.一種面向殘疾人大數據的分析方法,其特征在于,包括如下步驟:
S1、對殘疾人大數據對應數據集進行屬性分解,將所有選擇屬性按照其選項分解為多個判斷屬性,并將連續屬性離散化;然后基于分解后的判斷屬性采用獨熱編碼表示每一條數據,在每條編碼中每個判斷屬性對應一個屬性值,其中,判斷屬性對應的選項被選中的屬性值為1,反之為0,將數據集中所有數據轉換成獨熱編碼形成數據集矩陣;
S2、基于數據集矩陣,為數據集矩陣中屬性值為1的判斷屬性生成規則集合,其中,每個判斷屬性與其他屬性之間生成一條規則;
S3、對數據集矩陣進行回歸分析,依次以一個判斷屬性作為目標屬性,基于關聯規則集合,計算數據集中其他屬性對該目標屬性影響力的權重,所有其他屬性對目標屬性影響力的權重形成該目標屬性的權重集合。
2.根據權利要求1所述的一種面向殘疾人大數據的分析方法,其特征在于,還包括:
S4、將步驟S3中的權重集合進行可視化圖形操作。
3.根據權利要求1所述的一種面向殘疾人大數據的分析方法,其特征在于,采用數據分段的方式將連續屬性離散化。
4.根據權利要求1所述的一種面向殘疾人大數據的分析方法,其特征在于,所述步驟S2包括:
S21、以一個判斷屬性為分析對象,以數據集中該判斷屬性的屬性值為1的所有數據組成該分析對象的數據樣本矩陣;
S22、對數據樣本矩陣中屬性值為1的判斷屬性按照出現頻率進行排序,并通過支持度進行量化,其中,分別計算數據樣本中分析對象以外的每個判斷屬性在該數據樣本矩陣中的支持度以及在數據集矩陣中的支持度,并計算每個判斷屬性在該數據樣本矩陣中的支持度與其在數據集矩陣中的支持度的比值以獲得每個判斷屬性與分析對象之間規則的置信度,將支持度小于支持度閾值或置信度小于置信度閾值的屬性值從數據樣本矩陣中移除;
S23、根據步驟S22中數據集樣本剩余數據構建分析對象的頻繁模式樹,以分析對象以及分析對象的屬性值為1的數據樣本矩陣作為樹的頂層,以分析對象的數據樣本矩陣中的其他屬性及其在數據樣本矩陣中屬性值為1的數據組成的數據矩陣作為樹的第二層,每一個其他屬性對應一個節點;以本次分析對象的數據樣本作為新的數據集矩陣,以第二層節點對應的屬性作為新的分析對象,構建頻繁模式樹的第三層,然后以第三層節點對應的數據矩陣作為新的數據集矩陣構建頻繁模式樹的第四層,依此類推,直到滿足以下任一條件時停止構建頻繁模式樹:頻繁模式樹的高度達到預設要求、所有屬性值為1的屬性都存儲到樹中、在某一層屬性值的支持度低于支持度閾值或置信度低于置信度閾值;其中,支持度閾值和置信度閾值基于歷史數據分析結果預先設置。
S24、基于步驟S23構建的頻繁模式樹,進行規則合并,使每個判斷屬性對應一條規則。
5.根據權利要求4所述的一種面向殘疾人大數據的分析方法,其特征在于,
采用如下方式計算屬性值xjk=1的支持度:
采用如下方式計算屬性值xjk=1的置信度:
其中,T是數據集矩陣,X是由T中所有包含屬性值xuv=1的數據組成的數據樣本矩陣,x是矩陣X內的一行,|x∈X,xjk∈x|是矩陣X中包含屬性值xjk=1的行數,|X|是矩陣X的行數,N是數據集矩陣的行數,是一條規則。
6.根據權利要求1所述的一種面向殘疾人大數據的分析方法,其特征在于,所述步驟S3中,每次以一個判斷屬性為目標屬性,將數據集矩陣中目標屬性對應的列作為自變量集合,數據集矩陣中其他判斷屬性作為一系列因變量集合、以及所有判斷屬性的規則集合作為因變量,其中,自變量集合中的屬性值是目標屬性在數據集矩陣中每一行對應的屬性值集合,對目標屬性進行回歸分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010149602.9/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





