[發明專利]數據遺漏值的填補系統及方法無效
| 申請號: | 201010579932.8 | 申請日: | 2010-12-02 |
| 公開(公告)號: | CN102486790A | 公開(公告)日: | 2012-06-06 |
| 發明(設計)人: | 曾新穆;謝百恩;蘇家輝;許芝華 | 申請(專利權)人: | 財團法人資訊工業策進會 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F19/28 |
| 代理公司: | 北京中原華和知識產權代理有限責任公司 11019 | 代理人: | 壽寧;張華輝 |
| 地址: | 中國臺灣臺北市大*** | 國省代碼: | 中國臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 遺漏 填補 系統 方法 | ||
1.一種數據遺漏值的填補系統,其特征在于包括:
一儲存單元,其儲存有一數據陣列,該數據陣列包括多個數據列以及多個數據欄,該等數據列包括多個完整數據列與多個缺值數據列,每一缺值數據列包括至少一未知數據;以及
一計算設備,其包括:
一分析程序;及
一處理器,用以讀取并利用該分析程序分析該數據陣列,其中,該處理器從該等完整數據列找出各缺值數據列近似的至少一目標數據列,從其取出至少一已知數據以推算出一預估數據,以取代其個別對應的該等未知數據并作為多個待修正數據,再從該等待修正數據找出一特定待修正數據,以該特定待修正數據所在欄的數據變化趨勢,從該等數據欄中選擇數據變化趨勢近似順序的一第一指定數據欄與一第二指定數據欄,并依據該特定待修正數據所在列的數據,以相同數據為同群方式找出一數據列群組,再依據該數據列群組與該第二指定數據欄的欄組合,以相同數據為同群方式劃分該等數據列為多個子群組,并其中找出數據匹配該數據列群組的至少一目標群組,以利用其對應該特定待修正數據欄的數據推算出一填補數據以填入該特定待修正數據欄,再判斷該特定待修正數據所在列是否有其他待修正數據,以決定是否指定另一特定待修正數據。
2.如權利要求1所述的數據遺漏值的填補系統,其特征在于該處理器是建立每一完整數據列的一完整數據曲線,建立每一缺值數據列的一缺值數據曲線,并比對每一缺值數據曲線與該等完整數據曲線的相似度,以從該等完整數據曲線找出每一缺值數據曲線對應的至少一近似目標數據曲線;以及依據該等缺值數據曲線與各該目標數據曲線的匹對,找出每一缺值數據列近似的至少一最近似目標數據列。
3.如權利要求1所述的數據遺漏值的填補系統,其特征在于該處理器是判斷該子群組中一特定群組的數據列,與該數據列群組中的數據列任一相符時,判斷該特定群組為該目標群組,再指定待修正數據欄為指定數據欄。
4.如權利要求1所述的數據遺漏值的填補系統,其特征在于該等數據列的數據為數值型數據,該填補數據為該至少一目標群組的該指定數據欄中的數值的平均數。
5.如權利要求1所述的數據遺漏值的填補系統,其特征在于該等數據列的數據為類別型數據,該預估數據為其預填入的未知數據欄所屬該缺值數據欄,其對應的該至少一目標數據列的該至少一已知數據中的數據。
6.一種數據遺漏值的填補方法,適用于一數據陣列,該數據陣列包括多個數據列以及多個數據欄,其特征在于該方法包括:
從該數據陣列中找出多個完整數據列與多個缺值數據列,每一缺值數據列包括至少一未知數據;
從該等完整數據列中分別為每一缺值數據列取出近似的至少一目標數據列;
依據每一未知數據于所屬該缺值數據列的欄位置,從該缺值數據列對應的該至少一目標數據列取得至少一已知數據,并利用該至少一已知數據推算出一預估數據;
將該等預估數據取代其個別對應的該等未知數據,以作為多個待修正數據;
從該等待修正數據中指定一特定待修正數據,該特定待修正數據所在列為一修正數據列;
依據該特定待修正數據所在欄的數據變化趨勢,從該等數據欄中選擇數據變化趨勢近似的一第一指定數據欄,并依據該特定待修正數據所在列的數據,以相同數據為同群方式找出一數據列群組;
從該等數據欄中選擇與該特定待修正數據所在欄數據變化趨勢第二近似的一第二指定數據欄,依據該特定待修正數據所在欄與第二指定數據欄的欄組合,依該組合以相同數據為同群方式劃分該等數據列為多個子群組;
從該等子群組找出數據匹配該數據列群組的少一目標群組,以利用該至少一目標群組對應該特定待修正數據欄的數據推算出一填補數據以填入該特定待修正數據之欄;以及
判斷該特定待修正數據所在列是否有其他待修正數據,以決定是否指定另一特定待修正數據。
7.如權利要求6所述的數據遺漏值的填補方法,其特征在于從該等完整數據列中分別為取出每一缺值數據列取出近似的至少一目標數據列的該步驟包括:
建立每一完整數據列一完整數據曲線;
建立每一缺值數據列一缺值數據曲線:
比對每一缺值數據曲線與該等完整數據曲線的相似度,以從該等完整數據曲線找出每一缺值數據曲線對應的至少一近似目標數據曲線;以及
依據該等缺值數據曲線與各該目標數據曲線的匹對,找出每一缺值數據列近似的至少一最近似目標數據列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于財團法人資訊工業策進會,未經財團法人資訊工業策進會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010579932.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





