[發明專利]一種針對XML文件的數據自適應融合方法有效
| 申請號: | 201910184557.8 | 申請日: | 2019-03-12 |
| 公開(公告)號: | CN109977269B | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 宮琳;王晉意;洪澤華;陳西;高俊;楊奧 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F16/83 | 分類號: | G06F16/83 |
| 代理公司: | 北京理工大學專利中心 11120 | 代理人: | 李微微;仇蕾安 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 xml 文件 數據 自適應 融合 方法 | ||
本發明公開了一種針對XML文件的數據自適應融合方法,可以避免人工分析數據特點導致的時間較長、受經驗約束較大、準確性較低等問題;在分析過程中綜合考慮了歷史記錄、專家知識與實際業務需求三方面因素,既保證了數據處理方法的可靠性,又保證數據處理方法貼合實際需求。
技術領域
本發明屬于數據處理技術領域,具體涉及一種針對XML文件的數據自適應融合方法。
背景技術
隨著科學技術的發展,人類社會積累的數據量越來愈大,數據來源也越來越多。數據融合是一種可以綜合利用不同來源的數據、吸取不同數據源的特點、最終給出比單一數據源更加完整結果的數據處理方法。隨著相關研究的深入,數據融合的方法日益豐富,在處理具體數據時采用何種方法成為困擾數據處理人員的難題。傳統的做法是數據處理人員根據自身已有的經驗、專家知識等進行處理。這樣的做法不僅效率低下,而且準確率不高,嚴重制約了數據融合過程的速度、結果的精度。特別是在業務過程對數據融合的速度、精度等提出特別要求的時候,數據處理人員往往需要嘗試各種方法才能滿足指定要求。因此迫切需要一種數據自適應融合方法,不僅可以結合已有經驗、專家知識,還能在綜合考慮業務需求的基礎上為待處理數據選擇合適的數據融合方法。
發明內容
有鑒于此,本發明的目的是提供一種針對XML文件的數據自適應融合方法,可以保證據處理方法的可靠性,又保證數據處理方法貼合實際需求。
一種針對XML文件的數據自適應融合方法,包括如下步驟:
步驟1、針對XML格式的待處理數據,在數據融合的歷史記錄中找到與待處理數據相似度大于設定閾值的一系列同類型文檔,組成相似文檔集合;
步驟2、根據數據融合方法本身適用的數據類型和待處理數據本身的數據類型,為待處理數據選擇一系列可處理該數據的融合方法;
步驟3、針對步驟2確定的每一種融合方法,讀取該融合方法資料,確定該融合方法理論上適用于處理的文檔數據;
步驟4、計算待處理數據與步驟3確定的文檔數據之間的相似度;
步驟5、針對步驟1組成的相似文檔集合,計算步驟3的每一種融合方法被相似文檔集合中所有文檔所使用的方法推薦度;將該方法推薦度與步驟4計算的相似度相乘,得到一種融合方法對應的優先度;
步驟6、采用步驟3至步驟5的方法,遍歷步驟2選擇的每一種融合方法,得到各融合方法對應的優先度;
步驟7、將步驟6獲得的所有優先度進行降序排列;取其中排序靠前的設定數量的融合方法;
步驟8、針對步驟7選取的每一個融合方法,在歷史記錄中調取各融合方法處理過的與待處理數據同類型歷史文檔;同時確定每一個融合方法理論上適用的文檔;將所有融合方法對應的同類型歷史文檔與理論上適用的文檔組成文檔合集;
步驟9、確定待處理數據的業務需求和步驟8的文檔集合中各文檔的業務需求;
步驟10、從文檔合集中選擇與待處理數據的業務需求最相似的一部分文檔,再確定這些文檔使用次數最多的一種融合方法,即為待處理數據最終選擇的融合方法。
進一步的,所述步驟10中,當這些文檔使用次數最多的融合方法不止一種的情況下,在本步驟中選擇最相似的一部分文檔時,增加選擇的文檔的數量。
較佳的,所述步驟1和4中,計算相似度時,采用相同的方式提取待處理數據和同類型文檔的特征,根據兩者之間的特征匹配度確定相似度。
較佳的,所述相似度的計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910184557.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





