[發明專利]一種針對XML文件的數據自適應融合方法有效
| 申請號: | 201910184557.8 | 申請日: | 2019-03-12 |
| 公開(公告)號: | CN109977269B | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 宮琳;王晉意;洪澤華;陳西;高俊;楊奧 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F16/83 | 分類號: | G06F16/83 |
| 代理公司: | 北京理工大學專利中心 11120 | 代理人: | 李微微;仇蕾安 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 xml 文件 數據 自適應 融合 方法 | ||
1.一種針對XML文件的數據自適應融合方法,其特征在于,包括如下步驟:
步驟1、針對XML格式的待處理數據,在數據融合的歷史記錄中找到與待處理數據相似度大于設定閾值的一系列同類型文檔,組成相似文檔集合;
步驟2、根據數據融合方法本身適用的數據類型和待處理數據本身的數據類型,為待處理數據選擇一系列可處理該數據的融合方法;
步驟3、針對步驟2確定的每一種融合方法,讀取該融合方法資料,確定該融合方法理論上適用于處理的文檔數據;
步驟4、計算待處理數據與步驟3確定的文檔數據之間的相似度;
步驟5、針對步驟1組成的相似文檔集合,計算步驟3的每一種融合方法被相似文檔集合中所有文檔所使用的方法推薦度;將該方法推薦度與步驟4計算的相似度相乘,得到一種融合方法對應的優先度;
步驟6、采用步驟3至步驟5的方法,遍歷步驟2選擇的每一種融合方法,得到各融合方法對應的優先度;
步驟7、將步驟6獲得的所有優先度進行降序排列;取其中排序靠前的設定數量的融合方法;
步驟8、針對步驟7選取的每一個融合方法,在歷史記錄中調取各融合方法處理過的與待處理數據同類型歷史文檔;同時確定每一個融合方法理論上適用的文檔;將所有融合方法對應的同類型歷史文檔與理論上適用的文檔組成文檔合集;
步驟9、確定待處理數據的業務需求和步驟8的文檔集合中各文檔的業務需求;
步驟10、從文檔合集中選擇與待處理數據的業務需求最相似的一部分文檔,再確定這些文檔使用次數最多的一種融合方法,即為待處理數據最終選擇的融合方法。
2.如權利要求1所述的一種針對XML文件的數據自適應融合方法,其特征在于,所述步驟10中,當這些文檔使用次數最多的融合方法不止一種的情況下,在本步驟中選擇最相似的一部分文檔時,增加選擇的文檔的數量。
3.如權利要求1所述的一種針對XML文件的數據自適應融合方法,其特征在于,所述步驟1和4中,計算相似度時,采用相同的方式提取待處理數據和同類型文檔的特征,根據兩者之間的特征匹配度確定相似度。
4.如權利要求3所述的一種針對XML文件的數據自適應融合方法,其特征在于,所述相似度的計算公式為:
其中,α1表示當前文檔A與同類型文檔Bi之間的可比較特征中數值型特征所占的比例,α2表示A與Bi之間的可比較特征中文字型特征所占的比例;n表示當前文檔A與同類型文檔Bi之間的可比較特征中數值型特征的個數,ai、bi和bj分別表示A與Bi對應于某一數值型特征的取值歸一化后的結果;m表示當前文檔A與同類型文檔Bi之間的可比較特征中文字型特征的個數,ck和dk分別表示A與Bi對應于某一文字型特征的取值;count(ck=dk)為計數函數,即從k的值為1到m的過程中,當ck=dk時,count(ck=dk)=1。
5.如權利要求4所述的一種針對XML文件的數據自適應融合方法,其特征在于,所述設定閾值為0.5。
6.如權利要求3所述的一種針對XML文件的數據自適應融合方法,其特征在于,提取待處理數據特征的方法為,先建立特征模板庫,具體為:
(1)確定模板適用對象,說明該模板適用的數據類型;
(2)確定特征提取結構,說明該模板的結構形式;
(3)確定特征關鍵詞,說明關鍵詞的類別與在模板中的位置;
(4)確定關鍵詞詞庫,說明與模板中關鍵詞的對應關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910184557.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





