[發明專利]一種基于不確定性支持向量機的數據模型比較方法有效
| 申請號: | 202110237422.0 | 申請日: | 2021-03-04 |
| 公開(公告)號: | CN112598340B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 余志強;陳琛;周群博;王晨;宋亮;陳振宇 | 申請(專利權)人: | 成都飛機工業(集團)有限責任公司;清華四川能源互聯網研究院 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06K9/62;G06N20/10 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 徐靜 |
| 地址: | 610091 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 不確定性 支持 向量 數據模型 比較 方法 | ||
本發明公開了一種基于不確定性支持向量機的數據模型比較方法,通過構建高維度數據模型,將不確定性參數引入支持向量機分類模型的訓練,從而提升對本體數據模型的辨識和比較效率及準確率,最終實現高效數據集成。本發明采用了支持向量機機器學習方法,開展數據本體模型的快速分類。通過引入不確定性參數,避免了數據模型由于不同部門、不同責任主體之間的管理差異和不確定因素產生噪音干擾分類模型的正常運行。本發明同時兼顧線性分類和基于核函數的非線性分類,對不同的應用場景有較強的適應性。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種基于不確定性支持向量機的數據模型比較方法。
背景技術
許多大型企業由于信息化規劃及建設的遺留問題,過去的系統都是完全依據各個業務板塊的需求來設計建設的,整體的規劃較弱,沒有考慮是否與其它系統的功能或數據存在重復的問題,而且各個系統由不同的廠商和產品搭建,導致存在各業務部門數據模型不統一,部門之間數據定義矛盾或者相互混淆的情況,影響部門間及不同系統間數據交換,導致數據共享比較困難。在企業數據集成建設的工作中,傳統上是基于人工對照的方式,對不同系統的數據模型進行比較判斷,成本居高不下,無法應對越來越復雜的業務集成要求。因此,迫切需要一種更加快速高效的方式,對不同業務域的數據模型定義進行自動比較。
發明內容
為了解決上述問題,本發明提出一種基于不確定性支持向量機的數據模型比較方法,通過構建高維度數據模型,將不確定性參數引入支持向量機分類模型的訓練,從而提升對本體數據模型的辨識和比較效率及準確率,最終實現高效數據集成。
本發明的一種基于不確定性支持向量機的數據模型比較方法,包括以下步驟:
S1. 收集流程數據,通過構建數據流圖,以業務處理過程為中心,描述完整的業務和數據流程;所述數據流圖能夠根據需要進行分層繪制;
S2. 提取所述數據流圖信息,獲得包括數據來源、數據消費者、模型負責人、所屬部門和/或考核績效在內的業務信息;
S3. 構建包括多個特征值的高維度數據模型,所有特征值均伴隨一個不確定性參數,用以表達可能存在的無法準確獲取該特征值的情況;將特征值與其對應的不確定性參數組合,形成
S4. 進行本體數據模型識別,形成訓練數據集標簽;
S5. 基于本體數據模型識別結果,運用支持向量機分類模型進行訓練和驗證;
S6. 運用訓練完成的支持向量機分類模型進行本體數據模型分類,將劃分為同類的結果進行確認,確認后對本體數據模型中的不同項目進行統一修改,為系統集成和邏輯模型關聯提供支撐。
進一步的,步驟S1中,業務和數據流程的核心組成部分為業務活動和數據流向,包括:
數據輸入,即為當前業務活動所需的、來源于上游業務活動的信息;
數據輸出,即為當前業務活動產生的或改變的信息,供下游業務活動使用;
當前業務活動的所有者、責任人或部門信息;
當前業務活動的管理控制信息,包括當前業務活動所對應的績效KPI。
進一步的,步驟S2中,所涉及的流程和相關部門設定有唯一的流程ID和部門ID,以確保沿所有數據流方向上,盡可能多的ID都是遞增的;同時,參考數據定義、數據管理部門的相關數據信息,將流程與數據信息結合,協同構建高維度數據模型。
進一步的,步驟S3中,所述特征值包括數據存量、數據增量、更新頻率、數據來源、數據流向、數據所有者、所屬部門、績效指標、命名、編碼和/或數據類型。
進一步的,步驟S3中,不確定性參數的計算方法如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都飛機工業(集團)有限責任公司;清華四川能源互聯網研究院,未經成都飛機工業(集團)有限責任公司;清華四川能源互聯網研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110237422.0/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





