[發明專利]一種基于一階邏輯和神經網絡的數據對應方法有效
| 申請號: | 201210211474.1 | 申請日: | 2012-06-26 |
| 公開(公告)號: | CN102799627A | 公開(公告)日: | 2012-11-28 |
| 發明(設計)人: | 黃少濱;劉國峰;樸秀峰;申林山;劉剛;劉建華 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 一階 邏輯 神經網絡 數據 對應 方法 | ||
1.一種基于一階邏輯和神經網絡的數據對應方法,其特征在于,包括如下步驟:
(1)分析已完成匹配的數據模式,建立待匹配模式的表和字段形式的格式;
(2)將選擇訓練的模式轉換為表向量,存放在待匹配表訓練集合中,包括表名、正樣本數據、負樣本數據和斷言集合;
(3)使用一階邏輯的表特征提取算法對集合中的表進行特征提??;
(4)存儲提取的表的特征;
(5)使用提取的表的特征字段對待匹配模式中的待匹配表進行匹配;
(6)通過生成反饋的神經網絡算法對已完成匹配的模式中的字段進行訓練,修正字段的表示形式和建立的神經網絡;
(7)使用訓練好的神經網絡和修正后的字段表示格式,對已完成匹配的表進行字段匹配。
2.根據權利要求1所述的一種基于一階邏輯和神經網絡的數據對應方法,其特征在于,所述表的格式形式化為一個六元組:
T=(N,Ne,K,Ke,Sc,D),其中N為表名,Ne為表名的中文解釋,K為主鍵,Ke為主鍵的中文含義,Sc為除主鍵之外的各個字段的名稱和中文含義的集合,D為當前表中數據量的大?。?/p>
對于表中字段采用十六元組:
Tattribute=(DL,LE,PR,CT,NT,DT,PK,FK,NU,CV,DF,Max,Min,Ave,Var,StaDev),其中,DL為字段名的長度,LE為數據的長度,Pr為數據的精度,CT為字符類型,NT為數字類型,DT為日期類型,PK為主鍵,FK為外鍵,NU為是否為空,CV為唯一性約束,DF為默認值,Max為數據最大值,Min為數據最小值,Ave為數據平均值,Var為數據方差,StaDev為數據標準差。
3.根據權利要求1或2所述的一種基于一階邏輯和神經網絡的數據對應方法,其特征在于,所述對待匹配模式中的待匹配表進行匹配的具體步驟包括:
(1)提取待匹配模式中表的表名以及表中含有的字段名;
(2)順序遍歷提取的表名和字段名,在遍歷的過程中,查找表規則集合,檢索是否有表滿足其中的規則,如果滿足其規則,則將該表與表規則中的表進行匹配,標記已完成匹配的表;
(3)繼續遍歷,直到所有表都遍歷完成為止,反饋匹配結果。
4.根據權利要求3所述的一種基于一階邏輯和神經網絡的數據對應方法,其特征在于,所述生成反饋的神經網絡算法包括如下步驟:
(1)構建初始的生成反饋網絡,其輸入層的神經元的個數為N,輸出層神經元個數為M;
(2)對生成反饋網絡中的各個參數進行賦值,包括對其學習率r、網絡的權重值w和每個單元的偏倚值θ,其中網絡的學習率的r的取值范圍為(0.0≤r≤1.0),網絡權重w和每個單元的偏倚θ的取值范圍分別為-1.0≤w≤1.0和-1.0≤θ≤1.0;
(3)對構建的生成反饋網絡進行正向和逆向誤差傳播,同時修正權值和偏倚值;
(4)將訓練數據集輸入到神經網絡使用生成反饋的神經網絡算法對網絡中的節點和連接進行剪枝操作,同時對字段的初始十六元組形式進行修正。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210211474.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種平行式裝載型夾持裝置
- 下一篇:圓柱狀巖石試樣描量儀





