[發明專利]一種基于自組織映射神經網絡的異構數據屬性關聯方法有效
| 申請號: | 202010690533.2 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN112015854B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 錢玉潔;張紫薇;張杰 | 申請(專利權)人: | 河海大學常州校區 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/36;G06N3/088 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 丁濤 |
| 地址: | 213022 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 組織 映射 神經網絡 數據 屬性 關聯 方法 | ||
本發明公開了一種基于自組織映射神經網絡的異構數據屬性關聯方法,可在多個異構數據庫中,通過匹配實體進行屬性關聯。首先,以輸入的待匹配屬性為輸出神經元,以首個數據庫的所有屬性為輸入神經元,根據神經元的匹配度,選擇一個獲勝神經元。之后,以獲勝神經元領域函數范圍內所有神經元為輸出神經元,以下一個數據庫的所有屬性為輸入神經元,進行自組織迭代。此時,需計算獲勝神經元的領域函數,根據領域函數值計算各輸出神經元設定匹配度獎勵值,并根據各神經元的匹配值,選擇獲勝神經元,該過程在所有數據庫重復迭代。最后,提取所有迭代過程的獲勝神經元,關聯相關屬性。
技術領域
本發明涉及在數據庫中關聯相關屬性的方法,具體是一種基于自組織映射(SOM)神經網絡的異構數據屬性關聯方法。
背景技術
數據屬性的關聯一般用于異構數據的融合應用,例如,搜索引擎的語義關聯、知識圖譜的知識融合等;海量異構數據中,人工神經網絡是建模屬性關聯的有效途徑。
自組織映射(Self-Organizing?Map)神經網絡是一種無監督、競爭型的人工神經網絡。它運用競爭學習策略,依靠神經元之間互相競爭逐步優化網絡,使用領域函數維持輸入空間的拓撲結構。由于異構數據間存在實體的歧義、實體的共指等現象,基于競爭學習的自組織映射神經網絡可以通過同義、近義實體的競爭及協作,有效構建關聯拓撲結構,較適用于海量異構數據的屬性關聯。
發明內容
本發明提供了一種基于自組織映射(SOM)神經網絡的異構數據屬性關聯方法,在多個異構數據庫中,通過匹配實體進行屬性關聯。
本發明中主要采用的技術方案為:
一種基于自組織映射(SOM)神經網絡的異構數據屬性關聯方法。在多個異構數據庫中,通過匹配實體進行屬性關聯時,
具體步驟如下:
步驟1:初始化
進行首輪迭代,以輸入的屬性為輸出神經元,以首個數據庫的所有屬性為輸入神經元,根據神經元的匹配度,選擇一個獲勝神經元;
步驟2:計算獎勵值
以獲勝神經元領域函數范圍內所有神經元為輸出神經元,以下一個數據庫的所有屬性為輸入神經元,進行自組織迭代;
此時,計算獲勝神經元的領域函數,將領域函數值設定為獎勵值,賦予所有領域半徑內的神經元。獲勝神經元獲得最高獎勵值,其他神經元與獲勝神經元越相似,則獲取更高的獎勵值;
步驟3:輸出神經元與輸入神經元進行匹配度比較,在輸入神經元中選擇與任一輸出神經元匹配度最高的神經元為獲勝神經元,需進行輸出神經元數*輸入神經元數的匹配計算。此時,匹配度計算過程需代入各神經元設定的獎勵值;
步驟4:迭代,重復步驟2,步驟3,遍歷所有數據庫;
步驟5:最終,提取所有迭代過程的獲勝神經元,關聯相關屬性。
優選地,步驟1中根據神經元的匹配度,選擇一個獲勝神經元,具體計算公式如式(1)所示:
其中,i為輸入神經元編號;N為輸入神經元集合。
優選地,所述步驟2中獎勵值的計算方法如式(2)所示:
其中,j為輸入神經元編號;δ為0到1的常數,根據數據庫間的相關性設定;k為迭代次數;g為最高匹配值;λ為領域半徑。
優選地,所述步驟3中匹配度計算過程需代入各神經元設定的獎勵值,計算方法如式(3)所示:
其中,j為輸出神經元編號;K為輸出神經元集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學常州校區,未經河海大學常州校區許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010690533.2/2.html,轉載請聲明來源鉆瓜專利網。





