[發明專利]面向多元數據的自動關聯方法有效
| 申請號: | 201410838117.7 | 申請日: | 2014-12-29 |
| 公開(公告)號: | CN104516975B | 公開(公告)日: | 2019-03-22 |
| 發明(設計)人: | 付琨;許光鑾;孫顯;黃宇;王磊;田璟;宋俊 | 申請(專利權)人: | 中國科學院電子學研究所 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901 |
| 代理公司: | 北京安博達知識產權代理有限公司 11271 | 代理人: | 徐國文 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關聯關系 多元數據 時間屬性 自動關聯 屬性標簽 屬性信息 地理中心位置 橢球坐標系 保存數據 標簽信息 距離依賴 數據關聯 數據添加 位置屬性 已知信息 自動添加 挖掘 分辨率 隱含 標簽 轉換 覆蓋 改進 統一 | ||
1.面向多元數據的自動關聯方法,其特征在于按照以下步驟進行:
步驟1、選擇多元數據,指不同類型但具有一定共性的數據,包括,影像數據和情報數據;
步驟2、提取每個數據的時間屬性,對時間屬性不全的根據上下文補全;
步驟3、提取每個數據的地理中心位置和覆蓋范圍,并轉換到統一的橢球坐標系下;
步驟4、對數據添加屬性標簽;根據數據的來源、類別、等級、分辨率屬性對數據自動添加屬性標簽,具有相同屬性標簽的數據存在著隱含的關聯關系,所述屬性標簽包括語義標簽;
步驟5:利用多屬性信息挖掘數據間的關聯關系;同時考慮數據的時間屬性、位置屬性和屬性標簽的信息,利用改進的距離依賴中餐館過程挖掘數據間的關聯關系;
步驟6:保存數據之間的關聯關系,作為已知信息用于后續自動關聯組織;
其中,所述步驟4中利用圖像解譯算法對數據自動添加所述語義標簽,對每一幅圖像進行識別,檢測是否有艦船,以及檢測艦船的型號,然后將這個艦船的名字作為語義標簽添加到這個圖像的標簽中去;
所述步驟5中利用改進的距離依賴中餐館過程挖掘數據間的關聯關系過程分為以下幾步:
5.1計算數據之間的時間距離,dijt表示數據時間屬性上的距離,根據數據類型使用不同的時間粒度,普通數據采用天作為基本單位,時效性較高的數據采用秒為基本單位;
5.2計算數據之間的地理位置距離,dijl表示數據位置屬性上的距離,統一使用米為單位;
5.3對所有數據隨機初始化數據分組,每個數據都根據改進的距離依賴中餐館的先驗隨機選取一個數據作為自己的鄰居;
改進的距離依賴中餐館過程挖掘數據間的關聯關系是在中餐館過程的基礎上考慮數據之間的依賴關系采用如下公式:
f1,f2分別表示時間和位置距離的衰減函數,選取以下函數:f(d)=e-d/a,f(d)=exp(-d+a)/(1+exp(-d+a)),f(d)=1[d<a],保證時間相近位置相鄰的數據有更大的概率聚為一類;
5.4循環采樣數據之間的關聯關系,其中以時間和地理距離作為先驗,以屬性標簽的信息作為后驗來計算采樣的概率,并根據這個概率采樣每個數據所選擇的鄰居數據;
5.5選取收斂后若干輪的均值作為最終的結果;
5.6根據采樣結果恢復每個數據所選擇的鄰居數據,據此把數據聚類成不同的分組,自動建立數據之間的關聯關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院電子學研究所,未經中國科學院電子學研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410838117.7/1.html,轉載請聲明來源鉆瓜專利網。





