[發明專利]一種信息關聯的方法及裝置有效
| 申請號: | 201210322651.3 | 申請日: | 2012-09-04 |
| 公開(公告)號: | CN103678327B | 公開(公告)日: | 2017-02-22 |
| 發明(設計)人: | 簡勤;郭正平;王全禮;張紅巖;王容;徐凱旋 | 申請(專利權)人: | 中國移動通信集團四川有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京中譽威圣知識產權代理有限公司11279 | 代理人: | 叢芳,張相午 |
| 地址: | 610041*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息 關聯 方法 裝置 | ||
技術領域
本發明涉及信息處理技術領域,尤其涉及一種信息關聯的方法及裝置。
背景技術
隨著互聯網數據越來越龐大,獲取的數據種類和數量也越來越多,從互聯網上獲取數據源已經不是什么難題。但是由于互聯網數據的不規整性,將獲取的異構數據關聯起來成為目前的一個難題,另外不同的異構數據庫描述的數據一般都有自己格式,將不同異構數據庫直接的數據進行融合也需要數據關聯處理。一般情況下我們一些已有的目標值,然后從互聯網上或者從其他異構數據庫中獲取相關的信息,比如音樂領域我們有了歌曲、歌手、專輯中的某一種或者幾種信息,如果從互聯網上獲取相關的所有信息并將其關聯起來使用是很有價值的,因為互聯網數據具有不規整性的特點。
目前常用的做法是通過文本相似度計算,這種方法很大的缺陷是完全根據字符串相似度進行的,而沒有考慮文本描述對象包括哪些維度,也就是沒有從對象本身考慮問題,這樣當一個文本錯位嚴重或者文本不規則時,通過通用的文本相似度計算方法會造成很多錯誤的結果。
發明內容
為了解決現有技術中異構數據無法關聯的技術問題,本發明提出一種信息關聯的方法及裝置,能夠將一種數據在網絡上的所有相關信息關聯起來,形成一個一體化的數據集合,提高數據使用效率。
本發明的一個方面,提供一種信息關聯的方法,包括:
獲取待關聯信息的描述文本,將所述描述文本的數據值分解到多維空間,得到待關聯信息的匹配集合;
遞增選取所述待關聯信息的匹配集合中的維度值與目標集合中的維度值進行匹配,獲得關聯維度集合。
本發明的另一個方面,還提供一種信息關聯的裝置,包括升維模塊和匹配模塊,其中
所述升維模塊,用于獲取待關聯信息的描述文本,將所述描述文本的數據值分解到多維空間,得到待關聯信息的匹配集合;
所述匹配模塊,用于遞增選取所述待關聯信息的匹配集合中的維度值與目標集合中的維度值進行匹配,獲得關聯維度集合。
本發明實施例提出的信息關聯的方法及裝置,通過采用升維法將某一種數據在互聯網上所有的相關信息關聯起來,然后通過解決沖突的排序策略將同一種關聯信息進行再區分,最終形成一個一體化數據集合,用來解決互聯網領域數據不規整的特點,提高數據的使用效率。
附圖說明
圖1是本發明實施例中升維法模型的結構示意圖;
圖2是本發明實施例中信息關聯方法的流程圖;
圖3是本發明實施例中數據值分解后的示意圖;
圖4是本發明實施例中將待關聯信息描述文本的數據值分解到多維空間的流程圖;
圖5是本發明實施例中樣本集合到匹配集合關聯訓練的流程圖;
圖6是本發明實施例中目標集合到匹配集合關聯訓練的流程圖;
圖7是本發明實施例中以歌曲為例進行信息關聯的示意圖;
圖8是本發明實施例中信息關聯裝置的結構示意圖;
圖9是本發明實施例中升維模塊的結構示意圖;
圖10是本發明實施例中匹配模塊的結構示意圖。
具體實施方式
本發明是通過升維法將某一種數據在互聯網上所有的相關信息關聯起來,然后通過解決沖突的策略將同一種關聯信息進行再區分,最終形成一個一體化數據集合。
本發明信息關聯的方法實施例中,將待關聯信息的描述文本的數據值分解到多維空間是通過升維法進行的。升維法模型如圖1所示,對于給定m個目標值集合S1,S2…Sm,給定n個相關數據信息集合S1,S2…Sn,每個信息集合中包含了某一類型數據對象值及相關屬性序列,目標就是通過本發明設計的數據關聯方法將n個相關數據信息集合關聯到m個目標集合中,即:S1,S2…Sn—>S1,S2,Sm,形成某一領域的數據全集,完成異構數據的數據融合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團四川有限公司,未經中國移動通信集團四川有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210322651.3/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





