[發(fā)明專利]一種圖數(shù)據(jù)處理的方法及裝置有效
| 申請?zhí)枺?/td> | 201710061406.4 | 申請日: | 2017-01-26 |
| 公開(公告)號: | CN108364327B | 公開(公告)日: | 2021-09-17 |
| 發(fā)明(設(shè)計)人: | 夏應(yīng)龍;徐建;夏命榛 | 申請(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號: | G06T11/20 | 分類號: | G06T11/20 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù)處理 方法 裝置 | ||
本申請公開了一種圖數(shù)據(jù)處理的方法,包括:從數(shù)據(jù)庫中獲取圖數(shù)據(jù),圖數(shù)據(jù)為包含K個域的多域圖,K個域中的每個域包含同一類型的至少兩個頂點,以及用于連接每個域內(nèi)兩個頂點的至少一條域內(nèi)邊,圖數(shù)據(jù)還包括用于連接分別屬于不同域的兩個頂點的至少一條域間邊,K≥2,且K為整數(shù);對圖數(shù)據(jù)進行轉(zhuǎn)換,以得到一個2K維的張量的1/2表面,通過并行滑動窗口PSW從張量的1/2表面包含的每個面上,確定包含目標頂點的邊集合,目標頂點為每個面內(nèi)PSW所覆蓋的目的頂點,邊集合用于圖數(shù)據(jù)處理。本申請實施例提供的圖數(shù)據(jù)處理方案,既能更好的支持對多域圖分析處理,而且提高了圖數(shù)據(jù)處理的效率,節(jié)省了計算資源。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種圖數(shù)據(jù)處理的方法及裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)中的數(shù)據(jù)量呈現(xiàn)爆炸式增長,通過對這些海量數(shù)據(jù)進行分析可以挖掘出一些有價值的信息,以便于發(fā)現(xiàn)新的市場機會或商業(yè)模式。但網(wǎng)絡(luò)中的數(shù)據(jù)量非常龐大,為了提高數(shù)據(jù)分析效率,需要對數(shù)據(jù)進行建模,即將數(shù)據(jù)通過特定的模型來表達。由于圖(Graph)具有極強的模型表達能力,能夠直觀地表達具有相互聯(lián)系的實體(Entity),及其實體之間的關(guān)系。因此,在很多大數(shù)據(jù)分析場景下,將待處理的數(shù)據(jù)以圖的形式表示,然后再對圖進行分析處理,以得到用戶所需的信息,以圖的形式表示的數(shù)據(jù)通常也被稱為圖數(shù)據(jù),對圖數(shù)據(jù)進行分析處理也稱為圖計算。其中,圖的頂點(vertex)存儲實體對應(yīng)的值,邊(edge)表示實體之間的關(guān)系。典型地,社交網(wǎng)絡(luò)數(shù)據(jù)、CDR(call detailrecord,呼叫詳細記錄)、文章之間的引用關(guān)系和金融交易數(shù)據(jù)等都可以通過圖(Graph)來建模。圖計算已經(jīng)成為大數(shù)據(jù)處理系統(tǒng)的基本模塊。
如圖1所示,圖計算的應(yīng)用范圍廣泛,例如,在電信領(lǐng)域、安全領(lǐng)域,金融領(lǐng)域以及其他領(lǐng)域都會涉及對大數(shù)據(jù)進行挖掘分析,支撐上層應(yīng)用決策和運營。從海量數(shù)據(jù)中采集出各領(lǐng)域所需要的數(shù)據(jù),然后以圖的形式表達,最后利用數(shù)據(jù)挖掘方法,例如大規(guī)模關(guān)系計算,機器學(xué)習算法等,對圖數(shù)據(jù)進行處理,進而得到各個領(lǐng)域有價值的數(shù)據(jù)。
大數(shù)據(jù)場景下需要分析處理的圖數(shù)據(jù)往往包含大量相互關(guān)聯(lián)的實體,這些實體可能分屬不同類別,并且對于不同類別實體的處理多有差異。在圖上,這種差異化表現(xiàn)在對于頂點類型的描述,以及由此衍生出的域內(nèi)與域間的關(guān)聯(lián)關(guān)系。通常,一種類型的頂點的集合稱為一個域,而涉及多個域的圖被稱為多域圖。多域圖在現(xiàn)實中非常常見,而現(xiàn)有的圖計算框架缺乏對多域圖的支持?,F(xiàn)有技術(shù)中有個別圖計算框架采用標簽的方式標識來多域圖中各種不同類型的頂點,并在圖數(shù)據(jù)處理的過程中通過查詢標簽的方式來確定頂點的類型,從而實現(xiàn)對多域圖的處理,但是在對圖數(shù)據(jù)的處理過程中就需要不斷的反復(fù)查詢圖數(shù)據(jù)中各頂點的標簽,不僅影響了圖數(shù)據(jù)處理的速度,也耗費了計算資源。
發(fā)明內(nèi)容
為了更好地支持對多域圖的分析處理,提高多域圖的處理效率,本申請實施例提供一種圖數(shù)據(jù)處理的方法以及裝置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710061406.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種CT成像方法
- 下一篇:一種生成二維三角形網(wǎng)格的方法及裝置
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





