[發明專利]逐邊學習屬性圖表示在審
| 申請號: | 201980080282.1 | 申請日: | 2019-10-18 |
| 公開(公告)號: | CN113168576A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | R·帕特拉;S·洪;J·金;D·希洛林;D·巴托里尼;H·查菲 | 申請(專利權)人: | 甲骨文國際公司 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 馮薇 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 學習 屬性 圖表 | ||
描述了用于逐邊學習屬性圖表示的技術。輸入圖包括多個頂點和多個邊緣。多個頂點中的每個頂點與相應頂點的頂點屬性相關聯。生成頂點到屬性的映射,該映射將每個頂點映射到多個頂點屬性簽名中的頂點屬性簽名。生成多個邊緣單詞。每個邊緣單詞對應于一個或多個邊緣,每個邊緣起始于具有多個頂點屬性簽名中的特定頂點屬性簽名的第一頂點,并且終止于具有多個頂點屬性簽名中的特定頂點屬性簽名的第二頂點。生成多個句子,每個句子包括沿著輸入圖中的多個路徑中的路徑連接的邊緣單詞。文檔向量化模型用于生成表示輸入圖的機器學習向量。
技術領域
本發明涉及基于學習到的(learned)圖表示的圖處理和機器學習技術。
背景技術
本部分中描述的方法是可以實行的方法,但不一定是先前已經設想或實行的方法。因此,除非另有說明,否則不應僅由于本部分中所述的任何方法包括在本部分中而認為本部分中所述的任何方法都有資格作為現有技術。
屬性圖(property graph)的重要能力是它們對圖中的潛在關系建模并捕獲其它數據模型無法捕獲的鏈接信息(即,實體關系)的能力。在任何屬性圖中,節點(即,實體)和邊(即,實體之間的鏈接關系)都與一些屬性相關聯,這些屬性是鍵,值對,例如label:customer(標簽:客戶)或label:employee(標簽:雇員)。
同時,機器學習技術在多個領域中被采用,以通過從數據中的模式和趨勢學習來發現“隱藏的見解(hidden insights)”。屬性圖用于各種任務,比如鏈接預測(例如,友誼推薦)、分類(例如,欺詐檢測)、排名(例如,節點重要性)或相似性搜索(例如,搜索相似的化合物)。這樣的任務帶來了將各種機器學習技術應用于屬性圖的可能性。
圖表示學習已經使得能夠平滑地集成機器學習技術和屬性圖。圖表示學習的目標是找到與任務無關的方式來表示圖結構(在低維空間中),使得可以將經典的機器學習模型用于采用學習到的表示的多個應用。特征化圖結構的一種方法是圖內核(graph kernel),其主要采用手工制作的特征,例如最短路徑、小圖(graphlet)、頁面排名得分。但是,神經嵌入為圖表示學習提供了新的方向:將機器學習的成功結合到屬性圖中。
表示學習的一種類型是頂點級表示學習,其將接近節點(其中緊密度可以是結構接近度或面向屬性的接近度)表示為表示向量空間中相似的向量。這種學習目的有益于頂點級任務,諸如頂點分類或頂點聚類。傳統上,機器學習技術依靠手工制作的用戶定義特征(例如,集中性測量)對圖中關于頂點的結構信息進行編碼。但是,另一種方法是通過采用隨機游走(將頂點作為學習單元)來學習嵌入,隨后是skipgram模型來學習頂點表示。隨機游走(random walk)的變體通過采用偏向隨機游走探索不同鄰域來最大化保留節點的鄰域的可能性。
與頂點級別表示相比,一些任務可能需要圖的更高粒度,即,整個圖的表示。圖表示可以使多個任務受益,比如圖分類任務(欺詐或異常模式)、在圖的數據庫上進行相似性搜索(例如,藥物)、或者甚至進行指紋識別。與頂點表示類似,存在手工制作的用戶定義的特征來對圖(例如,子圖)的結構信息進行編碼的選項。另一種方法將整個圖視為文檔,并將圍繞該圖中的每個節點的生根子圖視為構成該文檔的單詞,但不考慮單詞(即,子圖)之間的任何排序。
但是,這兩種表示都有其缺點,因為當與各種機器學習模型一起使用時,這兩種表示都不是最佳的。
本文討論了用于提高基于圖的機器學習結果的質量的方法。
本部分中描述的方法是可以實行的方法,但不一定是先前已經設想或實行的方法。因此,除非另有說明,否則不應僅由于本部分中所述的任何方法包括在本部分中而認為本部分中所述的任何方法都有資格作為現有技術。
附圖說明
在附圖中:
圖1圖示了具有每個頂點的相關聯屬性的屬性圖。
圖2圖示了邊緣單詞生成圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于甲骨文國際公司,未經甲骨文國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980080282.1/2.html,轉載請聲明來源鉆瓜專利網。





