[發明專利]一種基于圖機器學習的用戶社區發現方法及相關組件在審
| 申請號: | 202010763046.4 | 申請日: | 2020-07-31 |
| 公開(公告)號: | CN111881366A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 張俊 | 申請(專利權)人: | 深圳市萬物云科技有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/901;G06N20/00 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 武志峰 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 用戶 社區 發現 方法 相關 組件 | ||
本發明公開了一種基于圖機器學習的用戶社區發現方法及相關組件。該方法先獲取多個圖結構的樣本,基于Node2Vec模型對所述樣本進行訓練,搜索得到所述各節點的有效鄰居節點,構成每一節點的有效鄰居節點集合,并確定Node2Vec模型的模型參數,從而完成Node2Vec模型的構建;然后再獲取待測社區的圖結構,將所述待測社區的圖結構輸入至所述Node2Vec模型,通過所述Node2Vec模型對待測社區的圖結構中的節點之間的鏈接關系進行預測并得到鏈接關系概率;根據所述鏈接關系概率是否超過預設的概率閾值,輸出各節點的有效鄰居節點。該方法實現了對用戶社區關系中各節點鏈接關系進行準確預測的優點。
技術領域
本發明涉及圖機器學習領域,尤其涉及一種基于圖機器學習的用戶社區發現方法及相關組件。
背景技術
圖(Graph)是一種復雜的非線性結構,由頂點的有窮非空集合和頂點之間邊的集合組成。在社交網絡、經濟網絡、生物醫學網絡、信息網絡等多個領域,圖數據結構被廣泛應用。
圖機器學習通過拉普拉斯特征映射(Laplacian eigenmaps)、基于隨機游走策略(Random walk approaches)等常見的圖向量化表示方法,使得圖結構數據也可以進行潛在的機器學習任務;相關任務主要包括:
(1)節點分類:預測一個給定節點的類型;
(2)鏈接預測:預測兩個節點是否連接;
(3)社群檢測:識別密集連接的節點群;
(4)網絡相似度:兩個子網絡的相似程度。
經過多年的發展,相應的圖機器學習模型和應用在社交網絡、推薦系統、知識圖譜上的效果初見端倪。
然而,由于圖是非歐幾里的結構,使得其向量化表示一直是圖機器學習理論的難點;具體表現在:圖的結構可以任意變化;節點也可以以任意順序標記,這樣使得圖結構的向量化表示成為影響圖機器學習模型效果的關鍵因素之一;比如說基于隨機游走策略的向量化方法,該方法通過變量α控制隨機游走的傾向,而α值的定義具有極大的不確定性。
特別是在現有的網絡社區關系建立方法中,通常依據用戶的對軟件系統的操作行為記錄(例如:點擊、評價等),為用戶自動地匹配關聯其他用戶或者向用戶推薦其他關聯用戶,從而在用戶之間建立關系;但這種方式建立的社區關系很不穩定,往往用戶最近的一次或數次操作就使以前建立的關聯關系完全變化,這也導致訓練節點表示模型時α值的優化范圍極大;加上其他客觀條件的影響,導致了現有圖機器學習在用戶社區發現的場景的應用不足。
發明內容
本發明的目的是提供一種基于圖機器學習的用戶社區發現方法及相關組件,旨在解決現有技術對用戶社區關系中各節點鏈接關系進行預測的準確性還有待提高的問題。
第一方面,本發明實施例提供了一種基于圖機器學習的用戶社區發現方法,其包括:
抽取不動產實體作為圖結構的核心節點,抽取動產實體和人員實體作為圖結構的輔助節點,抽取實體之間具有法律效力的關系作為圖結構的邊,以構建圖結構;
獲取多個圖結構的樣本,基于Node2Vec模型對所述樣本進行訓練,搜索得到所述各節點的有效鄰居節點,構成每一節點的有效鄰居節點集合,并確定Node2Vec模型的模型參數,從而完成Node2Vec模型的構建;
獲取待測社區的圖結構,將所述待測社區的圖結構輸入至所述Node2Vec模型,通過所述Node2Vec模型對待測社區的圖結構中的節點之間的鏈接關系進行預測并得到鏈接關系概率;
根據所述鏈接關系概率是否超過預設的概率閾值,輸出各節點的有效鄰居節點。
第二方面,本發明實施例提供了一種基于圖機器學習的用戶社區發現裝置,其包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市萬物云科技有限公司,未經深圳市萬物云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010763046.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于社區場景的工單處理方法及相關組件
- 下一篇:一種全自動模具開合模裝置





