[發明專利]基于GNN執行預測的方法和系統以及訓練方法和系統在審
| 申請號: | 202110483604.6 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113095592A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 趙歡;郭夏瑋;全雨晗;姚權銘 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/02;G06N3/08;G06N20/00 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 朱志玲;蘇銀虹 |
| 地址: | 100085 北京市海淀區清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 gnn 執行 預測 方法 系統 以及 訓練 | ||
提供了一種基于GNN執行預測的方法和系統以及訓練方法和系統,其中,基于GNN執行預測的方法包括:獲取包含待預測樣本的表數據;基于表數據創建圖,其中,圖中的每個節點表示表數據中的一個樣本,并且圖中的邊表示兩個樣本之間的相關性;基于創建的圖利用GNN學習圖中與所述待預測樣本對應的目標節點的特征表示;基于學習的目標節點的特征表示執行預測來獲得關于目標節點的預測結果。
技術領域
本申請總體說來涉及人工智能領域,更具體地,涉及一種基于圖神經網絡GNN執行預測的方法和系統以及一種訓練基于圖神經網絡GNN的機器學習模型的方法和系統。
背景技術
表數據在工業界有廣泛的應用,例如商品銷售、網站瀏覽、交易流水、金融貸款等數據都可以以表數據的形式存儲。對表數據進行學習,預測在已有數據中未知的值,在現實生活中有廣泛的應用,例如銷量預測、商品推薦、欺詐交易檢測和貸款風險預測等。現有的基于表數據的有監督學習的模型普遍考慮基于已有的特征來構建新的有效的交叉特征,從而提高模型的性能,然而,僅考慮交叉特征對模型性能和預測效果的提升仍然欠佳。鑒于此,需要能夠在表數據的學習中提高模型性能和預測效果的技術。
發明內容
本申請提供一種基于圖神經網絡GNN執行預測的方法和系統、一種訓練基于圖神經網絡GNN的機器學習模型的方法和系統、一種存儲指令的計算機可讀存儲介質以及一種包括至少一個計算裝置和存儲指令的至少一個存儲裝置的系統,以至少解決相關技術中的上述問題。本申請的技術方案如下:
根據本申請的第一方面,提供了一種基于圖神經網絡GNN執行預測的方法,所述方法包括:獲取包含待預測樣本的表數據;基于表數據創建圖,其中,圖中的每個節點表示表數據中的一個樣本,并且圖中的邊表示兩個樣本之間的相關性;基于創建的圖利用GNN學習圖中與所述待預測樣本對應的目標節點的特征表示;基于學習的目標節點的特征表示執行預測來獲得關于目標節點的預測結果。
可選地,所述圖是能夠反映表數據中樣本之間在多個方面的相關性的多重圖,其中,所述基于創建的圖利用GNN學習圖中與所述待預測樣本對應的目標節點的特征表示,包括:通過將多重圖中與目標節點有關的鄰居節點和相關性分別抽取出來,獲得與目標節點有關的多個子圖,其中,每個子圖反映樣本之間在一方面的相關性;基于每個子圖利用與每個子圖對應的GNN分別學習目標節點的子特征表示;將目標節點的子特征表示進行聚合來獲得目標節點的特征表示。
可選地,所述基于學習的目標節點的特征表示執行預測來獲得關于目標節點的預測結果,包括:僅基于利用GNN學習的目標節點的特征表示執行預測來獲得關于目標節點的預測結果;或者,將利用GNN學習的目標節點的特征表示與目標節點的原始特征表示或通過不同于GNN的其他方式學習的目標節點的特征表示進行拼接,并基于拼接后的特征表示執行預測來獲得關于目標節點的預測結果。
可選地,所述基于表數據創建圖,包括:根據表數據中的樣本的特征選取能夠構建樣本之間的相關性的特征;基于選取的特征選擇相關聯的樣本來創建圖。
可選地,所述根據表數據的樣本的特征選取能夠構建樣本之間的相關性的特征,包括:從樣本的特征之中直接選擇能夠構建樣本之間的相關性的特征;或者,將樣本的至少兩個離散特征進行組合來獲得新的離散特征,作為能夠構建樣本之間的相關性的特征。
可選地,所述基于選取的特征選擇相關聯的樣本來創建圖,包括:在選取的特征是離散特征的情況下,將選取的特征的取值相同的樣本確定為相關聯的樣本,并在相關聯的樣本之間構建邊;在選取的特征是連續特征的情況下,將連續特征轉化為離散特征,并將轉化后的離散特征的取值相同的樣本確定為相關聯的樣本,并在相關聯的樣本之間構建邊。
可選地,基于每個子圖利用與每個子圖對應的GNN分別學習目標節點的子特征表示,包括:對由每個子圖中的節點表示的樣本的特征進行編碼;基于編碼后的特征,利用每個子圖對應的GNN分別學習目標節點的子特征表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110483604.6/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





