[發明專利]區域教育需求的分析方法和裝置在審
| 申請號: | 202210378977.1 | 申請日: | 2022-04-12 |
| 公開(公告)號: | CN114782228A | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 麻志鵬;孟垂實 | 申請(專利權)人: | 京東城市(北京)數字科技有限公司 |
| 主分類號: | G06Q50/20 | 分類號: | G06Q50/20;G06Q10/04;G06Q30/06;G06K9/62 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 韓黎捷;張效榮 |
| 地址: | 100086 北京市海淀區知*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 區域 教育 需求 分析 方法 裝置 | ||
1.一種區域教育需求的分析方法,其特征在于,包括:
根據電商平臺數據構建區域與商品的二分圖;
將所述二分圖輸入圖自動編碼網絡中,通過自監督任務訓練得到圖嵌入模型,所述圖嵌入模型用于表征區域與商品之間的關聯關系;
根據歷史入學數據構建吸引力模型,所述吸引力模型用于預測各個區域未來的入學人數;
基于所述圖嵌入模型和所述吸引力模型的輸出結果來計算各個區域的教育需求。
2.根據權利要求1所述的方法,其特征在于,根據電商平臺數據構建區域與商品的二分圖包括:
對電商平臺數據進行數據清洗,以進行地址修正和刪除異常用戶數據,所述電商平臺數據包括商品數據、區域數據和訂單數據;
對所述商品數據進行特征提取以構造商品特征向量,所述商品數據包括商品自身信息和年齡信息;
對所述區域數據進行特征提取以構造區域特征向量,所述區域數據包括訂單的收貨地址所屬的區域信息;
將區域和商品分別作為二分圖的結點,區域特征向量與商品特征向量作為結點特征向量,通過訂單數據關聯區域結點和商品結點形成邊,將區域內購買商品的訂單數量作為邊的權重,構建二分圖。
3.根據權利要求2所述的方法,其特征在于,對所述商品數據進行特征提取以構造商品特征向量之后,還包括:
對所述商品數據,將商品按照所屬的商品類目進行聚合,并基于聚合后的商品構建二分圖。
4.根據權利要求2所述的方法,其特征在于,進行地址修正的步驟包括:
使用多個地理信息服務商的地理解析服務對教育機構進行經緯度解析;
根據解析結果的分布進行投票得到每個解析結果的投票得分;
根據所述投票得分和預設規則,確定所述教育機構的地址的最終結果以進行地址修正。
5.根據權利要求2所述的方法,其特征在于,將區域內購買商品的訂單數量作為邊的權重包括:
將區域內購買商品的訂單數量進行分箱以得到多個分箱值,并建立訂單數量與分箱值的映射關系;
將訂單數量對應的分箱值作為邊的權重。
6.根據權利要求1所述的方法,其特征在于,將所述二分圖輸入圖自動編碼網絡中,通過自監督任務訓練得到圖嵌入模型包括:
將所述二分圖輸入圖自動編碼網絡的圖編碼器中,通過圖卷積提取結構嵌入信息,將所述結構前任信息與結點的特征通過全連接層融合得到結點的隱層表示;
將所述結點的隱層表示輸入圖自動編碼網絡的圖解碼器中個,通過鏈路預測任務提供監督信號進行訓練,得到重構的區域結點與商品結點之間的關聯關系,以得到圖嵌入模型。
7.根據權利要求1所述的方法,其特征在于,所述吸引力模型是基于距離、規模、教育質量、生活質量四個維度的指標構建的,教育機構i對任一個位置j的吸引力Pij表示為:
其中,ci表示教育機構i的總人數,用于描述教育機構的規模;rai表示教育機構i的師生比,用于描述教育機構的教育質量;rbi表示教育機構i的人均面積,用于描述學生的生活質量;ω1、ω2、ω3為對應因子的權重;Rij表示教育機構i到位置j的距離指數,該距離指數表示為:
其中,Dij表示教育機構i到位置j的直線距離;Davg為該城市可選范圍內教育機構距離任一位置的平均距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東城市(北京)數字科技有限公司,未經京東城市(北京)數字科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210378977.1/1.html,轉載請聲明來源鉆瓜專利網。





