[發明專利]一種基于條件生成式對抗網絡的個性化精準教育系統在審
| 申請號: | 202210731989.8 | 申請日: | 2022-06-26 |
| 公開(公告)號: | CN115033795A | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 王昌棟;高靜;黃志川;溫晶 | 申請(專利權)人: | 廣東恒電信息科技股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06N3/08;G06Q50/20 |
| 代理公司: | 北京智行陽光知識產權代理事務所(普通合伙) 11738 | 代理人: | 李俊芝 |
| 地址: | 510640 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 條件 生成 對抗 網絡 個性化 精準 教育系統 | ||
1.一種基于條件生成式對抗網絡的個性化精準教育系統,其特征在于:它包括有以下步驟:
1)、構建用戶—物品交互矩陣;
2)、構建訓練數據,抽樣得到用戶u的個性化物品子集Tu和真實的條件評分向量ru,Tu;
3)、開展對抗訓練,更新條件生成式對抗網絡,直到生成器和判別器收斂;
4)、使用訓練后的模型預測用戶喜歡目標課程的程度,生成推薦列表。
2.根據權利要求1所述的一種基于條件生成式對抗網絡的個性化精準教育系統,其特征在于:第2)步驟具體包括以下步驟:
第一步驟:根據有交互記錄的二元組(用戶u,物品i),抽樣得到k個物品用于組成個性化物品子集Tu,其中包括p個有交互記錄的物品和q個沒有交互記錄的物品;
第二步驟:根據個性化物品子集Tu的物品順序,將用戶-物品交互矩陣對應的元素值組合,得到真實的條件評分向量ru,Tu。
3.根據權利要求1所述的一種基于條件生成式對抗網絡的個性化精準教育系統,其特征在于:第3)步驟具體包括以下步驟:
第一步驟:將用戶u和個性化物品子集Tu作為生成器的輸入,輸出生成的條件評分向量
其中,是條件評分向量的第j個元素;是從生成器存儲的用戶嵌入矩陣中檢索得到的用戶潛向量;是從生成器存儲的物品嵌入矩陣中檢索得到的物品潛向量,對應個性化物品子集Tu第j個物品;f(·,·)表示用戶和物品之間的交互函數,此交互函數能靈活地選擇不同的模型;
第二步驟:將用戶u和個性化物品子集Tu作為判別器中記憶模塊的輸入,輸出記憶向量
其中,muj是條件評分向量的第j個元素;是從判別器存儲的用戶嵌入矩陣中檢索得到的用戶潛向量;是從判別器存儲的物品嵌入矩陣中檢索得到的物品潛向量,對應個性化物品子集Tu的第j個物品;f(·,·)表示用戶和物品之間的交互函數;
第三步驟:將條件評分向量和記憶向量拼接后輸入判別器的分類模塊;分類模塊對真實的條件評分向量和生成的條件評分向量進行分類,分類任務的目標函數寫為如下的形式:
s.t.||θd||L≤δ·
其中,D表示判別器,θd表示判別器的參數,‖θd‖L≤δ表示判別器參數θd的Lipschitz約束;表示生成器擬合的交互數據分布,表示真實的交互數據分布;
第四步驟:計算判別器的隨機梯度,使用隨機梯度上升更新判別器的參數;
其中,C表示訓練樣本的數量,z(c)表示生成器生成的第c個樣本,x(c)表示從真實數據分布抽樣得到的第c個樣本;
第五步驟:計算生成器的隨機梯度,使用隨機梯度下降更新生成器的參數;
其中,C表示訓練樣本的數量,z(c)表示生成器生成的第c個樣本,x(c)表示從真實數據分布抽樣得到的第c個樣本。
4.根據權利要求1所述的一種基于條件生成式對抗網絡的個性化精準教育系統,其特征在于:第4)步驟的對抗訓練過程中,生成器在判別器的指導下擬合真實的交互數據分布,生成更加真實的條件評分向量;由于同時將用戶和物品子集作為條件信息,條件評分向量的維度遠小于原始的用戶評分向量,條件評分向量的稀疏程度也是能控制的,這解決了對抗訓練和模型推斷過程中存在的計算量冗余問題,簡化了生成器和判別器在潛向量空間的特征表示學習任務,緩解了原始用戶評分向量重構困難的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東恒電信息科技股份有限公司,未經廣東恒電信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210731989.8/1.html,轉載請聲明來源鉆瓜專利網。





