[發明專利]一種相似題目推薦系統和方法在審
| 申請號: | 202210489847.5 | 申請日: | 2022-05-07 |
| 公開(公告)號: | CN114817545A | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 張學忠;王冠;楊根科;褚健 | 申請(專利權)人: | 上海交通大學寧波人工智能研究院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/335;G06K9/62 |
| 代理公司: | 上海劍秋知識產權代理有限公司 31382 | 代理人: | 徐浩俊 |
| 地址: | 315012 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相似 題目 推薦 系統 方法 | ||
1.一種相似題目推薦系統,其特征在于,包括:
輸入模塊,輸入題目,題目包括原始待推薦題目、原始待選題目及所述原始待選題目的知識點標簽;
題目預處理模塊,把所述原始待推薦題目和所述原始待選題目預處理為統一的規范格式,分別得到待推薦題目和待選題目;
題目儲存模塊,存儲所述待選題目及所述知識點標簽;
知識點預測模塊,使用所述待選題目訓練知識點預測模型,使用所述知識點預測模型對所述待推薦題目的知識點進行預測,根據預測得到的知識點讀取所述題目儲存模塊中對應知識點標簽的候選題目作為候選題目;
文本表示白化處理模塊,將所述知識點預測模塊輸出矩陣變為一個均值為0、協方差矩陣為單位陣的矩陣;
文本對比學習模塊,使用對比學習的方法訓練文本表示,使用監督學習的方法構造正負樣本,將同一知識點下的待選題目作為正樣本,將不同知識點標簽下的待選題目作為負樣本,得到文本表示;
圖片對比學習模塊,使用對比學習的方法訓練圖片表示,分別使用圖像變換和同一知識點下的待選題目構造正樣本,不同知識點下的待選題目作為負樣本,得到圖片表示;
相似度計算模塊,計算所述待推薦題目和所述候選題目之間的余弦相似度;
去重模塊,輸入所述待推薦題目、所述候選題目和所述余弦相似度,根據去重策略去除與所述待推薦題目相同的待選題目,得到相似題目;
輸出模塊,輸出所述相似題目;
所述題目預處理模塊分別連接所述輸入模塊、所述題目儲存模塊、所述知識點預測模塊、所述文本對比學習模塊和所述圖片對比學習模塊,響應于所述輸入模塊輸入的所述原始待選題目及其知識點標簽,預處理后得到所述待選題目,然后把所述待選題目和所述知識點標簽寫入所述題目儲存模塊;響應于所述輸入模塊輸入的所述原始待推薦題目,預處理后得到所述待推薦題目,并發送到所述知識點預測模塊;響應于所述待推薦題目,所述知識點預測模塊預測知識點,根據預測得到的知識點讀取所述題目儲存模塊對應知識點標簽下的待選題目得到候選題目,然后在所述文本表示白化處理模塊做白化處理;所述待推薦題目在所述文本對比學習模塊訓練文本表示;所述待推薦題目在所述圖片對比學習模塊訓練圖片表示;白化處理的結果與所述文本表示、所述圖片表示共同輸入所述相似度計算模塊計算相似度,并通過所述去重模塊去重得到相似題目,然后把所述相似題目通過所述輸出模塊輸出。
2.如權利要求1所述的相似題目推薦系統,其特征在于,所述預處理包括將超文本標記語言移除,將不規范的表示轉化成Latex格式,對希臘字母、羅馬數字轉化為統一的字母題目表示。
3.如權利要求1所述的相似題目推薦系統,其特征在于,所述知識點預測模型使用編碼器-解碼器的結構。
4.如權利要求3所述的相似題目推薦系統,其特征在于,所述知識點預測模型設置12層編碼器層和12層解碼器層。
5.如權利要求1所述的相似題目推薦系統,其特征在于,所述知識點預測模塊使用隨機初始化權重對所述知識點預測模型進行訓練,輸入為待選題目,輸出為待選題目的知識點,訓練好之后保存知識點預測準確度最高的權重文件。
6.如權利要求1所述的相似題目推薦系統,其特征在于,所述去重策略為:使用編輯距離衡量待推薦題目和候選題目在文字上的相似程度,計算所述候選題目與所述待推薦題目的編輯距離,并設定重復閾值,如果所述編輯距離小于所述重復閾值,則認為所述候選題目與所述待推薦題目相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學寧波人工智能研究院,未經上海交通大學寧波人工智能研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210489847.5/1.html,轉載請聲明來源鉆瓜專利網。





