[發(fā)明專利]一種相似題目推薦系統(tǒng)和方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210489847.5 | 申請(qǐng)日: | 2022-05-07 |
| 公開(公告)號(hào): | CN114817545A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 張學(xué)忠;王冠;楊根科;褚健 | 申請(qǐng)(專利權(quán))人: | 上海交通大學(xué)寧波人工智能研究院 |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F16/335;G06K9/62 |
| 代理公司: | 上海劍秋知識(shí)產(chǎn)權(quán)代理有限公司 31382 | 代理人: | 徐浩俊 |
| 地址: | 315012 浙江省*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 相似 題目 推薦 系統(tǒng) 方法 | ||
本發(fā)明公開了一種相似題目推薦系統(tǒng)和方法,涉及自然語(yǔ)言處理和在線教育技術(shù)領(lǐng)域,一種相似題目推薦系統(tǒng)包括輸入模塊、題目預(yù)處理模塊、題目?jī)?chǔ)存模塊、知識(shí)點(diǎn)預(yù)測(cè)模塊、文本表示白化處理模塊、文本對(duì)比學(xué)習(xí)模塊、圖片對(duì)比學(xué)習(xí)模塊、相似度計(jì)算模塊、去重模塊和輸出模塊。本發(fā)明公開了一種相似題目推薦方法,包括S100、前置準(zhǔn)備,S200、待推薦題目輸入和預(yù)處理,S300、對(duì)比學(xué)習(xí)訓(xùn)練文本表示,S400、對(duì)比學(xué)習(xí)訓(xùn)練圖片表示,S500、預(yù)測(cè)待推薦題目的知識(shí)點(diǎn),S600、讀取候選題,S700、計(jì)算文本表示并白化,S800、拼接得到題目表示,S900、排序和去除相同的候選題目,S1000、相似題目輸出。本發(fā)明顯著提高了相似題目推薦的速度和準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語(yǔ)言處理和在線教育技術(shù)領(lǐng)域,尤其涉及一種基于知識(shí)點(diǎn)預(yù)測(cè)和語(yǔ)義相似度計(jì)算的相似題目推薦方法。
背景技術(shù)
近年來(lái),人工智能技術(shù)蓬勃發(fā)展,并被廣泛的應(yīng)用于教育領(lǐng)域,幫助減少老師的課后工作量,提高學(xué)生的學(xué)習(xí)效率。學(xué)生在學(xué)習(xí)中,對(duì)于做錯(cuò)的題目和理解不充分的題目,需要更多與之相似的題目進(jìn)行練習(xí)。老師在教學(xué)中,也常常需要給出一道題目的相似題目以供同學(xué)們?nèi)ゾ毩?xí)。因此,根據(jù)已練習(xí)的題目,從大量的按知識(shí)點(diǎn)分類儲(chǔ)存的題庫(kù)中推薦出相似的題目成為一個(gè)重要的需求,如何更好的實(shí)現(xiàn)上述相似題目的推薦成為了一項(xiàng)關(guān)鍵的技術(shù)。
實(shí)現(xiàn)上述任務(wù)的基本思路是將待推薦題目和候選題表示成固定長(zhǎng)度的表示,計(jì)算表示之間的距離并排序,從而得到相似題目。但是,如果對(duì)整個(gè)題庫(kù)進(jìn)行計(jì)算距離計(jì)算,其計(jì)算量太大,所以需要根據(jù)候選題對(duì)應(yīng)的知識(shí)點(diǎn)信息做召回,從而縮小候選題的范圍。因此,本專利的其中一個(gè)關(guān)鍵點(diǎn)在于精準(zhǔn)定位待推薦題目所屬的知識(shí)點(diǎn),以及將題目表示成準(zhǔn)確的語(yǔ)義表示,從而計(jì)算語(yǔ)義相似度。
專利《一種相似題目的推薦方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)》(CN201811582965.0)使用分類的方法對(duì)待推薦題目的知識(shí)點(diǎn)進(jìn)行預(yù)測(cè),每一道待推薦題只有單個(gè)知識(shí)點(diǎn)。然而同一道題目常常包含多個(gè)不同的知識(shí)點(diǎn),并且知識(shí)點(diǎn)之間也有復(fù)雜的結(jié)構(gòu)化關(guān)系,所以用分類方法并不能很好的對(duì)題目所屬的知識(shí)點(diǎn)進(jìn)行預(yù)測(cè)。本發(fā)明專利將其作為一個(gè)序列到序列的問題,采用編碼器-解碼器模型,將知識(shí)點(diǎn)的多層級(jí)樹狀結(jié)構(gòu)做深度優(yōu)先遍歷轉(zhuǎn)化成一個(gè)序列,從而很好的解決了以往專利的無(wú)法預(yù)測(cè)多個(gè)知識(shí)點(diǎn)和知識(shí)點(diǎn)結(jié)構(gòu)化缺失的問題。
專利《相似題目的檢索方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)》(CN201910913733.7)提供一種相似題目的檢索方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì),并未對(duì)如何將題目表示成特征表示的方法進(jìn)行具體的說(shuō)明?!兑环N相似題目的推薦方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)》(CN201811582965.0)將知識(shí)點(diǎn)的概率分布表示作為特征表示,但是無(wú)法表示原題目的語(yǔ)義信息。專利《一種理科相似題推薦方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)》(CN202111278966.8)使用了詞表示模型作為題目的表示表示,該方法的詞表示不會(huì)隨語(yǔ)境不同而變化,因此準(zhǔn)確度仍然不高。專利《一種基于語(yǔ)義信息的相似題推薦系統(tǒng)及其使用方法》(CN202110639976.3)專利使用Bert(Bidirectional Encoder Representation fromTransformers,雙向編碼器語(yǔ)言表征模型)的輸出作為文本表示。但Bert的輸出具有各向異性,其高頻詞會(huì)集中分布在一個(gè)“窄錐”區(qū)域,所以使用Bert的文本表示計(jì)算相似度,會(huì)存在的粗粒度范圍內(nèi)的相似值都很高,細(xì)粒度區(qū)分度缺失的問題。
因此,本領(lǐng)域的技術(shù)人員致力于開發(fā)一種相似題目推薦系統(tǒng)和方法。
發(fā)明內(nèi)容
有鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明所要解決的技術(shù)問題是如何提高相似題目推薦的速度與準(zhǔn)確性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué)寧波人工智能研究院,未經(jīng)上海交通大學(xué)寧波人工智能研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210489847.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 相似圖像提取裝置、相似圖像提取方法以及相似圖像提取程序
- 一種鋼結(jié)構(gòu)火災(zāi)反應(yīng)分析方法
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像搜索方法、裝置和存儲(chǔ)介質(zhì)
- 基于相似壽命模型和相似壽命的復(fù)雜產(chǎn)品可靠性評(píng)定方法
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 口罩(相似)
- 臺(tái)燈(相似)
- 一種問卷邏輯控制方法,及裝置
- 一種自動(dòng)修改題目錯(cuò)誤的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 電子題目的生成方法、生成裝置及終端
- 一種題目推薦方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 直播搜題方法、裝置、終端設(shè)備和存儲(chǔ)介質(zhì)
- 一種在線教育題目生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 題目抽取方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種題目條件替換后的解題方法
- 題目識(shí)別方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)





