[發(fā)明專利]一種錯(cuò)題收集及重難點(diǎn)知識(shí)提取方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010736373.0 | 申請(qǐng)日: | 2020-07-28 |
| 公開(kāi)(公告)號(hào): | CN111881285A | 公開(kāi)(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 吳鑫盈;趙耀;孫悅 | 申請(qǐng)(專利權(quán))人: | 揚(yáng)州大學(xué) |
| 主分類號(hào): | G06F16/34 | 分類號(hào): | G06F16/34;G06F16/33;G06F40/216;G06F40/289;G06K9/62;G06K9/20 |
| 代理公司: | 南京蘇科專利代理有限責(zé)任公司 32102 | 代理人: | 董旭東;趙荔 |
| 地址: | 225000 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 收集 難點(diǎn) 知識(shí) 提取 方法 | ||
1.一種錯(cuò)題收集及重難點(diǎn)知識(shí)提取方法,其特征在于,包括以下步驟:
(1)錯(cuò)題收集模塊收集錯(cuò)誤的題干和錯(cuò)題對(duì)應(yīng)的答案,錯(cuò)題收集模塊將收集到的錯(cuò)題的題干發(fā)送到題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中儲(chǔ)存,并將收集到的錯(cuò)誤的題干連同答案一起發(fā)送到錯(cuò)題數(shù)據(jù)庫(kù)中儲(chǔ)存;
(2)創(chuàng)建候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù);
(3)題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)與候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)進(jìn)行知識(shí)點(diǎn)匹配,得到題干知識(shí)點(diǎn);
(4)接收來(lái)自題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)的信息與題干知識(shí)點(diǎn)進(jìn)行比較,計(jì)算頻率,得出難點(diǎn)知識(shí);接收來(lái)自題庫(kù)的信息,進(jìn)行知識(shí)點(diǎn)匹配,計(jì)算頻率,得到重點(diǎn)知識(shí),將難點(diǎn)知識(shí)和重點(diǎn)知識(shí)分類放入重難點(diǎn)數(shù)據(jù)庫(kù);
(5)錯(cuò)題數(shù)據(jù)庫(kù)、題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)和重難點(diǎn)數(shù)據(jù)庫(kù)導(dǎo)出成文檔。
其中,候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中儲(chǔ)存有各種重難知識(shí)點(diǎn),題庫(kù)包括線上自帶的所有題目和新題目。
2.根據(jù)權(quán)利要求1所述的一種錯(cuò)題收集及重難點(diǎn)知識(shí)提取方法,其特征在于,所述步驟(3)中,知識(shí)點(diǎn)匹配的過(guò)程為,
(301)將題干分詞,并過(guò)濾掉題干中無(wú)用的詞匯;
(302)計(jì)算剩下的每個(gè)詞語(yǔ)在題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中的詞頻TF1(kp,di),(303)計(jì)算剩下的每個(gè)詞語(yǔ)在候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中的詞頻TF1(kp,dj);
(304)進(jìn)行相似度計(jì)算,相似度最高的為題干知識(shí)點(diǎn)。
3.根據(jù)權(quán)利要求2所述的一種錯(cuò)題收集及重難點(diǎn)知識(shí)提取方法,其特征在于,步驟(302)中,
步驟(303)中,
在步驟(303)和步驟(304)之間,還包括以下步驟:
(303a)計(jì)算TF-IDF1(kp,di)=TF(kp,di)*IDF(kp1),i=1,2,…m;
TF-IDF2(kp,dj)=TF(kp,dj)*IDF(kp2),j=1,2,…n;
將題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中的每個(gè)詞根據(jù)計(jì)算出的TF-IDF1(kp,di)的大小降序排列,將候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中的每個(gè)詞根據(jù)計(jì)算出的TF-IDF2(kp,dj)的大小降序排列;
其中,
m表示題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)的題干總數(shù),n表示候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)的題干總數(shù),kp表示某個(gè)詞語(yǔ),di表示第i個(gè)題干,表示kp在題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中出現(xiàn)的最大次數(shù);表示kp在候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中出現(xiàn)的最大次數(shù);
步驟(304)中,相似度計(jì)算具體過(guò)程為,
題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)和候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)的知識(shí)點(diǎn)按照步驟(303a)排序后構(gòu)成的向量空間為V={C1,C2,…,Ch},h為題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)和候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)合并后不同的知識(shí)點(diǎn)的數(shù)量,其中,Cg1表示知識(shí)點(diǎn),g1=1,2,…h(huán),題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中各個(gè)詞語(yǔ)的詞頻構(gòu)成的向量V1={X1,X2,…,Xh},Xg2表示知識(shí)點(diǎn)Cg2在題干知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中的詞頻,g2=1,2,…h(huán),候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)中各個(gè)詞語(yǔ)的詞頻構(gòu)成的向量V2={Y1,Y2,…,Yh},Yg3表示知識(shí)點(diǎn)Cg3在候選數(shù)據(jù)庫(kù)中的詞頻,g3=1,2,…h(huán),題干和候選知識(shí)點(diǎn)數(shù)據(jù)庫(kù)構(gòu)成的知識(shí)點(diǎn)向量相似度計(jì)算公式為:
cosθg為知識(shí)點(diǎn)Cg對(duì)應(yīng)的余弦值,余弦值越接近1,兩個(gè)向量越相似,即兩個(gè)知識(shí)點(diǎn)最相似,將最相似的知識(shí)點(diǎn)傳入重難點(diǎn)知識(shí)處理模塊。
4.根據(jù)權(quán)利要求1所述的一種錯(cuò)題收集及重難點(diǎn)知識(shí)提取方法,其特征在于,所述錯(cuò)題收集模塊包括線上錯(cuò)題收集單元和書(shū)面錯(cuò)題收集單元,線上錯(cuò)題收集單元收集錯(cuò)題時(shí),從題庫(kù)中自動(dòng)提取錯(cuò)誤的題干;書(shū)面錯(cuò)題收集單元將圖片轉(zhuǎn)換成計(jì)算機(jī)可以編輯的圖像放入圖像緩沖區(qū),在題干與答案開(kāi)始的第一行分別標(biāo)上不同的標(biāo)識(shí)符,圖像緩沖區(qū)先自動(dòng)識(shí)別標(biāo)識(shí)符,將題干與答案區(qū)分開(kāi)并生成信息發(fā)向?qū)?yīng)的數(shù)據(jù)庫(kù)。
5.根據(jù)權(quán)利要求1~4任一項(xiàng)所述的一種錯(cuò)題收集及重難點(diǎn)知識(shí)提取方法,其特征在于,所述步驟(5)中,錯(cuò)題數(shù)據(jù)庫(kù)導(dǎo)出錯(cuò)題,題干、錯(cuò)誤答案和正確答案分別以不同的顏色顯示,重難點(diǎn)數(shù)據(jù)庫(kù)導(dǎo)出的知識(shí)點(diǎn)中,重點(diǎn)和難點(diǎn)分別以不同的顏色顯示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于揚(yáng)州大學(xué),未經(jīng)揚(yáng)州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010736373.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 人機(jī)語(yǔ)言交互演繹系統(tǒng)及人機(jī)語(yǔ)言交互需求應(yīng)答的智能化實(shí)現(xiàn)方法
- 學(xué)生作業(yè)在線實(shí)時(shí)審閱系統(tǒng)
- 教學(xué)難點(diǎn)大數(shù)據(jù)分析系統(tǒng)
- 大型復(fù)材高精度難點(diǎn)零件的MBD測(cè)量工藝
- 一種數(shù)學(xué)難點(diǎn)題解題黑板
- 網(wǎng)絡(luò)教學(xué)內(nèi)容中難點(diǎn)檢測(cè)方法以及裝置
- 睡眠學(xué)習(xí)的應(yīng)用方法、裝置、系統(tǒng)和計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 智能防災(zāi)系統(tǒng)及智能防災(zāi)方法
- 一種錯(cuò)題收集及重難點(diǎn)知識(shí)提取方法
- 一種雙師直播課堂教學(xué)答疑的交互系統(tǒng)及方法
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





