[發(fā)明專利]一種題目分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201811583166.5 | 申請(qǐng)日: | 2018-12-24 |
| 公開(公告)號(hào): | CN109685137A | 公開(公告)日: | 2019-04-26 |
| 發(fā)明(設(shè)計(jì))人: | 金霄然 | 申請(qǐng)(專利權(quán))人: | 上海仁靜信息技術(shù)有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200331 上海市普陀*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 特征向量 神經(jīng)網(wǎng)絡(luò)分類器 題目分類 文本 存儲(chǔ)介質(zhì) 電子設(shè)備 融合 題目 圖片 公式信息 精準(zhǔn)分類 題目數(shù)據(jù) 拼接 標(biāo)簽 輸出 | ||
本公開實(shí)施例公開了一種題目分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),其中所述方法包括:對(duì)獲取到的題目數(shù)據(jù)中的文本、公式和圖片分別進(jìn)行編碼,得到所述文本、公式和圖片各自對(duì)應(yīng)的特征向量;將所述文本、公式和圖片各自對(duì)應(yīng)的特征向量進(jìn)行拼接,得到融合特征向量,并將所述融合特征向量輸入預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器輸出題目分類標(biāo)簽。本公開實(shí)施通過提取并融合題目中的文本、圖片和公式信息的特征,并將其輸入到神經(jīng)網(wǎng)絡(luò)分類器中,以達(dá)到對(duì)題目進(jìn)行自動(dòng)精準(zhǔn)分類的目的。
技術(shù)領(lǐng)域
本公開涉及在線教育領(lǐng)域,尤其涉及一種題目分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
在K12(kindergarten through twelfth grade)教育的題庫構(gòu)建、智能測(cè)評(píng)、自適應(yīng)學(xué)校等領(lǐng)域均需要對(duì)題目進(jìn)行分類,以便更好地檢測(cè)學(xué)生當(dāng)前的學(xué)習(xí)水平和狀態(tài),并相應(yīng)地實(shí)時(shí)調(diào)整學(xué)習(xí)活動(dòng)和進(jìn)程,幫助學(xué)生實(shí)現(xiàn)差異化和個(gè)性化的學(xué)習(xí),通常可以根據(jù)題目的知識(shí)點(diǎn)、難度、題型等對(duì)題目進(jìn)行分類。
針對(duì)題目的分類方法,現(xiàn)有的技術(shù)方案一般基于傳統(tǒng)的短文本分類方法,通常其分類流程為利用分詞工具對(duì)文本進(jìn)行分詞處理、提取特征、利用傳統(tǒng)的分類器如SVM或RF進(jìn)行分類。這類技術(shù)方案有如下問題:
1.K12教育中的題目往往連帶著圖片,如物理中的電路圖,化學(xué)中的流程圖,數(shù)學(xué)中的程序框圖等,現(xiàn)有的文本分類方法無法利用圖片中存在的特征。
2.K12教育中的題目基本存在著公式。公式作為一種特殊形式的文本,有著自己內(nèi)在的結(jié)構(gòu)和特殊性。現(xiàn)有的文本分類方法無法有效地利用公式中存在的信息進(jìn)行分類。
公開內(nèi)容
本公開實(shí)施例提供了一種題目分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以解決現(xiàn)有技術(shù)中傳統(tǒng)的短文本分類方法無法有效利用題目中圖片和公式,使得題目分類的準(zhǔn)確度低的技術(shù)問題。
第一方面,本公開實(shí)施例提供了一種題目分類方法,包括:
對(duì)獲取到的題目數(shù)據(jù)中的文本、公式和圖片分別進(jìn)行編碼,得到所述文本、公式和圖片各自對(duì)應(yīng)的特征向量;
將所述文本、公式和圖片各自對(duì)應(yīng)的特征向量進(jìn)行拼接,得到融合特征向量,并將所述融合特征向量輸入預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器輸出題目分類標(biāo)簽。
第二方面,本公開實(shí)施例還提供了一種題目分類裝置,包括:
編碼模塊,用于對(duì)獲取到的題目數(shù)據(jù)中的文本、公式和圖片分別進(jìn)行編碼,得到所述文本、公式和圖片各自對(duì)應(yīng)的特征向量;
分類模塊,用于將所述文本、公式和圖片各自對(duì)應(yīng)的特征向量進(jìn)行拼接,得到融合特征向量,并將所述融合特征向量輸入預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器輸出題目分類標(biāo)簽。
第三方面,本公開實(shí)施例還提供了一種電子設(shè)備,包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如本公開實(shí)施例中任一所述的題目分類方法。
第四方面,本公開實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本公開實(shí)施例中任一所述的題目分類方法。
本公開實(shí)施例提供的一種題目分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),通過對(duì)題目數(shù)據(jù)中的文本、公式和圖片進(jìn)行編碼,并將編碼后的文本、公式和圖片各自對(duì)應(yīng)的特征向量融合,基于融合后的特征向量,利用神經(jīng)網(wǎng)絡(luò)分類器題目進(jìn)行自動(dòng)、高效、準(zhǔn)確的分類。
附圖說明
圖1a是本公開一實(shí)施例提供的一種題目分類方法的流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海仁靜信息技術(shù)有限公司,未經(jīng)上海仁靜信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811583166.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積神經(jīng)網(wǎng)絡(luò)分類器系統(tǒng)、其訓(xùn)練方法、分類方法和用途
- 一種基于憶阻器陣列的WTA神經(jīng)網(wǎng)絡(luò)及其應(yīng)用
- 可拓展的基于深度卷積神經(jīng)網(wǎng)絡(luò)的間隔棒識(shí)別方法
- 用于圖像處理的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法、裝置以及計(jì)算機(jī)設(shè)備
- 一種基于改進(jìn)徑向基神經(jīng)網(wǎng)絡(luò)的船舶設(shè)備故障診斷方法
- 基于采用深度Adaboost算法的BP人工神經(jīng)元網(wǎng)絡(luò)的噴射器性能的預(yù)測(cè)方法
- 一種基于深度學(xué)習(xí)的手勢(shì)識(shí)別方法
- 一種基于循環(huán)三維卷積神經(jīng)網(wǎng)絡(luò)的手勢(shì)識(shí)別方法
- 一種果樹分類方法及系統(tǒng)
- 應(yīng)用神經(jīng)網(wǎng)絡(luò)集成的故障診斷方法
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





