[發(fā)明專利]一種題目分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201811583166.5 | 申請(qǐng)日: | 2018-12-24 |
| 公開(公告)號(hào): | CN109685137A | 公開(公告)日: | 2019-04-26 |
| 發(fā)明(設(shè)計(jì))人: | 金霄然 | 申請(qǐng)(專利權(quán))人: | 上海仁靜信息技術(shù)有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200331 上海市普陀*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 特征向量 神經(jīng)網(wǎng)絡(luò)分類器 題目分類 文本 存儲(chǔ)介質(zhì) 電子設(shè)備 融合 題目 圖片 公式信息 精準(zhǔn)分類 題目數(shù)據(jù) 拼接 標(biāo)簽 輸出 | ||
1.一種題目分類方法,其特征在于,所述方法包括:
對(duì)獲取到的題目數(shù)據(jù)中的文本、公式和圖片分別進(jìn)行編碼,得到所述文本、公式和圖片各自對(duì)應(yīng)的特征向量;
將所述文本、公式和圖片各自對(duì)應(yīng)的特征向量進(jìn)行拼接,得到融合特征向量,并將所述融合特征向量輸入預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器輸出題目分類標(biāo)簽。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對(duì)獲取到的所述題目數(shù)據(jù)中的文本、公式和圖片分別進(jìn)行編碼之前,所述方法還包括:
基于語(yǔ)法編譯器,將所述題目數(shù)據(jù)中的公式解析成語(yǔ)法樹;
相應(yīng)的,對(duì)題目數(shù)據(jù)中的公式進(jìn)行編碼,得到公式對(duì)應(yīng)的特征向量,包括:
通過樹形多層反饋神經(jīng)網(wǎng)絡(luò)對(duì)輸入的所述語(yǔ)法樹進(jìn)行特征提取,將所述語(yǔ)法樹編碼成公式特征向量;或
根據(jù)預(yù)設(shè)的教研規(guī)則在語(yǔ)法樹上抽取多個(gè)預(yù)先定義的特征,并對(duì)所述多個(gè)預(yù)先定義的特征進(jìn)行獨(dú)熱編碼。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于語(yǔ)法編譯器,將所述題目數(shù)據(jù)中公式解析成語(yǔ)法樹,包括:
從所述題目數(shù)據(jù)中提取公式,并將公式轉(zhuǎn)換成預(yù)設(shè)格式的公式;
基于語(yǔ)法編譯器,將轉(zhuǎn)換后的預(yù)設(shè)格式的公式解析成語(yǔ)法樹。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)獲取到的所述題目數(shù)據(jù)中的文本進(jìn)行編碼,包括:
通過多層反饋神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)對(duì)輸入的文本進(jìn)行特征提取,將所述文本編碼成文本特征向量。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)獲取到的所述題目數(shù)據(jù)中的圖片進(jìn)行編碼,包括:
通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)輸入的圖片進(jìn)行特征提取,將所述圖片編碼成圖片特征向量。
6.一種題目分類裝置,其特征在于,所述裝置包括:
編碼模塊,用于對(duì)獲取到的題目數(shù)據(jù)中的文本、公式和圖片分別進(jìn)行編碼,得到所述文本、公式和圖片各自對(duì)應(yīng)的特征向量;
分類模塊,用于將所述文本、公式和圖片各自對(duì)應(yīng)的特征向量進(jìn)行拼接,得到融合特征向量,并將所述融合特征向量輸入預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器輸出題目分類標(biāo)簽。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括:
解析模塊,用于基于語(yǔ)法編譯器,將所述題目數(shù)據(jù)中公式解析成語(yǔ)法樹;
相應(yīng)的,所述編碼模塊包括公式編碼單元,該公式編碼單元用于:
通過樹形多層反饋神經(jīng)網(wǎng)絡(luò)對(duì)輸入的所述語(yǔ)法樹進(jìn)行特征提取,將所述語(yǔ)法樹編碼成公式特征向量;或
根據(jù)預(yù)設(shè)的教研規(guī)則在語(yǔ)法樹上抽取多個(gè)預(yù)先定義的特征,并對(duì)所述多個(gè)預(yù)先定義的特征進(jìn)行獨(dú)熱編碼。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述解析模塊包括:
提取轉(zhuǎn)換單元,用于從所述題目數(shù)據(jù)中提取公式,并將其轉(zhuǎn)換成預(yù)設(shè)格式的公式;
解析單元,用于基于語(yǔ)法編譯器,將轉(zhuǎn)換后的預(yù)設(shè)格式的公式解析成語(yǔ)法樹。
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如權(quán)利要求1-5中任一所述的題目分類方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-5中任一所述的題目分類方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海仁靜信息技術(shù)有限公司,未經(jīng)上海仁靜信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811583166.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積神經(jīng)網(wǎng)絡(luò)分類器系統(tǒng)、其訓(xùn)練方法、分類方法和用途
- 一種基于憶阻器陣列的WTA神經(jīng)網(wǎng)絡(luò)及其應(yīng)用
- 可拓展的基于深度卷積神經(jīng)網(wǎng)絡(luò)的間隔棒識(shí)別方法
- 用于圖像處理的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法、裝置以及計(jì)算機(jī)設(shè)備
- 一種基于改進(jìn)徑向基神經(jīng)網(wǎng)絡(luò)的船舶設(shè)備故障診斷方法
- 基于采用深度Adaboost算法的BP人工神經(jīng)元網(wǎng)絡(luò)的噴射器性能的預(yù)測(cè)方法
- 一種基于深度學(xué)習(xí)的手勢(shì)識(shí)別方法
- 一種基于循環(huán)三維卷積神經(jīng)網(wǎng)絡(luò)的手勢(shì)識(shí)別方法
- 一種果樹分類方法及系統(tǒng)
- 應(yīng)用神經(jīng)網(wǎng)絡(luò)集成的故障診斷方法
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





