[發明專利]一種數學試題知識點自動化標注方法和裝置在審
| 申請號: | 201810067572.X | 申請日: | 2018-01-24 |
| 公開(公告)號: | CN108182177A | 公開(公告)日: | 2018-06-19 |
| 發明(設計)人: | 謝德剛;姚志峰 | 申請(專利權)人: | 謝德剛 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201235 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標注 數學試題 知識點 神經網絡模型 數學領域 自動化 預處理 方法和裝置 訓練樣本集 模型實現 數學題目 字符級別 詞向量 停用詞 語料庫 題庫 分詞 兩層 標準化 文本 學習 | ||
一種數學試題知識點自動化標注方法,該標注方法基于深度學習模型,所述標注方法包括步驟:S1:數學試題文本進行預處理,包括分別進行標準化、分詞和去停用詞處理;S2:準備數學領域語料庫,分別按字符級別,詞級別訓練數學領域詞向量;S3:搭建兩層TextCNN神經網絡模型,輸入有標注的數學試題訓練樣本集,訓練該神經網絡模型,利用該模型實現對新入題庫的數學題目進行知識點自動化標注。
技術領域
本發明屬于教學技術領域,特別涉及一種數學試題知識點自動化標注方法和裝置。
背景技術
隨著人工智能技術的不斷發展,深度學習越來越多得被運用于語音識別,圖像識別,自然語言處理等方面。深度學習的概念源于人工神經網絡的研究,含多隱藏層的多層感知器就是一種深度學習結構。深度學習框架能夠學習潛在的數據特征表示,從而找到特征數據與目標數據內在關系。在互聯網教育領域,線上題庫的建立與維護是“基石”。將新題目錄入到題庫的過程中,依賴于人工錄入,且標注題目相關信息(如題目知識點、考點、難度、題目類型等)。該工作既費時又費力。
發明內容
本發明的實施例提供一種基于深度學習技術的數學試題知識點自動化標注方法和裝置,目的在于解決現有的數學題庫對于試題無法自動標注知識點的問題。
本發明的實施例之一是,一種數學試題知識點自動化標注方法,該標注方法基于深度學習模型,所述標注方法包括步驟:
S1:數學試題文本進行預處理,包括分別進行標準化、分詞和去停用詞處理;
S2:準備數學領域語料庫,分別按字符級別,詞級別訓練數學領域詞向量;
S3:搭建兩層TextCNN神經網絡模型,輸入有標注的數學試題訓練樣本集,訓練該神經網絡模型,利用該模型實現對新入題庫的數學題目進行知識點自動化標注。
本發明的實施例之一,一種數學試題知識點自動化標注裝置,所述自動化標注裝置基于深度學習模型,該裝置包括存儲器;以及耦合到所述存儲器的處理器,該處理器被配置為執行存儲在所述存儲器中的指令,所述處理器執行以下操作:
S1:數學試題文本進行預處理,包括分別進行標準化、分詞和去停用詞處理;
S2:準備數學領域語料庫,分別按字符級別,詞級別訓練數學領域詞向量;
S3:搭建兩層TextCNN神經網絡模型,輸入有標注的數學試題訓練樣本集,訓練該神經網絡模型,利用該模型實現對新入題庫的數學題目進行知識點自動化標注。
本發明實施例還包括,一種基于深度學習的數學知識點自動化標注方法,包括如下步驟:
S1:準備標注好知識點的訓練樣本集,并對數學文本進行預處理。預處理工作具體包括文本標準化,規范化,分詞,去停用詞,tf-idf進行關鍵詞提取。其中tf-idf算法,基于詞頻和逆文檔率,計算詞語得分,反映出該詞語在該類文檔中的重要性程度;
S2:準備數學領域語料庫,分別按字符級別,詞級別訓練數學領域詞向量,將結果保存為{詞語/字符:詞向量}的字典形式,為之后訓練神經網絡模型備用;
S3:搭建兩層TextCNN神經網絡模型,輸入有標注的訓練樣本集,訓練模型。具體工作包括模型框架設計,本方法搭建兩層TextCNN網絡,結構為詞嵌入-卷積-池化-卷積-池化-dropout。其中,根據數學語言特點,設計多個不同視野的卷積核采集數學文本信息。詞嵌入為預先訓練的字符級\詞語級的word2vec向量。
在本發明說明書中提到的分詞、關鍵詞提取、詞嵌入,分別具有如下解釋:
分詞,針對中文文本無間隔特點,將其以詞語單位分開,便于程序輸入和后續分析處理。本方法采用jieba分詞法,并總結出數學領域專有詞表,對數學文本,連同數學表達式,進行分詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于謝德剛,未經謝德剛許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810067572.X/2.html,轉載請聲明來源鉆瓜專利網。





