[發明專利]一種要點題自動評價方法及裝置有效
| 申請號: | 201710050484.4 | 申請日: | 2017-01-23 |
| 公開(公告)號: | CN106897384B | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 沙晶;盛志超;陳志剛;魏思;胡國平;胡郁 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06Q50/20 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 230088 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 要點 自動 評價 方法 裝置 | ||
本發明實施例提供了一種要點題自動評價方法及裝置,其中方法包括:獲取待評價的答題數據;將所述答題數據向量化;對向量化后的所述答題數據進行聚類,將聚類結果作為初步答題要點;根據所述初步答題要點把所述答題數據分割為一個個分析單元,其中每個所述分析單元最多只涉及單個所述初步答題要點;對分割為一個個分析單元的所述答題數據重新進行聚類,將新的聚類結果作為精確答題要點;將所述精確答題要點輸入預先構建的評價模型,以得到所述答題數據的評價結果。本發明實施例中提出了一種基于語義的要點題自動評價方法,無需人工根據經驗去擴展答案,克服了現有技術中所存在的主觀性、準確性方面的不足。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種要點題自動評價方法及裝置。
背景技術
當前在教育領域中,無論基礎教育還是成人教育,無論學校教學還是在線教學,學生學習狀況的主要考察形式仍然是各種類型的考試。由于考試繁多,教師通常背負著很大的批改試卷的壓力,且效率很低,同時在為大量試卷評分時,教師也容易受到疲勞、個人偏好等主觀因素的干擾,從而影響試卷評分時的準確性和客觀性。
近年來,隨著信息技術的飛速發展,在傳統的教育領域也逐漸開展新一代的教育信息化升級探索,如何利用計算機輔助完成對試卷等內容的評價、減少人工評閱工作量、提升評分的準確性和客觀性,對教學過程意義重大。在各種題型中,要點題是一類較難評分的題型。要點題是指答案包含較為明確的答題要點的題型,例如簡答題、辨析題等,其中要點可以是關鍵詞、關鍵語句等,如果考生的答案涵蓋了正確的要點,則可以獲得相應的得分。
為了實現自動評閱要點題,在現有技術中,一種方案是先人工輔助制作參考答案,參考答案中除了包括標準答案外,還包括基于標準答案擴展得到的其他合理答案,然后將試卷中考生的作答內容與參考答案進行匹配,最終獲得評分結果。然而發明人在實現本發明的過程中發現,這種方式由于需要人工根據經驗對標準答案進行擴展,容易受到人員素質、個人偏好等的影響,而且人工擴展標準答案這種方法的覆蓋范圍有限,很難枚舉所有合理答案,容易造成評分錯誤。
發明內容
本發明提供一種要點題自動評價方法及裝置,以提高自動評閱要點題時的準確性和客觀性。
根據本發明實施例的第一方面,提供一種要點題自動評價方法,所述方法包括:
獲取待評價的答題數據;
將所述答題數據向量化;
對向量化后的所述答題數據進行聚類,將聚類結果作為初步答題要點;
根據所述初步答題要點把所述答題數據分割為一個個分析單元,其中每個所述分析單元最多只涉及單個所述初步答題要點;
對分割為一個個分析單元的所述答題數據重新進行聚類,將新的聚類結果作為精確答題要點;
將所述精確答題要點輸入預先構建的評價模型,以得到所述答題數據的評價結果。
可選的,將所述答題數據向量化,包括:
對所述答題數據分詞,并獲取每個詞的詞向量;
根據所述詞向量獲取所述答題數據中每個基本單元對應的向量,以完成所述答題數據的向量化。
可選的,對向量化后的所述答題數據進行聚類,包括:
獲取預定義的聚類數目;
根據所述聚類數目對向量化后的所述答題數據進行第一次聚類;
對所述第一次聚類后得到的類別中心進行第二次聚類,以得到聚類結果。
可選的,所述第一次聚類之后,所述第二次聚類之前,所述方法還包括:
獲取答題要點過濾表;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710050484.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:家用電器系統和大數據平臺
- 下一篇:一種基于關聯矩陣的不確定數據連接合并算法





