[發明專利]一種代碼抄寫行為識別方法、裝置和系統有效
| 申請號: | 201710867292.2 | 申請日: | 2017-09-22 |
| 公開(公告)號: | CN107679567B | 公開(公告)日: | 2021-04-27 |
| 發明(設計)人: | 方宏;方達 | 申請(專利權)人: | 江蘇海事職業技術學院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F11/34 |
| 代理公司: | 江蘇銀創律師事務所 32242 | 代理人: | 孫計良 |
| 地址: | 211170 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 代碼 抄寫 行為 識別 方法 裝置 系統 | ||
本發明公開了一種代碼抄寫行為識別方法、裝置和系統。其中系統包括編輯端裝置和客戶端裝置。編輯端裝置包括UI模塊、行為記錄模塊以及作業電子包生成模塊。行為記錄模塊用于提取所述UI模塊中學生編輯代碼的鍵盤和鼠標的輸入輸出記錄生成編輯行為記錄。作業電子包生成模塊用于將作業代碼集和編輯行為記錄打包成作業電子包。識別端裝置包括作業輸入模塊、相似分析模塊、分類學習模塊以及抄寫識別模塊。識別端裝置通過分析學生代碼相似度找出相似學生集,然后根據相似學生的編輯行為記錄采用機器學習算法進行分析得到該相似學生是否抄寫行為。
技術領域
本發明涉及學生程序作業的自動化批改。
背景技術
在學生編程作業及編程考試中,同學之間互相抄襲、甚至替人寫代碼的現象時有發生,人工發現抄襲的代碼,需要逐個比對每份提交的代碼,費時費力;通過代碼查重軟件對提交的源代碼文本進行相似度檢查來判斷是否存在抄襲,是目前應用較多的方法;但對于編程初學者,很多題目使用同一種算法,代碼量也不多,代碼相似度普遍較高,影響了抄襲判斷的準確度;而且該方法難以判斷誰是抄襲者。
發明內容
本發明所要解決的問題:判斷學生編程作業中是否存在抄襲。
為解決上述問題,本發明采用的方案如下:
根據本發明的一種代碼抄寫行為識別方法,包括如下步驟:
S1:獲取各個學生的作業電子包;所述作業電子包內包含有作業代碼集和編輯行為記錄;所述編輯行為記錄為學生在終端編輯代碼時所獲得鍵盤和鼠標的輸入輸出記錄;
S2:計算各個學生的作業電子包內的作業代碼集與其他學生的作業電子包內的作業代碼集的相似度值,選取所述相似度值超過限值的學生作為該學生的相似學生,從而得到各個學生的所對應的相似學生集合;
S3:采用分類學習算法,對各個學生的所對應的相似學生集合內的相似學生的編輯行為記錄與該學生的編輯行為記錄進行分析判斷該相似學生是否抄寫。
進一步,根據本發明的代碼抄寫行為識別方法,所述分類學習算法為隨機森林算法。
根據本發明的一種代碼抄寫行為識別裝置,該裝置包括以下模塊:
M1,用于:獲取各個學生的作業電子包;所述作業電子包內包含有作業代碼集和編輯行為記錄;所述編輯行為記錄為學生在終端編輯代碼時所獲得鍵盤和鼠標的輸入輸出記錄;
M2,用于:計算各個學生的作業電子包內的作業代碼集與其他學生的作業電子包內的作業代碼集的相似度值,選取所述相似度值超過限值的學生作為該學生的相似學生,從而得到各個學生的所對應的相似學生集合;
M3,用于:采用分類學習算法,對各個學生的所對應的相似學生集合內的相似學生的編輯行為記錄與該學生的編輯行為記錄進行分析判斷該相似學生是否抄寫。
進一步,根據本發明的代碼抄寫行為識別裝置,所述分類學習算法為隨機森林算法。
根據本發明的一種代碼抄寫行為識別系統,該系統包括編輯端裝置和識別端裝置;
所述編輯端裝置包括UI模塊、行為記錄模塊以及作業電子包生成模塊;所述UI模塊用于為學生編輯代碼提供UI交互;所述行為記錄模塊用于提取所述UI模塊中學生編輯代碼的鍵盤和鼠標的輸入輸出記錄生成編輯行為記錄;所述作業電子包生成模塊用于將學生編輯代碼所生成的作業代碼集和所述行為記錄模塊所生成的編輯行為記錄打包成作業電子包;所述作業電子包內包含有作業代碼集和編輯行為記錄;
所述識別端裝置包括作業輸入模塊、相似分析模塊、分類學習模塊以及抄寫識別模塊;
所述作業輸入模塊用于獲取各個學生的作業電子包;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇海事職業技術學院,未經江蘇海事職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710867292.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種達羅魯胺的晶型制備方法
- 下一篇:帶有過濾器元件的吸塵器





