[發明專利]一種基于用戶行為的編程能力評估方法在審
| 申請號: | 201710776947.5 | 申請日: | 2017-09-01 |
| 公開(公告)號: | CN107704993A | 公開(公告)日: | 2018-02-16 |
| 發明(設計)人: | 鄭萌 | 申請(專利權)人: | 北京猿圈科技有限責任公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06 |
| 代理公司: | 北京匯信合知識產權代理有限公司11335 | 代理人: | 夏靜潔 |
| 地址: | 100089 北京市海淀區永*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 行為 編程 能力 評估 方法 | ||
1.一種基于用戶行為的編程能力評估方法,所述方法包括:
(1)采集編程過程數據;
(2)提取所述編程過程數據中編程行為特征;
(3)對所述編程行為特征進行數據處理;
(4)建立訓練模型;
(5)根據所述訓練模型對處理后的所述數據進行實驗,并生成實驗結果;
(6)根據所述實驗結果生成實驗結論。
2.根據權利要求1所述的基于用戶行為的編程能力評估方法,其特征在于,(1)所述采集編程過程數據,具體包括:
對用戶在所述編程過程中的行為進行采集,并對數據進行預處理。
3.根據權利要求1或2所述的基于用戶行為的編程能力評估方法,其特征在于,(2)所述提取所述編程過程數據中編程行為特征的具體步驟如下:
WEB瀏覽器發送編譯請求代碼至服務器;
所述服務器發送符合所述編譯請求代碼的類型的編譯器的開發環境信息至所述WEB瀏覽器,并且在所述WEB瀏覽器中形成與所述開發環境信息對應的開發環境;
所述WEB瀏覽器發送在所述開發環境下編寫的源代碼至所述編譯器;
所述編譯器發送運行所述源代碼的運行結果至所述WEB瀏覽器;所述WEB瀏覽器將編寫源代碼過程的過程信息實時發送至服務器,所述服務器根據所述過程信息生成并存儲記錄文件,所述WEB瀏覽器與所述服務器之間通過websocket實時通信。
4.根據權利要求3所述的基于用戶行為的編程能力評估方法,其特征在于,所述過程信息包括:用時、間隔用時,代碼編輯活動的編輯內容、工作量;
通過統計算法,得到所述編譯事件類型特征中基礎事件的統計,解決編譯錯誤的行為模式,編譯錯誤的發生模式,編譯錯誤的類型模式;
通過統計算法,得到所述組合特征包括中事件放到用戶不同編輯階段中進行統計信息,事件與用戶所處編程環境相結合信息。
5.根據權利要求4所述的基于用戶行為的編程能力評估方法,其特征在于,所述基礎事件的統計包括插入、刪除、復制和粘貼。
6.根據權利要求3所述的基于用戶行為的編程能力評估方法,其特征在于,(3)所述編程行為特征進行數據處理包括:
無效的編譯提交、含注釋操作的編譯提交及同一次編譯提交的編譯錯誤;
其中,無效的編譯提交為去除“無效編譯事件”的發生次數;
含注釋操作的編譯提交包括:通過所述行為特征的正則表達式找出每次編譯事件所對應的代碼快照中的注釋內容,根據編譯事件對的組織形式,對編譯事件所對應的代碼快照進行對比,從而辨認識別出編譯提交所屬的類型;根據是否包含注釋內容把一次編譯提交分為僅包含注釋內容的編譯提交和包含注釋內容以及其他代碼改動的編譯提交;若編譯提交屬于僅包含注釋內容的編譯提交的情況,則這次編譯提交事件需要被標注為無效編譯提交;若編譯提交屬于包含注釋內容以及其他代碼改動的編譯提交的情況,則這次編譯提交事件仍然有效;
同一次編譯提交的編譯錯誤為:在一次編譯提交中,同一種類型的編譯錯誤數量最多只計兩次封頂,而不是全部計入統計。
7.根據權利要求3任一項所述的基于用戶行為的編程能力評估方法,其特征在于,(4)所述建立訓練模型的具體步驟如下,
編程過程建模
首先,根據如下公式,
S=(s0,s1,……,si,……,sn)
其中,s0為編程過程的起始用程序的初始狀態;sn為編程過程的最終的程序狀態;
其次,根據如下公式
P=(s0,A1,e1,sI,……,Ai,ei,si,……,An,en,sn);及
Ai=(a1,a2,……,ai,……,an)
其中,s表示程序某一時刻的狀態,n表示用戶提交編譯事件的次數,ei表示si與si+1之間的提交編譯事件,Ai表示si與si+1之間的編程活動過程,即由一系列編程活動a組成的有序行為序列。
8.根據權利要求3所述的基于用戶行為的編程能力評估方法,其特征在于,(5)所述根據所述訓練模型對處理后的數據進行實驗,并生成實驗結果具體包括:
對不同分類器進行打分的準確率和預測分和時機評價分的差值的分布。
9.根據權利要求3所述的基于用戶行為的編程能力評估方法,其特征在于,(6)所述根據所述實驗結果生成實驗結論,包括:
預測準確性、計算高分段和低分段的樣本區分能力和二類用戶行為特征集的算法及效果預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京猿圈科技有限責任公司,未經北京猿圈科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710776947.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種采用數據庫應用插件的支付方法
- 下一篇:一種查詢HDFS數據方法及系統
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





