[發明專利]基于自然語言處理的教育資源質量評價挖掘方法及系統有效
| 申請號: | 201910431440.5 | 申請日: | 2019-05-22 |
| 公開(公告)號: | CN110147552B | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 季一木;許正陽;劉強;劉尚東;堯海昌;李奎;劉艷蘭 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06Q10/06;G06Q50/20 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自然語言 處理 教育 資源 質量 評價 挖掘 方法 系統 | ||
本發明公開了一種基于自然語言處理的教育資源質量評價挖掘方法及系統,首先從海量教育評論數據中使用自然語言處理技術挖掘用戶評價觀點,以評價對象,評價詞二元組存儲。其次,以評價對象,評價詞為指標結點建立。然后基于教育資源語料庫通過神經網絡對詞向量進行訓練,建立詞到向量的模型。再對評價對象進行聚類,再按照floyd算法選出中心向量。接著對評價詞進行聚類,生成資源評價指標樹,選出的中心向量作為評價指標樹的結點,最后對評價詞進行情感分析并打分輸出。解決了基于眾籌眾創的數字教育評價數據量過大,人工評價方法成本高、難度大、主觀性高等問題。
技術領域
本發明涉及一種數字教育資源質量評價的方法,尤其涉及一種基于自然語言處理的教育資源質量評價挖掘方法及系統。
背景技術
隨著互聯網技術發展,遠程教育發展迅猛,數字化教育資源也在信息化發展過程中起到日益重要的作用。隨著大數據時代的到來和教育信息化的不斷推進,數字教育資源在數量上呈現‘爆炸式的增長。大數據的提出者麥肯希稱:“當今的每一個行業和業務職能領域都已被數據滲透其中,數據已然成為重要的生產因素。”,人們也在挖掘和運用大數據的道路上越走越遠。利用大數據的挖掘和分析進行教育資源的質量評價,建設課程質量保障體質,在為用戶提供課程質量評價服務的同時,為眾籌眾創過程中教育資源的質量提供保障。
數字化學習資源也呈現出種類繁雜混亂、可用性缺乏,使用戶難以選擇的現象。究其原因,主要在于數字化學習資源需要準確的質量評價方法和有效的質量控制機制。如今,在現代教育技術領域已經提出了許多成熟的質量評價框架,Achieve(2011)提出了一種名為OER Rubric的質量評價框架,其中包含8個評價指標;Quality Matters(2014)提出了基于八個評價維度的QM框架。在國內,教育部于2013年提出了國家精品資源共享課評審指標體系;于2010年提出國家精品課程評價指標體系。
雖然,教育質量評價已經有了很成熟的理論框架,但在應用領域仍有許多不足之處。比如教育質量評價無法對教學資源進行定量評價,因為當下的定量評價方法多以問卷的方式實現,問卷帶有過多的主觀性和非真實性,在質量評價方面有無法彌補的缺陷性。在自動化質量評價方面,2015年,肖奎,李兵等人提出了一種基于用戶行為分析的維基百科詞條質量評價方法,運用維基百科資源特有的點擊量、編輯次數等客觀數據進行機器學習的分類。由麗萍等人提出了一種基于自然語言處理和TOPSIS法的質量評價方法,基于酒店的評論數據對酒店的環境、服務等各方面指標進行了質量評價。
據研究表面,當前質量評價在計算機領域的應用主要分為兩大類:基于資源自身屬性的數據進行機器學習的簡單分類;基于自然語言處理的情感分析評價,從而判定詞條的質量。前者主要研究教育資源屬性方面與教育資源質量的關系,運用機器學習的方法進行簡單的分類,后者通過情感分析,使評價者的評論數據化。這些方法在一定程度上提高了質量評價的準確性,拓寬了質量評價的方法。但總體而言,在教育資源質量評價方面的研究仍然處于起步階段,應用于數字教育資源,基于細粒度評價模型的自動化質量評價方法還有待于研究。
發明內容
發明目的:為了克服現有技術中存在的不足,本發明提供一種基于自然語言處理的,對于用戶生成的海量評價自動化處理的教育資源質量評價方法及系統,首先從評論數據集中提取評價搭配二元組,再將二元組向量化,最后分別以評價對象、評價詞進行聚類,通過floyd算法確定中心向量值,構建三層評價樹,最后用情感分析字典進行打分,解決了基于眾籌眾創的數字教育評價數據量過大,人工評價方法成本高、難度大、主觀性高等問題。
技術方案:為實現上述目的,本發明采用的技術方案為:
一種基于自然語言處理的教育資源質量評價挖掘方法,其特征在于,包括以下步驟:
步驟1,采集教育資源評價數據,去除無效評論。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910431440.5/2.html,轉載請聲明來源鉆瓜專利網。





