[發明專利]一種基于句法分析與關鍵詞檢測的MOOC課程評價方法在審
| 申請號: | 202010592147.X | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111813919A | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 楊宗凱;朱曉亮;譙宇同 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/9536;G06F40/211;G06F40/12;G06Q10/06;G06Q50/00;G06Q50/20 |
| 代理公司: | 武漢天力專利事務所 42208 | 代理人: | 吳曉穎 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 句法 分析 關鍵詞 檢測 mooc 課程 評價 方法 | ||
1.一種基于句法分析與關鍵詞檢測的MOOC課程評價方法,其特征在于該方法包括以下步驟:
(1)從MOOC課程論壇的討論區數據中檢索出需評價課程的發帖內容;
(2)對步驟(1)檢索出的發帖內容進行句法分析,提取出內容中包含的關系三元組,提取發帖內容中包含的主謂賓、動賓關系,以及包含課程名稱的句子;
(3)對步驟(2)提取出的關系按關鍵詞進行檢測,提取出包含關鍵詞的部分,進行情感分析得到情感分值;
(4)將步驟(3)中各項評價指標的分值按一定的權重進行匯總,得到課程的總體評分。
2.根據權利要求1所述的基于句法分析與關鍵詞檢測的MOOC課程評價方法,其特征在于步驟(2)中句法分析的具體過程如下:
(2-1)提取討論區發帖內容
MOOC課程論壇的討論區數據為記錄了每個帖子的課程id、課程名稱、作者id、帖子類型、主貼id、帖子id、標題、內容數據的CSV文件,使用Python的pandas模塊的read_csv方法對CSV文件進行讀取,從CSV文件中提取出待評價課程的課程id、課程名稱、標題、內容數據;具體的,定義search方法:將CSV文件以矩陣數據表的形式讀入,根據搜索需要設定對應的搜索條件,若需要搜索一門課程的所有發帖則設定課程名稱為搜索條件,若需要搜索標題或者內容包含特定關鍵詞的發帖則設定關鍵詞為搜索條件,若需要搜索某一帖子的所有主貼、回帖內容則設定主貼id為搜索條件,對矩陣數據表中的數據的對應部分進行逐一檢索,若符合搜索條件,則整條數據保存至一個新的矩陣數據表,并在整個搜索過程結束后將新的矩陣數據表進行輸出,為之后的步驟使用;
(2-2)對發帖內容進行依存句法分析
使用Python的pyltp模塊的Segmentor對象的segment方法對步驟(2-1)提取出的數據進行分詞,再使用Postagger的postag方法對分詞結果進行詞性標注,最后使用Parser的parse方法進行依存句法分析;
(2-3)對依存句法分析結果進行處理
對依存句法分析的結果,提取出其中包含特定依存關系對的部分,具體來說,首先提取出其中包含主謂賓關系的部分,在pyltp模塊中,主謂賓關系在依存句法分析中由主謂關系和動賓關系兩種依存關系組合而成,若語句中的某個動詞與其他詞語之間同時存在主謂關系和動賓關系,即可認為語句中包含了主謂賓關系,再提取出僅包含動賓關系的部分,同時,若該句子包含了待評價課程的名稱,也將該句子提取出來;
(2-4)對處理結果進行補全
對步驟(2-3)中經過處理得到的結果進行補全:若得到的詞語存在定中關系,將對應的定語添加到結果中;若得到的詞語為動詞,且存在主謂賓關系,則將每個動詞對應的主語、賓語也添加到結果中;重復此操作,直到沒有新詞語可以被添加;補全的結果即為句法分析過程的輸出結果。
3.根據權利要求1所述的基于句法分析與關鍵詞檢測的MOOC課程評價方法,其特征在于:步驟(3)中關鍵詞檢測的具體過程如下:
(3-1)關鍵詞的選擇與擴充
制定課程評價指標及其對應的評分權重,進而對對應的評價指標選取若干關鍵詞,構成評價體系;對選取的關鍵詞進行擴充,擴充關鍵詞需與基礎關鍵詞相關,使用Python的synonyms模塊的nearby方法,得到與基礎關鍵詞相關的一系列詞語,再選取其中與課程評價有關的詞語作為擴充關鍵詞,最終得到關鍵詞列表;
(3-2)按關鍵詞進行檢索評分
對于句法分析過程的輸出結果,按步驟(3-1)中得到的關鍵詞列表對每個關鍵詞進行檢索,對檢索得到的結果,使用Python的paddlehub模塊進行情感分析,并得到情感傾向分值,所得到的情感分值在-1到1區間內,小于0的分數代表消極傾向,大于0的分數代表積極傾向,0代表情感中性。
4.根據權利要求1所述的基于句法分析與關鍵詞檢測的MOOC課程評價方法,其特征在于步驟(4)中獲得總體評分的具體過程如下:
設第i個指標分值在總體評分中所占的權重為ωi,每個指標包括k個關鍵詞,第j個關鍵詞的分值為Scorej,則第i個指標分值的計算方法為:
設指標的總數為n,則課程的總體評分S計算方法為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010592147.X/1.html,轉載請聲明來源鉆瓜專利網。





