[發明專利]基于自然語言處理的教育資源質量評價挖掘方法及系統有效
| 申請號: | 201910431440.5 | 申請日: | 2019-05-22 |
| 公開(公告)號: | CN110147552B | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 季一木;許正陽;劉強;劉尚東;堯海昌;李奎;劉艷蘭 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06Q10/06;G06Q50/20 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自然語言 處理 教育 資源 質量 評價 挖掘 方法 系統 | ||
1.一種基于自然語言處理的教育資源質量評價挖掘方法,其特征在于,包括以下步驟:
步驟1,采集教育資源評價數據,去除無效評論;
步驟2,評價搭配抽取;能夠表達用戶情感的評價對象和評價短語由多個詞語組成,每一組詞構成一個評價對象,評價詞的評價搭配;對評價進行分句,用帶權詞典構建Trie樹,根據Trie樹對待分句生成所有可能詞為結點組成的有向無環圖,通過動態規劃法以權值最大的路徑輸出為分詞結果;再對待處理句子進行依存句法分析,然后將滿足規則關系的搭配提取為評價搭配二元組,以評價對象,評價詞的結構保存;
步驟3,將自然語言向量化;word2vec采用的模型包含了連續詞袋模型CBOW和Skip-Gram模型;通過word2vec進行高效訓練從而得到詞向量,詞向量之間的距離表示詞和詞之間的相似程度;
步驟4,構建knn聚類模型;取評價對象向量集合Si,包含i個m種類的評價搭配詞向量模型,當第i+1個詞向量加入集合時,計算Ci+1與所有向量的余弦相似度sim;確定k的值為N×B,N為元組總數,B這里取1/10,將sim按照從小到大的順序排序,選取前k個向量tensors,統計這k個向量中所屬分類比例最大的,則這個向量屬于該分類;
步驟5,選出中心評價對象向量;通過floyd算法計算每一類中所有向量之間的余弦相似度,保存在矩陣S中,S[i][j]表示向量i與向量j的余弦相似度;遍歷S選取與其他向量相似度最小的向量作為類別的中心向量;中心向量對應的評價對象則為中心評價對象;
步驟6,選出中心評價詞對象;在以評價對象分的每一類中重復步驟5,選出中心詞評價向量組;
步驟7,生成評價樹;生成以資源,評價對象,評價詞為結點的評價樹,其中,資源為根結點,評價對象為二級結點,評價詞為三級結點;
步驟8,對評價詞進行情感分析;經過分類統計,得到關于評價對象的情感得分,再通過權重矩陣值得出整個資源的評分;將情感分成兩類標簽集:消極和積極;對于消極的評價詞,我們記作‘-1’,積極的評價詞記做‘1’;對于某含有a個中心詞的評價對象O,它的評分值屬于[-a,a]區間;對于含有x個評價對象的資源,它的評分值屬于[-x*a,x*a];
步驟9,用戶偏好矩陣構建;對于x個評價對象,獲得用戶偏好向量X,有Xi∈(0,1),用戶對某一評價對象偏好越大,相應的Xi值就越大;
步驟10,獲得資源評價得分;將評價對象得分向量A與用戶偏好向量X點乘,獲得最后的資源評價得分。
2.根據權利要求1所述基于自然語言處理的教育資源質量評價挖掘方法,其特征在于:步驟1中去除以符號字符為主的無效評論。
3.根據權利要求2所述基于自然語言處理的教育資源質量評價挖掘方法,其特征在于:步驟3中采用google開源框架word2vec,加載由大量百科詞庫訓練的模型,將評價對象,評價詞二元組轉化成1×64向量二元組。
4.根據權利要求3所述基于自然語言處理的教育資源質量評價挖掘方法,其特征在于:步驟7中對于評價生成樹,必須保證每一個上級結點下至少對應一個下級節點。
5.一種采用權利要求1所述基于自然語言處理的教育資源質量評價挖掘方法制成的系統,其特征在于:包括教育資源評價數據輸入模塊、去除無效評論模塊、評價搭配抽取模塊、將自然語言向量化模塊、構建knn聚類模型模塊、選出中心評價對象向量模塊、選出中心評價詞對象模塊、生成評價樹模塊、對評價詞進行情感分析模塊、用戶偏好矩陣構建模塊、獲得資源評價得分模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910431440.5/1.html,轉載請聲明來源鉆瓜專利網。





