[發明專利]一種基于TextRank和卷積神經網絡的小學作文自動分類方法有效
| 申請號: | 201810671815.0 | 申請日: | 2018-06-26 |
| 公開(公告)號: | CN109062958B | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 朱曉亮;劉三女牙;孫建文;石昀東 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04 |
| 代理公司: | 武漢天力專利事務所 42208 | 代理人: | 吳曉穎 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 textrank 卷積 神經網絡 小學 作文 自動 分類 方法 | ||
1.一種基于TextRank和卷積神經網絡的小學作文自動分類方法,其特征在于該方法包括以下步驟:
(1)分析小學作文常見的寫人、敘事、寫景、狀物、讀后感五類作文的特征,并以此為標準對數據集進行劃分;
(2)使用基于TextRank的關鍵句提取模型為各類作文提取關鍵句來去除多余的語義信息并將其作為數據集;
(3)在卷積神經網絡的第一層,隨機初始化數據集中每個字的word embedding,將每條數據中的字映射到其對應的word embedding組成二維特征矩陣作為卷積神經網絡的輸入;
(4)在卷積神經網絡的第二層,使用一維卷積核與輸入文本的特征矩陣進行卷積運算,得到的結果經過非線性變換并加上偏置向后,最終生成和卷積核數量一致的文本的多層局部卷積特征圖;
(5)在卷積神經網絡第三層,使用max-pooling算法對多層局部卷積特征圖進行采樣,得到文本的局部最優特征圖;
(6)在卷積神經網絡的全連接層,將文本的局部最優特征圖賦予全連接層,經過全連接層的計算后結果會賦予分類器,用于對文本的類型進行預測并輸出最終的分類結果。
2.根據權利要求1所述的基于TextRank和卷積神經網絡的小學作文自動分類方法,其特征在于:卷積神經網絡的第一層為embedding層,在該層,數據集中出現的每一個字都會被隨機初始化一個word embedding,每條數據中的字都會被映射到其對應的wordembedding從而組成二維特征矩陣T∈Rd*v作為卷積神經網絡的輸入,矩陣的行數d為文本的字數,列數v為word embedding的維度;在訓練過程中,使用隨機梯度下降方法對wordembedding進行更新。
3.根據權利要求1所述的基于TextRank和卷積神經網絡的小學作文自動分類方法,其特征在于:卷積神經網絡的第二層為卷積層,采用的是一維卷積操作,每個卷積核C∈Rh*v的行數為h,列數與文本特征矩陣T相同為v,每個卷積核會從上到下依次與h行v列的文本的特征矩陣塊做卷積操作,每一次的輸出ri,i=1,2……,d-h+1,如下式:
ri=C*Ti:i+h-1
接著輸出結果ri會被加上偏置項b,并使用激活函數進行非線性化處理,這里選擇的激活函數為f(x)=max(0,x),即ReLu函數,得到結果si,i=1,2……,d-h+1,如下式:
si=max(0,ri+b)
最終得到d-h+1個結果,這些結果就組成了一張局部卷積特征圖S∈R(d-h+1)*1,特征圖的總數與卷積核的數量m一樣,每張特征圖Sj,j=1,2……,m,如下式:
Sj=[s1,s2,s3......,sd-h+1]。
4.根據權利要求1所述的基于TextRank和卷積神經網絡的小學作文自動分類方法,其特征在于:卷積神經網絡第三層為池化層,在該層,提取每張特征圖中最大的元素,即max{Sj}并將其組成局部最優特征圖P∈Rm*1。
5.根據權利要求1所述的基于TextRank和卷積神經網絡的小學作文自動分類方法,其特征在于:卷積神經網絡的第四層為全連接層,該層與池化層全連接,以最優特征圖P為輸入,采用softmax分類器對向量P進行分類,并輸出最終的分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810671815.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:案源獲取和推薦方法及系統
- 下一篇:一種傳播內容的檢索方法和裝置





