[發明專利]一種日語寫作自動糾錯方法及系統在審
| 申請號: | 202110301196.8 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN112883917A | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 冶文玲;鄭毅樂;李慧;王霜;黃金春;趙付立;張磊 | 申請(專利權)人: | 蘭州理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06N20/00 |
| 代理公司: | 武漢菲翔知識產權代理有限公司 42284 | 代理人: | 賈雙明 |
| 地址: | 730050 甘肅*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 日語 寫作 自動 糾錯 方法 系統 | ||
1.一種日語寫作自動糾錯方法,其特征在于,包括以下步驟:
S1:收集待檢測的日語寫作文本;
S2:將待檢測的日語寫作文本中的每個單詞轉換為詞向量,將文本中的每個句子中的詞向量進行特征提取,得到句子中的具有特征的詞向量,并將其作為特征量,將句子中的詞向量與特征量輸入關聯模型中,關聯模型利用后饋傳播的方式進行學習調整,得到句子中的每個詞向量與特征量關聯值,根據詞性得到詞向量與詞向量之間組合的集合,選擇集合中總的關聯值最大的一組組合,標記組合中未被選擇的詞向量;
S3:將選擇的組合根據知識樹進行完善,生成糾錯后的文本。
2.根據權利要求1所述的一種日語寫作自動糾錯方法,其特征在于,所述步驟S2中,所述關聯模型通過深度學習算法根據數據庫建模,得到特征量與詞向量的關聯概率以及詞向量與特征量的關聯概率,將兩個關聯概率相除得到關聯值。
3.根據權利要求2所述的一種日語寫作自動糾錯方法,其特征在于,所述深度學習采用卷積神經網絡完成,所述卷積神經網絡由編碼器路徑和解碼器路徑組成,所述編碼器路徑和解碼器路徑均由卷積到批標準化到激活Relu函數的卷積單元形式的網絡結構組成。
4.根據權利要求1所述的一種日語寫作自動糾錯方法,其特征在于,所述步驟S3中,將組合中被選擇的詞向量作為節點,通過蒙特卡洛樹進行搜索,完善組合中缺少的詞向量,形成糾錯文本。
5.一種日語寫作自動糾錯系統,其特征在于,包括數據庫(5)、詞向量轉換模塊(2)、特征量提取模塊(3)、文本獲取模塊(1)、關聯模型(4)、文本選擇模塊(6)、錯誤標記模塊(7)、糾錯模塊(8);
所述文本獲取模塊(1)用于獲取待檢測的日語寫作文本;
所述詞向量轉換模塊(2)將獲取的日語寫作文本進行詞向量轉換;
所述特征提取模塊(3)提取文本中每個句子中最具有特征的詞向量作為特征量;
所述關聯模型(4)根據數據庫(5)進行建模,將句子中的詞向量與特征量采用深度學習算法,利用后饋傳播的方式進行學習調整,得到句子中的每個詞向量與特征量關聯值;
所述文本選擇模塊(6)根據詞的詞性得到詞向量與特征量組合的集合,利用貪婪算法得到算集合中最大的關聯值的組合,并選擇該組合;
所述錯誤標記模塊(7)將組合中未選擇的詞向量進行標記,生成帶有錯誤標記的文本;
所述糾錯模塊(8)將選擇后的組合通過知識樹進行完善,生成糾錯后的文本。
6.根據權利要求5所述的一種日語寫作自動糾錯系統,其特征在于,還包括展示模塊(9),所述展示模塊(9)將未被選擇的詞向量和添加完善的詞向量進行對比展示。
7.根據權利要求5所述的一種日語寫作自動糾錯系統,其特征在于,還包括統計模塊(10),統計模塊(10)將寫作中的錯誤率進行統計,生成得分數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘭州理工大學,未經蘭州理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110301196.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于河床或海床沖刷的監測預警裝置及方法
- 下一篇:一種吸塵器用旋轉鎖扣





