[發明專利]一種基于句法分析的作文處理方法及系統有效
| 申請號: | 201811514502.0 | 申請日: | 2018-12-12 |
| 公開(公告)號: | CN109614623B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 崔穎 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F16/332 |
| 代理公司: | 廣州德科知識產權代理有限公司 44381 | 代理人: | 萬振雄;楊中強 |
| 地址: | 528850 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 句法 分析 作文 處理 方法 系統 | ||
一種基于句法分析的作文處理方法及系統,該方法包括:對待批改的作文文本進行文本數據預處理,得到預處理后的目標文本數據;判斷目標文本數據中的目標語句與相鄰語句之間的邏輯關系是否存在錯誤,如果是,識別待批改的作文文本中與目標語句以及相鄰語句對應的第一異常語句,并對第一異常語句進行第一標記;和/或,將目標文本數據中的目標語句的句法結構與標準正則數據庫中的預設標準語句的標準句法結構進行對比,以判斷目標語句的句法結構是否符合所述標準句法結構;如果不符合,識別待批改的作文文本中與目標語句對應的第二異常語句;對第二異常語句進行第二標記并校正,從而可以自動批改作文中的語法錯誤,提高作文批改的效率。
技術領域
本發明涉及作文批改技術領域,具體涉及一種基于句法分析的作文處理方法及系統。
背景技術
作文是語言學習與考試的重點,因此老師需要花費較多時間進行作文批改。一般來說,評價一篇作文優劣的重點在于作文的框架結構和行文思路,老師也會重點針對這兩部分進行點評與分析。然而,在實踐中發現,由于粗心等原因,學生經常在作文中出現詞語搭配不恰當等語法錯誤,老師也需要耗費大量的時間批改這些語法錯誤,導致老師的工作量加大,作文批改的效率不高。
發明內容
本發明實施例公開了一種基于句法分析的作文處理方法及系統,能夠自動批改作文中的語法錯誤,提高作文批改的效率。
本發明實施例第一方面公開一種基于句法分析的作文處理方法,所述方法包括:
對待批改的作文文本進行文本數據預處理,得到預處理后的目標文本數據;
判斷所述目標文本數據中的目標語句與相鄰語句之間的邏輯關系是否存在錯誤,如果所述邏輯關系存在錯誤,識別所述待批改的作文文本中與所述目標語句以及所述相鄰語句對應的第一異常語句,并對所述第一異常語句進行第一標記;
和/或,將所述目標文本數據中的目標語句的句法結構與標準正則數據庫中的預設標準語句的標準句法結構進行對比,以判斷所述目標語句的句法結構是否符合所述標準句法結構;如果所述目標語句的句法結構不符合所述標準句法結構,識別所述待批改的作文文本中與所述目標語句對應的第二異常語句;
對所述第二異常語句進行第二標記并校正。
作為一種可選的實施方式,在本發明實施例第一方面中,所述標準句法結構,包括:語句的組成成分完整、語句中詞語的詞性與詞語所屬的組成成分相匹配、語句的語序符合標準語序。
作為一種可選的實施方式,在本發明實施例第一方面中,對所述第二異常語句進行校正,包括:
如果所述第二異常語句的組成成分不完整,利用所述第二異常語句的相鄰語句補全所述第二異常語句;
如果所述第二異常語句中任一目標詞語的詞性與所述目標詞語所屬的組成成分不匹配,識別所述目標詞語所屬的組成成分對應的標準詞性;從所述目標詞語的同義詞庫中查找出詞性為所述標準詞性的同義詞;將所述第二異常語句中的所述目標詞語替換成所述同義詞;
如果所述第二異常語句的語序不符合標準語序,按照所述標準語序重新組合所述第二異常語句中的各個詞語。
作為一種可選的實施方式,在本發明實施例第一方面中,所述方法還包括:
確定被標記的所述第一異常語句和/或所述第二異常語句在所述待批改的作文文本中的占比,并根據所述占比確定所述待批改的作文文本的第一得分;
獲取所述待批改的作文的批改者輸入的所述待批改的作文文本的第二得分;
根據所述第一得分以及所述第一得分對應的計算權重、所述第二得分以及所述第二得分對應的計算權重,確定所述待批改的作文文本的批改得分。
作為一種可選的實施方式,在本發明實施例第一方面中,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811514502.0/2.html,轉載請聲明來源鉆瓜專利網。





