[發明專利]作文偏題審批方法、終端、裝置及存儲介質在審
| 申請號: | 202010038763.0 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN111259646A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 李文斌 | 申請(專利權)人: | 平安國際智慧城市科技股份有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/258;G06F40/30;G06F40/284 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 徐進之 |
| 地址: | 518000 廣東省深圳市前海深港合*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 作文 偏題 審批 方法 終端 裝置 存儲 介質 | ||
本發明涉及人工智能領域,提供一種作文偏題審批方法、裝置、終端及可讀存儲介質,通過利用訓練樣本對初始偏題審閱模型進行訓練,得到目標模型,而后將待審閱作文對應的題目輸入到題干改寫模型,得到待審閱作文對應的主題列表,接下來基于主題列表以及待審閱作文生成預處理后的待審閱作文,將預處理后的待審閱作文輸入目標模型,得到審閱參數,最后基于審閱參數確定待審閱作文的偏題結果。通過對作文題目進行改寫得到主題列表,從而確定偏題審批標準,利用訓練好的機器閱讀模型獲得審閱參數,最終確定偏題結果。無需人工標準,且由于機器閱讀模型是從語義理解層面實現,進而提升作文內容細節判斷,提升了偏題審批的準確率。
技術領域
本發明涉及人工智能領域,尤其涉及一種作文偏題審批方法、終端、裝置及存儲介質。
背景技術
目前,市面上作文自動批改系統(AES),例如ETS的E-rater、批改網、訊飛英語作文批改、粉筆申論批改,在自動的偏題檢測問題上,主要采用給定關鍵字匹配、基于龐大的主題做文庫進行相似度比較,以及基于文檔向量進行相似度判別的方案,進而判別作文內容與主題或題干貼合度。前述第一種方法在識別模式上過于簡單,主題相關性識別準確度較低,容易成為騙分攻擊漏洞;第二種方法則需要建立主題作文庫,且需要進行人工標注,實施難度較大;而最后一種主要考慮文本之間的詞意距離,對于粗略的文意相近可以判別,但對于文意的細微差別通常很難識別,例如否定語義等,且相似度閾值設定存在困難,通常需要大量的偏題和不偏題作文測試獲得。
發明內容
本發明的主要目的在于提供一種作文偏題審批方法、終端、裝置及存儲介質,旨在解決現有作文自動批改方法存在準確率低、需要人工標注的技術問題。
利用訓練樣本對初始偏題審閱模型進行訓練,得到目標模型;
將待審閱作文對應的題目輸入到題干改寫模型,得到待審閱作文對應的主題列表;
基于所述主題列表以及所述待審閱作文生成預處理后的待審閱作文,將所述預處理后的待審閱作文輸入所述目標模型,得到審閱參數;
基于所述審閱參數確定所述待審閱作文的偏題結果。
進一步地,在一實施方式中,所述利用訓練樣本對初始偏題審閱模型進行訓練,得到目標模型的步驟包括:
對所述訓練樣本進行預處理,得到滿足所述初始偏題審閱模型要求的預處理后的訓練樣本;
將所述預處理后的訓練樣本輸入到初始偏題審閱模型進行訓練,并判斷所述初始偏題審閱模型是否收斂;
在所述初始偏題審閱模型收斂時,得到所述目標模型。
進一步地,在一實施方式中,所述利用訓練樣本對初始偏題審閱模型進行訓練,得到目標模型的步驟之前,包括:
基于樣本數據庫獲取預設數量的題干改寫樣本;
將所述題干改寫樣本輸入到初始模型進行訓練,得到所述題干改寫模型。
進一步地,在一實施方式中,所述初始模型為Seq2Seq模型,所述題干改寫樣本包括題目、題目對應的支持主題文本以及題干對應的不支持主題文本,所述將所述題干改寫樣本輸入到初始模型進行訓練,得到所述題干改寫模型的步驟包括:
對所述題目、所述支持主題文本以及所述不支持主題文本進行詞嵌入,生成序列數值向量;
將所述序列數值向量輸入到初始模型進行訓練,得到所述題干改寫模型。
進一步地,在一實施方式中,所述將待審閱作文對應的題目輸入到題干改寫模型,得到待審閱作文對應的主題列表的步驟包括:
將所述待審閱作文對應的題目進行分詞及詞嵌入,生成序列數值向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安國際智慧城市科技股份有限公司,未經平安國際智慧城市科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010038763.0/2.html,轉載請聲明來源鉆瓜專利網。





