[發明專利]基于作文論據特征分類器的語言生成模型及寫作支持方法在審
| 申請號: | 202011023526.3 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112182210A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 高震;蔣天惠;曹希燕;肖聰;閻華 | 申請(專利權)人: | 四川華空天行科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/205 |
| 代理公司: | 北京天奇智新知識產權代理有限公司 11340 | 代理人: | 葉明博 |
| 地址: | 610213 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 作文 論據 特征 分類 語言 生成 模型 寫作 支持 方法 | ||
本發明涉及一種基于作文論據特征分類器的語言生成模型及寫作支持方法,它包括語言模型訓練步驟和用戶寫作步驟;所述用戶寫作步驟包括尋求論據支持寫作步驟和/或尋求開放性寫作步驟。本發明的優點在于:提高了語言生成模型的穩定性,生成的提示內容詞句通順達意,并與作者的論點相關度有大幅度提高(60%),為用戶提供傳統方法無法達到的強一致性論據提示模型和文章續寫模型;可以為廣大學生提供低成本、高效、實時且精準的寫作指導。尤其是對于英語等外語寫作學習,將為學生提供接近母語的寫作建議、幫助學生盡快跨過初級寫作門檻、讓學生能依照自己觀點順利完成作文。
技術領域
本發明涉及主題分析技術領域,尤其涉及基于作文論據特征分類器的語言生成模型及寫作支持方法。
背景技術
傳統機器學習和自然語言處理界的摘要模型和語言生成模型直接應用在教育領域的議論文寫作的效果不理想;首先傳統的寫作批改建議模型在評分標準總結階段不區分支持論據和反對論據,導致在評語建議階段提出的論據,可能會和作者的論點相沖突。而最近幾年的支持預訓練的深度學習語言模型(比如GPT-2)對于議論文寫作提示方面不具有足夠的語境信息,不能生成高質量的跟作文題目相關的內容。即使該語言生成模型經過了微調訓練而具備了一定的語境信息,但是該語言環境信息并不區分是正方觀點還是反方觀點,從而使生成的建議內容混雜了正方觀點和反方觀點,導致語言模型的生成內容不可用或者效率低下,使得GPT-2在該領域的大范圍應用受到了阻礙。
申請號為201711160875.8公布的一種級聯式作文生成方法的專利中存在句子間邏輯無法連貫,不能保證生成的作文能夠符合主題的問題;而申請號為201811202083.7公布的一種基于主題模型的HSK作文生成方法的專利中仍然采用基于低效的關鍵詞搜索句子的方法,無法產生新的句子,且所需樣本量大,句子件邏輯性查,觀點一致性差;申請號為201710322347.1公布的一種基于模板的自動生成作文的系統及實現方法的專利中則存在生成的作文范圍窄,生成文本單調,詞句連貫性邏輯性差的問題。
發明內容
本發明的目的在于克服現有技術的缺點,提供了一種基于作文論據特征分類器的語言生成模型及寫作方法,解決了現有作文寫作方法不區分支持論據和反對論據,導致在評語建議階段提出的論據,或者語言提示的內容經常會和作者的論點相沖突的問題。
本發明的目的通過以下技術方案來實現:一種基于作文論據特征分類器的語言生成模型,它包括以下內容:
根據TextRank算法對作文庫中輸入的大量高分作文進行作文論據評分,輸出基于論據的評分標準并對評分標準進行預分類得到支持論據集合和反對論據集合;
對所有作文的摘要進行總結并將當前作文的總結和評分標準進行對比后得到作文庫中全部作文的特征向量表;
根據支持論據集合和反對論據集合與作文庫的特征向量表對每一篇作文進行打分,得到正方觀點作文集合和反方觀點作文集合;
將正方觀點作文集合和反方觀點作文集合作為輸入并根據評分標準分別生成正方論據模型和反方論據模型,并對各作文庫進行微調訓練得到GPT-2語言生成模型。
進一步地,所述根據TextRank算法對作文庫中輸入的大量高分作文進行作文論據評分,輸出基于論據的評分標準并對評分標準進行預分類得到支持論據和反對論據集合包括:
通過TextRank算法對作文庫中每一篇作為做摘要之后將高分作文的摘要集合起來,刪除冗余論據,整合成一個包含支持論據和反對論據的論據集合,即評分標準,并將其輸出;
采用VaderSentiment方法對每一個論據句子給出一個支持性評分,并根據評分結果得到支持論據集合和反對論據集合。
進一步地,所述對所有作文的摘要進行總結包括:
根據TextRank算法將作文文章中的句子看作圖中的點,把句子之間的相似度看作圖中的邊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川華空天行科技有限公司,未經四川華空天行科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011023526.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種加強型集成墻板及其施工方法
- 下一篇:一種黃芪顆粒及其制備方法





