[發明專利]提升機器寫作質量的方法、系統、計算機設備及存儲介質在審
| 申請號: | 202011353640.2 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112417856A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 尤瑩;衛海天 | 申請(專利權)人: | 北京明略昭輝科技有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/166 |
| 代理公司: | 青島清泰聯信知識產權代理有限公司 37256 | 代理人: | 趙燕 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提升 機器 寫作 質量 方法 系統 計算機 設備 存儲 介質 | ||
1.一種提升機器寫作質量的方法,其特征在于,包括:
BERT模型構建步驟:構建連貫性推理器BERT模型,并對所述連貫性推理器BERT模型進行訓練;
連貫性分數三元組獲得步驟:對文章進行分句處理后輸入訓練后的所述連貫性推理器BERT模型獲得連貫性分數,根據所述連貫性分數構建連貫性分數三元組;
處理步驟:根據所述連貫性分數三元組構建分割點列表,根據所述分割點列表對所述文章進行處理。
2.如權利要求1所述的一種提升機器寫作質量的方法,其特征在于,所述BERT模型構建步驟包括:收集相關指定領域的語料,對所述連貫性推理器BERT模型進行訓練。
3.如權利要求1所述的一種提升機器寫作質量的方法,其特征在于,所述連貫性分數三元組獲得步驟包括:
分句步驟:對輸入的所述文章進行分句,得到所述文章的句子列表,其中,句子個數為T;
排列步驟:以一個句子為單位,采用滑動窗口將所有句子組成T-1個連續的句子對;
連貫性分數計算步驟:將所述句子對輸入到訓練后的所述推理器連貫性推理器BERT模型中,計算當前所述句子對的連貫性分數;
連貫性分數三元組輸出步驟:根據所述連貫性分數構建所述連貫性分數三元組。
4.如權利要求1所述的一種提升機器寫作質量的方法,其特征在于,所述處理步驟包括:
識別文章分割點步驟:根據所述連貫性分數三元組的所述連貫性分數設置分割點;
分割點列表獲得步驟:根據所述分割點構建所述分割點列表;
文章連貫性判斷步驟:根據所述分割點列表對所述文章的連貫性進行判斷并輸出判斷結果。
語句計算刪除步驟:當所述判斷結果為所述分割點列表不為空時,所述分割點將所述文章分成多個段落,通過所述分割點列表中各個所述分割點的下標,計算出各個所述段落包含的句子個數,如果所述段落的所述句子個數小于等于一閾值時,則刪除所述段落中的所有語句。
5.一種提升機器寫作質量的系統,其特征在于,包括:
BERT模型構建模塊,所述BERT模型構建模塊構建連貫性推理器BERT模型,并對所述連貫性推理器BERT模型進行訓練;
連貫性分數三元組獲得模塊,所述連貫性分數三元組獲得模塊對文章進行分句處理后輸入訓練后的所述連貫性推理器BERT模型獲得連貫性分數,根據所述連貫性分數構建連貫性分數三元組;
處理模塊,所述處理模塊根據所述連貫性分數三元組構建分割點列表,根據所述分割點列表對所述文章進行處理。
6.如權利要求5所述的一種提升機器寫作質量的系統,其特征在于,所述BERT模型構建模塊收集相關指定領域的語料,對所述連貫性推理器BERT模型進行訓練。
7.如權利要求5所述的一種提升機器寫作質量的系統,其特征在于,所述連貫性分數三元組獲得模塊包括:
分句單元,所述分句單元對輸入的所述文章進行分句,得到所述文章的句子列表,其中,句子個數為T;
排列單元,所述排列單元以一個句子為單位,采用滑動窗口將所有句子組成T-1個連續的句子對;
連貫性分數計算單元,所述連貫性分數計算單元將所述句子對輸入到訓練后的所述推理器連貫性推理器BERT模型中,計算當前所述句子對的連貫性分數;
連貫性分數三元組輸出單元,所述連貫性分數三元組輸出單元根據所述連貫性分數構建所述連貫性分數三元組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略昭輝科技有限公司,未經北京明略昭輝科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011353640.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:物流分揀設備
- 下一篇:耐低溫陶瓷隔膜及制備方法、耐低溫二次電池





