[發(fā)明專利]一種公文模板推薦方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202111105392.4 | 申請日: | 2021-09-22 |
| 公開(公告)號: | CN113836884A | 公開(公告)日: | 2021-12-24 |
| 發(fā)明(設(shè)計)人: | 周劍明;林俊德;陳立峰;林誠漢 | 申請(專利權(quán))人: | 福建新大陸軟件工程有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/289;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 福州市鼓樓區(qū)京華專利事務(wù)所(普通合伙) 35212 | 代理人: | 林燕 |
| 地址: | 350000 福建省福州*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 公文 模板 推薦 方法 系統(tǒng) | ||
本發(fā)明提供了公文處理技術(shù)領(lǐng)域的一種公文模板推薦方法及系統(tǒng),方法包括如下步驟:步驟S10、獲取公文歷史數(shù)據(jù),并對所述公文歷史數(shù)據(jù)進行預(yù)處理;步驟S20、創(chuàng)建一公文模板抽取模型,利用所述公文模板抽取模型從公文歷史數(shù)據(jù)中抽取若干個公文模板;步驟S30、創(chuàng)建并訓(xùn)練一用于匹配所述公文模板與公文標題的公文模板匹配模型;步驟S40、獲取用戶輸入的新公文標題,基于所述新公文標題以及公文模板匹配模型匹配對應(yīng)的公文模板,完成公文模板推薦。本發(fā)明的優(yōu)點在于:極大的提升了公文寫作的效率以及質(zhì)量。
技術(shù)領(lǐng)域
本發(fā)明涉及公文處理技術(shù)領(lǐng)域,特別指一種公文模板推薦方法及系統(tǒng)。
背景技術(shù)
公文寫作有其獨特的寫作格式及寫作內(nèi)容,嚴謹專業(yè)的寫作格式可以反映出寫作者對業(yè)務(wù)的熟悉程度,更可以讓公文內(nèi)容高效地發(fā)揮其應(yīng)有的信息傳遞效用;寫作者需要長期保持對相關(guān)領(lǐng)域更新內(nèi)容的持續(xù)學(xué)習(xí)輸入和寫作輸出,才能保障寫作內(nèi)容的質(zhì)量。
當前,在公文寫作過程中,經(jīng)常存在調(diào)整格式復(fù)雜、寫作素材難尋以及文字校對易疏漏等痛點,寫作者常常需要耗費大量時間在格式排版和內(nèi)容寫作上,導(dǎo)致公文處理效率低下,進而導(dǎo)致工作事務(wù)處理不及時,影響企業(yè)機構(gòu)運轉(zhuǎn)的整體效率,增加企業(yè)的人工成本。
因此,如何提供一種公文模板推薦方法及系統(tǒng),實現(xiàn)提升公文寫作的效率以及質(zhì)量,成為一個亟待解決的問題。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題,在于提供一種公文模板推薦方法及系統(tǒng),實現(xiàn)提升公文寫作的效率以及質(zhì)量。
第一方面,本發(fā)明提供了一種公文模板推薦方法,包括如下步驟:
步驟S10、獲取公文歷史數(shù)據(jù),并對所述公文歷史數(shù)據(jù)進行預(yù)處理;
步驟S20、創(chuàng)建一公文模板抽取模型,利用所述公文模板抽取模型從公文歷史數(shù)據(jù)中抽取若干個公文模板;
步驟S30、創(chuàng)建并訓(xùn)練一用于匹配所述公文模板與公文標題的公文模板匹配模型;
步驟S40、獲取用戶輸入的新公文標題,基于所述新公文標題以及公文模板匹配模型匹配對應(yīng)的公文模板,完成公文模板推薦。
進一步地,所述步驟S10具體為:
從公文數(shù)據(jù)庫中獲取公文歷史數(shù)據(jù),并對所述公文歷史數(shù)據(jù)進行包括數(shù)據(jù)清洗和數(shù)據(jù)標準化的預(yù)處理;
所述公文歷史數(shù)據(jù)至少包括公文ID、部門ID、公文標題、正文、發(fā)送者、接收者、接收時間以及處理時間;
所述數(shù)據(jù)清洗具體為對所述公文歷史數(shù)據(jù)進行有效性校驗、剔除非法字符以及公文去重;
所述數(shù)據(jù)標準化具體為對所述公文歷史數(shù)據(jù)進行公文編碼、公文格式以及公文類型的統(tǒng)一。
進一步地,所述步驟S20具體為:
基于神經(jīng)網(wǎng)絡(luò)創(chuàng)建一公文模板抽取模型,利用預(yù)處理后的所述公文歷史數(shù)據(jù),對所述公文模板抽取模型進行包括預(yù)訓(xùn)練和微調(diào)的范式訓(xùn)練;
利用訓(xùn)練后的所述公文模板抽取模型從公文歷史數(shù)據(jù)中抽取若干個公文模板,并將各所述公文模板存儲至模板數(shù)據(jù)庫。
進一步地,所述步驟S30具體為:
基于神經(jīng)網(wǎng)絡(luò)創(chuàng)建一用于匹配所述公文模板與公文標題的公文模板匹配模型,從所述公文歷史數(shù)據(jù)中提取若干個公文標題組成公文標題訓(xùn)練集,利用所述公文標題訓(xùn)練集對公文模板匹配模型進行包括預(yù)訓(xùn)練和微調(diào)的范式訓(xùn)練。
進一步地,所述步驟S40具體為:
獲取用戶輸入的新公文標題,利用BM25算法匹配所述新公文標題以及公文歷史數(shù)據(jù)中的公文標題,進行篩選出相似度最高的N個公文標題,將各相似度最高的所述公文標題分別輸入公文模板匹配模型匹配對應(yīng)的公文模板,完成公文模板推薦。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建新大陸軟件工程有限公司,未經(jīng)福建新大陸軟件工程有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111105392.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





