[發(fā)明專利]留學(xué)文書撰寫方法、裝置及電子設(shè)備在審
| 申請?zhí)枺?/td> | 201910042070.6 | 申請日: | 2019-01-16 |
| 公開(公告)號: | CN109766537A | 公開(公告)日: | 2019-05-17 |
| 發(fā)明(設(shè)計)人: | 許志源 | 申請(專利權(quán))人: | 北京未名復(fù)眾科技有限公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06F17/27;G06N99/00 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 王術(shù)蘭 |
| 地址: | 100000 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 個人信息 撰寫 裝置及電子設(shè)備 改寫 描述文本 匹配 遷移 文書數(shù)據(jù)庫 查找 個人特點 人力成本 生產(chǎn)效率 時間成本 預(yù)設(shè) 輸出 申請 | ||
1.一種留學(xué)文書撰寫方法,其特征在于,包括:
獲取個人信息,所述個人信息包括待申請的學(xué)校名稱、專業(yè)名稱、個人特點;
從預(yù)設(shè)的文書數(shù)據(jù)庫中查找與所述個人信息匹配的相似文書;
基于遷移模型,從所述相似文書中選取實體描述段落;其中所述遷移模型是通過預(yù)先訓(xùn)練的模型得到的;
對所述實體描述段落進(jìn)行改寫,并輸出改寫后的實體描述段落以撰寫留學(xué)文書。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述實體描述段落進(jìn)行改寫的步驟,包括:
基于預(yù)先訓(xùn)練的基于同義詞的向量模型,對所述實體描述段落中的相應(yīng)詞匯進(jìn)行同義詞替換;和/或
將屬于第一語言的所述實體描述段落翻譯為屬于第二語言的第一段落,將所述第一段落翻譯為屬于所述第一語言的第二段落。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述實體描述段落進(jìn)行改寫的步驟包括:
獲取當(dāng)前選擇的改寫方式,所述改寫方式包括同義詞改寫方式、翻譯改寫方式及混合改寫方式;
基于當(dāng)前選擇的所述改寫方式,對所述實體描述段落進(jìn)行改寫。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述遷移模型的訓(xùn)練過程包括:
獲取若干個預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型;
將所述神經(jīng)網(wǎng)絡(luò)模型并聯(lián)或者串聯(lián),得到遷移模型;
將文書樣本輸入至所述遷移模型,對所述遷移模型進(jìn)行訓(xùn)練。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,將文書樣本輸入至所述遷移模型,對所述遷移模型進(jìn)行訓(xùn)練的步驟包括:
對所述文書樣本中的段落進(jìn)行實體標(biāo)注;
將標(biāo)注后的文書樣本輸入至所述遷移模型,以使所述遷移模型對所述文書樣本中的段落進(jìn)行實體識別,并返回錯誤率;
基于所述錯誤率調(diào)整所述遷移模型中各個所述神經(jīng)網(wǎng)絡(luò)模型的每一層的參數(shù)。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于同義詞的向量模型的訓(xùn)練過程包括:
基于詞向量模型建立基于同義詞的向量模型;所述詞向量模型用于對任意詞語向量化;
將預(yù)先獲取的同義詞集合、反義詞集合及語句樣本輸入至所述基于同義詞的向量模型,對所述基于同義詞的向量模型進(jìn)行訓(xùn)練;
所述同義詞集合、反義詞集合均包括多個不同詞性類別的集合。
7.一種留學(xué)文書撰寫裝置,其特征在于,包括:
獲取模塊,用于獲取個人信息,所述個人信息包括待申請的學(xué)校名稱、專業(yè)名稱、個人特點;
查找模塊,用于從預(yù)設(shè)的文書數(shù)據(jù)庫中查找與所述個人信息匹配的相似文書;
選取模塊,用于基于遷移模型,從所述相似文書中選取實體描述段落;其中所述遷移模型是通過預(yù)先訓(xùn)練的模型得到的;
改寫模塊,用于對所述實體描述段落進(jìn)行改寫,并輸出改寫后的實體描述段落以撰寫留學(xué)文書。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括:遷移模型訓(xùn)練模塊,所述遷移模型訓(xùn)練模塊用于:
獲取若干個預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型;
將所述神經(jīng)網(wǎng)絡(luò)模型并聯(lián)或者串聯(lián),得到遷移模型;
將文書樣本輸入至所述遷移模型,對所述遷移模型進(jìn)行訓(xùn)練。
9.一種電子設(shè)備,包括存儲器、處理器,所述存儲器上存儲有可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述權(quán)利要求1至6任一項所述的方法。
10.一種機器可讀存儲介質(zhì),其特征在于,所述機器可讀存儲介質(zhì)存儲有機器可執(zhí)行指令,所述機器可執(zhí)行指令在被處理器調(diào)用和執(zhí)行時,所述機器可執(zhí)行指令促使所述處理器實現(xiàn)權(quán)利要求1至6任一項所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京未名復(fù)眾科技有限公司,未經(jīng)北京未名復(fù)眾科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910042070.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 軟件改寫方法及軟件改寫裝置
- 一種獲取導(dǎo)入表和重定位表的方法及裝置
- 基于耗材芯片改寫器的芯片數(shù)據(jù)改寫方法及裝置
- 一種改寫芯片數(shù)據(jù)的方法及裝置
- 車輛用主裝置、非改寫對象的電源管理方法以及非改寫對象的電源管理程序
- 車輛用主裝置、改寫對象的組管理方法、改寫對象的組管理程序以及規(guī)格數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)
- 文本風(fēng)格處理方法、裝置、電子設(shè)備和存儲介質(zhì)
- 一種多輪對話改寫方法和裝置
- 一種前端文件處理方法、裝置、設(shè)備及機器可讀存儲介質(zhì)
- 一種多輪對話改寫方法、裝置和電子設(shè)備





