[發(fā)明專利]留學文書撰寫方法、裝置及電子設(shè)備在審
| 申請?zhí)枺?/td> | 201910042070.6 | 申請日: | 2019-01-16 |
| 公開(公告)號: | CN109766537A | 公開(公告)日: | 2019-05-17 |
| 發(fā)明(設(shè)計)人: | 許志源 | 申請(專利權(quán))人: | 北京未名復眾科技有限公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06F17/27;G06N99/00 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 王術(shù)蘭 |
| 地址: | 100000 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 個人信息 撰寫 裝置及電子設(shè)備 改寫 描述文本 匹配 遷移 文書數(shù)據(jù)庫 查找 個人特點 人力成本 生產(chǎn)效率 時間成本 預設(shè) 輸出 申請 | ||
本發(fā)明提供了一種留學文書撰寫方法、裝置及電子設(shè)備,該留學文書撰寫方法包括獲取個人信息,該個人信息包括待申請的學校名稱、專業(yè)名稱、個人特點;從預設(shè)的文書數(shù)據(jù)庫中查找與該個人信息匹配的相似文書;基于遷移模型,從相似文書中選取實體描述段落;該遷移模型是通過預先訓練的模型得到的;對該實體描述段落進行改寫,并輸出改寫后的實體描述段落以撰寫留學文書。該方式可以自動根據(jù)申請人的個人信息,查找匹配的相似文書,并對相似文書中的實體描述段落進行改寫,得到滿足申請人需求的實體描述文本,進而使申請人根據(jù)該實體描述文本進行留學文書的撰寫,有效節(jié)省了人力成本和時間成本,并提高了生產(chǎn)效率。
技術(shù)領(lǐng)域
本發(fā)明涉及文本處理技術(shù)領(lǐng)域,尤其是涉及一種留學文書撰寫方法、裝置及電子設(shè)備。
背景技術(shù)
留學文書主要以個人陳述、推薦信、個人簡歷及短文材料構(gòu)成。留學文書是出國留學申請中的重要材料,學生在申請海外學校時,絕大多數(shù)的學校都要求申請人提交申請文書(即留學文書)。海外院校招生官通過留學文書了解申請者是否符合申請條件。留學文書寫作好壞對錄取結(jié)果的影響非常大。
傳統(tǒng)的留學文書寫作需要全部依賴人工,需要耗費大量的人力成本和時間,且生產(chǎn)效率低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種留學文書撰寫方法、裝置及電子設(shè)備,以有效節(jié)省留學文書撰寫時的人力成本和時間成本,并提高了生產(chǎn)效率。
第一方面,本發(fā)明實施例提供了一種留學文書撰寫方法,包括:
獲取個人信息,所述個人信息包括待申請的學校名稱、專業(yè)名稱、個人特點;
從預設(shè)的文書數(shù)據(jù)庫中查找與所述個人信息匹配的相似文書;
基于遷移模型,從所述相似文書中選取實體描述段落;其中所述遷移模型是通過預先訓練的模型得到的;
對所述實體描述段落進行改寫,并輸出改寫后的實體描述段落以撰寫留學文書。
結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第一種可能的實施方式,其中,對所述實體描述段落進行改寫的步驟,包括:
基于預先訓練的基于同義詞的向量模型,對所述實體描述段落中的相應(yīng)詞匯進行同義詞替換;和/或
將屬于第一語言的所述實體描述段落翻譯為屬于第二語言的第一段落,將所述第一段落翻譯為屬于所述第一語言的第二段落。
結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第二種可能的實施方式,其中,對所述實體描述段落進行改寫的步驟包括:
獲取當前選擇的改寫方式,所述改寫方式包括同義詞改寫方式、翻譯改寫方式及混合改寫方式;
基于當前選擇的所述改寫方式,對所述實體描述段落進行改寫。
結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第三種可能的實施方式,其中,所述遷移模型的訓練過程包括:
獲取若干個預先訓練的神經(jīng)網(wǎng)絡(luò)模型;
將所述神經(jīng)網(wǎng)絡(luò)模型并聯(lián)或者串聯(lián),得到遷移模型;
將文書樣本輸入至所述遷移模型,對所述遷移模型進行訓練。
結(jié)合第一方面的第三種可能的實施方式,本發(fā)明實施例提供了第一方面的第四種可能的實施方式,其中,將文書樣本輸入至所述遷移模型,對所述遷移模型進行訓練的步驟包括:
對所述文書樣本中的段落進行實體標注;
將標注后的文書樣本輸入至所述遷移模型,以使所述遷移模型對所述文書樣本中的段落進行實體識別,并返回錯誤率;
基于所述錯誤率調(diào)整所述遷移模型中各個所述神經(jīng)網(wǎng)絡(luò)模型的每一層的參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京未名復眾科技有限公司,未經(jīng)北京未名復眾科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910042070.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 軟件改寫方法及軟件改寫裝置
- 一種獲取導入表和重定位表的方法及裝置
- 基于耗材芯片改寫器的芯片數(shù)據(jù)改寫方法及裝置
- 一種改寫芯片數(shù)據(jù)的方法及裝置
- 車輛用主裝置、非改寫對象的電源管理方法以及非改寫對象的電源管理程序
- 車輛用主裝置、改寫對象的組管理方法、改寫對象的組管理程序以及規(guī)格數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)
- 文本風格處理方法、裝置、電子設(shè)備和存儲介質(zhì)
- 一種多輪對話改寫方法和裝置
- 一種前端文件處理方法、裝置、設(shè)備及機器可讀存儲介質(zhì)
- 一種多輪對話改寫方法、裝置和電子設(shè)備





