[發(fā)明專(zhuān)利]一種訓(xùn)練自然語(yǔ)言處理模型的方法和系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202010794536.0 | 申請(qǐng)日: | 2020-08-10 |
| 公開(kāi)(公告)號(hào): | CN111950295A | 公開(kāi)(公告)日: | 2020-11-17 |
| 發(fā)明(設(shè)計(jì))人: | 程浩;楊曉慶;李奘 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京嘀嘀無(wú)限科技發(fā)展有限公司 |
| 主分類(lèi)號(hào): | G06F40/30 | 分類(lèi)號(hào): | G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06N20/10 |
| 代理公司: | 成都七星天知識(shí)產(chǎn)權(quán)代理有限公司 51253 | 代理人: | 楊永梅 |
| 地址: | 100193 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 訓(xùn)練 自然語(yǔ)言 處理 模型 方法 系統(tǒng) | ||
本申請(qǐng)實(shí)施例公開(kāi)了一種訓(xùn)練自然語(yǔ)言處理模型方法及系統(tǒng)。所述方法包括:獲取語(yǔ)言訓(xùn)練樣本以及初始模型,所述初始模型包括第一模型以及第二模型,所述第一模型至少包含編碼器,所述第二模型至少包含所述第一模型的編碼器;以及利用所述語(yǔ)言訓(xùn)練樣本,經(jīng)過(guò)迭代訓(xùn)練過(guò)程訓(xùn)練所述初始模型以生成自然語(yǔ)言處理模型,其中,所述迭代訓(xùn)練過(guò)程包括一次或以上的迭代,所述編碼器在每一次迭代中被更新兩次。本申請(qǐng)?jiān)谟?xùn)練執(zhí)行具體自然語(yǔ)言處理任務(wù)的第二模型時(shí),先通過(guò)訓(xùn)練編碼器的方式對(duì)語(yǔ)言訓(xùn)練樣本進(jìn)行預(yù)處理,可以解決自然語(yǔ)言處理過(guò)程中數(shù)據(jù)集較大的問(wèn)題,提高訓(xùn)練效率以及準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及自然語(yǔ)言處理領(lǐng)域,特別涉及一種訓(xùn)練自然語(yǔ)言處理模型的方法和系統(tǒng)。
背景技術(shù)
近年來(lái),自然語(yǔ)言處理(NLP,Natural Language Processing)作為研究人與計(jì)算機(jī)交互的語(yǔ)言問(wèn)題的基礎(chǔ),其融合了語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)科學(xué)等,也是人工智能的核心課題之一。
目前,在例如語(yǔ)義分析、情感分類(lèi)等具體的自然語(yǔ)言處理任務(wù)中,通常需要將海量的輸入文本或語(yǔ)音轉(zhuǎn)換文本數(shù)據(jù),影響自然語(yǔ)言處理系統(tǒng)的效率及性能。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例之一提供一種訓(xùn)練自然語(yǔ)言處理模型的方法,以提高自然語(yǔ)言處理模型的訓(xùn)練效果和/或訓(xùn)練效率。
本申請(qǐng)實(shí)施例之一提供一種訓(xùn)練自然語(yǔ)言處理模型的方法。該方法包括獲取語(yǔ)言訓(xùn)練樣本以及初始模型,所述初始模型包括第一模型以及第二模型,所述第一模型至少包含編碼器,所述第二模型至少包括所述第一模型的編碼器。該方法進(jìn)一步包括利用所述語(yǔ)言訓(xùn)練樣本,經(jīng)過(guò)迭代訓(xùn)練過(guò)程訓(xùn)練所述初始模型以生成自然語(yǔ)言處理模型。其中,所述迭代訓(xùn)練過(guò)程包括一次或以上的迭代,所述編碼器在第一次迭代中被更新兩次。
本申請(qǐng)實(shí)施例之一提供一種訓(xùn)練自然語(yǔ)言處理模型的系統(tǒng)。所述系統(tǒng)包括獲取模塊和訓(xùn)練模塊。所述獲取模塊用于獲取語(yǔ)言訓(xùn)練樣本以及初始模型,所述初始模型包括第一模型以及第二模型,所述第一模型至少包含編碼器,所述第二模型至少包括所述第一模型的編碼器。所述訓(xùn)練模塊用于利用所述語(yǔ)言訓(xùn)練樣本,經(jīng)過(guò)迭代訓(xùn)練過(guò)程訓(xùn)練所述初始模型以生成自然語(yǔ)言處理模型。其中,所述迭代訓(xùn)練過(guò)程包括一次或以上的迭代,所述編碼器在每一次迭代中被更新兩次。
本申請(qǐng)實(shí)施例之一提供一種訓(xùn)練自然語(yǔ)言處理模型的裝置,包括處理器,所述處理器用于執(zhí)行上述訓(xùn)練自然語(yǔ)言處理模型的方法。
本申請(qǐng)實(shí)施例之一提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)指令,當(dāng)計(jì)算機(jī)讀取存儲(chǔ)介質(zhì)中的計(jì)算機(jī)指令后,計(jì)算機(jī)執(zhí)行上述訓(xùn)練自然語(yǔ)言處理模型方法。
附圖說(shuō)明
本申請(qǐng)將以示例性實(shí)施例的方式進(jìn)一步說(shuō)明,這些示例性實(shí)施例將通過(guò)附圖進(jìn)行詳細(xì)描述。這些實(shí)施例并非限制性的,在這些實(shí)施例中,相同的編號(hào)表示相同的結(jié)構(gòu),其中:
圖1是根據(jù)本申請(qǐng)一些實(shí)施例所示的自然語(yǔ)言處理系統(tǒng)的應(yīng)用場(chǎng)景示意圖;
圖2是根據(jù)本申請(qǐng)一些實(shí)施例所示的處理引擎的模塊圖;
圖3是根據(jù)本申請(qǐng)一些實(shí)施例所示的訓(xùn)練自然語(yǔ)言處理模型的示例性流程圖;
圖4A是根據(jù)本申請(qǐng)一些實(shí)施例所示用于執(zhí)行迭代訓(xùn)練過(guò)程中的一次當(dāng)前迭代的示例性流程圖;
圖4B是根據(jù)本申請(qǐng)一些實(shí)施例所示的圖4A中流程400的示例性示意圖;
圖5是根據(jù)本申請(qǐng)一些實(shí)施例所示的更新當(dāng)前迭代中的第一模型的示例性流程圖;以及
圖6是根據(jù)本申請(qǐng)一些實(shí)施例所示的更新當(dāng)前迭代中的第二模型的示例性流程圖。
具體實(shí)施方式
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京嘀嘀無(wú)限科技發(fā)展有限公司,未經(jīng)北京嘀嘀無(wú)限科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010794536.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)
- 一種自然語(yǔ)言的搜索方法及系統(tǒng)
- 基于交互上下文處理自然語(yǔ)言方法
- 計(jì)算機(jī)化的自然語(yǔ)言查詢意圖分派
- 自然語(yǔ)言描述信息的生成方法及裝置
- 風(fēng)格可定制的文本生成
- 多輪預(yù)制對(duì)話
- 改變應(yīng)答以提供表現(xiàn)豐富的自然語(yǔ)言對(duì)話的方法、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言查詢的轉(zhuǎn)換
- 一種自然語(yǔ)言處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言理解模型訓(xùn)練方法、自然語(yǔ)言理解方法及裝置





