[發(fā)明專(zhuān)利]跨語(yǔ)言的任務(wù)訓(xùn)練在審
| 申請(qǐng)?zhí)枺?/td> | 201910447514.4 | 申請(qǐng)日: | 2019-05-27 |
| 公開(kāi)(公告)號(hào): | CN112084295A | 公開(kāi)(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計(jì))人: | 梁耀波;段楠;公明;壽林鈞;姜大昕;周明 | 申請(qǐng)(專(zhuān)利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類(lèi)號(hào): | G06F16/33 | 分類(lèi)號(hào): | G06F16/33;G06F16/332;G06F40/30;G06N3/08 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華;丁君軍 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)言 任務(wù) 訓(xùn)練 | ||
在本公開(kāi)的實(shí)施例中,提出了一種跨語(yǔ)言的任務(wù)訓(xùn)練方法。在獲得一種語(yǔ)言的訓(xùn)練句子之后,對(duì)訓(xùn)練句子中的某個(gè)詞語(yǔ)進(jìn)行掩碼,然后獲得與被掩碼的詞語(yǔ)相對(duì)應(yīng)的另一種語(yǔ)言的對(duì)應(yīng)詞語(yǔ)。接下來(lái),使用一種語(yǔ)言的掩碼句子和另一種語(yǔ)言的對(duì)應(yīng)詞語(yǔ)來(lái)預(yù)訓(xùn)練跨語(yǔ)言模型。經(jīng)過(guò)預(yù)訓(xùn)練的跨語(yǔ)言模型具備多語(yǔ)言的理解和處理能力,其可以根據(jù)特定任務(wù)再進(jìn)行進(jìn)一步訓(xùn)練。根據(jù)本公開(kāi)的實(shí)施例,在一種語(yǔ)言存在大量訓(xùn)練語(yǔ)料而另一種語(yǔ)言存在較少甚至沒(méi)有訓(xùn)練語(yǔ)料的情況下,可以通過(guò)跨語(yǔ)言訓(xùn)練方式來(lái)預(yù)訓(xùn)練跨語(yǔ)言模型,使得跨語(yǔ)言模型能夠適用于另一種語(yǔ)言,由此實(shí)現(xiàn)針對(duì)各種語(yǔ)言的模型訓(xùn)練。
背景技術(shù)
自然語(yǔ)言處理是指利用計(jì)算機(jī)處理人類(lèi)自然語(yǔ)言的技術(shù),自然語(yǔ)言處理使得計(jì)算機(jī)能夠理解人類(lèi)語(yǔ)言。計(jì)算機(jī)通過(guò)人工標(biāo)注的語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,能夠生成自然語(yǔ)言的語(yǔ)義表示。自然語(yǔ)言處理是人工智能領(lǐng)域的一個(gè)熱門(mén)方向,其可以應(yīng)用于語(yǔ)義分析、信息檢索、機(jī)器翻譯、自動(dòng)問(wèn)答、以及聊天機(jī)器人,等等。
語(yǔ)言模型是一串詞序列的概率分布,其是自然語(yǔ)言處理技術(shù)的基礎(chǔ)。通常,語(yǔ)言模型可以通過(guò)大量語(yǔ)料庫(kù)的訓(xùn)練而被構(gòu)建。例如,基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型可以使用一個(gè)三層前饋神經(jīng)網(wǎng)絡(luò),其在訓(xùn)練的過(guò)程中基于反向傳播技術(shù)來(lái)優(yōu)化基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型中的參數(shù)。訓(xùn)練好的語(yǔ)言模型能夠?qū)W習(xí)到句子或詞語(yǔ)之間的關(guān)系,因而可以用于預(yù)測(cè)下一詞語(yǔ)或下一句子等。
發(fā)明內(nèi)容
在本公開(kāi)的實(shí)施例中,提出了一種跨語(yǔ)言的任務(wù)訓(xùn)練方法。在獲得一種語(yǔ)言的訓(xùn)練句子之后,對(duì)訓(xùn)練句子中的某個(gè)詞語(yǔ)進(jìn)行掩碼,并獲得與被掩碼的詞語(yǔ)相對(duì)應(yīng)的另一種語(yǔ)言的對(duì)應(yīng)詞語(yǔ)。然后,使用一種語(yǔ)言的掩碼句子和另一種語(yǔ)言的對(duì)應(yīng)詞語(yǔ)來(lái)預(yù)訓(xùn)練跨語(yǔ)言模型。經(jīng)過(guò)預(yù)訓(xùn)練的跨語(yǔ)言模型具備多語(yǔ)言的理解和處理能力,其可以根據(jù)特定任務(wù)再進(jìn)行進(jìn)一步訓(xùn)練。根據(jù)本公開(kāi)的實(shí)施例,在一種語(yǔ)言存在大量訓(xùn)練語(yǔ)料而另一種語(yǔ)言存在較少甚至沒(méi)有訓(xùn)練語(yǔ)料的情況下,可以通過(guò)跨語(yǔ)言訓(xùn)練方式來(lái)預(yù)訓(xùn)練跨語(yǔ)言模型,使得跨語(yǔ)言模型能夠適用于另一種語(yǔ)言,由此實(shí)現(xiàn)各種語(yǔ)言的模型訓(xùn)練。
提供發(fā)明內(nèi)容部分是為了簡(jiǎn)化的形式來(lái)介紹對(duì)概念的選擇,它們?cè)谙挛牡木唧w實(shí)施方式中將被進(jìn)一步描述。發(fā)明內(nèi)容部分無(wú)意標(biāo)識(shí)本公開(kāi)的關(guān)鍵特征或主要特征,也無(wú)意限制本公開(kāi)的范圍。
附圖說(shuō)明
結(jié)合附圖并參考以下詳細(xì)說(shuō)明,本公開(kāi)各實(shí)施例的上述和其他特征、優(yōu)點(diǎn)及方面將變得更加明顯。在附圖中,相同或相似的附圖標(biāo)記表示相同或相似的元素,其中:
圖1示出了其中可以實(shí)施本公開(kāi)的一個(gè)或多個(gè)實(shí)施例的計(jì)算設(shè)備/服務(wù)器的框圖;
圖2示出了其中可以實(shí)施本公開(kāi)的用于預(yù)訓(xùn)練跨語(yǔ)言模型的方法的流程圖;
圖3示出了其中可以實(shí)施本公開(kāi)的用于訓(xùn)練針對(duì)特定任務(wù)的跨語(yǔ)言模型的過(guò)程的示意圖;
圖4示出了根據(jù)本公開(kāi)的實(shí)施例的用于預(yù)訓(xùn)練跨語(yǔ)言模型的一個(gè)示例的示意圖;
圖5示出了根據(jù)本公開(kāi)的實(shí)施例的用于預(yù)訓(xùn)練跨語(yǔ)言模型的另一示例的示意圖;
圖6示出了根據(jù)本公開(kāi)的實(shí)施例的用于預(yù)訓(xùn)練跨語(yǔ)言模型的又一示例的示意圖;
圖7示出了根據(jù)本公開(kāi)的實(shí)施例的用于進(jìn)一步訓(xùn)練跨語(yǔ)言模型的示例的示意圖;
圖8示出了根據(jù)本公開(kāi)的實(shí)施例的用于微調(diào)跨語(yǔ)言模型的示例的示意圖;以及
圖9示出了根據(jù)本公開(kāi)的實(shí)施例的在搜索引擎中提供問(wèn)答的示例的示圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開(kāi)的實(shí)施例。雖然附圖中顯示了本公開(kāi)的某些實(shí)施例,然而應(yīng)當(dāng)理解的是,本公開(kāi)可以通過(guò)各種形式來(lái)實(shí)現(xiàn),而且不應(yīng)該被解釋為限于這里闡述的實(shí)施例,相反提供這些實(shí)施例是為了更加透徹和完整地理解本公開(kāi)。應(yīng)當(dāng)理解的是,本公開(kāi)的附圖及實(shí)施例僅用于示例性作用,并非用于限制本公開(kāi)的保護(hù)范圍。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910447514.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 自動(dòng)檢測(cè)文件中搭配錯(cuò)誤的系統(tǒng)和方法
- 網(wǎng)絡(luò)連接裝置及網(wǎng)絡(luò)連接裝置的語(yǔ)言環(huán)境設(shè)定方法
- 一種口語(yǔ)評(píng)測(cè)方法及裝置
- 一種語(yǔ)言設(shè)置方法及移動(dòng)終端
- 一種語(yǔ)言文本加載方法和裝置
- 一種語(yǔ)言交流人工智能系統(tǒng)及其語(yǔ)言處理方法
- 語(yǔ)言序列標(biāo)注方法、裝置存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 一種基于語(yǔ)言包實(shí)現(xiàn)繼電保護(hù)裝置多語(yǔ)言版本方法及裝置
- 一種應(yīng)用軟件的多語(yǔ)言核對(duì)方法及系統(tǒng)
- 多語(yǔ)言字幕顯示方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價(jià)值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種自動(dòng)分配和推送的任務(wù)管理平臺(tái)及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲(chǔ)介質(zhì)
- 基于會(huì)話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)





