日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)在審

專利信息
申請(qǐng)?zhí)枺?/td> 201911366985.9 申請(qǐng)日: 2019-12-26
公開(公告)號(hào): CN113052191A 公開(公告)日: 2021-06-29
發(fā)明(設(shè)計(jì))人: 王亞平;王志剛;楊碩;劉雅婷;劉振宇;王澤皓;王芳 申請(qǐng)(專利權(quán))人: 航天信息股份有限公司
主分類號(hào): G06K9/62 分類號(hào): G06K9/62
代理公司: 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 代理人: 李迪
地址: 100195 北京市*** 國(guó)省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 神經(jīng) 語(yǔ)言 網(wǎng)絡(luò) 模型 訓(xùn)練 方法 裝置 設(shè)備 介質(zhì)
【說明書】:

發(fā)明實(shí)施例提供了一種神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用以降低訓(xùn)練樣本數(shù)據(jù)的標(biāo)注量,同時(shí)提高語(yǔ)言模型的訓(xùn)練效率。所述方法包括:獲取訓(xùn)練樣本數(shù)據(jù);循環(huán)執(zhí)行如下步驟,直至訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型滿足預(yù)設(shè)要求:利用前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型對(duì)未進(jìn)行標(biāo)注的訓(xùn)練樣本數(shù)據(jù)進(jìn)行預(yù)測(cè),確定用于表征每個(gè)訓(xùn)練樣本數(shù)據(jù)被識(shí)別的識(shí)別概率;依據(jù)預(yù)設(shè)選擇策略,基于每個(gè)訓(xùn)練樣本數(shù)據(jù)的識(shí)別概率,從未進(jìn)行標(biāo)注的訓(xùn)練樣本數(shù)據(jù)中選擇部分訓(xùn)練樣本數(shù)據(jù)請(qǐng)求進(jìn)行人工標(biāo)注;獲取人工標(biāo)注后的訓(xùn)練樣本數(shù)據(jù),并基于人工標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)對(duì)前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到新的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型。

技術(shù)領(lǐng)域

本發(fā)明涉及神經(jīng)網(wǎng)絡(luò)領(lǐng)域,尤其涉及一種神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)

近些年來,基于海量數(shù)據(jù)的深度學(xué)習(xí)方法在文本領(lǐng)域取得了較好的效果,但其學(xué)習(xí)過程大部分都是有監(jiān)督的,即需要大量的帶標(biāo)注的訓(xùn)練數(shù)據(jù)。而現(xiàn)實(shí)場(chǎng)景中海量數(shù)據(jù)的標(biāo)注工作不僅是單調(diào)乏味,浪費(fèi)時(shí)間,而且需要耗費(fèi)一定的人力和物力,如領(lǐng)域文本的實(shí)體標(biāo)注,分類等任務(wù)。

為了解決此類問題,提出了遷移學(xué)習(xí)(transfer learning)的概念,即試圖將源任務(wù)獲得的知識(shí),應(yīng)用于目標(biāo)領(lǐng)域。在文本領(lǐng)域,遷移學(xué)習(xí)最常見的應(yīng)用是神經(jīng)語(yǔ)言模型網(wǎng)絡(luò),如ELMo、GPT和BERT等模型,其中BERT模型是目前效果最好的?,F(xiàn)有技術(shù)中先使用BERT模型在大規(guī)模語(yǔ)料上進(jìn)行無監(jiān)督學(xué)習(xí)得到的預(yù)訓(xùn)練模型,然后進(jìn)行特定文本任務(wù)的遷移學(xué)習(xí),實(shí)驗(yàn)表明雖然可以顯著的降低文本深度網(wǎng)絡(luò)對(duì)標(biāo)注數(shù)據(jù)量的需求,但在實(shí)際任務(wù)中對(duì)語(yǔ)言模型的訓(xùn)練需要消耗大量時(shí)間,并且經(jīng)模型訓(xùn)練識(shí)別后,仍需要數(shù)千級(jí)以上的待標(biāo)注訓(xùn)練數(shù)據(jù),特別是針對(duì)一些特殊應(yīng)用領(lǐng)域,如醫(yī)學(xué)、政務(wù)等,需專家進(jìn)行標(biāo)注,仍需花費(fèi)較大的代價(jià)。

綜上所述,現(xiàn)有技術(shù)中的文本深度學(xué)習(xí)網(wǎng)絡(luò),訓(xùn)練數(shù)據(jù)標(biāo)注量較大,語(yǔ)言模型的訓(xùn)練時(shí)間較長(zhǎng)。

發(fā)明內(nèi)容

本發(fā)明實(shí)施例提供了一種神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用以降低訓(xùn)練樣本數(shù)據(jù)的標(biāo)注量,同時(shí)提高語(yǔ)言模型的訓(xùn)練效率。

第一方面,本發(fā)明實(shí)施例提供一種神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的訓(xùn)練方法,包括:

獲取訓(xùn)練樣本數(shù)據(jù);

循環(huán)執(zhí)行如下步驟,直至訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型滿足預(yù)設(shè)要求:

利用前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型對(duì)未進(jìn)行標(biāo)注的訓(xùn)練樣本數(shù)據(jù)進(jìn)行預(yù)測(cè),確定用于表征每個(gè)訓(xùn)練樣本數(shù)據(jù)被識(shí)別的識(shí)別概率;

依據(jù)預(yù)設(shè)選擇策略,基于每個(gè)訓(xùn)練樣本數(shù)據(jù)的識(shí)別概率,從未進(jìn)行標(biāo)注的訓(xùn)練樣本數(shù)據(jù)中選擇部分訓(xùn)練樣本數(shù)據(jù)請(qǐng)求進(jìn)行人工標(biāo)注;

獲取人工標(biāo)注后的訓(xùn)練樣本數(shù)據(jù),并基于人工標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)對(duì)前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,調(diào)整前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的參數(shù),得到新的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型。

本發(fā)明實(shí)施例提供的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的訓(xùn)練方法,根據(jù)業(yè)務(wù)需求,獲取訓(xùn)練樣本數(shù)據(jù)后,循環(huán)執(zhí)行如下步驟,直至訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型滿足預(yù)設(shè)要求:首先,利用前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型對(duì)未進(jìn)行標(biāo)注的訓(xùn)練樣本數(shù)據(jù)進(jìn)行預(yù)測(cè),確定用于表征每個(gè)訓(xùn)練樣本數(shù)據(jù)被識(shí)別的識(shí)別概率;然后依據(jù)預(yù)設(shè)選擇策略,并基于每個(gè)訓(xùn)練樣本數(shù)據(jù)的識(shí)別概率,在未進(jìn)行標(biāo)注的訓(xùn)練樣本數(shù)據(jù)中選擇出部分訓(xùn)練樣本數(shù)據(jù),請(qǐng)求進(jìn)行人工標(biāo)注;最后獲取人工標(biāo)注后的訓(xùn)練樣本數(shù)據(jù),并基于人工標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)對(duì)前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,調(diào)整前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型的參數(shù),得到新的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型。與現(xiàn)有技術(shù)相比,在訓(xùn)練過程對(duì)神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型不斷進(jìn)行優(yōu)化,提高了模型的訓(xùn)練效率,經(jīng)不斷優(yōu)化的模型識(shí)別后,有效降低了訓(xùn)練樣本數(shù)據(jù)的標(biāo)注量,減少了樣本數(shù)據(jù)標(biāo)注的成本。

在一種可能的實(shí)施方式中,基于人工標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)對(duì)前一次訓(xùn)練得到的神經(jīng)語(yǔ)言網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,包括:

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于航天信息股份有限公司,未經(jīng)航天信息股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201911366985.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产精品国产亚洲精品看不卡15 | 久久久精品观看| 欧美国产一区二区三区激情无套| 欧美一区二区三区久久精品视| 日日噜噜夜夜狠狠| 久久国产精彩视频| 午夜无遮挡| 亚洲精品乱码久久久久久写真| 夜夜爽av福利精品导航| 日韩精品少妇一区二区在线看| 99久久婷婷国产综合精品电影| 日韩av在线免费电影| 国内精品久久久久久久星辰影视| 四虎国产精品永久在线国在线| 精品99在线视频| 国产无遮挡又黄又爽又色视频| 国产日韩一区二区三免费| 狠狠色狠狠色综合日日2019| 色妞www精品视频| 日本三级韩国三级国产三级| 国产91免费观看| 国产1区2区视频| 国产区图片区一区二区三区| 一区二区在线精品| 91久久国产视频| 26uuu色噜噜精品一区二区| 中文字幕一区二区三区乱码视频| 日韩av在线一区| 国产精品一区二区av日韩在线 | 国产精品5区| 国产在线卡一卡二| 九九热国产精品视频| 99久久夜色精品国产网站| 日韩欧美中文字幕一区| 午夜国产一区二区三区四区| 国产一区二区手机在线观看| 亚洲视频精品一区| 国产91免费观看| 欧美国产亚洲精品| 久久乐国产精品| 国产一区二区日韩| 秋霞av电影网| 亚洲精品国产一区二区三区| 国产精品久久久久久久四虎电影| 国产一级自拍片| 国产精品久久免费视频| 黄色香港三级三级三级| 国产一二区精品| 99久久精品一区| 理论片午午伦夜理片在线播放 | av狠狠干| 欧美精品在线视频观看| 色综合欧美亚洲国产| 99国产精品9| 国产伦精品一区二区三区免费优势| 国产精品视频一区二区二| 欧美系列一区二区| 国产一区网址| 亚洲国产精品国自产拍久久| 欧美一区二区三区三州| 国产农村妇女精品一区二区| 男女视频一区二区三区| 青苹果av| 九一国产精品| 精品无人国产偷自产在线| 欧美日韩国产欧美| 中文字幕区一区二| 欧美精品二区三区| 91久久香蕉国产日韩欧美9色| 黄色av免费| 欧美亚洲视频二区| 亚洲自偷精品视频自拍| 久久久精品久久日韩一区综合| 88888888国产一区二区| 精品国产乱码久久久久久图片| 国产日韩欧美自拍| 日韩亚洲精品在线观看| 国产1区2区视频| 九九久久国产精品| 国产经典一区二区三区| 欧美三区视频| 亚洲欧美另类久久久精品2019|