日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]獎(jiǎng)勵(lì)模型處理方法、電子設(shè)備、介質(zhì)和計(jì)算機(jī)程序產(chǎn)品在審

專利信息
申請(qǐng)?zhí)枺?/td> 202011407855.8 申請(qǐng)日: 2020-12-03
公開(公告)號(hào): CN113535911A 公開(公告)日: 2021-10-22
發(fā)明(設(shè)計(jì))人: 侯政旭;劉亞飛;趙瑞輝 申請(qǐng)(專利權(quán))人: 騰訊科技(深圳)有限公司
主分類號(hào): G06F16/332 分類號(hào): G06F16/332;G06F40/35;G06N3/04
代理公司: 北京市柳沈律師事務(wù)所 11105 代理人: 王娟
地址: 518057 廣東省深圳*** 國(guó)省代碼: 廣東;44
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 獎(jiǎng)勵(lì) 模型 處理 方法 電子設(shè)備 介質(zhì) 計(jì)算機(jī) 程序 產(chǎn)品
【說(shuō)明書】:

提供了獎(jiǎng)勵(lì)模型處理方法、電子設(shè)備、介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。處理方法可以包括:獲取多輪次樣本對(duì)話,每輪次樣本對(duì)話包括樣本問句以及對(duì)應(yīng)的樣本答句;利用判別器模型構(gòu)造獎(jiǎng)勵(lì)模型,基于每輪次樣本對(duì)話,迭代地對(duì)生成器模型和判別器模型進(jìn)行訓(xùn)練,直至兩個(gè)模型滿足預(yù)設(shè)平衡條件;其中,每輪次樣本對(duì)話對(duì)應(yīng)于一次訓(xùn)練回合,在每次訓(xùn)練回合中:利用生成器模型基于當(dāng)前和先前輪次樣本對(duì)話生成偽樣本對(duì)話,偽樣本對(duì)話包括當(dāng)前輪次樣本對(duì)話中的樣本問句以及對(duì)應(yīng)的預(yù)測(cè)答句;利用判別器模型基于當(dāng)前、先前輪次樣本對(duì)話和偽樣本對(duì)話生成判別結(jié)果;以及基于判別結(jié)果調(diào)整生成器模型的參數(shù)以及基于生成器模型生成的偽樣本對(duì)話調(diào)整判別器模型的參數(shù)。

技術(shù)領(lǐng)域

本公開涉及人工智能技術(shù)領(lǐng)域,具體而言,本公開涉及一種任務(wù)型對(duì)話系統(tǒng)中的獎(jiǎng)勵(lì)模型的處理方法、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

背景技術(shù)

隨著信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)技術(shù)隨之發(fā)展,用戶經(jīng)常需要通過(guò)互聯(lián)網(wǎng)查詢各種信息,以獲得相應(yīng)的答案,因此,任務(wù)導(dǎo)向型對(duì)話系統(tǒng)(也稱為任務(wù)型對(duì)話系統(tǒng))變得日益流行,其是一種可以完成人類要求的具體任務(wù)的對(duì)話系統(tǒng),在實(shí)際當(dāng)中有著非常廣泛的應(yīng)用,能夠完成人類的基本所需,例如訂機(jī)票、酒店等等,這大大減少了人力資源的使用。

在任務(wù)導(dǎo)向型對(duì)話中,主要是通過(guò)強(qiáng)化學(xué)習(xí)模型來(lái)針對(duì)用戶輸入預(yù)測(cè)輸出,而對(duì)于強(qiáng)化學(xué)習(xí)模型需要根據(jù)獎(jiǎng)勵(lì)模型進(jìn)行訓(xùn)練。當(dāng)前基于強(qiáng)化學(xué)習(xí)的對(duì)話系統(tǒng)需要人工精心設(shè)計(jì)的獎(jiǎng)勵(lì)模型,強(qiáng)化學(xué)習(xí)所需要的訓(xùn)練時(shí)間長(zhǎng),訓(xùn)練步數(shù)多,并且還存在獎(jiǎng)勵(lì)稀疏的問題。此外,隨著對(duì)系統(tǒng)處理跨多個(gè)領(lǐng)域的復(fù)雜目標(biāo)的需求不斷增長(zhǎng),處理現(xiàn)實(shí)任務(wù)的復(fù)雜性對(duì)于這種人工設(shè)計(jì)的獎(jiǎng)勵(lì)模型而言是無(wú)法承受的,從而影響強(qiáng)化學(xué)習(xí)的學(xué)習(xí)效果以及模型預(yù)測(cè)的準(zhǔn)確率,進(jìn)而使得基于強(qiáng)化學(xué)習(xí)的對(duì)話系統(tǒng)的用戶體驗(yàn)度不佳。

因此,需要一種提升基于強(qiáng)化學(xué)習(xí)的學(xué)習(xí)效果以及模型預(yù)測(cè)的準(zhǔn)確率的方法。

發(fā)明內(nèi)容

本公開為了解決現(xiàn)有的用于任務(wù)型對(duì)話系統(tǒng)的強(qiáng)化學(xué)習(xí)模型中的上述問題,提出了一種能夠提升基于強(qiáng)化學(xué)習(xí)的學(xué)習(xí)效果以及模型預(yù)測(cè)的準(zhǔn)確率的方法,更具體地,提供了一種任務(wù)型對(duì)話系統(tǒng)中的獎(jiǎng)勵(lì)模型的處理方法、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

根據(jù)本公開的一方面,提供了一種任務(wù)型對(duì)話系統(tǒng)中的獎(jiǎng)勵(lì)模型的處理方法,包括:獲取多輪次樣本對(duì)話,每輪次樣本對(duì)話包括樣本問句以及對(duì)應(yīng)的樣本答句;以及利用判別器模型構(gòu)造所述獎(jiǎng)勵(lì)模型,基于所述多輪次樣本對(duì)話中的每輪次樣本對(duì)話,迭代地對(duì)生成器模型和判別器模型進(jìn)行訓(xùn)練,直至所述生成器模型和所述判別器模型滿足預(yù)設(shè)平衡條件;其中,每輪次樣本對(duì)話對(duì)應(yīng)于一次訓(xùn)練回合,在每次訓(xùn)練回合中,利用所述生成器模型基于當(dāng)前輪次樣本對(duì)話和當(dāng)前輪次之前的先前輪次樣本對(duì)話生成偽樣本對(duì)話,所述偽樣本對(duì)話包括所述當(dāng)前輪次樣本對(duì)話中的樣本問句以及對(duì)應(yīng)的預(yù)測(cè)答句;利用所述判別器模型基于所述當(dāng)前輪次樣本對(duì)話、先前輪次樣本對(duì)話和所述偽樣本對(duì)話生成對(duì)所述偽樣本對(duì)話的判別結(jié)果;以及基于所述判別結(jié)果調(diào)整所述生成器模型的參數(shù)以及基于生成器模型生成的偽樣本對(duì)話調(diào)整所述判別器模型的參數(shù)。

根據(jù)本公開的實(shí)施例,其中,所述樣本對(duì)話被編碼為具有狀態(tài)和動(dòng)作的特征表示,其中狀態(tài)與指示所述樣本問句填充到各個(gè)預(yù)設(shè)語(yǔ)義槽的槽值的概率的置信度相關(guān)并且所述動(dòng)作與所述樣本答句所涉及的行為相關(guān)。

根據(jù)本公開的實(shí)施例,其中,利用生成器模型基于當(dāng)前輪次樣本對(duì)話和用于先前訓(xùn)練回合的樣本對(duì)話生成偽樣本對(duì)話,包括:對(duì)于所述先前輪次樣本對(duì)話中的第一輪次對(duì)話,對(duì)所述第一輪次對(duì)話的特征表示進(jìn)行特征提取,以得到所述第一輪次對(duì)話的特征向量;對(duì)于所述先前輪次樣本對(duì)話中的其他每一輪次對(duì)話,對(duì)所述輪次對(duì)話的特征表示和前一輪次對(duì)話的特征向量進(jìn)行特征提取,以得到綜合特征向量,作為所述輪次對(duì)話的特征向量;以及基于所述當(dāng)前輪次樣本對(duì)話的前一個(gè)輪次對(duì)話的特征向量、所述當(dāng)前輪次樣本對(duì)話的特征表示中的樣本問句對(duì)應(yīng)的狀態(tài),生成與所述當(dāng)前輪次樣本對(duì)話的樣本問句的狀態(tài)對(duì)應(yīng)的預(yù)測(cè)動(dòng)作,基于所述預(yù)測(cè)動(dòng)作生成第一預(yù)測(cè)答句,并且將所述樣本問句以及所述預(yù)測(cè)答句作為偽樣本對(duì)話。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011407855.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 精品少妇一区二区三区免费观看焕| 亚洲精品国产一区| 丰满岳妇伦4在线观看| 国产乱了高清露脸对白| 国产精品一区二区日韩新区| 浪潮av色| 大bbw大bbw巨大bbw看看| 欧美日韩国产专区| 国产精选一区二区| 国产伦精品一区二区三| 国产欧美精品一区二区三区小说| free性欧美hd另类丰满 | 国产一区二区中文字幕| 国产在线欧美在线| 久久精品手机视频| 亚洲精品丝袜| 国产女人和拘做受视频免费| 国产在线卡一卡二| 国产精品剧情一区二区三区| 日韩精品中文字幕在线播放| 午夜电影三级| 国产精品麻豆一区二区| 欧美一区二区三区黄| 久久99精品久久久久国产越南| 午夜欧美a级理论片915影院| 国产精品一区一区三区| 欧美精品二区三区| 久久艹国产精品| 日韩一级片免费视频| 免费午夜片| 99精品小视频| 国产亚洲精品久久久久动| 国产欧美一区二区三区不卡高清| 日韩午夜毛片| 国产日韩欧美不卡| 国产精品理人伦一区二区三区 | 国产精品一区二区在线看| 日本一区二区三区中文字幕| 亚洲欧美一卡| 国产精品亚州| 午夜影院一区| 国产一区二区a| 国产在线不卡一区| 国产亚洲精品久久网站| 日韩av在线电影网| 国产精品1234区| 国产一区在线精品| 三上悠亚亚洲精品一区二区| 88国产精品欧美一区二区三区三| 毛片大全免费观看| 91精品夜夜| 国产欧美日韩一区二区三区四区| 精品一区中文字幕| 久久久99精品国产一区二区三区| 亚洲福利视频一区二区| 91久久免费| 99精品久久99久久久久| 日本一级中文字幕久久久久久| 亚洲精品suv精品一区二区| free性欧美hd另类丰满| 国产在线播放一区二区| 国产91电影在线观看| 国产精品免费一区二区区| 一本久久精品一区二区| 精品久久9999| 国产人成看黄久久久久久久久| 在线视频国产一区二区| 午夜av影视| 国产不卡一区在线| 91av一区二区三区| 91精品国产九九九久久久亚洲| 国产69精品久久久久孕妇不能看 | 国产999精品视频| 日本午夜一区二区| 午夜天堂电影| 护士xxxx18一19| 国产suv精品一区二区4| 国产资源一区二区| 欧美日韩国产91| 狠狠色依依成人婷婷九月| 国产一级片子| 午夜av男人的天堂| 毛片大全免费看| 国产欧美精品va在线观看| 一色桃子av大全在线播放| 国产精品69久久久| 国产91丝袜在线播放动漫| 午夜免费网址| 久久一二区| 妖精视频一区二区三区| 国产精品久久久不卡| 国产一区二区麻豆| 亚洲精品乱码久久久久久写真| 亚洲欧美一二三| 国产视频精品久久| 免费看欧美中韩毛片影院| 欧美一区二三区人人喊爽| 制服丝袜二区| 国产精品视频一区二区三| 狠狠色噜噜狠狠狠狠777| 亚洲国产精品网站| 91精品第一页| free性欧美hd另类丰满| 亚洲国产精品肉丝袜久久| 一区二区免费在线观看| 国产伦精品一区二区三区无广告| 国产精品色在线网站| 93久久精品日日躁夜夜躁欧美| 国产欧美一区二区三区视频| 在线国产一区二区三区| 91影视一区二区三区| 色噜噜狠狠色综合影视| 在线视频不卡一区| 天堂av一区二区| 色婷婷综合久久久中文一区二区| 欧美一区二区三区视频在线观看| 免费午夜在线视频| 欧美日韩国产一区在线| 99久久免费精品国产男女性高好| 亚洲乱在线| 91精品综合| 麻豆精品久久久| 国产二区不卡| 九九热国产精品视频| 亚洲久色影视| 日韩夜精品精品免费观看| 国产精品一区二区在线看| 国产精品v一区二区三区| 日韩av三区| 久久三级精品| 久久99久国产精品黄毛片入口| 狠狠躁天天躁又黄又爽| 性old老妇做受| 91精品系列| www.久久精品视频| 久久国产欧美一区二区三区精品| 国产精品无码专区在线观看| 亚洲第一区国产精品| 狠狠插狠狠爱| 国产丝袜一区二区三区免费视频| 久久噜噜少妇网站| 欧美在线观看视频一区二区三区| 国产日韩精品一区二区| 国产中文字幕一区二区三区| 国产伦高清一区二区三区| av国产精品毛片一区二区小说| 强制中出し~大桥未久在线播放| 国产在线精品一区| 国产精品一区二区av日韩在线 | 欧美国产在线看| 亚洲精品91久久久久久| 欧美hdxxxx| 久久国产精品久久| 国产有码aaaae毛片视频| 久久99精品一区二区三区| 亚洲欧美一区二区三区1000 | 久久一区二区三区视频| 国产日韩欧美在线影视| 国产欧美精品一区二区三区-老狼| 狠狠躁夜夜| 久久国产精品广西柳州门| 国产一区二区激情| а√天堂8资源中文在线| 国产精品欧美一区二区视频| 高清欧美精品xxxxx| 欧美在线观看视频一区二区| 少妇高潮一区二区三区99小说| 亚洲午夜天堂吃瓜在线| 欧美一区二区三区不卡视频| 亚洲一二三四区| 96国产精品视频| 狠狠躁狠狠躁视频专区| 日本一区二区三区电影免费观看| 玖玖精品国产| 亚洲第一天堂无码专区| 一级黄色片免费网站| 电影91久久久| 国产在线卡一卡二| 久久99国产精品久久99果冻传媒新版本 | 久久精品国产综合| 欧美日韩国产免费观看| 久久99精品国产麻豆婷婷| 久久艹国产精品| 欧美日韩国产精品一区二区三区| 国产一区=区| 国产精品高潮呻吟三区四区 | 日本一区二区电影在线观看| 日本福利一区二区| 国产精品对白刺激在线观看| 欧美日韩综合一区| 亚洲欧洲国产伦综合| 国产一区影院| 精品国精品国产自在久不卡| 99精品国产一区二区三区不卡| 国产一区二区伦理| 国产欧美一区二区三区免费看| 999偷拍精品视频| 国产精品一级片在线观看| 亚洲精品卡一| 国产精品乱码久久久久久久| 91超薄丝袜肉丝一区二区| 国产精品一区二| 国产精品一区二区日韩新区| 91片在线观看| 97久久精品人人澡人人爽| 97欧美精品| 狠狠插影院| 日韩欧美高清一区二区| 国产全肉乱妇杂乱视频在线观看 | 一区二区国产盗摄色噜噜| 精品国产免费一区二区三区| 日韩精品中文字幕在线| 少妇高清精品毛片在线视频| 欧美日韩中文字幕三区| 99精品视频一区二区| 国产精品人人爽人人做av片| 久久99精品国产一区二区三区| 亚洲精欧美一区二区精品| 午夜av电影网| 97精品国产aⅴ7777| 国产精品一级片在线观看| 午夜激情在线播放| 国产视频精品一区二区三区| 国产视频二区| 午夜免费网址| 久久第一区| 国产精品一区二区三区在线看| 天干天干天干夜夜爽av| 国产午夜精品一区二区三区视频| 99久久精品一区二区| 午夜国产一区二区三区四区| 欧美午夜羞羞羞免费视频app| 日韩精品1区2区3区| 久久激情网站| 国产精品一品二区三区四区五区| 日韩精品一区三区| 国产女人好紧好爽| 欧美一区二区色| 国产精品国产三级国产专区53| 久久97国产| 亚洲精品一区,精品二区| 亚洲神马久久| 欧美日韩国产一区在线| 日本一区二区在线观看视频| 中文字幕一区二区三区乱码视频| 日韩精品一区二区亚洲|