日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]強化學習模型的更新方法和裝置有效

專利信息
申請?zhí)枺?/td> 201911206271.1 申請日: 2019-11-29
公開(公告)號: CN110990548B 公開(公告)日: 2023-04-25
發(fā)明(設計)人: 張望舒;溫祖杰 申請(專利權)人: 支付寶(杭州)信息技術有限公司
主分類號: G06F16/332 分類號: G06F16/332;G06Q30/01;G06Q30/0207;G06N20/00
代理公司: 北京億騰知識產權代理事務所(普通合伙) 11309 代理人: 孫欣欣;周良玉
地址: 310000 浙江省杭州市*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 強化 學習 模型 更新 方法 裝置
【說明書】:

本說明書實施例提供一種強化學習模型的更新方法和裝置。強化學習模型包括第一動作價值網絡和第二動作價值網絡,分別承擔第一比例和第二比例的線上流量,第一比例大于第二比例,方法包括:接收線上的當前問句;以當前問句作為當前狀態(tài),利用第一動作價值網絡或利用第二動作價值網絡得到當前狀態(tài)對應的動作,以及相應的得到當前狀態(tài)、動作、獎勵和更新狀態(tài)作為一條記錄,將該條記錄以一定概率存儲;抽取記錄,根據(jù)該記錄對第二動作價值網絡進行訓練;當確定訓練后的第二動作價值網絡的效果優(yōu)于第一動作價值網絡時,將第一動作價值網絡更新為訓練后的第二動作價值網絡。能夠保證強化學習模型更新后的穩(wěn)定性和質量。

技術領域

本說明書一個或多個實施例涉及計算機領域,尤其涉及強化學習模型的更新方法和裝置。

背景技術

在智能客服中,用戶在與機器人交互過程中用戶語言口語化、簡略化,或者,用戶的問題描述不清晰、不準確或者描述冗雜,因此通常需要用戶與機器人之間的多輪交互,才能得到用戶想要的知識點答案。由于會話中,涉及到大量用戶交互反饋,所以可以使用強化學習來建模如何根據(jù)用戶問句確定知識點相關回答供用戶反饋。

由于線上用戶問句千變萬化,業(yè)務變更迅速頻繁,用戶的問句興趣點也會隨著時間漂移,所以需要對強化學習模型不斷更新迭代,以達到最佳效果。現(xiàn)有技術中,強化學習模型的更新方法無法保證更新后的穩(wěn)定性和質量。

因此,希望能有改進的方案,能夠保證強化學習模型更新后的穩(wěn)定性和質量。

發(fā)明內容

本說明書一個或多個實施例描述了一種強化學習模型的更新方法和裝置,能夠保證強化學習模型更新后的穩(wěn)定性和質量。

第一方面,提供了一種強化學習模型的更新方法,所述強化學習模型用于機器人客服根據(jù)用戶問句確定知識點相關回答供用戶反饋,所述強化學習模型包括第一動作價值網絡和第二動作價值網絡,所述第一動作價值網絡承擔第一比例的線上流量,所述第二動作價值網絡承擔第二比例的線上流量,所述第一比例大于所述第二比例,方法包括:

接收線上的當前問句;

當所述當前問句被分配給所述第一動作價值網絡時,以所述當前問句作為第一狀態(tài),根據(jù)第一概率和第一動作價值函數(shù)選擇第一回答作為第一動作;

在所述第一狀態(tài)執(zhí)行所述第一動作,獲取所述第一狀態(tài)和所述第一動作對應的第一獎勵,以及狀態(tài)更新后的第一更新狀態(tài);

將所述第一狀態(tài)、所述第一動作、所述第一獎勵和所述第一更新狀態(tài)作為一條記錄,以第二概率將該條記錄存儲在經驗回放列表中;

當所述當前問句被分配給所述第二動作價值網絡時,以所述當前問句作為第二狀態(tài),根據(jù)第三概率和第二動作價值函數(shù)選擇第二回答作為第二動作;

在所述第二狀態(tài)執(zhí)行所述第二動作,獲取所述第二狀態(tài)和所述第二動作對應的第二獎勵,以及狀態(tài)更新后的第二更新狀態(tài);

將所述第二狀態(tài)、所述第二動作、所述第二獎勵和所述第二更新狀態(tài)作為一條記錄,以第四概率將該條記錄存儲在所述經驗回放列表中;

從所述經驗回放列表中抽取記錄,根據(jù)該記錄利用所述第一動作價值函數(shù)計算累積獎勵,根據(jù)所述累積獎勵對所述第二動作價值網絡進行訓練,得到訓練后的所述第二動作價值網絡;

當確定訓練后的所述第二動作價值網絡的效果優(yōu)于所述第一動作價值網絡時,將所述第一動作價值網絡更新為訓練后的所述第二動作價值網絡。

在一種可能的實施方式中,所述以所述當前問句作為第一狀態(tài),根據(jù)第一概率和第一動作價值函數(shù)選擇第一回答作為第一動作,包括:

以所述當前問句作為第一狀態(tài),以所述第一概率根據(jù)所述第一動作價值函數(shù)選擇價值最大的第一回答作為第一動作,以1減所述第一概率的概率隨機選擇第一回答作為第一動作。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201911206271.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日本一二三四区视频| 91狠狠操| 国产一区二区视频免费在线观看 | 国产1区在线观看| 亚洲国产精品一区在线| 99久精品视频| 91av中文字幕| 日韩精品中文字幕一区二区| 国产精品一级片在线观看| 午夜裸体性播放免费观看| 久久综合国产伦精品免费| 国产黄色一区二区三区| 69精品久久| 麻豆国产一区二区| 国产清纯白嫩初高生视频在线观看| 日韩欧美激情| 久久激情综合网| 性生交大片免费看潘金莲| 国产精品一区二区免费| 欧美一区二区三区久久综合| 免费看农村bbwbbw高潮| 秋霞av电影网| 国产视频精品久久| 午夜伦全在线观看| 国产精品电影免费观看| 国产91电影在线观看| 欧美一区二区三区四区在线观看| 国产精一区二区三区| 亚洲一区二区福利视频| 国产精品不卡一区二区三区| 欧美67sexhd| 强制中出し~大桥未久在线播放| 亚洲一二区在线观看| 日韩精品乱码久久久久久| 91免费国产视频| 91一区二区三区久久国产乱| 97久久精品人人澡人人爽| 亚洲精品国产suv| 欧美激情图片一区二区| 精品欧美一区二区在线观看| 欧美激情在线免费| 欧美高清一二三区| 亚洲1区在线观看| 久久精品麻豆| 国产乱老一区视频| 日韩精品免费一区二区夜夜嗨| 一区二区三区精品国产| 国产九九九精品视频| 国产偷久久一区精品69| 久久国产精彩视频| 欧美日韩久久一区二区| 国产97久久| 亚洲网站久久| 国产精品欧美一区二区视频| 国产视频1区2区| 91精品视频在线免费观看| 2020国产精品自拍| 国产91在| 国产一区二区免费在线| 亚洲欧美制服丝腿| 精品国产仑片一区二区三区| 97精品国产aⅴ7777| 午夜av在线电影| 午夜电影一区二区| 性夜影院在线观看| 国产视频一区二区在线播放| 少妇中文字幕乱码亚洲影视| 欧美hdxxxx| 欧美在线播放一区| 欧美精品第1页| 日韩欧美高清一区| 国产精品久久久久久久久久久新郎 | 久久精品亚洲精品国产欧美| 91精品国产麻豆国产自产在线| 国产精品乱码一区| 国产精品久久免费视频在线| 91麻豆精品一区二区三区| 久久影视一区二区| 国产欧美一区二区三区四区| 肥大bbwbbwbbw高潮| 丰满岳乱妇在线观看中字 | 国产日产欧美一区二区| 亚洲欧美国产日韩色伦| 亚洲精品乱码久久久久久高潮| 狠狠色噜噜狠狠狠狠2021天天| 96精品国产| 久久精品一区二区三区电影| 久久精品国产综合| 亚洲精品乱码久久久久久按摩| 国产精品999久久久| 欧美色综合天天久久综合精品| 99日本精品| 17c国产精品一区二区| 日韩精品免费播放| 欧美一区二区三区免费电影| 欧美一级久久精品| 国产亚洲精品精品国产亚洲综合| 在线视频国产一区二区| 国产88av| 午夜666| 在线国产91| 国产超碰人人模人人爽人人添| 爱看av在线入口| 欧美hdxxxx| 香港三日本8a三级少妇三级99| 国产一区二区麻豆| 午夜激情电影在线播放| 精品久久不卡| 亚洲一卡二卡在线| 国产精品高潮呻吟久| 久久综合激情网| 国产精品96久久久久久又黄又硬| 国产精品视频久久久久久久| 国产精品一区二区免费视频| 私人影院av| 日韩a一级欧美一级在线播放| 91麻豆精品国产91久久久无限制版| 手机看片国产一区| 国产精品一二三四五区| 国产精品一品二区三区四区五区| 最新国产精品自拍| 国产精品一区二区毛茸茸| 国产片91| 欧美激情午夜| 欧美精品一区二区久久| 久久91精品国产91久久久 | 午夜码电影| 激情久久综合网| 午夜亚洲国产理论片一二三四 | 亚洲欧美一区二区三区不卡| 淫片免费看| 精品国产乱码久久久久久老虎| 国产精品天堂| 亚洲一级中文字幕| 亚洲国产另类久久久精品性| 久久久久久中文字幕| 夜夜夜夜夜猛噜噜噜噜噜gg| 国产欧美日韩一区二区三区四区| 久久99精品国产一区二区三区| 国产一区第一页| 国产一区免费播放| 久久久久久久国产| 丰满少妇高潮惨叫久久久一| 欧美午夜精品一区二区三区| 美女直播一区二区三区| 亚洲精品久久久久中文第一暮| 久久影院国产精品| 日本aⅴ精品一区二区三区日| 国产精品一区二区av日韩在线| 福利片一区二区三区| 亚洲国产精品国自产拍久久| 国产一区二区三区影院| 一区二区三区四区国产| 国产精品白浆视频| 91精品免费观看| 一区二区精品在线| 欧美一区二区三区四区在线观看| 午夜电影一区二区| 狠狠色丁香久久婷婷综合_中| 国产午夜一区二区三区| 亚洲免费永久精品国产| 午夜精品在线播放| 天堂av色婷婷一区二区三区| 激情久久一区| 欧美日韩中文字幕一区| 久久精品国产色蜜蜜麻豆| 国产1区2区3区| 一区二区三区日韩精品| 国产欧美精品va在线观看| 欧美日韩三区| 国产日韩欧美精品一区| 午夜电影一区| 日韩一区二区精品| 国产精品理人伦一区二区三区| 亚洲国产精品一区二区久久,亚洲午夜 | 高清在线一区二区| 久久久久亚洲精品| 日韩精品人成在线播放| 亚洲综合日韩精品欧美综合区| 国产一级片自拍| 一区二区三区欧美日韩| 日韩一区二区精品| 精品一区欧美| 亚洲欧美一二三| 91精品一区在线观看| 日韩精品中文字幕在线| 国产精品久久久久久久久久久新郎 | 日韩av一区不卡| freexxxx性| 国产精品久久久久久久久久久久久久久久| 欧美一区二区三区四区在线观看| 九九精品久久| 一区二区三区日韩精品| 日韩精品999| 欧美亚洲精品一区二区三区| 国产福利一区在线观看| 亚洲日韩欧美综合| 99久久99精品| 日韩精品免费一区二区三区| 日韩精品一区二区不卡| 久久综合伊人77777麻豆最新章节| 欧美一级免费在线视频| 欧美精品国产一区| 久久国产精品久久| 日本精品一区二区三区在线观看视频 | 国产欧美性| 国产一区二区三区小说| 国产精品久久国产三级国电话系列| 国产日韩欧美不卡| 国产精品久久久爽爽爽麻豆色哟哟 | 久久九九亚洲| 中文无码热在线视频| 麻豆国产一区二区三区| 一区二区三区中文字幕| 国产精品禁18久久久久久| 久久精品亚洲精品| 精品国产一区二| 欧美精品中文字幕亚洲专区| 午夜免费网址| 亚洲三区在线| 国产精品免费专区| 日韩精品免费一区二区三区| 日本一区二区在线观看视频| 在线视频不卡一区| 久久人做人爽一区二区三区小说 | 亚洲一区欧美| 欧美一区二区三区视频在线观看| 国产三级在线视频一区二区三区| 国产伦精品一区二区三区电影 | 欧美极品少妇xx高潮| 欧美一区二区久久| 欧美一级片一区| 日本一区二区三区电影免费观看| 国产一区二区高清视频| 午夜电影一区| 国产一区三区四区| 狠狠插狠狠爱| 女人被爽到高潮呻吟免费看 | 99re久久精品国产| 肥大bbwbbwbbw高潮| 在线观看欧美一区二区三区| 国产精品久久久麻豆| 好吊妞国产欧美日韩软件大全| 日韩一级片免费视频| 97久久国产亚洲精品超碰热| 久久免费视频99|