日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]交互任務的控制方法、裝置、電子設備及存儲介質有效

專利信息
申請號: 202010225186.6 申請日: 2020-03-26
公開(公告)號: CN111443806B 公開(公告)日: 2023-08-11
發明(設計)人: 李曉倩;邱福浩;韓國安;付強;王亮 申請(專利權)人: 騰訊科技(深圳)有限公司
主分類號: G06F3/01 分類號: G06F3/01;G06N20/00
代理公司: 北京市立方律師事務所 11330 代理人: 張筱寧
地址: 518000 廣東省深圳*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 交互 任務 控制 方法 裝置 電子設備 存儲 介質
【說明書】:

本申請涉及人工智能技術領域,提供了一種交互任務的控制方法、裝置、電子設備及存儲介質,該方法包括:獲取交互任務中的交互狀態;將所述交互狀態輸入機器學習模型獲取目標對象在所述交互任務中的控制策略;其中,所述機器學習模型由包括內部收益模型的機器訓練網絡訓練而得,所述內部收益模型對用于訓練的交互數據進行計算得到相應的交互狀態和內部收益值;所述內部收益值表征所述機器學習模型在所述交互狀態下的收斂程度;基于所述控制策略控制所述目標對象進行交互操作。本申請在機器學習模型的訓練過程中采用內部收益模型計算表征模型訓練收斂程度的內部收益值,可有效避免對模型訓練過度,提高模型訓練效率。

技術領域

本申請涉及人工智能技術領域,具體而言,本申請涉及一種交互任務的控制方法、裝置、電子設備及存儲介質。

背景技術

人工智能(Artificial?Intelligence,AI)是利用數字計算機或者數字計算機控制的機器模擬、延伸和擴展人的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術及應用系統。機器學習(Machine?Learning,ML)是人工智能技術中一門多領域交叉學科,其專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。

在機器學習中可采用強化學習的方法訓練AI模型,使得AI模型模擬人類的操作方式與人類進行交互。在強化學習過程中,其涉及到一個探索與利用的均衡問題,探索可以幫助模型充分了解運行環境,利用可以幫助模型選擇當前最優的策略執行;但是如果探索過多模型難以收斂,利用過多模型容易陷入最優解,導致模型能力較低。

現有技術中,解決平衡探索和利用的均衡問題時,一般采用探索策略中的貪心策略(ε-greedy策略),但是該策略雖然可以在前期使模型能探索到過多的狀態,避免模型陷入局部最優解,但是后期過多的探索導致模型收斂速度較慢,且對所有非最優行為采用相同的概率去探索,沒有采取針對性探索,導致模型浪費大量的時間在無意義的探索行為上,其探索效率低下,將導致模型能力較低,在執行任務時無法輸出最優的策略。

發明內容

本申請提供了一種交互任務的控制方法、裝置、電子設備及存儲介質,可以解決上述至少一種技術問題。所述技術方案如下:

第一方面,提供了一種交互任務的控制方法,包括:獲取交互任務中的交互狀態;將所述交互狀態輸入機器學習模型獲取目標對象在所述交互任務中的控制策略;其中,所述機器學習模型由包括內部收益模型的機器訓練網絡訓練而得,所述內部收益模型對用于訓練的交互數據進行計算得到相應的交互狀態和內部收益值;所述內部收益值表征所述機器學習模型在所述交互狀態下的收斂程度;基于所述控制策略控制所述目標對象進行交互操作。

結合第一方面,在第一方面的第一種實施方式中,所述機器訓練網絡包括自對弈模型以及由內部收益模型和外部收益模型構成的收益模型,其中,所述外部收益模型對用于訓練的交互數據進行計算得到外部收益值,所述外部收益值為控制目標對象進行交互操作所得收益;所述機器學習模型的訓練步驟包括:將所述自對弈模型自對弈時生成的交互數據輸入所述收益模型,獲得訓練數據;所述自對弈模型自對弈為采用機器學習模型控制目標對象以及與目標對象交互的交互對象進行交互;基于所述訓練數據訓練所述機器學習模型。

結合第一方面的第一種實施方式,在第一方面的第二種實施方式中,所述基于所述訓練數據訓練所述機器學習模型,包括:將所述訓練數據輸入所述機器學習模型,獲得更新后的機器學習模型;將所述更新后的機器學習模型反饋至所述自對弈模型,迭代所述訓練數據,以迭代更新所述機器學習模型。

結合第一方面的第一種實施方式,在第一方面的第三種實施方式中,所述將所述自對弈模型自對弈時生成的交互數據輸入所述收益模型,獲得訓練數據,包括:將所述自對弈模型自對弈生成的交互數據進行特征抽取,獲得目標狀態特征;其中,所述目標狀態特征包括以單元方式表達的目標對象與交互對象的屬性特征;將所述目標狀態特征輸入所述收益模型,獲得訓練數據。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010225186.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产99小视频| 国产91在| 在线观看欧美日韩国产| 日韩亚洲精品视频| 久久国产精品久久久久久电车| 日韩欧美激情| 日本三级香港三级网站| 国产精品18久久久久白浆| 国产精品一二三四五区| 久久九九亚洲| 一区二区三区在线观看国产| 热re99久久精品国99热蜜月| 欧美视频1区| 国产精品自产拍在线观看蜜| 亚洲国产一区二| 亚洲精品www久久久久久广东 | 久久久久国产精品视频| 国产在线卡一卡二| 亚洲视频h| 国产午夜一级一片免费播放| 欧美日韩一区二区三区四区五区六区| 免费毛片a| 香蕉免费一区二区三区在线观看| 亚洲精品一区二区三区98年| 99久精品视频| 国产白丝一区二区三区| 日韩欧美国产第一页| 欧美一区二区三区免费播放视频了| 福利视频亚洲一区| 国产精品亚洲一区| 激情久久久久久| 欧美午夜看片在线观看字幕| 中文字幕国内精品| 99精品国产一区二区三区麻豆| 久久久久国产一区二区三区不卡| 99精品视频一区二区| 国产午夜精品一区二区三区视频| 夜色av网站| 狠狠色噜噜狠狠狠狠视频| 午夜国内精品a一区二区桃色| 日韩av在线网址| 欧美一区二区三区精品免费| 日韩一区二区精品| 国产精品不卡一区二区三区| 午夜欧美a级理论片915影院| 亚洲午夜精品一区二区三区| 日本三级香港三级| 日本高清二区| 夜夜夜夜曰天天天天拍国产| 91麻豆精品国产91久久久资源速度| 日韩av在线网址| 国产清纯白嫩初高生在线播放性色| 国产精品女人精品久久久天天| 日韩精品一区二区三区四区在线观看 | 美女被羞羞网站视频软件| 久久99国产视频| 国产亚洲精品久久午夜玫瑰园| 91精品国产影片一区二区三区| 精品国产一级| 国产中文字幕一区二区三区| 欧美一区二区在线不卡| 久久精品中文字幕一区| 欧美日韩综合一区二区| 国产电影精品一区| 狠狠色综合欧美激情| 99爱精品在线| 久久精品99国产国产| 欧美日韩卡一卡二| 少妇高潮ⅴideosex| 日韩欧美高清一区| 国产精品视频久久| 欧美67sexhd| 一区二区三区四区中文字幕| 国产精品三级久久久久久电影| 69精品久久| 午夜影院91| 国产精品国产三级国产播12软件| 日韩中文字幕亚洲精品欧美| 久久久一二区| 久久国产精品欧美| 综合久久一区| 久久精品麻豆| 国产69精品福利视频| 亚洲国产一区二区久久久777| 97久久超碰国产精品| av中文字幕一区二区| free性欧美hd另类丰满| 国产在线一区观看| 狠狠色丁香久久婷婷综合丁香| 亚洲va欧美va国产综合先锋| 国产69精品久久久久999小说| 首页亚洲欧美制服丝腿| 国产伦精品一区二| 久久福利免费视频| 一区二区国产盗摄色噜噜| 欧美日韩国产精品一区二区| 亚洲第一天堂久久| 欧美国产精品久久| 精品日韩久久久| 亚洲精品www久久久| 日韩精品久久久久久久酒店| 国产精品视频1区| 乱子伦农村| 欧美日韩三区二区| 国产亚洲精品久久19p| 99久久国产综合精品麻豆 | 欧美在线观看视频一区二区| 国产理论片午午午伦夜理片2021 | 久久一区二区三区视频| 免费在线观看国产精品| 久久精品亚洲精品| 国产精品日韩一区二区| 国产日韩欧美中文字幕| 久久91久久久久麻豆精品| 日韩一区二区中文字幕| 亚洲自拍偷拍一区二区三区| 欧美日韩国产一区二区三区在线观看| 国产乱码精品一区二区三区中文| 国产精品日韩精品欧美精品| 国产一区日韩一区| 中文字幕在线播放一区| 午夜wwwww| 91麻豆精品国产综合久久久久久| 午夜在线看片| 国产一区精品在线观看| 99久国产| 国产性猛交xx乱| 国产精品亚洲精品一区二区三区| 99热久久精品免费精品| 国产精品美女久久久免费| 国产精品美女一区二区视频| 欧美一区二区三区久久精品| 精品国产一区在线| 欧美午夜精品一区二区三区| 国产一区二区a| 91精品综合| 亚洲区日韩| 日韩精品久久久久久久酒店| 国产91在| 淫片免费看| 999久久久国产精品| 久久久久久久国产| 欧美一区二区性放荡片| 日韩欧美一区二区在线视频| 国产1区2区3区| 午夜av男人的天堂| 欧美在线视频一二三区| 中文字幕日本一区二区| 国产一区第一页| 综合久久一区| 免费a一毛片| 少妇高潮一区二区三区99小说| 国产精欧美一区二区三区久久久| 综合在线一区| 国产精品久久久久久久久久久新郎| 中文字幕在线一二三区| 91高清一区| 亚洲国产精品国自产拍av| 精品国产1区2区3区| 一区二区三区四区视频在线| 99精品少妇| 狠狠色丁香久久婷婷综合丁香| 中文字幕+乱码+中文字幕一区| 91超碰caoporm国产香蕉| 欧洲另类类一二三四区| 好吊妞国产欧美日韩免费观看网站| 一区二区欧美视频| 麻豆国产一区二区| 欧美一区二区三区免费在线观看| 日本久久不卡| 欧美日韩国产一区二区三区在线观看 | 亚洲va国产2019| aaaaa国产欧美一区二区| 国产伦精品一区二区三区照片91 | 国产在线一区观看| 午夜看片在线| 丰满少妇高潮惨叫久久久| 国产精品高潮呻吟久| 鲁丝一区二区三区免费| 久99精品| 91一区在线观看| 国产精品日本一区二区不卡视频| 日韩区欧美久久久无人区| 99re6国产露脸精品视频网站| 91精品国产高清一区二区三区| 午夜大片网| 国产电影精品一区| 日韩中文字幕区一区有砖一区| 狠狠色噜噜狠狠狠四色米奇| 国产.高清,露脸,对白| 狠狠色噜噜狠狠狠狠米奇777| 午夜影院一级| 国产精品一区二区日韩新区| 97精品超碰一区二区三区| 99精品欧美一区二区三区美图| 香蕉视频在线观看一区二区| 午夜黄色大片| 国产一区二区三区国产| 欧美一区二区三区久久综合| 国产精品久久久久免费a∨大胸| 亚洲国产欧美一区| 国产一区正在播放| 亚洲精品国产精品国自| 国产精品欧美久久久久一区二区| 久久91精品国产91久久久 | 国产大片一区二区三区| 精品久久久久久中文字幕| 精品国产一区二区三区麻豆免费观看完整版 | 精品国产一区二区三区国产馆杂枝| 97一区二区国产好的精华液| 国产精彩视频一区二区| 欧美一区二区三区黄| 国产一级自拍片| 中文乱幕日产无线码1区| 国产精品一区二区三| 热99re久久免费视精品频软件| 一色桃子av| 欧美日韩一区二区三区四区五区| 久久精品综合| 色婷婷精品久久二区二区蜜臂av| 午夜在线看片| 99精品欧美一区二区| 国产午夜精品一区| 日韩午夜三级| 久久精品一二三| 中文在线一区二区三区| 精品少妇一区二区三区| 国产人成看黄久久久久久久久| 国产精品一级片在线观看| 国产91电影在线观看| 91超薄丝袜肉丝一区二区| 国产精品一区二区日韩新区 | 99精品国产一区二区三区不卡| 国产伦精品一区二区三区电影 | 午夜剧场a级免费| 高清欧美精品xxxxx在线看| 中文字幕天天躁日日躁狠狠躁免费 | 亚洲精品20p| 国偷自产中文字幕亚洲手机在线| 午夜伦理在线观看| 浪潮av网站| 激情久久一区二区| 亚洲国产aⅴ精品一区二区16| 国产99久久久精品视频| 91精品国产综合久久婷婷香| 男女视频一区二区三区|