日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]用于人機交互的行為決策方法、裝置、設備及存儲介質在審

專利信息
申請號: 202210836407.2 申請日: 2022-07-15
公開(公告)號: CN115186828A 公開(公告)日: 2022-10-14
發明(設計)人: 吳翼;于超;汪玉;高嘉煊;劉巍林 申請(專利權)人: 清華大學
主分類號: G06N20/00 分類號: G06N20/00;G06N5/04;G06N7/00;A63F13/67;A63F13/79
代理公司: 北京清亦華知識產權代理事務所(普通合伙) 11201 代理人: 李雪靜
地址: 100084*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 用于 人機交互 行為 決策 方法 裝置 設備 存儲 介質
【說明書】:

本申請涉及人工智能技術領域,特別涉及一種用于人機交互的行為決策方法、裝置、設備及存儲介質,其中,方法包括:獲取人機交互場景中至少一個目標事件;隨機搜索至少一個目標事件的目標獎勵函數空間,得到多個行為偏好,基于多個行為偏好生成偏置策略集合,根據預設行為指標從偏置策略集合中依次選擇不同類型的偏見策略,根據不同類型的偏見策略和預設獎勵策略構建策略多樣化的策略池;從策略池中隨機采樣策略訓練得到目標智能體的自適應策略,并基于自適應策略決策與目標智能體進行人機交互的行為,得到行為決策結果。由此,本申請實施例可以實現以人為中心的強交互與協同泛化性,以及大規模多智能體在開放場景中的群體行為決策泛化性。

技術領域

本申請涉及人工智能技術領域,特別涉及一種用于人機交互的行為決策方法、裝置、設備及存儲介質。

背景技術

經過數十年的研究努力,構建可以與人類交互、合作和輔助人類的智能體仍然是一項長期的AI挑戰。經典方法通常是基于模型的(model-based),它通常是基于人類數據建立一個有效的行為模型,并使用這樣的人類模型進行規劃。盡管這種方案取得了巨大成功,但這種基于模型的范式需要一個昂貴且耗時的數據收集過程,這對于當今AI技術面向的復雜問題很不友好,并且還可能存在隱私問題。

最近,多智能體強化學習(multi-agent reinforcement learning,MARL)已成為解決許多具有挑戰性的決策問題的有前途的方法。特別是在競爭環境中,基于自我博弈(self-play,SP)的MARL算法訓練的人工智能在各個領域都擊敗了人類專業人士。這一經驗證據表明,開發強大的AI的新方向可以以類似的“無模型”(model-free)方式直接與人類合作,即通過自我博弈。

與簡單地采用納什均衡策略(Nash equilibrium strategy)就足夠的零和游戲(zero-sum game)不同,通過自我博弈訓練合作智能體時的一個明顯問題是共識過度擬合(convention overfitting)。由于合作博弈中存在大量可能的最優策略,自我博弈訓練的智能體可以很容易地收斂到一個特定的最優值,并僅根據其共同訓練者的某種特定行為模式(即共識)做出決策,導致對未知的合作伙伴的泛化能力差。

發明內容

本申請提供一種用于人機交互的行為決策方法、裝置、電子設備及存儲介質,可以實現以人為中心的強交互與協同泛化性,以及大規模多智能體在開放場景中的群體行為決策泛化性。

本申請第一方面實施例提供一種用于人機交互的行為決策方法,包括以下步驟:獲取人機交互場景中至少一個目標事件;隨機搜索所述至少一個目標事件的目標獎勵函數空間,得到多個行為偏好,基于所述多個行為偏好生成偏置策略集合,根據預設行為指標從所述偏置策略集合中依次選擇不同類型的偏見策略,根據所述不同類型的偏見策略和預設獎勵策略構建策略多樣化的策略池;從所述策略池中隨機采樣策略訓練得到目標智能體的自適應策略,并基于所述自適應策略決策與所述目標智能體進行人機交互的行為,得到行為決策結果。

可選地,所述隨機搜索所述至少一個目標事件的目標獎勵函數空間,得到多個行為偏好,基于所述多個行為偏好生成偏置策略集合,包括:對所述目標獎勵函數空間的特征權重采樣多個樣本,并根據所述多個樣本得到一組隱藏的獎勵函數;對于每個隱藏獎勵函數,通過自我博弈找到由其推導的隱勢能馬爾可夫博弈的近似納什均衡解,并基于所述近似納什均衡解得到涵蓋多個行為偏好的偏置策略集合。

可選地,所述根據預設行為指標從所述偏置策略集合中依次選擇不同類型的偏見策略,包括:獲取初始池中的初始策略;根據預設行為指標從所述偏置策略集合中選擇與所述初始策略不同的偏見策略。

可選地,在隨機搜索所述至少一個目標事件的目標獎勵函數空間之前,包括:識別所述至少一個目標事件的事件特征;根據所述事件特征的線性函數和特征權重的界限生成所述目標獎勵函數空間。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210836407.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91精品国产综合久久婷婷香| 日韩精品999| 亚洲国产一二区| 国产一区二区在线观| 国产一区二区极品| 国产高清一区二区在线观看| 91国产一区二区| 国产二区免费| 国产精品精品国内自产拍下载| 亚洲精品日韩激情欧美| 亚洲精品久久久久中文第一暮| 99国产精品久久久久99打野战| 国产91清纯白嫩初高中在线观看| 久久天天躁夜夜躁狠狠躁2022| 国产亚洲精品久久网站| 国产在线欧美在线| 免费观看又色又爽又刺激的视频| 免费观看xxxx9999片| 精品久久久久久久免费看女人毛片| 午夜影院黄色片| 国产精品一区二区不卡| 亚洲精品卡一卡二| 97欧美精品| 欧美激情在线免费| 精品久久久久久亚洲综合网| 思思久久96热在精品国产| 国产日韩欧美视频| 亚洲精品卡一卡二 | 久久久久国产精品视频| 首页亚洲欧美制服丝腿| 国产精品麻豆自拍| 国产欧美一区二区三区四区| 亚洲午夜国产一区99re久久| 国产主播啪啪| 国产一区二区三区久久久| 国产区二区| 久久二区视频| 亚洲少妇一区二区| 丰满岳乱妇在线观看中字 | 日日夜夜亚洲精品| 午夜av网址| 国产精品亚洲а∨天堂123bt| 日韩中文字幕在线一区| 精品国产区一区二| 国产一区免费播放| 国产特级淫片免费看| 国产影院一区二区| 国产在线视频99| 999久久国精品免费观看网站| 国产欧美久久一区二区三区| 国产1区2区3区| 国产一区二区午夜| 国产一区2| 亚洲精品色婷婷| sb少妇高潮二区久久久久| 欧美精品在线观看一区二区| 午夜剧场a级片| 精品videossexfreeohdbbw| 国产99网站| 理论片午午伦夜理片在线播放| 日本精品视频一区二区三区| 欧美亚洲国产日韩| 国产69精品久久久久999天美| 国产aⅴ一区二区| 精品a在线| 国产精品日产欧美久久久久| 亚洲欧美一区二区三区不卡| 欧美精品免费看| 91午夜精品一区二区三区| 日韩一级在线视频| 久久国产欧美一区二区三区精品| 97午夜视频| 浪潮av色| 少妇中文字幕乱码亚洲影视| 男人的天堂一区二区| 国产一区二三| 国产亚洲久久| 国产一区免费在线| 欧美片一区二区| 国产伦精品一区二区三区照片91 | 国产99久久久久久免费看| 中文字幕天天躁日日躁狠狠躁免费| 狠狠色噜噜综合社区| 国产一区二| 国产精品综合在线| 四虎影视亚洲精品国产原创优播| 国产69精品久久久久久野外| 亚洲国产精品国自产拍av| 免费xxxx18美国| 草逼视频网站| 欧美日韩精品影院| 日韩精品中文字| 亚洲精品久久久久久动漫| 激情久久一区二区| 99精品国产一区二区三区不卡 | 一区二区三区四区中文字幕| 久久不卡精品| 国产精品亚洲欧美日韩一区在线| 999久久国精品免费观看网站 | 精品国产91久久久| 久久精品一区二区三区电影| 欧美一区二区久久| 日日狠狠久久8888偷色| 国产伦精品一区二区三| 国产精品亚洲二区| 日本精品99| 国产精品一区一区三区| 91亚洲欧美强伦三区麻豆| 亚洲乱小说| 91精品中综合久久久婷婷| 蜜臀久久久久久999| 国产九九影院| 久久国产精品精品国产| 欧美日韩三区二区| 国产精品自拍在线观看| 久久99精品一区二区三区| 国产大片一区二区三区| 国产一区在线免费观看| 97涩国一产精品久久久久久久| 国产一区欧美一区| 国产精品人人爽人人做av片| 国产精品免费自拍| 久久综合激情网| 国产乱子一区二区| av午夜在线| 91精品夜夜| 欧美激情在线一区二区三区| 国产精品电影免费观看| 久久久久久久国产| 久久久久亚洲最大xxxx| 在线观看v国产乱人精品一区二区 国产日韩欧美精品一区二区 | 欧美精品一级二级| 精品国产区一区二| 国产精品对白刺激在线观看| 国产精品一级片在线观看| 午夜影院5分钟| 色综合欧美亚洲国产| 国产欧美一二三区| 2021天天干夜夜爽| 国产精品精品国内自产拍下载| 国产精品亚洲精品| 国产精品96久久久| 国产一区免费在线观看| 日韩精品免费一区二区中文字幕| 狠狠色噜噜狠狠狠狠奇米777| 国产精品自产拍在线观看桃花| 国产日产精品一区二区三区| 午夜爽爽爽男女免费观看| 自拍偷在线精品自拍偷无码专区| 91精品一区二区中文字幕| 欧美乱妇高清无乱码免费 | 国产精品69久久久| 日本精品一区视频| 中文字幕日韩有码| 日本一区二区三区中文字幕| 日本边做饭边被躁bd在线看| 亚洲国产精品日本| 狠狠色狠狠综合久久| 肥大bbwbbwbbw高潮| 国产色婷婷精品综合在线手机播放| 26uuu色噜噜精品一区二区 | 香蕉免费一区二区三区在线观看| 国产一区影院| 91久久国产露脸精品国产护士| 九九精品久久| 一级黄色片免费网站| www色视频岛国| 国久久久久久| 99国精视频一区一区一三| 国产精品一区亚洲二区日本三区 | 久久久精品久久日韩一区综合| 国产女人好紧好爽| 日韩av在线一区| 国产精品videossex国产高清| 久久午夜无玛鲁丝片午夜精品| 亚洲精品国产91| 久久99精品久久久久婷婷暖91| 激情久久综合网| 欧美一区二区三区白人| 91国产在线看| 欧美一区二区久久| 挺进警察美妇后菊| 国产在线欧美在线| 欧美激情视频一区二区三区| 欧美精品在线视频观看| 右手影院av| 国产91在线拍偷自揄拍| 国产69精品久久777的优势| 日韩欧美多p乱免费视频| 老女人伦理hd| 国产精品69av| 精品国产鲁一鲁一区二区三区| 免费看大黄毛片全集免费| 国产精品无码永久免费888| 国产精品一区二区中文字幕| 中文字幕久久精品一区| 国产精品一区一区三区| 亚洲四区在线观看| 国产精品久久久区三区天天噜| 国产一级一区二区| 久久免费福利视频| 国产在线精品二区| 亚洲国产欧美国产综合一区| 国产精品国产亚洲精品看不卡15| 91精品视频一区二区| 99国产精品99久久久久| 欧美日韩久久一区二区| 538在线一区二区精品国产| 日本一区二区在线电影| 91精品丝袜国产高跟在线| 欧美高清xxxxx| 一区二区中文字幕在线| 奇米色欧美一区二区三区| 日本三级韩国三级国产三级| 精品一区二区超碰久久久| 一区二区中文字幕在线| 福利片91| 波多野结衣女教师30分钟| 免费毛片**| 日韩精品一区二区不卡| 亚洲精品久久久久不卡激情文学| 欧美日韩国产精品一区二区三区| 一区二区91| 国产videosfree性另类| 视频一区二区三区中文字幕| 午夜国产一区| 91偷拍网站| 国产日产高清欧美一区二区三区| 国产女人和拘做受在线视频| 亚洲精品国产精品国自产网站按摩| 狠狠色丁香久久综合频道日韩| 国产另类一区| 国产日韩一区在线| 少妇在线看www| 狠狠躁夜夜| 99久久久国产精品免费无卡顿| 国产资源一区二区三区| 午夜影院激情| 91一区二区三区视频| 日韩午夜毛片| 国产一区二区麻豆| 欧美日韩精品在线一区| 淫片免费看| 精品亚洲午夜久久久久91| 国产一区二区视频免费观看| 国产精品精品视频一区二区三区 |