[發(fā)明專利]一種多機(jī)器人工作站生產(chǎn)線系統(tǒng)的協(xié)同控制方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110057144.0 | 申請(qǐng)日: | 2021-01-15 |
| 公開(公告)號(hào): | CN112809678B | 公開(公告)日: | 2023-07-18 |
| 發(fā)明(設(shè)計(jì))人: | 唐昊;凌雅麗;戴飛;王彬 | 申請(qǐng)(專利權(quán))人: | 合肥工業(yè)大學(xué) |
| 主分類號(hào): | B25J9/16 | 分類號(hào): | B25J9/16 |
| 代理公司: | 合肥晨創(chuàng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 34162 | 代理人: | 康培培 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機(jī)器人 工作站 生產(chǎn)線 系統(tǒng) 協(xié)同 控制 方法 | ||
1.一種多機(jī)器人工作站生產(chǎn)線系統(tǒng)的協(xié)同控制方法,其特征在于,所述多機(jī)器人工作站生產(chǎn)線系統(tǒng)包括傳送帶、N個(gè)相同的工作站點(diǎn),每個(gè)工作站包括移動(dòng)拾取的機(jī)器人、工業(yè)相機(jī)、有限容量的緩沖庫和無限容量的成品庫;所述協(xié)同控制方法包括以下步驟,
步驟S1、初始化緩沖庫與機(jī)械臂的狀態(tài)、工件到達(dá)率、加工率,初始化各站點(diǎn)的決策時(shí)間,設(shè)定傳送帶速度、機(jī)械臂移動(dòng)速度;
步驟S2、判斷是否存在站點(diǎn)完成加工或卸載操作,若存在,則該站點(diǎn)i需要進(jìn)行決策,將決策時(shí)刻記為Tn;
步驟S3、決策時(shí)刻觀測(cè)站點(diǎn)i與相鄰下游站點(diǎn)i+1的緩沖庫的剩余量mi和mi+1,如果緩沖庫剩余容量mi為0,說明站點(diǎn)i的緩沖庫已滿,抓手移動(dòng)到緩沖庫撿取工件進(jìn)行加工,然后將加工后的工件放入成品庫中,即直接進(jìn)行服務(wù)操作;如果緩沖庫剩余容量mi為緩沖庫最大容量,說明站點(diǎn)i的緩沖庫為空,則等待直到前視距離內(nèi)有工件到達(dá);如果緩沖庫不滿也不空,則根據(jù)緩沖庫剩余容量mi和mi+1從最優(yōu)策略中選擇前視距離;對(duì)于末端站點(diǎn),由于不存在相鄰下游站點(diǎn),緩沖庫不滿也不空時(shí),則根據(jù)緩沖庫剩余容量mi設(shè)置前視距離;
根據(jù)系統(tǒng)控制方法建立強(qiáng)化學(xué)習(xí)模型,所述步驟S3的最優(yōu)策略采用基于模擬退火的Q學(xué)習(xí)算法;
所述基于模擬退火的Q學(xué)習(xí)算法包括以下步驟,
步驟B1、系統(tǒng)有N個(gè)站點(diǎn),因此建立N個(gè)Q值表,站點(diǎn)i的Q值表記為Qi,初始化Qi,學(xué)習(xí)步數(shù)Z,令z=0,Boltzmann常數(shù)K,溫度T以及溫度衰減因子ξ;
步驟B2、離散化行動(dòng)集Ω';設(shè)置初始狀態(tài)Si(0);
步驟B3、在狀態(tài)Si(Tn)下,在Qi中選出最小Q值對(duì)應(yīng)的行動(dòng)選擇隨機(jī)行動(dòng)vr,如果取否則
步驟B4、執(zhí)行行動(dòng)Si(Tn),轉(zhuǎn)移到下一狀態(tài)Si(Tn+1),獲得樣本數(shù)據(jù),若i≠N,記錄樣本數(shù)據(jù)若i=N,記錄樣本數(shù)據(jù)
步驟B5、計(jì)算Tn到Tn+1時(shí)間段的累積代價(jià)更新Q值表
其中,表示agent?i訪問狀態(tài)-行動(dòng)對(duì)的次數(shù),β為控制學(xué)習(xí)率的參數(shù),0<β<1;di(Tn)為agent?i在平均準(zhǔn)則和折扣準(zhǔn)則下統(tǒng)一的即時(shí)差分公式:其中為agent?i的平均代價(jià)的學(xué)習(xí)值:
表示每步學(xué)習(xí)的平均代價(jià),表示每步學(xué)習(xí)的平均逗留時(shí)間,mi為agent?i的學(xué)習(xí)步數(shù),用來控制學(xué)習(xí)率;
步驟B6、若滿足算法終止條件,學(xué)習(xí)結(jié)束,否則,z=z+1,T=T·ξ,轉(zhuǎn)到步驟B3;
步驟S4、判斷前視距離內(nèi)是否有工件,若有工件,則將距離前視距離內(nèi)最近的工件作為目標(biāo)工件,計(jì)算抓手與目標(biāo)工件的相遇點(diǎn),執(zhí)行步驟S5;若沒有工件,抓手移動(dòng)到緩沖庫撿取工件進(jìn)行加工,再將加工后的工件放入成品庫中后,執(zhí)行步驟S6;
步驟S5、判斷相遇點(diǎn)是否在機(jī)械臂的工作區(qū)間內(nèi),若在,則機(jī)械臂移動(dòng)到相遇點(diǎn)抓取目標(biāo)工件,若不在工作區(qū)間內(nèi),則機(jī)械臂移動(dòng)到工作區(qū)間最左端,等待工件到達(dá)后再抓取目標(biāo)工件,執(zhí)行步驟S7;
步驟S6、判斷加工時(shí)間是否大于前視時(shí)間,若大于,則進(jìn)入下一決策時(shí)刻;若小于,則等待延時(shí)時(shí)間后再進(jìn)行下一決策時(shí)刻,返回步驟S3;
步驟S7、判斷卸載時(shí)間是否大于工件到達(dá)前視點(diǎn)的時(shí)間,若大于,則進(jìn)入下一決策時(shí)刻;若小于,則等待延時(shí)時(shí)間后再進(jìn)行下一決策時(shí)刻返回步驟S3。
2.根據(jù)權(quán)利要求1所述的多機(jī)器人工作站生產(chǎn)線系統(tǒng)的協(xié)同控制方法,其特征在于,所述多機(jī)器人工作站生產(chǎn)線系統(tǒng)中,
各工作站獨(dú)立運(yùn)行,卸載操作和服務(wù)操作互不影響;
越靠近下游的站點(diǎn),工件密度越小,則選擇較遠(yuǎn)前視距離,機(jī)械臂趨向于卸載操作;
越靠近上游的站點(diǎn),工件密度越大,則選擇較近前視距離,機(jī)械臂趨向于服務(wù)操作;
上游站點(diǎn)流失的工件可以由下游站點(diǎn)撿取,如果工件沒有被任何站點(diǎn)撿取,則該工件在生產(chǎn)線上最終流失。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110057144.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





