[發(fā)明專利]RFID多閱讀器的防碰撞方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110399355.2 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113343725B | 公開(公告)日: | 2022-07-19 |
| 發(fā)明(設(shè)計)人: | 楊律青;黃晨曦;丘以書;錢偉華;李鼎昭;林嵐良;沈少欽 | 申請(專利權(quán))人: | 廈門大學(xué) |
| 主分類號: | G06K7/10 | 分類號: | G06K7/10;G06N3/08 |
| 代理公司: | 廈門創(chuàng)象知識產(chǎn)權(quán)代理有限公司 35232 | 代理人: | 葉秀紅;尤懷成 |
| 地址: | 361000 *** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | rfid 閱讀器 碰撞 方法 系統(tǒng) | ||
1.一種RFID多閱讀器的防碰撞方法,其特征在于,包括以下步驟:
獲取閱讀器的讀取請求,并根據(jù)所述讀取請求隨機分配一個信道資源路徑給所述閱讀器;
對所述隨機分配的信道資源路徑進(jìn)行仿真處理,以輸出對應(yīng)的獎勵值,以便根據(jù)所述獎勵值更新Q值,并將更新后的Q值添加到預(yù)先建立的臨時存儲表中;
在所述臨時存儲表存滿之后,將所述臨時存儲表作為訓(xùn)練集輸入到預(yù)先建立的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以得到訓(xùn)練好的防碰撞模型;
獲取當(dāng)前閱讀器可用的信道資源路徑數(shù),并將當(dāng)前閱讀器可用的信道資源路徑數(shù)輸入到所述訓(xùn)練好的防碰撞模型,以得到最優(yōu)的信道資源路徑;
其中,Q值包括狀態(tài)S和動作a,其中,狀態(tài)S表示當(dāng)前閱讀器可用的信道資源路徑數(shù),動作a表示分配一個信道資源路徑給當(dāng)前閱讀器;
其中,根據(jù)所述獎勵值更新Q值,并將更新后的Q值添加到預(yù)先建立的臨時存儲表中,包括:
根據(jù)所述隨機分配的信道資源路徑對應(yīng)的Q值在所述預(yù)先建立的臨時存儲表中進(jìn)行檢索,以判斷所述臨時存儲表中是否存在所述Q值;
如果是,則直接通過所述Q值和所述獎勵值更新Q值,并將更新后的Q值添加到預(yù)先建立的臨時存儲表中;
如果否,則將所述Q值中的狀態(tài)S輸入到預(yù)先建立的BP神經(jīng)網(wǎng)絡(luò),以輸出所有動作預(yù)測的Q值,并選擇最大Q值和所述獎勵值更新Q值,并將更新后的Q值添加到預(yù)先建立的臨時存儲表中;
其中,根據(jù)以下公式更新Q值:
Q’(s,a)=(1-α)Q(s,a)+αγC(s,a)+Q(s’,a’)
其中,Q’(s,a)表示更新后的當(dāng)前動作狀態(tài)的Q值,α表示學(xué)習(xí)率,Q(s,a)表示當(dāng)前動作狀態(tài)的Q值,γ表示折扣因子,C(s,a)表示當(dāng)前狀態(tài)下的平均獎勵值,Q(s’,a’)表示下一個狀態(tài)動作的Q值。
2.如權(quán)利要求1所述的RFID多閱讀器的防碰撞方法,其特征在于,在所述臨時存儲表存滿之后,將所述臨時存儲表作為訓(xùn)練集輸入到預(yù)先建立的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以得到訓(xùn)練好的防碰撞模型,包括:
判斷所述臨時存儲表是否存滿;
如果是,則將所述臨時存儲表作為訓(xùn)練集輸入到預(yù)先建立的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并更新學(xué)習(xí)次數(shù),以及將所述臨時存儲表里的內(nèi)容清空,根據(jù)當(dāng)前學(xué)習(xí)次數(shù)和預(yù)先設(shè)置的學(xué)習(xí)次數(shù)判斷是否達(dá)到學(xué)習(xí)次數(shù);
如果否,則直接根據(jù)當(dāng)前學(xué)習(xí)次數(shù)和預(yù)先設(shè)置的學(xué)習(xí)次數(shù)判斷是否達(dá)到學(xué)習(xí)次數(shù);
如果達(dá)到學(xué)習(xí)次數(shù)則完成信道資源路徑分配,如果未達(dá)到學(xué)習(xí)次數(shù)則重新獲取閱讀器的讀取請求,以進(jìn)行新一輪的迭代訓(xùn)練。
3.一種計算機可讀存儲介質(zhì),其特征在于,其上存儲有RFID多閱讀器的防碰撞程序,該RFID多閱讀器的防碰撞程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-2中任一項所述的RFID多閱讀器的防碰撞方法。
4.一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時,實現(xiàn)如權(quán)利要求1-2中任一項所述的RFID多閱讀器的防碰撞方法。
5.一種RFID多閱讀器的防碰撞系統(tǒng),其特征在于,包括:
獲取模塊,用于獲取閱讀器的讀取請求,并根據(jù)所述讀取請求隨機分配一個信道資源路徑給所述閱讀器;
更新處理模塊,用于對所述隨機分配的信道資源路徑進(jìn)行仿真處理,以輸出對應(yīng)的獎勵值,以便根據(jù)所述獎勵值更新Q值,并將更新后的Q值添加到預(yù)先建立的臨時存儲表中;
訓(xùn)練模塊,用于在所述臨時存儲表存滿之后,將所述臨時存儲表作為訓(xùn)練集輸入到預(yù)先建立的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以得到訓(xùn)練好的防碰撞模型;
防碰撞模塊,用于獲取當(dāng)前閱讀器可用的信道資源路徑數(shù),并將當(dāng)前閱讀器可用的信道資源路徑數(shù)輸入到所述訓(xùn)練好的防碰撞模型,以得到最優(yōu)的信道資源路徑;
其中,Q值包括狀態(tài)S和動作a,其中,狀態(tài)S表示當(dāng)前閱讀器可用的信道資源路徑數(shù),動作a表示分配一個信道資源路徑給當(dāng)前閱讀器;
其中,更新處理模塊還用于:
根據(jù)所述隨機分配的信道資源路徑對應(yīng)的Q值在所述預(yù)先建立的臨時存儲表中進(jìn)行檢索,以判斷所述臨時存儲表中是否存在所述Q值;
如果是,則直接通過所述Q值和所述獎勵值更新Q值,并將更新后的Q值添加到預(yù)先建立的臨時存儲表中;
如果否,則將所述Q值中的狀態(tài)S輸入到預(yù)先建立的BP神經(jīng)網(wǎng)絡(luò),以輸出所有動作預(yù)測的Q值,并選擇最大Q值和所述獎勵值更新Q值,并將更新后的Q值添加到預(yù)先建立的臨時存儲表中;
其中,根據(jù)以下公式更新Q值:
Q’(s,a)=(1-α)Q(s,a)+αγC(s,a)+Q(s’,a’)
其中,Q’(s,a)表示更新后的當(dāng)前動作狀態(tài)的Q值,α表示學(xué)習(xí)率,Q(s,a)表示當(dāng)前動作狀態(tài)的Q值,γ表示折扣因子,C(s,a)表示當(dāng)前狀態(tài)下的平均獎勵值,Q(s’,a’)表示下一個狀態(tài)動作的Q值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門大學(xué),未經(jīng)廈門大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110399355.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





