[發(fā)明專(zhuān)利]一種基于強(qiáng)化學(xué)習(xí)的無(wú)線(xiàn)信道指紋方法有效
| 申請(qǐng)?zhí)枺?/td> | 201510219184.5 | 申請(qǐng)日: | 2015-05-04 |
| 公開(kāi)(公告)號(hào): | CN104918249B | 公開(kāi)(公告)日: | 2018-04-10 |
| 發(fā)明(設(shè)計(jì))人: | 肖亮;劉國(guó)隆;李燕 | 申請(qǐng)(專(zhuān)利權(quán))人: | 廈門(mén)大學(xué) |
| 主分類(lèi)號(hào): | H04W12/06 | 分類(lèi)號(hào): | H04W12/06;H04W12/04;H04L9/32 |
| 代理公司: | 廈門(mén)南強(qiáng)之路專(zhuān)利事務(wù)所(普通合伙)35200 | 代理人: | 馬應(yīng)森 |
| 地址: | 361005 *** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 強(qiáng)化 學(xué)習(xí) 無(wú)線(xiàn) 信道 指紋 方法 | ||
1.一種基于強(qiáng)化學(xué)習(xí)的無(wú)線(xiàn)信道指紋方法,其特征在于包括以下步驟:
1)無(wú)線(xiàn)接收機(jī)在M個(gè)頻點(diǎn)上預(yù)先測(cè)量和存儲(chǔ)各用戶(hù)發(fā)射機(jī)的接收信號(hào)強(qiáng)度(RSS),每個(gè)用戶(hù)發(fā)射機(jī)的信道指紋由接收機(jī)在M個(gè)不同頻點(diǎn)測(cè)得的RSS構(gòu)成,即用戶(hù)發(fā)射機(jī)r的信道指紋可表示為Hr=(RSS1,RSS2,...,RSSn,...,RSSM),其中RSSn為接收機(jī)在第n個(gè)信道測(cè)得的用戶(hù)發(fā)射機(jī)r的RSS,1≤n≤M;無(wú)線(xiàn)接收機(jī)將存儲(chǔ)的各個(gè)用戶(hù)發(fā)射機(jī)的信道指紋作為對(duì)該用戶(hù)進(jìn)行物理層認(rèn)證的參考指紋;
2)無(wú)線(xiàn)接收機(jī)收到某用戶(hù)發(fā)射機(jī)發(fā)射的數(shù)據(jù)包之后,將提取該用戶(hù)發(fā)射機(jī)的信道指紋對(duì)該用戶(hù)進(jìn)行物理層認(rèn)證,若該用戶(hù)聲稱(chēng)自己為用戶(hù)r,接收機(jī)將調(diào)取預(yù)存用戶(hù)r的參考指紋,計(jì)算該用戶(hù)信道指紋與用戶(hù)r的參考指紋之間的歐氏距離,并將歸一化處理后的歐氏距離與接收機(jī)系統(tǒng)設(shè)定的閾值θ進(jìn)行比較,若歸一化處理后的歐氏距離大于接收機(jī)系統(tǒng)設(shè)定的閾值,則認(rèn)定屬于電子欺騙攻擊,將接收到的數(shù)據(jù)包丟棄,否則進(jìn)一步執(zhí)行上層認(rèn)證;若通過(guò)上層認(rèn)證判定屬于合法數(shù)據(jù)包,則存儲(chǔ)下來(lái),并將提取出來(lái)的信道指紋作為該用戶(hù)r新的參考指紋;
3)接收機(jī)系統(tǒng)對(duì)時(shí)間T內(nèi)接收到的由各用戶(hù)發(fā)射機(jī)發(fā)射的N個(gè)數(shù)據(jù)包進(jìn)行統(tǒng)計(jì)匯總,計(jì)算出虛警率PF(θ)和漏報(bào)率Pm(θ),獲得接收機(jī)系統(tǒng)在此刻的狀態(tài)S,S由系統(tǒng)計(jì)算出的虛警率PF(θ)和漏報(bào)率Pm(θ)構(gòu)成,此時(shí)接收機(jī)系統(tǒng)獲得即時(shí)收益R(S,θ),即接收機(jī)系統(tǒng)收益函數(shù):
R(S,θ)=p(-Pm(θ)Ch+(1-Pm(θ))α-Cp)+(1-p)(-PF(θ)γ+(1-PF(θ))(β-Ch)-Cp)
其中γ為丟失合法數(shù)據(jù)包系統(tǒng)遭受的損失,α為接收機(jī)系統(tǒng)物理層認(rèn)證正確識(shí)別出合法數(shù)據(jù)包的收益,β為接收機(jī)系統(tǒng)物理層認(rèn)證正確識(shí)別出屬于電子欺騙攻擊的數(shù)據(jù)包的收益,p為接收機(jī)系統(tǒng)遭受電子欺騙攻擊的概率,Cp為接收機(jī)系統(tǒng)物理層認(rèn)證所需消耗,Ch為接收機(jī)系統(tǒng)上層認(rèn)證所需消耗;
4)接收機(jī)系統(tǒng)通過(guò)強(qiáng)化學(xué)習(xí)算法中的Q學(xué)習(xí),在最優(yōu)閾值θ不確定的情況下,學(xué)習(xí)如何設(shè)置閾值,并進(jìn)行實(shí)時(shí)調(diào)節(jié),從而可以自適應(yīng)各種無(wú)線(xiàn)環(huán)境,確保較高的認(rèn)證精度,獲得較好的系統(tǒng)收益,對(duì)于不同無(wú)線(xiàn)環(huán)境,有不同的最優(yōu)閾值θ,在一次學(xué)習(xí)過(guò)程中,最多可更換Z次閾值,每一次更換閾值后,接收機(jī)會(huì)有一個(gè)觀察期,以探測(cè)更換閾值對(duì)系統(tǒng)造成的影響,Q學(xué)習(xí)確定最優(yōu)閾值θ的過(guò)程包括以下步驟:
4.1)初始化Q值矩陣,對(duì)于每一個(gè)接收機(jī)系統(tǒng)狀態(tài)S下,接收機(jī)可以選擇一個(gè)a,a∈A,A=[a1,a2,a3,...,aτ],作為閾值θ,τ為可選閾值的個(gè)數(shù),對(duì)每個(gè)狀態(tài)下的可選擇的閾值分配一個(gè)對(duì)應(yīng)的Q值即Q(S,θ),對(duì)每個(gè)初始Q值賦值為0,并設(shè)置學(xué)習(xí)因子α(0<α<1),和折扣因子δ(0<δ<1);
4.2)接收機(jī)觀察系統(tǒng)當(dāng)前所處狀態(tài)Sk,以概率ε選擇閾值θk,進(jìn)行第k次更換閾值,1≤k≤Z,即以概率ε選擇使得Q(Sk,θ)最大的θ值作為閾值θk,以概率1-ε選擇使得Q(Sk,θ)非最大的θ值作為閾值θk,在更換閾值后,接收機(jī)連續(xù)對(duì)時(shí)間T內(nèi)接收到的由各用戶(hù)發(fā)射機(jī)發(fā)射的N個(gè)數(shù)據(jù)包進(jìn)行認(rèn)證,并觀察系統(tǒng)下一個(gè)狀態(tài)Sk+1;
4.3)根據(jù)公式:
對(duì)Q值矩陣更新,Q(Sk,θk)是接收機(jī)系統(tǒng)在Sk狀態(tài)下采用θk值為閾值時(shí)的Q值,R(Sk,θk)為在Sk狀態(tài)下采用閾值θk得到的系統(tǒng)即時(shí)收益,是服務(wù)器在Sk+1狀態(tài)下,采用讓Q值最大化的閾值θ;
4.4)重復(fù)步驟4.2)、4.3),直到第k次更換閾值后接收機(jī)系統(tǒng)滿(mǎn)足時(shí),閾值θ收斂,θk即是接收機(jī)系統(tǒng)最優(yōu)閾值;
4.5)接收機(jī)將θk設(shè)定為該無(wú)線(xiàn)環(huán)境中最優(yōu)閾值,并利用該值進(jìn)行物理層認(rèn)證。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于廈門(mén)大學(xué),未經(jīng)廈門(mén)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510219184.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線(xiàn)上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 通信系統(tǒng)、無(wú)線(xiàn)通信終端和無(wú)線(xiàn)基站
- 無(wú)線(xiàn)通信方法、無(wú)線(xiàn)通信系統(tǒng)、無(wú)線(xiàn)基站以及無(wú)線(xiàn)終端
- 向無(wú)線(xiàn)對(duì)接服務(wù)認(rèn)證無(wú)線(xiàn)對(duì)接方的方法、設(shè)備、存儲(chǔ)介質(zhì)
- 無(wú)線(xiàn)連接方法、無(wú)線(xiàn)連接裝置及無(wú)線(xiàn)終端
- 無(wú)線(xiàn)信道的占用方法、無(wú)線(xiàn)接入點(diǎn)及系統(tǒng)
- 無(wú)線(xiàn)通信系統(tǒng)和無(wú)線(xiàn)通信方法
- 發(fā)射功率控制方法,設(shè)備和無(wú)線(xiàn)控制器
- 多頻率并行無(wú)線(xiàn)智能電表抄表用中繼器
- 無(wú)線(xiàn)終端裝置以及無(wú)線(xiàn)供電裝置
- 無(wú)線(xiàn)充電座、無(wú)線(xiàn)充電座的位置確定方法及裝置





