[發(fā)明專利]一種基于強(qiáng)化學(xué)習(xí)的衛(wèi)星信號(hào)周跳探測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110123896.2 | 申請(qǐng)日: | 2021-01-29 |
| 公開(kāi)(公告)號(hào): | CN112946698B | 公開(kāi)(公告)日: | 2023-08-29 |
| 發(fā)明(設(shè)計(jì))人: | 夏娜;王振舉;羅輝;胡迪;于永堂;張繼文;徐思;吳成;何夢(mèng)花 | 申請(qǐng)(專利權(quán))人: | 合肥工業(yè)大學(xué)智能制造技術(shù)研究院;合肥星北航測(cè)信息科技有限公司 |
| 主分類號(hào): | G01S19/29 | 分類號(hào): | G01S19/29;G01S19/37;G01S19/44;G06N3/044;G06N3/084;G06N3/092 |
| 代理公司: | 安徽省合肥新安專利代理有限責(zé)任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230051 安*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 強(qiáng)化 學(xué)習(xí) 衛(wèi)星 信號(hào) 探測(cè) 方法 | ||
1.一種基于強(qiáng)化學(xué)習(xí)的衛(wèi)星信號(hào)周跳探測(cè)方法,其特征是按如下步驟進(jìn)行:
步驟1:對(duì)衛(wèi)星信號(hào)載波相位進(jìn)行高階差分處理;
步驟1.1:以所設(shè)定的采樣周期T獲得樣本數(shù)為k+r+1的載波相位值序列,對(duì)所述載波相位值序列進(jìn)行高階差分處理,共獲得k+1個(gè)r階差分值,其中,載波相位的第i個(gè)r階差分值為r為差分階數(shù);
利用式(1)計(jì)算第i個(gè)差分序列xi:
式(1)中,c為使第i個(gè)差分序列xi在[-1,1]范圍內(nèi)的縮放系數(shù);
步驟2:利用式(2)所示的坐標(biāo)延遲重構(gòu)法構(gòu)建第j個(gè)空間向量Xj并作為第j個(gè)訓(xùn)練樣本:
式(2)中,xi+1為第i+1個(gè)差分序列;k表示訓(xùn)練樣本集X的樣本數(shù);
步驟3:利用式(3)構(gòu)造預(yù)測(cè)方差
式(3)中,是第j個(gè)輸出預(yù)測(cè)值,是k個(gè)輸出預(yù)測(cè)值的均值;
步驟4:利用式(4)構(gòu)造第j個(gè)周跳探測(cè)統(tǒng)計(jì)量Dj:
式(4)中,是第j個(gè)輸出預(yù)測(cè)值;
步驟5:利用式(5)建立強(qiáng)化學(xué)習(xí)方法的第j個(gè)獎(jiǎng)勵(lì)函數(shù)Rj:
式(5)中,η表示獎(jiǎng)勵(lì)值,b表示獎(jiǎng)勵(lì)函數(shù)的判決量,S表示當(dāng)前衛(wèi)星信號(hào)的狀態(tài),S′表示當(dāng)前狀態(tài)的下一狀態(tài);→表示狀態(tài)的變化;
步驟6:構(gòu)建強(qiáng)化學(xué)習(xí)方法的網(wǎng)絡(luò)模型:
步驟6.1:構(gòu)建由多個(gè)卷積層組成的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN,并用于對(duì)所述訓(xùn)練樣本集X進(jìn)行特征提取,得到多維特征向量;
步驟6.2:構(gòu)建全連接層,用于將所述多維特征向量映射為一維特征向量;
步驟6.3:構(gòu)建由兩個(gè)n輸出的全連接層組成的Q網(wǎng)絡(luò),用于對(duì)一維特征向量進(jìn)行信息抽象映射,得到衛(wèi)星信號(hào)的預(yù)測(cè)值;
步驟6.4:構(gòu)建由一個(gè)m連接的全連接層組成的動(dòng)作向量,用于對(duì)所述衛(wèi)星信號(hào)的預(yù)測(cè)值進(jìn)行處理,并輸出一個(gè)含有m個(gè)元素的動(dòng)作向量,包括:m1個(gè)調(diào)整動(dòng)作與m2個(gè)終止動(dòng)作;m=m1+m2;
步驟7:對(duì)強(qiáng)化學(xué)習(xí)方法的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練:
步驟7.1:隨機(jī)初始化Q網(wǎng)絡(luò)的所有參數(shù)的集合w,基于集合w初始化所有的狀態(tài),將經(jīng)驗(yàn)池初始化為空集;
步驟7.2:通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)RNN和全連接層獲取一維特征向量;
步驟7.3:將一維特征向量作為Q網(wǎng)絡(luò)的輸入,由Q網(wǎng)絡(luò)輸出所有動(dòng)作對(duì)應(yīng)的Q值,并用ε-貪婪法在當(dāng)前輸出的Q值中選擇對(duì)應(yīng)的第j個(gè)動(dòng)作Aj,以1-ε為概率貪婪選擇當(dāng)前最大行為價(jià)值的動(dòng)作,以ε為概率隨機(jī)從m個(gè)動(dòng)作向量中選擇一個(gè)動(dòng)作,其中,ε為探索率,并設(shè)初始值為q1,且隨著訓(xùn)練周期的增加,將ε逐漸降低至q2;
步驟7.4:在當(dāng)前衛(wèi)星信號(hào)的狀態(tài)S下執(zhí)行第j個(gè)動(dòng)作Aj,得到新?tīng)顟B(tài)S′對(duì)應(yīng)的特征向量和第j個(gè)獎(jiǎng)勵(lì)Rj;
步驟7.5:將五元組{Yj,Aj,Rj,Y′j,is_endj}存入經(jīng)驗(yàn)池,其中,Yj為第j個(gè)訓(xùn)練樣本Xj在狀態(tài)S下通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)RNN和全連接層后得到的特征向量,Rj是在狀態(tài)S下執(zhí)行動(dòng)作Aj后得到的獎(jiǎng)賞,Y′j為在新?tīng)顟B(tài)S′下通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)RNN和全連接層后得到的特征向量,is_endj為終止?fàn)顟B(tài);
步驟7.6:從經(jīng)驗(yàn)池中采樣k個(gè)樣本,并計(jì)算當(dāng)前輸出的第j個(gè)預(yù)測(cè)值
式(6)中,maxA′Q(Y′j,A′,w)表示未來(lái)的獎(jiǎng)勵(lì),γ表示折扣因子,A′j是當(dāng)前動(dòng)作Aj的下一步動(dòng)作;1≤j≤k;
步驟7.7:通過(guò)神經(jīng)網(wǎng)絡(luò)的梯度反向傳播方法來(lái)更新Q網(wǎng)絡(luò)的所有參數(shù),并判斷S′是終止?fàn)顟B(tài)is_endj是否成立,若成立,則迭代結(jié)束,輸出第j個(gè)預(yù)測(cè)值并作為衛(wèi)星信號(hào)周跳探測(cè)的預(yù)測(cè)值,再求出新的周跳探測(cè)統(tǒng)計(jì)量D′j,并依據(jù)三倍標(biāo)準(zhǔn)差原理,判斷新的周跳探測(cè)統(tǒng)計(jì)量D′j是否大于a,若是,則認(rèn)為發(fā)生了信號(hào)周跳,否則,轉(zhuǎn)到步驟7.3。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué)智能制造技術(shù)研究院;合肥星北航測(cè)信息科技有限公司,未經(jīng)合肥工業(yè)大學(xué)智能制造技術(shù)研究院;合肥星北航測(cè)信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110123896.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種拉拉褲熱焊機(jī)構(gòu)
- 下一篇:一種堅(jiān)果拾取器
- 同類專利
- 專利分類
G01S 無(wú)線電定向;無(wú)線電導(dǎo)航;采用無(wú)線電波測(cè)距或測(cè)速;采用無(wú)線電波的反射或再輻射的定位或存在檢測(cè);采用其他波的類似裝置
G01S19-00 衛(wèi)星無(wú)線電信標(biāo)定位系統(tǒng);利用這種系統(tǒng)傳輸?shù)男盘?hào)確定位置、速度或姿態(tài)
G01S19-01 .傳輸時(shí)間戳信息的衛(wèi)星無(wú)線電信標(biāo)定位系統(tǒng),例如,GPS [全球定位系統(tǒng)]、GLONASS[全球?qū)Ш叫l(wèi)星系統(tǒng)]或GALILEO
G01S19-38 .利用衛(wèi)星無(wú)線電信標(biāo)定位系統(tǒng)傳輸?shù)男盘?hào)來(lái)確定導(dǎo)航方案
G01S19-39 ..傳輸帶有時(shí)間戳信息的衛(wèi)星無(wú)線電信標(biāo)定位系統(tǒng),例如GPS [全球定位系統(tǒng)], GLONASS [全球?qū)Ш叫l(wèi)星系統(tǒng)]或GALILEO
G01S19-40 ...校正位置、速度或姿態(tài)
G01S19-42 ...確定位置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 定位系統(tǒng)、信息提供裝置及終端裝置
- 衛(wèi)星接收信號(hào)調(diào)試方法、系統(tǒng)及設(shè)備
- 衛(wèi)星定位方法
- 一種捕獲衛(wèi)星組的方法和裝置
- 衛(wèi)星捕獲方法及裝置
- 基于分布式星群的數(shù)據(jù)傳輸方法和裝置
- 一種基于K-means++聚類算法的北斗導(dǎo)航系統(tǒng)故障檢測(cè)方法及檢測(cè)系統(tǒng)
- 一種用于衛(wèi)星網(wǎng)絡(luò)的通信方法、裝置和設(shè)備
- 基于遺傳算法的成像衛(wèi)星調(diào)度方法和系統(tǒng)
- 成像衛(wèi)星的任務(wù)調(diào)度方法和系統(tǒng)





