[發明專利]一種基于Q學習算法的Spinal碼編譯碼交織策略及裝置有效
| 申請號: | 202011066122.2 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112152638B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 敖珺;李娜;馬春波 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | H03M13/11 | 分類號: | H03M13/11 |
| 代理公司: | 桂林市華杰專利商標事務所有限責任公司 45112 | 代理人: | 覃永峰 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 學習 算法 spinal 譯碼 交織 策略 裝置 | ||
1.一種基于Q學習算法的Spinal碼編譯碼交織策略,其特征在于,包括如下步驟:
步驟S1,初始化Spinal碼的編碼參數和譯碼參數;初始化高斯學習算法參數;初始化交織器參數;初始化Q學習算法參數;
步驟S2,設置編碼符號初始值W=N1,W指編碼符號數量,N1表示設置的初始值;
步驟S3,發送端編碼生成W個編碼符號,編碼的過程為:首先,將一段長度為n?bits的信息比特序列M劃分為組,即n表示信息比特序列的長度,k表示劃分后每組的長度,即每組長度為k?bits;然后,將隨機數種子s0和M0經過Hash函數,根據式(1)依次類推計算:
si=Hash(si-1,Mi-1)??????????(1)
得到每組信息比特對應的值si,即:其中i為每個值的標號,每個值si的大小為v?bits,最后,將個值si分別作為隨機數生成器(RNG)的輸入,得到xi表示每一個隨機數生成器的輸出,隨機數生成器每一批次的編碼輸出組成一個Spinal碼的編碼符號,對于每一信息比特序列,發送端可通過隨機數生成器源源不斷地生成編碼符號;
步驟S4,確定交織深度K,c表示每一個隨機數生成器輸出的長度,將W個編碼符號作為輸入信息序列逐行寫入到大小為R×C的矩陣中;
步驟S5,對R×C矩陣進行行內交織,得到行內交織的序列Ui(j),它表示被改變順序的第i行中第j個信息所對應的原始位置;
步驟S6,將得到的Ui(j)按照T(i)進行行間交織,其中T(i)為行間交織模型,具體參數根據交織的深度K和行數R選取,得到交織后的新矩陣;
步驟S7,通過裁剪新矩陣并按列讀取得到輸出信息序列;
步驟S8,將得到的交織后的輸出信息序列作為一個數據包發送;
步驟S9,接收端對收到的數據包解交織,解交織過程為交織的逆過程,得到W個Spinal碼編碼符號;
步驟S10,對W個編碼符號進行逐一譯碼,直到譯碼成功,或W個編碼符號均譯碼失敗,譯碼過程為:使用與編碼端相同的s0、Hash函數以及隨機數生成器在譯碼端重建譯碼樹,以s0為根節點,按順序考慮的可能取值,然后從根節點遍歷至葉子節點,從譯碼樹的第d級開始,d表示譯碼時開始裁剪譯碼樹的級數,每級譯碼樹只保留譯碼開銷最小的B個節點,B表示譯碼時每次刪減保留的節點數;接著,從B·2k條路徑中選出譯碼開銷最小的路徑,即為最終譯碼結果;最后,對譯碼結果進行CRC校驗,若CRC校驗通過,則譯碼成功;否則譯碼失敗;
步驟S11,判斷當前譯碼狀況,若對其中一個編碼符號譯碼成功,表示對這一段信息比特序列譯碼成功,本輪譯碼結束;若對W個編碼符號均譯碼失敗,Retranstime次數累加1次,判斷當前是否達到最大允許傳輸次數Retranstimemax;記本輪參與譯碼的編碼符號數目為Morepass,當前信息段的傳輸次數為Retranstime;
步驟S12,計算回報函數Reward,在發送端,根據上一步譯碼的編碼符號數目Morepass和傳輸次數Retranstime計算回報函數Reward,其中,γ(0≤γ≤1)為權衡因子;Morepassmax為允許發送的最大累計編碼符號數目;Retranstimemax表示最大允許的傳輸次數;
步驟S13,通過高斯學習確定方差σ2,均值μ,偏度σ3,發送端根據接收端的反饋,利用高斯學習算法計算當前信道的譯碼累計分布函數,得到信道新狀態參數:方差σ2,均值μ,偏度σ3,計算方法為:
Qsample=Qα·Qsample+1,Qsumq=Qα·Qsumq+Qsample,Qsumsq=Qα·Qsumsq+Qsample2,Qsumtq=Qα·Qsumtq+Qsample3,
Qα表示高斯學習因子,其取值越大,之前時刻的譯碼累積分布函數對當前時刻的譯碼累計分布函數的估計的影響就越大;Qsample、Qsumq、Qsumsq和Qsumtq為高斯學習算法參數,Qsample表示與高斯學習因子相乘得到的折扣后的樣值,Qsumq表示與高斯學習因子相乘得到的折扣后的累加和、Qsumsq表示與高斯學習因子相乘得到的折扣后的平方和、Qsumtq表示與高斯學習因子相乘得到的折扣后的立方和,在步驟S1中進行初始化;
步驟S14,在發送端,根據信道狀態參數σ2,均值μ確定當前狀態State(μ,σ2),找到步驟S1初始化Q學習參數時建立的Q表中對應的行Q(State,:),找出這一行中最大的元素Qmax(State,A);得到下一步執行的最優動作A;
步驟S15,在發送端,根據最優動作A和偏度σ3確定當前應編碼產生的編碼符號N,σ3的正負及大小用來衡量譯碼累計分布函數的不對稱性,偏度為正代表分布為右偏態,即右側的尾部更長,分布的主體集中在左側,此時應減少編碼符號的數量;偏度為負代表分布為左偏態,即左側的尾部更長,分布的主體集中在右側,此時應增加編碼符號的數量,具體計算方法為:
步驟S16,設置探索因子βQ的值,產生一個0到1的隨機數Qrand,若βQ>Qrand,則spinal碼編碼端生成的編碼符號數量為W=N;若βQ≤Qrand,則實際發送的編碼符號數量為W=N-δ,δ表示探索值;
步驟S17,根據Reward和Qmax(State,A)更新Q表,更新公式為:Qnew(State,A)=Reward+η·Qmax(State,A),η為Q學習因子,Qnew(State,A)表示Q表的更新值;
步驟S18,編碼端根據步驟S11的譯碼情況,若譯碼成功,則按照步驟S16得到的W,回到步驟S3,進入下一信息比特序列的傳輸;若譯碼失敗,判斷是否達到最大傳輸次數:若是,丟棄這一信息比特序列,按照步驟S16得到的W,回到步驟S3,進入下一信息比特序列的傳輸;若否,按照步驟S16得到的W,回到步驟S3,繼續這一信息比特序列的傳輸。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011066122.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:字段的規范化自動命名方法、裝置及系統
- 下一篇:夜視環境下活物檢測方法及裝置
- 同類專利
- 專利分類





