[發(fā)明專利]一種基于GPU的Polar碼高速并行譯碼方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010629868.3 | 申請(qǐng)日: | 2020-07-03 |
| 公開(公告)號(hào): | CN111966405B | 公開(公告)日: | 2022-07-26 |
| 發(fā)明(設(shè)計(jì))人: | 李舒 | 申請(qǐng)(專利權(quán))人: | 北京航空航天大學(xué)杭州創(chuàng)新研究院 |
| 主分類號(hào): | G06F9/38 | 分類號(hào): | G06F9/38;G06F9/50;G06F9/54;H03M13/13;H04L1/00 |
| 代理公司: | 北京慧泉知識(shí)產(chǎn)權(quán)代理有限公司 11232 | 代理人: | 李娜 |
| 地址: | 310052 浙江省*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 gpu polar 高速 并行 譯碼 方法 | ||
1.一種基于GPU的Polar碼高速并行譯碼方法,其特征在于:整個(gè)譯碼過程分為三個(gè)階段:初始化階段、譯碼階段、結(jié)果回傳階段,其中初始化階段包括以下步驟1和步驟2,譯碼階段包括以下步驟3和步驟4,以下步驟5是結(jié)果回傳階段:
步驟1:主機(jī)初始化
依次包括:為信息比特標(biāo)志、因子圖置換和逆置換信息、接收機(jī)接收到的信號(hào)、譯碼的結(jié)果即源比特的對(duì)數(shù)似然比分配內(nèi)存空間,信息和變量的初始化,存儲(chǔ)接收到的信號(hào)并計(jì)算編碼比特對(duì)數(shù)似然比;
步驟2:GPU初始化
依次包括:GPU全局內(nèi)存分配,主機(jī)將數(shù)據(jù)發(fā)送給GPU,啟動(dòng)GPU的并行譯碼線程,GPU分配共享內(nèi)存,初始化共享內(nèi)存,根據(jù)全局內(nèi)存給共享內(nèi)存的數(shù)組賦值;
步驟3:譯碼內(nèi)核函數(shù)進(jìn)行若干次循環(huán)迭代,最大循環(huán)次數(shù)由程序預(yù)先設(shè)定
每次循環(huán)依次包括:L1階段、L1-L2階段間交換線程塊共享內(nèi)存、L2階段、R1階段、R1-R2階段間交換線程塊共享內(nèi)存、R2階段和循環(huán)終止條件判斷:如果在循環(huán)過程中有因子圖滿足早期終止條件,或者已達(dá)到最大循環(huán)次數(shù),則設(shè)置變量p_good,并終止循環(huán),跳轉(zhuǎn)到步驟4;
步驟4:對(duì)于變量p_good的所有線程塊的0號(hào)線程,即線程((p_good,b),0),其中b=0,1,...,N1-1,N為Polar碼的碼長(zhǎng),將其共享內(nèi)存中的Local_L[][0]+Local_R[][0]經(jīng)過逆置換后,作為譯碼結(jié)果;
步驟5:主機(jī)將譯碼結(jié)果從GPU傳回到主機(jī)。
2.根據(jù)權(quán)利要求1所述的一種基于GPU的Polar碼高速并行譯碼方法,其特征在于:所述步驟2在GPU初始化時(shí),譯碼過程中使用的L和R數(shù)組分布式存儲(chǔ)在各線程塊共享內(nèi)存,即在一次完整的循環(huán)過程中,只需要通過全局內(nèi)存在線程塊之間交換共享內(nèi)存2次,其他所有操作都使用線程塊內(nèi)的共享內(nèi)存。
3.根據(jù)權(quán)利要求1所述的一種基于GPU的Polar碼高速并行譯碼方法,其特征在于:步驟2所述的全局內(nèi)存的分配,具體為:同一個(gè)因子圖使用的全局內(nèi)存連續(xù)存放,并且用于線程塊之間交換共享內(nèi)存的全局內(nèi)存空間按照線程塊讀取的順序連續(xù)存放,即每個(gè)線程塊從交換空間讀取時(shí),其讀取的地址空間是連續(xù)的。
4.根據(jù)權(quán)利要求1所述的一種基于GPU的Polar碼高速并行譯碼方法,其特征在于:所述步驟3循環(huán)迭代的每次循環(huán)包括以下步驟:
步驟3.1:向左迭代的第一階段,即L1階段,包括第n-1,...,n-n1級(jí)迭代,其中n1=log2N1;
步驟3.2:每個(gè)因子圖的線程塊之間通過全局內(nèi)存交換共享內(nèi)存中的Local_L[][n-n1+1];
步驟3.3:向左迭代的第二階段,即L2階段,包括第n-n1-1,...,0級(jí)迭代;
步驟3.4:向右迭代的第一階段,即R1階段,包括第0,...,n-n1-1級(jí)迭代;
步驟3.5:每個(gè)因子圖的線程塊之間通過全局內(nèi)存交換共享內(nèi)存中的Local_R[][n-n1];
步驟3.6:向右迭代的第二階段,即R2階段,包括第n-n1,...,n-1級(jí)迭代;
步驟3.7:判斷是否有因子圖滿足早期終止條件或者已達(dá)到最大循環(huán)次數(shù),并設(shè)置變量p_good。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué)杭州創(chuàng)新研究院,未經(jīng)北京航空航天大學(xué)杭州創(chuàng)新研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010629868.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲(chǔ)介質(zhì)及設(shè)備





