[發明專利]一種多通道無沖突拆分的硬件實現方法及運行該方法的計算機設備與可讀存儲介質有效
| 申請號: | 201911025671.2 | 申請日: | 2019-10-25 |
| 公開(公告)號: | CN111045965B | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 李麗;鄒文豪;傅玉祥;宋文清;何國強;陳鎧;何書專 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F13/28 | 分類號: | G06F13/28;G06F5/16 |
| 代理公司: | 南京泰普專利代理事務所(普通合伙) 32360 | 代理人: | 竇賢宇 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通道 沖突 拆分 硬件 實現 方法 運行 計算機 設備 可讀 存儲 介質 | ||
1.一種基于可重構計算的多通道無沖突拆分的硬件實現方法,其特征是包括以下步驟:
步驟1、初始化,讀取存儲在寄存器中的多通道拆分相關配置信息,并將配置信息傳輸至DMA接口單元、數據重組單元和控制單元,包含通道數、采樣點總數、當前批次采樣點數以及單點位數;
步驟2、數據輸入,DMA接口單元根據配置信息選擇相應的源數據存儲方式,將源數據從DDR傳輸至數據存儲單元,傳輸結束后跳轉至S3;
所述步驟2進一步包括以下六種情況:
情況1、源數據單點位數為64bit且通道數CH為奇數,源數據在Bank中按行連續存入;
情況2、源數據單點位數為64bit且通道數CH為偶數,將每1個采樣點末尾補1個零,視為1個新采樣點,當作情況1處理;
情況3、源數據單點位數為32bit且通道數CH為奇數,將每2個采樣點為1組,視為1個新采樣點,當作情況1處理;
情況4、源數據單點位數為32bit且通道數CH為偶數,將每2個采樣點為1組,末尾補1個零,視為1個新采樣點,當作情況1處理;
情況5、源數據單點位數為16bit且通道數CH為奇數,將每4個采樣點為1組,視為1個新采樣點,當作情況1處理;
情況6、源數據單點位數為16bit且通道數CH為偶數,將每4個采樣點為1組,末尾補1個零,視為1個新采樣點,當作情況1處理;
步驟3、調用無沖突訪存單元根據控制單元提供的源數據分發方式,讀取數據存儲單元中相應源數據,存入數據存儲單元相應位置;
所述無沖突訪存單元通過地址映射將按采樣點輸入的源數據按通道存入數據存儲單元,其并行路數受存儲資源和單點位數影響,對于單點16bit的源數據,并行路數為4*N,對于單點32bit的源數據,并行路數為2*N,對于單點64bit的源數據,并行路數為N;對于單點位數為64bit的源數據進行1*N路的多通道拆分;對于單點位數為32bit的源數據進行2*N路的多通道拆分;對于單點位數為16bit的源數據進行4*N路的多通道拆分;
將源數據轉換為源矩陣為;
對源矩陣C進行分塊后得到分塊矩陣;
在分塊矩陣的基礎上進行轉置得到分塊轉置;
步驟4、遍歷度判定,判斷是否已經拆分完本批次的所有通道,未完成則返回S3,已完成則跳轉至S5;
步驟5、數據重組,數據重組單元根據配置信息選擇相應的數據重組模式;
步驟6、數據輸出,DMA接口單元根據配置信息選擇相應的結果數據讀出方式,將結果數據從數據存儲單元輸出到DDR,結束算法。
2.根據權利要求1所述的基于可重構計算的多通道無沖突拆分的硬件實現方法,其特征在于,所述步驟5進一步包括以下三種情況:
情況1、源數據單點位數為64bit,每次取同一通道4個bank的數,組合成256bit輸出;
情況2、源數據單點位數為32bit,每次取同一通道4個bank的數,按照AB交叉的方式組合成256bit輸出;
情況3、源數據單點位數為16bit,每次取同一通道4個bank的數,按照ABCD交叉的方式組合成256bit輸出。
3.根據權利要求1所述的基于可重構計算的多通道無沖突拆分的硬件實現方法,其特征在于:所述DMA接口單元用于DDR和SRAM之間的數據交互,根據配置信息選擇相應的源數據無沖突存儲方式和結果數據無沖突讀出方式,以適應無沖突訪存單元的要求。
4.根據權利要求1所述的基于可重構計算的多通道無沖突拆分的硬件實現方法,其特征在于:所述數據重組單元用于根據配置信息重組結果數據,發送至DMA接口單元進行結果輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911025671.2/1.html,轉載請聲明來源鉆瓜專利網。





