[發(fā)明專利]基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 202110090277.8 | 申請日: | 2021-01-22 |
| 公開(公告)號: | CN112732638B | 公開(公告)日: | 2022-05-06 |
| 發(fā)明(設(shè)計(jì))人: | 蔣劍飛;蔡亮;郭怡良;董峰;虞科華;陳可 | 申請(專利權(quán))人: | 上海交通大學(xué);北京愛奇藝科技有限公司 |
| 主分類號: | G06F15/78 | 分類號: | G06F15/78;G06N3/04 |
| 代理公司: | 上海漢聲知識產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 ctpn 網(wǎng)絡(luò) 加速 系統(tǒng) 方法 | ||
1.一種基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,包括CPU端和FPGA端;
所述FPGA端包括第一子圖和第二子圖,所述CPU端包括第三子圖;
所述第一子圖包括CTPN網(wǎng)絡(luò)的CNN部分,第二子圖包括CTPN網(wǎng)絡(luò)的RNN部分,所述第三子圖包括CTPN網(wǎng)絡(luò)的剩余部分;
所述第一子圖的CNN部分與第二子圖的RNN部分的分隔為CNN網(wǎng)絡(luò)的CONV/Relu節(jié)點(diǎn),第二子圖的RNN部分與第三子圖的分隔節(jié)點(diǎn)為RNN網(wǎng)絡(luò)的Reshape_1節(jié)點(diǎn);
所述第一子圖和第二子圖在FPGA端執(zhí)行,所述第三子圖在CPU端執(zhí)行;
所述FPGA端的輸出作為第三子圖的輸入;
所述CPU端最終實(shí)現(xiàn)網(wǎng)絡(luò)推斷,并得到最終結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述CNN部分包括數(shù)據(jù)讀取模塊、卷積和激活函數(shù)計(jì)算模塊、數(shù)據(jù)寫回模塊和池化計(jì)算模塊,各模塊之間通過FIFO連接并完成數(shù)據(jù)傳輸。
3.根據(jù)權(quán)利要求2所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述數(shù)據(jù)讀取模塊包括:采用多重循環(huán)展開和乒乓緩沖的方式搬運(yùn)數(shù)據(jù),利用內(nèi)外部帶寬減少外部存儲器的訪問。
4.根據(jù)權(quán)利要求2所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述卷積和激活函數(shù)計(jì)算模塊包括:分別實(shí)現(xiàn)卷積和激活函數(shù)功能,采用多計(jì)算單元并行方式,通過緩沖器累加中間結(jié)果的方法提高計(jì)算速度,并且核心乘累加部分采用定制算子替換,進(jìn)一步提高卷積計(jì)算的性能。
5.根據(jù)權(quán)利要求2所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述數(shù)據(jù)寫回模塊包括:采用多任務(wù)核心,提高數(shù)據(jù)寫回外部存儲器的并行度。
6.根據(jù)權(quán)利要求2所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述池化計(jì)算模塊包括:采用多計(jì)算單元并行方式,采用分級大小比較的策略,同一行的數(shù)值位于第一級比較,每一行的最大值位于第二級比較,實(shí)現(xiàn)每次計(jì)算獲取九個(gè)數(shù)最大值的功能,通過配置參數(shù)改變池化核大小。
7.根據(jù)權(quán)利要求1所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述RNN部分包括:LSTM權(quán)重讀取模塊、LSTM計(jì)算模塊和中間數(shù)據(jù)調(diào)度模塊,各模塊之間通過FIFO連接,實(shí)現(xiàn)流水線執(zhí)行。
8.根據(jù)權(quán)利要求7所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述LSTM權(quán)重讀取模塊包括:通過正向反向LSTM的共用減少對外部存儲器的重復(fù)訪問,提高數(shù)據(jù)提取的效率。
9.根據(jù)權(quán)利要求8所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),其特征在于,所述LSTM計(jì)算模塊包括:接收LSTM權(quán)重讀取模塊通過channel發(fā)來的權(quán)重,特征圖以及bias數(shù)據(jù),將計(jì)算得到的新的記憶數(shù)據(jù)和輸出數(shù)據(jù)發(fā)送給中間數(shù)據(jù)調(diào)度模塊形成閉環(huán),對分塊的矩陣乘法在計(jì)算過程中實(shí)現(xiàn)分塊不同精度量化;
所述中間數(shù)據(jù)調(diào)度模塊包括:接收LSTM計(jì)算模塊發(fā)送過來的新的記憶數(shù)據(jù)和輸出數(shù)據(jù)并更新緩存。
10.一種基于CTPN網(wǎng)絡(luò)的異構(gòu)加速方法,其特征在于,采用權(quán)利要求1-9中任一種所述的基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng),包括:
步驟1:將RPN網(wǎng)絡(luò)以子圖的形式切割出來;
步驟2:調(diào)用軟件接口對子圖形式的RPN網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)推斷,得到最終結(jié)果,從而在CPU端實(shí)現(xiàn)RPN網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué);北京愛奇藝科技有限公司,未經(jīng)上海交通大學(xué);北京愛奇藝科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110090277.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F15-00 通用數(shù)字計(jì)算機(jī)
G06F15-02 .通過鍵盤輸入的手動操作,以及應(yīng)用機(jī)內(nèi)程序的計(jì)算,例如,袖珍計(jì)算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時(shí),進(jìn)行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個(gè)或多個(gè)數(shù)字計(jì)算機(jī)的組合,其中每臺至少具有一個(gè)運(yùn)算器、一個(gè)程序器及一個(gè)寄存器,例如,用于數(shù)個(gè)程序的同時(shí)處理
G06F15-18 .其中,根據(jù)計(jì)算機(jī)本身在一個(gè)完整的運(yùn)行期間內(nèi)所取得的經(jīng)驗(yàn)來改變程序的;學(xué)習(xí)機(jī)器
- 一種文本行區(qū)域檢測方法、裝置、介質(zhì)和電子設(shè)備
- 一種文字檢測方法及計(jì)算機(jī)可讀存儲介質(zhì)
- 列車消毒通道識別系統(tǒng)
- 一種基于深度學(xué)習(xí)的手寫氣象檔案資料的文本定位方法
- 一種基于真實(shí)場景的文字識別方法、系統(tǒng)及OCR終端
- 一種面向地址場景識別的離線文字識別方法
- 基于CTPN網(wǎng)絡(luò)的異構(gòu)加速系統(tǒng)及方法
- 一種產(chǎn)品圖片文字識別方法和系統(tǒng)
- 一種基于改進(jìn)CTPN算法的電氣設(shè)備銘牌文本檢測方法
- 基于深度學(xué)習(xí)的OCR圖像文字識別與段落輸出方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





