[發(fā)明專利]基于NVM進(jìn)行AI計(jì)算的芯片架構(gòu)在審
| 申請(qǐng)?zhí)枺?/td> | 202110541351.3 | 申請(qǐng)日: | 2021-05-18 |
| 公開(公告)號(hào): | CN113127407A | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設(shè)計(jì))人: | 叢維;林小峰;金生 | 申請(qǐng)(專利權(quán))人: | 南京優(yōu)存科技有限公司 |
| 主分類號(hào): | G06F15/78 | 分類號(hào): | G06F15/78;G06N3/063;G06N3/04;G06N3/08 |
| 代理公司: | 上海容慧專利代理事務(wù)所(普通合伙) 31287 | 代理人: | 于曉菁 |
| 地址: | 210008 江蘇省南京市江北*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 nvm 進(jìn)行 ai 計(jì)算 芯片 架構(gòu) | ||
本發(fā)明提供的一種基于NVM進(jìn)行AI計(jì)算的芯片架構(gòu),包括通過總線通信連接的NVM陣列、外部接口模塊、NPU和MCU;采用NPU和NVM相結(jié)合進(jìn)行AI神經(jīng)網(wǎng)絡(luò)計(jì)算,神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)數(shù)字化存儲(chǔ)在NVM陣列中,MCU接收外部的AI運(yùn)算指令控制NPU及NVM陣列實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)計(jì)算,MCU控制NVM陣列加載其內(nèi)部存儲(chǔ)的神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù),通過運(yùn)行的程序和神經(jīng)網(wǎng)絡(luò)模型來進(jìn)行AI計(jì)算,與現(xiàn)有各類采用NVM進(jìn)行模擬運(yùn)算的存算方案相比,數(shù)字存儲(chǔ)與運(yùn)算方式運(yùn)算結(jié)構(gòu)靈活,可靠性好、精度高、讀取準(zhǔn)確度高,故此本發(fā)明在突破采用片外NVM存儲(chǔ)速度瓶頸以及降低外部輸入功耗的同時(shí),又具備高度的可實(shí)施性、靈活性以及可靠性。
技術(shù)領(lǐng)域
本發(fā)明涉及AI(Artificial Intelligence,人工智能)技術(shù)領(lǐng)域,特別涉及一種基于NVM(non-volatile memory,非易失性存儲(chǔ))進(jìn)行AI計(jì)算的芯片架構(gòu)。
背景技術(shù)
AI的算法來源于人腦的結(jié)構(gòu)的啟示。人腦是一個(gè)由大量神經(jīng)元復(fù)雜連接的網(wǎng)絡(luò),每個(gè)神經(jīng)元通過大量的樹突連接大量的其他神經(jīng)元,接收信息,每一個(gè)連接點(diǎn)叫突觸(Synapse)。在外部刺激積累到一定程度后,產(chǎn)生一個(gè)刺激信號(hào),通過軸突傳送出去。軸突有大量的末梢,通過突觸,連接到大量其他神經(jīng)元的樹突。就是這樣一個(gè)由簡(jiǎn)單功能的神經(jīng)元組成的網(wǎng)絡(luò),實(shí)現(xiàn)了人類所有的智能活動(dòng)。人的記憶和智能,普遍被認(rèn)為存儲(chǔ)在每一個(gè)突觸的不同的耦合強(qiáng)度里。
從上世紀(jì)60年代興起的神經(jīng)網(wǎng)絡(luò)算法,用一個(gè)函數(shù)來模仿神經(jīng)元的功能。函數(shù)接受多個(gè)來自其他神經(jīng)元的輸入,每個(gè)輸入有不同的權(quán)重,輸出是每一個(gè)輸入與相應(yīng)的神經(jīng)元連接權(quán)重相乘再求和。函數(shù)輸出再輸入到下一層其他的神經(jīng)元,組成一個(gè)神經(jīng)網(wǎng)絡(luò)。
常見的AI芯片在算法上針對(duì)網(wǎng)絡(luò)計(jì)算優(yōu)化了矩陣并行計(jì)算,但因?yàn)锳I計(jì)算需要極高的存儲(chǔ)讀取帶寬,把處理器和內(nèi)存、存儲(chǔ)分離的架構(gòu)遇到了讀取速度的瓶頸,也受限于外部存儲(chǔ)讀取功耗。業(yè)界已經(jīng)開始廣泛研究存儲(chǔ)內(nèi)計(jì)算(in-memory-computing)的架構(gòu)。
目前采用NVM的存儲(chǔ)內(nèi)計(jì)算的方案,都是利用NVM采用模擬信號(hào)的形式存儲(chǔ)神經(jīng)網(wǎng)絡(luò)中的權(quán)重,把神經(jīng)網(wǎng)絡(luò)的計(jì)算通過模擬信號(hào)加乘的方法實(shí)現(xiàn),具體范例參見公開號(hào)為CN109086249A的中國(guó)專利申請(qǐng)。這類方案已經(jīng)有了不少科研成果,但實(shí)際應(yīng)用仍有困難。因?yàn)閷?shí)用的神經(jīng)網(wǎng)絡(luò)基本都有很多的層和非常復(fù)雜的連接結(jié)構(gòu),模擬信號(hào)在實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)計(jì)算過程中在層間的傳遞、進(jìn)行各種信號(hào)處理時(shí)非常不方便,模擬計(jì)算陣列結(jié)構(gòu)僵化,不利于支持靈活的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。另外,模擬信號(hào)的存儲(chǔ)、讀寫與計(jì)算中各種噪音和誤差會(huì)影響到存儲(chǔ)的神經(jīng)網(wǎng)絡(luò)模型的可靠性和計(jì)算的準(zhǔn)確性受限。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于NVM進(jìn)行AI計(jì)算的芯片架構(gòu),克服現(xiàn)有的存儲(chǔ)內(nèi)計(jì)算的方案利用NVM采用模擬信號(hào)的形式存儲(chǔ)神經(jīng)網(wǎng)絡(luò)中的權(quán)重時(shí),模擬信號(hào)在實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)計(jì)算過程中在層間的傳遞、進(jìn)行各種信號(hào)處理時(shí)非常不方便,模擬計(jì)算陣列結(jié)構(gòu)僵化,不利于支持靈活的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以及模擬信號(hào)的存儲(chǔ)、讀寫與計(jì)算中各種噪音和誤差會(huì)影響到存儲(chǔ)的神經(jīng)網(wǎng)絡(luò)模型的可靠性和計(jì)算的準(zhǔn)確性受限的缺陷,提供一種在突破了外部存儲(chǔ)的速度瓶頸及降低外部輸入的功耗的同時(shí)又具有更好的靈活性、高度的可實(shí)施性以及可靠性的基于NVM進(jìn)行AI計(jì)算的芯片架構(gòu)。
為了達(dá)到上述目的,本發(fā)明提供一種基于NVM進(jìn)行AI計(jì)算的芯片架構(gòu),包括通過總線通信連接的NVM陣列、外部接口模塊、NPU(嵌入式神經(jīng)網(wǎng)絡(luò)處理器)和MCU(Microcontroller Unit,微控制單元);
所述NVM陣列用于片內(nèi)存儲(chǔ)數(shù)字化的神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)、所述MCU運(yùn)行的程序以及神經(jīng)網(wǎng)絡(luò)模型;
所述NPU用于神經(jīng)網(wǎng)絡(luò)的數(shù)字域加速計(jì)算;
所述外部接口模塊用于接收外部的AI運(yùn)算指令、輸入數(shù)據(jù)以及向外輸出AI計(jì)算的結(jié)果;
所述MCU用于基于所述AI運(yùn)算指令執(zhí)行所述程序,以控制所述NVM陣列和所述NPU對(duì)所述輸入數(shù)據(jù)進(jìn)行AI計(jì)算,以得到所述AI計(jì)算的結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京優(yōu)存科技有限公司,未經(jīng)南京優(yōu)存科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110541351.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F15-00 通用數(shù)字計(jì)算機(jī)
G06F15-02 .通過鍵盤輸入的手動(dòng)操作,以及應(yīng)用機(jī)內(nèi)程序的計(jì)算,例如,袖珍計(jì)算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時(shí),進(jìn)行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個(gè)或多個(gè)數(shù)字計(jì)算機(jī)的組合,其中每臺(tái)至少具有一個(gè)運(yùn)算器、一個(gè)程序器及一個(gè)寄存器,例如,用于數(shù)個(gè)程序的同時(shí)處理
G06F15-18 .其中,根據(jù)計(jì)算機(jī)本身在一個(gè)完整的運(yùn)行期間內(nèi)所取得的經(jīng)驗(yàn)來改變程序的;學(xué)習(xí)機(jī)器
- 請(qǐng)求沒有進(jìn)行IMS注冊(cè)的用戶進(jìn)行注冊(cè)的方法
- 對(duì)要進(jìn)行紋理操作的像素進(jìn)行分組
- 對(duì)餐盤進(jìn)行溫度調(diào)節(jié)和進(jìn)行分配的獨(dú)立小車
- 對(duì)圖像進(jìn)行編碼
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 蛋糕(甜蜜進(jìn)行時(shí))
- 對(duì)定位輔助數(shù)據(jù)進(jìn)行分級(jí)和分組以進(jìn)行廣播
- 對(duì)物體進(jìn)行分離和定向以進(jìn)行供料
- 對(duì)工件進(jìn)行評(píng)價(jià)以進(jìn)行加工的方法
- AI接口平臺(tái)及其應(yīng)用方法、AI應(yīng)用系統(tǒng)
- AI行為調(diào)用方法和裝置
- 人工智能平臺(tái)實(shí)現(xiàn)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 人工智能的病種分析方法及裝置、存儲(chǔ)介質(zhì)、計(jì)算機(jī)設(shè)備
- 一種處理AI任務(wù)的方法及裝置
- 提供AI模型的方法、AI平臺(tái)、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 一種自適應(yīng)AI模型部署方法
- 分離AI中的公共知識(shí)與私有知識(shí)
- 應(yīng)用于城市大腦的AI算法和AI模型的調(diào)配系統(tǒng)及方法
- 云服務(wù)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





