[發(fā)明專利]基于x86架構(gòu)的AI芯片任務處理方法和裝置有效
| 申請?zhí)枺?/td> | 202010789760.0 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111949329B | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設計)人: | 沈付旺 | 申請(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F9/445 | 分類號: | G06F9/445;G06F8/41 |
| 代理公司: | 北京連和連知識產(chǎn)權(quán)代理有限公司 11278 | 代理人: | 楊帆;宋薇薇 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 x86 架構(gòu) ai 芯片 任務 處理 方法 裝置 | ||
1.一種基于x86架構(gòu)的AI芯片任務處理方法,其特征在于,所述方法包括:
更改內(nèi)核配置文件,并基于更改的內(nèi)核配置文件對x86系統(tǒng)進行內(nèi)核的重新編譯;
利用預設編譯器版本和庫文件對x86系統(tǒng)進行編譯環(huán)境搭建;
在已搭建的編譯環(huán)境中對AI芯片進行設備注冊以生成AI芯片驅(qū)動,并將所述AI芯片驅(qū)動掛載到x86系統(tǒng);
獲取計算任務,并利用x86系統(tǒng)的運行時程序?qū)⑺鲇嬎闳蝿障聜髦了鯝I芯片驅(qū)動;
利用所述AI芯片驅(qū)動和所述計算任務對AI芯片的功能模塊進行任務配置和使能直至任務完成。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述更改內(nèi)核配置文件,并基于更改的內(nèi)核配置文件對x86系統(tǒng)進行內(nèi)核的重新編譯的步驟包括:
獲取底層配置文件,將所述底層配置文件中的drm功能和dma功能均配置為打開;
獲取頂層配置文件,將所述頂層配置文件中的dma連續(xù)內(nèi)存分配功能配置為打開;
利用所述底層配置文件和所述頂層配置文件對x86系統(tǒng)進行內(nèi)核的重新編譯。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用預設編譯器版本和庫文件對x86系統(tǒng)進行編譯環(huán)境搭建的步驟包括:
獲取x86系統(tǒng)的當前編譯器版本,并將所述當前編譯器版本與所述預設編譯器版本進行比較;
若所述當前編譯器版本低于所述預設編譯器版本,則將當前編譯器版本替換為所述預設編譯器版本;
獲取jpeg包和png包,并將所述jpeg包和png包添加至x86系統(tǒng)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對AI芯片進行設備注冊包括:PCI驅(qū)動定義、AI芯片ID聲明、AI芯片配置、任務隊列初始化、AI芯片地址映射、AI芯片中斷注冊、dma字符設備添加、AI芯片dma連續(xù)內(nèi)存分配。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述在已搭建的編譯環(huán)境中對AI芯片進行設備注冊以生成AI芯片驅(qū)動具體包括:
使用pci_driver驅(qū)動結(jié)構(gòu)體將AI硬件注冊為PCI設備,所述pci_driver驅(qū)動結(jié)構(gòu)體包括AI芯片的名稱、待驅(qū)動AI芯片列表、初始化AI芯片以及卸載AI芯片功能函數(shù);
配置AI芯片廠商ID和AI芯片ID以進行PCI設備匹配;
為PCI設備定義私有的設備信息結(jié)構(gòu)體,所述設備信息結(jié)構(gòu)體用于接收保存PCI設備的中斷信息、硬件配置信息、隊列信息以及中斷自旋鎖信息,利用devm_kzalloc命令為所述設備信息結(jié)構(gòu)體申請內(nèi)存,利用pci_set_drvdata命令將所述設備信息結(jié)構(gòu)體掛載到匹配的PCI設備上;
配置AI芯片的MAC數(shù)量、是否支持壓縮、winograd算法進行初始化;
初始化AI芯片的任務隊列;
利用APIpci_enable_device命令進行對應PCI設備的匹配與喚醒,利用pci_resource_start命令獲取PCI設備的地址空間,利用ioremap命令將該地址進行虛擬地址映射,利用reg_read命令以及reg_write命令對相應的寄存器進行讀寫實現(xiàn)CPU與AI芯片之間的交互;
獲取PCI設備的irq變量值,利用devm_request_irq命令來實現(xiàn)的對所述irq變量值和中斷函數(shù)之間的對應匹配;
為AI芯片添加drm設備功能,其中drm設備注冊了包含特定名稱的字符設備,并為所述字符設備添加打開、文件操作以及ioctl功能;
為AI芯片分配dma存儲空間,所述dma存儲空間用于存放推理權(quán)值、輸入、輸出數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取計算任務,并利用x86系統(tǒng)的運行時程序?qū)⑺鲇嬎闳蝿障聜髦了鯝I芯片驅(qū)動的步驟包括:
利用x86系統(tǒng)的解析器對待處理任務進行解析以得到計算任務,并將所述計算任務發(fā)送至x86系統(tǒng)的運行時程序;
x86系統(tǒng)的運行時程序與所述AI芯片驅(qū)動進行交互以將所述計算任務發(fā)送至所述AI芯片驅(qū)動。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010789760.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





