[發(fā)明專利]一種基于人工智能應(yīng)用的無損網(wǎng)絡(luò)性能測試方法和裝置有效
| 申請?zhí)枺?/td> | 202110060368.7 | 申請日: | 2021-01-18 |
| 公開(公告)號: | CN112866059B | 公開(公告)日: | 2022-07-15 |
| 發(fā)明(設(shè)計)人: | 邱奔;李潔;郭亮;王月;王少鵬;謝麗娜;吳美希;劉鵬云;許可欣;常金鳳;宮偉文;柯芊;李寧東;盛凱;盧帥;鄭常奎 | 申請(專利權(quán))人: | 中國信息通信研究院 |
| 主分類號: | H04L43/08 | 分類號: | H04L43/08;H04L43/0829;H04L43/0852;H04L43/0894;H04L43/12;H04L41/0803 |
| 代理公司: | 北京德琦知識產(chǎn)權(quán)代理有限公司 11018 | 代理人: | 杜志敏;宋志強 |
| 地址: | 100191 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 人工智能 應(yīng)用 無損 網(wǎng)絡(luò) 性能 測試 方法 裝置 | ||
1.一種基于人工智能應(yīng)用的無損網(wǎng)絡(luò)性能測試方法,其特征在于,所述方法包括:
通過部署網(wǎng)絡(luò)拓撲構(gòu)建無損網(wǎng)絡(luò)人工智能AI業(yè)務(wù)測試平臺,其中,所述網(wǎng)絡(luò)拓撲包括:服務(wù)器和交換機;所述服務(wù)器之間通過交換機通信;
所述服務(wù)器作為管理節(jié)點將待訓(xùn)練數(shù)據(jù)包分發(fā)給多個作為計算節(jié)點的服務(wù)器;
所述服務(wù)器作為計算節(jié)點與其他計算節(jié)點使用相同的訓(xùn)練模型對接收到的待訓(xùn)練數(shù)據(jù)包進行AI訓(xùn)練;在訓(xùn)練結(jié)束后將訓(xùn)練結(jié)果反饋給所述管理節(jié)點;
所述服務(wù)器作為管理節(jié)點確定所述訓(xùn)練結(jié)果是否滿足預(yù)設(shè)條件,如果否,根據(jù)所述訓(xùn)練結(jié)果更新所述計算節(jié)點上的訓(xùn)練模型的參數(shù),并將待測數(shù)據(jù)包重新分發(fā)給所述多個計算節(jié)點繼續(xù)進行訓(xùn)練,直到反饋的訓(xùn)練結(jié)果滿足預(yù)設(shè)條件;計算網(wǎng)絡(luò)訓(xùn)練性能值和加速比,并獲取無損網(wǎng)絡(luò)進行AI訓(xùn)練時的丟包率、時延和平均帶寬;
其中,所述預(yù)設(shè)條件為訓(xùn)練次數(shù)大于預(yù)設(shè)次數(shù)值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述網(wǎng)絡(luò)拓撲基于二層無阻塞Spine Leaf拓撲模型部署,將所述網(wǎng)絡(luò)拓撲劃分為葉層和脊層,葉層和脊層網(wǎng)絡(luò)中分別分布著作為葉交換機和脊交換機的交換機,服務(wù)器與作為葉交換機的交換機的相連。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,對所述網(wǎng)絡(luò)拓撲中的服務(wù)器和交換機進行硬件部署包括:
對服務(wù)器、網(wǎng)絡(luò)設(shè)施和顯示核心GPU眾核加速卡進行部署;其中,所述網(wǎng)絡(luò)設(shè)施包括:交換機和物理連線;
對所述網(wǎng)絡(luò)拓撲中的服務(wù)器和交換機進行軟件部署包括:
對作為計算節(jié)點的服務(wù)器進行深度學(xué)習(xí)模型訓(xùn)練框架軟件、操作系統(tǒng)及容器平臺部署;
對作為管理節(jié)點的服務(wù)器和交換機進行操作系統(tǒng)及容器平臺部署。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,對所述網(wǎng)絡(luò)拓撲中的服務(wù)器和交換機進行配置包括:
網(wǎng)絡(luò)拓撲和物理連線、服務(wù)器基礎(chǔ)環(huán)境配置、交換機配置、RDMA網(wǎng)卡QoS配置,以及AI應(yīng)用軟件。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法進一步包括:
在作為計算節(jié)點的服務(wù)器上安裝TensorFlow分布式AI訓(xùn)練框架軟件,使各計算節(jié)點采用相同的訓(xùn)練模型進行AI訓(xùn)練。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述服務(wù)器作為管理節(jié)點將待訓(xùn)練數(shù)據(jù)包分發(fā)給多個作為計算節(jié)點的服務(wù)器時,通過Kubernetes將待訓(xùn)練數(shù)據(jù)包分發(fā)給多個作為計算節(jié)點的服務(wù)器。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法進一步包括:
部署監(jiān)控工具,用于監(jiān)控?zé)o損網(wǎng)絡(luò)進行AI訓(xùn)練時的丟包率、時延和平均帶寬;
所述獲取無損網(wǎng)絡(luò)進行AI訓(xùn)練時的丟包率、時延和平均帶寬,包括:
從所述監(jiān)控工具或交換機控制界面查詢獲取各個計算節(jié)點在進行AI訓(xùn)練時的丟包率、時延和平均帶寬。
8.根據(jù)權(quán)利要求1-7任一項所述的方法,其特征在于,所述服務(wù)器之間,以及計算節(jié)點之間通過交換機通信使用的協(xié)議為:
傳輸控制協(xié)議TCP、遠程直接數(shù)據(jù)存取RDMA,或圖形處理器遠程直接數(shù)據(jù)存取GDR。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國信息通信研究院,未經(jīng)中國信息通信研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110060368.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種水面垃圾自動收集的方法
- 下一篇:防火內(nèi)平窗的耐火五金鉸鏈
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評估方法及智能終端
- 人工智能倫理風(fēng)險與防范虛擬仿真方法、系統(tǒng)和機器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險防范方法
- 人工智能倫理風(fēng)險辨識防范虛擬仿真實驗方法和機器人
- 基于人工智能體決策的人工智能倫理風(fēng)險辨識和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險辨識防范方法和機器人
- 在線應(yīng)用平臺上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場
- 使用應(yīng)用的方法和應(yīng)用平臺
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠程應(yīng)用進行應(yīng)用安裝
- 應(yīng)用檢測方法及應(yīng)用檢測裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)





