[發明專利]跨節點應用性能監測方法、裝置及高性能計算系統有效
| 申請號: | 201910245092.2 | 申請日: | 2016-08-18 |
| 公開(公告)號: | CN109976989B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 吳廣輝;陳健;黃新平;王寧;張華 | 申請(專利權)人: | 北京并行科技股份有限公司 |
| 主分類號: | G06F11/34 | 分類號: | G06F11/34 |
| 代理公司: | 北京思睿峰知識產權代理有限公司 11396 | 代理人: | 謝建云;趙愛軍 |
| 地址: | 100094 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 節點 應用 性能 監測 方法 裝置 計算 系統 | ||
本發明公開了監測應用執行性能的方法、裝置及高性能計算系統。其中,監測應用執行性能的方法包括下述步驟。獲取對應執行應用的計算節點的節點列表。基于該節點列表,獲取執行應用的每個計算節點對應的進程列表和函數列表。基于所獲取的每個進程列表,提取其中與應用關聯的進程項。從每個關聯的進程項對應的函數列表中,提取與該進程項關聯的函數項。根據所提取與應用關聯的進程項和與每個提取的進程項關聯的函數項,監測應用的執行性能。
本申請是本申請人于2016年8月18日提交的申請號為201610685041.8,名稱為監測應用執行性能的方法、裝置及高性能計算系統的發明專利申請的分案申請。
技術領域
本發明涉及云計算領域,尤其涉及監測應用執行性能的方法、裝置及高性能計算系統。
背景技術
在例如高性能計算等云計算領域中,用戶通常將待執行的應用(例如高性能計算的一項計算作業)分配到服務器集群中一個或多個計算節點來執行。目前,執行計算應用的硬件性能越來越高,這極大提高了對作業的執行效率。另外,在一項作業被提交到服務器集群后,用戶還需要了解關于該作業的執行情況。
現有的作業管理系統通常只能查詢關于應用的總體運行狀態(即,退出、掛起、排隊和運行)。換言之,現有的作業管理系統并不能監測應用執行性能。
因此,本發明提供一種新的監測應用執行性能的技術方案。
發明內容
為此,本發明提供一種新的監測應用執行性能的方案,有效的解決了上面至少一個問題。
根據本發明的一個方面,提供一種監測應用執行性能的方法,適于在計算設備中執行。該應用適于在服務器集群中執行。該服務器集群包括多個計算節點。每個計算節點包括一個或多個適于被進程占用的計算單元。該方法包括下述步驟。獲取與執行應用的計算節點對應的節點列表。基于該節點列表,獲取執行應用的每個計算節點對應的進程列表和函數列表。基于所獲取的每個進程列表,提取其中與應用關聯的進程項。從每個關聯的進程對應的函數列表中,提取與該進程項關聯的函數項。根據所提取與應用關聯的進程項和與每個提取的進程項關聯的函數項,監測應用的執行性能。
可選地,在根據本發明的監測應用執行性能的方法中,進程項包括下述中至少一部分:進程標識、進程名稱、進程狀態、對所占用的計算單元的使用率、內存使用量、內存占用率、進程持續時間、父進程標識、所占用的計算單元的標識、交換區(swap)的使用量和進程創建時間。函數項包括:函數名稱、該函數所屬的執行模塊的名稱、單位時間內對該函數累計的采樣次數、和該函數的采樣次數占執行該函數的進程所在的計算節點在該單位時間內對函數采樣的總次數的比例。
可選地,根據本發明的監測應用執行性能的方法還包括獲取執行應用的計算節點的異常運行狀態,其中,每個計算節點的異常運行狀態包括下述中至少一種:內存使用量超過第一閾值并使用交換區(swap),代碼向量化(VEC)比率低于第二閾值,指令集執行(AVX)比率低于第三閾值,CPU使用率超過第四閾值且浮點運算速率(Gflops)低于第五閾值。
在獲取到執行應用的任一個計算節點的異常運行狀態時,根據本發明的監測應用執行性能的方法還包括根據所提取與所述應用關聯的進程項和與每個提取的進程項關聯的函數項,判斷引起該計算節點運行異常的進程項和函數項,以便定位應用的性能瓶頸。
可選地,在根據本發明的監測應用執行性能的方法中,從每個關聯的進程項所占用的計算單元所對應的函數列表中,提取與該進程項關聯的函數項的步驟包括:根據進程項的進程標識,從所對應的函數列表中提取與該進程名稱相關聯的函數項。服務器集群為高性能計算集群。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京并行科技股份有限公司,未經北京并行科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910245092.2/2.html,轉載請聲明來源鉆瓜專利網。





