新聞公告

高性能計算平臺推出“低效作業主動告警增值服務”
更新日期👐🏻:2020年04月02日 17:17
為提高運行效率👩🏻🦯➡️、避免機時浪費,高性能計算平臺面向用戶推出“低效作業主動告警增值服務”,以郵件告警形式告知低效作業操作,提醒用戶修改作業腳本🚑,節省資源。
低效作業是指在高性能計算平臺運行過程中,作業指定計算資源與實際運行需求不匹配,從而導致運行狀態異常造成機時浪費的一類作業。申請節點過多並行效率遇到瓶頸、單節點作業申請了多節點資源🖖🏻、單線程作業申請了整個節點資源🏌🏻,是低效作業的常見原因。
超算平臺根據估算的每個作業CPU核心🧜🏿、內存使用需求與用戶申請數量對比,若發現設置不合理,則會發送“告警”郵件並給出調整建議,用戶可根據建議修改💐:
👆收到此類建議的作業,建議減少作業所用的計算節點數。
👆收到此類建議的作業,請重新提交到CPU隊列使用單節點運行🤜🏽🎐。
👆收到此類建議的作業🥱,請重新提交到small隊列使用單核心運行。
如有疑問,請發送郵件至hpc@sjtu.edu.cn咨詢。
上一條💆🏿♀️:交大食堂就餐指數上線
下一條⛹🏻♀️:交大“校級用印”申請流程上線