Ray Huang
本名為黃柏竣,GitHub ID 是 ExplorerRay,是一名交大資工大四學生暨系計中助教,正在努力往 data center infra 相關研究邁進
Beitrag
10.08
14:10
30min
在系上搞運算服務的那檔事
Ray Huang
隨著運算需求的快速增長,如何有效管理並最大化運算資源的利用率成為一大挑戰。當節點數量增加,資源調度變得更加複雜,如何確保不同使用者的工作能夠順利執行,並讓整體運算效能發揮到極致?
本次分享將介紹講者在交大資工建置運算服務時所遇到的實際問題,包括資源分配、服務品質 (QoS) 等挑戰。講者也將分享解決這些問題的經驗,並帶領聽眾了解 Slurm 在高效能運算 (HPC) 環境中的角色,從基本概念到實際應用。
無論你是對管理大量運算節點有興趣,或是想知道 Slurm 是怎麼運作的,本議程都將帶你了解建置運算服務的概念與實務經驗。
Open Source DevOps / SRE, Monitoring & Observability
TR210