10/08/2025 –, TR313
KubeRay 是一個開源專案,實作了一個 Kubernetes Operator,使我們能夠在 Kubernetes 環境中輕鬆部署 Ray。它提供了豐富的指標(metrics)、容錯機制,以及零停機時間(zero-downtime)的升級支援等等功能,讓 end users 能夠充分發揮 Kubernetes 的彈性與穩定性,來部署各種分散式應用。
此外,KubeRay 也與多個其他開源專案有良好的整合,像是 Apache YuniKorn、Volcano 等,讓 users 可以根據不同場景彈性選擇要使用哪種 scheduler,使其成為更加高效且可擴展的分散式運算平台。
TBA
Niveau de difficulté:Intermediate
成功大學, Into ML Infra, Kubernetes and cool stuff.
https://github.com/owenowenisme