COSCUP 2024

雲端 GPU 共享系統
2024-08-04, 14:20–14:50 (Asia/Taipei), TR412-1

長庚大學基於教學上的需要,使用 kubernetes+kubeflow 建立了一套雲端的 AI 教學系統。根據教學管理上的需要,客制化 kubeflow 並加入了下列的新模組。這個系統除了給一般的 AI 程式教學外,也很適合給一般分享 GPU 硬體給多人使用。以提高資源的移用率。

我們將介紹 kubeflow 的架構。並說明我們對 kubeflow 的修改,並討論將來一至二年的計畫。希望能邀請更多人加入共同開發出一套功能更完善的系統。


預計分享系統中新增之功能

  • 支援 LDAP 的帳號管理系統,可以支援 admin/group admin/user 三個不同層級
  • jupyter notebook 分享系統,可以讓使用者相互分享作品
  • 廣播系統,讓不同使用者可以分享畫面
  • 資源管理系統,可以為每一個使用者指定可用的資源
  • notebook 模版,可以在不需要重新製作 docker image 的情況下,製作新的 container

從 1992 年開始參與開放原始碼運動。開發 Linux 上第一套中文的終端機及相關的中文化套件。隨後至 UC Irvine 攻讀博士。參與 real-time Linux 的開發。過去二十年多半從事嵌入式系統的開發工作。目前任教長庚大學人工智慧學系,為長庚 AI 中心副主任。