新增/計劃 Instance Type
這份文件說明如何新增 instance type 以及建議初次使用時如何根據實際環境 (CPUs/MEM/GPUs) 著手開始規劃要哪些 instance types。
規劃建議
在實際情況中,我們會需要管理及分配 CPUs/MEM/GPUs 資源給不同的專案;透過Instance Type Management,我們可以開始規劃資源配置的選項,讓不同專案/群組可以一起有效率地運用整體資源,也可以避免單一專案佔掉大部分的資源。
PrimeHub cluster 本身會需要用到部分資源維持自身的運作,所以我們無法將 100% 資源都用在專案上,建議保留整體資源 10%-15% 留給 cluster 之用。
不同專案對運算資源有不同需求,我們可以依照需求大小來制定 instance type 選項 (如:small/medium/large);使用者可以依據專案資源需求來選擇合適的 instance type 請求所需的資源。
以實際環境的整體資源的比例做為考量,來規劃我們的 instance type 配置選項;初次使用時,可以以此為規劃出發點。
假設實際環境配置 CPU 40 / MEM 512GB / GPU 4:
CPU-Only instance type
| Scale | CPU | Mem | % of Total | 
|---|---|---|---|
| Small | 4 | 128G | 10-25 | 
| Medium | 16 | 256G | 40-60 | 
| Large | 32 | 420G | 80+ | 
GPU-Equipped instance type
| Scale | CPU | Mem | GPU | % of Total | 
|---|---|---|---|---|
| Small | 4 | 128G | 1 | 10-25 | 
| Medium | 16 | 256G | 2 | 40-60 | 
| Large | 32 | 420G | 4 | 80+ | 
新增
根據我們規劃讓我們來新增一個「medium-with-GPU」instance type。
- 以管理者帳號登入 - PrimeHub,於- User Portal點擊- Admin Dashboard進入管理介面。
- 在側邊選單上,點擊 - Instance Types進入管理介面,點擊- + Add按鈕,新增 instance type。
- Name:輸入 medium-with-gpu。
- CPU Limit:輸入 16;- Memory Limit:輸入 256GB。
- GPU Limit:輸入 2。
- (非必要) - Overcommitting: 如果需要啟用;- CPU Request:輸入 14;- Memory Request:輸入 200GB. 詳細資訊請見 [Overcommitting]。
- 點擊 - edit groups並選擇可以使用此 instance type 的群組(專案)。
- 點擊 - Confirm儲存。
我們已經新增一個「中級資源配置需求」的 「medium-with-gpu」instance type ;屬於指定群組(專案)的使用者就可以指定此配置需求來啟始 jupyterhub 進行專案。
