透過 Pre-packaged Server 模型部署
Enterprise
    Applicable to Enterprise Edition
  
  Deploy
    Applicable to Deploy Edition
  
此教學將採用 pre-packaged server 方式來部署模型。我們採用 SKLearn pre-packaged server 來部署 IRIS 模型檔做為範例。
前置條件
開啟工作群組的 Model Deployment 功能
須先開啟工作群組的 Model Deployment 功能;請洽系統管理者。

教學步驟
- 登入 User Portal 並選擇 - Deployments。
- 在 model deployment 主頁 點擊 - Create Deployment。
- Deployment name欄位中填入- quickstart-iris。- Model Image欄位中填入- SKLearn server;此為- scikit-learn用的 pre-packaged 基底映像檔,可以將- scikit-learn模型檔服務化。 - Model URI欄位中填入- gs://seldon-models/sklearn/iris;此路徑指向存放在 Google Cloud Storage 已訓練的模型檔。 
- Resources選項:- 選擇 instance type, 我們選擇 (CPU: 0.5 / Memory: 1 G / GPU: 0)作為範例
- 保留 Replicas預設值 (1) 
 
- 選擇 instance type, 我們選擇 
- 點擊 - Deploy後,導轉回主頁。 等待同時,可以點擊- Refresh更新部署狀態。  - 部署成功後(綠色),點擊該部署查看詳細資訊。  
- 頁面顯示所有詳細資訊;準備測試部署的模型, 複製 - endpoint URL並取代下列指令中- ${YOUR_ENDPOINT_URL}。- curl -X POST ${YOUR_ENDPOINT_URL} \ -H 'Content-Type: application/json' \ -d '{ "data": {"tensor": {"shape": [1, 4], "values": [5.3, 3.5, 1.4, 0.2]}} }'- 在 Terminal 執行整串指令; 指令中我們帶入 tensor 並送出請求。 
- 請求範例
curl -X POST https://hub.xxx.aws.primehub.io/deployment/quickstart-iris-xxx/api/v1.0/predictions \ -H 'Content-Type: application/json' \ -d '{ "data": {"tensor": {"shape": [1, 4], "values": [5.3, 3.5, 1.4, 0.2]}} }'
- 回應範例 (it predicts the species is Iris setosaas the first index has the highest prediction value){ "data": { "names": [ "t:0", "t:1", "t:2" ], "tensor": { "shape": [ 1, 3 ], "values": [ 0.8700986370655746, 0.12989376988727133, 7.5930471540348975e-06 ] } }, "meta": {} }
- 恭喜,至此我們已成功部署模型,並同時提供線上服務接受請求。
Reference
- 完整模型部署功能,請見 Model Deployment。
- 客製 pre-packaged server 指引,請見 Pre-packaged Server。
