导航菜单

人工智能程序设计/模型部署与优化
课程进度 66% · 第6/8章6/8章 · 标签 1/4
1

模型部署

导出格式

  • TorchScript:PyTorch模型导出
  • ONNX:跨框架格式
  • TensorFlow SavedModel
  • TensorRT:NVIDIA加速

部署方案

  • TensorFlow Serving:高性能模型服务
  • TorchServe:PyTorch模型服务
  • ONNX Runtime:跨平台推理
  • Docker容器化部署
2

ONNX导出

python
1
import torch
2
import torch.onnx
3
 
4
model = torch.load("model.pth")
5
dummy_input = torch.randn(1, 3, 224, 224)
6
torch.onnx.export(model, dummy_input, "model.onnx",
7
input_names=['input'], output_names=['output'],
8
dynamic_axes={'input': {0: 'batch'}})