课程进度 66% · 第6/8章第6/8章 · 标签 1/4
— 1 —
模型部署
导出格式
- TorchScript:PyTorch模型导出
- ONNX:跨框架格式
- TensorFlow SavedModel
- TensorRT:NVIDIA加速
部署方案
- TensorFlow Serving:高性能模型服务
- TorchServe:PyTorch模型服务
- ONNX Runtime:跨平台推理
- Docker容器化部署
— 2 —
ONNX导出
python
1
import torch
2
import torch.onnx
3
4
model = torch.load("model.pth")
5
dummy_input = torch.randn(1, 3, 224, 224)
6
torch.onnx.export(model, dummy_input, "model.onnx",
7
input_names=['input'], output_names=['output'],
8
dynamic_axes={'input': {0: 'batch'}})