PyTorch ONNX模型的加载与推理详解
本文详细阐述如何加载并使用torch.onnx.export导出的ONNX模型进行推理。torch.onnx.export函数可将PyTorch模型转换为ONNX格式,方便在其他框架中部署。然而,直接使用PyTorch张量作为ONNX Runtime的输入会导致错误。
文中示例展示了使用torch.onnx.export导出模型,以及使用ONNX Runtime推理时遇到的错误:“runtimeerror: input must be a list of dictionaries or a single numpy array for input ‘x’.” 该错误指出ONNX Runtime要求输入数据为NumPy数组,而非PyTorch张量。
解决方法:将PyTorch张量转换为NumPy数组
关键在于将PyTorch张量转换为NumPy数组。 以下是两种正确的代码示例:
方法一:
- import onnxruntimeimport numpyimport torchresnet_onnx = onnxruntime.InferenceSession('onnx.pb')# x = torch.ones(2, 2) # 错误:输入类型为torch.tensorx = numpy.ones((2, 2), dtype=numpy.float32) # 正确:输入类型为numpy.ndarrayinputs = {resnet_onnx.get_inputs()[0].name: x}print(resnet_onnx.run(None, inputs))
登录后复制
此方法将输入x的类型从torch.tensor更改为numpy.ndarray,并指定数据类型为numpy.float32,解决了类型不匹配问题。
方法二:
- import onnxruntime as ortimport numpy as np# 加载模型sess = ort.InferenceSession("onnx.pb")# 准备输入数据input_data = np.ones((2, 2)).astype("float32")# 运行模型output_data = sess.run(None, {"x": input_data})[0]# 输出模型的预测结果print(output_data)
登录后复制
此方法同样使用NumPy数组作为输入,并清晰地展示了如何获取模型输出。
两种方法均成功加载并运行导出的ONNX模型,核心在于确保输入数据的类型与ONNX Runtime的要求一致。 使用NumPy数组是避免错误的关键步骤。
以上就是如何用ONNX Runtime正确加载和推理PyTorch导出的ONNX模型?的详细内容,更多请关注【创想鸟】其它相关文章!