1# 使用MindSpore Lite进行模型转换
2
3## 基本概念
4
5- MindSpore Lite:OpenHarmony内置AI推理引擎,提供深度学习模型的推理部署能力。
6
7- Neural Network Runtime:神经网络运行时,简称NNRt。作为中间桥梁,连通上层 AI 推理框架和底层加速芯片,实现 AI 模型的跨芯片推理计算。
8
9- 通用的神经网络模型格式,如MindSpore、ONNX、TensorFlow、CAFFE等。
10
11- 离线模型:使用硬件厂商的离线模型转换工具转换得到的模型,由硬件厂商负责解析和推理。
12
13## 场景介绍
14
15MindSpore Lite AI模型部署流程是:
161. 开发者首先将原始模型(如:ONNX、CAFFE等)用MindSpore Lite模型转换工具,生成后缀为.ms的模型文件;
172. 然后在代码中调用MindSpore Lite推理引擎接口,执行[模型推理](mindspore-lite-guidelines.md)。
18
19## 环境准备
20
21### 获取模型转换工具
22
23对于MindSpore Lite模型转换工具,有以下两种方式可以获取:
24
25#### 通过下载获取
26
27| 组件                                                    | 硬件平台 | 操作系统     | 链接                                                         | SHA-256                                                      |
28| ------------------------------------------------------- | -------- | ------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
29| 端侧推理和训练benchmark工具、converter工具、cropper工具 | CPU      | Linux-x86_64 | [mindspore-lite-2.1.0-linux-x64.tar.gz](https://ms-release.obs.cn-north-4.myhuaweicloud.com/2.1.0/MindSpore/lite/release/linux/x86_64/mindspore-lite-2.1.0-linux-x64.tar.gz) | b267e5726720329200389e47a178c4f882bf526833b714ba6e630c8e2920fe89 |
30
31> **说明:**
32>
33> 由于支持转换PyTorch模型的编译选项默认关闭,因此下载的安装包不支持转换PyTorch模型,只能通过源码编译方式获取。
34
35#### 通过源码编译
36
371. 编译环境要求如下:
38
39   - 系统环境:Linux x86_64,推荐使用Ubuntu 18.04.02LTS。
40   - C++编译依赖:
41     -  GCC >= 7.3.0
42     -  CMake >= 3.18.3
43     -  Git >= 2.28.0
44
452. 取[MindSpore Lite源码](https://gitee.com/openharmony/third_party_mindspore)。此代码仓采用 “压缩包 + 补丁”的方式管理源码。首先执行以下命令解压源码,打入补丁。
46
47   ```bash
48   python3 build_helper.py --in_zip_path=./mindspore-v2.1.0.zip --patch_dir=./patches/ --out_src_path=./mindspore-src
49   ```
50
51   执行完毕,MindSpore Lite完整源码位于:`mindspore-src/source/`。
52
533. 执行编译。
54
55   如要获取支持转换PyTorch模型的转换工具,编译前需要先`export MSLITE_ENABLE_CONVERT_PYTORCH_MODEL=on && export LIB_TORCH_PATH="/home/user/libtorch"`。转换前加入libtorch的环境变量:`export LD_LIBRARY_PATH="/home/user/libtorch/lib:${LD_LIBRARY_PATH}"`。用户可以下载CPU版本libtorch后解压到`/home/user/libtorch`的目录下。
56
57   ```bash
58   cd mindspore-src/source/
59   bash build.sh -I x86_64 -j 8
60   ```
61
62   编译完成后,可从源码根目录的`output/`子目录取得MindSpore Lite发布件。解压后,转换工具位于`tools/converter/converter/`。
63
64### 配置环境变量
65
66获取到模型转换工具之后,还需要将转换工具需要的动态链接库加入环境变量LD_LIBRARY_PATH。
67
68```bash
69export LD_LIBRARY_PATH=${PACKAGE_ROOT_PATH}/tools/converter/lib:${LD_LIBRARY_PATH}
70```
71
72其中,${PACKAGE_ROOT_PATH}对应为编译或下载得到的MindSpore Lite发布件解压后的路径。
73
74
75## 参数说明
76
77MindSpore Lite模型转换工具提供了多种参数设置,用户可根据需要来选择使用。此外,用户可输入`./converter_lite --help`获取实时帮助。
78下面提供详细的参数说明。
79
80
81|        参数        | 是否必选            | 参数说明                                                     | 取值范围                                         |
82| :----------------: | ------------------- | ------------------------------------------------------------ | ------------------------------------------------ |
83|       --help       | 否                  | 打印全部帮助信息。                                           | -                                                |
84|       --fmk        | 是                  | 输入模型的原始格式。只有在MS模型转换为Micro代码场景时,才支持设置为MSLITE。 | MINDIR、CAFFE、TFLITE、TF、ONNX、PYTORCH、MSLITE |
85|    --modelFile     | 是                  | 输入模型的路径。                                             | -                                                |
86|    --outputFile    | 是                  | 输出模型的路径,不需加后缀,可自动生成`.ms`后缀。            | -                                                |
87|    --weightFile    | 转换CAFFE模型时必选 | 输入模型权重文件的路径。                                     | -                                                |
88|    --configFile    | 否                  | 1)可作为训练后量化配置文件路径;2)可作为扩展功能配置文件路径。 | -                                                |
89|       --fp16       | 否                  | 设定在模型序列化时是否需要将float32数据格式的权重存储为float16数据格式。<br/>默认值为off。 | on、off                                          |
90|    --inputShape    | 否                  | 设定模型输入的维度,输入维度的顺序和原始模型保持一致。对某些特定的模型可以进一步优化模型结构,但是转化后的模型将可能失去动态shape的特性。输入名和shape之间用`:`分割,多个输入用`;`分割,同时加上双引号`""`。例如配置为"inTensorName_1: 1,32,32,4;inTensorName_2:1,64,64,4;"。 | -                                                |
91| --inputDataFormat  | 否                  | 设定导出模型的输入format,只对四维输入有效。<br/>默认值为NHWC。 | NHWC、NCHW                                       |
92|  --inputDataType   | 否                  | 设定量化模型输入tensor的数据类型。仅当模型输入tensor的量化参数(scale和zero point)配置时有效。默认与原始模型输入tensor的数据类型保持一致。<br/>默认值为DEFAULT。 | FLOAT32、INT8、UINT8、DEFAULT                    |
93|  --outputDataType  | 否                  | 设定量化模型输出tensor的数据类型。仅当模型输出tensor的量化参数(scale和zero point)配置时有效。默认与原始模型输出tensor的数据类型保持一致。<br/>默认值为DEFAULT。 | FLOAT32、INT8、UINT8、DEFAULT                    |
94| --outputDataFormat | 否                  | 设定导出模型的输出format,只对四维输出有效。                 | NHWC、NCHW                                       |
95
96> **说明:**
97> - 参数名和参数值之间用等号连接,中间不能有空格。
98> - CAFFE模型一般分为两个文件:`*.prototxt`模型结构,对应`--modelFile`参数;`*.caffemodel`模型权值,对应`--weightFile`参数。
99
100## 使用示例
101
102以CAFFE模型LeNet为例,执行转换命令。
103
104```bash
105./converter_lite --fmk=CAFFE --modelFile=lenet.prototxt --weightFile=lenet.caffemodel --outputFile=lenet
106```
107本例中,因为采用了CAFFE模型,所以需要模型结构、模型权值两个输入文件。再加上其他必需的fmk类型和输出路径两个参数,即可成功执行。
108结果显示为:
109
110```bash
111CONVERT RESULT SUCCESS:0
112```
113这表示已经成功将CAFFE模型转化为MindSpore Lite模型,获得新文件`lenet.ms`。
114
115## 离线模型转换(可选)
116
117当部署场景对加载时延要求严格时,开发者希望进一步降低加载时延,可采用另一种部署方案,即基于离线模型的推理。
118
119执行推理时,MindSpore Lite会直接将离线模型传给接入NNRt的 AI 硬件,无需在线构图即可加载,大幅降低模型加载时延,并且可携带额外的硬件特定信息,协助 AI 硬件推理。
120
121### 约束与限制
122
123- 离线模型仅支持在NNRt后端推理,硬件厂商需接入NNRt且支持离线模型推理。
124- 离线模型转换工具仅支持通过源码编译方式获取。
125- 离线模型在转换时`fmk`必须指定为`THIRDPARTY`。
126- 离线模型本身作为黑盒,转换工具无法直接解析它得到模型输入输出张量信息,因此需要用户在转换工具的扩展配置文件中手动配置。
127
128### 扩展配置文件说明
129
130扩展配置样例如下:
131- 首行`[third_party_model]`为固定关键词,表明此节为离线模型配置。
132- 下方依次是模型输入输出张量的名称、数据类型、形状、内存格式等信息,每个字段独占一行,先后顺序不限,采用键值对格式。
133- 除数据类型和形状必选外,其它为可选配置。
134- 最后,还提供扩展参数字段,可将离线模型所需的自定义配置用键值对的形式一同封装到.ms文件,在推理时由NNRt传递给AI硬件使用。
135
136```text
137[third_party_model]
138input_names=in_0;in_1
139input_dtypes=float32;float32
140input_shapes=8,256,256;8,256,256,3
141input_formats=NCHW;NCHW
142output_names=out_0
143output_dtypes=float32
144output_shapes=8,64
145output_formats=NCHW
146extended_parameters=key_foo:value_foo;key_bar:value_bar
147```
148
149字段说明:
150
151- `input_names`:[可选]模型输入名称,格式:字符串,多个输入用`;`间隔。
152- `input_dtypes`:[必选]模型输入数据类型,格式:类型,多个输入用`;`间隔。
153- `input_shapes`:[必选]模型输入形状,格式:整数数组,多个输入用`;`间隔。
154- `input_formats`:[可选]模型输入内存布局,格式:字符串,多个输入用`;`间隔,默认值NHWC。
155- `output_names`:[可选]模型输入名称,格式:字符串,多个输入用`;`间隔。
156- `output_dtypes`:[必选]模型输出数据类型,格式:类型,多个输出用`;`间隔。
157- `output_shapes`:[必选]模型输出形状,格式:整数数组,多个输出用`;`间隔。
158- `output_formats`:[可选]模型输出内存布局,格式:字符串,多个输入用`;`间隔,默认值NHWC。
159- `extended_parameters`:[可选]推理硬件自定义配置,字符串键值对格式,会通过NNRt后端传给硬件。