TensorFlow 模型优化

TensorFlow 模型优化工具包 减少了优化机器学习推理的复杂性。

推理效率是部署机器学习模型时的一个关键问题，因为涉及延迟、内存利用率，以及在许多情况下还有功耗。特别是在移动设备和物联网 (IoT) 等边缘设备上，资源更加有限，模型大小和计算效率成为主要问题。

训练的计算需求随着在不同架构上训练的模型数量而增长，而推理的计算需求则与用户数量成正比。

用例

模型优化对于以下方面非常有用：

模型优化领域可能涉及各种技术

我们的工具包支持训练后量化、量化感知训练、剪枝和聚类。该工具包还提供对协作优化的实验性支持，以结合各种技术。

量化模型是指我们将模型表示为较低精度，例如 8 位整数而不是 32 位浮点数。较低的精度是利用某些硬件的必要条件。

稀疏模型是指在运算符（即神经网络层）之间的连接已被剪枝的模型，在参数张量中引入了零。

聚类模型是指将原始模型的参数替换为更少数量的唯一值的模型。

该工具包提供对协作优化的实验性支持。这使您能够从结合多种模型压缩技术中获益，并通过量化感知训练同时提高精度。