什么是迁移学习?

复杂的深度学习模型具有数百万个参数(权重),从头开始训练它们通常需要大量数据和计算资源。迁移学习是一种技术,它通过使用已经在相关任务上训练过的模型的一部分并将其重新用于新模型来缩短这一过程。

例如,本节中的下一个教程将向您展示如何构建自己的图像识别器,该识别器利用已经训练过的模型来识别图像中的 1000 多种不同类型的物体。您可以使用比原始模型所需的训练数据少得多的数据来调整预训练模型中的现有知识,以检测您自己的图像类别。

这对于快速开发新模型以及在浏览器和移动设备等资源受限的环境中定制模型非常有用。

在进行迁移学习时,我们通常不会调整原始模型的权重。相反,我们会删除最后一层,并在截断模型的输出之上训练一个新的(通常相当浅的)模型。本节中的教程将演示这种技术

有关使用 TensorFlow.js 进行迁移学习的另一个示例,请参阅 使用预训练模型