您可以使用 TensorFlow 决策森林 (TF-DF) 从表格数据中训练、评估和部署机器学习模型。此过程很快,因为 TF-DF 只需要少量代码,并在几秒钟内完成训练。但是,如果您的数据在电子表格中,使用电子表格中的数据训练机器学习模型并在数据上进行预测的最直接方法是什么?
您可以使用 **Simple ML for Sheets** 在 Google 表格中直接完成大部分 ML 工作。使用 Simple ML
- 您无需编写任何代码。
- 训练在几秒钟内在您的浏览器中本地运行。
- 您可以将 Simple ML 生成的模型导出到 TensorFlow、Colab 或 TF Serving。
入门
- 从 WorkPlace 市场 获取 Simple ML 附加组件。
- 尝试使用介绍性的 Simple ML for Sheets 教程 在几分钟内在电子表格中使用机器学习!
让我们看一下
例如,下图显示了一个电子表格,其中包含 Palmer Penguins 数据集 的副本。每行代表一只企鹅。请注意,物种列中的一些值缺失。使用 Google 表格的 Simple ML 附加组件,您可以使用机器学习来预测缺失的值。
"
在幕后,**预测缺失值** 任务会在包含给定列中值的行(在本例中为物种列)上训练模型,然后使用该模型来预测缺失的值。您无需创建或调整模型,也不必配置模型如何使用输入特征 - Simple ML 会为您处理所有这些。
您可以使用 Simple ML 做什么?
在 Google 表格中启用 Simple ML 附加组件后,您可以预测数据中的缺失值并识别异常值。Simple ML 会在您的电子表格中创建新列,以包含这些值以及对新值的置信度。
为了完成这些任务,Simple ML 会在后台创建一个 ML 模型,并在您的电子表格中的数据上对其进行训练。该模型保存在 Google Drive 文件夹中的名为 **simple_ml_for_sheets** 的文件夹中。
您还可以通过选择要训练模型的数据列(并可选地选择训练算法)来训练模型。
训练模型后,您可以使用它执行以下任务,包括预测指定列中的所有值
您可以评估和理解模型。
您可以将模型导出以在 Colab 中使用。
您可以查看模型的详细信息,以及重命名和删除 Simple ML 创建的模型。
Simple ML 保护您的数据安全
Simple ML 会保留您的电子表格数据。Simple ML 永远不会覆盖现有数据,而是会创建新列来显示预测值以及预测的置信度概率。这样,您就不会因错误而丢失数据。
Simple ML 的所有训练操作都在您的浏览器中直接运行,这意味着您的数据完全保留在您的 Google 表格中。优势包括
- 隐私:数据集和模型不会发送到 Google 表格之外的第三方(除了 Google Drive)。
- 响应能力:训练是即时的(在小型数据集上)。
- 没有配额限制:由于您正在使用您的机器进行训练,因此您可以训练任意数量的模型,并且可以训练任意时间。
Simple ML 在您的电子表格中的数据上训练模型
Simple ML 允许您在电子表格中使用 ML 的强大功能,而无需担心细节。您只需要担心大局 - 您将如何使用这些预测?
但是,对于了解如何开发和使用 ML 模型的开发人员,Simple ML 会让您访问您的模型。例如,您可以手动训练、评估、应用或分析模型,并且可以在创建新模型时选择训练算法。
当您使用 Simple ML 执行诸如预测缺失值之类的任务时,它会生成一个 ML 模型并将其保存在您的 Google Drive 中名为 **simple_ml_for_sheets** 的文件夹中。然后,您可以使用该模型进行预测并分析其他数据。例如,您可以在 colab 中上传保存的模型,以编写和运行使用它的代码。
了解有关使用 Simple ML for Sheets 的更多信息
要开始使用,请参阅 ML for Sheets 入门教程。
要详细了解如何使用 Simple ML,请参阅 Simple ML for Sheets 文档。