了解如何使用 TensorFlow 将负责任的 AI 实践集成到您的 ML 工作流程中

TensorFlow 致力于通过与 ML 社区分享资源和工具的集合,帮助负责任地开发 AI 取得进展。

什么是负责任的 AI?

AI 的发展正在创造新的机会来解决具有挑战性的现实世界问题。它也引发了关于构建对每个人都有益的 AI 系统的最佳方式的新问题。

设计 AI 系统应遵循软件开发最佳实践,同时采用以人为本的
ML 方法

公平性

随着 AI 对各行业和社会的影响越来越大,努力实现对每个人都公平且包容的系统至关重要

可解释性

理解和信任 AI 系统对于确保它们按预期工作至关重要

隐私

使用敏感数据训练模型需要隐私保护措施

安全性

识别潜在威胁有助于确保 AI 系统的安全

ML 工作流程中的负责任的 AI

负责任的 AI 实践可以在 ML 工作流程的每个步骤中实施。以下是一些在每个阶段需要考虑的关键问题。

我的 ML 系统适用于谁?

实际用户体验您的系统的方式对于评估其预测、推荐和决策的真实影响至关重要。确保在开发过程的早期阶段从各种用户那里获得反馈。

我是否使用了具有代表性的数据集?

您的数据是否以代表您的用户(例如,将用于所有年龄段,但您只有来自老年人的训练数据)和现实世界环境(例如,将全年使用,但您只有来自夏季的训练数据)的方式进行采样?

我的数据中是否存在现实世界/人为偏差?

数据中的潜在偏差会导致复杂的反馈循环,加剧现有的刻板印象。

我应该使用什么方法来训练我的模型?

使用训练方法将公平性、可解释性、隐私和安全性融入模型。

我的模型表现如何?

评估用户在各种用户、用例和使用环境中的现实世界场景中的体验。首先进行内部测试,然后在发布后继续进行测试。

是否存在复杂的反馈循环?

即使整个系统设计中的所有内容都经过精心设计,基于 ML 的模型在应用于真实、实时数据时也很少能达到 100% 的完美。当实时产品中出现问题时,请考虑它是否与任何现有的社会劣势相符,以及它将如何受到短期和长期解决方案的影响。

TensorFlow 的负责任的 AI 工具

TensorFlow 生态系统提供了一套工具和资源,可以帮助解决上述一些问题。

步骤 1

定义问题

使用以下资源设计具有负责任的 AI 的模型。

人与 AI 研究 (PAIR) 指南

详细了解 AI 开发过程和关键注意事项。

PAIR 可探索

通过交互式可视化,探索负责任的 AI 领域中的关键问题和概念。

步骤 2

构建和准备数据

使用以下工具检查数据是否存在潜在偏差。

了解您的数据(Beta 版)

交互式调查您的数据集,以提高数据质量并缓解公平性和偏差问题。

TF 数据验证

分析和转换数据以检测问题并设计更有效的特征集。

数据卡

为您的数据集创建透明度报告。

僧侣肤色色阶 (MST)

更具包容性的肤色色阶,开放许可,使您的数据收集和模型构建需求更加稳健和包容。

步骤 3

构建和训练模型

使用以下工具使用隐私保护、可解释性技术等训练模型。

TF 模型修复

训练机器学习模型以促进更公平的结果。

TF 隐私

使用隐私训练机器学习模型。

TF 联合学习

使用联合学习技术训练机器学习模型。

TF 约束优化

优化不等式约束问题。

TF 格子

实施灵活、受控且可解释的基于格子的模型。

步骤 4

评估模型

使用以下工具调试、评估和可视化模型性能。

公平性指标

评估二元和多元分类器的常见公平性指标。

TF 模型分析

以分布式方式评估模型并计算不同数据切片上的数据。

假设工具

检查、评估和比较机器学习模型。

语言可解释性工具

可视化和理解 NLP 模型。

可解释 AI

开发可解释和包容的机器学习模型。

TF 隐私测试

评估分类模型的隐私属性。

TensorBoard

衡量和可视化机器学习工作流程。

步骤 5

部署和监控

使用以下工具跟踪和交流模型上下文和详细信息。

模型卡工具包

使用模型卡工具包轻松生成模型卡。

ML 元数据

记录和检索与 ML 开发人员和数据科学家工作流程相关的元数据。

模型卡

以结构化的方式整理机器学习的基本事实。

社区资源

了解社区正在做什么,并探索参与的方式。

Google 众包

帮助 Google 的产品更具包容性,并代表您的语言、地区和文化。

负责任的 AI DevPost 挑战赛

我们要求参与者使用 TensorFlow 2.2 构建一个模型或应用程序,并牢记负责任的 AI 原则。查看画廊以查看获奖者和其他精彩项目。

TensorFlow 中的负责任 AI(TF Dev Summit '20)

介绍一个框架来思考 ML、公平性和隐私。