MinDiff 需求

我应该何时使用 MinDiff?

在您的模型总体上表现良好,但在属于敏感群体示例上更频繁地产生有害错误的情况下,应用 MinDiff,并且您希望缩小性能差距。感兴趣的敏感群体可能因您的用例而异,但通常包括受保护的类别,例如种族、宗教、性别、性取向等等。在本文件中,我们将使用“敏感群体”来指代属于受保护类别的任何一组示例。

使用 MinDiff 来解决数据切片性能不佳有两个主要条件

  • 您已经调整并评估了您的模型,确定了显示数据切片性能不佳的指标。这必须在应用模型修复之前完成。
  • 您拥有或可以获得足够数量的属于性能不佳群体的相关标记示例(更多详细信息见下文)。

MinDiff 是用于修复不平等行为的众多技术之一。特别是,当您试图直接均衡群体之间的性能时,它可能是一个不错的选择。MinDiff 可以与其他方法结合使用,例如数据增强和其他方法,这可能会带来更好的结果。但是,如果您需要优先考虑投资哪种技术,则应根据您的产品需求进行选择。

应用 MinDiff 时,您可能会看到最佳性能群体的性能下降或略有下降,因为性能不佳的群体得到改善。这种权衡是预期的,应在您的产品需求的背景下进行评估。在实践中,我们经常发现 MinDiff 不会导致最佳性能切片下降到不可接受的水平,但这与应用程序相关,需要由产品所有者做出决定。

我可以在哪些模型类型上应用 MinDiff?

MinDiff 已被证明在应用于二元分类器时始终有效。可以将该方法改编用于其他应用程序,但尚未完全测试。已经有一些工作表明在多分类和排名任务中取得成功1,但任何在这些模型或其他类型的模型上使用 MinDiff 都应被视为实验性的。

我可以在哪些指标上应用 MinDiff?

当您尝试均衡跨群体的指标是假阳性率 (FPR)假阴性率 (FNR) 时,MinDiff 可能是一个不错的解决方案,但它可能适用于其他指标。作为一般规则,当您要定位的指标是属于敏感群体和不属于敏感群体的示例之间得分分布差异的结果时,MinDiff 可能有效。

构建您的 MinDiff 数据集

在准备使用 MinDiff 进行训练时,您需要准备三个独立的数据集。与常规训练一样,您的 MinDiff 数据集应代表您的模型所服务的用户。MinDiff 可能会在没有这种情况的情况下工作,但在这种情况下,您应该格外小心。

假设您正在尝试提高模型对属于敏感类别的示例的 FPR,您将需要

  1. 原始训练集 - 用于训练基线模型的原始数据集
  2. MinDiff 敏感集 - 属于敏感类别且具有负面真实标签的示例数据集。这些示例将仅用于计算 MinDiff 损失。
  3. MinDiff 非敏感集 - 属于敏感类别且具有负面真实标签的示例数据集。这些示例将仅用于计算 MinDiff 损失。

使用库时,您将把所有这三个数据集组合成一个数据集,该数据集将用作您的新训练集。

为 MinDiff 选择示例

在上面的例子中,如果你主要关注的是误报率的差异,那么专门挑选负面标记的样本似乎违反直觉。但是,请记住,误报预测来自错误分类为正面的负面标记样本。

在为 MinDiff 收集数据时,你应该选择性能差异明显的样本。在上面的例子中,这意味着选择负面标记的样本来解决 FPR。如果我们对针对 FNR 感兴趣,则需要选择正面标记的样本。

我需要多少数据?

好问题——这取决于你的用例!根据你的模型架构、数据分布和 MinDiff 配置,所需的数据量可能会有很大差异。在过去的应用中,我们发现 MinDiff 在每个 MinDiff 训练集(上一节中的集合 2 和 3)中使用 5,000 个样本时效果很好。数据量较少,性能下降的风险会增加,但这在你的生产约束范围内可能是微不足道的或可以接受的。应用 MinDiff 后,你需要彻底评估你的结果,以确保性能达到可接受的水平。如果结果不可靠,或不符合性能预期,你可能仍然需要考虑收集更多数据。

MinDiff 什么时候适合我?

MinDiff 是一种强大的技术,可以提供令人印象深刻的结果,但这并不意味着它适合所有情况。随意应用它并不能保证你能够获得足够的解决方案。

除了上面讨论的要求之外,还有一些情况下,MinDiff 在技术上是可行的,但并不适合。你应该始终根据已知的推荐实践设计你的 ML 工作流程。例如,如果你的模型任务定义不明确,产品需求不明确,或者你的样本标签过于偏斜,你应该优先解决这些问题。同样,如果你没有明确定义敏感群体,或者无法可靠地确定样本是否属于敏感群体,你就无法有效地应用 MinDiff。

在更高层面上,你应该始终考虑你的产品是否适合使用 ML。如果是,请考虑它可能产生的用户伤害的潜在途径。负责任的 ML 的追求是一项多方面的努力,旨在预测各种潜在的危害;MinDiff 可以帮助减轻其中一些危害,但所有结果都值得仔细考虑。

1Beutel A.,Chen,J.,Doshi,T.,Qian,H.,Wei,L.,Wu,Y.,Heldt,L.,Zhao,Z.,Hong,L.,Chi,E.,Goodrow,C. (2019)。通过成对比较实现推荐排名中的公平性。