TensorFlow Text 提供了一组与文本指标相关的类和操作,可与 TensorFlow 2.0 配合使用。该库包含文本相似性指标(例如 ROUGE-L)的实现,这是自动评估文本生成模型所必需的。
在评估模型时使用这些操作的好处是,它们与 TPU 评估兼容,并且与 TF 流式指标 API 配合得很好。
pip install -q "tensorflow-text==2.11.*"
import tensorflow as tf
import tensorflow_text as text
Rouge-L 指标是一个介于 0 到 1 之间的分数,表示两个序列的相似程度,基于最长公共子序列 (LCS) 的长度。具体来说,Rouge-L 是 LCS 精度(LCS 覆盖的假设序列的百分比)和 LCS 召回率(LCS 覆盖的参考序列的百分比)的加权调和平均值(或 f-measure)。
TF.Text 实现为每个(假设、参考)对返回 F-measure、精度和召回率。
hypotheses = tf.ragged.constant([['captain', 'of', 'the', 'delta', 'flight'],
['the', '1990', 'transcript']])
references = tf.ragged.constant([['delta', 'air', 'lines', 'flight'],
['this', 'concludes', 'the', 'transcript']])
假设和参考应为令牌的 tf.RaggedTensors。需要令牌而不是原始句子,因为没有单一的标记化策略适合所有任务。
现在我们可以调用 text.metrics.rouge_l 并获得结果
result = text.metrics.rouge_l(hypotheses, references)
print('F-Measure: %s' % result.f_measure)
print('P-Measure: %s' % result.p_measure)
print('R-Measure: %s' % result.r_measure)
F-Measure: tf.Tensor([0.44444448 0.57142854], shape=(2,), dtype=float32) P-Measure: tf.Tensor([0.4 0.6666667], shape=(2,), dtype=float32) R-Measure: tf.Tensor([0.5 0.5], shape=(2,), dtype=float32)
ROUGE-L 有一个附加超参数 alpha,它决定用于计算 F-Measure 的调和平均值的权重。接近 0 的值将召回率视为更重要,接近 1 的值将精确率视为更重要。alpha 的默认值为 .5,对应于精确率和召回率的权重相等。
# Compute ROUGE-L with alpha=0
result = text.metrics.rouge_l(hypotheses, references, alpha=0)
print('F-Measure (alpha=0): %s' % result.f_measure)
print('P-Measure (alpha=0): %s' % result.p_measure)
print('R-Measure (alpha=0): %s' % result.r_measure)
F-Measure (alpha=0): tf.Tensor([0.5 0.5], shape=(2,), dtype=float32) P-Measure (alpha=0): tf.Tensor([0.4 0.6666667], shape=(2,), dtype=float32) R-Measure (alpha=0): tf.Tensor([0.5 0.5], shape=(2,), dtype=float32)
# Compute ROUGE-L with alpha=1
result = text.metrics.rouge_l(hypotheses, references, alpha=1)
print('F-Measure (alpha=1): %s' % result.f_measure)
print('P-Measure (alpha=1): %s' % result.p_measure)
print('R-Measure (alpha=1): %s' % result.r_measure)
F-Measure (alpha=1): tf.Tensor([0.4 0.6666667], shape=(2,), dtype=float32) P-Measure (alpha=1): tf.Tensor([0.4 0.6666667], shape=(2,), dtype=float32) R-Measure (alpha=1): tf.Tensor([0.5 0.5], shape=(2,), dtype=float32)