TensorFlow 文本处理指南

TensorFlow 文本处理指南记录了用于自然语言处理 (NLP) 的库和工作流程,并介绍了处理文本的重要概念。

KerasNLP

KerasNLP 是一个高级自然语言处理 (NLP) 库,它包含所有最新的基于 Transformer 的模型以及低级标记化实用程序。对于大多数 NLP 使用案例,它是推荐的解决方案。

  • KerasNLP 入门: 通过在不断提高的复杂度级别上执行情感分析来学习 KerasNLP,从使用预训练模型到从头开始构建自己的 Transformer。

tf.strings

tf.strings 模块提供用于处理字符串张量的操作。

  • Unicode 字符串: 在 TensorFlow 中表示 Unicode 字符串,并使用 Unicode 等效的标准字符串操作来操作它们。

TensorFlow 文本

如果您需要访问低级文本处理工具,可以使用 TensorFlow 文本。TensorFlow 文本提供了一组操作和库,可帮助您处理文本形式的输入,例如原始文本字符串或文档。

预处理

TensorFlow 模型 – NLP

TensorFlow 模型 - NLP 库提供 Keras 原语,可以组装成基于 Transformer 的模型,以及脚手架类,可以轻松地对新架构进行实验。