TensorFlow.js 模型

探索预训练模型,将计算机视觉、自然语言处理 (NLP) 等常见机器学习任务添加到您的 Web 和基于浏览器的应用程序中。

视觉

分析图像和视频中的特征。在浏览器中解锁新的实时体验。

图像分类

使用 ImageNet 数据库中的标签对图像进行分类(MobileNet)。

目标检测

在单个图像中定位和识别多个对象(Coco SSD)。

语义分割

在浏览器中运行语义分割(DeepLab)。

身体

使用来自 MediaPipe 及其他模型检测面部、手部和身体上的关键点和姿势,这些模型针对 JavaScript 和 Node.js 进行了优化。

简单的人脸检测

使用具有自定义编码器(Blazeface)的单次检测器架构检测图像中的人脸。

人脸关键点检测

预测 486 个 3D 人脸关键点,以推断人脸的近似表面几何形状。

姿势检测

统一的姿势检测 API,用于使用三种模型之一,这些模型有助于检测非典型姿势和快速身体运动,并具有实时性能。

身体分割

实时分割人物和身体部位。

手部姿势检测

手掌检测器和手部骨骼手指跟踪模型。预测每个检测到的手的 21 个 3D 手部关键点。

肖像深度估计

估计单个肖像图像的人的深度图。

文本

利用 BERT 和其他 Transformer 编码器架构的力量,在您的 Web 应用程序中启用 NLP。

自然语言问答

使用 BERT 根据给定文本段落的內容回答问题。

文本毒性检测

对评论可能对对话产生的感知影响进行评分,从“非常有毒”到“非常健康”(毒性)。

通用句子编码器

将文本编码为嵌入,用于 NLP 任务,例如情感分类和文本相似性(通用句子编码器)。

音频

对音频进行分类以检测声音并在您的 Web 应用程序中触发操作。

语音命令识别

对语音命令数据集中的 1 秒音频片段进行分类(语音命令)。

通用

查找更多可开箱即用使用的 TensorFlow.js 模型。

KNN 分类器

使用 K 近邻算法创建分类器的实用程序。可用于迁移学习。