在 TensorFlow.org 上查看 | 在 Google Colab 中运行 | 在 GitHub 上查看源代码 | 下载笔记本 | 查看 TF Hub 模型 |
概述
从低分辨率图像恢复高分辨率 (HR) 图像的任务通常称为单图像超分辨率 (SISR)。
这里使用的模型是 ESRGAN (ESRGAN:增强型超分辨率生成对抗网络)。我们将使用 TensorFlow Lite 对预训练模型进行推理。
TFLite 模型是从 TF Hub 上托管的 实现 转换而来的。请注意,我们转换的模型将 50x50 的低分辨率图像上采样到 200x200 的高分辨率图像(比例因子 = 4)。如果您想要不同的输入大小或比例因子,则需要重新转换或重新训练原始模型。
设置
首先安装所需的库。
pip install matplotlib tensorflow tensorflow-hub
导入依赖项。
import tensorflow as tf
import tensorflow_hub as hub
import matplotlib.pyplot as plt
print(tf.__version__)
下载并转换 ESRGAN 模型
model = hub.load("https://tfhub.dev/captain-pool/esrgan-tf2/1")
concrete_func = model.signatures[tf.saved_model.DEFAULT_SERVING_SIGNATURE_DEF_KEY]
@tf.function(input_signature=[tf.TensorSpec(shape=[1, 50, 50, 3], dtype=tf.float32)])
def f(input):
return concrete_func(input);
converter = tf.lite.TFLiteConverter.from_concrete_functions([f.get_concrete_function()], model)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
tflite_model = converter.convert()
# Save the TF Lite model.
with tf.io.gfile.GFile('ESRGAN.tflite', 'wb') as f:
f.write(tflite_model)
esrgan_model_path = './ESRGAN.tflite'
下载测试图像(昆虫头部)。
test_img_path = tf.keras.utils.get_file('lr.jpg', 'https://raw.githubusercontent.com/tensorflow/examples/master/lite/examples/super_resolution/android/app/src/main/assets/lr-1.jpg')
使用 TensorFlow Lite 生成超分辨率图像
lr = tf.io.read_file(test_img_path)
lr = tf.image.decode_jpeg(lr)
lr = tf.expand_dims(lr, axis=0)
lr = tf.cast(lr, tf.float32)
# Load TFLite model and allocate tensors.
interpreter = tf.lite.Interpreter(model_path=esrgan_model_path)
interpreter.allocate_tensors()
# Get input and output tensors.
input_details = interpreter.get_input_details()
output_details = interpreter.get_output_details()
# Run the model
interpreter.set_tensor(input_details[0]['index'], lr)
interpreter.invoke()
# Extract the output and postprocess it
output_data = interpreter.get_tensor(output_details[0]['index'])
sr = tf.squeeze(output_data, axis=0)
sr = tf.clip_by_value(sr, 0, 255)
sr = tf.round(sr)
sr = tf.cast(sr, tf.uint8)
可视化结果
lr = tf.cast(tf.squeeze(lr, axis=0), tf.uint8)
plt.figure(figsize = (1, 1))
plt.title('LR')
plt.imshow(lr.numpy());
plt.figure(figsize=(10, 4))
plt.subplot(1, 2, 1)
plt.title(f'ESRGAN (x4)')
plt.imshow(sr.numpy());
bicubic = tf.image.resize(lr, [200, 200], tf.image.ResizeMethod.BICUBIC)
bicubic = tf.cast(bicubic, tf.uint8)
plt.subplot(1, 2, 2)
plt.title('Bicubic')
plt.imshow(bicubic.numpy());
性能基准
性能基准数字是使用 此处描述的工具 生成的。
模型名称 | 模型大小 | 设备 | CPU | GPU |
---|---|---|---|---|
超分辨率 (ESRGAN) | 4.8 Mb | Pixel 3 | 586.8ms* | 128.6ms |
Pixel 4 | 385.1ms* | 130.3ms |
*使用 4 个线程