如何使用 Tensorflow 通过 Python 可视化数据?

pythonserver side programmingprogrammingtensorflow

假设我们有花卉数据集。可以使用基本上链接到花卉数据集的 Google API 下载花卉数据集。可以使用 ‘get_file’ 方法将 API 作为参数传递。完成后,数据将下载到环境中。

可以使用 ‘matplotlib’ 库对其进行可视化。‘imshow’方法用于在控制台上显示图像。

阅读更多: 什么是 TensorFlow,以及 Keras 如何与 TensorFlow 配合使用来创建神经网络?

我们将使用 Keras Sequential API,它有助于构建用于处理普通层堆栈的顺序模型,其中每个层都有一个输入张量和一个输出张量。

使用 keras.Sequential 模型创建图像分类器,并使用 preprocessing.image_dataset_from_directory 加载数据。数据可以高效地从磁盘加载。识别过度拟合并应用技术来缓解它。这些技术包括数据增强和丢弃。有 3700 朵花的图像。此数据集包含 5 个子目录,每个类有一个子目录。它们是: 

  • 雏菊, 
  • 蒲公英, 
  • 玫瑰, 
  • 向日葵和 
  • 郁金香。

我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 有助于在浏览器上运行 Python 代码,并且不需要任何配置,并且可以免费访问 GPU(图形处理单元)。 Colaboratory 已在 Jupyter Notebook 上构建。

print("可视化数据集")
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 10))
for images, labels in train_ds.take(1):
   for i in range(6):
      ax = plt.subplot(3, 3, i + 1)
      plt.imshow(images[i].numpy().astype("uint8"))
      plt.title(class_names[labels[i]])
      plt.axis("off")

for image_batch, labels_batch in train_ds:
   print(image_batch.shape)
   print(labels_batch.shape)
   break

代码来源:https://www.tensorflow.org/tutorials/images/classification

输出

可视化数据集
(32, 180, 180, 3)
(32,)

解释

  • 使用fit 方法,也可以手动迭代数据集,以检索批量图像。
  • 此数据显示在控制台上。
  • image_batch 是形状为 (32, 180, 180, 3) 的张量。
  • 这是一批 32 张形状为 180x180x3 的图像。
  • label_batch 是形状为 (32,) 的张量,这些是 32 张图像的对应标签。
  • 可以在 image_batch 和 labels_batch 张量上调用 .numpy() 以将它们转换为 numpy.ndarray。

相关文章