如何使用 Tensorflow 预处理花卉训练数据集?

pythonserver side programmingprogrammingtensorflow

可以使用 keras 预处理 API 预处理花卉数据集。它有一个名为"image_dataset_from_directory"的方法它采用验证集、存储数据的目录和其他参数来处理数据集。

阅读更多: 什么是 TensorFlow,以及 Keras 如何与 TensorFlow 配合使用来创建神经网络?

我们将使用 Keras Sequential API,它有助于构建用于处理普通层堆栈的顺序模型,其中每个层只有一个输入张量和一个输出张量。使用 keras.Sequential 模型创建图像分类器,并使用 preprocessing.image_dataset_from_directory 加载数据。

数据高效地从磁盘加载。识别过度拟合并应用技术来缓解它。这些技术包括数据增强和 dropout。有 3700 朵花的图像。该数据集包含 5 个子目录,每个类有一个子目录。它们是:雏菊、蒲公英、玫瑰、向日葵和郁金香。

我们正在使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 有助于在浏览器上运行 Python 代码,并且不需要任何配置,并且可以免费访问 GPU(图形处理单元)。 Colaboratory 已在 Jupyter Notebook 上构建。

print("使用 keras.preprocessing 预处理数据集")
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="validation",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)
class_names = train_ds.class_names
print("类名是:")
print(class_names)

代码来源:https://www.tensorflow.org/tutorials/images/classification

输出

使用 keras.preprocessing 对数据集进行预处理
发现 3670 个文件属于 5 个类别。
使用 734 个文件进行验证。
类名是:
['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']

解释

  • 使用 keras.preprocessing 方法处理数据集。
  • 下一步是在控制台上显示类名。

相关文章