如何使用 Tensorflow 加载花卉数据集并使用它?

pythonserver side programmingprogrammingtensorflow

我们将使用花卉数据集,其中包含数千朵花的图像。它包含 5 个子目录,每个类都有一个子目录。

阅读更多: 什么是 TensorFlow,以及 Keras 如何与 TensorFlow 配合使用以创建神经网络?

使用 ‘get_file’ 方法下载花卉数据集后,它将被加载到环境中以使用它。明确提到了加载器参数,并将加载的数据分为训练和验证集。

我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 有助于在浏览器上运行 Python 代码,并且不需要任何配置,并且可以免费访问 GPU(图形处理单元)。 Colaboratory 已在 Jupyter Notebook 上构建。

print("加载加载器的参数")
batch_size = 32
img_height = 180
img_width = 180

print("使用 Keras 预处理图像数据集")
print("将数据集拆分为训练集和验证集")

train_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="training",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)

print("将数据集拆分为训练集和验证集")
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="validation",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)

print("打印子目录中的类名")
class_names = train_ds.class_names
print(class_names)

代码来源:https://www.tensorflow.org/tutorials/load_data/images

输出

加载加载器的参数
使用 Keras 预处理图像数据集
将数据集拆分为训练集和验证集
发现 3670 个文件属于 5 个类别。
使用 2936 个文件进行训练。
将数据集拆分为训练集和验证集
发现 3670 个文件属于 5 个类别。
使用 734 个文件进行验证。
打印子目录中存在的类名
['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']

解释

  • 参数已定义。
  • 数据集分为训练集和验证集。
  • 控制台上显示每个图像所属的类名。

相关文章