PyTorch - 使用 Convents 进行序列处理
在本章中,我们提出了一种替代方法,它依赖于跨两个序列的单个 2D 卷积神经网络。 我们网络的每一层都根据目前产生的输出序列重新编码源标记。 因此,类似注意力的属性在整个网络中普遍存在。
在这里,我们将专注于根据数据集中包含的值创建具有特定池化的顺序网络。 这个过程也最好应用在"图像识别模块"中。
以下步骤用于使用 PyTorch 创建带有 convents 的序列处理模型 −
步骤 1
使用 Convents 导入执行序列处理所需的模块。
import keras from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Flatten from keras.layers import Conv2D, MaxPooling2D import numpy as np
步骤 2
使用以下代码执行必要的操作以按相应的顺序创建模式 −
batch_size = 128 num_classes = 10 epochs = 12 # input image dimensions img_rows, img_cols = 28, 28 # the data, split between train and test sets (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train = x_train.reshape(60000,28,28,1) x_test = x_test.reshape(10000,28,28,1) print('x_train shape:', x_train.shape) print(x_train.shape[0], 'train samples') print(x_test.shape[0], 'test samples') y_train = keras.utils.to_categorical(y_train, num_classes) y_test = keras.utils.to_categorical(y_test, num_classes)
步骤 3
编译模型并拟合上述常规神经网络模型中的模式,如下所示 −
model.compile(loss = keras.losses.categorical_crossentropy, optimizer = keras.optimizers.Adadelta(), metrics = ['accuracy']) model.fit(x_train, y_train, batch_size = batch_size, epochs = epochs, verbose = 1, validation_data = (x_test, y_test)) score = model.evaluate(x_test, y_test, verbose = 0) print('Test loss:', score[0]) print('Test accuracy:', score[1])
生成的输出如下 −