如何使用 Keras 下载和探索与 Python 中 stackoverflow 问题的预测标签相关的数据集?

keraspythonserver side programmingprogramming

Tensorflow 是 Google 提供的机器学习框架。它是一个与 Python 结合使用的开源框架,用于实现算法、深度学习应用程序等。它用于研究和生产目的。它具有优化技术,有助于快速执行复杂的数学运算。

这是因为它使用 NumPy 和多维数组。这些多维数组也称为‘张量’。该框架支持使用深度神经网络。它具有高度可扩展性,并附带许多流行的数据集。它使用 GPU 计算并自动管理资源。它附带大量机器学习库,并且得到很好的支持和记录。该框架能够运行深度神经网络模型、训练它们并创建预测相应数据集相关特征的应用程序。

‘tensorflow’可以使用以下代码行在 Windows 上安装包 −

pip install tensorflow

Keras 是作为 ONEIROS(开放式神经电子智能机器人操作系统)项目研究的一部分而开发的。Keras 是一个用 Python 编写的深度学习 API。它是一个高级 API,具有高效的界面,可帮助解决机器学习问题。它具有高度可扩展性,并具有跨平台能力。这意味着 Keras 可以在 TPU 或 GPU 集群上运行。Keras 模型也可以导出以在 Web 浏览器或手机中运行。

Keras 已经存在于 Tensorflow 包中。可以使用下面的代码行访问它。

import tensorflow
from tensorflow import keras

我们使用 Google Colaboratory 运行以下代码。Google Colab 或 Colaboratory 有助于在浏览器上运行 Python 代码,无需配置,可以免费访问 GPU(图形处理单元)。Colaboratory 是在 Jupyter Notebook 之上构建的。以下是使用 Python 探索 StackOverflow 问题预测标签相关数据集的代码片段 −

示例

print("正在下载 tensorflow-text")
!pip -q install tensorflow-text

import collections
import pathlib
import re
import string
import tensorflow as tf

from tensorflow.keras import layer
from tensorflow.keras import loss
from tensorflow.keras import preprocessing
from tensorflow.keras import utils
from tensorflow.keras.layers.experimental.preprocessing import TextVectorization

import tensorflow_datasets as tfds
import tensorflow_text as tf_text
data_url =
'https://storage.googleapis.com/download.tensorflow.org/data/stack_overflow_16k.tar.gz'
dataset = utils.get_file(
   'stack_overflow_16k.tar.gz',
   data_url,
   untar=True,
   cache_dir='stack_overflow',
   cache_subdir='')
dataset_dir = pathlib.Path(dataset).parent

代码来源 − https://www.tensorflow.org/tutorials/load_data/text

输出

Downloading tensorflow-text
Downloading data from
https://storage.googleapis.com/download.tensorflow.org/data/stack_overflow_16k.tar.gz
6053888/6053168 [==============================] - 0s 0us/step

解释

  • 已导入所需软件包。

  • 数据从api。


相关文章