Seaborn.load_dataset() 方法

Seaborn.load_dataset() 方法用于从 seaborn 库加载内置数据集。 为了描述 seaborn 或为错误投诉创建可重现的示例,此功能提供了对一些示例数据集的快速访问。

它不是日常使用所必需的。 为了为分类变量创建适当的排序,对一些数据集进行了少量预处理。

语法

以下是 seaborn.load_dataset() 方法的语法 −

seaborn.load_dataset(name, cache=True, data_home=None, **kws)

参数

seaborn.load_dataset() 的参数如下所示。

S.No 参数及说明
1 Name

接受一个字符串值,它是数据集的名称。

2 Cache

取布尔值,它是一个可选参数。 如果为 true,它会首先尝试从本地缓存加载,并且需要下载到缓存。

3 Data_home

这个可选参数接受一个字符串值,它是设置缓存数据的目录。


返回值

此方法返回一个 pandas 数据框。


加载数据集

为了绘制图表,我们需要数据,以防万一您无法使用所需格式且包含所需数据的数据,您可以使用 Seaborn 库中的数据集。

Seaborn 除了作为统计图表工具包之外,还包含各种默认数据集。 我们将使用其中一个内置数据集作为默认数据集的示例。

让我们考虑第一个示例中的提示数据集。 "tips"(小费)数据集包含有关可能在餐厅用餐的人的信息,以及他们是否给服务员小费,以及他们的性别、吸烟状况和其他因素。

get_dataset_names() 方法有助于检索 Seaborn 中可用的所有内置数据集的名称。

seaborn.get_dataset_names()

load_dataset() 方法有助于将具有名称的数据集加载到数据结构中。

Tips=seaborn.load_dataset('tips')

上面的代码行有助于将名称为"tips"的数据集加载到名为 tips 的数据结构中。 因此,此方法有助于从库中加载数据集。

示例 1

以下是加载 tips 数据集的示例

import seaborn as sns
import matplotlib.pyplot as plt
dts= sns.load_dataset("titanic")
dts.head()
sns.relplot(data=dts, x="age", y="fare")
plt.show()

输出

下面是上面例子的输出 −

seaborn_load_dataset_method

示例 2

在下面的示例中,我们正在加载 tips 数据集 −

import seaborn as sns
import matplotlib.pyplot as plt
tips=sns.load_dataset("tips")
tips.head()
sns.catplot(data=tips,x="sex",y="tip",hue="time",height=5, aspect=.8)
plt.show()

输出

这会生成以下输出 −

load_dataset_method

示例 3

让我们看另一个例子 −

import seaborn as sns
import matplotlib.pyplot as plt
exercise=sns.load_dataset("exercise")
exercise.head()
g=sns.PairGrid(exercise)
g.map_upper(sns.scatterplot)
g.map_lower(sns.kdeplot)
g.map_diag(sns.ecdfplot)
plt.show()

输出

执行时,上面的例子生成下面的绘图 −

load_dataset

❮Seaborn 实用函数简介