Seaborn.residplot() 方法
Seaborn.residplot() 方法用于绘制线性回归的残差数据。 此函数将对变量 y 和 x 进行稳健或多项式回归,然后将残差绘制为散点图。 如果您想查看残差是否具有任何结构,您可以选择对残差图拟合低平滑器。
残差图是一种图形数据可视化工具,它在 y 轴上绘制残差点,在 x 轴上绘制独立因子。 此工具确定应用于点的回归模型必须是线性的还是非线性的。
语法
以下是 seaborn.residplot() 方法的语法 −
seaborn.residplot(*, x=None, y=None, data=None, lowess=False, x_partial=None, y_partial=None, order=1, robust=False, dropna=True, label=None, color=None, scatter_kws=None, line_kws=None, ax=None
参数
下面讨论了 residplot() 方法的一些参数。
S.No | 参数及说明 |
---|---|
1 | x,y 这些参数将变量名称作为绘制长格式数据的输入。 输入可以是向量或字符串。 |
2 | data 这是用于绘制图形的数据框。 |
3 | Lowess 此参数采用布尔值,并用低平滑器拟合残差散点图。 |
4 | {x,y}_partial 此可选参数接受文本或矩阵作为输入。 输入要么是数据中的列名,要么是第一维与 x 相同的矩阵。 在绘图之前,这些变量被认为是混杂的,并从 x 或 y 变量中减去。 |
5 | Order 此可选参数接受整数值并确定计算残差时要拟合的多项式阶数。 |
6 | Color 用于指定单一颜色,该颜色应用于所有绘图元素。 |
7 | robust 此可选参数采用布尔值,并在计算残差时适合稳健的线性回归。 |
8 | dropna 它采用布尔值,如果为 True,则忽略缺少数据的观察结果。 |
返回值
residplot() 方法返回带有标绘点的 matplotlib 轴。
加载seaborn库
让我们在继续开发绘图之前加载 seaborn 库和数据集。 要加载或导入 seaborn 库,可以使用以下代码行。
Import seaborn as sns
加载数据集
在本文中,我们将使用 seaborn 库中内置的 Titanic 数据集。 以下命令用于加载数据集。
titanic=sns.load_dataset("titanic")
下面提到的命令用于查看数据集中的前 5 行。 这使我们能够了解哪些变量可用于绘制图形。
titanic.head()
以下是上面这段代码的输出。
index,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone 0,0,3,male,22.0,1,0,7.25,S,Third,man,true,NaN,Southampton,no,false 1,1,1,female,38.0,1,0,71.2833,C,First,woman,false,C,Cherbourg,yes,false 2,1,3,female,26.0,0,0,7.925,S,Third,woman,false,NaN,Southampton,yes,true
既然我们已经加载了数据集,我们将探索几个例子。
示例 1
我们将在本文中使用 titanic 数据集并绘制 residplot(),我们将数据集的年龄和存活列传递给 x、y 参数,并通过将颜色参数传递给 seaborn.residplot() 方法。 在这种情况下,我们将字符串"g"传递给颜色,这会将绘图更改为绿色。
import seaborn as sns import matplotlib.pyplot as plt titanic=sns.load_dataset("titanic") titanic.head() sns.residplot(y="survived", x="age",color="g",data=titanic) plt.show()
输出
得到的输出如下,
示例 2
下面我们就来了解一下robust参数的用法。 此可选参数采用布尔值,并在计算残差时适合稳健的线性回归。 该参数的使用方式如下所示。 在下面的示例中,robust 传递给 True。
import seaborn as sns import matplotlib.pyplot as plt titanic=sns.load_dataset("titanic") titanic.head() sns.regplot(y="survived", x="age",color="g", robust=True,data=titanic) plt.show()
输出
绘图的输出如下,
示例 3
Lowess 是 seaborn.residplot() 方法中经常使用的另一个参数。 此参数采用布尔值,并用低平滑器拟合残差散点图。
由于我们在本文中使用泰坦尼克号数据集并绘制 residplot(),因此我们将数据集的 age 和 survived 列分别传递给 x,y 参数。 我们将布尔值 True 传递给 lowess 参数和红色,e+ie:字符串"r"传递给 color 属性,该属性将绘图更改为红色。
可以在下面观察情节。
import seaborn as sns import matplotlib.pyplot as plt titanic=sns.load_dataset("titanic") titanic.head() sns.regplot(y="survived", x="age",color="r", lowess=True,data=titanic) plt.show()
输出
the plot obtained is,