Seaborn - 内核密度估计
核密度估计 (KDE) 是一种估计连续随机变量的概率密度函数的方法。 它用于非参数分析。
在 distplot 中将 hist 标志设置为 False 将产生核密度估计图。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.distplot(df['petal_length'],hist=False) plt.show()
输出

拟合参数分布
distplot() 用于可视化数据集的参数分布。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.distplot(df['petal_length']) plt.show()
输出

绘制双变量分布
二元分布用于确定两个变量之间的关系。 这主要涉及两个变量之间的关系以及一个变量相对于另一个变量的行为方式。
在 seaborn 中分析双变量分布的最佳方法是使用 jointplot() 函数。
Jointplot 创建一个多面板图形,投影两个变量之间的双变量关系以及每个变量在不同轴上的单变量分布。
散点图
散点图是可视化分布的最便捷方式,其中每个观察值都通过 x 和 y 轴在二维图中表示。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.jointplot(x = 'petal_length',y = 'petal_width',data = df) plt.show()
输出

上图展示了虹膜数据中petal_length和petal_width的关系。 图中的趋势表明所研究的变量之间存在正相关。
Hexbin 绘图
当数据密度稀疏时,即当数据非常分散且难以通过散点图进行分析时,在双变量数据分析中使用六角分箱。
名为"kind"和值"hex"的附加参数绘制了 hexbin 图。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex') plt.show()

核密度估计
核密度估计是一种估计变量分布的非参数方法。 在 seaborn 中,我们可以使用 jointplot() 绘制一个 kde。
将值"kde"传递给参数 kind 以绘制核图。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex') plt.show()
输出
