ggplot2 - 简介

ggplot2 是一个 R 包,专为数据可视化而设计,可提供最佳的探索性数据分析。它提供美观、无忧的图表,可处理诸如绘制图例和表示图例等细节。这些图表可以迭代创建,稍后再编辑。此包设计为分层工作,首先显示使用 R 进行探索性数据分析期间收集的原始数据,然后添加注释和统计摘要层。

即使是最有经验的 R 用户也需要帮助来创建精美的图形。这个库是使用 R 创建图形的非凡工具,但即使经过多年的几乎日常使用,我们仍然需要参考我们的备忘单。

这个包在称为"图形语法"的深层语法下工作,该语法由一组可以通过多种方式创建的独立组件组成。 "图形语法"是 ggplot2 非常强大的唯一原因,因为 R 开发人员不局限于其他软件包中使用的一组预先指定的图形。语法包括一组简单的核心规则和原则。

2005 年,Wilkinson 创建或更确切地说是发起了图形语法的概念,以描述所有统计图形之间的深层特征。它专注于层的主要部分,包括适应嵌入 R 的功能。

"图形语法"与 R 之间的关系

它告诉用户或开发人员,统计图形用于将数据映射到美学属性,例如相关几何对象(如点、线和条)的颜色、形状、大小。该图还可能包含在上述坐标系上绘制的相关数据的各种统计变换。它还包括一项称为"Faceting"的功能,通常用于为上述数据集的不同子集创建相同的图。R 包含各种内置数据集。这些独立组件的组合完全构成了一个特定的图形。

现在让我们关注可以参考语法创建的不同类型的图 −

数据

如果用户想要可视化给定的一组美学映射,该映射描述了如何将数据中所需的变量映射在一起以创建映射的美学属性。

图层

它由几何元素和所需的统计变换组成。图层包括几何对象、用于短数据的几何对象,它们实际上借助点、线、多边形等来表示图。最好的演示是将观察结果进行分箱和计数,以创建特定的直方图,以总结特定线性模型的二维关系。

比例尺

比例尺用于映射数据空间中的值,用于创建值,无论是颜色、大小还是形状。它有助于绘制图例或轴,以提供逆映射,从而可以从所述图中读取原始数据值。

坐标系

它描述了数据坐标如何一起映射到图形的所述平面。它还提供读取图形所需的轴和网格线的信息。通常它用作笛卡尔坐标系,包括极坐标和地图投影。

刻面

它包括如何将数据分解为所需子集并将子集显示为数据的倍数的规范。这也称为条件或网格化过程。

主题

它控制显示的细节,如字体大小和背景颜色属性。为了创建一个有吸引力的情节,考虑参考文献总是更好的选择。

现在,讨论语法不提供的局限性或功能也同样重要 −

  • 它缺乏应该使用哪种图形或用户感兴趣的建议。

  • 它没有描述交互性,因为它只包括静态图形的描述。对于动态图形的创建,应该应用其他替代解决方案。

下面提到了使用 ggplot2 创建的简单图形 −

使用 ggplot2 创建的图表