散点图、散点图和气泡图
本章重点介绍散点图、散点图和气泡图的细节。首先,让我们研究一下散点图。
散点图
散点图用于在水平轴和垂直轴上绘制数据点,以显示一个变量如何影响另一个变量。数据表中的每一行都由一个标记表示,该标记的位置取决于其在X和Y轴上设置的列中的值。
graph_objs 模块(go.Scatter)的scatter()方法产生散点轨迹。这里,mode属性决定数据点的外观。mode 的默认值是lines,它显示连接数据点的连续线。如果设置为标记,则仅显示由小实心圆表示的数据点。当模式分配为"线+标记"时,会同时显示圆和线。
在下面的示例中,绘制了笛卡尔坐标系中三组随机生成的点的散点轨迹。下面将解释以不同模式属性显示的每条轨迹。
import numpy as np N = 100 x_vals = np.linspace(0, 1, N) y1 = np.random.randn(N) + 5 y2 = np.random.randn(N) y3 = np.random.randn(N) - 5 trace0 = go.Scatter( x = x_vals, y = y1, mode = 'markers', name = 'markers' ) trace1 = go.Scatter( x = x_vals, y = y2, mode = 'lines+markers', name = 'line+markers' ) trace2 = go.Scatter( x = x_vals, y = y3, mode = 'lines', name = 'line' ) data = [trace0, trace1, trace2] fig = go.Figure(data = data) iplot(fig)
Jupyter Notebook 单元的输出如下所示 −
Scattergl Plot
WebGL(Web 图形库)是一个 JavaScript API,用于在任何兼容的 Web 浏览器中渲染交互式 2D 和 3D 图形,无需使用插件。WebGL 与其他 Web 标准完全集成,允许图形处理单元 (GPU) 加速使用图像处理。
Plotly,您可以使用 Scattergl() 代替 Scatter() 来实现 WebGL,以提高速度、改善交互性并能够绘制更多数据。go.scattergl() 函数在涉及大量数据点时可提供更好的性能。
import numpy as np N = 100000 x = np.random.randn(N) y = np.random.randn(N) trace0 = go.Scattergl( x = x, y = y, mode = 'markers' ) data = [trace0] layout = go.Layout(title = "scattergl plot ") fig = go.Figure(data = data, layout = layout) iplot(fig)
输出如下所示 −
气泡图
气泡图显示数据的三个维度。每个实体及其相关数据的三个维度被绘制为一个圆盘(气泡),其中两个维度通过圆盘的xy 位置表示,第三个维度通过其大小表示。气泡的大小由第三个数据系列中的值决定。
气泡图是散点图的一种变体,其中数据点被气泡替换。如果您的数据有三个维度(如下所示),则创建气泡图将是一个不错的选择。
Company | Products | Sale | Share |
---|---|---|---|
A | 13 | 2354 | 23 |
B | 6 | 5423 | 47 |
C | 23 | 2451 | 30 |
气泡图由 go.Scatter() 轨迹生成。上述两个数据系列以 x 和 y 属性给出。第三维由标记显示,其大小代表第三个数据系列。在上述情况下,我们使用 products 和 sale 作为 x 和 y 属性,并使用 market share 作为 marker size。
在 Jupyter 笔记本中输入以下代码。
company = ['A','B','C'] products = [13,6,23] sale = [2354,5423,4251] share = [23,47,30] fig = go.Figure(data = [go.Scatter( x = products, y = sale, text = [ 'company:'+c+' share:'+str(s)+'%' for c in company for s in share if company.index(c)==share.index(s) ], mode = 'markers', marker_size = share, marker_color = ['blue','red','yellow']) ]) iplot(fig)
输出结果如下所示 −