Python - 图形数据

CSGraph 代表压缩稀疏图，专注于基于稀疏矩阵表示的快速图形算法。

图形表示

首先，让我们了解什么是稀疏图以及它如何帮助图形表示。

稀疏图到底是什么？

图形只是节点的集合，节点之间有链接。图形几乎可以表示任何东西 &min; 社交网络连接，其中每个节点都是一个人并与熟人相连；图像，其中每个节点都是一个像素并与相邻像素相连；点在高维分布中，每个节点都与其最近的邻居以及您能想到的几乎任何其他东西相连。

表示图形数据的一种非常有效的方法是使用稀疏矩阵：我们称之为 G。矩阵 G 的大小为 N x N，G[i, j] 给出节点"i"和节点"j"之间连接的值。稀疏图主要包含零 − 也就是说，大多数节点只有几个连接。在大多数情况下，此属性都是正确的。

创建稀疏图子模块的动机是 scikit-learn 中使用的几种算法，包括以下 −

Isomap − 一种流形学习算法，需要在图中找到最短路径。
层次聚类 −基于最小生成树的聚类算法。
谱分解 − 基于稀疏图拉普拉斯算子的投影算法。

作为一个具体的例子，假设我们想要表示以下无向图 −

此图有三个节点，其中节点 0 和 1 由权重为 2 的边连接，节点 0 和 2 由权重为 1 的边连接。我们可以构建密集、掩蔽和稀疏表示，如下例所示，请记住，无向图由对称矩阵表示。

G_dense = np.array([ [0, 2, 1],
                     [2, 0, 0],
                     [1, 0, 0] ])
                     
G_masked = np.ma.masked_values(G_dense, 0)
from scipy.sparse import csr_matrix

G_sparse = csr_matrix(G_dense)
print G_sparse.data

上述程序将生成以下输出。

array([2, 1, 2, 1])

这与上一个图相同，只是节点 0 和 2 由零权重的边连接。在这种情况下，上面的密集表示会导致歧义 − 如果零是一个有意义的值，那么如何表示非边。在这种情况下，必须使用掩码或稀疏表示来消除歧义。

让我们考虑以下示例。

from scipy.sparse.csgraph import csgraph_from_dense
G2_data = np.array
([
[np.inf, 2, 0 ],
[2, np.inf, np.inf],
[0, np.inf, np.inf]
])
G2_sparse = csgraph_from_dense(G2_data, null_value=np.inf)
print G2_sparse.data

上述程序将生成以下输出。

array([ 2., 0., 2., 0.])

Python 数据科学教程

Python 数据处理

Python 数据可视化

统计数据分析

Python - 图形数据

图形表示

稀疏图到底是什么？

颜色选择器

读后有收获微信请站长喝咖啡

错误报告

您的建议:

感谢您的帮助！