图形的应用、优点和缺点

data structurec++programming

图形用于不同的学科。它们在生物学中用于表示基因相互作用,在交通运输中用于路线优化,在社交网络中用于用户连接分析。复杂关系的视觉表示和查看模式和趋势的能力是图形的两个优点。然而,处理大型数据集会使图形变得庞大且难以理解。此外,创建图形需要时间并且需要知识。尽管存在这些缺点,但图表仍然是跨学科进行数据分析和决策的有效工具。

使用的方法

  • 集合表示

  • 链接表示

  • 顺序表示

集合表示

图中的每个顶点都与一个集合相关联,该集合包含其周围的顶点,这些顶点位于图的集合表示中。在此方法中,图的边存储在邻接集或包含集合的哈希表中。每个顶点的集合保证没有任何相邻顶点是重复的,并且它有效地管理稀疏图。与其他表示相比,它更容易添加和删除边,并且内存利用率降低。当处理具有不同连接程度的网络时,此技术非常有用,因为它可以实现有效的操作,例如检查边和遍历附近的顶点。

  • 邻接集:在图的集合表示中,邻接集使用集合来记录每个顶点的邻居,从而防止重复并促进有效处理边。

  • 哈希表:哈希表用于图的集合表示中,将每个顶点与包含其相邻顶点的集合链接起来。

算法

  • 图顶点应该由类或数据结构表示。每个顶点对象都需要有一个集合来包含其相邻顶点以及 ID 或标签。

  • 创建一个空的存储空间来保存图的顶点(例如数组、向量或哈希表)。

  • 对于图中的每个顶点:

    为图中的每个顶点创建一个具有指定 ID 或标签的新顶点对象。

    将其旁边的顶点添加到邻接集中。

  • 使用以下技术在顶点之间添加边:

    收集源和目标顶点的顶点对象。

    将目标顶点包含在源顶点的邻接集中。

  • 实施以下边移除技术:

    收集源顶点和目标顶点的顶点对象。

    从源顶点的邻接集中消除目标顶点。

  • 实现图形操作所需的其他技术,例如确定边是否存在以及获取顶点的邻居。

示例

#include <iostream>
#include <unordered_map>
#include <unordered_set>

class Graph {
private:
    std::unordered_map<int, std::unordered_set<int>> adjacencySets;

public:
    void addEdge(int source, int destination) {
        adjacencySets[source].insert(destination);
        adjacencySets[destination].insert(source); // 如果图是无向的,则添加两条边
    }

    void removeEdge(int source, int destination) {
        adjacencySets[source].erase(destination);
        adjacencySets[destination].erase(source); // 如果图是无向的,则删除两条边
    }

    void printNeighbors(int vertex) {
        std::cout << "Neighbors of vertex " << vertex << ": ";
        for (int neighbor : adjacencySets[vertex]) {
            std::cout << neighbor << " ";
        }
        std::cout << std::endl;
    }
};

int main() {
    Graph graph;

    graph.addEdge(1, 2);
    graph.addEdge(1, 3);
    graph.addEdge(2, 3);
    graph.addEdge(3, 4);
    graph.addEdge(4, 5);

    graph.printNeighbors(1);
    graph.printNeighbors(3);

    graph.removeEdge(2, 3);

    graph.printNeighbors(1);
    graph.printNeighbors(3);

    return 0;
}

输出

Neighbors of vertex 1: 3 2 
Neighbors of vertex 3: 4 2 1 
Neighbors of vertex 1: 3 2 
Neighbors of vertex 3: 4 1

链接表示

每个顶点都表示为图的链接表示中的链接列表中的节点。图的结构由这些节点形成,这些节点通过指针或引用相互连接并保存有关顶点的数据。每个节点还有一个链接列表或其他动态数据结构,用于存储边的相邻顶点。此方法有效地描绘了具有各种连通性级别的稀疏图。它支持动态图架构并允许简单的边添加和删除。但是,与其他表示相比,它的内存负担可能会稍大一些。当内存灵活性和效率是首要考虑因素时,使用链接表示法是有利的。

算法

  • 在树中找到与顶点 1 对应的图形节点。

  • 如果无法找到节点,则为顶点 1 创建一个新节点并将其添加到图形中。

  • 在图形中,找到与顶点 2 对应的节点。

  • 如果无法找到节点,则为顶点 2 创建一个新节点并将其添加到图形中。

  • 要指示边,请将顶点 2 添加到与顶点 1 对应的节点的链接列表中。

  • 在无向图中,在链接列表中将顶点 1 链接到顶点 2。

示例

#include <iostream>
#include <unordered_map>
#include <list>

void AddEdge(std::unordered_map<int, std::list<int>>& graph, int vertex1, int vertex2) {
    graph[vertex1].push_back(vertex2);
    graph[vertex2].push_back(vertex1);
}

int main() {
    std::unordered_map<int, std::list<int>> graph;

    AddEdge(graph, 1, 2);
    AddEdge(graph, 1, 3);
    AddEdge(graph, 2, 3);

    for (const auto& entry : graph) {
        std::cout << "Vertex " << entry.first << " is connected to: ";
        for (int neighbor : entry.second) {
            std::cout << neighbor << " ";
        }
        std::cout << std::endl;
    }

    return 0;
}

输出

Vertex 3 is connected to: 1 2 
Vertex 2 is connected to: 1 3 
Vertex 1 is connected to: 2 3 

应用

  • 图表用于模拟社交媒体平台上的用户连接,允许调查社交互动和识别社区。

  • 图表在路线优化、最短路径计算和有效交通网络的设计中很有用。

  • 网络的拓扑结构由图表表示,这有助于网络设计、分析和故障排除。

  • 图表模拟代谢途径、蛋白质相互作用和基因连接,以帮助研究生物系统。

  • 图表用于推荐引擎,根据用户偏好和项目关系推荐商品、电影或其他材料。

  • 它们通过构造和连接信息来实现智能搜索和问答系统。

  • 欺诈检测、风险评估和投资组合优化都使用图表。

  • 基于图表的技术用于解决包括链接预测、分类和分组在内的问题。

  • 图表使人们更容易理解物联网设备与数据流之间的联系,从而促进物联网应用中的分析。

  • 图表支持药物相互作用、患者监测和疾病建模方面的医学研究,从而提高医疗保健洞察力。

优势

  • 图表提供了简单易懂的数据可视化表示,使复杂的联系和关系更容易理解。

  • 图表使模式识别、趋势分析和异常检测成为可能,从而提高了决策和解决问题的能力。

  • 为了高效地处理和解释数据,图表描绘了各种数据结构,准确模拟复杂的现实世界

  • 在数据库中处理互连数据时,基于图的拓扑结构使数据检索和遍历成为可能。

  • 图经常用于社交网络分析,以理解社交互动并精确定位突出的节点或用户。

  • 图对于确定运输和物流中地点之间最快或最有效的路线非常有用。

  • 图驱动推荐引擎,根据用户行为和偏好为商品、服务或信息提供推荐。

  • 图可以分层表示知识和信息,这使得它们在人工智能和语义网应用中很有用。

  • 在结构化数据中,使用基于图的机器学习技术执行聚类、分类和链接预测等任务。

  • 找到最佳匹配或有效地安排工作只是众多任务中的两个例子图形算法可能会有所帮助的挑战。

缺点

  • 当处理大量数据集或存在大量节点和边时,图会变得难以管理和复杂。由于这种复杂性,可能很难充分分析和理解数据。

  • 存储图会消耗大量内存,尤其是对于具有大量节点和边的密集图。随着图变大,内存使用可能成为一个问题。

  • 例如,在巨大的图中寻找最短路径可能是一项耗时且计算密集型的任务。这可能会导致性能问题,尤其是在实时应用中。

  • 图可以具有多种结构,其中一些节点的连接明显多于其他节点。由于这种不一致性,使用常用技术或从数据中得出有用的推论可能会很困难。

  • 使用高维图形时,可视化复杂的图形可能具有挑战性,并且不一定能清晰地表示底层数据。

  • 缺失或不正确的数据可能会导致图形不一致,从而影响分析的质量和可靠性。

结论

图形非常灵活,经常用于各种学科,例如生物学、交通运输和社交网络。它们是数据分析的有用工具,因为它们可以可视化复杂的关系并可以找到模式。但是,处理大型数据集会变得复杂,需要更多内存。此外,创建图形需要时间并且需要知识。尽管存在这些缺点,但图形仍然是解决问题和决策的有用工具。通过利用适当的表示形式(例如集合和链接表示形式)并实践有效的算法,图表可以继续在多个学科的各种应用中提供有用的见解和支持。


相关文章