Apache Xerces - DOM 解析器概述

文档对象模型是万维网联盟 (W3C) 的官方推荐。它定义了一个接口,使程序能够访问和更新 XML 文档的样式、结构和内容。支持 DOM 的 XML 解析器会实现该接口。

何时使用?

您应该在以下情况下使用 DOM 解析器 −

  • 您需要了解很多有关文档结构的信息。

  • 您需要移动文档的各个部分(例如,您可能想要对某些元素进行排序)。

  • 您需要多次使用文档中的信息。

您会得到什么?

使用 DOM 解析器解析 XML 文档时,您会得到一个包含文档所有元素的树结构。DOM 提供了各种函数,您可以使用它们来检查文档的内容和结构。

优点

DOM 是用于操作文档结构的通用接口。它的设计目标之一是,为一个 DOM 兼容解析器编写的 Java 代码应该可以在任何其他 DOM 兼容解析器上运行而无需更改。

DOM 接口

DOM 定义了几个 Java 接口。以下是最常见的接口 −

  • Node − DOM 的基本数据类型。

  • Element − 您将处理的绝大多数对象都是元素。

  • Attr − 表示元素的属性。

  • Text − Element 或 Attr 的实际内容。

  • Document − 表示整个 XML 文档。 Document 对象通常被称为 DOM 树。

常见的 DOM 方法

使用 DOM 时,有几种经常使用的方法 −

  • Document.getDocumentElement() − 返回文档的根元素。

  • Node.getFirstChild() − 返回给定 Node 的第一个子元素。

  • Node.getLastChild() − 返回给定 Node 的最后一个子元素。

  • Node.getNextSibling() −这些方法返回给定 Node 的下一个兄弟节点。

  • Node.getPreviousSibling() − 这些方法返回给定 Node 的前一个兄弟节点。

  • Node.getAttribute(attrName) − 对于给定 Node,返回具有请求名称的属性。