DTD XML 构建模块
XML和HTML文档的主要构建模块是元素。
XML文档的构建模块
从DTD的角度来看,所有XML文档都由以下构建模块组成:
- 元素
- 属性
- 实体
- PCDATA
- CDATA
元素
元素是XML和HTML文档的主要构建模块。
HTML元素的例子有"body"和"table"。XML元素的实例可以是"note"和"message"。元素可以包含文本、其他元素或为空。空HTML元素的例子有"hr"、"br"和"img"。
实例:
<body>some text</body>
<message>some text</message>
属性
属性提供有关元素的额外信息。
属性总是放在元素的开始标记内。属性总是以名称/值对的形式出现。以下是"img"元素具有有关源文件的其他信息:
<img src="computer.gif" />
元素的名称是 "img"。 属性的名称是 "src"。 该属性的值为 "computer.gif"。由于元素本身为空,因此由 " /" 关闭。
实体
有些字符在XML中有特殊的含义,比如定义XML标记开头的小于号(<)。
大多数人都知道HTML实体:" "。这个"no-breaking-space"实体在HTML中用于在文档中插入额外的空格。当XML解析器解析文档时,实体被展开。
以下实体是用XML预定义的:
实体引用 | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA 表示已解析的字符数据。
将字符数据视为在XML元素的开始标记和结束标记之间找到的文本。
PCDATA是将由解析器解析的文本. 解析器将检查文本中的实体和标记.
文本中的标记将被视为标记,实体将被展开.
但是,解析的字符数据不应包含任何&, <, or >字符;这些需要由& < and >实体。
CDATA
CDATA表示字符数据。
CDATA是解析器不会解析的文本. 文本中的标记不会被视为标记,实体也不会展开。