编码
编码就是转换 Unicode 字符为等价二进制示意的历程。XML 处置惩罚递次读取一个 XML 文档时,它依赖于编码范例来编码文档。因而,我们须要在 XML 声明中指定编码范例。
编码范例
重要有两种范例的编码:
UTF-8
UTF-16
UTF 示意 UCS 转换花样,而 UCS 自身的意义是通用字符集。编号 8 或许 16 示意显现字符的比特数。它们是 8(一个字节)或许 16(两个字节)。关于没有编码信息的文档,默许运用 UTF-8。
语法
编码信息包括在 XML 文档的序文部份。UTF-8 编码的语法以下:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
UTF-16 编码语法以下:
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
示例
下面的例子展现了编码声明:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </contact-info>
在上面的 encoding="UTF-8" 示例中,指定运用 8 位示意字符。要运用 16 为示意字符,能够运用 UTF-16 编码。
运用 UTF-8 编码的 XML 文件尺寸比 UTF-16 花样的文件更小。
考证
考证 就是对 XML 文档举行考证的历程。假如文档内容与元素,属性和关联的文档范例定义(DTD)婚配,以及文档相符b表达的束缚则该文档被认为是有用的。经由过程 XML 解析器处置惩罚考证的体式格局有两种。分别是:
花样优越的 XML 文档
有用的 XML 文档
花样优越的 XML 文档
假如 XML 文档恪守以下划定规矩则被认为是花样优越的。
没有 DTD 的 XML 文档必需运用预定义的字符实体处置惩罚 amp(&),apos(单引号),g(>),quot(双引号)。
必需遵照标签的递次,比方内部标签必需在外部标签闭合之前闭合。
每一个最先标签必需都有一个完毕标签或许必需是一个自闭合标签(<title>...</title> 或许 <title />)。
在最先标签中必需只能有一个属性,而且须要运用引号包裹。
除了amp(&),apos(单引号),g(>),quot(双引号)实体以外其他的必需先声明再运用。
示例
下面是一个花样优越的 XML 文档示例:
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE address [ <!ELEMENT address (name,company,phone)> <!ELEMENT name (#PCDATA)> <!ELEMENT company (#PCDATA)> <!ELEMENT phone (#PCDATA)> ]> <address> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </address>
上面的示例被认为是花样优越的,由于:
它定义了文档范例。而且这里文档范例是元素范例。
包括一个名为 address 的根元素。
每一个子元素 name,company 和 phone 都是一个自诠释准确闭合的标签。
标签的递次准确。
以上就是细致引见XML代码编写的编码与考证题目的细致内容,更多请关注ki4网别的相干文章!