依据xml范例的划定,所谓空格是四种字符的恣意组合序列:
-----------------------
空格字符(space),对应字符值为 #x20
返回字符(Carriage Return),对应字符值为 #xD
新行字符(Newline),对应字符值为 #xA
跳格字符(Tab),对应字符值为 #x9。
xml文件的空格也会构成结点,也就是空格结点。空格结点属于笔墨结点范例。
对xml和xslt而言,空格结点会牵涉到两个议题:
-----------------------
1。在xml输入文件中决议哪些空格是主要的,xslt处置惩罚器要看见这些空格结点。而决议的密钥就是xml:space属性。
2。在xsl模板文件中决议哪些空格是主要的,xslt处置惩罚器应将它复制到结果树中,而决议的密钥就是xsl:strip-space
和xsl:preserve-space这两个敕令。
“主要和不主要的空格结点”
-----------------------
若某组件的内容只能放组件,则该组件中的空格结点就是不主要的(Insignificant);
假如某组件的内容是#PCDATA的范例,则其内的空格结点应视为主要的(Signficant)。
至于组件内容混淆了笔墨内容和组件的状况则无从评判,应视组件及其内容之语意而定。
xslt处置惩罚器接触到xml输入文件之前,会先由xml剖析器举行剖析
-----------------------
(1)xml:space属性能够转变后续接办的xml应用程序处置惩罚空格结点的形式,比方,xslt处置惩罚器就会受xml:space属性影响。
(2)xml文件中任何一列标记或内容尾端的末端的末端标记全部会换成单一新行字符(#xA)。
(3)属性值交给xml应用程序之前,xml剖析器也应当先对属性值做范例化的操纵。这是由于差别的操纵体系每一行笔墨列的末端字符有差别的组合,比方,windows体系会由返回字符呵新行字符构成末端标记,而Unix体系则仅由新行字符组
成末端标记。xml剖析器在读取xml文件以后,便先即将一切末端标记换成单一新行字符,不仅一致了差别体系间差别末端标记设想的差异性,同时也简化了后续xml应用程序的的操纵难度。如许一个处置惩罚历程称为“范例化(Normalization)”。
a,每一笔墨列的末端标记都要范例化成单一的新行字符(#xA)。
b,任何一个空格符(#x20、#xD、#xA、#x9)都应换成一个空格字符(#x20)。
c,属性值中若含有字参码,则应替代成该参考字符,比方, 会换成新行字符(#xA)。
d,属性值若含有实体参考,则应以其替代笔墨替代。
e,除此之外,任何字符都应直接放入范例化属性值中。
f,末了,假如属性范例不是CDATA,则xml剖析器应当再进一步把属性值前后的空格字符序列删除,而且属性值中心如有空格序列,也应当替代成单一空格字符。
xslt处置惩罚器把xml输入文件和xsl模板文件的构造树建好以后,会现把组件中相邻的笔墨结点兼并成单一的笔墨结点,然后再把一些笔墨结点抽掉。然则,假如笔墨结点相符以下前提之一,就会被保存下来:
-----------------------
(1)笔墨结点的父组件是空格保存组件称号集(Set Of Whitespace-preserving Element Names)中的一员。
(2)笔墨结点中至少有一个非空格符。
(3)笔墨结点的某个先人组件中有xml:space属性,其值为preserve,而且较近的先人组件中没有其他xml:space属性值为default。除此之外的笔墨结点逗会被抽掉。
对xsl模板而言,所谓的空格保存组件称号集只要一个xsl:text组件可用。xsl模板文件的空格结点都邑被删除,然则,假如空格结点出现在xsl:text组件中就会被保存下来。
以上就是说明注解xml中的空格的细致内容,更多请关注ki4网别的相干文章!