为了让你的解析器可以邃晓这些字符,你必需在XML文档中统一的字符编码规范。
--------------------------------------------------------------------------------
Windows 95/98 记事本
Windows 95/98 记事本不能以Unicode的编码花样保留文件。
可以运用记事原本编辑和保留包括了外文字符的XML文档 (比方:挪威语或许法语或许中文)
<?xml version="1.0"?> <note> <from>小奀</from> <to>小林</to> <message>晚上一同去火锅呀</message> </note>
然则假如你用阅读器翻开这个用记事本编辑过的XML文档,将会涌现一个毛病。
--------------------------------------------------------------------------------
在Windows 95/98 记事本中运用编码
Windows 95/98 记事本编辑XML文件必需举行编码属性设置。
为了防止发作毛病,可以在XML文档声明中加上一个encoding属性,指明此XML文档的编码范例,然则不要运用Unicode编码。
下面的编码范例不会致使毛病,, 而且汉字显现一般:
<?xml version="1.0" encoding="gb2312"?>
下面的编码范例不会致使毛病,, 而且汉字显现一般:
<?xml version="1.0" encoding="gbk"?>
下面的编码范例不会致使毛病,, 而且汉字显现不一般(乱码):
<?xml version="1.0" encoding="windows-1252"?>
下面的编码范例不会致使毛病,, 而且汉字显现不一般(乱码):
<?xml version="1.0" encoding="ISO-8859-1"?>
下面的编码范例不会致使毛病,,而且汉字显现一般:
<?xml version="1.0" encoding="UTF-8"?>
下面的编码范例会致使毛病,:
<?xml version="1.0" encoding="UTF-16"?>
--------------------------------------------------------------------------------
运用Windows 2000 记事本
Windows 2000 记事本可以以Unicode编码花样保留文件。
Windows 2000 的记事本支撑Unicode字符集。假如运用Win2000的记事本以Unicode的编码花样保留XML文档(请注意这里在XML声明中没有编码信息):
<?xml version="1.0"?> <note><from>小奀</from><to>小林</to><message>晚上一同去火锅呀</message></note>
--------------------------------------------------------------------------------
Windows 2000 记事本编码
Windows 2000记事本还可以以"UTF-16"编码花样保留文件。
假如你在XML文档中声清楚明了编码属性而又以Unicode编码花样保留文件,将可能发作毛病。
下面的代码将会致使毛病:
<?xml version="1.0" encoding="windows-1252"?>
下面的代码将会致使毛病:
<?xml version="1.0" encoding="ISO-8859-1"?>
下面的代码将会致使毛病:
<?xml version="1.0" encoding="UTF-8"?>
下面这个文件; note_encode_utf16_u.xml, 将会在IE5.0+中显现一般,在网景Netscape 6.2阅读器中将会涌现毛病。
<?xml version="1.0" encoding="UTF-16"?>
------------------------------------------------------------------------------
毛病信息
当时用IE5.0或许更高版本阅读XML文档时,可能会碰到两中差别的编码毛病:
在文本内容中发明一个不法字符(An invalid character was found in text content)。
假如你的XML文档和你的XML文档的编码花样不婚配就可能致使毛病发作。一般状况是,XML文档包括一些“非英文”字符,而且运用了单字节编码的编辑器,而且没有在XML文档的声明中设置XML文档的编码花样。
不支撑从当前的编码花样转换成另一种编码花样(Switch from current encoding to specified encoding not supported)。
假如XML文档以Unicode/UTF-16编码花样保留,然则XML文档的声明中却设置了编码花样是一些单字节的编码(比方 Windows-1252, ISO-8859-1 或许 UTF-8);或许XML文档以单字节编码花样保留,然则XML文档的声明中却设置了编码花样是一些Unicode/UTF-16的编码情势,如许两种状况都邑致使毛病发作。
--------------------------------------------------------------------------------
结论
结论:在保留XML文档之前在XML文档的声明中设置文档的编码花样,我的一些关于防止毛病发作的发起:
运用一种支撑Unicode编码花样的编辑器。
确信你晓得本身正在运用那种编码花样。
在XML文档中运用属性声明设置编码花样。
以上就是xml文件怎样编辑的概况引见的细致内容,更多请关注ki4网别的相干文章!