1、将全部XML文件一次性读入内存
2、将全部XML看作一棵树
3、XML中的每个标签,属性,文本都看作是树上的一个结点
4、然后可以对结点举行增编削查的操纵
话不多说,上代码。
1、起首我在D:\ABC中新建了一个文本文件,重命名为stus.xml,以下是文件中的内容
<?xml version = "1.0" encoding = "GBK" ?> <stus class = "S160401A"> <stu num = "001" > <name>张三</name> <age>20</age> <sex>男</sex> </stu> <stu num = "002"> <name>李四</name> <age>21</age> <sex>女</sex> </stu> <stu num = "003"> <name>王五</name> <age>22</age> <sex>男</sex> </stu> </stus>
在第一行是XML声明<?xml version="1.0" encoding="GBK" ?>,version示意版本号,encoding示意编码体式格局,微软的记事本用的是国标的编码体式格局,假如要用UTF-8,则要在另存为窗口中修正编码体式格局为UTF-8。
必需且只能有一对根标签,我写的根标签是<stus></stus>。其他的就不多说了。
2、这是一个门生类,定义了一些属性和get、set要领
<span style="font-size: 16px;">public class Student { public static String Class; private String name; private int num; private int age; private char sex; public String getName() { return name; } public void setName(String name) { this.name = name; } public int getNum() { return num; } public void setNum(int num) { this.num = num; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } public char getSex() { return sex; } public void setSex(char sex) { this.sex = sex; } }</span>
3、这是用DOM剖析的类,看这个类之前还要相识一下。
DocumentBuilderFactory DOM剖析器工场
DocumentBuilder DOM剖析器
Document 文档对象
Node 结点【接口】
Element 元素结点【标签结点】
Attr 属性结点
Text 文本结点
Node 是Document,Element,Attr,Text的父接口
NodeList 结点列表
NamedNodeMap 一个结点的一切属性
<span style="font-size: 16px;">import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Attr; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import bean.Student; public class DOMParser { public static void main(String[] args) throws Exception { // 取得剖析器工场对象 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); // 生产一个剖析器对象 DocumentBuilder builder = factory.newDocumentBuilder(); // 最先剖析XML文件,取得剖析的效果,是一个Document对象 // Document对象叫做文档树对象 Document dom = builder.parse("D:\\ABC\\stus.xml"); // 经由过程Document对象提取数据 // Document对象的第一个子节点是根节点[根标签] Node root = dom.getFirstChild(); // 取得标签的名字 String str = root.getNodeName(); // 取得根节点的属性 NamedNodeMap attrs = root.getAttributes(); // 强转成Attr范例 属性类 Attr attr = (Attr) attrs.getNamedItem("class"); // 取得属性里的值 String v = attr.getValue(); System.out.println(v); // 取得一切的门生------------------------------------- NodeList list = root.getChildNodes(); for (int i = 0; i < list.getLength(); i++) { Node node = list.item(i); // 推断是不是是标签结点 if (node instanceof Element) { Element e = (Element) node; // 取得标签结点里属性的值 String num = e.getAttribute("num"); System.out.println(num); // 输出标签中的文本 // System.out.println(e.getTextContent()); // 继承取得stu的子节点 NodeList nodeList = e.getChildNodes(); for (int j = 0; j < nodeList.getLength(); j++) { Node n = nodeList.item(j); if (n instanceof Element) { Element ele = (Element) n; // 取得元素结点的标签名字 String nodeName = ele.getNodeName(); // 取得元素结点标签中的文本 String value = ele.getTextContent(); if (nodeName.equals("name")) { System.out.println("姓名:" + value); } else if (nodeName.equals("age")) { System.out.println("岁数:" + value); } else if (nodeName.equals("sex")) { System.out.println("性别:" + value); } } } } } } }</span>
本身在个中总结了一些要领:
DocumentBuilderFactory类:
public static DocumentBuilderFactory newInstance(); //取得剖析器工场对象 public abstract DocumentBuilder newDocumentBuilder(); //生产一个剖析器对象
DocumentBuilder类:
public Document parse(String uri); //剖析途径为uri的XML文件,取得剖析的效果是一个Document对象
Node类:
public Node getFirstChild(); //取得Document对象的第一个子结点,也就是根结点、或许叫根标签,在上面的代码中取得的是stus,看上面的第1点中的XML文件的内容。 public NamedNodeMap getAttributes();//取得结点的属性 public NodeList getChildNodes();//取得一切子结点 public String getNodeName();//取得标签的名字 public String getTextContent() throws DOMException;//取得标签结点中的文本
NamedNodeMap类:
public Node getNamedItem(String name);//返回一切名字为name的结点
Attr类:
public String getValue();//取得属性里的值
NodeList类:
public Node item(int index);//返回第index个结点
Element类:
public String getAttribute(String name);//取得标签结点里属性name的值
以上就是详解XML- JAXP手艺-DOM剖析的细致内容,更多请关注ki4网别的相干文章!