這是用Java進行XML解析的最佳庫。
實際上,Java支持4種開箱即用地解析XML的方法:
DOM解析器/構(gòu)建器:整個XML結(jié)構(gòu)都已加載到內(nèi)存中,你可以使用眾所周知的DOM方法進行處理。DOM還允許你使用Xslt轉(zhuǎn)換來寫文檔。例:
public static void parse() throws ParserConfigurationException, IOException, SAXException { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); factory.setValidating(true); factory.setIgnoringElementContentWhitespace(true); DocumentBuilder builder = factory.newDocumentBuilder(); File file = new File('test.xml'); Document doc = builder.parse(file); // Do something with the document here.}
SAX Parser:僅讀取XML文檔。Sax解析器貫穿文檔并調(diào)用用戶的回調(diào)方法。存在用于文檔的開始/結(jié)束,元素等的方法。它們是在org.xml.sax.ContentHandler中定義的,并且有一個空的幫助程序類DefaultHandler。
public static void parse() throws ParserConfigurationException, SAXException { SAXParserFactory factory = SAXParserFactory.newInstance(); factory.setValidating(true); SAXParser saxParser = factory.newSAXParser(); File file = new File('test.xml'); saxParser.parse(file, new ElementHandler()); // specify handler}
StAx讀取器/寫入器:與面向數(shù)據(jù)流的接口一起使用。程序會在準備好時要求下一個元素,就像游標/迭代器一樣。你也可以使用它創(chuàng)建文檔。閱讀文件:
public static void parse() throws XMLStreamException, IOException { try (FileInputStream fis = new FileInputStream('test.xml')) {XMLInputFactory xmlInFact = XMLInputFactory.newInstance();XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);while(reader.hasNext()) { reader.next(); // do something here} }}
撰寫文件:
public static void parse() throws XMLStreamException, IOException { try (FileOutputStream fos = new FileOutputStream('test.xml')){XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);writer.writeStartDocument();writer.writeStartElement('test');// write stuffwriter.writeEndElement(); }}
JAXB:讀取XML文檔的最新實現(xiàn):是v2中Java 6的一部分。這使我們可以序列化文檔中的Java對象。你使用一個實現(xiàn)了javax.xml.bind.Unmarshaller的接口的類來閱讀文檔(你可以從JAXBContext.newInstance中獲得一個用于該類的類)。必須使用使用的類來初始化上下文,但是你只需要指定根類,而不必擔心靜態(tài)引用的類。你可以使用注釋來指定哪些類應該是元素(@XmlRootElement),哪些字段應該是元素(@XmlElement)或?qū)傩裕ˊXmlAttribute,這真是個驚喜!)
public static void parse() throws JAXBException, IOException { try (FileInputStream adrFile = new FileInputStream('test')) {JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);Unmarshaller um = ctx.createUnmarshaller();RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile); }}
撰寫文件:
public static void parse(RootElementClass out) throws IOException, JAXBException { try (FileOutputStream adrFile = new FileOutputStream('test.xml')) {JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);Marshaller ma = ctx.createMarshaller();ma.marshal(out, adrFile); }}
從一些舊的演講幻燈片中無恥地復制了示例;-)
編輯:關(guān)于“我應該使用哪個API?”。好吧,這取決于-并非所有API都具有與你看到的功能相同的功能,但是如果你可以控制用于映射XML文檔的類,那么JAXB是我個人最喜歡的,非常優(yōu)雅和簡單的解決方案(盡管我沒有將其用于非常大的文檔,可能會有點復雜)。SAX也非常易于使用,如果你沒有充分的理由使用它,那就不要使用DOM-我認為舊的,笨拙的API。我認為沒有任何現(xiàn)代的第三方庫具有STL所缺少的任何特別有用的功能,并且標準庫具有通常的優(yōu)點,即它們經(jīng)過了嚴格的測試,記錄和穩(wěn)定。
解決方法我正在搜索Java庫以解析XML(復雜的配置和數(shù)據(jù)文件),我用Google搜索了一下,但除了dom4j之外都找不到(似乎他們正在V2上工作)。不喜歡它,其他有關(guān)XML的Apache項目似乎處于hibernate狀態(tài)。我還沒有獨自評估dom4j,只是想知道-Java是否有其他(良好)開源xml解析庫?您對dom4j的體驗如何?
在@Voo回答之后,讓我再問一個-我應該使用Java的內(nèi)置類還是諸如dom4j之類的任何第三方庫。優(yōu)點是什么?
相關(guān)文章:
1. python - 我在使用pip install -r requirements.txt下載時,為什么部分能下載,部分不能下載2. mysql - jdbc的問題3. python - 如何正則字符串中的所有漢字4. mysql - 分庫分表、分區(qū)、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處5. mysql - 如何減少使用或者不用LEFT JOIN查詢?6. python - 編碼問題求助7. 視頻文件不能播放,怎么辦?8. 圖片鏈接的地址怎么獲得的9. mysql 5個left關(guān)鍵 然后再用搜索條件 幾千條數(shù)據(jù)就會卡,如何解決呢10. python - oslo_config
