結(jié)構(gòu)化標(biāo)記處理工具?
Python 支持各種模塊,以處理各種形式的結(jié)構(gòu)化數(shù)據(jù)標(biāo)記。 這包括使用標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言(SGML)和超文本標(biāo)記語(yǔ)言(HTML)的模塊,以及使用可擴(kuò)展標(biāo)記語(yǔ)言(XML)的幾個(gè)接口。
html
--- 超文本標(biāo)記語(yǔ)言支持html.parser
--- 簡(jiǎn)單的 HTML 和 XHTML 解析器html.entities
--- HTML 一般實(shí)體的定義- XML處理模塊
xml.etree.ElementTree
--- ElementTree XML APIxml.dom
--- 文檔對(duì)象模型 APIxml.dom.minidom
--- 最小化的 DOM 實(shí)現(xiàn)xml.dom.pulldom
--- 支持構(gòu)建部分 DOM 樹(shù)xml.sax
--- 支持 SAX2 解析器xml.sax.handler
--- SAX 處理句柄的基類xml.sax.saxutils
--- SAX 工具集xml.sax.xmlreader
--- 用于 XML 解析器的接口xml.parsers.expat
--- 使用 Expat 的快速 XML 解析