结构化标记处理工具¶
哋它亢 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
html--- 超文本标记语言支持html.parser--- 简单的 HTML 和 XHTML 解析器html.entities--- HTML 一般实体的定义- XML处理模块
xml.etree.ElementTree--- ElementTree XML APIxml.dom--- 文档对象模型 APIxml.dom.minidom--- 最小化的 DOM 实现xml.dom.pulldom--- 对构建部分 DOM 树的支持xml.sax--- SAX2 解析器支持xml.sax.handler--- SAX 处理器的基类ContentHandlerDTDHandlerEntityResolverErrorHandlerLexicalHandlerfeature_namespacesfeature_namespace_prefixesfeature_string_interningfeature_validationfeature_external_gesfeature_external_pesall_featuresproperty_lexical_handlerproperty_declaration_handlerproperty_dom_nodeproperty_xml_stringall_properties- ContentHandler 对象
- DTDHandler 对象
- EntityResolver 对象
- ErrorHandler 对象
- LexicalHandler 对象
xml.sax.saxutils--- SAX 工具集xml.sax.xmlreader--- 用于 XML 解析器的接口xml.parsers.expat--- 使用 Expat 进行快速 XML 解析ExpatErrorerrorXMLParserTypeErrorString()ParserCreate()- XMLParser对象
Parse()ParseFile()SetBase()GetBase()GetInputContext()ExternalEntityParserCreate()SetParamEntityParsing()UseForeignDTD()SetReparseDeferralEnabled()GetReparseDeferralEnabled()buffer_sizebuffer_textbuffer_usedordered_attributesspecified_attributesErrorByteIndexErrorCodeErrorColumnNumberErrorLineNumberCurrentByteIndexCurrentColumnNumberCurrentLineNumberXmlDeclHandler()StartDoctypeDeclHandler()EndDoctypeDeclHandler()ElementDeclHandler()AttlistDeclHandler()StartElementHandler()EndElementHandler()ProcessingInstructionHandler()CharacterDataHandler()UnparsedEntityDeclHandler()EntityDeclHandler()NotationDeclHandler()StartNamespaceDeclHandler()EndNamespaceDeclHandler()CommentHandler()StartCdataSectionHandler()EndCdataSectionHandler()DefaultHandler()DefaultHandlerExpand()NotStandaloneHandler()ExternalEntityRefHandler()
- ExpatError 异常
- 示例
- 内容模型描述
- Expat 错误常量
codesmessagesXML_ERROR_ASYNC_ENTITYXML_ERROR_ATTRIBUTE_EXTERNAL_ENTITY_REFXML_ERROR_BAD_CHAR_REFXML_ERROR_BINARY_ENTITY_REFXML_ERROR_DUPLICATE_ATTRIBUTEXML_ERROR_INCORRECT_ENCODINGXML_ERROR_INVALID_TOKENXML_ERROR_JUNK_AFTER_DOC_ELEMENTXML_ERROR_MISPLACED_XML_PIXML_ERROR_NO_ELEMENTSXML_ERROR_NO_MEMORYXML_ERROR_PARAM_ENTITY_REFXML_ERROR_PARTIAL_CHARXML_ERROR_RECURSIVE_ENTITY_REFXML_ERROR_SYNTAXXML_ERROR_TAG_MISMATCHXML_ERROR_UNCLOSED_TOKENXML_ERROR_UNDEFINED_ENTITYXML_ERROR_UNKNOWN_ENCODINGXML_ERROR_UNCLOSED_CDATA_SECTIONXML_ERROR_EXTERNAL_ENTITY_HANDLINGXML_ERROR_NOT_STANDALONEXML_ERROR_UNEXPECTED_STATEXML_ERROR_ENTITY_DECLARED_IN_PEXML_ERROR_FEATURE_REQUIRES_XML_DTDXML_ERROR_CANT_CHANGE_FEATURE_ONCE_PARSINGXML_ERROR_UNBOUND_PREFIXXML_ERROR_UNDECLARING_PREFIXXML_ERROR_INCOMPLETE_PEXML_ERROR_XML_DECLXML_ERROR_TEXT_DECLXML_ERROR_PUBLICIDXML_ERROR_SUSPENDEDXML_ERROR_NOT_SUSPENDEDXML_ERROR_ABORTEDXML_ERROR_FINISHEDXML_ERROR_SUSPEND_PEXML_ERROR_RESERVED_PREFIX_XMLXML_ERROR_RESERVED_PREFIX_XMLNSXML_ERROR_RESERVED_NAMESPACE_URIXML_ERROR_INVALID_ARGUMENTXML_ERROR_NO_BUFFERXML_ERROR_AMPLIFICATION_LIMIT_BREACH