Lxml je knihovna pro Python pro zpracování HTML a XML.
su -c "yum install python3-lxml"
nalezení elementů Layer
v xml
from lxml import etree root = etree.parse("http://adresa.net/soubor.xml").getroot() # hledají se pouze uzly s defaultním namespace element_name = etree.QName(root.nsmap[None], "Layer").text # nalezení pouze podelementů rootovského uzlu root.findall(element_name) # nalezení všech elementů rekurzivně pomocí XPath root.findall(".//" + element_name)
najde element meta
v html, jehož atribut name
má hodnotu generator
from lxml import etree parser = etree.HTMLParser() root = etree.parse(url, parser).getroot() element = self.root.find(".//meta[@name='generator']")
načte xml z textu a vrátí obsah tagu SUB
from lxml import etree def get_sub(xml_text): root = etree.fromstring(xml_text) return root.find("./SUB").text