Uživatelské nástroje

Nástroje pro tento web


navody:lxml

Lxml

Lxml je knihovna pro Python pro zpracování HTML a XML.

Instalace Fedora

su -c "yum install python3-lxml"

Příklady

nalezení elementů Layer v xml

from lxml import etree
 
root = etree.parse("http://adresa.net/soubor.xml").getroot()
# hledají se pouze uzly s defaultním namespace
element_name = etree.QName(root.nsmap[None], "Layer").text
# nalezení pouze podelementů rootovského uzlu
root.findall(element_name)
# nalezení všech elementů rekurzivně pomocí XPath
root.findall(".//" + element_name)

najde element meta v html, jehož atribut name má hodnotu generator

from lxml import etree
 
parser = etree.HTMLParser()
root = etree.parse(url, parser).getroot()
element = self.root.find(".//meta[@name='generator']")

načte xml z textu a vrátí obsah tagu SUB

from lxml import etree
 
def get_sub(xml_text):
    root = etree.fromstring(xml_text)
    return root.find("./SUB").text
navody/lxml.txt · Poslední úprava: 2020/11/05 11:07 autor: jules