arara
18-09-2007, 21:13
Sto studiando come accedere a informazioni mirate contenute in una pagina web tramite Python, quindi con PyXML e DOM.
Questo č un esempio che sto studiando, deve aprire una pagina, listare tutte le immagini e stamparne l'attributo "src", perņ si comporta in modo strano:
from xml.dom.ext.reader import HtmlLib
reader = HtmlLib.Reader()
doc_node = reader.fromUri("http://www.google.com/firefox")
images = doc_node.documentElement.getElementsByTagName("img")
for image in images:
print image.getAttribute("src")
Il metodo getAttribute("src") ritorna una stringa vuota, e il metodo hasAttribute("src") ritorna false.
Se pero effettuo questa chiamata: image.attributes.item(0).nodeValue, ritorna l'attributo src corretto...
Mi chiedo perchč getAttribute("src") non mi ritorni pure lui il valore corretto, visto che serve apposta per quello.:confused:
Questo č un esempio che sto studiando, deve aprire una pagina, listare tutte le immagini e stamparne l'attributo "src", perņ si comporta in modo strano:
from xml.dom.ext.reader import HtmlLib
reader = HtmlLib.Reader()
doc_node = reader.fromUri("http://www.google.com/firefox")
images = doc_node.documentElement.getElementsByTagName("img")
for image in images:
print image.getAttribute("src")
Il metodo getAttribute("src") ritorna una stringa vuota, e il metodo hasAttribute("src") ritorna false.
Se pero effettuo questa chiamata: image.attributes.item(0).nodeValue, ritorna l'attributo src corretto...
Mi chiedo perchč getAttribute("src") non mi ritorni pure lui il valore corretto, visto che serve apposta per quello.:confused: