Tutorial a richiesta: gdrive, IMPORTXML e XPath

Un piccolo esempio per il monitoraggio dei contenuti di una pagina web

Il 13 gennaio del 2017 Laura Strano ha pubblicato un messaggio in cui mostrava come il Comune di Messina non adempia in modo pieno agli obblighi di pubblicazione dei curriculum e delle retribuzioni dei propri dirigenti.

Come funziona

IMPORTXML(url; query_xpath) 
  • gli URL di una sezione particolare (ad tutti quelli della classica sezione “ultime notizie”);
  • tutti i tag associati alle foto;
  • ecc..
//tbody/tr[not(descendant::td[4]//a/@href)]
  • poi tr ovvero le righe contenute;
  • poi la condizione che applica il filtro e che fa in modo che vengano selezionate soltanto quelle righe in cui la IV colonna (td in HTML) non contiene un hyperlink (quello al PDF del CV), [not(descendant::td[4]//a/@href)]
  • “descendant”, ovvero gerarchicamente discendente, ovvero figlio di tr (una riga della tabella);
  • la IV colonna “td[4]”;
  • “a”, ovvero il tag <a>, quindi gli hyperlink;
  • “@href” la proprietà href del tag <a>, quindi l’indirizzo per il download dei PDF;
=IMPORTXML("http://www.comune.messina.it/amministrazione-trasparente/personale/dirigenti.aspx","//tbody/tr[not(descendant::td[4]//a/@href)]/*[1]")

#data #maps #GIS #baci #condivisione. Orgoglioso di essere presidente di @ondatait

#data #maps #GIS #baci #condivisione. Orgoglioso di essere presidente di @ondatait