09. La prima estrazione - Interfaccia avanzata | Batch Data Collector

In questo capitolo lavoreremo su una ricetta reale, dalla definizione all’estrazione.

L’obiettivo è estrarre la tabella presente in questa pagina:

Riferimento: https://www.w3schools.com/html/html_tables.asp

Ecco la sequenza delle operazioni da svolgere:

1. Lasciare aperta la finestra contenente il sito da analizzare.

2. Lanciare Free/Batch Data Collector dall’icona posta su tale finestra, cosicché il programma sia in grado di analizzarne il codice sorgente.

3. In Free/Batch Data Collector – Interfaccia Avanzata – impostare un nome per la ricetta:

4. Sulla pagina originale, cercare l’elemento padre della tabella. Il consiglio è di usare Inspect di Chrome. Ciò avviene cliccando col tasto destro sulla prima cella della tabella e scegliendo dal menù contestuale la voce Inspect.

5. Da Inspect possiamo riconoscere chiaramente che l’elemento ripetitivo è table#customers tr

6. Ovviamente le colonne figlie dell’elemento ripetitivo saranno td con Occorrenza n. (Instance n.) progressiva da 0 a 2 (trattandosi di tabella a tre colonne).

7. Per ogni colonna impostare il tipo text.

Ecco la ricetta completa:

8. E’ possibile procedere con l’applicazione agendo su Svuota ed estrai dati (Empty results and extract).

A fondo pagina il codice JSON generato e alcuni tasti di controllo. Il primo permette di esportare i dati collezionati in formato Excel.

I successivi mostrano a video i dati estratti senza passare per un foglio elettronico.

Facile e veloce, no?