Strumenti per acquisire e convertire il Web

Come riempire un set di dati

A volte quando costruzione di un set di dati nel Raschietto Web vengono aggiunti più valori into una colonna rispetto a un'altra. Nell'esempio seguente dopo che la prima pagina è stata raschiata, il nome John viene aggiunto alla colonna Nome insieme a tre colori e nella pagina successiva viene aggiunto il nome David insieme ad altri due colori. Per fornire il seguente set di dati.

NomeColore
JohnGiallo
DavidRosso
Green
Blu
Viola

Tuttavia questa tabella è fuorviante in quanto non mostra quale nome è stato trovato con quali colori. Invece il pad Il metodo può essere utilizzato per aggiungere automaticamente celle vuote alla fine delle colonne del set di dati fino a quando tutte le colonne hanno la stessa lunghezza. Un esempio di pad il metodo in uso è mostrato di seguito.

Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad();

Queste istruzioni di raschiatura producono un set di dati che assomiglia a questo.

NomeColore
JohnGiallo
Rosso
Green
DavidBlu
Viola

Potremmo migliorare ulteriormente specificando il padValue parametro del pad metodo per essere il nome trovato dal raschietto. Come in questo esempio c'è sempre un solo nome per pagina che diventa le istruzioni di raschiatura.

var name = Page.getTagValue({"class":{"equals":"Name"}});
Data.save(name, 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad(name);

Che mette un nome in ogni cella vuota della colonna del nome come mostrato di seguito.

NomeColore
JohnGiallo
JohnRosso
JohnGreen
DavidBlu
DavidViola