Strumenti per acquisire e convertire il Web

Grandi miglioramenti del raschietto web per 2019

08 marzo 2019

Oltre a una riprogettazione e un sacco di correzioni di errori, abbiamo apportato notevoli miglioramenti al raschietto web di Grabz, tra cui:

  • Supportare l'estrazione di contenuti contenuti negli stili CSS
  • Ora puoi scegliere il paese dal quale viene eseguita la raschiatura. Al momento le scelte sono negli Stati Uniti o nel Regno Unito.
  • Ora puoi scegliere se rispettare le regole robots.txt o meno. Per impostazione predefinita, una raschiatura fa.
  • I dati relativi ora possono ora essere associati automaticamente, questo è utile quando si hanno dati presenti su alcuni elementi HTML ma non su altri. Associando tali elementi insieme, i valori verranno visualizzati rispetto agli elementi di dati corretti nel set di dati risultante.
  • Quando si crea un set di dati, colonne diverse possono appartenere a modelli diversi, il che significa che alcune colonne possono essere popolate da un tipo di pagina e altre colonne da diversi tipi di pagina. Un esempio di ciò potrebbe essere una pagina di elenco dei prodotti e una pagina dei dettagli del prodotto. Ciò consentirebbe di ottenere i dettagli generali dalla pagina di elenco e quindi le informazioni dettagliate dalla pagina dei dettagli del prodotto.
  • Un altro modo in cui il generatore di set di dati è stato migliorato è quello di consentire agli effetti di un'operazione, come un contenuto, inferiore a ecc. Di essere applicato a tutte o ad alcune colonne.
  • Ora ce ne sono diversi nuovi comandi disponibile dalla procedura guidata di raschiatura.
    • Elimina: ora puoi eliminare elementi, il che è utile in alcune circostanze per impedire che gli stessi elementi vengano letti più volte.
    • Scorrimento: il raschietto web ora può scorrere elementi HTML che lo supportano.
    • Passa il mouse: questo comando passa il mouse sopra un elemento specificato, che può essere utile per rivelare informazioni.
    • Impaginazione: questa è una nuova funzionalità per l'azione Clic e consente di eseguire automaticamente l'impaginazione sui collegamenti di impaginazione selezionati. Ciò significa che anche se lo scraper scatta da qualche parte nei dati impaginati, come parte dello scrape, tornerà alla pagina impaginata corrente per continuare con lo scrape.
  • La parte migliore di GrabzIt's Raschietto Web è che puoi usarlo gratuitamente ogni mese. Allora, cosa stai aspettando, provalo e ti preghiamo di restituirci qualsiasi feedback tu abbia fatto, saremmo lieti di rendere il nostro il miglior web raschietto online!

Visualizza gli ultimi post del blog