Oggi su internet troviamo una grande quantità di informazioni, così grande che si chiama big data. Il problema di avere tante informazioni però è che ci sovrastano e a quel punto non le utilizziamo più. Sappiamo invece che creare strategie di marketing data driven è fondamentale e per questo scopo esistono gli strumenti di web scraping che riescono ad estrarre i dati in modo veloce e facile.
Cos’è il web scraping:
La web scraping è l’attività che fanno i crawler (cioè robot che fanno la scansione dei siti) copiando i contenuti di un sito e incollandoli dove riteniamo opportuno (come ad esempio un file excel). Esistono diverse tipologie di estrazione dei dati e ovviamente cambiano in base al dato. Grazie agli strumenti di web scraping possiamo estratte testi, tabelle, numeri ecc.
Le Applicazioni possibili:
- estrazione di testi dai social per una sentiment analysis
- estrazione delle parole chiave per l’analisi semantica e la keyword research
- estrazione dei prezzi dei prodotti per determinare il prezzo medio di mercato
TOOLS e Software free:
Esistono tantissimi tool per estrarre dati dal web, i più famosi sono php, java, phytone, excel ,r, c# ma sono tutt’altro che facili da utilizzate. In questo articolo invece citiamo tool veramente facili ed utilizzabili da marketers.
1.Google Drive: il primo grande strumento è di google. Attraverso formule che trovate in rete potete importare nel vostro foglio di lavoro (sheet) dati, tabelle, feed e tanto altro. Di seguito le formule più utilizzate.
=importdata(” link “) copi tutti i dati in pagina
=importfeed(” link feed “) importa i feed
=importhtml(“link”; “table”) estrae la tabella dalla pagina
=importhtml(“link”; “table”; 4) estrae la tabella 4 dalla pagina
=importxml(A1, “//a/@href”) estrae i dati della pagine (link in a1) e poi dici cosa vuoi. in questo caso il link
=importxml(A1, “//a[@class=’biz-name’]””) estrae la classe a class=biz name
2.convextra.com: lo strumento che preferisco in assoluto, facilissimo da utilizzare e sulla home c’è anche un video di spiegazione che vale più di mille guide. Utilissimo per estrarre tabelle, immagini e tanto altro.
3. import.io: strumento molto potente con tipologia freemium, viene utilizzato molto dai giornalisti per importare news, articoli e tanto altro. Si possono utilizzare API’s e si possono schedulare le estrazioni.
4. Strumenti per la SEO
- scraper strumento molto utilizzato per la SEO in quanto è in grado di estrarre dati da pagine web ma anche dalle SERP di google
- http://www.scrapebox.com/ – utile per cambiare proxy, trova tutte le parole chiave con la kw selezionata. estrae anche metadata
5. Strumenti per tweetter:
- https://tags.hawksey.info/, collega doc a twitter con set up in custom tab. facile veloce e gratuito
- https://moz.com/followerwonk/ , strumento potente ma a pagamento
- http://datatoolbar.com/ tasto x e poi selezioni dati che vuoi
ALTRI tool Generici
- http://www.outwit.com/ molto utile perchè suggerisce cosa scaricare
- https://addons.mozilla.org/en-US/firefox/addon/downthemall/ che scarica anche pdf
- https://chrome.google.com/webstore/detail/scraper/nndknepjnldbdbepjfgmncbggmopgden
- IFTTT: di solito viene utilizzato per i social media in quanto costruisce delle regole come acd esempio se posti fu Facebook posta la solita cosa anche su tweetter o instagram. In questo caso possiamo costruire la ricetta in questo modo: se su ebay (etsy o instagram) compare la keyword allo esportala in google drive o dropbox