Ieri ho assistito all’evento di #big(data)2015 di IBM ed ho avuto l’occasione di assistere in real-time alle potenzialità di Watson Analytics. La sera poi l’ho provato e vi posso confermare la sua enorme utilità e il mio stupore pensando a tutte le analisi che potrò fare in 5 minuti e con un click.
Prima di spiegare come si usa e come funziona ci tengo a ribadire che stiamo parlando di vera intelligenza artificiale. A breve capirete perchè…
COS’E’ WATSON ANALYTICS
Alla fine del 2014 IBM ha rilasciato la versione Beta di Watson Analytics, il nuovo software in cloud che permette di analizzare un enorme quantità di dati senza competenze statistiche.
Ancora oggi “democratizzazione della conoscenza” è il cavallo portante della nostra epoca, il progetto di IBM permette di creare analisi statistiche come correlazioni, regressioni, alberi decisionali e cluster senza la minima conoscenza teorica. Lo scopi di IBM infatti è quello di rendere i bigdata accessibili a tutti, anche ai managers. Inoltre lo strumento adotta una strategia di tipo freemium ovvero è gratuita fino ad un limite di 10.000 record.
COME FUNZIONA WATSON ANALYTICS
1.E’ possibile caricare i dati in modo facile e veloce. Sono supportati sia file csv che excel. Nella versione free potete caricare file con al massimo 50 colonne che pesano massimo 10 MB.
2.Sezione Explorer: in questa sezione analizzate i dati. Lo strumento vi consiglia già alcune analisi da fare (in base alle relazioni che ha trovato tra le variabili), ma la cosa sorprendente è che potete scrivere la domanda. Mi spiego meglio; potete scrivere “quale paese ha convertito di più a gennaio?” e lui vi tira fuori il report con la migliore visualizzazione possibile che risponde alla vostra domanda. Voi chiedete e lui vi da le risposte in modo semplice e bello da vedere (oltre che corretto). Ovviamente potete poi modificare visualizzazioni, colori e altro ancora per rendere i vostri report più friendly possibili. Potete poi fare “pin” e crearvi la vostra dashboard.
3. Sezione Predict: questa è la sezione più fenomenale. Riesce a calcolare le relazioni tra variabili al fine di individuare i fattori che influenzano la metrica che vi interessa. Pensate alle entrate, se vi dicesse ad esempio che sono influeunzate dall’orario del giorno che cosa fareste? Ma non è finita qui, se inserite come dati il vostro database utenti è capace di creare dei cluster (per i più tecnici usa il metodo gerarchico con visualizzazione ad albero decisionale). Insomma vi dice che le donne di 25-45 anni sono più propense ad acquistare il lunedì. Le deduzioni le lascio a voi.
4. Sezione dashboard: potete aggregare tutti i report che avete fatto e inserirli in una dashboard. Simpatico, intuitivo e di Design.
https://www.youtube.com/watch?v=_Xcmh1LQB9I
5. controllo e accuratezza statistica: lo strumento vi propone una sezione dove controllare gli errori e gli scostamenti come devianza, R ecc, calcolando anche l’affidabilità e la significatività della relazione tra variabili. Vi mette anche a disposizione una guida per avvicinarvi a questi concetti. Infine è in grado di determinare se esistono errori nel foglio o se mancano dei valori associati alle variabili.
Ovviamente dovreste provare per credere, vi link di seguito gli open-data americani per “giocare”
Pensate a questo strumento come l’inizio di un era in cui tutti possono sfruttare i dati, e pensate a cosa si potrebbe fare quando sarà in grado di fare analisi cognitive? se siete curiosi sappiate che è già iniziata la collaborazione Twitter-Watson per analizzare le reti sociali.
Sarà la fine dei data scientist? alcuni lo pensano, ma io non credo proprio. Sempre di più vedo questi anni come la rivincita dei Nerd.
VI lascio con un punto interessante: IBM per raccogliere fondi ha fatto partecipare al nostro “chi vuol esser milionario” americano. Non male davvero.