Top News
DATA SCIENCE: L'ARTE DI VALORIZZARE I DATI
La centralità dei dati diventa una priorità per tutte le aziende. Le informazioni, ormai reperibili ovunque e in ogni momento, rappresentano un bene non contabilizzabile che conferisce potere a chiunque le possegga.
La scienza dei dati è una disciplina trasversale. L’espressione Data Science si riferisce alla scienza che si occupa di manipolare dati utilizzando tecniche e metodi provenienti da discipline come l’informatica, la matematica e la statistica, per trasformare un dato in un’informazione utile per il raggiungimento di determinati obiettivi.
Si è cominciato a parlare di data science quando la mole dei dati prodotti dalla società dell’informazione ha assunto dimensioni tali da richiedere l’utilizzo di nuove tecniche e nuove metodologie di memorizzazione, elaborazione e analisi.
Big Data
L’oggetto principale della Data Science sono i big data. I big data sono ovunque e vengono generati e scambiati da dispositivi connessi e relativi software (Internet of Things). La loro importanza è associata non tanto alla loro quantità, quanto invece all’ utilizzo che ne viene fatto. Questi dati vengono gestiti in maniera tale da ricavarne informazioni che sono in grado di
- Ridurre i costi
- Accorciare le tempistiche
- Sviluppare nuovi prodotti e ottimizzare le offerte
- Prendere decisioni ponderate
Secondo alcuni dati riportati dall’ osservatorio Big Data & Business Analytics (MIP) in Italia le banche sono state il primo settore per quota di mercato analytics (28%), seguite da manifattura (24%), telco e media (14%), servizi (8%), Gdo e retail (7,5%), assicurazioni (7%), utility (6.5%), PA e sanità (5%).
L’ andamento crescente dei Big Data e il modello delle 3 V
Secondo Doug Laney il modello di crescita dei dati è tridimensionale: con il passare del tempo i dati aumentano di volume, velocità e varietà.
- Il volume, ovvero la quantità di dati, strutturati o non strutturati, generati da sorgenti eterogenee quali database, sensori, e-mail, social media;
- La varietà, in quanto ai dati strutturati contenuti nei database si sono aggiunte differenti tipologie di dati non strutturati o semi strutturati come testi, log di web server, immagini, video, audio, elementi di calcolo;
- La velocità, con la quale i nuovi dati vengono generati e a cui corrispondono tempi brevi di raccolta e analisi.
Successivamente il modello di Laney è stato ridefinito con l’aggiunta di altre due variabili importanti collegate alla crescita esponenziale delle masse di dati:
- Veridicità che serve a garantire l’affidabilità dei risultati delle analisi dei dati che sono alla base di decisioni aziendali.
- Variabilità, ossia la grande varietà di formati e provenienza, che può comportare errori nella comprensione dei dati al momento dell’interpretazione.
“Il nuovo petrolio”, ecco come vengono definiti i Big Data per l’economia. Quest’ espressione viene utilizzata per sottolineare una fonte inestimabile di valore, che qualcuno definisce la sesta V del modello.
Per estrarre valore dai Big Data occorrono progetti impegnativi, anche economicamente, per la raccolta dei dati e la loro analisi, che è opportuno far precedere da una valutazione del valore effettivo portato al business.
Durante la pandemia la “fame di dati” è aumentata ed è per questo che sarà richiesto un cambiamento culturale in ottica data-driven.