Top News

RESI S.p.A | Data Science: l’arte di valorizzare i dati

Data Science: l’arte di valorizzare i dati

La centralità dei dati diventa una priorità per tutte le aziende. Le informazioni, ormai reperibili ovunque e in ogni momento, rappresentano un bene non contabilizzabile che conferisce potere a chiunque le possegga.

La scienza dei dati è una disciplina trasversale. L’espressione Data Science si riferisce alla scienza che si occupa di manipolare dati utilizzando tecniche e metodi provenienti da discipline come l’informatica, la matematica e la statistica, per trasformare un dato in un’informazione utile per il raggiungimento di determinati obiettivi.

Si è cominciato a parlare di data science quando la mole dei dati prodotti dalla società dell’informazione ha assunto dimensioni tali da richiedere l’utilizzo di nuove tecniche e nuove metodologie di memorizzazione, elaborazione e analisi.

Big Data

L’oggetto principale della Data Science sono i big data. I big data sono ovunque e vengono generati e scambiati da dispositivi connessi e relativi software (Internet of Things). La loro importanza è associata non tanto alla loro quantità, quanto invece all’ utilizzo che ne viene fatto. Questi dati vengono gestiti in maniera tale da ricavarne informazioni che sono in grado di

  • Ridurre i costi
  • Accorciare le tempistiche
  • Sviluppare nuovi prodotti e ottimizzare le offerte
  • Prendere decisioni ponderate

Secondo alcuni dati riportati dall’ osservatorio Big Data & Business Analytics (MIP) in Italia le banche sono state il primo settore per quota di mercato analytics (28%), seguite da manifattura (24%), telco e media (14%), servizi (8%), Gdo e retail (7,5%), assicurazioni (7%), utility (6.5%), PA e sanità (5%).

L’ andamento crescente dei Big Data e il modello delle 3 V

Secondo Doug Laney il modello di crescita dei dati è tridimensionale: con il passare del tempo i dati aumentano di volume, velocità e varietà.

  • Il volume, ovvero la quantità di dati, strutturati o non strutturati, generati da sorgenti eterogenee quali database, sensori, e-mail, social media;
  • La varietà, in quanto ai dati strutturati contenuti nei database si sono aggiunte differenti tipologie di dati non strutturati o semi strutturati come testi, log di web server, immagini, video, audio, elementi di calcolo;
  • La velocità, con la quale i nuovi dati vengono generati e a cui corrispondono tempi brevi di raccolta e analisi.

Successivamente il modello di Laney è stato ridefinito con l’aggiunta di altre due variabili importanti collegate alla crescita esponenziale delle masse di dati:

  • Veridicità che serve a garantire l’affidabilità dei risultati delle analisi dei dati che sono alla base di decisioni aziendali.
  • Variabilità, ossia la grande varietà di formati e provenienza, che può comportare errori nella comprensione dei dati al momento dell’interpretazione.

“Il nuovo petrolio”, ecco come vengono definiti i Big Data per l’economia. Quest’ espressione viene utilizzata per sottolineare una fonte inestimabile di valore, che qualcuno definisce la sesta V del modello.

Per estrarre valore dai Big Data occorrono progetti impegnativi, anche economicamente, per la raccolta dei dati e la loro analisi, che è opportuno far precedere da una valutazione del valore effettivo portato al business.

Durante la pandemia la “fame di dati” è aumentata ed è per questo che sarà richiesto un cambiamento culturale in ottica data-driven.