In un contesto globale affollato da grandi moli di dati in continua evoluzione, l’informazione richiede strumenti adatti per essere condivisa a un pubblico sempre più ampio. L’esigenza di tradurre i fenomeni più o meno complessi attraverso forme, grafici ed infografiche trova risposta nella Data Visualization.
In quest'articolo approfondiremo la scienza della visualizzazione dei dati. Perché è importante per un'azienda saper tradurre e valorizzare i dati in un formato visivo e quali sono le tecniche e gli strumenti più adatti per farlo?
Cosa si intende per Data Visualization
La Data Visualization (visualizzazione dei dati) racchiude quindi tutte le tecniche necessarie a consegnare l’informazione all’utente finale, in maniera chiara e veritiera: sfruttando un approccio grafico, risulta più efficace la comunicazione di concetti quantitativi e qualitativi, migliorano così anche le scelte e i risultati di chi i dati li deve utilizzare.
Un’organizzazione, piccola o grande che sia, produce e ha necessità di condividere quotidianamente molti dati, sia sul passato, sia sul futuro. La Data Visualization si pone l’obiettivo di facilitare l’esplorazione di questi dati, rendendo possibile la trasformazione in informazioni di valore.
La storia della Data Visualization
La Data Visualization, così come la conosciamo oggi, è un concetto relativamente giovane, influenzato positivamente dalle tecnologie moderne. In realtà, anche nei secoli precedenti la rappresentazione di informazioni ha sempre assunto un ruolo determinante: si pensi ad esempio alle mappe per l’esplorazione e la navigazione, nate per raccontare quanto veniva scoperto a chi quella navigazione non l’aveva intrapresa.
Nelle epoche successive, l’informazione ha cominciato a essere più strutturata e certamente molto più eterogenea; nuove scienze ed esigenze hanno infatti portato a galla la necessità di nuovi strumenti: forme geometriche e nuovi grafici hanno iniziato ad essere utilizzati per rappresentare fenomeni quantitativi relativamente complessi oltre che informazioni qualitative. Dai fenomeni economici all’epidemiologia, passando per le scienze esatte, la visualizzazione dei dati ha assunto man mano un ruolo sempre più centrale.
Le tipologie di visualizzazione dei dati
La Data Visualization ormai da alcuni decenni utilizza dei grafici elementari (es. grafici a torte, istogrammi, grafici a barre) per rappresentare una o più variabili. Tuttavia, l’esplosione dei Big Data ha notoriamente comportato la raccolta di ampi volumi di dati, eterogenei per fonte e formato. Le comuni rappresentazioni, seppur sempre utili, vengono oggi affiancate da tipologie di data visualization più evolute. Una prima classificazione prende perciò in considerazione il numero di dimensioni dei dati che si va rappresentare per indicare il grado di complessità.
Una seconda distinzione può essere identificata nella fase in cui la Data Visualization viene chiamata in causa: tradizionalmente, la rappresentazione di informazioni semplici – Data visualization esplicativa – permette il racconto (storytelling) dei risultati.
Quando però i dati si trovano ad un alto livello di granularità e la complessità dei dati richiede una conoscenza profonda, le tecniche di rappresentazione possono entrare in gioco in una fase antecedente all’analisi: è il caso della Data Visualization esplorativa, mirata a sfornare alcuni grafici di partenza per identificare possibili correlazioni e distorsioni. Ne consegue che il focus si allarga dall’oggetto dell’analisi alle relazioni tra le diverse variabili. Allo stesso modo il ruolo della Data Visualization si espande: non si tratta solo di strumenti per raccontare storie, ma anche di rappresentazioni che ricercano un senso nei dati.
Tools per la Data Visualization: funzionalità e caratteristiche
Così come il concetto di Data Visualization è mutato negli anni, anche le funzionalità offerte dagli strumenti di business intelligence hanno subito una forte accelerata. Il report – definito anche basic data visualization – è generalmente un documento statico, generato periodicamente e condiviso tramite i classici strumenti di office automation.
Le maggiori richieste informative all’interno delle organizzazioni hanno indirizzato lo sviluppo di nuovi strumenti, introducendo il concetto di visual analytics e di dashboard interattive.
Possiamo identificare almeno tre rilevanti caratteristiche degli strumenti più evoluti:
- Interazione self-service: utenti non esperti nel campo dell’analisi dei dati possono importare dati e creare modelli analitici anche complessi in maniera del tutto autonoma facendo affidamento su approcci guidati e ambienti che non richiedono la conoscenza di codici specifici. Il punto di forza è la facilità con cui gli utenti possono preparare i dati con semplici drag-and-drop, creare e modificare grafici e dataset, portare alla luce insights, il tutto eliminando la scomoda dipendenza dall’IT;
- Ricerca ed esplorazione: gli strumenti di visual analytics tendono a incorporare la capacità di calcolo unendo due step fino a quel momento separati, analisi e rappresentazione. La capacità di analisi è un abilitante necessario per garantire l’interattività, viceversa, risulterebbe poco efficace il concetto di interazione self-service. Tali strumenti garantiscono generalmente analisi descrittive e predittive;
- Esperienza near real-time: gli strumenti di Visual Analytics si arricchiscono anche dell’esperienza sempre più in tempo reale, se non addirittura in streaming di ingestione, analisi e rappresentazione dati. La velocità con cui i dati circolano è sempre più rilevante, in quanto garantisce tempestività nel processo decisionale, un aspetto che la business intelligence tradizionale ha sempre faticato a garantire.
L'importanza della Data Visualization
Quali sono dunque i vantaggi per le aziende di una corretta gestione della Data Visualizion? Innanzitutto, l’utente interno (decisore aziendale o comunque impiegato in una linea di business), divenuto autonomo nell’utilizzo e nel parziale sviluppo di dashboard interattive, non solo impiega meno risorse della funzione IT, ma si avvicina a una maggiore consapevolezza e cultura del dato.
Ad un livello ancora superiore, nasce la figura del “Citizen Data Scientist” come la figura business che sa estrarre intuizioni predittive e prescrittive dai dati, senza avere profonde conoscenze tecniche.
Gli utenti che si approcciano alle analisi descrittive e predittive – tipicamente incorporate negli strumenti di Visual Analytics – registrano ulteriori benefici poiché si riducono i tempi di data preparation e esplorazione dei dati. Tale aspetto, insieme a una riduzione della dipendenza dall’IT, garantisce una maggiore efficienza dei processi decisionali: i decisori aziendali potranno fare affidamento su analisi tempestive - time-to-market minore - e personalizzabili, rappresentative di dinamiche attuali e future.
I rischi della Data Visualization
Un utilizzo maggiormente pervasivo della Data Visualization in azienda, come già illustrato, porta ad adottare un approccio di Self-Service Data Analytics, in cui l’utente di business acquista autonomia e consapevolezza nell’utilizzo dei dati. A tutto ciò si deve naturalmente contrapporre un rischio evidente, cioè la perdita del controllo sui dati: dovendo garantire l’accesso a diverse fonti dati ad una ampia platea, i rischi connessi alla privacy e alla sicurezza dei dati risulteranno maggiori. Inoltre, ogni utente potrebbe portare avanti in maniera distaccata le proprie analisi ed elaborazioni, portando ad una diminuzione della fiducia nei dati. Questo rischio non deve portare a una rinuncia ad una maggiore autonomia, ma va compreso e contenuto attraverso opportuni strumenti e procedure dedicate alla Data Governance.
Nicola Ciani, Ricercatore Osservatorio Big Data Analytics & Business Intelligence
In un contesto globale affollato da grandi moli di dati in continua evoluzione, l’informazione richiede strumenti adatti per essere condivisa a un pubblico sempre più ampio. L’esigenza di tradurre i fenomeni più o meno complessi attraverso forme, grafici ed infografiche trova risposta nella Data Visualization.
In quest'articolo approfondiremo la scienza della visualizzazione dei dati. Perché è importante per un'azienda saper tradurre e valorizzare i dati in un formato visivo e quali sono le tecniche e gli strumenti più adatti per farlo?
Cosa si intende per Data Visualization
La Data Visualization (visualizzazione dei dati) racchiude quindi tutte le tecniche necessarie a consegnare l’informazione all’utente finale, in maniera chiara e veritiera: sfruttando un approccio grafico, risulta più efficace la comunicazione di concetti quantitativi e qualitativi, migliorano così anche le scelte e i risultati di chi i dati li deve utilizzare.
Un’organizzazione, piccola o grande che sia, produce e ha necessità di condividere quotidianamente molti dati, sia sul passato, sia sul futuro. La Data Visualization si pone l’obiettivo di facilitare l’esplorazione di questi dati, rendendo possibile la trasformazione in informazioni di valore.
La storia della Data Visualization
La Data Visualization, così come la conosciamo oggi, è un concetto relativamente giovane, influenzato positivamente dalle tecnologie moderne. In realtà, anche nei secoli precedenti la rappresentazione di informazioni ha sempre assunto un ruolo determinante: si pensi ad esempio alle mappe per l’esplorazione e la navigazione, nate per raccontare quanto veniva scoperto a chi quella navigazione non l’aveva intrapresa.
Nelle epoche successive, l’informazione ha cominciato a essere più strutturata e certamente molto più eterogenea; nuove scienze ed esigenze hanno infatti portato a galla la necessità di nuovi strumenti: forme geometriche e nuovi grafici hanno iniziato ad essere utilizzati per rappresentare fenomeni quantitativi relativamente complessi oltre che informazioni qualitative. Dai fenomeni economici all’epidemiologia, passando per le scienze esatte, la visualizzazione dei dati ha assunto man mano un ruolo sempre più centrale.
Le tipologie di visualizzazione dei dati
La Data Visualization ormai da alcuni decenni utilizza dei grafici elementari (es. grafici a torte, istogrammi, grafici a barre) per rappresentare una o più variabili. Tuttavia, l’esplosione dei Big Data ha notoriamente comportato la raccolta di ampi volumi di dati, eterogenei per fonte e formato. Le comuni rappresentazioni, seppur sempre utili, vengono oggi affiancate da tipologie di data visualization più evolute. Una prima classificazione prende perciò in considerazione il numero di dimensioni dei dati che si va rappresentare per indicare il grado di complessità.
Una seconda distinzione può essere identificata nella fase in cui la Data Visualization viene chiamata in causa: tradizionalmente, la rappresentazione di informazioni semplici – Data visualization esplicativa – permette il racconto (storytelling) dei risultati.
Quando però i dati si trovano ad un alto livello di granularità e la complessità dei dati richiede una conoscenza profonda, le tecniche di rappresentazione possono entrare in gioco in una fase antecedente all’analisi: è il caso della Data Visualization esplorativa, mirata a sfornare alcuni grafici di partenza per identificare possibili correlazioni e distorsioni. Ne consegue che il focus si allarga dall’oggetto dell’analisi alle relazioni tra le diverse variabili. Allo stesso modo il ruolo della Data Visualization si espande: non si tratta solo di strumenti per raccontare storie, ma anche di rappresentazioni che ricercano un senso nei dati.
Tools per la Data Visualization: funzionalità e caratteristiche
Così come il concetto di Data Visualization è mutato negli anni, anche le funzionalità offerte dagli strumenti di business intelligence hanno subito una forte accelerata. Il report – definito anche basic data visualization – è generalmente un documento statico, generato periodicamente e condiviso tramite i classici strumenti di office automation.
Le maggiori richieste informative all’interno delle organizzazioni hanno indirizzato lo sviluppo di nuovi strumenti, introducendo il concetto di visual analytics e di dashboard interattive.
Possiamo identificare almeno tre rilevanti caratteristiche degli strumenti più evoluti:
- Interazione self-service: utenti non esperti nel campo dell’analisi dei dati possono importare dati e creare modelli analitici anche complessi in maniera del tutto autonoma facendo affidamento su approcci guidati e ambienti che non richiedono la conoscenza di codici specifici. Il punto di forza è la facilità con cui gli utenti possono preparare i dati con semplici drag-and-drop, creare e modificare grafici e dataset, portare alla luce insights, il tutto eliminando la scomoda dipendenza dall’IT;
- Ricerca ed esplorazione: gli strumenti di visual analytics tendono a incorporare la capacità di calcolo unendo due step fino a quel momento separati, analisi e rappresentazione. La capacità di analisi è un abilitante necessario per garantire l’interattività, viceversa, risulterebbe poco efficace il concetto di interazione self-service. Tali strumenti garantiscono generalmente analisi descrittive e predittive;
- Esperienza near real-time: gli strumenti di Visual Analytics si arricchiscono anche dell’esperienza sempre più in tempo reale, se non addirittura in streaming di ingestione, analisi e rappresentazione dati. La velocità con cui i dati circolano è sempre più rilevante, in quanto garantisce tempestività nel processo decisionale, un aspetto che la business intelligence tradizionale ha sempre faticato a garantire.
L'importanza della Data Visualization
Quali sono dunque i vantaggi per le aziende di una corretta gestione della Data Visualizion? Innanzitutto, l’utente interno (decisore aziendale o comunque impiegato in una linea di business), divenuto autonomo nell’utilizzo e nel parziale sviluppo di dashboard interattive, non solo impiega meno risorse della funzione IT, ma si avvicina a una maggiore consapevolezza e cultura del dato.
Ad un livello ancora superiore, nasce la figura del “Citizen Data Scientist” come la figura business che sa estrarre intuizioni predittive e prescrittive dai dati, senza avere profonde conoscenze tecniche.
Gli utenti che si approcciano alle analisi descrittive e predittive – tipicamente incorporate negli strumenti di Visual Analytics – registrano ulteriori benefici poiché si riducono i tempi di data preparation e esplorazione dei dati. Tale aspetto, insieme a una riduzione della dipendenza dall’IT, garantisce una maggiore efficienza dei processi decisionali: i decisori aziendali potranno fare affidamento su analisi tempestive - time-to-market minore - e personalizzabili, rappresentative di dinamiche attuali e future.
I rischi della Data Visualization
Un utilizzo maggiormente pervasivo della Data Visualization in azienda, come già illustrato, porta ad adottare un approccio di Self-Service Data Analytics, in cui l’utente di business acquista autonomia e consapevolezza nell’utilizzo dei dati. A tutto ciò si deve naturalmente contrapporre un rischio evidente, cioè la perdita del controllo sui dati: dovendo garantire l’accesso a diverse fonti dati ad una ampia platea, i rischi connessi alla privacy e alla sicurezza dei dati risulteranno maggiori. Inoltre, ogni utente potrebbe portare avanti in maniera distaccata le proprie analisi ed elaborazioni, portando ad una diminuzione della fiducia nei dati. Questo rischio non deve portare a una rinuncia ad una maggiore autonomia, ma va compreso e contenuto attraverso opportuni strumenti e procedure dedicate alla Data Governance.
Nicola Ciani, Ricercatore Osservatorio Big Data Analytics & Business Intelligence