Civic Hacking a base di dati

Il tema dei dati, come sa chi mi conosce o chi ha già letto qualcuno dei miei articoli, è un tema sul quale nutro molto interesse ed in questo articolo voglio parlarti di un progetto di hacking civico (o civic hacking) basato sui dati.

Premessa: (per me) i dati non sono una religione

In ambito marketing, trovo che i dati siano quell’elemento di concretezza che permette un linguaggio chiaro e pragmatico all’interno delle aziende, anche quelle più tradizionali.

Il professor Harari nel suo bellissimo Homo Deus, ci parla del dataismo: la religione della Silicon Valley, basata su Big Data e Intelligenza Artificiale.

Risultati immagini per harari
Yuval Noah Harari durante il suo TED talk “come si spiega l’ascesa dell’uomo?

Personalmente sono abbastanza lontano da questo estremismo. Credo che i dati siano sì importanti, ma il contributo umano resterà fondamentale, anche con l’avvento sempre più preponderante dell’intelligenza artificiale all’interno della nostra società.

Se ti interessa, ho scritto un articolo+video sull’etica e gli impatti futuri dell’intelligenza artificiale.

Smart citizen: questione di mentalità

Se da un lato i dati non dovrebbero costituire l’unico elemento di decisione, dall’altro non dobbiamo nemmeno dimenticarcene. Non dobbiamo ignorarli o prendere decisioni basate solamente sulle nostre sensazioni.

Sì, possono essere difficili da maneggiare e da interpretare e talvolta possono portare ad errori anche gravi se utilizzati in modo improprio (non sono i dati a produrre gli errori, ma la loro interpretazione).
Alla fine di questo articolo ti riporto un esempio di come un errore di interpretazione avrebbe potuto invertire le sorti della seconda guerra mondiale.

Tuttavia, è fondamentale cambiare approccio nei confronti dei dati. Cambiare mentalità ed atteggiamento.

Dai comuni cittadini, che diventerebbero smart citizen, agli imprenditori, chiunque non abbia dimestichezza con i dati, dovrebbe sforzarsi quantomeno a cercarli e a provare ad utilizzarli.

Gli esperti invece, i data scientist, ma anche gli operatori di marketing, devono impegnarsi a semplificare la comunicazione, senza appiattire la complessità.

Fenomeni complessi, restano fenomeni complessi. Ma questo non vuol dire che non si possano provare a spiegare con maggiore semplicità.

Il percorso che porta un utente dall’incontro con un brand ad un acquisto non è praticamente mai fatto da un clic su un banner pubblicitario.

Questo percorso è nella maggior parte dei casi, lungo, complesso, frastagliato e certamente non lineare.

Ma questo non ha impedito al marketing di trovare concetti e modelli utili alla gestione di questa complessità, come ad esempio il concetto di funnel marketing.

La rappresentazione efficace dei dati

In modo analogo le leggi del governo che regolano il bilancio di uno stato, i flussi migratori, la sicurezza del paese e in generale i fenomeni sociali, sono fenomeni complessi che non si possono banalizzare, ma che tuttavia vanno spiegati con il supporto di dati oggettivi.

Dati oggettivi che mettono quantomeno alcuni paletti alla discussione.

Perchè no, alcuni fenomeni sono e restano talmente complessi che i dati non ne permettono comunque il controllo. Ma permettono (o permetterebbero se li si utilizzasse) quantomeno di evitare la banalizzazione di questi fenomeni.

È in questo contesto che voglio parlarti di un progetto che ho scoperto da poco e che soddisfa a mio parere le premesse di cui sopra: dati utilizzati per descrivere fenomeni complessi in modo semplice.

E soprattutto, rappresentazioni efficaci di questi dati. Rappresentazioni efficaci grazie a quella disciplina chiamata data visualization che permette di maneggiare con una certa semplicità informazioni complesse.

Ecco ad esempio come, partendo da un grafico a barre, sia possibile rappresentare in maniera molto comprensibile, l‘invecchiamento della popolazione italiana.

Vedi la “pancia” del grafico qui sotto che si sposta verso l’alto?

Quel movimento rappresenta esattamente questo fenomeno.

La parte più ampia della popolazione (la zona più larga del grafico) che diventa la più vecchia (si sposta verso l’alto).

Civic Hacking e g0v.it

L’hacking civile è un movimento che vede impegnati studenti, professionisti e semplici appassionati con competenze informatiche, al fine di risolvere un problema comune.

In tal senso il progetto g0v.it (si legge “gov zero.it”) si configura proprio come un progetto di civic hacking con il quale ci si impegna a “sostenere la trasparenza delle informazioni ed a costruire soluzioni tecnologiche per il miglioramento della partecipazione e dell’informazione dei cittadini“.

Il progetto è open source ed il codice è completamente disponibile su GitHub.

Attualmente il progetto g0v.it è composto da 4 applicazioni disponibili online.

La prima, offre la possibilità di esplorare i dati che ti ho presentato prima (la piramide dell’età della popolazione italiana), in modo interattivo: https://fsbolgi.github.io/Sciviz/homepage.html

È disponibile poi una rappresentazione dell’ultimo bilancio finanziaro consolidato dell’Istituto Nazionale di Previdenza Sociale (INPS): https://inps.g0v.it/.

Ci sono poi altri due progetti di cui ti parlo un po’ più in dettaglio.

Politica in TV

Chi ha avuto più spazio in TV? Chi ha potuto parlare di più? Ecco un esempio, che potrei definire “pop“, di civic hacking. Una rappresentazione davvero efficace dello spazio riservato ai principali politici italiani in TV (RAI, Mediaset, Sky, La7) nell’arco di una settimana, dal 13 al 19 maggio 2019; ad una settimana dalle elezioni europee.

Ecco la rappresentazione dei primi 8 politici

Ed ecco quella dei primi 8 partiti, aggregando i dati dei singoli esponenti

Tutti i dati sono disponibili e navigabili interattivamente a questo indirizzo https://agcom.g0v.it/

Legge di bilancio 2020

Infine, altro progetto interessante, la rappresentazione della distribuzione dei costi del disegno di legge di bilancio 2020 (presentato in senato il 2 novembre 2019).

Ecco come gli oltre 896 mila milioni di euro (896.894 milioni per la precisione, quasi un milione di milioni o mille miliardi di euro) vengono suddivisi tra i ministeri. In figura sono presenti solo i primi 8 ministeri.

Quasi mille miliardi di euro

1.000.000.000.000 euro

l’ammontare della legge di bilancio 2020. riesci ad immaginarli?

Ogni cerchio rappresenta una missione ed il colore indica la variazione rispetto all’anno precedente, secondo la scala dell’immagine qui sotto.

Ecco quindi che, ad esempio, con questo strumento è possibile evidenziare quanto viene riservato ad un tema molto sentito in questo periodo, come l’immigrazione. Sullo sfondo si può vedere l’intero valore della legge di bilancio ed in primo piano le due missioni relative all’immigrazione.

Per quanto piccoli, i colori dei due cerchi indicano un sostanziale consolidamento di una delle due voci (-0,07%) ed un aumento dell’altra (+17,89%) rispetto all’anno precedente (rispetto quindi al Governo Conte I).

Riesci a capire quanto sia ampio lo scostamento tra lo spazio che questa tematica trova nel dibattito pubblico (società civile, tv, radio, giornali, piazze… se ne parla ovunque costantemente) e il reale impatto che ha su tutti noi? (lo 0,023% di tutto il budget… ed ho incluso entrambe le voci).
È come se una persona con uno stipendio di 1.000€ al mese, destinasse 23 centesimi di euro (0,23€) alla propria sicurezza.
Tu percepisci questo valore dalle attuali discussioni della politica su questo tema?

Qui gioca un ruolo fondamentale l’euristica della disponibilità, fenomeno che ti suggerisco di approfondire, anche per comprendere alcuni atteggiamenti dei politici.

In evidenza, quei due piccoli cerchietti, sono appunto il budget riservato all’ordine pubblico

Leggi di bilancio del 2017 (Gov. Renzi), 2018 (Gov. Gentiloni) e 2019 (Gov. Conte I).
Nella colonna di sinistra e nel grafico a torta di destra si trovano invece i riferimenti al disegno di legge di bilancio 2020 (Gov. Conte II)

ed al contrasto all’immigrazione clandestina

Tutti i dati sono disponibili a questo indirizzo: https://budget.g0v.it/

Per approfondire

Il progetto g0v.it è supervisionato da Copernicani, un’associazione indipendente di studenti, lavoratori, imprenditori, docenti, ricercatori e politici che hanno deciso di trasformare le proprie idee in azioni, per stimolare una cultura dell’innovazione e pungolare i partiti in modo trasversale.

Lo sviluppo è curato, tra gli altri da Enrico Fagnoni di LinkedData.Center.

Il progetto g0v.it utilizza Open Data, cioè dati pubblici ufficiali e liberamente utilizzabili per fornire informazioni utili sia ai cittadini che alle stesse pubbliche amministrazioni.

Il progetto si sta facendo notare a vari livelli, anche istituzionali tant’è che, durante una chiacchierata che ho fatto con Enrico Fagnoni, mi ha confermato che è stato lo stesso Tito Boeri (presidente INPS) a chiedergli personalmente di avere una versione di g0v.it dedicata ai dati dell’Inps.

Per quanto riguarda il movimento di Civic Hacking in Italia, oltre al già citato Copernicani, segnalo anche il sito (e hashtag) #CivicHackingIT gestito da Matteo Brunati (esperto di web) e Erika Marconato (assidua lettrice, “racconta” i libri che legge in modo originale)

Se i dati non si fossero interpretati correttamente…

Concludo con una breve storia, dove i dati e la loro interpretazione hanno giocato un ruolo fondamentale.

Siamo nel pieno della Seconda Guerra Mondiale e l’esercito degli Stati Uniti stava lavorando ad un metodo per rafforzare le difese dei propri aerei, che rientravano sempre pieni di fori di proiettile.

I militari, dopo un lungo lavoro di raccolta dei dati, chiesero aiuto all’SRG – lo Statistical Research Group presso la Columbia University – per capire come muoversi.

I dati forniti evidenziavano come le zone colpite erano concentrate solo in alcune parti dell’aereo e pertanto avevano la possibilità di fortificare l’aereo in maniera efficiente: non serviva rafforzarlo tutto, evitando di appesantirlo oltre il necessario.

Risultati immagini per abraham wald
La distribuzione dei fori di proiettile negli aerei

In particolare, vennero anche presentati i dati numerici per le singole parti dell’aereo

Sezione dell’aereoFori di proiettile per unità di superficie
Motore1,11
Fusoliera1,73
Sistema di alimentazione1,55
Resto dell’aereo1,80

Con questi dati, risultava evidente che si poteva evitare un rafforzamento del motore, dato che per qualche ragione, era la parte che subiva meno danni.

Tutto chiaro fino a qui, giusto?

Non proprio. Ai militari stava sfuggendo quello che per fortuna balzò agli occhi di Abraham Wald, matematico austro-ungarico del 1902 che si trasferisce negli Stati Uniti nel 1938 per un’offerta della Yale University.

Risultati immagini per abraham wald
Abraham Wald

Wald ipotizza che i fori abbiano una distribuzione casuale, poichè il contesto e la tecnologia non permettono una grande precisione nella mira. Non conclude insomma che i nemici mirassero esattamente ai punti rilevati, quanto piuttosto che mirassero “verso l’aereo” con l’obiettivo di abbatterlo.

Così Wald, suggerì esattamente l’opposto di quello che credevano i militari: rafforzare le zone dove non vengono ritrovati danni.

Perchè?

Semplice (dopo che Wald fece l’osservazione!). Solo gli aerei non colpiti in quelle zone riuscivano a rientrare alla base. E solo gli aerei che rientravano venivano analizzati ed entravano a far parte della statistica.

Gli altri venivano abbattuti!

Grazie agli interventi di Wald, gli aerei statunitensi e britannici aumentarono la loro sopravvivenza alla contraerea nemica.

Questo fenomeno è noto come “pregiudizio di sopravvivenza” ed è un celebre bias cognitivo che spinge l’uomo a concentrarsi sulle cose sopravvissute anzichè su quelle che non lo sono (sui bias e sul neuromarketing ho scritto diversi contenuti).

Questa storia dimostra come i dati di per sè non siano nè buoni nè cattivi (a condizione che siano esatti). È la loro interpretazione che può essere errata e per questo la cultura dei dati, il cambio di mentalità e movimenti come l’hacking civico sono molto importanti e possono dare un contributo concreto al miglioramento della nostra società.


Lasciami nei commenti le tue domande, condividi l’articolo con qualcuno a cui pensi possa interessare e linkalo nel tuo blog se ne hai uno.