Privacy Policy Cookie Policy
Brain
brain
europa
critic
Coloro cui sfugge completamente l'idea che è possibile aver torto non possono imparare nulla, tranne la tecnica. (Gregory Bateson)
Vai ai contenuti
La profilazione consentita dai Big Data sta danneggiando la democrazia?
TEORIE > METODI > INTELLIGENZA ARTIFICIALE
Scopo di questa pagina
I Big Data si possono definire come un qualunque aggregato di dati, così grande e così complesso da rendere difficile il suo trattamento mediante le tradizionali applicazioni informatiche. L'informatico e docente al MIT Samuel Madden ha dato dei Big Data la seguente definizione: "Dati che sono troppo grandi, troppo rapidi, o troppo complessi per gli attuali strumenti di calcolo". Gli informatici Viktor Mayer-Schönberger e Kenneth Cukier, hanno analizzato vantaggi e svantaggi dei Big Data, nel libro "Big Data". I vantaggi che essi accreditano ai Big Data sono soprattutto tre (p. 33): (1) Quantità: possibilità di analizzare enormi quantitativi di dati su un certo argomento, anzichè doversi accontentare di insiemi ristretti (campioni statistici); (2) Confusione: disponibilità ad accettare la confusione dei dati reali, anzichè privilegiarne l'esattezza; (3) Correlazioni: possibilità di effettuare correlazioni sull'intero set di dati, anzichè andare alla ricerca di causalità su campioni parziali.  Riguardo al primo e al secondo punto un esempio applicativo noto è quello delle traduzioni online. Alla fine degli anni '80 l'approccio innovativo trovato dalla IBM prevedeva una traduzione automatica su base statistica, cioè che lasciava che il software di traduzione usasse il calcolo delle probabilità per scegliere quale parola o frase fosse la più adatta. La IBM aveva applicato il processo di traduzione a dieci anni di trascrizioni dei dibattiti parlamentari in francese e in inglese ma, dopo pochi anni, abbandonò l'impresa. Invece, nel 2006, Google si lanciò in un approccio completamente diverso (basato sui Big Data), che prevedeva l'uso di un dataset di frasi molto più vasto e confuso, cioè quello dell'intera Rete. Sfruttando il fatto che essa poteva accedere ai documenti presenti in Rete e alle traduzioni in varie lingue di tutti i documenti ufficiali, Google addestrò il proprio software su miliardi di pagine dalla qualità di traduzione disomogenea. Quest'approccio si rivelò vincente infatti, pur rinunciando all'esattezza delle traduzioni di qualità, sfruttava la numerosità delle frasi presenti in Rete per inferire la traduzione migliore. Infatti il traduttore Google online che tutti usiamo è il migliore, nonostante gli errori che talvolta esso produce. Riguardo al terzo punto, cioè all'importanza delle correlazioni, un caso emblematico è quello delle catene di supermercati che attraverso gli acquisti dei consumatori, monitorati con le carte-fedeltà offerte ai clienti, hanno la possibilità di prevedere molti cambiamenti avvenuti nella famiglia del consumatore e "agire" preventivamente con l'offerta "mirata" di buoni sconto. Un caso che ha fatto scalpore è quello delle donne incinta, scrive Kenneth Cukier (p. 83): "Sapere se una cliente potrebbe essere incinta è importante per le catene distributive, perchè la gravidanza è un vero e proprio spartiacque nella vita delle coppie, in quanto segna un profondo cambiamento nelle loro abitudini di acquisto. Il team ha passato in rassegna gli acquisti effettuati dalle donne che si erano iscritte nel registro dei regali per i bambini piccoli. E ha osservato che quelle donne acquistavano grosse quantità di lozione senza profumo intorno al terzo mese di gravidanza, e che alcune settimane dopo tendevano ad acquistare integratori alimentari al magnesio, al sodio e allo zinco. Alla fine il team ha individuato una ventina di prodotti che, utilizzati come indicatori rappresentativi, consentivano all'azienda di calcolare un indicatore di "previsione della gravidanza" per ogni cliente che pagava con la carta di credito, usava una tessera-fedeltà o dei buoni sconto inviati per posta. Le correlazioni hanno consentito a Target di stimare con ragionevole attendibilità persino la data del parto, in modo da poter spedire alle clienti buoni-sconto su misura per ogni fase della gravidanza. Più "Target" di così... Un altro caso di correlazioni utili commercialmente è stato quello della catena Walmart (ved. bibliografia) che scoprì una correlazione tra previsioni atmosferiche e consumo di merendine infatti, passando al setaccio le transazioni pregresse dei suoi clienti, scoprì che in previsione di un uragano aumentavano le vendite di torce elettriche e di merendine. Tutti prodotti che venivano posti all'ingresso dei punti vendita quando le previsioni atmosferiche segnalavano tempeste e uragani in arrivo. Il libro di Viktor Mayer-Schönberger e Kenneth Cukier riporta molti altri esempi "americani" dell'applicazione dei big data a casi concreti di interesse pubblico. Tra gli svantaggi dei Big Data citati da Viktor Mayer-Schönberger e Kenneth Cukier figurano tre fattori: (1) Privacy: Internet ha reso più facile la rilevazione dei dati personali sia a coloro che già la effettuavano (le agenzie governative di intelligence), sia a coloro che hanno potuto ampliare enormente la loro azione di profilazione commerciale dei consumatori (private enterprises). (2) Propensione: i Big Data offrono la possibilità di usare le previsioni sulla singola persona per giudicarla e punirla prima che agisca; se questa possibilità verrà usata vi saranno gravi rischi per la democrazia. Come scrivono gli autori (p.213): "La scena di apertura del film "Minority Report" ritrae una società in cui le previsioni sono così accurate da consentire alla polizia di arrestare gli individui prima che commettano i delitti. Le persone vengono incarcerate non per quello che hanno fatto ma per quello che stanno per fare, anche se non hanno commesso alcun delitto." (3) Valutazione degli Algoritmi: data l'enorme quantità di dati disponibile su ogni aspetto della realtà sociale e individuale, il problema si sposta sulla progettazione di algoritmi che estraggano da quei dati previsioni, tendenze, propensioni, ecc. La valutazione degli scopi degli algoritmi diventerà cruciale per determinarne la liceità. Scrivono gli autori (p.205): "Nonostante la sua bravura nella raccolta e nella conservazione delle informazioni, c'erano molte cose che la Stasi non era in grado di fare. Non poteva seguire costantemente gli spostamenti di tutti e non poteva sapere, se non attraverso grandissimi sforzi, con chi parlavano. Ma oggi, la maggior parte di queste informazioni viene raccolta dagli operatori di telefonia mobile. Il governo della DDR non era in grado di sapere quanti cittadini sarebbero diventati dissidenti, ma le forze di polizia stanno cominciando a impiegare modelli algoritmici per stabilire dove e quando effettuare dei pattugliamenti, il che ci dà un'idea dei prossimi sviluppi."
dog
Un tempo su internet nessuno sapeva che ero un cane.
Adesso, a causa dei Big Data, tutti sanno che sono lo scarabocchio di un labrador quindicenne che ha una passione segreta per il cibo per gatti.
Punto chiave di questa pagina
ELEZIONI USA: REPUBBLICANI O DEMOCRATICI? Le elezioni USA del 2012 vengono accreditate come le prime in cui i Big Data sono stati usati per prevedere le intenzioni di voto degli elettori. Come mostrato nell'immagine, le intenzioni possono essere inferite dalle banali preferenze personali degli elettori (perfino dalla bevanda preferita). Le tecniche di micro-targeting, un tempo impossibili da attuare, oggi consentono di profilare gli elettori in base alle intenzioni di voto rivelate dai loro consumi personali, e di inviare loro messaggi personalizzati online, come mostrato nella slide che descrive l'intero processo. I dati online e offline del singolo elettore convergono in un motore centrale (CampaignGrid) che "decide" quale tipo di messaggio elettorale inviargli.
Punti di riflessione
I Big Data danno accesso a una quantità enorme di dati sulla singola persona e sulle sue relazioni con il suo ambiente. I soggetti (commerciali, sociali e politici) che accedono a tali dati vengono messi in grado di correlarli e ricavarne previsioni sul comportamento o agire per indirizzarlo.

_

Una cultura sviluppata non si preoccupa soltanto di accumulare dati, ma ne ha anche cura: li analizza, li inserisce in un contesto, li interpreta. Oggi invece la velocità dell'informazione cancella e riscrive in un ciclo continuo. Non è un caso, purtroppo, che i due mestieri oggi a maggior rischio di estinzione siano i bibliotecari e i giornalisti. La storia rischia di essere ridotta a un perenne hic et nunc e noi potremmo finire imprigionati in un perenne 'adesso'.  (Luciano Floridi)

_

L'analisi e la valutazioni di dati sensibili sono sempre più affidate a soggetti non istituzionali con interessi commerciali della cui eticità è lecito dubitare. I Big Data sollevano quindi una serie di sfide epistemologiche che riguardano, ad esempio, i rapporti fiduciari tra le persone e l'etica della ricerca accademica di fronte alla possibilità che i dati vengano sfruttati commercialmente. I problemi etici sulle propensioni degli individui che dovessero emergere dalle correlazioni non sono ancora state oggetto di analisi politiche ma già fanno discutere i filosofi.
-
Prima del referendum sull'adesione all'Unione europea del Regno Unito del 2016, l'azienda di Alexander Nix (Cambridge Analytica) era coinvolta nel sostenere Leave.EU con la sua campagna Brexit. (Wikipedia)
Quando il tuo supermercato sa che sei incinta prima che tu lo abbia detto a qualcuno
big data
Le abitudini di acquisto dei consumatori rivelano molto più di quanto si immagini se si fanno le giuste correlazioni. Il team statistico della catena di supermercati statunitense Target ha individuato una ventina di prodotti che, utilizzati come indicatori rappresentativi, consentivano all'azienda di calcolare un indicatore di "previsione della gravidanza" per ogni cliente che utilizzava la sua carta-fedeltà.
i Big Data offrono la possibilità di usare le previsioni sulla singola persona per giudicarla e punirla prima che agisca; se questa possibilità verrà usata vi saranno gravi rischi per la democrazia
Le carte-fedeltà dei supermercati servono a profilare i clienti
I supermercati che ci "regalano" una carta-fedeltà per avere diritto a sconti sui prodotti accedono a una quantità di dati su di noi che consentono di fare correlazioni di vario tipo e, se gli diamo anche il nostro indirizzo, hanno la possibilità di inviarci a casa volantini e buoni-sconto personalizzati. Se poi il supermercato fornisce anche carte di credito e carte telefoniche userà questi dati facendoli convergere sul nostro identificativo (Guest ID). Negli USA tale profilazione è già realtà, in Italia non siamo ancora a questo livello. Scrive Charles Duhigg nel libro "Il potere delle abitudini" (279):

"Con il codice identificativo abbiamo il vostro nome, indirizzo e modalità di pagamento, sappiamo che avete una Target Visa, una carta di debito, e possiamo collegare tutti i vostri acquisti al supermercato" dichiarò Pole [l'esperto statistico di Target] davanti a un pubblico di esperti in statistica commerciale in un congresso del 2010. L'azienda può ricollegare a una persona circa metà di tutte le vendite nel supermercato, quasi tutte le vendite online e circa un quarto della navigazione in rete. In quel congresso Pole mostrò una diapositiva che descriveva un esempio dei dati raccolti da Target. [quella mostrata in figura] Il problema di tutti questi dati, però, è che non hanno alcun significato senza l'interpretazione fornita dagli statistici: agli occhi di un profano, due clienti che acquistano entrambi lo stesso succo d'arancia potrebbero sembrare uguali. E' necessario un matematico per stabilire se uno è una donna di trentaquattro anni che acquista il succo per i figli (e quindi potrebbe gradire un buono per un DVD di Thomas la locomotiva a vapore) e l'altro è uno scapolo di ventotto anni che beve succo d'arancia dopo aver fatto jogging (e al quale pertanto potrebbero interessare gli sconti sulle scarpe da ginnastica). Pole e gli altri cinquanta membri del Guest Data and Analytical Service di Target erano in grado di individuare le abitudini nascoste nei dati.
I Big Data che non salvarono la vita a Steve Jobs
Com'è noto, il fondatore della Apple, Steve Jobs è morto di un tumore al pancreas ma, in virtù della sua ricchezza, cercò di sfruttare i Big Data applicati al suo corpo (l'intero DNA) per scegliere le terapie più efficaci.
Scrivono Viktor Mayer-Schönberger e Kenneth Cukier nel libro "Big Data" (p.42):

Nella sua lotta personale contro il cancro, il leggendario CEO di Apple Steve Jobs ha adottato un approccio del tutto diverso. E' stato uno dei primi al mondo a far sequenziare per intero il proprio DNA e quello del suo tumore. A tale scopo, ha pagato una cifra a sei zeri - parecchie centinaia di volte il prezzo richiesto da 23andMe. In cambio non ha ricevuto un campione, una serie di marker, ma un file con i codici genetici nella loro interezza. Nella scelta del trattamento da somministrare a un paziente oncologico, i medici devono sperare che il suo DNA sia abbastanza simile a quello dei pazienti che hanno partecipato alla sperimentazione del farmaco. Ma i medici che curavano Steve Jobs hanno potuto selezionare le terapie in base all'efficacia che avrebbero avuto per la composizione specifica del suo codice genetico. Tutte le volte che una cura perdeva di efficacia perchè il tumore si modificava e riusciva a eluderla, potevano impiegare un altro farmaco - saltando, come diceva lui, "da una ninfea all'altra". "Sarò uno dei primi a sconfiggere un tumore di questo tipo, o uno degli ultimi a morirne", amava ripetere. Purtroppo la sua predizione non si è avverata...
Il DNA di Steve Jobs
Conoscere o non conoscere il proprio DNA? il tema è controverso. C'è chi preferisce non conoscerlo per evitare esiti potenzialmente negativi, c'è invece chi vuole conoscere per avere uno stimolo in più per modificare il proprio stile di vita e, inaspettatamente, c'è chi vuole conoscerlo per scoprire qualcosa in più sui propri antenati. Potete saperne qualcosa in più qui e, se volete informazioni suI migliori kit per test del DNA qui.
Steve Jobs è morto di un tumore al pancreas ma, in virtù della sua ricchezza, cercò di sfruttare i Big Data applicati al suo corpo (l'intero DNA) per scegliere le terapie più efficaci
Una tassonomia dei Big Data
Nel definire i "Big Data" il ricercatore Bob Hayes cita una ricerca effettuata dall'Università di Berkeley che ha chiesto a un grande numero di aziende (operanti in campi disparati) la loro definizione del termine ricevendone circa 40 diverse.
Bob Hayes ha suddiviso e organizzato queste definizioni in sei categorie (indicando tra parentesi il numero delle occorrenze):


  • Caratteristiche dei Dati: Big Data riguarda le tradizionali 3V (volume, velocità, varietà) di dati (n= 19) e le risorse di calcolo non routinarie necessarie per elaborare tali dati (n= 11). Big Data sono "dati che contengono sufficienti osservazioni da richiedere un trattamento particolare a causa della loro grandezza."

  • Intuizioni (Insights): Big Data riguarda le intuizioni/risultati/valore (N = 17) che otteniamo dai dati e le persone necessarie per estrarle (n = 3). Big Data "ci incantano con la promessa di nuove intuizioni."

  • Analisi (Analytics): Big Data riguarda l'analisi e i metodi di modellazione (n = 12) e la loro applicazione nel migliorare il processo decisionale (n = 4). Big Data ci dà l'opportunità "di acquisire una maggiore comprensione delle relazioni tra i diversi fattori e di scoprire delle strutture relazionali precedentemente non rilevati nei dati."

  • Integrazione Dati: Big Data riguarda l'integrazione di diverse disparate fonti di dati e sfruttarne la loro potenza combinata (n = 6). Quel che c'è di grande nei Big Data è "il gran numero di fonti di dati cui è possibile accedere, come sensori digitali e rilevatori comportamentali in tutto il mondo."

  • Visualizzazione e Narrazione: Big Data riguarda l'essere in grado di raccontare una storia (n = 1) attraverso la visualizzazione (n = 2). Big Data è "storytelling - sia che si tratti di farlo attraverso una informazione grafica o altri ausilii visivi che spiegano il tema in un modo comprensibile a persone di tutti i settori."

  • Etica: Big Data è essere consapevoli di come usiamo le enormi quantità di dati che abbiamo oggi a disposizione (n = 1). Big Data è in grado di fornirci "infinite possibilità per tutta la vita."

L'uso politico dei Big Data
Le elezioni USA del 2012 vengono accreditate (ved. bibliografia Wadhwa) come le prime in cui i Big Data sono stati usati per prevedere le intenzioni di voto degli elettori. Come mostrato nell'immagine a fianco, le intenzioni possono essere inferite dalle banali preferenze personali degli elettori (perfino dalla bevanda preferita). Le tecniche di micro-targeting, un tempo impossibili da attuare, oggi consentono di profilare gli elettori in base alle intenzioni di voto rivelate dai loro consumi personali, e di inviare loro messaggi personalizzati online, come mostrato nella seguente slide dell'intero processo. I dati online e offline del singolo elettore convergono in un motore centrale (CampaignGrid) che "decide" quale tipo di messaggio elettorale inviargli.

Elezioni USA 2012: preferenze di voto in funzione di ciò che si beve
Big Data Elections
I ricercatori informatici A.Oboler, C.Welsh e L.Cruz hanno fatto un'analisi dei Big Data alla luce delle trasformazioni sociali che essi comportano, evidenziando i rischi di aggregazioni e correlazioni. Il filosofo Luciano Floridi (ved. bibliografia) mette in guardia sull'eticità dei soggetti che governano i dati e le correlazioni su di essi, parafrasando Orwell e il suo 1984: "Chi controlla le domande dà forma alle risposte e chi controlla le risposte dà forma alla realtà".

Altan
There is a new world order.
That's why you do not find anything.
Lo scandalo Cambridge Anaytica: la vittoria di Trump è stata determinata dall'uso di Big Data?
Alexander Nix era il CEO di Cambridge Analytica, una società che effettuava analisi su grandi masse di Big Data e che è stata ingaggiata da Donald Trump alle elezioni USA del 2016 (vedi bibliografia Grasseger). La società di Nix ha utilizzato un modello già noto in psicometria (denominato "Big Five") per valutare la personalità degli individui sulla base di cinque dimensioni:

  • Apertura (Opennes): quanto siete aperti a nuove esperienze?

  • Coscienziosità (Conscientiousness): quanto siete perfezionisti?

  • Estroversione (Extroversion): quanto siete socievoli?

  • Gradevolezza (Agreableness): quanto siete premurosi e cooperativi?

  • Nevrosi (Neuroticism): quanto facilmente venite turbati?

Sulla base di queste dimensioni, note anche come modello OCEAN, acronimo di apertura, coscienziosità, estroversione, gradevolezza, nevrosi, si è in grado di effettuare una valutazione piuttosto precisa del tipo di persona di fronte a noi. Ciò che ha permesso di mettere in atto su grande scala tale modello è stato l'avvento di Internet e, in particolare, di Facebook. Infatti nel 2012 il ricercatore Michal Kosinski dell'Università di Cambridge ha svolto una ricerca sperimentale sui "like" di Facebook, dimostrando che sono sufficienti 68 "like" da parte di un utente per individuare il suo colore della pelle (con il 95% di precisione), il suo orientamento sessuale (88% di precisione), il suo orientamento politico democratico o repubblicano (85% di precisione), più altre caratteristiche quali appartenenza religiosa, dipendenza da droghe, ecc. La scoperta di Kosinski venne sfruttata, a partire dal 2014, da Cambridge Analytica per offrire servizi ai propri clienti, tra i quali Nigel Farage per sostenere la campagna online "Leave-EU". Nel giugno 2016 Alexander Nix dichiarò di essere stato ingaggiato da Donald Trump per la sua campagna elettorale e di aver costruito i profili di personalità degli elettori americani acquistando i dati (tutti i dati personali sono in vendita sul mercato!) da varie fonti quali: catasti, registri automobilistici, iscrizioni a club, ecc. Nix si è vantato di aver profilato la personalità di ogni adulto negli USA: 220 milioni di cittadini. In che modo sono stati utilizzati i dati per produrre risultati tangibili a favore di Donald Trump? In due modi:

  • Agire sugli elettori democratici scontenti in modo da convincerli a non andare a votare (ad esempio inviando dei messaggi pubblicitari agli elettori afro-americani in cui si mostravano delle dichiarazioni di Hillary Clinton che in passato aveva definito gli uomini neri "predatori")

  • Individuare, nei collegi elettorali più a rischio, quegli elettori repubblicani su cui indirizzare gli sforzi persuasivi

Alexander Nix ha affermato che sta costruendo un database di profili personali per tutto il mondo e che ha già ricevuto richieste specifiche da Germania, Svizzera e Australia.

Che fine ha fatto Cambridge Analytics? Wikipedia riporta: "Nel 2018 Cambridge Analytica è stata sciolta dopo che riprese video sotto copertura mostravano Nix che affermava che la sua azienda stava usando trappole, corruzione e prostitute, tra le altre tattiche, per influenzare più di 200 elezioni a livello globale per i suoi clienti."
Alexander Nix, CEO di Cambridge Analytica
Cambridge Analytica
Come funziona Cambridge Analytica
Nel giugno 2016 Alexander Nix dichiarò di essere stato ingaggiato da Donald Trump per la sua campagna elettorale e di aver costruito i profili di personalità degli elettori americani acquistando i dati (tutti i dati personali sono in vendita sul mercato!) da varie fonti
La razionalità richiede impegno personale!
Iscriviti alla Newsletter di pensierocritico.eu per ricevere in anteprima nuovi contenuti e aggiornamenti:
Bibliografia (chi fa delle buone letture è meno manipolabile)


Scrivi, se non sei d'accordo
Se ritenete che le tesi del "punto chiave" non vengano sufficientemente supportate dagli argomenti presenti in questa pagina potete esprimere il vostro parere (motivandolo).
Inviate una email con il FORM. Riceverete una risposta. Grazie della collaborazione.
Libri consigliati
a chi vuole capire in che modo le aziende usano i Big Data
Spesa annua pro capite in Italia per gioco d'azzardo 1.583 euro, per l'acquisto di libri 58,8 euro (fonte: l'Espresso 5/2/17)

Pagina aggiornata il 27 luglio 2023

creative commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione 2.5 Generico
Quest'opera è distribuita con Licenza Creative Commons Attribuzione 2.5 Generico
Torna ai contenuti