Il piggybacking e le aziende che accedono ai miei dati personali quando apro un sito

Quante aziende accedono ai miei dati personali (in particolare ai dati di navigazione), quando apro un sito? La risposta a questa domanda è ovviamente “dipende” e il piggybacking è uno dei motivi per il quale non c’è una risposta unica.

Nel video di questa quarta puntata di questa serie dedicata all’analisi dei tag dei 50 siti più popolari in Italia, vediamo:

  • La classifica dei 50 siti più popolari in Italia, in funzione del numero totale di tag rilevato dopo un’analisi automatica di 100 pagine pubbliche
  • Cos’è il piggybacking, ovvero come i tag che inseriamo sui nostri siti sono talvolta (spesso) dei cavalli di Troia
  • Il punto di vista dei siti per adulti e i tag di PornHub che utilizza strumenti interessantissimi per i marketer (soprattutto per quelli, come me, focalizzati sui dati).

Come anticipato nel video, qui sotto trovi tutti i dati generati da TagInspector, lo strumento utilizzato per l’analisi automatica.

In particolare:

  • Il file excel con tutti i dati estratti direttamente da TagInspector (download)
  • I dati elaborati in SQL Server (download):
    • Il backup del database in formato SQL Server 2014
    • Lo script T-SQL per la creazione del database da script (dovrebbe essere compatibile anche con MySql)
    • Uno script con alcune query che ho creato per l’analisi

Quali sono le aziende che vedono i nostri dati?

Come racconto nel video, ad ogni tag spesso corrisponde un’azienda diversa (talvolta, come nel caso di Google, più tag possono fare capo alla stessa azienda).

Ad ogni modo, dall’analisi effettuata a Gennaio, ho analizzato 50 siti (i 50 più popolari in Italia, secondo la classifica di Alexa, così com’era disponibile l’8 gennaio 2020).

L’analisi effettuata tramite TagInspector, ha analizzato in particolare al massimo 100 pagine pubbliche (quelle accessibili senza inserire username e password) per ognuno dei 100 siti. Non di tutti sono state analizzate 100 pagine quindi.

Complessivamente sono state analizzate 2390 pagine e sono stati rilevati 327 tag diversi.

Non si può dire che i 327 tag facciano capo a 327 diverse aziende, ma l’ordine di grandezza è quello.

Il tag più diffuso in assoluto è “Google Universal Analytics (analytics.js)” rilevato su 39 siti e 2013 pagine.

E Google è presente in ben 6 delle prime 10 posizioni. Ecco la top 10 (per numero di pagine):

  1. [GOOGLE] Google Universal Analytics (analytics.js) (30 siti, 2013 pagine)
  2. [GOOGLE] DoubleClick (35/1346)
  3. [GOOGLE] Google Web Font (28/1150)
  4. [COMSCORE] ScorecardResearch (20/1136)
  5. [NIELSEN] Nielsen Online (17/1142)
  6. [GOOGLE] Google Ads Remarketing (33/1029)
  7. [GOOGLE] Google AdSense (20/968)
  8. [FACEBOOK] Facebook Pixel (24/919)
  9. [GOOGLE] Google Tag Manager (22/826)
  10. [XANDR] AppNexus (28/812)

E PornHub?

Per quanto riguarda PornHub, dei suoi 6 tag, abbiamo visto che 4 sono di Google. Abbiamo poi TrafficJunky e MixPanel.

Per quanto riguarda TrafficJunky, la società (TrafficJunky Inc.), è stata fondata a Montreal in Canada nel 2008. Non ho trovato relazioni di proprietà tra TrafficJunky e PornHub, ma non significa che non ci siano (non sono riuscito a fare ricerche approfondite… se conosci qualche altra informazione, fammelo sapere, così posso integrare l’articolo)

MixPanel invece ha diverse sedi sparse nel mondo. Nel documento di privacy policy si fa riferimento a “Mixpanel International, Inc., Mixpanel S.L., Mixpanel UK Limited, and Mixpanel APAC Pte. Ltd.”. Non ho approfondito su quale sia la capofila… questo è un altro genere di ricerca che per ora lascio in sospeso.

In generale quindi, quando navighiamo su un sito, anche quando questo ha pochi tag, raramente i nostri dati (in particolare i dati di navigazione) rimangono confinati nell’azienda che gestisce quel sito.

I nostri dati viaggiano, in molte aziende diverse.


Lasciami nei commenti le tue domande, condividi l’articolo con qualcuno a cui pensi possa interessare e linkalo nel tuo blog se ne hai uno.