Personal tools
You are here: Home Comunità zopemaster's Home Macropost Il topografo tra le righe

Daniele Paganelli


alias mythsmith

  • Blog
  • Feed RSS
    Iscriviti al diario, con il feed RSS (?)
  • Emopiano
    Imporvvisazioni al pianoforte ed alla tastiera (del computer :)
  • Università
    Documenti redatti per/a/con l'Università
  • Programmazione
    La mia limitata biblioteca personale di script, principalmente in Python.
  • Macropost
    Testi molto lunghi, inadatti per il blog.
  • Segnalibri
    I miei segnalibri direttamente da Firefox... quando mi ricordo di aggiornarli!

Sinapsi

  • AGESCI zona di Modena
    (curato da me, si nota? ;-)
  • Magnatune
    Etichetta discografica online. Musica di alta qualità con licenza CreativeCommons. Anteprime gratuite e complete di qualsiasi album... Attenzione: rischi di non uscirne più fuori!!!
  • Conoscere Linux
    Il Linux User Group di Modena, cui sono associato dalla fondazione.
  • Slack.it
    Wiki di un amico...
  • Punto Informatico
    I miei inutili interventi sulla rivista online più antica d'italia...
  • Oblivion999
    Un gruppo metal
  • Fax via eMail
    Il servizio che utilizzo per inviare e ricevere fax via eMail per lavoro.



Contatti Personali:
  • Jabber: dapa@jabber.org
    Per accedere alla rete Jabber usa Gaim oppure Google Talk
  • Posta: daniele.chioccia.modena1.it
  • OpenWengo: paganoide
  • Perché evito MSN?
 
Document Actions

Il topografo tra le righe

by mythsmith last modified 2007-04-08 11:51 AM

Sapevate di essere osservati mentre visitate la maggior parte dei siti internet?

Fin dall'antichità i topografi usano una tecnica chiamata triangolazione per determinare la posizione di punti remoti, inaccessibili. Si fa risalire ad Eratostene, III secolo a.C., e venne notevolmente perfezionata da Snell nel seicento.

Supponiamo di voler determinare la posizione di una vetta montana standocene però comodamente nel nostro paesino rifornito di tutto. Scegliamo allora due punti, magari ove vi siano panchine ed un po' d'ombra. Munitici di carta, penna, metro e goniometro, nonché di un gustoso spuntino, ci sediamo nella prima locazione, poi nella seconda, e misuriamo un po' d'angoli e la distanza tra i due punti scelti.
Con buona volontà e discrete conoscenze trigonometriche possiamo ricavare la posizione relativa della vetta rispetto ai punti d'osservazione, ed anche l'altitudine.
Tutto questo senza mai violare quella lontana ed impervia cima innevata, in virtù del fatto che per descrivere compiutamente un triangolo basta conoscere un lato e due angoli.

Anche in Internet ci sono due "angoli" che identificano i navigatori univocamente e geograficamente: sono l'indirizzo IP e la data (la maggior parte degli indirizzi IP viene assegnato dinamicamente, e perciò varia al passare del tempo).
Il cybertopografo si apposta in ogni sito, e registra al nostro passaggio l'ora e l'IP. Poi, con la carta e la penna dei moderni calcolatori, confronta la colossale mole di angoli raccolti in tutti i siti da noi visitati: a quel punto ci ha triangolati! Ha costruito un profilo della nostra persona, senza però determinare con precisione "chi siamo", senza mai violare la nostra privacy.
La Rete è piena di "cybertopografi": questi loschi figuri, nemmeno paragonabili agli uomini di scienza che si occupavano nei secoli passati di geografia, raccolgono informazioni sulle nostre abitudini in rete. Ambiscono a conoscere quali siti visitiamo, come li visitiamo, in che sequenza. Quali pubblicità ci accliccano. Quali temi ci appassionano. Non sono direttamente interessati a noi personalmente, anche se volendo potrebbero risalire alla nostra identità molto facilmente. Vogliono solo fare massa, fare statistica: per città, per regione, per nazione, per continente... Carpire le grandi voglie, le nuove tendenze delle moltitudini, e venderle al migliore offerente.
Certo, sembra un'impresa impossibile: per realizzare un tracciamento significativo, il nostro ipotetico osservatore dovrebbe aver accesso ai "log" di moltissimi siti internet (cioè i registri in cui sono annotate tutte le transazioni eseguite). Oppure dovrebbe installare uno "spyware" sul nostro computer, in aperto contrasto con tutte le leggi vigenti.
Apparentemente pare che nessuno abbia un potere così vasto da percorrere la prima via; mentre sulla seconda si sono incamminati rari ma celebri casi di applicazioni utilissime, che nascondevano poi codice tracciante. Basta allora stare un po' attenti, e installare solo software open source, per ritagliarsi un minimo di riservatezza?

Così credevo fino a qualche giorno fa, quando inspiegabilmente Gheminga non voleva caricarsi. Aspetta e aspetta... l'occhio va a cadere sulla barra di stato di Firefox: "Looking up c13.statcounter.com...". Volevo un po' di giornalismo civico, ed invece il mio browser stava misteriosamente - e lentissimamente - contattando questo StatCounter.
Scopro che si tratta di un servizio gratuito per la raccolta di statistiche sui visitatori di siti web: viene usato dagli amministratori per tener traccia di come viene visitato il loro sito. Una porzione di codice, invisibile agli utenti, viene aggiunta alle pagine di cui si vuole analizzare il traffico. Ogni volta che un visitatore accede a quei siti, il codice è eseguito a loro insaputa: ora, IP, browser, sistema operativo ed altre informazioni vengono inviate ad un server centralizzato, che raccoglie questi dati e li elabora. Gli amministratori possono poi visualizzare le statistiche in bello stile.
E' quindi di un servizio attivato esplicitamente dai proprietari di siti web, nel legittimo tentativo di farsi un'idea di chi legge le loro pagine.

Quel giorno non è riuscito a fuggire abbastanza rapidamente, imbottigliato probabilmente nel traffico, nella calca... e si è fatto riconoscere: anche Gheminga infatti usa StatCounter, e questo è il codice nascosto tra le righe del nostro amato sito (premete Ctrl+U per vederlo):

<!-- Start of StatCounter Code -->
<script type="text/javascript">/* <![CDATA[ */
var sc_project=1393434;
var sc_invisible=1;
var sc_partition=12;
var sc_security="d7b2b81e";
var sc_remove_link=1; /* ]]> */
</script>
<script type="text/javascript" src="http://www.statcounter.com/counter/counter_xhtml.js"></script>
<!-- End of StatCounter Code -->

Siamo di fronte a quel genere di cybertopografo che, in cambio di un servizio senza dubbio utile per gli amministratori, acquisisce la possibilità di accedere ai "log" di centinaia di migliaia di siti internet!

Subito ho pensato: "ma forniranno una qualche garanzia, per impedirsi di utilizzare questa montagna di dati per triangolare usi e costumi di intere popolazioni!". Sono dunque andato a leggermi le Condizioni d'Uso¹ per il servizio,  molto chiare ed esplicite:
.    6. "Users acknowledge and agree that their Web site information (site name, URL, traffic counts, etc.) may be utilized by StatCounter.com. Possible uses include (but are not limited to) a directory of the sites using our service, general promotional uses, etc."
.    12. "We both own the data regarding visitors to your Web site that we collect. You can use the data we provide for any legal purposes. We will use the data in compliance with our privacy policy."

La quale privacy policy dice²:
.    1. "When a visitor requests pages from the StatCounter.com site, our Web servers automatically log the browser's domain name, and IP address. This information is collected solely for statistical purposes and is not used to identify individuals."
.    2. "To enable StatCounter.com to track your unique visitors we send a cookie to your visitors' computer. This information is collected solely to improve the service we offer to you and statistical purposes and is not used to identify individuals."

Le Condizioni d'Uso ahimè sostengono, nel punto 6, che StatCounter può fare quello che gli pare con i dati raccolti. Ad esempio, può eseguire una statistica attraverso i dati provenienti da tutti i siti internet registrati: una triangolazione, appunto. Può vendere questi dati a qualcun altro, che sappia cosa farne: ad esempio tracciare i percorsi degli utenti di una certa regione, per valutare una strategia commerciale.
Il punto 12 sembrerebbe porre dei limiti a questo comportamento: esiste una Privacy Policy cui attenersi. Sfortunatamente questa dice semplicemente che non si useranno i dati per identificare individui (non impedisce di venderli a terzi, che potrebbero invece farlo), e poi rincara la dose rispetto alle Condizioni. Un cookie viene infatti lasciato ai visitatori, in modo da identificarli univocamente anche qualora il loro indirizzo IP cambiasse nel frattempo. Ciò significa che l'utente non solo è tracciabile per il periodo di tempo durante il quale il suo indirizzo IP rimane costante, ma lo sarà all'incirca per sempre: il cookie è in pratica un "angolo" aggiuntivo che permette di ricavare informazioni maggiori. Grazie al cookie potrebbero ad esempio ricostruire le evoluzioni temporali delle rotte seguite da incauti marinai virtuali.

In pratica questi signori si impegnano a non risalire al nostro numero di telefono (anche se gli basta pochissimo per farlo), ma conoscono sicuramente tutti i nostri movimenti in rete.

E' un bene? Un male? Innanzitutto chiedo a Gheminga di rendere esplicitamente note ai navigatori la presenza del codice StatCounter e la relativa policy, almeno nell'apposita sezione "privacy". Dovrebbe essere espresso chiaramente che, sebbene Gheminga segua effettivamente la politica attuale, non è così per StatCounter, il quale raccoglie dati per mezzo e contestualmente alla fruizione della stessa, adottando però una policy in netto contrasto con l'informativa ghemingia.

Per coloro che desiderino difendersi attivamente dai cybertopografi rimando ad articolo venturo.

[1] http://my.statcounter.com/terms.html , Condizioni d'Uso di StatCounter.com
[2] http://www.statcounter.com/privacy.html , Privacy Policy di StatCounter.com

( Articolo originariamente pubblicato su Gheminga. )




Difendersi dai Cybertopografi


Nel precedente articolo "Il topografo tra le righe"¹ ho descritto la figura del "cybertopografo": un abile osservatore che raccoglie i dati più disparati, li incrocia, li analizza, e poi li usa per i suoi scopi. Il tutto nella quasi completa oscurità.

Ma che c'è di male? All'epoca della pubblicazione del suddetto articolo, nel quale tra l'altro criticavo Gheminga per non avvisare l'utente che terze parti lo stanno osservando mentre ne visita le pagine, mi fu chiesto da più parti perché mai dovessi nutrire preoccupazioni così paranoidi riguardo questi improbabili loschi figuri.

Personalmente mi disturba sapere che qualcuno possa registrare e poi analizzare moli di dati così immense. E poi venderle, o pubblicarle. Come è successo recentemente con AOL: l'azienda ha deciso di punto in bianco di pubblicare i suoi database di ricerche... la "class action" intentata da migliaia di utenti californiani mi fa pensare di non essere paranoico, o almeno mi fa sentire in buona compagnia.

Se ritenete che l'operato di questi topografi non sia rispettoso della vostra riservatezza, che sia pericoloso o concettualmente spiacevole, ci sono svariate contromisure che potete prendere.
Electronic Frontier Foundation, indignata dalla mossa di AOL, ha pubblicato una guida riguardo come proteggere la propria privacy nell'uso di motori di ricerca².
Riassumendo, si sconsiglia di:
1      lanciare ricerche contenenti dati personali (ad esempio il proprio nome)
2      usare motori di ricerca offerti dal proprio Internet Service Provider (se ho alice, evito virgilio)
3      autenticarsi nel motore di ricerca se lo si deve usare (se ho un account gmail, evito google finché mantengo lo stesso indirizzo IP dell'ultima volta in cui mi sono loggato in gmail)
EFF raccomanda inoltre di bloccare i "cookies" del nostro motore di ricerca, oppure di cambiare frequentemente IP usando proxy o IP dinamici. Infine, nel caso si esiga un anonimato "forte", EFF suggersice Tor, un sistema distribuito per la tutela della privacy.

    A tutti questi validissimi consigli, per i quali rimando al link, ne voglio aggiungere uno mirato specificamente contro StatCounter e servizi analoghi a quanto spiegato ne "Il topografo tra le righe".
La strategia consiste nell'ingannare tutti i programmi che si connettono ad internet, redirigendo ogni connessione a StatCounter verso un indirizzo IP inesistente.
A tal fine sfruttiamo un particolare file di configurazione del sistema operativo, chiamato "hosts", in cui sono tradotti in numeri IP alcuni nomi di dominio. Generalmente, questo file contiene solo una riga:

127.0.0.1    localhost

la quale traduce tutte connessioni al nome "localhost" verso l'indirizzo IP 127.0.0.1. Se visitate http://localhost vi connettete così al vostro computer stesso: il più delle volte senza alcun risultato, poiché questo non sa come rispondere alla connessione e la rifiuta (a meno che non abbiate installato un sito internet!).
Basta aggiungere la riga:

0.0.0.0    www.statcounter.com

per rendere impossibile la comunicazione con StatCounter! L'indirizzo IP indicato infatti è inesistente, quindi il browser non tenterà neppure di collegarsi (se visitate il sito dopo aver modificato "hosts", vedrete istantaneamente un errore).
Questo prezioso ed utilissimo file di configurazione si trova in /etc/hosts in GNU/Linux, mentre su Windows tutto si complica. Tale file ha infatti l'abitudine di migrare in modo imprevedibile col passare del tempo, certamente per rendere più facile la vita degli utenti (non c'è dubbio). A seconda dell'edizione di Windows che possedete, sperate quindi di trovarlo in:

Windows 95/98/Me     ->     c:\windows\hosts
Windows NT/2000/XP Pro ->     c:\winnt\system32\drivers\etc\hosts
Windows XP Home     ->     c:\windows\system32\drivers\etc\hosts

Per motivi che tralascerò, dovrete anche ripulire la "cache" del vostro browser per diventare intracciabili: aprite le Preferenze, nella sezione Privacy al tab "Cache" e cliccate su "Svuota la Cache".
 
La modifica di "hosts" ha il pregio di rendere efficace il provvedimento per tutti i programmi e gli utenti che potrebbero collegarsi ad internet. Una soluzione più blanda, ma più efficace nello specifico di Firefox, è quella di installare l'estensione AdBlock ed inserire la stringa *statcounter.com/* tra i siti da bloccare.
 
In questo modo eviterete anche inutili perdite di tempo nell'attesa di un servizio non richiesto (o addirittura blocchi totali), unitamente ad un maggior rispetto della vostra privacy.

Il procedimento illustrato potete attuarlo per neutralizzare anche altri "servizi". Come Google-Analytics, l'analogo (ben più esteso) di StatCounter. Modificate così la riga nel solito file hosts:

0.0.0.0    www.statcounter.com , www.google-analytics.com

Google Analytics ha una politica più stringente rispetto a StatCounter: non può vendere o comunicare a terzi i dati raccolti. Si riserva naturalmente di fare quel che gli pare internamente... unite i dati collezionati in questo modo a quelli ricavati dal motore di ricerca più famoso del mondo ed al servizio di pubblicità più diffuso, e avrete una vaga idea della portata smisurata delle informazioni contenute nella grande G.

Un esercizio utile per scovare altri cybertopografi è quello di consultare meticolosamente i "Cookies" immagazzinati dal vostro browser, indagare su quelli sospetti, e agire come spiegato per vanificare i tentativi dei cattivi pasticcieri¹ che ve li hanno preparati. Con Firefox aprite le Preferenze, nella sezione Privacy, all'eloquente tab "Cookies", e cliccate su "View Cookies". Cercare la parola "stat" nella lista di cookies potrebbe rivelarsi molto preoccupante...
Per evitare di scrivere una enciclopedia anziché un articolo, evito ora di parlarvi delle licenze di tutti i topografi avvistati in questo modo: vi basti la riga che ho apposto al mio /etc/hosts,

0.0.0.0    www.statcounter.com , www.google-analytics.com , 0stats.com , sitestat.com , estat.com , shinystat.com , shinystat.it , stat.4u.pl , onestat.com , webtrendslive.com , superstats.com , addfreestats.com

LINK:
[1] "Il topografo tra le righe":
http://www.gheminga.it/articolo.asp?art=3250
[2] I consigli di EFF:
http://www.eff.org/Privacy/search/searchtips.php
La notizia di Punto Informatico su AOL:
http://punto-informatico.it/p.aspx?id=1666793&r=PI

( Articolo originariamente pubblicato su Gheminga )


hosting
Iniziative che sponsorizziamo:
Scopri altri siti scout!
Sito precedente 5o sito precedente Home ScoutRing Lista dei Siti Sito Casuale Sito successivo 5o sito successivo
Informati e protesta contro il DRM!
Powered by Plone, the Open Source Content Management System