// Capitoli //
// Informazioni //

V. In aggiunta altre maliziose funzionalità

I filtri sugli algoritmi: banche dati preconfezionate e controllo degli utenti

La teoria dei grafi[1] è la base matematica per l'elaborazione di tutti gli algoritmi sulle reti, tra cui figura anche il PageRank. Questo ramo della matematica si occupa tra l'altro di studiare i metodi per gestire, creare, percorrere diverse tipologie di reti descrivibili attraverso grafi e le loro rispettive grandezze. La teoria dei grafi ha avuto un particolare sviluppo a partire dalla metà del XX secolo con l'introduzione dei calcolatori elettronici. Possiamo immaginare geometricamente un grafo come un insieme di punti nello spazio e di curve continue che connettono coppie di punti senza intersecarsi tra loro. Nella teoria dei grafi, si dice grafo (da non confondere con grafico) una figura costituita da punti, detti vertici o nodi, e da linee che li uniscono, dette lati o spigoli o archi[2].

Una rete è un particolare tipo di grafo, nelle quali è possibile assegnare un valore differente a ogni arco (un “peso”), che potrà essere utilizzato per generare valori di percorrenza diversi. Internet è un grafo e lo stesso si può dire per l'insieme delle pagine Web; il sistema di ricerca di Google è organizzato a partire da questo assunto.

Uno degli elementi fondamentali degli algoritmi sulle reti è il fattore tempo in relazione al numero di nodi esaminati. Il tempo di completamento di un percorso (o di una ricerca) che collega un nodo della rete a un altro dipende dal numero degli elementi della rete e varia sempre tra un valore minimo e un valore massimo, che possono essere anche molto differenti tra loro, a seconda dell'algoritmo che si utilizza per generare il percorso.

Nella rete delle pagine Web ogni pagina è un nodo del grafo complessivo e ogni link è un lato/spigolo/arco. Se consideriamo la premessa sul fattore tempo, appare evidente che i risultati proposti da Google come risultato di una qualsiasi interrogazione (tecnicamente, una query su database) non si possono appoggiare su una consultazione di “tutto” il suo ipotetico Internet.

Lo spider di Google è perennemente impegnato nell'arduo compito di copiare Internet nella sua base di dati; tuttavia, non è credibile che a ogni interrogazione il motore di ricerca sfogli puntualmente tutto il suo database per trovare i risultati più congrui. Il fattore chiave che consente di ottenere risultati quasi immediati dipende da un'oculata serie di limitazioni nella selezione generale, cioè, concretamente, dall'applicazione di particolari filtri. Data un'interrogazione al motore di ricerca, un filtro garantisce la velocità del risultato finale per mezzo di una serie di scarti e scelte studiati appositamente per limitare l'intervallo (range) dei possibili blocchi di dati da analizzare.

In questo modo Google può fornire risultati alle interrogazioni in tempi eccezionalmente rapidi. Tuttavia, se la ricerca diventa rapida, contemporaneamente risulta poco trasparente, cioè non del tutto coerente con i dati presenti complessivamente sulla porzione di rete indicizzata. In altre parole, i risultati della ricerca saranno ottenuti velocemente non solo grazie alla potenza di calcolo disponibile, ma anche e soprattutto perché i filtri permettono di ridurre il bacino di informazioni dalle quali attingere.

Il compito di un filtro consiste nell'operare drastiche selezioni sui nodi della rete in modo da escluderli (o valorizzarli) unitamente ad altri eventuali collegamenti associati. L'applicazione di questi dispositivi ha l'obiettivo di escludere (o includere) interi blocchi tra i risultati complessivi.

Tutto questo è possibile mediante l'uso di banche dati di ricerche preconfezionate, per cui a interrogazioni standard vengono fornite risposte standard, ma anche tramite la profilazione dell'utente basata sulle sue ricerche precedenti, in base alla sua lingua, alla sua posizione geografica ecc. In questo modo, un utente che compie abitualmente ricerche in italiano non interrogherà l'intera banca dati di Google, ma solo la porzione in italiano, con un evidente risparmio di tempo.

Su quantità di dati elevate, è impensabile impiegare algoritmi trasparenti, cioè che vadano a toccare tutti i nodi della rete; è necessario introdurre manipolazioni, semplificazioni o riduzioni delle possibilità di analisi. Questo per ragioni tecniche, di computabilità matematica in senso stretto, e anche, ovviamente, per motivi economici. Inoltre, senza peccare di ingiustificata malizia, in un sistema basato su approssimazioni dettate da filtri si può facilmente concepire l'inserimento di filtri ulteriori per aggiungere o spostare in posizioni visibili i risultati commerciali, a pagamento, oppure di semplice propaganda.

Tuttavia bisogna osservare che dal punto di vista di Google i filtri aggiuntivi non sono legati direttamente a un interesse economico, poiché non servono a vendere un prodotto, ma sono legati al fruitore, alle sue abitudini e ai suoi interessi personali. Google infatti vende pubblicità, non prodotti (o solo in minima parte, ad esempio i prodotti hardware come Google Mini e altri sistemi di indicizzazione per aziende): il suo interesse principale è dunque ottenere dati aggregati in base a parametri sui quali poter effettuare le campagne pubblicitarie con precisione. La personalizzazione dei risultati in base al destinatario è possibile sulla base di informazioni che Google stesso fornisce e che vengono raccolte nel modo meno invasivo possibile. Ad esempio, mailbox, blogs, hardisks virtuali, e altri servizi simili rappresentano altrettante banche dati utili alla profilazione degli utenti molto più di quanto si immagini.

I servizi “extra” messi a disposizione da Google, al di là del semplice motore di ricerca, sono perciò utili all'azienda per sperimentare nuove vie, ma anche e soprattutto perché svolgono un fondamentale ruolo di “accentratori di informazioni personali” degli utenti.

Un esempio eclatante sono state le mailbox di GMail, una sorta di hard disk virtuale presso Google (al momento, oltre 2GB di spazio online, in costante crescita), offerte attraverso un sistema di propagazione basato sul PageRank stesso. In breve, ogni nodo della rete di Google (utente) ha a disposizione un peso (un certo numero di inviti) e può usarlo per offrire lo stesso servizio (link) ai suoi conoscenti. Grazie a questo metodo ogni soggetto coinvolto viene controllato dal punto di vista dell'uso del servizio; al contempo, mette a disposizione di Google informazioni essenziali sui propri conoscenti e amici.

In un secondo tempo, il meccanismo si propaga alla rete delle persone invitate, che possono effettuare nuovi inviti: in questo modo si va a creare un grafo delle relazioni umane tra gli utenti di enorme valore strategico per la personalizzazione delle inserzioni pubblicitarie.

Se consideriamo tutte le informazioni che si posso estrapolare dall'invio di email (a chi, per quale ragione, in che lingua, in che formati, con quali parole chiave, con quali allegati, ecc.), possiamo immaginare che esista nella banca dati di Google, oltre a una copia forzatamente parziale ma significativa di Internet, anche una copia parziale, ma altrettanto significativa, delle relazioni umane, emotive, professionali dei fruitori del servizio.

In teoria i filtri servono semplicemente per rendere più rapida l'interrogazione e più rispondente alle esigenze degli individui; sono anche assolutamente necessari da un punto di vista tecnico. Tuttavia, il loro utilizzo dimostra come sia estremamente semplice per un soggetto di fatto egemone nel campo dei servizi di ricerca sfruttarne le peculiarità per approfittare dei dati a sua disposizione in senso commerciale e lesivo della privacy.

In breve: attualmente, la base di dati di Google, attraverso alcune parole chiave, è in grado di ordinare i risultati di una ricerca (query) in maniera diversificata a seconda del tipo di utente che si trova a servire, ovvero in base ai dati relativi a quell'utente che sono in suo possesso. Lungi dall'essere risultati “oggettivi”, i risultati di ogni ricerca sono quindi calibrati; anzi, l'utilizzo dei servizi di ricerca affina le capacità del sistema di “riconoscere” l'utente e servirgli risultati adeguati.

L'utilizzo di ogni servizio è subordinato all'accettazione di regolamenti e liberatorie da parte degli utenti, e Google in ogni caso si impegna a non divulgare informazioni riservate e personali in genere; è facile però pensare che Google possa commercializzare o sfruttare per i più diversi scopi i dati dei propri utenti. Senza considerare per il momento l'opportunità (sarebbe meglio dire: la certezza) che militari e forze di polizia di vario tipo possano richiedere e avere accesso a simili informazioni per millantate ragioni di “sicurezza nazionale”. L'aggiunta di filtri di ricerca al fine di personalizzare i risultati è in concreto lo scenario più semplice da immaginare.

I cookies di Google, biscotti che lasciano il segno

La profilazione[3] degli utenti si basa sempre su un sistema di selezione e riconoscimento. Nella rete di Internet distinguiamo fra metodi di profilazione esplicita e implicita. La profilazione esplicita necessita di un’apposita procedura di registrazione, che implica l’invio tramite un modulo (form) di dati personali da parte dell’utente. Le informazioni inviate, archiviate nella base dati, vengono analizzate attraverso una serie di parametri utili a segmentare in gruppi omogenei la totalità degli utenti registrati (età, sesso, professione, interessi, ecc.). La profilazione implicita viene invece realizzata tramite il tracciamento di utenti anonimi nel corso delle loro visite a un sito, tramite indirizzo IP oppure tramite cookies, ovvero biscotti. I cookies sono piccoli file di testo utilizzati dai siti web per immagazzinare alcune informazioni nel computer dell'utente. Nel momento in cui il fruitore ritorna su quei siti, il browser riconsegna le informazioni salvate nel “biscotto”. L'obiettivo è automatizzare alcune operazioni di autenticazione (login), ricordare eventuali operazioni in corso, ma soprattutto associare il visitatore a tutte le informazioni memorizzate nelle sue precedenti visite.

La maggior parte dei siti Internet che offrono servizi online utilizzano i cookies e Google non fa assolutamente eccezione[4]. Grazie alla combinazione di cookies e filtri aggiuntivi sugli algoritmi è possibile tenere traccia della navigazione di una persona e accumulare informazioni sulla sua “impronta”.

Facciamo un esempio: l'individuo X possiede un numero di telefono cellulare registrato a proprio nome, con il quale chiama la propria famiglia, alcuni amici e i colleghi di lavoro. Dopo un certo lasso di tempo decide di cancellare quel numero e di utilizzarne un altro non registrato a proprio nome, ritenendo in questo modo di proteggere la propria privacy. Con il nuovo telefono ristabilisce la sua cerchia di conoscenze, contattando la propria famiglia, alcuni amici e i colleghi di lavoro. Quella sequenza di “collegamenti sociali” (famiglia, amici, colleghi), risulta essere una sequenza unica tra tutte le telefonate del mondo, legata indissolubilmente al protagonista di questo esempio. Non è impossibile formalizzare una simile sequenza con un grafo che rappresenta i nodi e gli archi di una rete: i valori (i rispettivi “pesi” degli archi che collegano i nodi) potrebbero essere assegnati associando alla “vicinanza” un proporzionale grado di “amicizia” con il punto di partenza dell'analisi, cioè con il nostro ipotetico individuo X.

La rimozione dei cookies è quindi un'ottima pratica di difesa della privacy, ma un ragionamento analogo all'esempio precedente può facilmente essere modulato sull'utilizzo dei motori di ricerca. Tramite i cookies, cercando informazioni su alcuni specifici intervalli tematici, è infatti possibile identificare gruppi di persone, se non direttamente individui in base alla loro impronta univoca lasciata sulla rete.

La stessa traccia univoca che scandisce i nostri movimenti, i nostri contatti sociali (o telefonici), è unica quanto le preferenze, i gusti, le idiosincrasie, le passioni che ci distinguono dagli altri. Le nostre passioni sono, in questo caso, i siti che visitiamo, e soprattutto, le ricerche che effettuiamo durante la nostra navigazione. Questa mole di informazioni che noi forniamo a un qualunque motore di ricerca rende possibile la ricostruzione della nostra “impronta”[5].

Come ogni biscotto che si rispetti, anche quelli Internet hanno una data di scadenza. I siti Internet che consegnano al nostro browser un cookie sono obbligati a impostare una data di scadenza, ovvero una data dopo la quale il browser può procedere all'eliminazione dei dati contenuti nel cookie stesso. Non è banale utilizzare al meglio i cookies; è certamente degno di nota il fatto che Google abbia saputo sfruttare a suo vantaggio un artificio tecnico noto agli sviluppatori del mondo POSIX (lo standard internazionale che permette l'interoperabilità dei sistemi operativi Unix e Unix-like, che comprendono anche GNU/Linux). Infatti, la data di scadenza di Google è il 2038, ovvero pressoché la data massima impostabile in un cookies e ciò comporta che il browser dei nostri sistemi operativi non rimuoverà mai quel cookies e le informazioni in esso salvate[6].

Onanismo tecnologico: crea, ricerca e consuma i tuoi contenuti

È impossibile seguire le rapidissime evoluzioni e innovazioni “made in Google”: i rilasci di nuovi servizi si susseguono in maniera quasi convulsa, e diventa molto difficile capire quali siano realmente destinati ad avere un impatto nelle nostre vite e quali invece saranno dimenticati nel giro di qualche mese o settimana. Del resto, è anche poco interessante e utile perdersi in elaborazioni complicate, in tassonomie esaustive che inevitabilmente tralasciano eccezioni significative, se consideriamo l'elevata depauperabilità delle informazioni e delle innovazioni su Internet. La natura fluida e dinamica della rete scoraggia, se mai qualcuno ne sentisse ancora il bisogno, qualsiasi approccio totalizzante e onnicomprensivo, che si rivela velleitario nel momento stesso della sua farraginosa esposizione.

È tuttavia possibile abbozzare, da una prospettiva soggettiva e situata, una visione complessiva del fenomeno Google, senza addentrarci nelle specifiche tecniche né tanto meno in pronostici futuribili di scarsa attendibilità. È senz'altro rilevante l'estremizzazione della figura del “prosumer”, attraverso l'accento posto sul concetto di personalizzazione.

Google è noto per l'abitudine consolidata a rilasciare versioni beta, non definitive e ancora in fase di test, dei suoi servizi: questa dinamica, come abbiamo visto nel capitolo precedente, è direttamente mutuata dalle comunità di sviluppo del Free Software. Gli utenti, fornendo feedback, suggerimenti e impressioni d'uso, contribuiscono in maniera determinante all'affermazione o meno di un nuovo servizio: sono al tempo stesso produttori e fruitori dei servizi che utilizzano, figure ibride dette appunto prosumer[7].

Ponendosi come soggetto di mediazione globale dei contenuti del web, Google in sostanza vende tecnologie e risultati di ricerca (mediante la pubblicità) agli utenti, che da un lato tendono a essere creatori dei contenuti della rete, dall'altro i consumatori di quegli stessi contenuti attraverso i servizi di Google, che hanno modellato fortemente in prima persona.

Due esempi, apparentemente slegati fra loro, possono chiarire questo ciclo chiuso di produzione e consumo di contenuti: il Google Web Toolkit (GWT)[8] e la convergenza fra GTalk e Nokia[9].

Google ha rilasciato nel maggio 2006 il Google Web Toolkit, un framework che permette di sviluppare applicazioni AJAX attraverso il linguaggio Java. AJAX (Asynchronous JavaScript and XML) è una tecnica per sviluppare applicazioni web interattive e dinamiche usando una combinazione del classico HTML (o XHTML) con CSS per la parte visiva e JavaScript per mostrare dinamicamente le informazioni e interagire con esse. Siti estremamente dinamici, insomma, nei quali non è necessario attendere ogni volta il caricamento di tutte le informazioni della pagina. Gmail, ad esempio, utilizza AJAX. La novità è significativa perché in questo modo cambia l'approccio alla creazione delle applicazioni web, che vengono scritte in un linguaggio a oggetti di alto livello, Java, poi compilate dal GWT e rese compatibili con tutti i browser. Tuttavia, questa innovazione non giustifica l'annuncio in pompa magna dell'avvento di un fantomatico “web 2.0” che rivoluzionerà Internet rendendola adatta alle macchine. Infatti, tecnologie per la creazione di software multipiattaforma, per la condivisione dei propri bookmark, il social networking, l'aggregazione automatica dei dati, ecc. sono note da anni. Inoltre, l'ipocrisia di multinazionali come SUN che millantano l'ingresso nell'Era della Partecipazione (Partecipation Age), da una parte dimentica l'attitudine alla cooperazione in ambito informatico propria della cultura hacker da decenni, dall'altra spaccia per una grande rivoluzione l'uso degli strati più elementari (standardizzazione attraverso XML/RDF) delle innovazioni proposte da organismi come il W3C a proposito del web semantico[10].

Di certo AJAX e tecnologie affini risolvono alla radice il problema molto comune della portabilità dei siti web, che al momento sono difficilmente visualizzabili da tutti i browser. Il codice del framework è disponibile sotto licenza Apache, ovvero sostanzialmente Open Source, ma, come accade per le iniziative di code.google.com, alcune parti fondamentali (in questo caso, il compilatore Java-to-JavaScript e l’hosted web browser) vengono distribuite solo in binario e occorre sottoscrivere un’apposita licenza, che sostanzialmente vieta di ridistribuirli, di derivarne ulteriori prodotti e di includerli in prodotti commerciali. Inoltre, ogni volta che si usa l’hosted web browser, che permette di provare le applicazioni sulla propria macchina prima di pubblicarle su internet, viene contattato un server di Google, ufficialmente per verificare che si stia usando la versione più aggiornata del prodotto. È evidente però che si tratta di un metodo di controllo estremamente efficace, applicato agli sviluppatori invece che agli utenti. Certo, il codice prodotto è distribuibile liberamente, anche con scopi commerciali.

GWT è in pratica uno strumento semplice per creare siti perfettamente compatibili con i sistemi di indicizzazione di Google. Al momento, è necessario conoscere un linguaggio non banale come Java, ma non è avveniristico immaginare lo sviluppo di strumenti che permettano anche a un utente alle prime armi di posizionare sulla propria pagina web oggetti come barre degli strumenti, gallerie di immagini, menù di vario tipo e ogni sorta di oggetti web senza scrivere una riga di codice. Naturalmente esistono già programmi estremamente semplici per creare siti web (WYSIWYG, What You See Is What You Get); ma GWT è via web. Questi contenuti sarebbero quindi immediatamente pronti per essere fruiti su dispositivi fissi o mobili di qualsiasi tipo, purché siano in grado di accedere al web.

Immaginiamo ora che Google stringa accordi commerciali per la costruzione di hardware su misura, offrendo a chiunque usa i suoi servizi strumenti semplici per costruire pagine web visualizzabili su PC, palmari, ecc. e indicizzate nella maniera più semplice possibile dai suoi spider. Google infatti non fornisce programmi dietro pagamento di licenza, come Microsoft: ha bisogno, come sappiamo, di diffondere i propri standard per poter gestire più facilmente la sua economia di ricerca.

Ed ecco GTalk e Nokia. GoogleTalk è il servizio VoIP[11] di Google, integrato da poco nella casella di posta GMail, in modo che gli appartenenti alla “Google community” possano non solo mandarsi mail, ma anche chattare e parlare in tempo reale. A partire da fine maggio 2006 è disponibile sui nuovi dispositivi mobili di Nokia, chiamati “internet tablet”, sorta di cellulari evoluti pensati per navigare sul web. In questo modo Google entra dalla porta principale nel mondo della telefonia mobile, con la prospettiva di integrarsi ben presto con le reti senza fili pubbliche (wireless o wi-max) che cominciano a essere installate in diverse città, aeroporti, aree di servizio sulle autostrade, ecc. Una prospettiva di convergenza sul video è altrettanto plausibile: video.google.com è una miniera di video, e la televisione sui cellulari è il prossimo passo.

In altre parole, Google fornisce gli strumenti per creare contenuti secondo i suoi standard. Questa è la personalizzazione estrema, l'equivalente del meccanismo “code lunghe” (che permette di fornire esattamente il prodotto personalizzato per ogni consumatore) nel campo della creazione di contenuti web: l'utente crea “esattamente” quello che vuole nel formato standard di Google. La decentralizzazione totale a livello di creazione di contenuti è parallela alla decentralizzazione totale della pubblicità, e quindi della fornitura di prodotti “personalizzati”.

Un sistema pervasivo per imporre uno standard, ma formalmente “democratico” perché nelle mani degli utenti, a portata di click, a portata di browser. Quella che viene spacciata per democrazia elettronica si trasforma in una standardizzazione che consente di digerire i contenuti creati da una miriade di utenti e associare ad essi la pubblicità più adatta.

Browser come ambienti di sviluppo

L'esplosione di nuovi e sempre più potenti servizi web a partire dal 2005 sta trasformando il browser da strumento di semplice navigazione a strumento di sviluppo. Un ampio ventaglio di tecnologie stravolge gli standard di programmazione web correnti, offrendo agli sviluppatori uno strumento facile, multipiattaforma, completo e affidabile: il browser, appunto.

Negli ultimi anni si è lentamente modellato un nuovo stile nella creazione di siti internet, anche grazie alle maggiori attenzioni verso la portabilità e l'accessibilità dei contenuti: ne sono un chiaro indizio la diffusione dei fogli di stile (Cascading Style Sheet, standard CSS e CSS2) invece dell'HTML nudo e crudo, dei validatori, dello stesso standard XML. Grafici e web designer trovano nei browser sempre più sofisticati e rispettosi dei vari standard ottimi alleati, riuscendo a realizzare siti conformi alle norme per la visualizzazione sui dispositivi più disparati e contemporaneamente a mantenere, e anzi ampliare, la propria libertà d'espressione.

In particolare, la nascita di browser come Mozilla Firefox e la loro rapida diffusione ha consentito una forte interazione fra gli sviluppatori di siti internet e gli sviluppatori di questo browser, giungendo in breve tempo a sanare quasi tutti i bug e le incompatibilità sugli standard web.  L'incompatibilità fra Internet Explorer, Opera, e molti altri browser proprietari e non, è un problema noto a chiunque abbia creato pagine web. La sinergia sviluppata da Mozilla, apparentemente semplice e forse ovvia, costituisce una novità assoluta nella storia dei browser. Un'altra caratteristica interessante dei prodotti Mozilla è la struttura modulare sviluppata intorno al motore di rendering Gecko, che consente l'aggiunta di qualsiasi funzionalità immaginabile: tra i più noti e diffusi, strumenti per eliminare la pubblicità dalle pagine web, per avere sempre sott'occhio le previsioni del tempo o l'andamento della borsa. 

I browser sono insomma strumenti sempre più affidabili, permettono la creazione di siti internet complessi e assumono le caratteristiche di veri e propri programmi: tendono addirittura a sostituire gli applicativi di uso comune. L'esempio lampante sono i vari strumenti per ufficio proposti da Google come alternativa web alla suite di produttività Microsoft Office e anche a Openoffice[12]. Al momento, è possibile utilizzare Writely (prodotto da una società acquisita) come elaboratore di testi, Google Spreadsheets come foglio elettronico, Google Page Creator per creare pagine web velocemente. Tutti i servizi sono in fase di betatesting a invito: è necessario avere un account Google per utilizzarli, ovviamente sotto stretto controllo.

Gli sviluppatori, da parte loro, spostano il loro interesse sempre più verso il web, anche grazie all'utilizzo di strumenti come GWT. Naturalmente Microsoft non sta a guardare e ha già pronta la versione beta (allineandosi alla strategia di “betatesting diffuso” di Google, derivata come sappiamo dalle pratiche del Free Software) di Office System (ovvero Office 2007), che prevede un'integrazione sempre più spinta con gli strumenti web, pur rimanendo un applicativo da installare.

I browser si stanno dunque trasformando in ambienti di sviluppo completi per la creazione di contenuti standard, ovvero SDK (Standard Development Kit). Dove sta realmente l'innovazione che ha reso possibile trasformare i browser in SDK? Sicuramente, possiamo parlare di un nuovo paradigma della programmazione: si possono ora creare programmi realmente multipiattaforma, distribuiti, lato client, residenti sui server, facilmente aggiornabili, e senza bisogno di complessi framework da installare sui computer degli utenti. I contenuti, compresi i dati personali degli utenti, sono sempre più stoccati su macchine remote (ad esempio i server di Google), a cui si accede via web, cioè attraverso browser.

Spesso la scelta di browser Open Source come Mozilla è motivata dalla loro semplicità di configurazione, e dalla disponibilità di numerose estensioni potenti e gratuite. Gli sviluppatori si basano su questi browser per implementare programmi via via sempre più complessi e strutturati. La nascita di programmi basati soltanto sul web provoca due fenomeni entrambi con forti ricadute sul mercato e sugli utenti: i programmi binari da installare diventano obsoleti e i browser diventano i programmi più complessi, spesso fortemente modulari, e più appetibili sul mercato dell'IT. Quindi in futuro possiamo aspettarci meno programmi .exe (Windows), .dmg (Macintosh), o pacchetti Unix installabili, e più strumenti integrati nei browser, dalle estensioni per leggere i feed RSS al podcasting, da Gmail a software completi per ufficio.

Il controllo capillare che può essere effettuato da parte dei fornitori di servizi web rende questa dinamica potenzialmente pericolosa per tutti noi. Chi offre i servizi infatti conosce in maniera esatta l'identità digitale dei propri fruitori, il tempo di utilizzo del software e i contenuti in elaborazione poiché controlla ogni accesso e dettaglio relativo all'uso degli strumenti che mette a disposizione.

Si tratta a livello tecnico di un'interazione continua tra client (il browser) e il server (chi offre i servizi), dove quest'ultimo è in grado di monitorare costantemente le richieste, i tempi e gli elaborati finali. Muta anche lo scenario della sicurezza: con la scusa di fornire un prodotto “al sicuro” dalle grinfie di cracker e hacker di vario tipo, i meccanismi di autenticazione non si trovano più nel programma compilato e rilasciato senza sorgenti, perché avvengono direttamente sui server dei distributori. Quindi per “entrare” in un software non è più sufficiente disassemblare il codice sulla propria macchina per comprendere come funziona, ma diventa necessario “bucare” server remoti.

Privacy, Paranoie, Poteri

La strategia dell'accumulo ha reso Google un soggetto in grado di mettere in difficoltà addirittura Microsoft, innescando una guerra senza esclusione di colpi per la standardizzazione e il controllo dell'accesso al web e alle reti che usiamo ogni giorno. In quanto soggetto di mediazione globale di informazioni, il fenomeno Google riguarda in maniera diretta tutti i fruitori di informazioni digitali, cioè tutti noi. Percorrere la storia di Google significa perciò ripercorrere la nostra storia di esploratori di internet e del web, che troppo spesso abbiamo delegato la gestione delle nostre informazioni, dei nostri siti, gallerie di immagini, caselle di posta, blog, sms, conversazioni telefoniche, ecc. ad aziende tutt'altro che disinteressate.

La strategia dell'oggettività, che Google attua ponendo l'accento sulla ricerca, sull'eccellenza accademica, sulla superiorità tecnologica, sull'accurato studio delle interfacce, è un velo che nasconde l'inquietante prospettiva di un unico punto d'accesso ai dati prodotti da utenti ingenui.

La strategia dell'Open Source, infine, è necessaria a Google per cooptare il metodo di sviluppo cooperativo proprio delle comunità digitali, rendendolo funzionale alla propria “mission”. Anche in questo caso abbiamo visto come Google si muova con estrema disinvoltura, proponendo metodi “nuovi” per sfruttare dinamiche note: Summer of Code ne è l'esempio lampante.

L'attività di Google, insomma, costituisce un pericolo evidente per chiunque abbia minimamente a cuore le tematiche della privacy e, in senso più ampio, della costruzione consapevole del proprio alter ego digitale. Si tratta dell'emersione di un conglomerato di potere che già oggi influenza pesantemente la vita di troppi individui. Google detiene informazioni riservate che analizza senza sosta per promuovere una personalizzazione sempre più accurata del cancro pubblicitario. E poiché l'accumulo di potere generalmente favorisce l'ansia di dominio, è opportuno indagare a fondo questo fenomeno.

Non  esistono risposte globali in grado di risolvere una volta per tutte il problema della privacy. Il Grande Fratello non esiste, o quantomeno, come ogni paranoia che esclude orizzonti di liberazione e oscura possibili vie di fuga, è utile e funzionale all'esercizio del potere dominante.

Nascondere, crittografare, steganografare sono pratiche utili, ma non sono soluzioni definitive: l'obiettivo e il desiderio rimangono la comunicazione e la condivisione, che solo la “pubblicazione”, ovvero il movimento di “rendere pubblico”, consente. L'ossessione per la privacy scade molto rapidamente nella paranoia del complotto; in questo senso, non è utile indulgere nella costruzione di complicate alternative per creare reti assolutamente sicure e impenetrabili. La tecnologia è un'occasione di apertura e condivisione, poiché usare la macchine significa usare creature ibride, artefatti materiali (appartengono in questo senso al mondo naturale) investiti di valori e significati culturali (appartenenti cioè all'universo della “cultura”). Le reti sono espressione di una dinamica coevolutiva di macchine meccaniche, biologiche e significanti: la tecnologia è meticcia per nascita. Creare reti significa infatti collegare macchine di vario tipo; significa creare metodi di condivisione, metodi di traduzione, metodi di scambio: non è possibile rimanere chiusi in sé stessi, è necessario mettersi in gioco e cambiare.

C'è bisogno di ricerca e di analisi competenti; la denuncia dei meccanismi del dominio tecnocratico urge più che mai. Abdicare al pensiero critico equivale invece a soccombere alle paranoie del controllo, che pure si fa sempre più pervasivo. È possibile utilizzare in senso paradigmatico la storia di Google per tracciare vie di fuga non ingenue, per immaginare pratiche di autogestione delle tecnologie. Google è infatti il punto d'incontro fra lo stile meritocratico dell'accademia, la spinta all'innovazione a ogni costo e il capitalismo finanziario più avanzato.

È l'occasione giusta per sviluppare reti autonome e decentrate, per contrapporre il desiderio di “esplorare” e “percorrere” le reti alla necessità di “accedere” ai dati, per focalizzare l'attenzione sul percorso invece che sul risultato.

 



[1]              La letteratura sui grafi è sterminata; per un primo approccio, si veda lomonima categoria di wikipedia, http://it.wikipedia.org/wiki/Categoria:Teoria_dei_grafi

[2]              Più formalmente, dati un insieme V di nodi e un insieme E di archi, un grafo G è un insieme G = (V, E).

[3]              La profilazione è un settore chiave delleconomia della ricerca, in continua espansione, che comprende concetti come: Clickstream analysis, CRM (Customer relationship management), Data mart, Data mining, Data warehouse, OLAP (Online Analytical Processing). Per unintroduzione elementare allargomento, si veda: http://www.diodati.org/scritti/2002/g_stat/stat05.asp. Interessante notare che le tecniche di profilazione dei consumatori derivano in ultima analisi dalle attività di profiling criminale.

[4]              Per un approfondimento sui cookies volatili, si vedano in particolare: http://www.google-watch.org/cgi-bin/cookie.htm e http://www.scroogle.org/. Google Watch spiega la gestione dei cookies da parte di Google e metodi per difendersi dalla profilazione; Scroogle si prefigge di anonimizzare le ricerche verso google, facendo in modo che il cookie eterno di Google non possa consentire un tracciamento storico sulle ricerche effettuate dallutente.

[5]              Per un approfondimento sulla tematica, si veda lintervento La privacy e i motori di ricerca, di Claudio Agosti vecna - s0ftpj.org in occasione del convegno e-privacy - fra Trusted Computing e Data Retention, tenuto a Firenze il 19-20 maggio 2006 http://e-privacy.firenze.linux.it/, disponibile allindirizzo http://e-privacy.firenze.linux.it/atti/e-privacy_2006_Agosti_Privacy_e_motori_di_ricerca.pdf

[6]              Si veda in proposito lappendice I: La fine del mondo in un biscotto.

[7]              Productor-consumer, produttori-consumatori.

[8]              http://code.google.com/webtoolkit/

[10]             A proposito dellimplementazione del web semantico, ben altro rispetto al web 2.0, si veda la roadmap del 1998 di Tim Berners-Lee, http://www.w3.org/DesignIssues/Semantic.html; il coordinamento del W3C, http://www.w3.org/2001/sw/; un documento introduttivo alla filosofia del web semantico: http://www2.autistici.org/bakunin/doc/reti/index.xml

[11]             Lacronimo VoIP, Voice over IP (Voce tramite protocollo Internet), indica una tecnologia che rende possibile effettuare una conversazione telefonica sfruttando una connessione internet o unaltra rete dedicata che utilizza il protocollo IP, anziché passare attraverso la normale linea di trasmissione telefonica. Si veda http://it.wikipedia.org/wiki/Voice_over_IP. Non esistono solo Skype e Google che forniscono servizi VoIP, ma naturalmente anche programmi free, come Asterisk, http://www.asterisk.org/

[12]             Esistono anche suite complete per ufficio utilizzabili via web, come gOffice, prodotto dalla società Silveroffice, Inc. di San Francisco, che afferma: gOFFICE non è affiliata a Google, Inc., ma ci piace pensare che sarà una bella lotta finchè la loro missione rimarrà lindicizzazione di tutte le informazioni del mondo, mentre la nostra è di aiutare la gente a creare quelle informazioni. Abbiamo perciò bisogno di Google per ricercare i contenuti che i nostri utenti creano con gOFFICE! Forse dovremmo aggiungere una scheda alla nostra barra degli strumenti chiamata ricerca... www.goffice.com