V. In aggiunta altre
maliziose funzionalità
I filtri sugli
algoritmi: banche dati preconfezionate e controllo degli utenti
La teoria dei grafi[1] è la base matematica per l'elaborazione di
tutti gli algoritmi sulle reti, tra cui figura anche il PageRank. Questo ramo
della matematica si occupa tra l'altro di studiare i metodi per gestire,
creare, percorrere diverse tipologie di reti descrivibili attraverso grafi e le
loro rispettive grandezze. La teoria dei grafi ha avuto un particolare sviluppo
a partire dalla metà del XX secolo con l'introduzione dei calcolatori
elettronici. Possiamo immaginare geometricamente un grafo come un insieme di
punti nello spazio e di curve continue che connettono coppie di punti senza
intersecarsi tra loro. Nella teoria dei grafi, si dice grafo (da non confondere con grafico) una figura costituita da punti, detti vertici o nodi, e da linee che li uniscono, dette lati o spigoli o archi[2].
Una rete è un particolare tipo di grafo,
nelle quali è possibile assegnare un valore differente a ogni arco (un “peso”),
che potrà essere utilizzato per generare valori di percorrenza diversi.
Internet è un grafo e lo stesso si può dire per l'insieme delle pagine Web; il
sistema di ricerca di Google è organizzato a partire da questo assunto.
Uno degli elementi fondamentali degli
algoritmi sulle reti è il fattore tempo in relazione al numero di nodi
esaminati. Il tempo di completamento di un percorso (o di una ricerca) che
collega un nodo della rete a un altro dipende dal numero degli elementi della rete
e varia sempre tra un valore minimo e un valore massimo, che possono essere
anche molto differenti tra loro, a seconda dell'algoritmo che si utilizza per
generare il percorso.
Nella rete delle pagine Web ogni pagina è
un nodo del grafo complessivo e ogni link è un lato/spigolo/arco. Se
consideriamo la premessa sul fattore tempo, appare evidente che i risultati
proposti da Google come risultato di una qualsiasi interrogazione
(tecnicamente, una query su database) non si possono appoggiare su una consultazione
di “tutto” il suo ipotetico Internet.
Lo spider di Google è perennemente
impegnato nell'arduo compito di copiare Internet nella sua base di dati;
tuttavia, non è credibile che a ogni interrogazione il motore di ricerca sfogli
puntualmente tutto il suo database per trovare i risultati più congrui. Il
fattore chiave che consente di ottenere risultati quasi immediati dipende da
un'oculata serie di limitazioni nella selezione generale, cioè, concretamente,
dall'applicazione di particolari filtri. Data un'interrogazione al motore di
ricerca, un filtro garantisce la velocità del risultato finale per mezzo di una
serie di scarti e scelte studiati appositamente per limitare l'intervallo (range) dei possibili blocchi di dati da analizzare.
In questo modo Google può fornire risultati
alle interrogazioni in tempi eccezionalmente rapidi. Tuttavia, se la ricerca
diventa rapida, contemporaneamente risulta poco trasparente, cioè non del tutto
coerente con i dati presenti complessivamente sulla porzione di rete indicizzata.
In altre parole, i risultati della ricerca saranno ottenuti velocemente non
solo grazie alla potenza di calcolo disponibile, ma anche e soprattutto perché
i filtri permettono di ridurre il bacino di informazioni dalle quali attingere.
Il compito di un filtro consiste
nell'operare drastiche selezioni sui nodi della rete in modo da escluderli (o
valorizzarli) unitamente ad altri eventuali collegamenti associati.
L'applicazione di questi dispositivi ha l'obiettivo di escludere (o includere)
interi blocchi tra i risultati complessivi.
Tutto questo è possibile mediante l'uso di
banche dati di ricerche preconfezionate, per cui a interrogazioni standard
vengono fornite risposte standard, ma anche tramite la profilazione dell'utente
basata sulle sue ricerche precedenti, in base alla sua lingua, alla sua
posizione geografica ecc. In questo modo, un utente che compie abitualmente
ricerche in italiano non interrogherà l'intera banca dati di Google, ma solo la
porzione in italiano, con un evidente risparmio di tempo.
Su quantità di dati elevate, è impensabile
impiegare algoritmi trasparenti, cioè che vadano a toccare tutti i nodi della
rete; è necessario introdurre manipolazioni, semplificazioni o riduzioni delle
possibilità di analisi. Questo per ragioni tecniche, di computabilità
matematica in senso stretto, e anche, ovviamente, per motivi economici.
Inoltre, senza peccare di ingiustificata malizia, in un sistema basato su
approssimazioni dettate da filtri si può facilmente concepire l'inserimento di
filtri ulteriori per aggiungere o spostare in posizioni visibili i risultati
commerciali, a pagamento, oppure di semplice propaganda.
Tuttavia bisogna osservare che dal punto di
vista di Google i filtri aggiuntivi non sono legati direttamente a un interesse
economico, poiché non servono a vendere un prodotto, ma sono legati al
fruitore, alle sue abitudini e ai suoi interessi personali. Google infatti
vende pubblicità, non prodotti (o solo in minima parte, ad esempio i prodotti
hardware come Google Mini e altri sistemi di indicizzazione per aziende): il
suo interesse principale è dunque ottenere dati aggregati in base a parametri
sui quali poter effettuare le campagne pubblicitarie con precisione. La
personalizzazione dei risultati in base al destinatario è possibile sulla base
di informazioni che Google stesso fornisce e che vengono raccolte nel modo meno
invasivo possibile. Ad esempio, mailbox, blogs, hardisks virtuali, e altri
servizi simili rappresentano altrettante banche dati utili alla profilazione
degli utenti molto più di quanto si immagini.
I servizi “extra” messi a disposizione da
Google, al di là del semplice motore di ricerca, sono perciò utili all'azienda
per sperimentare nuove vie, ma anche e soprattutto perché svolgono un
fondamentale ruolo di “accentratori di informazioni personali” degli utenti.
Un esempio eclatante sono state le mailbox
di GMail, una sorta di hard disk virtuale presso Google (al momento, oltre 2GB
di spazio online, in costante crescita), offerte attraverso un sistema di
propagazione basato sul PageRank stesso. In breve, ogni nodo della rete di
Google (utente) ha a disposizione un peso (un certo numero di inviti) e può
usarlo per offrire lo stesso servizio (link) ai suoi conoscenti. Grazie a
questo metodo ogni soggetto coinvolto viene controllato dal punto di vista
dell'uso del servizio; al contempo, mette a disposizione di Google informazioni
essenziali sui propri conoscenti e amici.
In un secondo tempo, il meccanismo si
propaga alla rete delle persone invitate, che possono effettuare nuovi inviti:
in questo modo si va a creare un grafo delle relazioni umane tra gli utenti di
enorme valore strategico per la personalizzazione delle inserzioni
pubblicitarie.
Se consideriamo tutte le informazioni che
si posso estrapolare dall'invio di email (a chi, per quale ragione, in che
lingua, in che formati, con quali parole chiave, con quali allegati, ecc.),
possiamo immaginare che esista nella banca dati di Google, oltre a una copia
forzatamente parziale ma significativa di Internet, anche una copia parziale,
ma altrettanto significativa, delle relazioni umane, emotive, professionali dei
fruitori del servizio.
In teoria i filtri servono semplicemente
per rendere più rapida l'interrogazione e più rispondente alle esigenze degli
individui; sono anche assolutamente necessari da un punto di vista tecnico.
Tuttavia, il loro utilizzo dimostra come sia estremamente semplice per un
soggetto di fatto egemone nel campo dei servizi di ricerca sfruttarne le
peculiarità per approfittare dei dati a sua disposizione in senso commerciale e
lesivo della privacy.
In breve: attualmente, la base di dati di
Google, attraverso alcune parole chiave, è in grado di ordinare i risultati di
una ricerca (query) in maniera diversificata a seconda del
tipo di utente che si trova a servire, ovvero in base ai dati relativi a
quell'utente che sono in suo possesso. Lungi dall'essere risultati “oggettivi”,
i risultati di ogni ricerca sono quindi calibrati; anzi, l'utilizzo dei servizi
di ricerca affina le capacità del sistema di “riconoscere” l'utente e servirgli
risultati adeguati.
L'utilizzo di ogni servizio è subordinato
all'accettazione di regolamenti e liberatorie da parte degli utenti, e Google
in ogni caso si impegna a non divulgare informazioni riservate e personali in
genere; è facile però pensare che Google possa commercializzare o sfruttare per
i più diversi scopi i dati dei propri utenti. Senza considerare per il momento
l'opportunità (sarebbe meglio dire: la certezza) che militari e forze di
polizia di vario tipo possano richiedere e avere accesso a simili informazioni
per millantate ragioni di “sicurezza nazionale”. L'aggiunta di filtri di
ricerca al fine di personalizzare i risultati è in concreto lo scenario più
semplice da immaginare.
I
cookies di Google, biscotti che lasciano il segno
La profilazione[3] degli utenti si basa sempre su un sistema
di selezione e riconoscimento. Nella rete di Internet distinguiamo fra metodi
di profilazione esplicita e implicita. La profilazione esplicita necessita di
un’apposita procedura di registrazione, che implica l’invio tramite un modulo (form) di dati personali da parte dell’utente. Le informazioni inviate,
archiviate nella base dati, vengono analizzate attraverso una serie di
parametri utili a segmentare in gruppi omogenei la totalità degli utenti
registrati (età, sesso, professione, interessi, ecc.). La profilazione
implicita viene invece realizzata tramite il tracciamento di utenti anonimi nel
corso delle loro visite a un sito, tramite indirizzo IP oppure tramite cookies, ovvero biscotti. I cookies sono piccoli file di testo utilizzati dai
siti web per immagazzinare alcune informazioni nel computer dell'utente. Nel
momento in cui il fruitore ritorna su quei siti, il browser riconsegna le
informazioni salvate nel “biscotto”. L'obiettivo è automatizzare alcune
operazioni di autenticazione (login), ricordare eventuali operazioni in corso,
ma soprattutto associare il visitatore a tutte le informazioni memorizzate
nelle sue precedenti visite.
La maggior parte dei siti Internet che
offrono servizi online utilizzano i cookies e Google non fa assolutamente
eccezione[4]. Grazie alla combinazione di cookies e
filtri aggiuntivi sugli algoritmi è possibile tenere traccia della navigazione
di una persona e accumulare informazioni sulla sua “impronta”.
Facciamo un esempio: l'individuo X possiede
un numero di telefono cellulare registrato a proprio nome, con il quale chiama
la propria famiglia, alcuni amici e i colleghi di lavoro. Dopo un certo lasso
di tempo decide di cancellare quel numero e di utilizzarne un altro non
registrato a proprio nome, ritenendo in questo modo di proteggere la propria
privacy. Con il nuovo telefono ristabilisce la sua cerchia di conoscenze,
contattando la propria famiglia, alcuni amici e i colleghi di lavoro. Quella
sequenza di “collegamenti sociali” (famiglia, amici, colleghi), risulta essere
una sequenza unica tra tutte le telefonate del mondo, legata indissolubilmente
al protagonista di questo esempio. Non è impossibile formalizzare una simile
sequenza con un grafo che rappresenta i nodi e gli archi di una rete: i valori
(i rispettivi “pesi” degli archi che collegano i nodi) potrebbero essere
assegnati associando alla “vicinanza” un proporzionale grado di “amicizia” con
il punto di partenza dell'analisi, cioè con il nostro ipotetico individuo X.
La rimozione dei cookies è quindi un'ottima pratica di difesa della privacy, ma un ragionamento
analogo all'esempio precedente può facilmente essere modulato sull'utilizzo dei
motori di ricerca. Tramite i cookies, cercando informazioni su alcuni specifici
intervalli tematici, è infatti possibile identificare gruppi di persone, se non
direttamente individui in base alla loro impronta univoca lasciata sulla rete.
La stessa traccia univoca che scandisce i
nostri movimenti, i nostri contatti sociali (o telefonici), è unica quanto le
preferenze, i gusti, le idiosincrasie, le passioni che ci distinguono dagli
altri. Le nostre passioni sono, in questo caso, i siti che visitiamo, e
soprattutto, le ricerche che effettuiamo durante la nostra navigazione. Questa
mole di informazioni che noi forniamo a un qualunque motore di ricerca rende
possibile la ricostruzione della nostra “impronta”[5].
Come ogni biscotto che si rispetti, anche
quelli Internet hanno una data di scadenza. I siti Internet che consegnano al
nostro browser un cookie sono obbligati a impostare una data di
scadenza, ovvero una data dopo la quale il browser può procedere
all'eliminazione dei dati contenuti nel cookie stesso. Non
è banale utilizzare al meglio i cookies; è
certamente degno di nota il fatto che Google abbia saputo sfruttare a suo
vantaggio un artificio tecnico noto agli sviluppatori del mondo POSIX (lo
standard internazionale che permette l'interoperabilità dei sistemi operativi
Unix e Unix-like, che comprendono anche GNU/Linux). Infatti, la data di
scadenza di Google è il 2038, ovvero pressoché la data massima impostabile in
un cookies e ciò comporta che il browser dei nostri
sistemi operativi non rimuoverà mai quel cookies e le
informazioni in esso salvate[6].
Onanismo
tecnologico: crea, ricerca e consuma i tuoi contenuti
È impossibile seguire le rapidissime
evoluzioni e innovazioni “made in Google”: i rilasci di nuovi servizi si
susseguono in maniera quasi convulsa, e diventa molto difficile capire quali
siano realmente destinati ad avere un impatto nelle nostre vite e quali invece
saranno dimenticati nel giro di qualche mese o settimana. Del resto, è anche
poco interessante e utile perdersi in elaborazioni complicate, in tassonomie
esaustive che inevitabilmente tralasciano eccezioni significative, se
consideriamo l'elevata depauperabilità delle informazioni e delle innovazioni
su Internet. La natura fluida e dinamica della rete scoraggia, se mai qualcuno
ne sentisse ancora il bisogno, qualsiasi approccio totalizzante e
onnicomprensivo, che si rivela velleitario nel momento stesso della sua
farraginosa esposizione.
È tuttavia possibile abbozzare, da una
prospettiva soggettiva e situata, una visione complessiva del fenomeno Google,
senza addentrarci nelle specifiche tecniche né tanto meno in pronostici
futuribili di scarsa attendibilità. È senz'altro rilevante l'estremizzazione
della figura del “prosumer”, attraverso l'accento posto sul concetto
di personalizzazione.
Google è noto per l'abitudine consolidata a
rilasciare versioni beta, non definitive e ancora in fase di test, dei suoi
servizi: questa dinamica, come abbiamo visto nel capitolo precedente, è
direttamente mutuata dalle comunità di sviluppo del Free Software. Gli utenti,
fornendo feedback, suggerimenti e impressioni d'uso, contribuiscono in maniera
determinante all'affermazione o meno di un nuovo servizio: sono al tempo stesso
produttori e fruitori dei servizi che utilizzano, figure ibride dette appunto prosumer[7].
Ponendosi come soggetto di mediazione
globale dei contenuti del web, Google in sostanza vende tecnologie e risultati
di ricerca (mediante la pubblicità) agli utenti, che da un lato tendono a
essere creatori dei contenuti della rete, dall'altro i consumatori di quegli
stessi contenuti attraverso i servizi di Google, che hanno modellato fortemente
in prima persona.
Due esempi, apparentemente slegati fra
loro, possono chiarire questo ciclo chiuso di produzione e consumo di
contenuti: il Google Web Toolkit (GWT)[8] e la convergenza fra GTalk e Nokia[9].
Google ha rilasciato nel maggio 2006 il
Google Web Toolkit, un framework che permette di sviluppare applicazioni AJAX
attraverso il linguaggio Java. AJAX (Asynchronous JavaScript and XML) è una
tecnica per sviluppare applicazioni web interattive e dinamiche usando una
combinazione del classico HTML (o XHTML) con CSS per la parte visiva e
JavaScript per mostrare dinamicamente le informazioni e interagire con esse.
Siti estremamente dinamici, insomma, nei quali non è necessario attendere ogni
volta il caricamento di tutte le informazioni della pagina. Gmail, ad esempio,
utilizza AJAX. La novità è significativa perché in questo modo cambia
l'approccio alla creazione delle applicazioni web, che vengono scritte in un
linguaggio a oggetti di alto livello, Java, poi compilate dal GWT e rese compatibili
con tutti i browser. Tuttavia, questa innovazione non giustifica l'annuncio in
pompa magna dell'avvento di un fantomatico “web 2.0” che rivoluzionerà Internet
rendendola adatta alle macchine. Infatti, tecnologie per la creazione di
software multipiattaforma, per la condivisione dei propri bookmark, il social networking, l'aggregazione automatica dei dati, ecc.
sono note da anni. Inoltre, l'ipocrisia di multinazionali come SUN che
millantano l'ingresso nell'Era della Partecipazione (Partecipation Age), da una parte dimentica l'attitudine alla
cooperazione in ambito informatico propria della cultura hacker da decenni,
dall'altra spaccia per una grande rivoluzione l'uso degli strati più elementari
(standardizzazione attraverso XML/RDF) delle innovazioni proposte da organismi
come il W3C a proposito del web semantico[10].
Di certo AJAX e tecnologie affini risolvono
alla radice il problema molto comune della portabilità dei siti web, che al
momento sono difficilmente visualizzabili da tutti i browser. Il codice del
framework è disponibile sotto licenza Apache, ovvero sostanzialmente Open
Source, ma, come accade per le iniziative di code.google.com, alcune parti
fondamentali (in questo caso, il compilatore Java-to-JavaScript e l’hosted web browser) vengono distribuite solo in binario e
occorre sottoscrivere un’apposita licenza, che sostanzialmente vieta di
ridistribuirli, di derivarne ulteriori prodotti e di includerli in prodotti
commerciali. Inoltre, ogni volta che si usa l’hosted web browser,
che permette di provare le applicazioni sulla propria macchina prima di
pubblicarle su internet, viene contattato un server di Google, ufficialmente
per verificare che si stia usando la versione più aggiornata del prodotto. È
evidente però che si tratta di un metodo di controllo estremamente efficace,
applicato agli sviluppatori invece che agli utenti. Certo, il codice prodotto è
distribuibile liberamente, anche con scopi commerciali.
GWT è in pratica uno strumento semplice per
creare siti perfettamente compatibili con i sistemi di indicizzazione di
Google. Al momento, è necessario conoscere un linguaggio non banale come Java,
ma non è avveniristico immaginare lo sviluppo di strumenti che permettano anche
a un utente alle prime armi di posizionare sulla propria pagina web oggetti
come barre degli strumenti, gallerie di immagini, menù di vario tipo e ogni
sorta di oggetti web senza scrivere una riga di codice. Naturalmente esistono
già programmi estremamente semplici per creare siti web (WYSIWYG, What You See Is What You Get); ma GWT è via web. Questi contenuti
sarebbero quindi immediatamente pronti per essere fruiti su dispositivi fissi o
mobili di qualsiasi tipo, purché siano in grado di accedere al web.
Immaginiamo ora che Google stringa accordi
commerciali per la costruzione di hardware su misura, offrendo a chiunque usa i
suoi servizi strumenti semplici per costruire pagine web visualizzabili su PC,
palmari, ecc. e indicizzate nella maniera più semplice possibile dai suoi
spider. Google infatti non fornisce programmi dietro pagamento di licenza, come
Microsoft: ha bisogno, come sappiamo, di diffondere i propri standard per poter
gestire più facilmente la sua economia di ricerca.
Ed ecco GTalk e Nokia. GoogleTalk è il
servizio VoIP[11] di Google, integrato da poco nella casella
di posta GMail, in modo che gli appartenenti alla “Google community” possano
non solo mandarsi mail, ma anche chattare e parlare in tempo reale. A partire
da fine maggio 2006 è disponibile sui nuovi dispositivi mobili di Nokia,
chiamati “internet tablet”, sorta di cellulari evoluti pensati per navigare sul
web. In questo modo Google entra dalla porta principale nel mondo della
telefonia mobile, con la prospettiva di integrarsi ben presto con le reti senza
fili pubbliche (wireless o wi-max) che
cominciano a essere installate in diverse città, aeroporti, aree di servizio
sulle autostrade, ecc. Una prospettiva di convergenza sul video è altrettanto
plausibile: video.google.com è una miniera di video, e la televisione sui
cellulari è il prossimo passo.
In altre parole, Google fornisce gli
strumenti per creare contenuti secondo i suoi standard. Questa è la
personalizzazione estrema, l'equivalente del meccanismo “code lunghe” (che
permette di fornire esattamente il prodotto personalizzato per ogni
consumatore) nel campo della creazione di contenuti web: l'utente crea “esattamente”
quello che vuole nel formato standard di Google. La decentralizzazione totale a
livello di creazione di contenuti è parallela alla decentralizzazione totale
della pubblicità, e quindi della fornitura di prodotti “personalizzati”.
Un sistema pervasivo per imporre uno
standard, ma formalmente “democratico” perché nelle mani degli utenti, a
portata di click, a portata di browser. Quella che viene spacciata per
democrazia elettronica si trasforma in una standardizzazione che consente di
digerire i contenuti creati da una miriade di utenti e associare ad essi la
pubblicità più adatta.
Browser
come ambienti di sviluppo
L'esplosione di nuovi e sempre più potenti
servizi web a partire dal 2005 sta trasformando il browser da strumento di
semplice navigazione a strumento di sviluppo. Un ampio ventaglio di tecnologie
stravolge gli standard di programmazione web correnti, offrendo agli
sviluppatori uno strumento facile, multipiattaforma, completo e affidabile: il
browser, appunto.
Negli ultimi anni si è lentamente modellato
un nuovo stile nella creazione di siti internet, anche grazie alle maggiori
attenzioni verso la portabilità e l'accessibilità dei contenuti: ne sono un
chiaro indizio la diffusione dei fogli di stile (Cascading Style Sheet, standard CSS e CSS2) invece dell'HTML
nudo e crudo, dei validatori, dello stesso standard XML. Grafici e web designer
trovano nei browser sempre più sofisticati e rispettosi dei vari standard
ottimi alleati, riuscendo a realizzare siti conformi alle norme per la
visualizzazione sui dispositivi più disparati e contemporaneamente a mantenere,
e anzi ampliare, la propria libertà d'espressione.
In particolare, la nascita di browser come
Mozilla Firefox e la loro rapida diffusione ha consentito una forte interazione
fra gli sviluppatori di siti internet e gli sviluppatori di questo browser,
giungendo in breve tempo a sanare quasi tutti i bug e le incompatibilità sugli
standard web. L'incompatibilità fra
Internet Explorer, Opera, e molti altri browser proprietari e non, è un
problema noto a chiunque abbia creato pagine web. La sinergia sviluppata da
Mozilla, apparentemente semplice e forse ovvia, costituisce una novità assoluta
nella storia dei browser. Un'altra caratteristica interessante dei prodotti
Mozilla è la struttura modulare sviluppata intorno al motore di rendering Gecko, che consente l'aggiunta di qualsiasi funzionalità immaginabile: tra i
più noti e diffusi, strumenti per eliminare la pubblicità dalle pagine web, per
avere sempre sott'occhio le previsioni del tempo o l'andamento della
borsa.
I browser sono insomma strumenti sempre più
affidabili, permettono la creazione di siti internet complessi e assumono le
caratteristiche di veri e propri programmi: tendono addirittura a sostituire
gli applicativi di uso comune. L'esempio lampante sono i vari strumenti per
ufficio proposti da Google come alternativa web alla suite di produttività
Microsoft Office e anche a Openoffice[12]. Al momento, è possibile utilizzare Writely
(prodotto da una società acquisita) come elaboratore di testi, Google
Spreadsheets come foglio elettronico, Google Page Creator per creare pagine web
velocemente. Tutti i servizi sono in fase di betatesting a invito: è necessario avere un account
Google per utilizzarli, ovviamente sotto stretto controllo.
Gli sviluppatori, da parte loro, spostano
il loro interesse sempre più verso il web, anche grazie all'utilizzo di
strumenti come GWT. Naturalmente Microsoft non sta a guardare e ha già pronta
la versione beta (allineandosi alla strategia di “betatesting diffuso” di Google, derivata come sappiamo
dalle pratiche del Free Software) di Office System (ovvero Office 2007), che
prevede un'integrazione sempre più spinta con gli strumenti web, pur rimanendo
un applicativo da installare.
I browser si stanno dunque trasformando in
ambienti di sviluppo completi per la creazione di contenuti standard, ovvero
SDK (Standard Development
Kit). Dove sta realmente
l'innovazione che ha reso possibile trasformare i browser in SDK? Sicuramente,
possiamo parlare di un nuovo paradigma della programmazione: si possono ora
creare programmi realmente multipiattaforma, distribuiti, lato client,
residenti sui server, facilmente aggiornabili, e senza bisogno di complessi framework da installare sui computer degli utenti. I contenuti, compresi i dati
personali degli utenti, sono sempre più stoccati su macchine remote (ad esempio
i server di Google), a cui si accede via web, cioè attraverso browser.
Spesso la scelta di browser Open Source
come Mozilla è motivata dalla loro semplicità di configurazione, e dalla
disponibilità di numerose estensioni potenti e gratuite. Gli sviluppatori si
basano su questi browser per implementare programmi via via sempre più
complessi e strutturati. La nascita di programmi basati soltanto sul web
provoca due fenomeni entrambi con forti ricadute sul mercato e sugli utenti: i
programmi binari da installare diventano obsoleti e i browser diventano i
programmi più complessi, spesso fortemente modulari, e più appetibili sul
mercato dell'IT. Quindi in futuro possiamo aspettarci meno programmi .exe
(Windows), .dmg (Macintosh), o pacchetti Unix installabili, e più strumenti
integrati nei browser, dalle estensioni per leggere i feed RSS al podcasting,
da Gmail a software completi per ufficio.
Il controllo capillare che può essere
effettuato da parte dei fornitori di servizi web rende questa dinamica
potenzialmente pericolosa per tutti noi. Chi offre i servizi infatti conosce in
maniera esatta l'identità digitale dei propri fruitori, il tempo di utilizzo
del software e i contenuti in elaborazione poiché controlla ogni accesso e
dettaglio relativo all'uso degli strumenti che mette a disposizione.
Si tratta a livello tecnico di
un'interazione continua tra client (il browser) e il server (chi offre i
servizi), dove quest'ultimo è in grado di monitorare costantemente le
richieste, i tempi e gli elaborati finali. Muta anche lo scenario della
sicurezza: con la scusa di fornire un prodotto “al sicuro” dalle grinfie di
cracker e hacker di vario tipo, i meccanismi di autenticazione non si trovano
più nel programma compilato e rilasciato senza sorgenti, perché avvengono
direttamente sui server dei distributori. Quindi per “entrare” in un software
non è più sufficiente disassemblare il codice sulla propria macchina per
comprendere come funziona, ma diventa necessario “bucare” server remoti.
Privacy,
Paranoie, Poteri
La strategia dell'accumulo ha reso Google
un soggetto in grado di mettere in difficoltà addirittura Microsoft, innescando
una guerra senza esclusione di colpi per la standardizzazione e il controllo
dell'accesso al web e alle reti che usiamo ogni giorno. In quanto soggetto di
mediazione globale di informazioni, il fenomeno Google riguarda in maniera
diretta tutti i fruitori di informazioni digitali, cioè tutti noi. Percorrere
la storia di Google significa perciò ripercorrere la nostra storia di
esploratori di internet e del web, che troppo spesso abbiamo delegato la
gestione delle nostre informazioni, dei nostri siti, gallerie di immagini,
caselle di posta, blog, sms, conversazioni telefoniche, ecc. ad aziende
tutt'altro che disinteressate.
La strategia dell'oggettività, che Google
attua ponendo l'accento sulla ricerca, sull'eccellenza accademica, sulla
superiorità tecnologica, sull'accurato studio delle interfacce, è un velo che
nasconde l'inquietante prospettiva di un unico punto d'accesso ai dati prodotti
da utenti ingenui.
La strategia dell'Open Source, infine, è
necessaria a Google per cooptare il metodo di sviluppo cooperativo proprio
delle comunità digitali, rendendolo funzionale alla propria “mission”. Anche in questo caso abbiamo visto come Google si muova con estrema
disinvoltura, proponendo metodi “nuovi” per sfruttare dinamiche note: Summer of Code ne è l'esempio lampante.
L'attività di Google, insomma, costituisce
un pericolo evidente per chiunque abbia minimamente a cuore le tematiche della
privacy e, in senso più ampio, della costruzione consapevole del proprio alter
ego digitale. Si tratta dell'emersione di un conglomerato di potere che già
oggi influenza pesantemente la vita di troppi individui. Google detiene
informazioni riservate che analizza senza sosta per promuovere una
personalizzazione sempre più accurata del cancro pubblicitario. E poiché
l'accumulo di potere generalmente favorisce l'ansia di dominio, è opportuno
indagare a fondo questo fenomeno.
Non
esistono risposte globali in grado di risolvere una volta per tutte il
problema della privacy. Il Grande Fratello non esiste, o quantomeno, come ogni
paranoia che esclude orizzonti di liberazione e oscura possibili vie di fuga, è
utile e funzionale all'esercizio del potere dominante.
Nascondere, crittografare, steganografare
sono pratiche utili, ma non sono soluzioni definitive: l'obiettivo e il
desiderio rimangono la comunicazione e la condivisione, che solo la “pubblicazione”,
ovvero il movimento di “rendere pubblico”, consente. L'ossessione per la
privacy scade molto rapidamente nella paranoia del complotto; in questo senso,
non è utile indulgere nella costruzione di complicate alternative per creare
reti assolutamente sicure e impenetrabili. La tecnologia è un'occasione di
apertura e condivisione, poiché usare la macchine significa usare creature
ibride, artefatti materiali (appartengono in questo senso al mondo naturale)
investiti di valori e significati culturali (appartenenti cioè all'universo
della “cultura”). Le reti sono espressione di una dinamica coevolutiva di
macchine meccaniche, biologiche e significanti: la tecnologia è meticcia per
nascita. Creare reti significa infatti collegare macchine di vario tipo;
significa creare metodi di condivisione, metodi di traduzione, metodi di
scambio: non è possibile rimanere chiusi in sé stessi, è necessario mettersi in
gioco e cambiare.
C'è bisogno di ricerca e di analisi
competenti; la denuncia dei meccanismi del dominio tecnocratico urge più che
mai. Abdicare al pensiero critico equivale invece a soccombere alle paranoie
del controllo, che pure si fa sempre più pervasivo. È possibile utilizzare in
senso paradigmatico la storia di Google per tracciare vie di fuga non ingenue,
per immaginare pratiche di autogestione delle tecnologie. Google è infatti il
punto d'incontro fra lo stile meritocratico dell'accademia, la spinta
all'innovazione a ogni costo e il capitalismo finanziario più avanzato.
È l'occasione giusta per sviluppare reti
autonome e decentrate, per contrapporre il desiderio di “esplorare” e “percorrere”
le reti alla necessità di “accedere” ai dati, per focalizzare l'attenzione sul
percorso invece che sul risultato.
[1] La letteratura sui grafi è sterminata; per un primo approccio, si veda
l’omonima categoria di wikipedia, http://it.wikipedia.org/wiki/Categoria:Teoria_dei_grafi
[2] Più formalmente, dati un insieme V di nodi e un insieme E di archi, un
grafo G è un insieme G = (V, E).
[3] La profilazione è un settore chiave dell’economia della
ricerca, in continua espansione, che comprende concetti come: Clickstream analysis, CRM (Customer relationship management), Data mart, Data mining, Data warehouse, OLAP (Online Analytical Processing). Per un’introduzione elementare all’argomento, si veda: http://www.diodati.org/scritti/2002/g_stat/stat05.asp. Interessante notare che le tecniche di
profilazione dei consumatori derivano in ultima analisi dalle attività di profiling criminale.
[4] Per un approfondimento sui cookies volatili, si vedano in particolare: http://www.google-watch.org/cgi-bin/cookie.htm e http://www.scroogle.org/. Google Watch spiega la gestione dei
cookies da parte di Google e metodi per difendersi dalla profilazione; Scroogle
si prefigge di anonimizzare le ricerche verso google, facendo in modo che il
cookie eterno di Google non possa consentire un tracciamento storico sulle
ricerche effettuate dall’utente.
[5] Per un approfondimento sulla tematica, si veda l’intervento “La privacy e i motori di ricerca”, di Claudio Agosti “vecna” - s0ftpj.org in
occasione del convegno “e-privacy - fra Trusted Computing e Data
Retention”, tenuto a Firenze il 19-20 maggio 2006 http://e-privacy.firenze.linux.it/, disponibile all’indirizzo http://e-privacy.firenze.linux.it/atti/e-privacy_2006_Agosti_Privacy_e_motori_di_ricerca.pdf
[6] Si veda in proposito l’appendice I: La fine del mondo in un
biscotto.
[7] Productor-consumer, produttori-consumatori.
[10] A proposito dell’implementazione del web semantico, ben
altro rispetto al “web 2.0”, si veda la roadmap del 1998 di Tim Berners-Lee, http://www.w3.org/DesignIssues/Semantic.html; il coordinamento del W3C, http://www.w3.org/2001/sw/; un documento introduttivo alla filosofia del
web semantico: http://www2.autistici.org/bakunin/doc/reti/index.xml
[11] L’acronimo VoIP, Voice over IP (Voce tramite
protocollo Internet), indica una tecnologia che rende possibile effettuare una
conversazione telefonica sfruttando una connessione internet o un’altra rete dedicata che utilizza il protocollo IP, anziché passare
attraverso la normale linea di trasmissione telefonica. Si veda http://it.wikipedia.org/wiki/Voice_over_IP. Non esistono solo Skype e Google che
forniscono servizi VoIP, ma naturalmente anche programmi free, come Asterisk, http://www.asterisk.org/
[12] Esistono anche suite complete per ufficio utilizzabili via web, come gOffice, prodotto dalla società Silveroffice, Inc. di San Francisco, che afferma: “gOFFICE non è affiliata a Google, Inc., ma ci piace pensare che sarà una bella lotta finchè la loro missione rimarrà l’indicizzazione di tutte le informazioni del mondo, mentre la nostra è di aiutare la gente a creare quelle informazioni. Abbiamo perciò bisogno di Google per ricercare i contenuti che i nostri utenti creano con gOFFICE! Forse dovremmo aggiungere una scheda alla nostra barra degli strumenti chiamata “ricerca”... www.goffice.com