I. Storie di motori
Motori
e ricerche
I motori di ricerca si presentano oggi come
siti appartenenti al World Wide Web (web) che permettono il reperimento di
informazioni (information retrieval). La maggior parte degli utenti ritiene
erroneamente che Internet e il web coincidano, perché il web è l’aspetto più
semplice e immediato di Internet. In realtà la Rete è assai più complessa,
eterogenea e variegata del web: comprende anche i mondi delle chat, dei
newsgroup, della posta elettronica, e in generale tutto ciò che gli individui
desiderano “mettere in rete”, a prescindere dalla “forma” con la quale queste
informazioni si presentano. Inoltre, la Rete non è statica, ma dinamica. Ciò
significa che le connessioni fra le risorse si modificano, le risorse stesse sono
soggette a cambiamenti (nascita, trasformazione, morte). Allo stesso modo, i
vettori di connessione fisica a queste risorse cambiano in continuazione, si
evolvono dal doppino telefonico del modem fino alla “banda larga” e alla fibra
ottica. Non ultimi, gli individui che creano la Rete proiettando i loro alter
ego digitali su di essa sono in continua mutazione, in quanto esseri viventi.
La Rete dunque non è il web, ma una dinamica coevolutiva costituita dalle
interazioni complesse fra tre differenti tipi di macchine: macchine meccaniche
(computer, cavi, modem, ecc.), macchine biologiche (individui umani), macchine
significanti (risorse condivise).
In ogni caso, dal momento che reperire
informazioni nel magma della Rete è sempre stata un’esigenza fondamentale, per
quanto possa sembrare strano, la storia dei motori di ricerca è assai più
antica rispetto a quella del web.
Il web così come noi lo conosciamo è un’invenzione
di Tim Bernes-Lee, Robert Caillau[1] e altri scienziati europei e americani.
Tra il 1989 e il 1991 al CERN di Ginevra creano i primi browser, il protocollo
http e il linguaggio html per la composizione e visualizzazione di documenti
ipertestuali, ovvero contenenti link (sia interni a ogni documento, sia fra
documenti diversi). Questa nuova tecnologia si presenta come un’implementazione
della rete Internet, un progetto americano esito della fusione di diversi
progetti universitari e militari.
Mentre il web si diffondeva tra i
laboratori e le università di tutto il mondo, i motori di ricerca offrivano già
da anni servizi di indicizzazione e ricerca di informazioni su Internet.
I primi motori di ricerca ovviamente non
erano consultabili via web: erano veri e propri programmi da installare e
configurare sulla propria macchina. Questi strumenti indicizzavano le risorse
di Internet attraverso protocolli come ftp (per lo scambio di file), Gopher (un
rivale dell’emergente http) e altri sistemi ormai caduti in disuso.
Nel 1994 diventava operativo il primo
motore di ricerca basato su web: WebCrawler[2], un esperimento finanziato dall’università
di Washington. Le innovazioni introdotte da questo motore di ricerca erano
straordinarie: oltre a funzionare come un sito Internet, e a offrire la
possibilità di effettuare ricerche fulltext[3], era dotato di uno strumento per
catalogare le pagine automaticamente, lo spider. Lo spider è un software che, come vedremo approfonditamente in seguito, assolve
a due funzioni: mentre naviga su Internet, memorizza le informazioni contenute
sulle pagine web e le rende accessibili agli utenti del servizio di ricerca.
Per quanto WebCrawler fosse incredibilmente
innovativo per l’epoca, i risultati che era in grado di fornire erano semplici
elenchi di indirizzi web e i rispettivi titoli delle pagine indicizzate.
Negli ultimi mesi del 1994 il motore di
ricerca Lycos riusciva a indicizzare in pochissimi mesi oltre il 90% delle
pagine web di allora (10 milioni circa in tutto). La principale innovazione di
Lycos era quella di escludere sistemi fulltext per la
catalogazione, analizzando soltanto le prime 20 righe di ogni pagina
indicizzata, invece che l’intero contenuto testuale di ogni pagina. Questo
permetteva a Lycos di mostrare nei risultati anche una breve descrizione
estrapolata da quelle stesse righe.
Con l’avvento di Excite, nel dicembre 1995,
i risultati cominciano a essere ordinati in base al criterio dell’importanza
delle pagine. L’introduzione di un sistema di valutazione del “peso” di una
pagina apriva anche a una forma rudimentale di catalogazione tematica:
finalmente venivano accantonate le liste interminabili di risultati non
ordinati. Si configurava così una prima consultazione a “directory” dei siti,
che possiamo paragonare a un’organizzazione in stile biblioteconomico classico
delle risorse web, ovvero ad albero, con una indicizzazione suddivisa per
materie, lingue, ecc.
Tuttavia, Excite è passato alla storia per
un’altra ragione: è stato il primo motore di ricerca a dotarsi di strumenti
finalizzati esplicitamente all’attività commerciale. Dopo aver acquistato
WebCrawler, ha offerto personalizzazioni agli utenti e caselle di posta
gratuite, trasformandosi in meno di due anni in uno dei primi portali web
(1997). Di lì a breve, con la nascita di motori di ricerca sempre più evoluti,
Excite mette da parte la propria vocazione originaria, optando per l’utilizzo
degli strumenti di ricerca di altre società, tra cui oggi anche Google[4].
Ma il panorama dei precursori di Google non
sarebbe completo senza una menzione di quello che nel 1997 era il miglior
motore di ricerca esistente, nonché il più popolare: Altavista. Altavista, che
vuol dire “vista dall’alto”, si avvaleva dei risultati di un gruppo di ricerca
della Digital Equipment Corporation (DEC) di Palo Alto, California, che nella
primavera del 1995 era riuscito a immagazzinare tutte le parole di una pagina
HTML presente su Internet in un indice nel quale fosse possibile effettuare
ricerche. Questo aveva consentito ad AltaVista lo sviluppo del primo database
aperto alla consultazione diretta del World Wide Web. La mente di AltaVista era
Louis Monier[5] che, usando cluster di computer collegati fra loro, hardware all’avanguardia e il meglio
delle tecnologie allora disponibili, era riuscito in breve tempo a rendere la
propria creatura il motore di ricerca più usato e più apprezzato dagli utenti.
AltaVista è stato anche il primo motore di ricerca multi-lingua di Internet e
la prima tecnologia di ricerca in grado di supportare testi in cinese,
giapponese e coreano. Infine, ha introdotto un sistema di traduzione automatica
Babel Fish, tuttora utilizzato.
Prima del suo crollo[6] nel 1997, Altavista serviva 25 milioni di
richieste al giorno e raccoglieva 50 milioni di dollari l’anno di
sponsorizzazioni, fornendo il servizio di ricerca per gli utenti del portale
Yahoo!, ancora oggi il maggiore antagonista di Google nel mondo Web.
La nascita di Google:
in principio fu il garage, anzi, l’università
La parola Google deriva da “Googol”,
termine matematico che indica un 1 seguito da 100 zeri. Leggenda vuole che
questo fosse il numero di pagine web che Larry Page e Sergey Brin sognavano di
indicizzare con il loro nuovo strumento di ricerca. Si incontrano nel 1995 a
Stanford, quando il 24enne Larry Page, laureato all’Università del Michigan, si
reca in visita a Stanford con l’idea di iscriversi al dottorato in informatica.
Il 23enne Sergey Brin faceva parte del gruppo di studenti assegnati ad
accompagnare i visitatori nel campus. Stanford era il luogo ideale per
sviluppare progetti fortemente innovativi dal punto di vista tecnologico.
Infatti poteva offrire da una parte laboratori di ricerca all’avanguardia; dall’altra,
legami stretti sia con aziende del settore Information Technology (IT), sia con
finanziatori attenti e disponibili a investire grossi capitali sulle ricerche
accademiche più promettenti. Brin e Page sono entrambi affascinati dalla
crescita vertiginosa del web e dai problemi connessi alla ricerca e all’organizzazione
delle informazioni; si dedicano al progetto BackRub, chiamato così perché era
in grado di analizzare i “back links” che puntavano a un sito e di fornirne una
mappatura. In seguito BackRub sarà ribattezzato Google quando verrà dotato di
una pagina web, nel 1997.
L’innovazione fondamentale introdotta da
Google è quella di ribaltare il processo di indicizzazione delle pagine: non si
elencano più i siti in base alla “prossimità” rispetto alla richiesta
effettuata, ma si mostrano i risultati esattamente nell’ordine “corretto”,
ovvero rispondenti alle aspettative dell’utente. Il primo link reso disponibile
deve essere la risposta “esatta” all’interrogazione; i successivi si
allontanano via via dal fulcro della richiesta[7].
In quest’ottica nasce il noto pulsante “mi
sento fortunato”: cliccando, si apre direttamente il primo link della ricerca
di Google, presentato come il link inequivocabilmente “giusto”.
L’algoritmo che Larry Page si “inventa” per
calcolare l’importanza di una pagina web, noto come PageRank, si basa sulla
matematica statistica dei primi del Novecento e in particolare sulle formule
sviluppate da Andrej Andreevic Markov per calcolare, all’interno di una rete, l’importanza
di un nodo rispetto agli altri[8].
All’inizio, Google è solo un progetto
accademico e scientifico, per il quale il sistema di valutazione dipende in
larga misura dai giudizi dei recensori (referees) che
operano secondo il meccanismo della “revisione dei pari” (peer-review). Il metodo che teoricamente offre le
garanzie maggiori di oggettività è il cosiddetto “doppio cieco” (double-blind): prima di essere accolto in una rivista
scientifica, un articolo viene sottoposto ad almeno due ricercatori di chiara
fama, che non devono conoscere il nome dell’autore (per non essere influenzati
nel giudizio). Il secondo passaggio “cieco” riguarda l’estensore dell’articolo,
che non deve conoscere il nome dei recensori. In sostanza, più un articolo
scientifico viene accolto in maniera positiva da altri scienziati (che si
suppone lavorino in maniera indipendente), più l’articolo stesso viene
considerato importante e meritevole. Page trasla nel suo campo di ricerca
questo approccio e sviluppa la teoria secondo cui il numero di link che conduce
a una pagina è un modo per valutare il valore della pagina stessa e in un certo
senso la sua qualità. Vedremo meglio più avanti come si realizza questo
passaggio dalla “quantità” di informazioni servite alla “qualità” del risultato
rispondente alle aspettative dell’utente[9].
Ma questo criterio non era di per sé
sufficiente, perché non tutti i link sono uguali né hanno lo stesso valore: più
precisamente, spostando l’attenzione dal valore statico di un collegamento al
valore dinamico di un percorso, la Rete è un ambiente (in termini matematici,
un grafo) in cui non tutti i percorsi hanno lo
stesso valore, ma diversi “valori di percorrenza” a seconda del “peso” dei
nodi. Del resto, proseguendo nel parallelo con la pratica scientifica, non
tutte le recensioni sulle riviste scientifiche hanno la medesima importanza. Il
parere positivo di recensori non prestigiosi, o addirittura malvisti dalla
comunità scientifica, è nocivo: troppe recensioni di scarso peso inficiano l’autorevolezza
di una pubblicazione. Così, secondo Page, i link provenienti da siti
particolarmente connessi, con un elevato numero di link, sono di maggiore
importanza. Pertanto, un percorso (link) che giunge a una pagina da un sito
molto popolare ha maggiore rilevanza rispetto a un percorso proveniente da una
pagina poco nota. In questo modo un link da una pagina A a una pagina B viene
interpretato come una recensione scientifica (ma va sottolineato che Brin e
Page parlano esplicitamente di “voto” e “democrazia”), di maggior peso a
seconda della popolarità del recensore/votante che fornisce il link. Il
criterio dell’autorevolezza del recensore scientifico diventa più banalmente la
misurazione della popolarità di un sito.
La valutazione delle pagine web di Google,
detta PageRanking, si costruisce dunque in base a un sistema
di recensione “pubblica” analogo al sistema della “repubblica scientifica”[10], non limitato agli scienziati ma esteso a
tutti i navigatori della Rete.
Oggi, l’organizzazione della repubblica
scientifica e la questione del reperimento delle informazioni in genere è
diventato un problema di cruciale importanza: in questo contesto di diluvio
informazionale[11], in particolare sul web, ragionare non
solo sull’importanza ma anche sull’attendibilità delle informazioni diventa
sempre più complesso. Tanto più dopo che il meccanismo della “revisione dei
pari” è stato messo in discussione dagli scienziati stessi[12]. Fra le proposte alternative più
interessanti figurano meccanismi di valutazione distribuita delle
pubblicazioni, rese disponibili sotto licenze libere (copyleft) mediante
progetti di accesso pubblico (Open Access), anche per quanto riguarda le opere
umanistiche (si veda ad esempio HyperJournal)[13].
Così nel marzo 1996 Page lancia il suo spider,
un programma per esplorare il web, testandolo con l’algoritmo di ranking che
aveva sviluppato.
Il motore di ricerca dei due talenti di
Stanford, costruito attorno allo spider, diventa immediatamente di successo tra
studenti e ricercatori, acquisendo rapidamente una straordinaria popolarità.
Tuttavia per gli amministratori di rete di Stanford il consumo di banda del
motore di ricerca comincia a rappresentare un problema significativo. Non solo,
ma i proprietari dei siti indicizzati si preoccupavano da un lato dei diritti
di copyright dei propri materiali e dall’altro del fatto che il ranking di
Google non tenesse in alcuna considerazione i premi ufficiali o gli altri
sistemi di valutazione consolidati, fatta eccezione per la quantità e qualità
(nel senso di popolarità) delle relazioni che una pagina è in grado di muovere
attorno a sé. A Google interessa l’economia relazionale espressa in termini di
link e null’altro: “lo spider non si interessa dei contenuti di una pagina”.
Una simile affermazione sottintende che il
valore di un risultato si costruisce attraverso la valutazione delle relazioni
di una pagina con altre, e non imponendo una classificazione arbitraria in base
a termini di ricerca. Questa forzatura sarà la chiave dell’efficienza di Google
negli anni a venire: i risultati non sono più stabiliti in maniera assoluta una
volta per tutte, ma variano dinamicamente a seconda della posizione assunta
dalle pagine nel contesto della rete.
Google.com:
pubblicità diretta all’interno delle pagine
Page e Brin sviluppano e testano Google per tutto il primo anno e mezzo
di vita usando strumenti liberi messi a disposizione delle comunità Free
Software e Open Source[14], a partire dal sistema operativo
GNU/Linux. Implementano così un strumento fortemente modulare e scalabile, che
si può espandere e modificare facilmente anche a pieno regime di utilizzo. Tale
struttura modulare è la base del datacenter[15] odierno di Google, il Googleplex, che
permette la sostituzione o l’aggiunta di hardware e software, la sua manutenzione
e aggiornamento senza dover mai bloccare il servizio.
A metà del 1998 Google serve circa
diecimila richieste di ricerca al giorno; il sistema casalingo ammassato nella
stanza affittata da Page e Brin è ormai sull’orlo del collasso. Bisognava
trovare un sistema di finanziamento per il progetto che andasse al di là dei
normali fondi per la ricerca.
L’uscita dall’università viene attribuita
all’incontro con Andy Bechtolsheim, fondatore della Sun e consumato talent scout dell’IT, che stacca ai due ricercatori un
primo assegno da centomila dollari.
La nascita della società coincide con l’assunzione dei primi dipendenti necessari allo sviluppo e alla manutenzione del datacenter, tra cui Craig Silverstein, direttore della tecnologia. Il datacenter di Google si configura sin dall’inizio come un sistema fortemente ridondante in cui le informazioni vengono copiate in più luoghi per minimizzare la possibilità di perdita dei dati (ovvero la carta moneta di un sistema di ricerca) e soprattutto nel quale in ogni momento è possibile aggiungere e togliere i moduli presenti per ottenere una maggiore efficienza. L’approccio tipico della filosofia degli universitari smanettoni di Brin e Page, che recuperano e riadattano hardware a buon mercato e usano software gratuito, si rivela una carta vincente. Le ridotte risorse economiche consentono poi di farne la chiave di volta della loro filosofia aziendale, che sarà basato sull’estrema scalabilità a ogni livello. Il sistema-Google è scalabile perché in grado di “crescere” o “decrescere” (aumentare o diminuire di scala) in funzione delle necessità e delle disponibilità. Non è necessario riprogettare il sistema quando vengono aggiunte nuove risorse (di qualsiasi tipo: macchine, servizi, dipendenti, ecc.): la struttura altamente modulare consente l’acquisizione di nuovi moduli senza soluzione di continuità.
Google Inc. apre le porte il 7 Settembre
1998 a Menlo Park, California. Per la precisione, Larry apre queste porte con
un telecomando: gli uffici sono stipati nel garage che un amico subaffitta alla
società. Un ufficio-garage spartano, ma dotato di alcuni comfort non
indifferenti: una lavatrice, un essiccatore e un idromassaggio. Fin dal
principio, la filosofia aziendale di Google è all’insegna della soddisfazione
dei lavoratori.
Nel gennaio 1999 Google abbandona
definitivamente il campus di Stanford, dichiarando: “Il progetto di ricerca
Google è diventato Google Inc. Vogliamo dare al mondo ricerche di qualità
superiore e migliori di quelle che ci sono ora, e una compagnia sembra il modo
migliore per portare a termine questo obiettivo. Abbiamo cominciato ad assumere
altre persone e a configurare altri server per rendere il nostro sistema
scalabile (abbiamo cominciato a ordinare i server in pacchi da 21). Abbiamo
anche cominciato a lanciare il nostro spider più frequentemente e i nostri
risultati non solo sono rimasti veloci quanto prima, ma sono anche diventati
ancora più aggiornati. Stiamo assumendo persone di grande talento molto
rapidamente e questo ci porta le ultime e migliori tecnologie per quanto
concerne il Web” ... Brin e Page poi dedicano qualche riga ai dieci buoni
motivi per lavorare per Google, incluso tecnologie, azioni, snacks, bevande gratis e la possibilità che milioni di persone: “usino e
apprezzino i vostri software”.
Tra il 1998 e il 1999 tutti i motori di
ricerca e i siti più popolari del mondo sono affetti dalla sindrome del
portale, una vera e propria mania per la costruzione di siti per trattenere i
visitatori sulla propria pagina a ogni costo, includendo sempre più servizi,
pubblicità e personalizzazioni. Google è l’unico strumento privo di pubblicità
e servizi aggiuntivi: solo motore di ricerca, per altro il migliore, il più
veloce, e senza legami commerciali o sponsor.
In ogni caso la compagnia non può
sopravvivere con la modesta somma di Bechtolsheim, senza generare ancora
profitti apprezzabili e continuando a fare ricerca sull’organizzazione e
reperimento delle informazioni. Mostrando grande capacità di interlocuzione con
le alte sfere della finanza, e ribadendo in continuazione il loro interesse per
la ricerca, Brin e Page riescono a mettere d’accordo due delle principali
società di finanziamenti della California, che a sorpresa accettano di
cofinanziare una singola compagnia: caso più unico che raro, due enormi società
di capitale di rischio (venture capitalism) vengono convinte a dividere i rischi, e i
profitti, dell’eventuale affare. Il 7 giugno 1999 Google può annunciare che la
Sequoia Capital Sequoia Capital e la
Kleiner Perkins Caufield & Byers gli hanno concesso un finanziamento da 25
milioni di dollari[16].
Mentre aumentano gli assunti alla Google
Inc., i due presidenti cercano un modo per far fruttare in senso economico la
mole di dati indicizzata. Inizialmente tentano di vendere il loro servizio di
ricerca come OEM (Original
Equipment Manufacturer –
Prodotti forniti senza i supporti originali)[17] a portali, ma i risultati sono alquanto
scarsi. Il modello di business che si dimostra più adatto alla nuova società è
invece la pubblicità diretta all’interno del motore di ricerca, attraverso il
conteggio del numero di visitatori che accedono ai siti dai link promozionali a
pagamento. Questo modello economico, CPM (Costo Per Mille Impressioni – in
inglese CPT, Cost per
Thousand Impression)[18] è strutturato in modo da essere il meno
invasivo possibile per l’utente; infatti, invece di puntare sull’estrema
visibilità delle inserzioni pubblicitarie, vengono mostrati pochi link
attentamente selezionati in cima alla ricerca. Questi collegamenti hanno colori
e caratteri diversi da quelli non commerciali, ma tendono a non disturbare in
alcun modo l’attività di ricerca dell’utente.
Il
self-service pubblicitario: oltre la bolla della new-economy
Un modello economico basato sulla comparsa
di semplici link da sponsorizzare a lato dei risultati delle ricerche è poco
vantaggioso in termini di profitto; a questo punto la pianificazione aziendale
a lungo termine di Google necessita di un salto di qualità. I presidenti si
guardano attorno alla ricerca di soluzioni più interessanti e proficue, e
inciampano su Goto, società fondata da Bill Gross[19], oggi di proprietà di Overture/Yahoo!.
Il business di Goto consisteva nel
mescolare risultati effettivi e quelli sponsorizzati, fatturando agli
inserzionisti soltanto i click compiuti dagli utenti sui loro indirizzi: un
modello noto come CPC (Cost
Per Click).
Questo metodo era particolarmente
innovativo rispetto ai precedenti. I link sponsorizzati comparivano infatti in
base alle ricerche dell’utente, ampliando in questo modo al massimo le
possibilità di portare a buon termine la transazione economica, contabilizzata
come click verso il sito pagante. Google cerca di avviare una partnership con
Goto, ma il deciso rifiuto del presidente li obbliga a implementare
internamente uno strumento simile. All’epoca tutti i portali (ad esempio
Excite, Lycos, Infoseek, AltaVista e Yahoo!) utilizzavano il modello CPM, e il
CPC era quasi un desiderio proibito. Ciò dimostra come un tentativo fallito di
comprare la tecnologia ritenuta migliore per il proprio business comporti la
necessità di implementarla in maniera autonoma.
Nel marzo del 2000 esplode la bolla del
Nasdaq, trascinando con sé tutti i sogni di gloria delle dot com. Crolla anche
il modello CPM, ovvero l’illusione che tonnellate di banner pubblicitari a “migliaia
di impressioni”, spesso decontestualizzati perché presenti su siti del tutto
estranei al business di riferimento dell’inserzionista, sarebbero stati una
fonte inesauribile di introiti. Google si ritrova proprio allora a fare i conti
con la necessità di monetizzare le proprie tecnologie di ricerca.
Nell’ottobre 2000 entra in scena AdWords,
una sorta di self-service pubblicitario in cui gli inserzionisti possono
scegliere le parole di ricerca a cui associare il loro link commerciale: un’implementazione
della “pubblicità per parole-chiave” (keywords advertising)
ideata da Goto.
Google sopravvive perciò al crollo del
Nasdaq; o meglio, grazie alla sua natura di società privata non ancora quotata
in borsa, ne approfitta per assumere tutti i talenti in fuga dalle macerie
delle altre dot com. A metà del 2000 Google serve 18 milioni di ricerche al
giorno e il suo indice di documenti conta un miliardo di unità; sei mesi dopo
le ricerche sono 60 milioni.
Stile,
morfologia e moltiplicazione dei servizi
Agli inizi del 2000 Google si trova perciò
con pochi concorrenti e dà inizio a una nuova fase di innovazione, cominciando
a offrire molti nuovi servizi[20] agli utenti.
Ogni nuovo servizio è parte di un mosaico
complesso, in costante ridefinizione, con ramificazioni in ogni ambito dell’IT.
Al momento Google offre: diciassette tipologie di servizi di ricerca su
database di immagini, blog, notizie, libri, mappe, video, servizi finanziari,
sui documenti presenti sul proprio computer e molto altro ancora. Due servizi
sono legati allo sviluppo di applicazioni e alle novità in cantiere nei
laboratori di Google. Sei i servizi di comunicazione: Email, VoIP,
messaggistica istantanea, Gruppi di discussione, condivisione di fotografie,
servizi di traduzione. Tre servizi riguardano dispositivi mobili (telefoni
cellulari, PDA, ecc.); infine, un servizio propone software consigliati da
Google. Non passa giorno senza che se ne aggiungano di nuovi.
Anche l’utente più sprovveduto si rende
conto facilmente della potenza di questi strumenti. Oggi è possibile digitare
un indirizzo o un numero di telefono e Google fornisce tutti i dati necessari a
contattare e localizzare una persona o una cosa; si possono memorizzare le
proprie preferenze di ricerca rendendo l’uso continuativo del motore di ricerca
di una facilità sconcertante; se si sbaglia a digitare una parola nella
ricerca, Google suggerisce la ricerca giusta da fare con un meccanismo di
correzione ortografica molto avanzato in grado di “imparare” da ogni ricerca.
Nel 2001 Google lancia “Google immagini”,
un motore di ricerca per immagini che nel giro di poche settimane diventa una
delle fonti principali di produzione grafica fai-da-te e rappresenta uno dei
più grandi database di immagini distribuite sul web. Intanto la compagnia
acquisisce da Deja.com l’archivio Usenet, ovvero i messaggi dei newsgroup a
partire dal 1995, che con oltre 650 milioni di post è la “memoria storica” dell’Internet
ante-web, quando i gruppi di discussione erano la linfa vitale della Rete. Nell’aprile
2001 Usenet diventa “Google gruppi”, con un’interfaccia piuttosto semplice e
accattivante per seguire facilmente complessi argomenti di discussione. Tutti
questi servizi sono in continuo ampliamento e miglioramento.
Dal 2001 in avanti i servizi nascono a
ripetizione, senza nessuno scopo evidente né ritorni economici immediati, come
se Brin e Page si divertissero a mostrare che un datacenter sconfinato è in
grado di elaborare quasi qualsiasi sogno tecnologico. L’esempio più eclatante è
il potentissimo Google Maps per la Terra, Marte o per la Luna (2005 e 2006), un
set di software messo a disposizione gratuitamente per visualizzare con
immagini satellitari una piantina dettagliata o almeno una ricostruzione
fotografica della superficie dei pianeti. “Google Directory”, che presenta i
contenuti Open Directory di Dmoz.com, organizzati da agenti umani con un
sistema cooperativo e decentrato di open publishing, è già da tempo
consultabile dalla sempre meno graficamente scarna pagina di Google.
Nel 2005 vedono la luce Google News, che
mette l’enorme database di informazioni di Google al servizio della produzione
giornalistica, e Gmail, che offre 1 Gigabyte di spazio mail per ogni utente.
Con un meccanismo a inviti che immediatamente crea una rete di relazioni tutta
interna al mondo Google, vengono zittite le proteste circa la privacy della
propria casella di posta con un lapidario “è un buon prodotto, i pregi sono
maggiori dei dubbi e il tempo lo proverà”. Nessun concorrente è in grado di
mettere a disposizione gratuitamente tanto spazio. Con Gmail ogni attore
coinvolto è controllato dal punto di vista dell’uso del servizio, dal momento l’enorme
disponibilità di spazio incita a lasciare le proprie mail sui server di Google.
Inoltre, poiché la propagazione del servizio avviene mediante inviti, che ogni
utente può utilizzare a proprio piacimento, vengono offerte a Google
informazioni essenziali sui propri conoscenti e amici: un progetto pervasivo e
mirato di data mining.
Si arriva poi al progetto di Google Scholar (Accademia), un motore di ricerca ancora sperimentale, in fase beta (la cosiddetta fase di beta-testing), che permette di individuare testi della letteratura accademica come articoli sottoposti a revisione, tesi di laurea, di dottorato, volumi accademici, preprint, sommari, rapporti tecnici, recensioni di tutti i settori della ricerca accademica. Infine Google Library, che ha l’ambizione di mettere a disposizione on line tutti i libri del mondo in formato digitale, stringendo accordi con biblioteche di tutto il mondo per la digitalizzazione dei volumi, ma anche con gli editori interessati. Un sogno che solo il datacenter di Google promette di poter realizzare: la biblioteca digitale globale accessibile dalle pagine di Google, in aperta rottura con gran parte degli editori statunitensi, riuniti nella Association of American Publishers, che temono di veder calare drasticamente i propri profitti; già nel 2005 la AAP aveva richiesto di bloccare per sei mesi la digitalizzazione delle opere protette da copyright in attesa di spiegazioni convincenti su Google Library. Ma l’apparenza inganna e, nonostante l’opposizione dei fautori del copyright, non si tratta di un’iniziativa per la libera circolazione dei saperi, ma solo di un cambio di monopolio dell’informazione, che passerebbe da alcuni grandi editori a Google. Infatti, come per ogni sogno, l’incubo è dietro l’angolo: un singolo soggetto privato, Google, aspira a decidere cosa faccia parte della sfera dell’informazione collettiva, rendendolo disponibile tramite formati proprietari. In reazione a questo progetto è nata la Open Content Alliance, sostenuta da Internet Archive, una fondazione no profit, e da Yahoo!: l’obiettivo è la disponibilità totale del materiale acquisito grazie all’utilizzo di formati aperti.
Parallelamente alla nascita di nuovi
servizi, Google si rivela estremamente abile nel mettere pienamente a profitto
l’economia relazionale, generata dallo sfruttamento in senso commerciale dei
dati indicizzati.
Nel 2004 viene lanciato AdSense, cioè la
possibilità per chiunque di ospitare sul proprio sito alcuni link commerciali
suggeriti da Google in base agli argomenti trattati e ad alcune parole chiave.
Gli introiti derivanti dai click su questi link vengono suddivisi tra Google e
i proprietari dei siti ospitanti. La novità di questo approccio consiste nel
mettere a frutto la rete di fiducia basata sugli utilizzatori del sito: Google
non è più sul sito di Google, ma è su chiunque voglia averne la “finestra”, e
questo piccolo spazio sarà sempre riempito con dati validi ed interessanti,
come sempre con Google, anche se ora saranno suggerimenti commerciali. In
pratica AdSense dà sostanza a una “Rete di Google”, una rete che incrocia i
dati degli utenti e le relazioni fra di essi per i suggerimenti pubblicitari.
Nelle parole di Google, è una rete “composta da siti e prodotti connessi a
Google da un rapporto di partnership per la pubblicazione di annunci mirati
AdWords sul proprio sito o prodotto”[21]; ovviamente, anche il sistema AdSense fa
parte della “Rete di Google”!
Naturalmente, fatta la rete, bisogna fare i
soldi. Non a caso, sempre nel 2005, Google sperimenta un “ritorno” al modello
CPM attraverso l’offerta AdWords con la metodologia “targeting per sito”: gli
inserzionisti tornano a pagare per visualizzazioni (impression), ma con un meccanismo ad asta, e non per
numero di click sul proprio banner. Possono scegliere in maniera estremamente
particolareggiate quali caratteristiche devono avere gli utenti che
visualizzeranno l’inserzione: nazionalità, area geografica di provenienza, lingua,
ecc. Ma soprattutto, le visualizzazioni avvengono solo all’interno della “Rete
di Google”. Questa strategia interessa soprattutto coloro che desiderano
visibilità e promozione di un marchio, piuttosto che utenti a cui vendere un
prodotto, ovvero privilegiano una forma indiretta di marketing rispetto a forme
dirette. Nello specifico, si tratta di investire nella cosiddetta “consapevolezza
del marchio” (brand
awareness) invece che su
prodotti specifici indicati da parole chiave (come es. il keyword advertising del modello CPC).
Vi è una sordida specularità tra il modo di
gestire i propri prodotti immateriali e l’organizzazione dei dipendenti, dell’ambiente
di sviluppo progettuale, perfettamente adeguato al criterio di scalabilità
modulare che fonda la filosofia aziendale di Google: la crescita infinita è
necessaria affinché il sistema non crolli. Il numero di utenti che compiono
ricerche tramite Google e affidano ai suoi server i propri dati deve crescere
continuamente, affinché cresca di pari passo il numero di inserzionisti che
pubblicizzano nella “Rete di Google” i propri prodotti. Sono necessari sempre
nuovi servizi, nuove macchine per gestirli, nuovi dipendenti per implementarli,
nuovi utenti per utilizzarli, nuovi inserzionisti per renderli proficui... Ogni
nuovo “pezzo” del sistema verrà introdotto come nuovo modulo, in un ciclo di
accumulazione senza fine: accumulazione di dati e accumulazione di cervelli e
accumulazione di utenti e dei loro dati, bontà nel trattamento dei dati, bontà
nel trattamento dei dipendenti, bontà nel trattamento degli utenti e dei loro
dati, archiviati nel datacenter di Google. Sempre con l’imperativo della
rapidità e dello sviluppo.
Brin e Page non nascondono le loro
ambizioni: “Perché lasciare che i nostri dipendenti cerchino di fondare la
propria società e poi doverla acquistare quando possiamo finanziarli per
restare da noi e fare quello che avrebbero fatto comunque?”. Infatti il
GooglePlex[22], la sede operativa per i lavoratori di
Google a Mountain View, è una specie di campus universitario in cui le persone
sono costantemente coccolate e ai dipendenti viene persino lasciato un giorno
alla settimana per lavorare ai propri progetti; questi progetti vengono poi
presentati al “Google Duo” che premia con denaro e sostegno aziendale i talenti
più promettenti.
Google,
il gigante buono, va in borsa
“Don’t be evil”, non essere cattivo, si può
fare qualsiasi cosa, basta non fare del male. Questo il motto del capitalismo
umano di Google[23]. Ma già si registrano molti distinguo in
questa campagna a favore del Bene: cause legali di vario genere, sospetti di
frode, oscuramento di siti web, ecc.[24].
Nel dicembre del 2002 Google conta oltre
1000 dipendenti e possiede oltre 10000 computer. Indicizza oltre 4 miliardi di
documenti e i ricavi netti (anche se rivelati con molta cautela) sono di circa
185 milioni di dollari. Di fronte a dimensioni simili gli investitori
cominciano a pretendere maggiore chiarezza e controllo, imponendo una struttura
societaria più credibile, con a capo non due ingegneri geniali ed eccentrici,
ma un manager dalle provate capacità imprenditorialie.
Dopo una serie di incontri infelici e di
scontri verbali, il ruolo di amministratore delegato (CEO, Chief Executive
Officier) della Google Inc. viene affidato a Eric Schmidt (già in forza a Sun e
poi a Novell). I due giovani prodigi continuano a prendere decisioni a tutto
campo, ma la mossa diplomatica si rivela essere anche una buona scelta
economica, dato che l’arrivo di Schmidt coincide con il primo trimestre in
attivo della compagnia, che dimostra così di aver finalmente girato con
successo la boa della monetizzazione dei propri prodotti.
Page e Brin avevano dilazionato la
necessità di diventare una società quotata in borsa il più a lungo possibile,
temendo che la necessità di un rendiconto pubblico delle proprie prospettive e
dei propri guadagni avrebbe reso il loro lavoro molto più difficile, mettendo
fra l’altro Google in condizione di essere monitorato meglio e più facilmente e
quindi attaccato dai concorrenti sul mercato.
Ma ormai, dopo AdSense, nel 2004, per
quanto nelle parole di Page “Google non è una compagnia convenzionale. E non
abbiamo nessuna intenzione di diventarlo”, per ragioni legali il nuovo colosso
diventa esattamente come tutte le altre società americane e si quota in borsa.
Proprio a ridosso dell’offerta pubblica,
Yahoo! e altri concorrenti rovesciano decine e decine di cause per violazione
di brevetto, di copyright e altro su Google, per rovinarne il nome in vista
della vendita pubblica delle azioni.
Wall Street è sul punto di abbassare il
prezzo minimo delle azioni previsto, considerata la difficoltà dell’operazione,
ma Page e Brin risolvono la principale contesa con Yahoo!, pagando al colosso
di Filo e Yang un compenso in azioni e sistemando la controversia brevettuale.
Il duo quindi, nonostante il parere contrario della Borsa, procede con l’offerta
pubblica di azioni nel bel mezzo dell’agosto 2004, anche se con un ribasso del
prezzo di oltre 20 dollari ad azione.
In un solo giorno di contrattazioni sul mercato
le azioni di Google passano dalla base di 85 dollari a 100 dollari, con un
guadagno netto di 1 miliardo e mezzo di dollari. Un anno dopo le azioni
raggiungono il valore di 400 dollari con un aumento di oltre il 300 percento.
Per Google Inc. tutto sembra andare a gonfie vele, nel mondo meraviglioso dove
nessuno è cattivo, tutti guadagnano, nessuno si fa mai male. Certo, di fronte a
simili cifre, qualsiasi minima oscillazione al ribasso significa milioni di
dollari in fumo, come si è visto per una flessione di sette punti percentuali
nel marzo 2006. Google Inc. è ormai un gigante fra i giganti della Borsa
mondiale, e se trema, in molti tremano con lui.
Google
Inc.: il monopolio della ricerca
Nell’autunno 2004 Page e Brin, in viaggio
sul loro charter privato, vengono a sapere che il colosso AOL (America Online,
il principale provider statunitense) ha firmato il contratto per il proprio
motore di ricerca con Yahoo!. I neotrentenni cambiano rotta, dirigono su Londra
e convincono AOL a strappare il contratto già firmato e passare a Google con un’offerta
irresistibile da 50 milioni di dollari. Non è esattamente il comportamento
aperto e gentile che ci si aspetterebbe dal gigante buono intento a sconfiggere
i cattivi monopolisti, ma del resto, gli affari sono affari, anche per i due
bravi ricercatori di Mountain View.
Nel frattempo i guadagni di Google Inc. in
un periodo di 5 anni sono cresciuti più del 400 mila percento, rendendolo il
diretto concorrente di Yahoo! e Microsoft, non solo in termini di movimentazione
finanziaria, ma soprattutto per la popolarità e quindi per il dominio culturale
sull’immaginario. Milioni di utenti della Rete usano le pagine di Google come
punto di partenza per le loro navigazioni, si fidano dei risultati ottenuti con
gli strumenti messi a punto a Mountain View. Ormai Google è sinonimo di web,
quando non addirittura di Internet. Google è in grado di sfruttare al meglio la
rete relazionale dei suoi utenti e riesce a spremere ogni centesimo da milioni
di piccoli inserzionisti, cosicché nel 2005 i dati parlano di circa sei
miliardi di dollari di ricavi pubblicitari (Yahoo! è fermo a quota 4,6 miliardi
di dollari).
Il primo pantano nel quale Google rimane
invischiato è il rapporto fra le sue ricerche e la legislazione sui marchi
registrati (trademark, TM). Emblematiche le cause intentate contro Google dalla
Geico e dalla American Blind & Wallpaper Factory[25]. In entrambi i casi le società accusano il
servizio AdWords del motore di ricerca di vendere termini sotto il loro
trademark a concorrenti, violando le leggi sul marchio registrato. La questione
è spinosa, perché le aziende chiedono a Google di impedire che appaiano
inserzioni di proprie rivali o comunque non da loro autorizzate quando gli
utenti cercano termini come “geico”, “american blind” o “american wallpaper”.
Se questo concetto passasse in tribunale, una delle più importanti fonti di
reddito di Google e dei suoi partner verrebbe ampiamente messa a rischio,
perché consentirebbe a chiunque possegga un trademark di inibirne l’uso per AdWords
o di denunciare Google per il suo utilizzo. Louis Vuitton in Francia intenta
una causa simile, e vince. La risposta ufficiale di Google è che i responsabili
della violazione, al massimo, sono gli inserzionisti e non certo Google che in
questo caso è un medium neutro, e che “limitare la vendita di termini
registrati equivale a limitare la libertà di espressione”. Una posizione forte
da parte della società e apparentemente più che condivisibile.
Tuttavia proprio la società di Mountain
View cade nello stesso tranello teso alle società sulla libertà d’espressione,
violando il vincolo di fiducia che la lega a molti utenti e che costituisce una
delle sue risorse fondamentali. Google si è sempre trincerata dietro la
presunta oggettività degli algoritmi di ricerca e l’obiettività delle macchine
nel fornire risultati senza manipolare in alcun modo i risultati. Eppure, poco
prima del causa con American Blind, Google aveva deciso di rimuovere alcune
AdWords acquistate dal gruppo di attivisti Oceana[26]. La “colpa” di Oceana era stata la
pubblicazione di denunce ecologiste circa l’attività di un grosso investitore
di Google, la Royal Caribbean Cruise Lines, usando come keywords dei propri
annunci parole come “cruise vacation” o “cruise ship”, normalmente utilizzate
per cercare pagine riservate a vacanze in barca o simili. La motivazione
ufficiale sostiene che Google è un canale neutro, e non vuole essere veicolo di
campagne propagandistiche atte a discreditare altre aziende. Evidentemente in
questo caso la libertà di parola non era così importante.
Inoltre, proprio il giorno dell’udienza per
il caso American Blind, nel distretto di San José dove si teneva il processo i
risultati di Google si mostravano misteriosamente differenti da ogni altro
luogo nel mondo. Per la prima volta Google veniva colto a manipolare i
risultati per fini diversi da quelli del “miglior risultato di una ricerca”. Il
parere positivo della corte rispetto al caso con Geico (in tutto e per tutto
analogo a quello con American Blind) fatica a cancellare questa realtà.
Il caso più recente e noto rimane l’entrata
in Cina del colosso della ricerca. Per cercare di conquistare il crescente
mercato cinese, Google si è infatti piegato pubblicamente per la prima volta
alle richieste di censura, rendendo inaccessibili i siti indicati dall’autorità
censoria cinese agli utenti che effettuano le ricerche dal territorio cinese.
Ma già nel 2002 uno studio di Harvard aveva mostrato che Google censurava 113
siti, nelle versioni locali francese e tedesca (Google.fr e Google.de). Google
rispose che era vero, ma che erano stati rimossi solo su segnalazione di enti
governativi, autorità di polizia e altri soggetti, e solo dopo attenta analisi
dei loro contenuti: molti siti erano di ispirazione razzista, altri ispirati
dal fondamentalismo religioso. Qualcuno polemizzò sul fatto che la tanto
sbandierata trasparenza di Google cominciava a vacillare: bisognava rendere
noto agli utenti l’applicazione di una censura che rischiava altrimenti di
rimanere “nascosta”; altri fecero notare come la colpa non fosse certo di
Google ma fosse insita negli ordinamenti giuridici che prevedono la possibilità
di trascinare in tribunale un’azienda per la presenza di un link e niente più
sulle proprie pagine[27]. In quel caso, è evidente che Google, per evitare
possibili conseguenze legali, preferì rimuovere i link valutando caso per caso.
Da notare per inciso che la fine del diritto di link è destinata a pesare sulle
libertà digitali in misura sempre maggiore: chi deciderà cosa è lecito
censurare? L’ennesima super-autorità, magari sovrastatale? Il diritto del più
forte, ovvero nel sistema di mercato il diritto di chi paga (o vale) di più?
Oppure i ricatti dei fondamentalismi locali, soprattutto di matrice religiosa,
che minacciano ritorsioni ogni qual volta viene lesa la loro particolare
visione del mondo da qualche sito “sovversivo”? La portata del problema è vasta
quanto l’importanza della libertà d’espressione e certo non si può risolvere
nelle aule di tribunale. Il clamore sollevato dal caso cinese è però legato a
una censura ordinata da un governo: ma nonostante questo cambiamento di scala,
Page e Brin non hanno cambiato idea, coscienti dell’importanza di un mercato
rivolto a un quarto della popolazione mondiale.
Secondo Google presto il mondo sarà un enorme
indice in cui le risorse digitali corrisponderanno completamente e
perfettamente alla definizione della realtà circostante; ogni indice potrà
essere raccolto e offerto nel modo migliore attraverso un algoritmo nei
risultati di una ricerca: e Google è nella posizione perfetta per essere lo
strumento per gestire questo indice.
Ma, a parte l’ovvia e banale obiezione che
i mondi reali e quelli digitali, per quanto intrecciati, non corrispondono
affatto, da un punto di vista tecnico non esiste l’algoritmo perfetto quando si
parla di reperimento delle informazioni in Rete; soprattutto, nulla è neutrale
nell’ambito tecnologico, e tanto meno quando si gestiscono i dati di individui
reali su Internet.
A prescindere dalle alleanze che verranno
strette, la convergenza tecnologica che si sta realizzando ci sembra una
direzione nuova della visione di Google come unico punto d’accesso, di gestione
e di mediazione dei dati digitali. Si delinea insomma la distopia di Google
come aspirante grande fratello, pericolosa e affascinante come ogni scontro
epocale: il web è il nuovo territorio di competizione selvaggia verso l’affermazione
di un nuovo standard di comunicazione. Uno standard paradossalmente “personalizzato”
con servizi e proposte differenziate sulla base dei gusti degli utenti: ormai
da alcuni anni la parola d’ordine è “personalizzazione di massa”. Un ossimoro,
certo, che rivela però l’importanza della posta in gioco, un vero e proprio
slittamento di paradigma, dal consumismo seriale dell’industria di massa al consumismo
personalizzato, che viene spacciato come frutto della “libertà di scelta”. Al
di là delle facili retoriche, la via di fuga può essere solo una nuova
direzione nelle nostre scelte: non si tratta di usare o non usare Google o i
suoi servizi, ma di scegliere diversamente il modo di mettere informazioni su
Internet e di imparare a collegarle in modo nuovo, con percorsi nuovi e più
interessanti per ciascuno di noi[28].
Da alcuni anni
Google sta comprendendo a sue spese (e sulla pelle dei suoi utenti, naturalmente)
che la purezza non è una qualità del mondo e tanto meno del mondo degli affari,
che la bontà totale è una sciocchezza in genere, tanto più per una società che
mira a fare utili, e soprattutto che la neutralità è una strada sempre più
difficile da percorrere nella guerra dei motori di ricerca. Del resto, sarebbe
bene ricordare che le nazioni da sempre neutrali, come la Svizzera, sono anche
quelle armate fino ai denti. Vediamo allora quali sono le armi “buone” di
Google, che ne hanno fatto un fenomeno di rilievo mondiale
[1] Si
veda: Tim Berners-Lee, L’architettura del nuovo Web - Dall’inventore della rete
il progetto di una comunicazione democratica, Feltrinelli, Milano, 2001.
[2] Esiste ancora, ed è un ottimo metamotore di ricerca, combinando i risultati dei migliori motori: http://www.webcrawler.com
[3]
Grazie alla ricerca full-text è possibile trovare parole singole,
combinazioni di parole, frasi complete, scorrendo i documenti nella loro
completezza.
[4] L’idea
di usare le funzionalità di ricerca di altri siti, e quindi poter offrire fra i
risultati anche quelli altrui, non è stata di Excite. Già alla fine del 1995,
MetaCrawler restituiva sulle proprie pagine web i servizi di tutti i motori di
ricerca presenti. A oggi esistono moltissimi meta-motori di ricerca che
compiono ricerche incrociate su diverse tipologie di database.
[5] In
seguito Monier ha lavorato per Ebay; è stato assunto da Google nel 2005.
[6]
Nel 1996 il valore di questa ricerca non è ancora monetizzabile, considerato
anche lo stato embrionale in cui si trova l’economia legata a Internet, ma il
suo potenziale è individuato chiaramente dalla DEC, società che si occupava
dell’aspetto hardware di AltaVista. Tuttavia il gruppo DEC non riuscirà a sfruttare
l’occasione a causa di una serie sfortunata di ristrutturazioni interne che
smembrano il team di AltaVista, acquisito nel 2003 da Overture (ceduta
successivamente a Yahoo!).
[7]
Riteniamo questo approccio assolutamente irrealistico, oltre che politicamente
scorretto e intrinsecamente autoritario, poiché sottintende l’esistenza di un’autorità
in grado di esplicitare e fornire una risposta “giusta, rapida e corretta” a un
desiderio. Possono esistere al limite molti percorsi individuali per costruire
una risposta accettabile e soddisfacente a un
bisogno/desiderio (si veda Cap. V).
[8] Si veda il cap. IV.
[9] Si veda il cap. VI.
[10] Il
sistema della pubblicazioni scientifiche nasce nel 1665 con The Philosophical
Transactions, la prima rivista scientifica fondata da Henry Oldenburg della
Royal Society di Londra, una sorta di pubblico registro della proprietà
intellettuale; essa funzionava come una specie di ufficio brevetti delle idee
scientifiche. La rivista voleva introdurre chiarezza e trasparenza nel processo
di fondazione delle pretese innovative e tali pretese venivano soddisfatte col
conferimento, da parte di pari, di un titolo di “nobiltà intellettuale”; la
quale assicurava un particolare titolo di proprietà: quella intellettuale,
appunto. L’importanza delle pubblicazioni contribuiva alla creazione di una “gerarchia
tra i pari”, fondata su un ideale di eccellenza; tuttavia, poiché i risultati
per essere apprezzati avevano bisogno di pubblicità, l’organizzazione delle
regole di pubblicazione assunse un ruolo centrale, poiché per uno scienziato
rendersi visibile diveniva fondamentale per acquistare notorietà e prestigio.
[11] Il concetto di diluvio informazionale (“déluge informationnel”) è stato sviluppato soprattutto da Pierre Lévy, rielaborando l’idea di “secondo diluvio” dell’artista Roy Ascott. Ne deriva un quadro filosofico in cui il movimento di “virtualizzazione” assume un ruolo centrale, si veda: Pierre Lévy, Il virtuale, Cortina, Milano, 1997 (online la versione originale francese: http://hypermedia.univ-paris8.fr/pierre/virtuel/virt0.htm). In maniera indipendente, Manuel Castells parla di “informazionalismo” ed “economia informazionale”. Gran parte delle letture economiche in merito all’epoca del diluvio informazionale, specie in ambito francese, italiano e statunitense, sono di derivazione marxista e si basano su interpretazioni forzose dei fenomeni di “intelligenza collettiva” delle Reti come ipostasi del General Intellect marxiano; si vedano ad esempio: Olivier Blondeau, Le Capitalisme Informationnel - Genèse et subversion http://www.vulgum.org/article.php3?id_article=158; la rivista monografica “La società del General Intellect”, Derive approdi, Roma; Wark McKenzie, Un manifesto hacker, Feltrinelli, Milano, 2005.
[12] SITOGRAFIA: La revisione dei pari. Definizione: http://it.wikipedia.org/wiki/Revisione_paritaria; La topologia di una Rete di citazioni: Stefano Mazzocchi, “Peer Review vs. Citation Network Topology” http://www.betaversion.org/~stefano/linotype/news/74/; Recenti articoli critici, da The scientist: Alison McCook. “Is Peer Review Broken?”. The Scientist. Volume 20, Issue 2, page 26 http://www.the-scientist.com/2006/2/1/26/1/; Richard Gallagher. “Taking on peer review”. The Scientist. Volume 20, Issue 2, page 13 http://www.the-scientist.com/2006/2/1/13/1/; Google e la revisione dei pari: http://www.lib.uiowa.edu/hardin/md/notes4.html; Il fenomeno dei Blog tra informazione e rumore di fondo: Fabio Giglietto, http://nextmedia.blogspot.com/2004/10/informazionenon-informazione-fra.html; Citazioni e revisione dei pari, scienze dure e scienze morbide: Francesca di Donato: “Verso uno European Citation Index for the Humanities - Che cosa possono fare i ricercatori per la comunicazione scientifica” http://bfp.sp.unipi.it/~didonato/ovre/ECIH.html; L’esaustivo lavoro di Jean-Claude Guédon, “In Oldenburg’s Long Shadow: Librarians, Research Scientists, Publishers, and the Control of Scientific Publishing” Université de Montréal, http://www.arl.org/arl/proceedings/138/guedon.html
[13] SITOGRAFIA: L’accesso ai saperi; la libertà dell’informazione e l’accesso aperto alla letteratura scientifica. Segnaliamo in particolare il volume del Gruppo Laser, “Il sapere liberato”, Feltrinelli, Milano, 2005, online su www.ippolita.net/laser/. In campo umanistico, il lavoro svolto da Francesca di Donato che riesce a coniugare un approccio qualitativo e non scientista con la necessità di decentramento degli archivi e delle informazioni e di definizione di un numero minimo di criteri a priori di catalogazione (metadati, ad esempio attraverso XML), da scambiarsi tramite un protocollo comune. Si veda “HyperJournal. Un software open source per l’Open Publishing” (abstract e slides) http://purl.org/hj/bfp/102/; Seminario: “Dopo Berlin 3: politiche di accesso aperto alla letteratura scientifica” (Pisa, 16 febbraio 2006) http://bfp.sp.unipi.it/blog/html/notizie/oapisa.html. Il sito di HyperJournal: http://www.hjournal.org/
[14]
Per un’analisi dettagliata di
questi rapporti si veda il cap. III
[15] Il datacenter di Google è composto
al momento attuale di svariati datacenter sparsi in giro per il mondo che
elaborano le richieste effettuate e si occupano di propagare le modifiche delle
indicizzazioni. L’aggiornamento dei database, però, così come il calcolo del
pageranking, risente della decentralizzazione: i dati vengono di solito
allineati nel giro di qualche giorno, o anche più; questo sfasamento dà luogo
alla cosiddetta “Google Dance”, la danza dei ranking. Per una panoramica di
massima, si veda l’articolo http://www.alverde.net/articoli/stampa.asp?ID=145 e http://www.motoricerca.info/articoli/google-dance.phtml sulla “Google
Dance”.
[16] Le due società detengono tuttora le quote di maggioranza del capitale di Google.
[17] Un
OEM è una società che costruisce componenti utilizzati in sistemi venduti da un’altra
società come, ad esempio, un rivenditore. Società che vendono prodotti con
componenti provenienti da OEM sono comuni nell’industria elettronica ed
informatica. Tipicamente l’OEM si contrappone al RETAIL, ovvero il prodotto
viene fornito a terzi senza i supporti originali (dischi d’installazione,
manuali, ecc.), integrato nel prodotto del rivenditore.
[18] CPM, CPC, ecc.: i modelli di
business pubblicitario online sono sempre più complessi e raffinati. Per una
rapida introduzione si veda (in inglese) http://earlystagevc.typepad.com/earlystagevc/2005/08/web_20_needs_bu.html; in
italiano, segnaliamo il blog di Mauro Lupi, di AdMaiora: chi meglio di un pubblicitario
può parlare di pubblicità (anche se non certo in maniera critica)?
[19] La storia di Goto è emblematica, perché mostra come anche nel panorama del web si tenda sempre più alle megafusioni tipiche del capitalismo informazionale. Una buon riassunto in italiano fino al 2004 si trova a questo indirizzo: http://www.motoridiricerca.it/goto.htm; su wikipedia, risorse a proposito del ruolo commerciale giocato da Goto/Overture nel business di Yahoo! http://en.wikipedia.org/wiki/Yahoo!_Search_Marketing.
[20] Accenneremo qui solo ai servizi più interessanti; per un elenco esaustivo dei servizi offerti da Google, si veda http://www.google.com/intl/en/options/ (i servizi disponibili in italiano e nelle altre lingue sono meno, ma in rapida ascesa: http://www.google.it/intl/it/options/).
[21] Definizione della Rete di Google secondo Google: https://adwords.google.it/support/bin/answer.py?answer=6104&topic=82
[22] Si veda il servizio fotografico del Time su Googleplex: http://www.time.com/time/photoessays/2006/inside_google/
[23] La filosofia della Google Inc.: http://investor.google.com/conduct.html
[24] Solo tre esempi della mole di informazioni al riguardo: un articolo di Wired, Google vs. Evil, www.wired.com/wired/archive/11.01/google_pr.html; un simpatico raccontino di Paul Ford, The Banality of Google (invece della notoria banalità del male…), http://www.ftrain.com/GoogleIP.html; e un intero portale sul motto, esteso a un’auspicato ritorno della fiducia negli affari, nella politica, nei media, con tanto di manifestazioni perché Google rimanga fedele ai suoi principi, http://www.dontbeevil.com/
[25] Al momento, solo Geico ha perso, negli altri due casi Google è stato condannato a un’ammenda. Segnaliamo qui alcune fonti autorevoli in italiano su queste vicende giudiziarie: il caso American Blind and Wallpaper Factory: http://punto-informatico.it/p.asp?i=46751; Google condannato a risarcire Louis Vuitton in Francia http://punto-informatico.it/p.asp?i=45643; Google vince contro Geico http://webnews.html.it/news/2514.htm
[26] Il gruppo no-profit Oceana si batte per la qualità delle acque: www.oceana.org
[27] La versione integrale del rapporto, a firma di Jonathan Zittrain e Benjamin Edelman, si trova all’indirizzo http://cyber.law.harvard.edu/filtering/google/
[28] In tal senso, una fonte ricca di riferimenti e proposte, indispensabile anche per la stesura di questo testo, è Ferry Bite, Claudio Parrini, “I motori di ricerca nel caos della rete - kit di sopravvivenza”, ShaKe, Milano, 2001.