Global Rank: fro papalarita e qualita dei siti Web

Transcript

Global Rank: fro papalarita e qualita dei siti Web
Global Rank: fro papalarita e qualita dei siti Web
di Stefano Federici, Simone Borsci, Maria Laura Mele
e Gianluca Stamerra
Riassunto
Con il progredire del Web nascono nuovi bisogni dei navigalori connessi sia
alia quantitil. e reperibililil. delle informazioni che alia crescenle necessilil. di garanzie della qualitil. delle slesse e dell'interazioni dell'ulenle con Ie tecnologie.
L'alluale modello di ordinamenlo dell'informazione dei motori di ricerca, centralo
su una Web Popularity (WP) quantitativa, obbliga l'ulenle ad un adaUamento cognitivo complesso dovulQ ai limiti di questa imposlazione "elerodirella", che Irasporta dalle lecnologie alia realtil. il fenomeno del "rich-gel-ritcher". Molti sludi in
lellemlura mostrano !'esigenza di implememare gli alluali modelli di Web Rank
allmverso !'introduzione di algoritmi in grado di valutare la qualitil. delle pagine e
delle informazioni in esse contenute in senso qualitativo, facilitando l'adallamento
cognitivo aHa tecnologia da parte dell'utente.
Parole chiave: distribuzione del Rank, link popularity, qualitil. dei sistemi.
Summary
Through the Web communication development, new users' needs are rising related 10 the amount of information and its findability, and also in relation 10 the
increasing necessity to ensure quality for user-technology interaction. The current
model of information ranking by search engines is based on quantitative Web
Popularity (WP) and it binds the user 10 a cognitive adaptation based on an "heterodirected" rank-system restrictions which transposes the "rich-get-richer" effect
from technologies 10 reality. Several wolks in literature show the need 10 implement the current Web-ranking models through the introduction of algorithms,
which are able to evaluate the quality of pages and the information they contain on
a qualitative level easing users' cognitive adaptation 10 the technology.
Keywordv: rank distribution, link popularity, system quality.
Psicolech,n.l,2008
7
Introduzione
Lo sviluppo della Rete Internet e oggi una realta consolidata a livello
mondiale, sebbene debba ancora risolvere Ie questioni inerenti il digital
divide; sviluppo che e entrato in una nuova fase, quella cioe cent rata sulla
relazione tra utente e tecnologia. Ogni tecnologia e descrivibile come un
amplificatore che in se trasporta regole, vincoli e possibilita di conoscenza
e che costringe il soggetto-utente che intende utilizzare tali strumenti, ad
un adattamento cognitivo e culturale.
La Web site Popularity (WP) e emersa intorno agli anni '90 come indice quantitativo, in risposta all 'esigenza dei motori di ricerca di mettere ordine all'infonnazione presente nella Rete ed organizzarla in "c1assifiche"
che rispondessero aile query degli utenti (Cho, Roy, 2004). Tali c1assifiche
esprimono in gradi di val ore, rank, la popolarita di un sito Web. PopolaritQ
e qui inteso come "ampio consenso popolare". 11 consenso e rilevato dal
numero di volte in cui un sito Web e visitato.
Tale impostazione, utile agli inizi dello sviluppo della tecnologia Web,
via via ha assunto un implicito significato qualitativo, di qualita di contenuto e accessibilita del sito, che potrebbe essere accettabile solo nel momento in cui Ie c1assifiche contenessero, nelloro calcolo algoritmico, fattori connessi alia qualita strutturale del sito e della sua informazione, cosa
che non avviene negli attuali ordinamenti dell'infonnazione dei motori di
ricerca. Pertanto, quel consenso su cui e misurata la popolarita di un sito ha
ben poco a che fare con un esplicito assenso degli utenti su contenenti e
qualita del sito c1iccato!navigato. Tuttavia, illivello di WP veicola implicitamente un consenso di qualita per un semplice meccanismo percettivo,
indotto dalla tecnologia stessa, fondato su una comune legge di mercato:
I'oggetto piil venduto e I'oggetto migliore. Che in questo caso si traduce
in: I'oggetto piil c1iccato e I'oggetto migliore.
Infatti, i motori di ricerca ordinano i risultati di una query secondo una
sequenza gerarchica, dall'alto verso il basso, partendo dal sito che possiede
il maggior livello di rank in poi. Sicche, il primo risultato proposto e percepito dagli utenti anche come quello qualitativamente migliore, che meglio cioe risponde alia richiesta inserita dall'utente nel motore di ricerca. Si
ediffusa cosi I'idea che i motori di ricerca e Ie liste di ranking siano strutturate per offrire il piil rapidamente possibile il prodotto migliore rispetto
alia query inserita. Tale effetto, prod otto da una certa "consonanza cognitiva", per cui il primo posto in c1assifica di un sito che possiede il massimo
grado di rank induce a inferire che esso possieda anche la migliore qualita
rispetto al contenuto del sito medesimo (Ia risposta ha incontrato la do8
manda), non fa che produrre un processo circolare e vizioso, per cui cio
che si presenta pill facilmente raggiungibile in uno spazio virtu ale, perche
pHI popolare, otterra sempre maggiore popolarita, perche probabilisticamente pHI c1iccato dagli utenti (Cho, Roy, Adams, 2005; Fortunato, Flamini, Menczer, Vespignani, 2006). Tale probabilita, inoltre, sara pill elevata
per quei siti gia popolari, in quanto si presentano primi nell'ordine sequenziale della list a dei risultati, influendo sulle scelte degli utenti e sulla fruizione dell'informazione. La qualita, cosi, diviene un mero prodotto tecnologico che informa e forma la realta dell'utente, influenzandolo nel giudizio di quei prodotti che egli sceglie, mentre diviene un mezzo del processo
indotto dal prod otto tecnologico stesso.
La sovrapposizione fra Ie rnisure di Web popularity e di /illk popularity
L'ordinamento dell'informazione in Internet da parte dei motori di ricerca si basa, come sottolineano Brin e Page (1998) fondatori ed ideatori di
Google™, suI calcolo della link popularity (LP), ovvero suI numero di inbound ed outbound 0 external link che uniscono i vari siti della Rete.
Maggiore e il numero di link che conducono ad un sito Internet, piil alta e
la posizione di quel sito nel motore di ricerca. Sebbene sia noto che esistano nell'algoritmo di Google™ altre specifiche che determinano il posizionamento, come il fattore di dumping, ovvero il valore attribuito nel rank ad
una singola pagina e il traffico del sito, e innegabile che attualmente la WP
e prevalentemente determinata dalla LP e che si sia diffuso I'assunto che la
popolarita e la qual ita siano direttamente correlate attraverso il numero di
link (Pandey et aI., 2005). Se, per esempio, inseriamo nei motori di ricerca
secondo Nielsen (2006) piil utilizzati, Coogle.com, Yahoo.com e Msn.com
Ie parole chiave link popularity e Web site popularity (di questo risultano
sinonimi Website popularity, Web popularity e popularity), si ottiene una
quasi totale coincidenza dei primi 10 risultati (vedi Tabella I).
II rank di popolarita e certamente un criterio ritenuto dai motori di ricerca utilissimo per dare ordine all'informazione presente nella Rete e offrire con efficacia ed efficienza risposte adeguate aile query degli utenti
(Page et aI., 1999). Tuttavia, questo criterio di ordinamento, funzionale ai
search engine, dell'informazione Internet, rischia di essere travisato quando I'utente presuppone che il sito Web piu alto in c1assifica, sia anche
quello che conduca ad informazioni qualitativamente migliori di altre presenti nella Rete.
9
Tabella 1: Risultati ottenuti inserendo Ie query link popularity e Web site popularity in 3 motori di ricerca.
M!Xorr iii rima.
~u!tlU 101m JIC1
WP Risultlu wtlh JIC1 LP Primi SERP"
9/10
Google.com
65.300_000
16_800.000
.~
Y:lhOO.COID
77.100.000
64.600JJOO
.~
fill lI'i'o\l'
"'10
fra lI'i'o\l'
Msn.com
27.900.000
20.500.000
8/10
asllOcilli!:u!
fill lI'i'o\l'
.
•SERP. Search Engine hwhs Pagt. (pagim dci mll1Ul1 dellllOlOR di. nefta)
Per poter parI are di WP in termini qllalitativi, il rank dovrebbe essere
elaborato anche in base ai giudizi degli utenti rispetto al sito navigato, indice assolutamente non rilevato dalla WP.
Per meglio comprendere la distinzione tra un indice solo quantitativo e
un indice anche qualitativo, possiamo esemplificare riferendoci all'indice
dell' Impact factor, prodotto dalla Thomson Scientific (http://scientific
scientific.thomson.comlindex.html), che e un val ore assegnato ad ogni articolo del Citation Indexes, cioe la raccolta di riviste scientific he intemazionali e dei relativi articoli, che rappresenta il numero di articoli (isibi
source) che fanno riferimento ad esso (Garfield, 1955; 1961).
Trattandosi del risultato del rapporto fra il numero di citazioni ricevllte
in un certo anno da lavori pubblicati su una specifica rivista nei due anni
precedenti e il numero di articoli che sono stati pubblicati su quella rivista
nello stesso periodo di tempo, I'impactfactor esprime, in un valore quantitativo, I'impatto della rivista nel mondo scientifico, ossia quanto una rivista e letta e citata. In questo caso il valore quantitativo di popolarita scientifica della rivista indica un pari grado di qualita della medesima (almeno
per la comunita scientifica che si riconosce nel Citation Indexes). Pertanto,
nell'indice di "popolarita" espresso dall'impact factor viene indicato il
riutilizzo da parte degli utenti di quel prod otto indicizzato, che costituisce
una garanzia di qual ita esterna al sistema di ordinamento dell'informazione
(Ia Thomson Scientific). Diversamente, la WP prodotta dai motori di ricerca non tiene conto delle valutazioni degli utenti rispetto al contenuto del
10
sito, limitandosi a computare il numero dei link e la quantita di traffico
accumulata da un sito.
Certo, entrambi i rank potrebbero subire un effetto di circolarita viziosa. E infatti noto che la popolarita e un processo cumulativo, che segue il
Mathew Effect, individuato da Merton (1968; 1988) per spiegare il successo delle produzioni scientifiche, secondo cui gli scienziati che raggiungono
dei successi nei primi anni di carriera hanno in seguito molta pHI facilita a
pubblicare e dunque costruiscono piu facilmente una credibilita che determina il successo delle proprie teorie, a parita di ogni altro fattore. Ma, a
differenza della WP, I' impact factor e conseguenza di una popolarita partecipativa e intenzionale. Ovviamente, nella comunita scientifica e possibiIe parlare di infonnazione monopolizzata dalle grandi scuole di pensiero.
Tllttavia, il grado di consapevolezza del fenomeno e assai pill ampio di
quello che invece sembra sfuggire agli lltenti nell'automatismo di un semplice click.
I principi di ordinamento dei motori di ricerca conducono all'impossibilita per siti non popolari di emergere nella Rete. Cosi come viene descritto da Cho e collaboratori (2005) descrivendo il fenomeno del rich-getricher, per cui la popolarita delle pagine tende ad aumentare, mentre Ie
pagine nuove 0 non popolari diminuiscono nella possibilita di essere
II isibil.
Alcuni stlldi empirici sembrano contrastare, perC., una visione del tutto
passiva dell'lltente, complice inconsapevole del fenomeno indotto del
rich-get-richer. Un recente studio di Fortunato e collaboratori (2006) ha
dimostrato che esiste un comportamento adattivo degli utenti che,
nell'utilizzo della Rete, mitigano I'incidenza della popolarita come fattore di ricerca ed ordinamento. Infatti, gli utenti nei motori di ricerca tenderebbero ad espandere la rice rca anche ai siti meno popolari generando
una ridistribuzione del traffico. Inoltre, all'aumentare dei collegamenti,
Ie pagine pHI popolari raggiungono una certa satllrazione di WP e, indipendentemente dall'aumento dei link entranti, tali pagine non espandono
la loro visibilita.
Questi effetti di mitigazione e saturazione dipenderebbero dallivello di
interesse dell 'utente rispetto ad un argomento che, una volta visitato i siti
pHI popolari, ampliera la sua ricerca orientandosi su siti meno popolari,
ridistribuendo cosi il traffico Internet.
Se e vero, perc., che soggetti particolannente esperti riescano ad ampliare I'informazione cercata, allargando la navigazione ai siti meno popolari,
Ie barriere interattive bloccano gli utenti meno esperti impedendogli di
ampliare la ricerca e di ridistribuire il traffico. Per cui, se da un lato
II
I'effetto della WP quantitativa e mitigato dal comportamento di utenti esperti che, avendo sviluppato un adattamento ai limiti dell'ordinamento
delle Search Engine Results Page (SERP), accedendo anche ad informazioni divergenti, periferiche e qualitativamente migliori, questo mantiene il
suo effetto fuorviante nei non-esperti. Le possibilita di accesso alia Rete
restano ineguali e tendono ad ampliare il digital devide. La Rete obbliga,
come ogni tecnologia, ad un adattamento dell'utente, ma tale processo potrebbe essere notevolmente semplificato da una maggiore accortezza
nell'organizzazione dell'accesso all'infonnazione, modificando gli algoritmi di ranking, introducendovi aspetti qualitativi nella WP.
Un indice di qualita, inserito nel calcolo algoritmico dei motori di ricerca, potrebbe generare una ricerca piil orientata aile esigenze degli utenti,
che non impedirebbe I'ordinamento dei risultati, pur permettendo a tutti gli
utenti, indipendentemente dal livello di competenza tecnologica, di accedere piil facilmente ad infonnazioni qualitativamente migliori.
Un primo aspetto qllalitativo che potrebbe essere introdotto nella WP e
quello dell'accessibilita di un sito che, seppure non ci dice ancora nulla
sulla qualita dei contenuti, tuttavia ci permette di verificare il primo fondamentale livello di accesso all'informazione: la capacita di garantire, nella misura piil ampia possibile, che Ie informazioni siano disponibili aile
persone, indipendentemente dalla presenza 0 meno di disabilita, di qualsiasi natura esse siano (Berners-Lee, 1999). Un indice di popolarita che tenesse conto di cio gia garantirebbe un accesso universale, diminuendo il carico cognitivo legato alia navigazione e di conseguenza una piil facile frllizione dei contenuti. Gia con questo primo passo si supererebbe la sovrapposizione tra WP e LP.
Corne superare la sovrapposizione tra \VP e LP?
Molti studi a livello intemazionale hanno dimostrato che Ie c1assifiche
di rank tendono a:
I.
2.
non modificare la distribuzione dei siti Web nel tempo, suggerendo
I'idea che la WP quantitativa sia una proprieta universale di
Internet (Krashakov, Teslyuk, Shchur, 2006);
mantenere Ie posizioni dei siti pHI popolari, incrementando il divario con i siti meno popolari (Cho et aI., 2005).
12
Tali studi, tesi ad implementare 0 modificare Ie metodiche di ranking,
si basano su diverse riconcettualizzazioni della popolarita.
Cho et at. (2005) hanno proposto una visione della WP come una qual ita delle pagine derivata da un modello ipotetico dell'utente. Questa impostazione pennetterebbe di superare il fenomeno definito rich-get-richer.
Cho propone una funzione di ranking denominata pagequality, da integrare nell'algoritmo del rank, introducendo il fattore "qualita della pagina"
derivato dal modello utente, nella computazione delle c1assifiche di popolarita. Sebbene interessante, tale sollizione risliita esterna ai motori di ricerca e vincolata ai limiti del modello dell'utente. La necessita attuale e
invece quella di individuare un procedimento di valutazione integrabile
nelle tecniche di c1assificazione dei siti Web.
Nie et at. (2005) hanno proposto di integrare la WP con la qualita dei
link che hanno un cosi grande peso nell'attuale ranking dei siti. Tale impostazione propone un modello di object ranking, denominato PopRank (popularity rank), che compllti in maniera diversificata i link di ogni singola
pagina trattandoli come oggetti, permettendo una diversificazione delle
c1assifiche di popolarita attraverso un diverso peso dei link. Anche questa
soluzione, pur essendo valida, non fomisce un indice della qualita che si
possa considerare universale e dunque applicabile in ogni tipo di c1assificazione dei siti Web. Piil recentemente Yen (2007) propone di integrare la
WP con il design delle pagine. In quest'ottica la WP e determinata delle
possibilita di accesso al sito, 0 reperibilita di accesso, intesa come il grado
di facilita con cui una pagina puo essere trovata attraverso altre pagine e
link. Tale impostazione sostiene un punto di vista vincolato alia popolarita
quantitativa, per cui I'accessibilita, qui intesa come reperibilita, e in stretta
relazione con il numero di hyperlink. In questo senso potremmo definirla
un'accessibilita quantitativa. Questo approccio e utile per creare strutture
Web calibrate, in cui Ie pagine con i contenuti piu importanti dovrebbero
essere quelle piu linkate, in modo da creare una connessione fra popolarita
e Ie pagine con Ie infonnazioni pHI rilevanti. Questo modello, sebbene utile
per costmire strlltture Web facilmente raggiungibili e calibrate, non riesce
tuttavia a superare la logica quantitativa e rimane legato a fattori di analisi
del design, senza prendere in considerazione I'accessibilita nel suo significato pHI profondo, cioe come superamento delle barriere e garanzia per Ie
persone con disabilita di percepire, comprendere, navigare e interagire con
il Web e offr"ire ad esso un loro contributo (http://www.w3c.itlwai/).
La WP e stata rivista anche come un indice calcolabile automaticamente attraverso la relazione fra aspetti qualitativi interni ed esterni al sito. Tale impostazione formulata da Signore (2005) muove dalla definizione ISO
J3
9126 di qualita d'uso: capacita del prodotto software di essere compreso,
appreso, usato e gradito dall'utente quando usato in determinate condizioni. Le scale di valutazione dei siti Web si baserebbero su cinque dimensioni: accuratezza, presentazione, contenuto, navigazione e interazione.
Zeng e Pannanto (2003) ritengono che si possa verificare I'esistenza di
una correlazione fra WP ed accessibilita, intesa questa come la capacita di
garantire, nella misura pUt ampia possibile, che Ie infonnazioni siano disponibili aile persone, indipendentemente dalla presenza 0 meno di disabilita, di qualsiasi natura esse siano (Berners-Lee, 1999). Questi autori utilizzano per I'analisi dell'accessibilita un algoritmo denominato Wabscore
(Web isibilita barrier score) in grado di misurare il numero di barriere presenti nelle pagine Web, la cui formulazione e la seguente:
p: pagine lolali del silo Web;
v: violazioni lolali della pagina;
nv: numero di violazioni;
Nv: numero di violazioni potenziali;
Wv: peso della violazione in maniera inversamente proporzionale al WCGA;
Np: numero di pagine analizzale in IotaIe.
Zeng mostra, attraverso prove sperimentali su un campione rappresentativo di 108 siti Web riguardanti il tema della salute, come attraverso
I'analisi dei dati del rank e dell'accessibilita del campione, si evidenzi una
correlazione importante fra: qualita, accessibilita e WP. I risultati dimostrano che esiste una correlazione fra la popolarita di un sito e la sua accessibilita, riscontrabile solamente nelle c1assifiche di alcuni motori di ricerca,
dando prova della possibilita di introdurre il fattore dell'accessibilita nel
calcolo del rank. Questi stlldi testimoniano la necessita, opportunita e possibilita di un superamento dell'attuale impostazione del WP che, pur mantenendo la sua primaria funzione di organizzazione dell'informazione, ordini qualitativamente i SERP. La popolarita puo essere ripensata come un
indice che offra realmente all'lltente la possibilita di ricevere informazioni
anche sulla qual ita delle infonnazioni reperibili nella Rete ed utili alia sua
ricerca; e questo gia garantendo I'accessibilita delle pagine Web, ovvero
dall'assenza di barriere all'infonnazione in esse contenuta. Se un sito e
popolare, dunque, deve poter essere accessibile alia maggioranza della
/4
popolazione Internet. Accessibile deve poter allora corrispondere a "popolare". criterio d'ordine della WP.
Introduzione del criterio di accessibilita nella classifica rnondiale
di siti \Veb universitari
AI fine di verificare empiricamente se I'introduzione di un criterio di
valutazione dell'accessibilita di un sito modifichi la sua posizione in un
ordinamento basato esclusivamente su di un criterio quantitativo di Web
site popularity si e proceduto nell'applicazione del WabScore di Zeng e
Pannanto (2003) nel Webometrics Ranking (WR) of World Universities
(http://www.Webometrics.info).I1WReun·iniziativa condotta dal
Cybermetrics Lab, un gmppo di ricerca del Centro de informacion y 00cumentacion, parte del National Research Council spagnolo. II Cybermetries Lab e finalizzato all'analisi quantitativa di contenuti Internet e Web.
II WR e una c1assificazione mondiale di siti Web universitari che c1assifica
ciascun sito sommando diversi indici di c1assifiche separate basate principalmente su fattori quantitativi e inbound ed outbound link. Abbiamo scelto il WR per due ragioni: la prima, perche esso si present a come una c1assificazione di siti basata su un calcolo del rank secondo i criteri utilizzati dai
motori di ricerca; la seconda ragione e che esso intende superare un ordinamento non basato solo sui risultati della ricerca, cosi come avviene nei
search engines, ma come c1assificazione che, attraverso I'integrazione di
altri indicatori, sappia riflettere la qualita globale dei siti delle istituzioni
universitarie mondiali presenti nel Web. Pertanto, il nostro esperimento
mirava a verificare se i criteri di qualita utilizzati per I'ordinamento dei siti
universitari operata dal WR correlassero con illivello di accessibilita dei
medesimi.
Proprieta rnetriche del \VR
II WR e costruito su una sommatoria di quattro c1assifiche separate
(http://www.Webometrics.info/methodology.html):
•
size (S): numero di pagine recuperate a part ire da quattro motori di
ricerca (Coogle, Yahoo, Live Search e Exalead); per ciascun motore, i risultati sono log-nonnalizzati ad I del valore piil alto. Poi,
per ciascun dominio, sono stati esclusi i risultati massimi e minimi
/5
•
•
•
e ad Og111 lslltuto e stato assegnato un rank, in accordo con la
somma combinata;
visibility (V): il numero totale di link unici ricevuti dall'esterno
(inlinks) possono essere ricavati con sicurezza da un sito attraverso
Yahoo Search, Live Search ed Exalead. Per ciascun motore, i risultati sono log-nonnalizzati ad I del val ore piil alto e quindi combinati per generare il rank;
rich files (R): dopo la valutazione della loro pertinenza ad attivita
accademiche e di pubblicazione e in considerazione al volume dei
diversi fonnati di files, e stato selezionato quanto segue: Adobe
Acrobat (.pdf), Adobe PostScript (.ps), Microsoft Word (.doc) e
Microsoft Powerpoint (.ppt). questi dati sono stati estratti usando
Coogle e unendo i risultati per ciascun tipo di file dopo la lognonnalizzazione nel modo gUt descritto;
scholar (Sc): Coogle Scholar offre il numero di articoli e citazioni
per ciascun dominio accademico. Questi risultati, a part ire dal
database Scholar, presentano docllmenti, reports e altri articoli accademici.
Le quattro c1assifiche vanno a fonnare una scala globale, il WR, che da
luogo all'ordinamento nella classifica secondo la fonnula segllente:
WR ~ (4'V}+ (2'S) + R + Sc
V: Visibility rank;
S Size rank;
R: Rich file rank;
Sc: Google scholar rank.
L'impostazione del WR evidenzia come il fattore visibilita, sebbene abbia
un peso notevole nella sommatoria, non sia detenninante nell'ordinamento,
diversamente da cio che avviene nei motori di ricerca. II WR intenderebbe
offrire cosi un'infonnazione qualitativamente esaustiva agli utenti, ritenendo
di superare i vincoli di una c1assifica basata soltanto sui WP.
Metodologia di analisi e risultati
Sulla base della c1assifica proposta dal Webometric dei primi 3000 siti
delle universitft mondiali, e stata operata una divisione in 20 c1assi di 150
/6
siti, in base aile posizioni determinate dal WR. Come campione rappresentativo per ogni c1asse e stato selezionato: il sito posizionato nel valore medio, qllello sopra e qllello sotto una deviazione standard della c1asse. II
campione, rappresentativo della c1assifica globale, lltilizzato nell'analisi e
stato dunqlle composto da 60 siti Web (vedi Tabella 4). L'accessibilita e
stata misllrata, cosi come proposto da Zeng e Pannanto (2003), lltilizzando
Bobby© 5.0 come crawler per identificare Ie violazioni aile WeGA 1.0., da
cui si sono ottenllti i dati necessari al calcolo del WabScore per ogni sito
Web universitario dei 60 selezionati.
L'analisi dell'indice WabScore, che va da 0 (pienamente accessibile) a
I (massima inaccessibilita), ha evidenziato che il campione era composto
da siti non pienamente accessibili, con una media di 0,35 punti di inaccessibilita che indica la presenza di 35 barriere reali 0 potenziali su 100
(StdV"O, I0).
L'analisi delle correlazioni non ha evidenziato alclln val ore significativo del WabScore ne con il WR, ne con ciascllna delle qllattro c1assifiche
che costitlliscono gli addendi della sommatoria del WR. Chiaramente, tutti
gli elementi delle 4 c1assifiche che costitlliscono il WR e 10 stesso WR sono correlati fra loro (vedi Tabella 2).
Tabella 2: CO/Telazione per ranghi di Spermanfra ifattori Size rank (S), Vivibilita
rank (V), Richfile rank (R), Google scholar rank (Sc), Webometric rank (WR) e
WabScore.
w
,
S
1,000
,11:01'
.764·
,6119·
,909·
.113
V
,so I·
1,000
,674·
,621·
,927'
,1J5
R
,764'
,67P
1,000
,719·
,533'
.160
S<
.6119·
.(il] •
,n9·
1,000
,S03·
,060
WR
,909·
,927'
.BH·
,B01·
1,000
,101
WabScou
,ID
,13>
,160
,060
,107
1,000
,
..
Ne conseglle che il Webometrics Ranking of World Universities, sebbene offra una c1assificazione basata Sll piu fattori di valutazione rispetto a
quella offerta dai motori di ricerca, manca di un fattore determinante, qllel-
/7
10 dell'accessibilita, che dovrebbe assumere un molo rilevante in una c1assitka che indicizza siti di enti che promllovono in massimo grado contemlti educativi, favorendo un accesso senza barriere agli utenti.
Successivamente, abbiamo ipotizzato che, se avessimo inserito il fattore
accessibilita nella scala globale del WR, avremmo potuto modificare
I'ordinamento delle posizioni dei siti delle singole llniversita in base alia
loro accessibilita. Si e dunque proceduto trasfonnando it WabScore in modo da inserire anche I'accessibilita del sito tra gli addendi della sommatoria
del WR. L'accessibilita, come affermato da Zeng e Parmanto (2003) deve
essere correlata alia WP, che nel calcolo del WR assimilabile alia c1assifica V (visibility rank). Abbiamo quindi deciso di creare un Accessibility
Rank (AR), ottenendo cosi it numero di posizioni, approssimato per eccesso, di cui deve scendere un sito nella c1assifica V in ragione dei suoi punti
di inaccessibilita, secondo la seguente formula:
e
V· WabScore = AR
V: Visibility rank.
La formula ci permette di ottenere un fattore che agisce direttamente suI
rank V ed indirettamente sulla WR, come proposto nella seguente modifica della sommatoria denominata GlobalRank (GR):
GR ~ (4'(V+AR))+ (2'S) + R + Sc
GR: GlobalRank;
V: Visibility rank;
S Size rank;
AR: AccessibililyRank;
R: Rich file rank;
Sc: Google scholar rank.
Con un WabScore pari a zero, la posizione del sito resta invariata sia
nel rank V sia nella c1assifica generale WR, poiche il sito Web pienamente accessibile. Con WabScore pari ad I, che eqllivale al I()()O/(I di inaccessibilitft, il sito Web scende del doppio del suo valore nel rank V, influenzando indirettamente I'ordinamento WR. 11 GR rappresenta la variazione, in base all'accessibilita, dell'ordinamento della c1assifica WR rispettando Ie correlazioni con i fattori (vedi Tabella 3) che danno luogo alia
sommatoria:
e
/8
Tabella 3: Analisi della correlaziolle per ranghi di Spermall fra Size rank (S), Visibility rank (V), Richfile rank (R), Google scholar rank (Sc), AR, WabScore e
l'ordinamento secondo il GR.
S,
AR
W~bStor~
GR
S
1,000
,80 I
0
R
,']~~
,~89
,156°
,113
,SHo
V
,SOl'
1,000
,6H
,621' ,91.'i'
,IH
,946°
R
,164 0
.674 0
1,000
.n9
.6.'i4°
,160
,:s~Oo
Sc
,619 t
,621
0
,n9 t
1,000 ,599 0
,060
,181·
AR
,756°
,935 0
,654
,599 0 1,000
,431°
,901 0
,135
.1~0
,060
V
WabScoft .113
GR
,894'
,946"
,8~Oo
• 1... corr.I.""o"••
,432°
1,000
,160
,187' ,907'
.160
1,000
nrn,f.cu,va a) 1".11.. 0.01.
II fattore accessibilita introdotto con AR nella c1assifica GR risulta correI are sia con il WabScore che con gli altri addendi della sommatoria WR,
dimostrando cosi di rispettare anche Ie proprieta di calcolo dell'ordinamento WR (vedi Tabella 4). Dccorre inoltre notare che il Wabscore, come
gia nella precedente analisi rispetto al WR (vedi Tabella 2), non correIa
con il GR. Questo conferma che la formula del GR, pesando I'accessibilita
tramite il rank AR, non snatura completamente la precedente c1assifica del
WR, correlando con Ie diverse scale di questo, pur approfondendo illivello
di misurazione delle caratteristiche dei siti.
Questioni aperte
II nostro studio lascia ancora aperti alcuni aspetti che dovrebbero essere
affrontati dal futuro sviluppo di algoritmi di ranking:
•
I'integrazione di formule di misurazione del fattore accessibilita,
come il nostro GR, negli algoritmi di ranking dei motori di ricerca,
tra I'altro c'e da considerare che I'adozione di un algoritmo di
ranking dei siti da parte dei principali motori di ricerca che introducesse il fattore accessibilita spingerebbe gli sviluppatori di siti a
prendere in maggiore considerazione Ie standard roules della W3C
per favorire la visibilita del proprio sito;
/9
•
•
I'accessibilita e soltanto la principale porta d'accesso ai contenuti
di un sito Web, il passo ulteriore necessario a garantire una c1assifica in grado di fornire utili informazioni sulla qualita del sito dovra elaborare formule in grado di dare indicazioni anche sulla qualit a dei contenuti stessi;
infine, sarebbe auspicabile che ulteriori sviluppi di ranking dei siti
prendessero in considerazione anche I'usabilita delle interfacce
Web, per fornire indicazioni sulla qualita dell'interazione utentetecnologia.
Conclusioni
L'analisi che abbiamo condotto sui rapporto fra WP e qualita in
Internet mostra come I'attuale impostazione algoritmica dei motori di ricerca centrata sui calcolo della LP, non sia in grado di rispondere aile nuove esigenze degli utenti che sperimentano un processo di costante adattamento alia tecnologia Internet. La necessita di avere un indice di popolarita
che sia in grado di informare sulla qualita dell'infonnazione e un emergenza dovllta a qllesto adattamento. L'idea che il comportamento e Ie strategie
di ricerca dell'utente emergano come un fattore contrastivo dei limiti strutturali delle impostazioni di ranking dei motori di ricerca e sllggestiva e
sembra confermare I'idea che la tecnologia, in quanto amplificatrice
dell'agire umano, permetta alia specie di evolvere sviluppando nuovi comportamenti adattivi in sistemi complessi. Tale adattamento riproduce tuttavia nella realta il fenomeno del rich-get-richer, contrastabile solo con
I'introduzione di indici qualitativi, come il WabScore, che consentono un
riordinamento delle c1assifiche di rank. La modifica da noi proposta del
Webometrics Ranking of World Universities dimostra come la connessione
fra il concetto di WP e quello di accessibilita possa ristmtturare gli ordinamenti dell'informazione, senza modificare Ie proprietft e gli obiettivi
delle c1assificazioni. La diffllsione e la promozione dell'accessibilita passa
attraverso 10 sviluppo della relazione fra questa e la qualita delle strutture
Web. Tale legame pennette non solo di contrastare il digital divide, ma
anche di ridurre il carico cognitivo semplificando Ie strategie di reperimento dell'infonnazione, divenendo cosi un mezzo che estende e promuove
I'adattamento cognitivo aile tecnologie da parte dell'lltente.
20
Tabella 4: clavsifica Global Rank e nuovo ordinamento con l'introduzione del
fattoreAR.
0_
N~
WebSile
1
~
hll :Ilww",. il-nn
hltp:/lwww.utsa.edu
531
hltp:llwww.maine.edu
http://www.uni-ulmde
hltp:/lwww.uab.es
hUp:!!ww", .rdg.ac.uk
7
12
11
lJ
...,
14
15
16
17
lJ
14
16
17
" "
19
20
19
20
" l.!
" "
"
" "
"
" "
2J
25
380
860
74
3J9
300
4'"
561
269
"
203
215
132
265
442
2'"
hllpJlwww.mcw.edu
hn
'186"
364
776
71
http://www.usyd.edu.au
10
98
222
64
I
2
3
4
5
6
12
26
hltp:/lwww.msu.odu
hllpJlwww.buffalo.odu
I
10
GR
Richfile
2
3
4
5
6
11
WR
Visibility
OnIN
,• ,
S,
Size
"""',
wW",.f r ham.
hn :Ilww",.bill.ac.il
hltpJlwww.iitb.ac.in
489
121<;
627
352
•
hltp:llwww.stcvens.edu
III
151
305
383
.l2li
'"
433
351
1<9
674
1092
<6,
306
767
924
305
403
14'
"'
600
<1,
1185
1297
1709
2092
"80
2600
J494
J6911
'"40
3941
4329
5180
1889
3036
'6"
1311
'"
4"'"
1256
<;246
<;<;10
612
4H67
5114J
lJ7
I 41
5812
7436
!ill.!
441
7659
7790
5
R4'
62.
1036
570
1351
663
855
564
717
'"
6199
1087
7158
713
"'"
7519
7799
7864
8568
hn
w"'. \',
hn :!!ww",.iisc.ernel.in
71
hlto:/lwww.clVU.edu
'92
hltpJlwww.Weber.edu 10("
http://www.nmu.edu S03
1428
206"
1211
1354
791
686
2183
hllpJlwww.uniandes.odu.CQ
122
,...
10526
hup://ww", .nuhsc.cd Il
1627
!.ill
15JO
20117
111191
111659
hn -/ ww",.i"lk.a .in
1291
1.lfi2
9ill
I ill
5117
http://www.ulster.ac.uk 1086
'",",.arti.
hn
1166
1619
""
5Jj)
10lIl
'1147
IIH99
hn :!!www.lle\·nra. I
hlm:!!www .sden ccs-on.fr
1951
hllpJlwww.simmons.edu
1737
95'
1114
8412
9544
1341
1439
1579
10554
12490
4'0
IIOR
1002
4'50
1UI6
I2UIII
WIOO
223H
766
1133H
I2HII6
1776
13070
I"'"
1009
983
2,122
"'''
11598
I ... .l.l.!lli!.
1J2J2
16112
JllI6
11656
14140
2753
2266 13021
14141
27
27
1lt
25
"30
2R
hn :/lwww.lcsc.edll 1376
30
http://www.bard.edu 2035
Jl
Jl
hllDJlwww.uhb.fr
1725
1483
2100
2108
13590
15978
'I.
II
II
'I.
hup:11w w"' .unh'-lille2.fr
UIllJ
196R
15,11
1247
142511
15994
hnp:!!www .Il sslc.edll.cn
1742
1494
2,114
2141
J4
JR
hn :/lwww.llliss.il 2296
2059
35
35
hltpJIwww. bridgeport.edu 2036
1774
"'"
1492
2614
15274
18306
)6
'"
191<;
2.174
2114
14R64
llUI04
J7
J7
Jj)
41
J9
J9
hu - www nii ala- .a
hn -/ ww"'.
,.
11 2
1218
1J915 161179
1502 16619 17723
hltpJlwww.nsu.edu 2488
1697
1895
2679 16338 18982
144.
hit :/lwww.ceu.es 294'
12119
57JII
4J29
17799
19499
180'
2504
1274
I"'"
19788
hup:!!ww",.a rlcen ler.cd u
2/
0_
Qnloo
N,w
OnIN
WebSite
Size
Visibility Richfile
S,
WR
GR
20077
'" .u'"
hllpJlwww.hamk.fi
1056
2".,
nOt
17445
hllpj/lw ww .£dgcwood.£d u
2612
I SlI9
2611,1
4511
UI694
211282
'Ii
hllp:{/Www.ufS·hr
1459
2,19S
UII4
IJS6
IS6lI1l
hl! :lIwww.ubu.ac.lh
HI77
2451
1611
29S0
UII49
'11664
21097
hllpJlwww.sa vonia-amk.fi 2648
1984
1674
"'"
4163 19069 21737
1022 '9442 23498
1912
390'
20Rn
!.2.!§.
,HIOI
1!..!i1l
24169
2407
24"i40
41
42
4J
42
44
44
45
46
.
47
.
45
hllpJlwww.uca.edu.ar 3007
£!
h" :lIwww.du sita e.l h 2821
hllp:llwww. nmh M.rn u ,111211
47
hlt • ",",w.m im .r
2749
2JJ9
2{)6S
"'IK
49
51
£!
49
h" :{fwww.xznu.edu.cn 31143
hllPi(fwww, .ill!.l
;
0
x.fr
a
46
hnp:!!ww",.n jusl.edu.cn
lUll
24,14
52
56
.edu
JJJII
"7'>
a
a
,:;
,.
SS
a
53
2
57
57
58
58
a
60
,
..
h" :lIwww.s
2360
2599
'7<"
1982
2066
23612
"'J7
20444
"., 219S4
'5660
!ill
2IJOO
~
2174
,HIOI
20075
25707
56'"
SIH9
4707
24177
'64119
hnp:!!ww", .Iflka i.a c. i p ,1075
2177
,1,115
2,1,1112
26446
hllp:/lwww. miem.edu.ru
WII
SIl95
2H9J
2,11170
271J1I
hit :f/www."cl.ac.i1
''''7
'''''0
3103
HIJJ
JJJ5
22954
273UI
hllp:/lwww.hehau.edu.cn
HilS
JOO2
24J7
5445
ill!!!l
277S6
1581
1298
2646
.15..11
225..11
2R.11 I
2822
3417
4163
24992
28988
,H197
297S
1S24
256711
29666
hlt • www.
...
.
..
hltp:llwww.rdc.ab.ca 3062
h ltp:!!www .en skaen. fr
'640
32113
1573
2S24 25347 311379
h" :lIwww.aull .11 41169
sono stall marcalL I SIll coo hanno modlficalo la 10m poslZIOOO nspctlo al fallore aCCCSSlblhtl. AR.
60
59
Bibliografia
Bemers-Lee T., FischeUi M. (1999), Weaving the Web: Origins and Future of the
World Wide Web, Orion Business, Britain.
Brin S., Page L. (1998), "The Anatomy of a Large-Scale Hypertextual Web
Search Engine", Computer Networks, 30: 107-117.
Cho J., Roy S. (2004), "Impact of Search Engines on Page Popularity", International World Wide Web Conference, Proceedings of the 13th international
conference on World Wide Web: ACM.
Cho J., Roy S., Adams R.E. (2005), "Page Quality: In Search ofan Unbiased Web
Ranking", SIGMOD, 551-562.
Fortunato S., Flamini A., Menczer F., Vespignani A. (2006), "Topical interests
and the mitigation of search engine bias", PNAS, 103(34): 12684-12689.
Garofalakis J., Kappos P., Mourloukos D. (1999), "Web site optimization using
page popularity", IEEE Internet Computing, 22-29.
Garfield E. (1955), "Citation Indexes for Science: A New Dimension in Documentation through Association of Ideas", Science, 122(3159):108-111.
Garlield E. (1961), "Science Citation Index", Science Citation Index, 80( I): V-XVI.
22
ISO/IEC FDiS 9126-1 (2000), Software Engineering - Product quality - Part 1:
Quality model,
(ONLINE): htlp://www.usabilitynel.orgltoolsl/r_intemational.htm#9126-1.
Krashakov S.A., Teslyuk A.B., Shchur L.N. (2006), "On the universality of rank
distributions of Website popularity", Computer Networkv, 50:1769-1780.
Merton Robert K. (1968), "The Mallhew Effect in Science", Science,
159(38101'56-63.
Merton Robert K. (1988), "The Matthew Effect in Science, II: Cumulative
advantage and the symbolism of intellectual property", ISIS, 79:606-623.
Nie Z., Zhang Y., Wen J., Ma W. (2005), "ObjectLevel Ranking: Bringing Order
to Web Objects", International World Wide Web Conference Committee
(IW3C2), ACM.
Nielsen J., Loranger H. (2006), Prioritizing Web usability, USA: New Riders.
Page L., Brin S., Motwani R., Winograd T. (1999), "The PageRank Citation
Ranking: Bringing Order to the Web", Stanford Digital Library Technologies,
1-17.
Pandey S., Roy S., Olston c., Cho J., Chakrabarti S. (2005), "Shuffling a Stacked
Deck: The Case for Partially Randomized Ranking of Search Engine Results",
Proceedings ofthe 3/st VLDB Conference, lEEExplore.
Signore O. (2005), "A Comprehensive Model for Web Sites Quality", Proceedings ofthe 2005 Seventh IEEE International Symposium on Web Site Evolution
(WSE'05), IEEE computer society.
Yen B.P.c. (2007), "The design and evaluation of accessibility on Web navigation", Decision Support Systems, (42):2219-2235.
Zeng X., Parmanto B. (2003), "Evaluation of Web Accessibility of Consumer
Health Information Websites", AM/A 2003 Symposium Proceedings.
23