Google PageRank
Il concetto di attribuire un valore ad un documento ed usarlo per meglio restituire i risultati delle ricerche è alla base delle diverse tecnologie che usano i motori di ricerca: alcuni attribuiscono maggior valore ai fattori di ottimizzazione interna del sito, altri, come Google, hanno sviluppato il proprio algoritmo sulla popolarità di un sito internet.
Il PageRank, detto anche indice di popolarità, è una delle tecnologie centrali di Google: la sua origine risale a un articolo tecnico scritto dai fondatori di Google, Lawrence (Larry) Page e Sergey Brin, quando studiavano ancora all'Università di Stanford intitolato " The Anatomy of a Large-Scale Hypertextual Web Search Engine ". PageRank non conosce siti ma singoli documenti.
Il funzionamento del PageRank, fondamentalmente, è piuttosto semplice e si basa sul numero di link effettuati a una determinata pagina da altre pagine Web, più link esistono a una determinata pagina e più questa diventerà "importante".
Ogni link viene considerato come un voto espresso dalla pagina che integra il collegamento ipertestuale alla pagina correlata. PageRank si basa sul concetto che la qualità di un documento possa essere riconoscibile dalla quantità e dalla qualità dei link che riceve da altri documenti esterni.
Tempo fa lessi una guida a Google, in cui si diceva che PageRank risentisse della attinenza dei contenuti a quella delle pagine correlate: ma nella formula originale del PageRank non ci sono fattori che indicano la tematizzazione dei contenuti.
La formula per il calcolo del PageRank potrebbe essere stata aggiornata, ma, come testimoniano l'algoritmo di ordinamento dei risultati Hilltop e il database dei vettori di termini per riconoscere il tema trattato nei documenti, sarebbe più facile che siano stati implementati nuovi sistemi per la modifica dei punteggi generati da PageRank
Google TrustRank
Ultimamente Google, ha registrato un'altra tecnologia di nome TrustRank, che secondo molti affiancherà il PageRank nell'algoritmo del motore di ricerca.
Zoltàn Gyongyi e Hector Garcia-Molina del Computer Science Department dell'Università di Stanford insieme a Jan Pedersen di Yahoo! Inc. sono gli autori di una pubblicazione dal titolo Combating Web Spam with TrustRank.
TrustRank nasce quindi per combattere lo SPAM: nell'introduzione della pubblicazione si legge:
"Mentre un utente esperto può facilmente identificare lo SPAM, è troppo dispendioso valutare manualmente un grande numero di pagine web. Proponiamo, quindi, delle tecniche semi-automatiche per separare le pagine buone dallo SPAM. Prima si sceglie un piccolo insieme di pagine, da valutare da un esperto, considerate come "semi": una volta che abbiamo identificato manualmente i "semi", usiamo i link contenuti per scoprire altre pagine che potrebbero essere buone. Basando il nostro esperimento sugli indici di Altavista, i risultati che proponiamo mostrano come una lista di circa 200 buoni "semi" possano effettivamente combattere e filtrare lo SPAM dai risultati delle ricerche."
La grossa e sostanziale novità quindi risulta essere l'impiego di risorse umane nei sistemi di ordinamento dei risultati: saranno tecnici esperti a selezionare la lista di partenza di siti "fidati" da cui partire nella ricerca di documenti e contenuti di qualità grazie ai sistemi di linking di internet.
Uno degli aspetti interessanti è che sicuramente non saranno più utili molti di quei trucchi e stratagemmi usati per aumentare il ranking: per avere un buon posizionamento su Google sarà sempre più necessario realizzare delle pagine di buona qualità, interessanti, ricche di contenuti e con relazioni con altri siti web correlati.
In sintesi, realizzare siti di qualità .
Posted in Fattori Esterni printer-friendly version | 1931 reads
Submitted by Motori-e-Ricerca on Mon, 2005-11-28 18:13.