L'aggiornamento, o il cambiamento, dei contenuti di un documento o di un sito web possono essere dei fattori determinanti per il posizionamento sui motori di ricerca.
Il motore di ricerca, grazie allo spider che analizza il web nella sua continua ricerca di informazioni, riesce a monitorare gli aggiornamenti, e l'entità di essi, effettuati sul documento o su parti di esso, a partire dalla sua data iniziale o in un determinato lasso di tempo: lo spider archivia, poi, i dati analizzati in una memoria temporanea (la versione cache di Google) in modo da controllare più facilmente se al documento sono apportate modifiche e aggiornamenti.
Nel Brevetto sul reperimento di Dati Storici, Google ci indica anche in che modo potrebbe rilevare e dar peso agli aggiornamenti effettuati: una funzione, che potrebbe essere una somma o una somma pesata, in cui vengono messi in relazione due fattori: uno legato alla frequenza degli aggiornamenti, che indica al motore di ricerca "quanto spesso" viene aggiornato un documento, e uno legato alla quantità degli aggiornamenti effettuati.
La frequenza con cui un documento viene tenuto aggiornato nel tempo può essere determinata dal motore di ricerca facendo uso di "copie" del documento che vengono archiviate nel database del motore e possono essere usate per effettuare analisi comparative in un determinato periodo.
Per determinare, poi, la quantità degli aggiornamenti effettuati, Google nel suo brevetto ci indica diversi fattori che possono essere esaminati per assegnare un punteggio legato alla quantità degli aggiornamenti: dal numero delle nuove pagine in un lasso di tempo, al rapporto di queste ultime con il totale delle pagine contenute dal documento a partire dalla sua Data Iniziale...ma non solo!!
Dal numero dei fattori riportati dal Brevetto possiamo facilmente renderci conto della necessità di aggiornare un documento con contenuti nuovi e validi; infatti la quantità degli aggiornamenti può essere a sua volta una funzione di diversi fattori pesati in maniera differente.
Google può determinare il "tipo" di agggiornamento effettuato e attribuirgli un peso diverso a seconda che il tipo di aggiornamento effettuato sia considerato "importante" o no. Per esempio i cambiamenti di contenuti come commenti, pubblicità, script ed elementi di navigazione possono avere un peso relativamente piccolo od essere addirittura ignorati da Google nella determinazione della quantità degli aggiornamenti.
Dopo aver descritto la frequenza e la quantità degli aggiornamenti, passiamo ad analizzare i vari modi di utilizzo di questi due parametri. Ritroviamo il concetto di "ritmo di crescita" (già visto nella Data Iniziale per il numero di link entranti in un certo documento) applicato agli aggiornamenti o cambiamenti dei contenuti di un documento o di un sito. Il ritmo di crescita degli aggiornamenti in un dato periodo può essere rilevato, esaminato e messo a confronto col ritmo di crescita riferito ad un altro periodo (precedente) per determinare eventuali accelerazioni o decelerazioni negli aggiornamenti dei contenuti: per esempio, a quei documenti in cui viene rilevato un incremento nel ritmo di crescita e nei quali l'entità degli aggiornamenti supera un certo valore, potrebbe essere attribuito un punteggio maggiore rispetto ad altri documenti che non vengono aggiornati, e rimangono statici nel tempo, o che subiscono leggeri aggiornamenti.
Per determinare tutti questi fattori e tenere sotto controllo il ritmo di crescita degli aggiornamenti e la loro entità, il motore di ricerca deve usare fisicamente e materialmente molte risorse: dallo spazio fisico per la memorizzazione dei dati, alle risorse di banda per l'analisi e il rilevamento dei questi ultimi.
Finchè queste risorse sono a disposizione può essere analizzato e archiviato l'intero documento, al fine di rilevarne gli aggiornamenti, ma, in alcune situazioni, queste risorse possono essere momentaneamente insufficienti per una corretta analisi e archiviazione dei dati: in questo caso il motore di ricerca usa archiviare delle "copie" o "rappresentazioni" del documento, invece del documento stesso, e monitorare queste ultime per determinarne gli aggiornamenti. Queste rappresentazioni possono essere delle "signature" (letteralmente firme) di un documento, o un "vettore di dati" in cui sono memorizzati i termini ritenuti più importanti o più frequentemente ricorrenti nel documento.
Con lo stesso tipo di analisi effettuate per determinare l'aggiornamento dei contenuti di un documento, il motore di ricerca può generare, sempre sulla base dei contenuti di un documento, un certo "codice" di somiglianza, in cui memorizzerà una serie di termini o una copia intera del documento, e monitorare questo codice per rilevare gli aggiornamenti effettuati. Lo stesso "codice di somiglianza" può essere usato, poi, dal motore di ricerca, per rilevare eventuali duplicazioni e simili di un documento. A tal proposito, nel brevetto sui dati storici, è indicato che per documenti molto grandi, che includono per esempio parti di documento o documenti interi appartententi a più individui, il punteggio che il motore di ricerca genera può essere assegnato a ciascuno dei sub-documenti, che è aggiornato dal singolo individuo ma che fa parte a tutti gli effetti del "macro" documento.
Alla luce di quanto visto, la frequenza e la quantità degli aggiornamentideicontenuti di un documento, o di un sito internet, possono essere due parametri fondamentali elaborati dal motore per il corretto posizionamento del sito sui motori di ricerca; aggiornare spesso i contenuti di un sito, o di un documento, è sicuramente un fattore da non sottovalutare per ottenere un corretto posizionamento. Il motore, infatti, in generale preferisce siti che aggiornano spesso, e in grande quantità, i propri contenuti, tranne in alcuni casi in cui, per alcune ricerche, possono essere favoriti documenti che non sono stati recentemente aggiornati rispetto al altri aggiornati più di recente.
L'aggiornamento dei contenuti traduzione in italiano del brevetto sui Dati Storici
Posted in I Dati Storici printer-friendly version | 2327 reads
Submitted by Motori-e-Ricerca on Sun, 2005-11-27 15:58.