La data iniziale dei documenti

La Data Iniziale può essere vista come il "primo contatto" tra il motore di ricerca e il documento. E' uno dei parametri fondamentali sul quale si basano molte implementazioni diverse dell'algoritmo: il motore di ricerca, infatti, per poter eseguire le diverse analisi necessarie al reperimento dei dati storici e comparare i dati relativi a periodi diversi, deve attribuire al documento una "data di nascita" dalla quale cominciare a rilevare cambiamenti e aggiornamenti.

Nel brevetto, Google, ci indica l'utilizzo di diversi modi usati dal suo motore di ricerca per reperire la Data Iniziale di un documento:

- attraverso l'esplorazione, cioè con il primo passaggio dello spider nel documento
- attraverso la segnalazione del documento al motore di ricerca da fonti esterne, come ad esempio il modulo di segnalazione Add URL dello stesso Google
- attraverso una combinazione delle prime due tecniche
- attraverso l'esplorazione del web, quando lo spider del motore di ricerca trova per la prima volta un link al documento.

In altre implementazioni dell'algoritmo poi, ci sono anche altri modi di reperire la Data Iniziale: alcuni esempi li possiamo leggere nel Brevetto, ma ci sono anche altre tecniche non specificatamente menzionate, o combinazioni di esse, che possono essere usate per determinare la data iniziale del documento. Alla luce di questo, soffermiamoci sul significato e sulle possibili applicazioni del concetto di Data Iniziale.

La Data Iniziale di un documento è necessaria al motore di ricerca per stabilire quanto sia "vecchio" o "giovane" un documento: per misurare l' "anzianità" di un documento in un determinato momento, Google nel suo brevetto fa riferimento alla Data Iniziale dello stesso. A seconda, poi, dell'anzianità del documento, e anche in base al settore di competenza dello stesso, ma lo vedremo più avanti, può essere implementato un sistema di valorizzazione che consideri più importante un documento più anziano a dispetto di uno più giovane.

In un esempio del Brevetto, Google indica la corrispondenza del concetto di Data Iniziale con i backlink di un documento: infatti, partendo dall'assunto che un documento con una Data Iniziale abbastanza recente non riceva un numero significante di link da altri documenti rispetto ad un documento più vecchio a cui puntano molti più link, possiamo facilmente intuire che il documento più anziano sia considerato più importante e di conseguenza venga maggiormente valorizzato.

D'altro canto, introducendo il concetto di "ritmo di crescita" dei backlink, cioè quanti backlink riceve un documento in un determinato periodo di tempo a partire dalla Data Iniziale, quanto appena detto sopra potrebbe non essere più vero, ed un documento più giovane con un ritmo di crescita maggiore potrebbe avere più valore di un documento più anziano con più link ma con un ritmo di crescita minore. Questo a testimoniare il fatto che un documento "anziano" ha maggiori probabilità di contenere informazioni "obsolete" rispetto ad un documento più giovane.

In questo modo, il ritmo di crescita dei backlink di un documento può essere monitorato dal motore di ricerca ed usato anche come fattore di determinazione di probabile spam al motore stesso e il concetto di ritmo di crescita diventa quindi un concetto molto importante al fine di "pesare" i backlink di un documento.

Il concetto "ritmo di crescita", appena descritto per i backlink, assume, quindi, un valore molto importante: ritroveremo in altre sezioni il "ritmo di crescita" di qualcosa, cioè quanto un determinato fattore viene implementato o aggiornato in un determinato periodo di tempo, e vedremo quanto questo concetto sia importante per la corretta lettura di tutto il Brevetto.

La Data iniziale: traduzione in italiano del brevetto sui Dati Storici

Posted in I Dati Storici printer-friendly version | 3059 reads

Submitted by Motori-e-Ricerca on Sun, 2005-11-27 15:51.

Cerca con Google

Google
Web motoriericerca.com

Syndicate

XML feed

User login