L'indicizzazione nei motori di ricerca di Motori e Ricerca nel secondo mese da quando è on-line, ha visto notevoli aggiornamenti nel numero delle pagine e dei contenuti correttamente indicizzati.
In quest'ultimo mese, Motori e Ricerca non ha ricevuto link freschi statici, soltanto link in post del forum GT sul posizionamento nei motori di ricerca.
Il sito viene costantemente visitato dagli spider dei motori di ricerca di Google, Yahoo e Msn: GoogleBot spiderizza correttamente ogni categoria, tanto che, avendo commesso un errore nella configurazione dell'archivio di Motori e Ricerca, si era addentrato nell'archivio del 2005 e visitava ogni giorno una trentina di pagine VUOTE!!
Essendo nato a dicembre 2005, i contenuti in archivio erano relativi solo all'ultimo mese: il mio errore è stato quello di non configurare correttamente l'archivio soltanto sui giorni con contenuti, creando così tutto l'archivio del 2005 che risultava pieno di pagine vuote.
Ho disabilitato l'archivio, disabilitato sul file robots.txt l'accesso alla
cartella relativa all'archivio 2005, dopodichè GoogleBot ha continuato a spiderizzare la categoria per un po', poi ha cambiato, ha continuato ad addentrarsi nelle altre categorie e l'indicizzazione è di nuovo proseguita correttamente.
Tra i vari spider, GoogleBot, nonostante si parlava qualche tempo di problemi legati allo spider di Google, è sicuramente quello che funziona in maniera efficiente. MsnBot, nonostante l'estrema velocità iniziale, effettua visite di brevi entità e con discontinuità. Slurp, come dicevo nelle prime pagine del diario, ha confermato la sua costanza, e, ad oggi, è quello che costantemente aggiunge pagine indicizzate in Yahoo senza alcun problema.
Dopo aver esaminato l'indicizzazione in maniera approfondita nel primo mese, tutti i giorni, con rapporti settimanali, in questo secondo mese ho preferito cercare di tracciare dei profili di crescita dell'indicizzazione: qui di seguito vi riporto alcuni dati che ho tenuto sotto controllo per approfondire l'indicizzazione di un sito nuovo e conoscere e studiare i comportamenti degli spider dei motori
di ricerca.
Gennaio |
Pagine indicizzate su Google |
Pagine indicizzate su Yahoo |
Pagine indicizzate su Msn |
6 |
40 |
16 |
48 |
8 |
40 |
23 |
48 |
9 |
41 |
27 |
53 |
10 |
43 |
36 |
53 |
11 |
74 |
34 |
60 |
12 |
46 |
37 |
60 |
13 |
46 |
40 |
60 |
14 |
74 |
40 |
60 |
15 |
73 |
42 |
57 |
16 |
74 |
43 |
60 |
17 |
74 |
72 |
56 |
18 |
48 |
45 |
67 |
20 |
118 |
47 |
70 |
21 |
39 |
47 |
70 |
22 |
37 |
45 |
67 |
23 |
156 |
92 |
71 |
24 a .m |
37 |
108 |
72 |
24 p.m |
186 |
108 |
72 |
|
|
|
|
Si può vedere come i vari datacenter siano spesso disallineati: verificando l'indicizzazione su Google.it e sui datacenter di BigDaddy (tipo il 66.249.93.104) spesso si riscontrano risultati completamente differenti: è come se i datacenter su cui agisce BigDaddy siano più aggiornati e facciano da fonte per gli altri datacenter.
Posted in Diario di bordo | Monitoraggio indicizzazione printer-friendly version | 1194 reads
Submitted by Motori-e-Ricerca on Mon, 2006-03-06 20:25.