Il Recupero delle Informazioni (IR) è uno dei settori tecnologici di base dei motori di ricerca per l'estrazione dei dati dagli archivi.
Il settore SEO è in continua crescita ed evoluzione, sempre più web-master, web-designer e programmatori si avvicinano al posizionamento sui motori di ricerca.
I motori di ricerca si evolvono ininterrottamente: ben presto, avendo archiviato e ottimizzato le tecniche per il recupero dei documenti, rivolgeranno la propria attenzione all'intelligenza artificiale.
Ogni SEO per cercare di “seguire il passo” dei motori, dovrebbe conoscere il funzionamento degli algoritmi usati dai motori per la ricerca e l'archiviazione, la classificazione, la valorizzazione e il recupero dei documenti.
Conoscere gli algoritmi significa studiare, provare, testare, e studiare.
E gli studi devono essere approfonditi e di settore: bisogna comprendere come ragiona il motore di ricerca per sapergli comunicare correttamente le informazioni di cui necessita.
In questa sezione verrà studiato l 'Information Retrieval , cioè il recupero delle informazioni , cercando di mettere in luce almeno le basi e le varie tecniche usate nel recupero delle informazioni, come il Vector Space Model (modello spazio vettoriale)
L'Information Retrieval, è uno dei settori di base per lo sviluppo di applicazioni e tecnologie per il reperimento, l'archiviazione e il recupero di dati (testi, documenti, media, altro): dai criteri di espansione di una ricerca allo studio del Relevance Feedback e criteri per la raffinazione di una ricerca basato sulle preferenze dell'utente, dal Latent Semantic Indexing, (LSI), indicizzazione semantica latente, ai sistemi di thesaurus usati per l'associazione e la correlazione di parole e argomenti.
Cercherò di approfondire le varie teorie trattate soprattutto in relazione al posizionamento su Google: l'unico motore di ricerca di cui sono pubblici alcuni algoritmi di funzionamento brevettati ufficialmente all'indirizzo
I Brevetti di Google
Espansione della query
Creare nuovi link
Link a porzioni di documento
Molte sono le pubblicazioni di esperti ricercatori e scienziati sull'Information Retrieval: la maggior parte delle pubblicazioni provengono da fonti universitarie, tra cui in particolare segnalo quelle della Standford University, in cui sono contenute alcune pubblicazioni di K.Bharat, ingegnere di Google e progettista di Google News, come “The
Term Vector Database: fast access to indexing terms for Web pages” (2000), When experts agree: using non-affiliated experts to rank popular topics. (ACM
Abstract) (HTML)
Raymie Stata, Krishna Bharat, Farzin Maghoul. The Term Vector Database: fast access to indexing terms for Web pages. 9th International WWW Conference (WWW9) WWW9/Computer Networks 33(1-6): 247-255 (2000) (HTML)
Posted in Motori di Ricerca | Fattori Tecnici printer-friendly version | 3728 reads
Submitted by Motori-e-Ricerca on Mon, 2006-01-23 19:25.