L'espansione delle ricerche viene effettuata dai motori di ricerca al fine di restituire risultati più pertinenti associati alla ricerca effettuata. L'espansione di una ricerca è un'applicazione dei diversi modelli di Information Retrieval usati dai motori di ricerca per il recupero delle informazioni.
Quando un utente effettua una ricerca sul motore, lo scopo principale del motore di ricerca è “non far ridere” l'utente con i risultati che gli propone. Per affinare questo semplice concetto, il settore dell' Information Retrieval studia da anni metodi e modelli logico-matematici per catalogare, categorizzare, correlare, reperire e restituire informazioni pertinenti alla richiesta inoltrata, e i motori di ricerca sono quelli che ne fanno maggior uso.
Per espandere una ricerca , cioè per associare diversi termini semanticamente o logicamente correlati alla ricerca effettuata, il motore di ricerca potrebbe usare differenti modelli logico matematici: dai diversi sistemi Thesaurus per la costruzioni di elenchi e liste di parole simili, sinonimi, contrari e termini semanticamente collegati, al Term Vector Model , che consente al motore di ricercare e controllare quali siano i termini rilevanti nel documento e pertinenti con la ricerca effettuata,e quale sia il loro peso.
Il Term Vector Model, è il più importante tra i modelli usati per costruire un sistema di recupero di informazioni - IRS (Information Retrieval System), capace di fornire insiemi di risultati ordinati a seguitodi una ricerca effettuata.
Mediante l'applicazione del vettore dei termini, il motore di ricerca è in grado di comprendere il tema di un documento, classificare e ordinare le pagine web e i documenti per argomento.
Si possono pensare numerose altre applicazioni, che potrebbero essere ià utilizzate dai motori di ricerca, basandosi solo sui concetti di somiglianza e similarità tra diversi vettori di termini e sui fattori di valutazione dei pesi, come il generico TF*IDF (TermFrequency * Inverse Document Frequency).
Studiare questo settore dei motori di ricerca e comprendere i vari meccanismi usati per il recupero delle informazioni, è determinante per capire come funzionano i motori di ricerca: l'IR è un argomento molto vasto ed esistono molti modelli da analizzare, è un settore dell'informaticain cui studiosi e ricercatori si cimentano dagli anni 60.
In questa sezione cercherò di fare un breve quadro sull'IR e sui modelli più usati.
Approfondimenti: