I: descrizione del sistema

[0037] In riferimento alla fig.1, è mostrata l'architettura software di un sistema di ricerca incoporato 100 in accordo all'incorporazione della presente invenzione. In questo, il sistema include un sistema di indicizzazione 110, un sistema di ricerca 120, un sistema di presentazione 130 e un server front end 140.

[0038] Il sistema di indicizzazione 110 è responsabile dell'identificazione di frasi nei documenti, e dell'indicizzazione dei documenti in accordo con le loro frasi, accedendo a diversi siti web 190 e altri insiemi di documenti. Il server front end 140 riceve le query dall'utente di un client 170, e fornisce queste query al sistema di ricerca 120. Il sistema di ricerca 120 è responsabile della ricerca di documenti rilevanti per la query di ricerca (risultati di ricerca), includendo l'identificazione di ogni frase nella query di ricerca, e poi dell'ordinamento dei documenti nei risultati della ricerca usando la presenza di frasi per influenzare l'ordine di importanza. Il sistema di ricerca 120 fornisce i risultati di ricerca al sistema di presentazione 130. Il sistema di presentazione 130 è responsabile della modifica dei risultati di ricerca inclusa la rimozione di documenti duplicati, e della generazione di descrizioni in tema coi documenti, e fornisce i risultati di ricerca modificati al server front end 140, che fornisce i risultati al client 170. Il sistema 100 include un indice 150 che archivia le informazioni di indicizzazione pertinenti ai documenti, e un magazzino di frasi (dati) 160 che archivia le frasi, e le informazioni statistiche correlate.

[0039] Nel contesto di questa applicazione, i "documenti" rappresentano ogni tipo di media file che può essere indicizzato e recuperato dal motore di ricerca, inclusi documenti web, immagini, file multimediali, documenti di testo, pdf o altri. Un documento può avere una o più pagine, partizioni, segmenti o altri componenti, appropriatamente al suo contenuto e tipo. In maniera equivalente un documento può essere inteso come una "pagina", come comunemente si usa per riferirsi ai documenti su Internet. Nessuna limitazione all'opportunità dell'invenzione è implicata dall'uso del termine generico "documenti". Il sistema di ricerca 100 opera su un largo corpo di documenti, come Internet e il World Wide Web, ma può nello stesso modo essere usato in insiemi più limitati, come per l'insieme di documenti di una libreria o di una impresa privata. In entrambi i contesti, si valuteranno i documenti che sono generalmente distribuiti su diversi sistemi di computer e siti. Senza perdita di generalità allora, i documenti in generale, a meno del formato o della locazione (esempio quale sito web o database) sarà collettivamente corrisposto ad un corpo o ad una raccolta di documenti. Ogni documento ha associato un identificativo che identifica univocamente il documento; l'identificativo è di solito una URL, ma anche altri tipi (esempio numeri documenti) possono essere usati. In questa è assunto l'uso delle URL per l'identificazione dei documenti.

AttachmentSize
figura2.jpg56.19 KB

Posted in Phrase based searching in IRS printer-friendly version | 2535 reads

Submitted by Motori-e-Ricerca on Wed, 2007-04-11 10:33.

Cerca con Google

Google
Web motoriericerca.com

Syndicate

XML feed

User login