Sunday, November 17, 2019

Motore di ricerca

Motore di ricerca

Da Wikipedia, l'enciclopedia libera.
Jump to navigationJump to search
Nell'ambito delle tecnologie di Internet, un motore di ricerca (in inglese search engine) è un sistema automatico che, su richiesta, analizza un insieme di dati (spesso da esso stesso raccolti) e restituisce un indice dei contenuti disponibili[1] classificandoli in modo automatico in base a formule statistico-matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca.
Uno dei campi in cui i motori di ricerca trovano maggiore utilizzo è quello dell'information retrieval e nel web. I motori di ricerca più utilizzati nel 2017 sono stati: GoogleBingBaiduQwantYandexEcosiaDuckDuckGo.

Descrizione[modifica | modifica wikitesto]

Concettualmente un motore di ricerca è un sistema molto simile ad un'applicazione web ovvero un sistema client-server, attraverso la rete Internet, dove il client è rappresentato dal web browser dell'utente che su richiesta dello stesso si connette ad un server il quale a sua volta esegue una query di ricerca, tramite opportuni algoritmi di ricerca, su dei database (database distribuiti). Nell'analisi dei risultati forniti in output un componente essenziale è il cosiddetto crawler o spider. Un buon motore di ricerca è quello che riesce a trovare il maggior numero di contenuti in linea con la tipologia di richiesta ordinandoli per importanza e rilevanza secondo la specifica di ricerca.

Fasi operative[modifica | modifica wikitesto]

Il lavoro dei motori di ricerca si divide principalmente in tre fasi:
  • analisi del campo d'azione (tramite l'uso di crawler appositi);
  • catalogazione del materiale ottenuto;
  • risposta alle richieste dell'utente.

Catalogazione[modifica | modifica wikitesto]

Dopo l'analisi delle pagine, a seconda di criteri che variano da motore a motore, alcune di esse vengono inserite nel database e nell'indice del motore di ricerca.
La parte testuale archiviata durante la fase di analisi verrà in seguito analizzata per fornire le risposte alle ricerche degli utenti. Molti motori di ricerca sul web rendono anche disponibile una copia dei dati testuali di ogni pagina archiviata per quando la risorsa originale sia irraggiungibile: questa funzione è detta copia cache.

Risposta[modifica | modifica wikitesto]

Rispondere alle richieste degli utenti implica la necessità di elencare i siti in ordine di rilevanza rispetto alla richiesta ricevuta.
Per stabilire la rilevanza di un sito vengono cercati nel database quei documenti che contengono la parola chiave inserita dall'utente, dopodiché ogni motore di ricerca sfrutta propri algoritmi per classificare le pagine, controllando, per esempio, quante volte le parole chiave vengono ripetute, quanti link riceve quel documento, in quali punti della pagina sono poste le parole chiave, quanti siti del database contengono link verso quella pagina, o quante volte un utente ha visitato quel sito dopo una ricerca.

Raffinamento della ricerca[modifica | modifica wikitesto]

La possibilità di raffinare la ricerca varia da motore a motore, ma la maggior parte permette di utilizzare operatori booleani: ad esempio è possibile cercare "Ganimede AND satellite NOT coppiere" per cercare informazioni su Ganimede inteso come pianeta e non come figura mitologica.
Su Google e sui motori più moderni è possibile raffinare la ricerca a seconda della lingua del documento, delle parole o frasi presenti o assenti, del formato dei file (Microsoft WordPDFPostScript, ecc.), a seconda della data di ultimo aggiornamento, e altro ancora. È anche possibile cercare contenuti presenti in un determinato sito, ad esempio "Ganimede site:nasa.gov" cercherà le informazioni su Ganimede presenti sul sito della NASA.
Su Exalead si trova una parte speciale per raffinare la ricerca più intuitivamente.

Indicizzazione[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svg Lo stesso argomento in dettaglio: Indicizzazione (motori di ricerca).
Per indicizzazione si intende l'inserimento di un sito web nel database di un motore di ricerca. L'indicizzazione di un sito internet, in altre parole, è il modo in cui il sito viene acquisito e interpretato dai motori di ricerca e quindi compare nelle loro pagine di risposta alle interrogazioni degli utenti web.

Posizionamento[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svg Lo stesso argomento in dettaglio: Posizionamento (motori di ricerca).
Con il termine posizionamento s'intende l'acquisizione di visibilità tra i risultati dei motori di ricerca. Più specificamente, è l'operazione attraverso la quale il sito viene ottimizzato per comparire nei risultati in una posizione il più possibile favorevole e rilevante.

Ottimizzazione[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svg Lo stesso argomento in dettaglio: Ottimizzazione (motori di ricerca).
Con il termine ottimizzazione per i motori di ricerca si intendono, nel linguaggio di internet, tutte quelle attività volte a migliorare la visibilità di un sito web sui motori di ricerca (quali ad es. Google, Yahoo!, ecc.) al fine di migliorare (o mantenere) il posizionamento nelle pagine di risposta alle interrogazioni degli utenti del web. A sua volta, il buon posizionamento di un sito web nelle pagine di risposta dei motori di ricerca è funzionale alla visibilità dei prodotti/servizi venduti.

Risultati sponsorizzati[modifica | modifica wikitesto]

I motori di ricerca forniscono anche risultati sponsorizzati, ovvero mostrano in maggiore evidenza nelle SERP (Search Engine Result Pages, Pagine dei risultati dei motori di ricerca) siti web di aziende che pagano per risultare tra i primi risultati quando si cercano termini (detti keyword o parole chiave) che sono in relazione all'ambito di competenza dell'azienda stessa. I risultati sponsorizzati dei motori possono apparire anche sui siti che partecipano al loro programma di affiliazione. In particolar modo, Google permette di far apparire nelle proprie SERP (chiaramente distinti dai risultati "naturali") risultati a pagamento comprati con il programma AdWords. In aggiunta a questo offre anche un servizio di sponsorizzazione che si rivolge a tutti i siti che hanno determinati requisiti, chiamato AdSense. Google AdSense (spesso abbreviato con Google AS) usa le capacità del motore di ricerca di interpretare il tema della pagina in cui è posizionato l'apposito codice per fornire annunci a tema. Yahoo! Search ha annunciato l'arrivo di un programma analogo chiamato Panama.

Motori di ricerca più diffusi[modifica | modifica wikitesto]

Secondo alcuni servizi online[2] nelle 12 mensilità del 2017 i motori di ricerca più utilizzati a livello mondiale sono i 4 seguenti, con circa il 95% di peso percentuale sul traffico delle ricerche internet da desktop. :
  • Google, oltre ad essere di gran lunga il più usato direttamente, è anche quello con il maggior numero di siti che ne utilizzano il database, anche a causa del programma di sponsorizzazione "AdSense per la ricerca" che appartiene al più vasto programma AdSense.
  • Yahoo!
  • Microsoft Bing, il motore creato dalla Microsoft ed usato da Microsoft Network, meglio noto come MSN.
  • Baidu, tecnologia proprietaria cinese che raccoglie un bacino di utenza tanto vasto quanto in crescita, dato il totale strapotere sugli altri motori di ricerca usati in Cina.
Questi 4 motori di ricerca sono come prevedibile gli unici dotati di una tecnologia proprietaria.
Altre menzioni importanti sono:
  • Ask.com, usato dalla versione italiana di Excite per un rapporto di partnership.
  • Ixquick, uno dei pochi motori di ricerca al mondo a garantire la privacy, poiché non conserva né registra gli IP di chi effettua ricerche.
  • FileByType è una raccolta di moduli di ricerca basati sulle categorie.
  • Ecosia, motore di ricerca ecologico tedesco, produce meno anidride carbonica dei server concorrenti; l'80% dei proventi viene utilizzato per piantare alberi in giro per il mondo e diminuire il disboscamento, ed è stato fondato in collaborazione con il WWF.
  • Qwant, motore di ricerca europeo che mira ad offrire all'utente una maggiore privacy.
  • Yandex, dominatore delle statistiche di search market share in Russia.
Le prime quattro tecnologie proprietarie sono utilizzate da una quantità sterminata di provider e di metamotori di ricerca (il cui nome deriva proprio dal pescare i propri risultati da più motori, come il metamotore incorporato nel portale Excite). A più riprese Microsoft ha provato a comprare Yahoo!, cosa che avrebbe portato ad un ulteriore accorpamento e riduzione delle tecnologie proprietarie in campo, a causa della fusione di Live (il motore della Microsoft) e Yahoo! Search. L'ultimo rifiuto di Yahoo! è riportato dal Wall Street Journal in data 6/5/2007 (a fronte di un'offerta di circa 50 miliardi di dollari da parte della società fondata da Bill Gates).
Parte delle descrizioni dei siti presentate nei risultati di ricerca dai principali motori sono importate da DMOZ - ODP. ODP, acronimo di Open Directory Project, non è un motore ma una open directory (basata su listing e recensioni fatte da esseri umani[1], anche se esistono alcuni meccanismi automatici per eliminare i siti estinti). È stata creata da Netscape, a sua volta comprata da AOL nel 1998 per quasi 25 miliardi di dollari, ed appartiene tuttora ad AOL (che è la divisione Internet di Time Warner, divisione nella quale Google ha una modesta partecipazione azionaria).

In Italia[modifica | modifica wikitesto]

  • Google è utilizzato anche da LiberoYouTubeArianna e Tiscali (per un rapporto di partnership). In Italia il divario fra l'utilizzo di Google e degli altri è talmente vasto che, pur essendo i dati ovviamente variabili, la percentuale delle ricerche effettuate su Google è pari ad un multiplo della somma di tutti gli altri motori di ricerca messi assieme.
  • Yahoo! è utilizzato anche da AltaVista, che venne acquistata indirettamente da Yahoo! quando quest'ultima acquisì Overture, nonché da Kataweb per un rapporto di partnership.
  • Virgilio.it è legato a Google da un rapporto di partnership da diversi anni e ne importa (cosa immediatamente verificabile da chiunque) i risultati di ricerca con minime modifiche come aggiungere propri risultati sponsorizzati ed accorpare quelli che fanno riferimento allo stesso dominio.
  • Istella Italia è un motore di ricerca sviluppato da Tiscali.

Lista[modifica | modifica wikitesto]

Anno Motore Evento Stato attuale
1993 Svizzera W3Catalog Lancio Inattivo
1993 Svizzera Aliweb Lancio Inattivo
Scozia JumpStation Lancio Inattivo
Stati Uniti WWW Worm Lancio Inattivo
1994 Stati Uniti WebCrawler Lancio Inattivo (Solamente un'interfaccia per Bing)
Stati Uniti Go.com Lancio Inattivo
Stati Uniti Infoseek Lancio Inattivo
Stati Uniti Lycos Lancio Attivo
Italia Spenki Fondazione Inattivo
1995 Stati Uniti AltaVista Lancio Inattivo, reindirizzato a Yahoo!
Corea del Sud Daum Lancio Attivo
Stati Uniti Magellan Lancio Inattivo
Stati Uniti Excite Lancio Inattivo, solo notizie
Portogallo SAPO Lancio Inattivo, solo notizie
Stati Uniti Yahoo! Lancio Attivo
1996 Stati Uniti Dogpile Lancio Attivo, Aggregatore
Stati Uniti Inktomi Fondazione Inattivo, acquisito da Yahoo!
Stati Uniti HotBot Fondazione Attivo
Italia Arianna Fondazione Inattivo, inglobato in Libero
Italia Multisoft Fondazione Inattivo
Italia Virgilio Fondazione Attivo, risultati Google
Stati Uniti Ask Jeeves Fondazione Attivo (rimarchiato in ask.com)
1997 Stati Uniti Northern Light Lancio Inattivo
Russia Yandex Lancio Attivo
1998 Stati Uniti Google Lancio Attivo
EuropaPaesi Bassi Ixquick Lancio Attivo anche come Startpage
Stati Uniti MSN Search Lancio Inattivo, diventato Bing
Corea del Sud empas Lancio Inattivo (fusa con NATE)
1999 Norvegia Alltheweb Lancio Inattivo (URL reindirizzato a Yahoo!)
Canada GenieKnows Lancio Inattivo
Corea del Sud Naver Lancio Attivo
Stati Uniti Teoma Fondazione Inattivo, reindirizza Ask.com
Stati Uniti Vivísimo Fondazione Inattivo, IMB
Italia superEva Lancio Inattivo, solo analisi trend
2000 Cina Baidu Fondazione Attivo
Francia Exalead Lancio Attivo
Stati Uniti Gigablast Lancio Attivo
2001 Francia Kartoo Lancio Inattivo
2003 Inghilterra Info.com Lancio Attivo, risultati Bing
Scroogle Lancio Inattivo
2004 Stati Uniti Yahoo! Search Lancio finale Attivo (Solamente un'interfaccia per Bing)
Stati Uniti A9.com Lancio Inattivo
Cina Sogou Lancio Attivo
2005 Stati Uniti Windows Live Search Lancio finale Inattivo
Stati Uniti GoodSearch Lancio Inattivo (cerca coupon con Google)
Stati Uniti SearchMe Lancio Inattivo
2006 Cina Soso Lancio Attivo
FranciaUnione europea Quaero Fondazione Inattivo
Stati Uniti Search.com Fondazione Attivo
Stati Uniti Ask.com Lancio Attivo
Stati Uniti Windows Live Search Lancio Inattivo
Stati Uniti ChaCha Lancio beta Inattivo
India Guruji.com Lancio beta Inattivo
2007 Stati Uniti Wikiseek Lancio Inattivo
Stati Uniti Sproose Lancio Inattivo
Stati Uniti Wikia Search Lancio Inattivo
Stati Uniti Blackle.com Lancio Inattivo (Solamente tema scuro di Google)
2008 Stati Uniti Cuil Lancio (chiuso) Inattivo
Stati Uniti Powerset Lancio Inattivo
Russia Picollator Lancio Inattivo
Stati Uniti Viewzi Lancio Inattivo
Inghilterra Boogami Lancio Inattivo
Stati Uniti LeapFish Lancio Inattivo
Germania Forestle Lancio Inattivo (reindirizza a Ecosia)
Australia Ecocho Lancio Inattivo
Stati Uniti DuckDuckGo Lancio Attivo
2009 Inghilterra Wolfram Alpha Lancio Attivo
Stati Uniti Bing Lancio Attivo
Stati Uniti Yebol Lancio Inattivo
Stati Uniti Mugurdy Lancio Inattivo
Stati Uniti Scout (Goby) Lancio Inattivo
Stati Uniti Coozila! Lancio Inattivo
Germania Ecosia Lancio Attivo (Bing + Algoritmi proprietari)
Corea del Sud NATE Lancio Attivo
2010 Stati Uniti iAlgae Lancio Inattivo
Stati Uniti Blekko Lancio Inattivo (venduto a IBM)
Stati Uniti Cuil Lancio Inattivo
Russia Yandex (Versione
in Inglese)
Lancio Attivo
2011 Stati Uniti YaCy Lancio Inattivo (online, non ricerca)
2012 Italia Volunia Lancio (chiuso) Inattivo
Italia Ideao Lancio beta Inattivo
2013 Italia Istella Lancio Attivo
EuropaFrancia Qwant Lancio Attivo
Stati Uniti Aoohe Lancio Inattivo
Vietnam Coc Coc Lancio Attivo, motore di ricerca vietnamita
Flag of Kurdistan.svg Egerin Lancio Attivo, motore di ricerca in curdo / Sorani
2014 Searx Lancio Attivo, metamotore di ricerca
Svizzera Swisscows Lancio Attivo
2017 Xaphir Beta Inattivo, acquisito da Qwant[3]
La maggior parte dei motori di ricerca che opera sul web è gestito da compagnie private che utilizzano algoritmi proprietari e database tenuti segreti. Esistono comunque diversi tentativi di dar vita a motori di ricerca fondati sul software libero, alcuni esempi sono:

Prospettive di sviluppo[modifica | modifica wikitesto]

Le più recenti innovazioni nella produzione di algoritmi e di sistemi di Information Retrieval si basano sull'analisi semantica dei termini e sulla conseguente creazione di reti semantiche. La stessa Google ha adottato sistemi per la prevenzione dell'errore e la contestualizzazione dei risultati.
È lecito prevedere che nel giro di alcuni anni i motori di ricerca baseranno le proprie tecnologie sia sull'analisi quantitativa dei contenuti (le parole in sé), sia soprattutto su quella qualitativa (il senso delle parole). I motori di ricerca saranno, ad esempio, in grado di distinguere il senso della parola "pesca" a seconda di quale sia il contesto in cui la parola è contenuta (capire se sia il frutto, la disciplina sportiva, o altro). Per muoversi in questa direzione Google ha acquisito Oingo (un tempo noto come "il motore dei concetti") e la tecnologia dell'azienda che lo creò, la Applied Semantics.

Il web 2.0 e il futuro dei motori di ricerca[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svg Lo stesso argomento in dettaglio: web 2.0.
La nuova frontiera dei motori di ricerca è il web 2.0. Adottando questa logica molti motori e directory internazionali puntano a una maggiore partecipazione degli utenti nella creazione dei contenuti dei motori di ricerca, in modo da eliminare qualsiasi ricorso a spider o a link sponsorizzati. Con questa logica gli utenti possono segnalare essi stessi i link e decidono se dare o meno popolarità ai siti segnalati.
Il web 2.0 punta anche a una facilità di utilizzo più rapida, veloce ed intuitiva grazie all'utilizzo di Metamotori (o motori di ricerca multipli) come:

Note[modifica | modifica wikitesto]

  1. ^ Salta a:a b Alta Vista, p. 6.
  2. ^ http://gs.statcounter.com/search-engine-market-share ; https://www.netmarketshare.com/search-engine-market-share.aspx
  3. ^ (FRQwant reprend Xilopix, créateur du moteur Xaphir - Le Monde Informatique, in LeMondeInformatiqueURL consultato il 15 gennaio 2018.
  4. ^ Vincitore tinooo.com un motore di ricerca - Vincitore tinooo.com un motore di ricerca che in pochi click può essere personalizzato per trovare qualsiasi cosa sul web.

Bibliografia[modifica | modifica wikitesto]

  • Guida alle Tecniche di Ricerca su Internet, Milano, Loeacher, 2000.

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autorità GND (DE4423007-2 · NDL (ENJA00964483
Internet Portale Internet: accedi alle voci di Wikipedia che trattano di internet


source http://tessrijogo.blogspot.com/2019/11/motore-di-ricerca.html

No comments:

Post a Comment