Motori di Ricerca Internet

I Motori di Ricerca sono dei Siti Internet che forniscono delle pagine web come risultato di una richiesta o domanda (query) fatta dall'utente digitando una o più parole chiavi (keywords) quando si fanno delle ricerche più specifiche. Le pagine che visualizzano tutti i risultati di un Motore di Ricerca sono chiamate SERP (Search Engines Result Pages).

In realtà oggi sono le keyphrases) ossia le frasi chiave di ricerca che svolgono un ruolo importante nei motori di ricerca e sopratutto su Google, che indicizza interi contenuti testuali. Inoltre chi digita una frase, una domanda o keywords con più dettagli è un'utente interessato a trovare risultati più specifici, che cercando semplici keywords non lo hanno soddisfatto.

Google stà sperimentando le risposte migliori alle frasi di ricerca, anche digitate in forma di domanda si ottengono risposte più complete e anche la Ricerca vocale Google oggi non sembra più essere una fantascienza, perchè un modo di ricerca utilizzato sopratutto dagli utenti in mobilità.

Tutti i Motori di Ricerca oggi includono risultati pubblicitari o annunci sponsorizzati per la maggiorpate sotto forma di testo, ma spesso anche icone, immagini o anteprime dei video, che spesso sono estratte da YouTube che è un motore di ricerca video di proprietà Google.


Motori di Ricerca nel Mondo

MOTORI DI RICERCA

Ci sono centinaia di Motori di Ricerca di nel mondo, ma quelli più usati da miliardi di utenti internet variano in base alla zona di interesse e lingua, che si possono notare in questa immagine. Google con oltre il 90% ha la percentale maggiore in Europa, tra cui anche in Italia, Spagna, Germania e Francia. Ma negli USA Yahoo! e Bing hanno il 30% di traffico. Infine, in Russia il motore di ricerca più usato è Yandex, in Cina è Baidù il più frequentato.

Per capire il funzionamento dei Motori di Ricerca bisogna fare subito una distinzione con le web directory presenti su internet. La differenza principale è proprio nel loro funzionamento, nel modo differente in cui raccolgono e archiviano informazioni, immagini, dati, files e presentano una lista ordinata di pagine internet agli utenti.

Nelle Web Directory l'inserimento dei siti web avviene spesso manualmente: si fà richiesta di inserire l'URL di un sito web in una categoria, con titolo, descrizione, indirizzo. La web directory più importante del Mondo, da cui attinge informazioni anche il motore di ricerca Google è www.dmoz.org che organizza milioni di siti web in categorie, paesi e lingue diverse, con un team di volontari che revisonano tutti i siti internet che vengono segnalati.

L'indicizzazione delle pagine web in tutti i motori di ricerca, anche se esiste la possibilità di segnalare il proprio sito in apposite sezioni o categorie, avviene in modo del tutto o quasi automatico, per mezzo di spyder e robots incaricati di scandagliare periodicamente internet e aggiornare i propri database di nuovi contenuti.

Tuttavia i Motori di Ricerca non sono degli archivi di pagine web e neanche Google lo è mai stato! Infatti, quelli mostrati nei risultati sono probabilmente soltanto un 20% di tutte le pagine internet, che vengono continuamente indicizzate, aggiornate o eliminate.

Invece, un vero archivio Internet è sicuramente Internet Archive che archivia un'infinità di informazioni (siti web, audio, immagini, video) come una biblioteca fin dalla nascita del World Wide Web partendo dal 1996 quando Google ancora non esiteva. Tramite la Wayback Machine è possibile andare indietro nel tempo anche di 20 anni.


Inserire un sito su Google, Bing e Yahoo!

Google-Bing-Yahoo!

Il processo di inseriemnto per Google avviene tramite pagina www.google.it/intl/it/add_url.html dove segnalare il proprio URL (uniform resurce locator) ossia il dominio del proprio sito internet! Google stesso dichiara di non aggiungere all'indice tutti quelli segnalati senza una garanzia di indicizzazione.

Inoltre è possibile aggiungere commenti o keywords che descrivono i contenuti, ma che saranno forse usati a titolo informativo per uso interno e non avranno alcun effetto su come la pagina viene indicizzata o utilizzata dal motore di ricerca.

In questo caso l'URL del nostro sito include http:// seguito dal prefisso www e dal nome a dominio.

Non è necessario aggiungere tutte le pagine di un sito web, perchè questo è il compito dello spyder del motore di ricerca (Googlebot) seguire tutti i collegamenti e indicizzare tutte le pagine web trovate, quindi è di fondamentale importanza che tutte le pagine online da indicizzare siano raggiungibili da almeno un Link!


Segnalare un sito internet al motore di ricerca Bing (Microsoft) è altrettanto semplice: senza alcun bisogno di registrarsi, basta entrare in questa pagina e seguire le istruzioni www.bing.com/toolbox/submit-site-url

La procedura è diversa per il motore di ricerca Yahoo! che è più una web directory, quindi occorre registrarsi gratuitamente al sito http://siteexplorer.search.yahoo.com, ma da quando Yahoo! ha stretto accordi con Microsoft e il motore di ricerca Bing purtroppo non offre più questo servizio!

Dopo aver segnalato il proprio URL nel Motore di Ricerca, si può aspettare ore, giorni o settimane, prima che il crawler o indexer indicizzi tutte le pagine, specialmente se il vostro sito internet è online da poco tempo e contiene testi e immagini che non sono del tutto originali, cioè non aggiungono qualcosa di nuovo ai risultati già presenti.

  • Quando un sito web è stato segnalato ai Motori di Ricerca, riceve periodicamenete visite dagli spyder o robots, che ne leggono i contenuti di ogni singola pagina online, seguendo tutti i links presenti che portano alle altre pagine del sito.

  • Per agevole il compito di indicizzazione, si può inserire una Sitemap XML del sito web, con dei valori di scansionamento e tramite un file di testo, denominato Robots.TXT, indicare ai motori di ricerca quali pagine non visitare o tralasciare in fase di scansione... questo è molto importante, considerando che le visite di uno spyder durano pochi secondi!

  • Subito dopo, le pagine scansionate vengono trasferite nel database del motore di ricerca stesso, che contiene una copia di ogni singola pagina scansionata (chiamata copia cache). Se poi la pagina web viene modificata, di solito, al prossimo passaggio la stessa viene aggiornata con le nuove informazioni rilevate.

  • Infine, il compito dei Search Engines Software, cioè tutti i programmi Software dei Motori di Ricerca, producono dei risultati creando le SERP, cioè tutte le pagine dei risultati ordinate in base alle query digitate da ogni singolo utente!

Scansione di Google e aggiornamenti

In seguito a questa operazione di Indicizzazione Google avviene una scansione di ogni URL con aggiornamenti e controlli automatici da parte di Googlebot che possono diventare giornalieri.

Google esegue di solito 2 tipi di scansione e aggiornamento: una profonda (deep-crawling) e una molto superficiale (soft-crawling) quest'ultima è la più frequente...aggiorna solo il titolo o descrizione di una pagina web online (se sono stati modificati) ma senza rilevare i nuovi testi, immagini o links aggiunti o eliminati.

Tutti i contenuti devono nascere ottimizzati per i Motori di Ricerca anzichè farlo in un momento successivo alla messa online, allo scopo di velocizzare la fase di posizionamento nei risultati organici o naturali, che sono anche gratuiti.

L'aggiornamento completo degli indici avviene una volta al mese, oltre a quello giornaliero che aggiorna di continuo risultati, in particolare il canale delle Notizie. Tutta questa attività di aggiornamento si ricorda come google-dance che in passato durava anche per una settimana.

Inizialmente si credeva che fosse solo il Pagerank l'unico parametro utilizzato da Google, ma tutto questo non è assolutamente vero. In ogni caso l'Indicizzazione è la prima fase che esegue qualsiasi motore di ricerca con un proprio database.


Indicizzazione nei Motori di Ricerca

Tutto questo dopo la prima fase di Indicizzazione diventa anche un ciclo giornaliero di scansione. In alternativa Google rileva un errore tipo 404 (pagina non trovata) eliminandola dal suo indice.

Google Motori di Ricerca

L'infografica mostra la Pipeline di Google (catena di montaggio dati) che riguarda le principali fasi svolte da Google durante il processo di Indicizzazione, dove si aggiunge il grafo dei links e altre informazioni, per creare le pagine dei risultati (SERP) partendo dal una loro copia (copia cache).

Tutti i risultati di Google possono risultare diversi in base all'utente, posizione geografica, lingua e sistema operativo. Ma anche funzione del browser (user-agent) o in base all'ISP (internet service provider) per mostrare risultati geolocalizzati.

La localizzaione interessa meglio la Local Search sopratutto da mobile e il canale delle mappe dedicato alle schede Google plus business, che spesso si trovano inserite nella ricerca principale.

Internet è molto dinamico e anche i motori di ricerca come Google lo sono e si aggiornano mensilmente. Infatti per questo motivo diventa indispensabile un servizio professionale di monitoraggio di tutte le keywords, suddivise per canali di traffico con dei report personalizzati.