Les moteurs de recherche, technologie et liste

Ils ne sont plus seulement un moyen de trouver un site traitant d'un sujet, ils veulent aller au-delà, répondre aux questions par exemple et sont devenus pour les webmasters l'élément essentiel de l'environnement.

Technologie des moteurs de recherche

Pendant longtemps, la technique a consisté à associer un ensemble de mots-clés à une page, et afficher dans les résultats les pages correspondants aux mots-clés de la requête de l'utilisateur.

Pour améliorer la pertinence, Google a inventé le PageRank: les pages sont classées en fonction du nombre et la qualité des liens pointant sur elles, pour un groupe de mots-clés.

A coté du PageRank, on voit le BrowseRank qui classe les pages selon l'activité des utilisateur, le TrustRank qui concerne l'indice de confiance sur la source. Le FreshRank vise lui a évalué la nouveauté des contenu et leur pertinance dans l'actualité.

Les référenceurs s'évertuent à comprendre le fonctionnement de l'algorithme, mais il est vain d'essayer de lui attribuer une logique. Tout au moins selon l'optique du webmaster, car le moteur à sa propre logique. Un site web est du point de vue du moteur comme une étoile perdue dans une infinité de galaxies lointaines. Rien qu'un petit point lumineux. Le webmaster ne comprend pas toujours comment le moteur positionne son site, mais pour ce dernier il s'agit de diriger les internautes dans cet amas d'étoile et de façon optimale. On sous-estime souvent la contraite de moyens que qu'implique le mot optimal.

Base de connaissance d'objets

Knowledge Graph

Bing essaie de passer du texte à l'objet, tout comme Google. En 2012, 300 millions d'objets disposent d'une fiche descriptive dans la base de donnée de Microsoft. Lorsque l'on fait une requête, le moteur tente d'identifier l'objet concerné et retourne les résultats en rapport avec cet objet. Toutes les informations récoltées sur la Web, dans les pages, sur les sites sociaux, sont associées à un objet. Cela permet de fournir l'information sur celui-ci quand il est identifié dans la requête.

Google dispose d'un outil similaire qui commence à prendre forme dans les SERPs en 2012, et qu'il appelle Graphe de Connaissance. Cela consiste à afficher dans la page des résultats à coté de la liste de liens, des informations concernant l'objet de la recherche: des gens, des lieux, des oeuvres etc... Cela en texte et image.

Les données proviennent de Freebase, Wikipedia, CIA World Factbook, et autre sources. Elle contiennent en 2012 500 millions d'objets et 3.5 milliards de faits à propos de ces objets. Pour donner un exemple, si l'objet recherché est identifié comme étant Marie Curie, la page affiche sa photo, une biographie, des photos de personnes en rapport avec elle. S'il s'agit d'un peintre, on aura des images de ses toiles les plus connues.

Vidéo du Knowledge Graph.
Ce type de résultat fait l'objet d'une expérimentation par Google sur www.wydl.com depuis 2011 et on s'attendait à ce qu'il passe au moteur de recherche principal, ce qui à maintenant commencé en 2012.

Liste des moteurs de recherche

Vous pouvez inscrire gratuitement et simplement votre site sur les moteurs de recherche suivants (sauf moteurs spéciaux), les plus importants sont dans la liste. Noter que l’inscription sur l’annuaire Dmoz.org, vous inscrit d’emblée dans de nombreux moteurs… Cependant il peut être utile pour gagner du temps de référencer sur les moteurs (et non sur les annuaires) la description d’un site en construction…

Le chiffre entre parenthèses correspond au PageRank.

Searchmash.com, moteur expérimental de Google est fermé.

Moteurs de recherche de code source

Après la fermeture de la recherche Google dans le code, il reste néanmoins des alternatives...

Ressources