Qu’est ce qu’un spider ?

spider google

Aussi connu sous le nom de robot, le spider est un élément incontournable du web, et sans lui, les moteurs de recherche n’existeraient pas.

Le spider (ce qui signifie araignée en Français) est un « robot » qui va visiter toutes les pages du web, et va ensuite permettre aux moteurs de recherche d’indexer les pages et médias.

Quel est le fonctionnement d’un spider ?

Un spider est avant tout un programme très léger qui permet de visiter un grand nombre de pages très rapidement. Un spider tel que ceux des grands moteurs de recherche comme Google ou Bing peut parcourir plusieurs millions de pages par heure.

Le fonctionnement d’un spider est assez simple car il se contente de visiter une page et de décomposer celle-ci en plusieurs parties : texte « utile » (pour l’internaute, donc tout ce qui n’est pas du code permettant l’affichage de la page), médias, etc.

Une fois ce texte et ces médias détectés, il va envoyer ces informations à la base de données.
C’est ensuite, en fonction de leur algorithme, que les moteurs de recherche vont déterminer si ces éléments doivent être indexés ou non.

Les spiders et le référencement

Les moteurs de recherche attribuent une certaine quantité de temps pour chaque site, que l’on appelle crawl budget.
Ce temps n’est pas fixe, et peut évoluer, dans un sens ou dans l’autre.

Afin de mettre le maximum de chances de son côté et avoir le plus de chances possible de voir un maximum de pages indexées par les moteurs de recherche, il faut penser à optimiser son site pour favoriser une circulation optimale pour les spiders.

Ainsi par exemple, il faudra éviter de créer des « culs de sacs » d’où le spider ne saura pas sortir. Il faut aussi lui indiquer (entre autre via le fichier robots.txt, les pages que l’on ne veut pas qu’il consulte).
En optimisant la visite des moteurs de recherche, vous maximiserez vos chances d’être mieux positionné.

Autre facteur à prendre en compte : les languages utilisés pour faire votre site.
Ainsi par exemple mieux vaudra effectuer des sites entièrement codés en JS car bien que très jolis, ceux-ci sont souvent très mal compris par Google (même si avec l’arrivée de Chromium, utilisés maintenant par ses spiders), il « comprend » mieux les sites.

Le cocon sémantique : entre référencement naturel et stratégie marketing

Le cocon sémantique : entre référencement naturel et stratégie marketing

Le cocon sémantique est une approche du référencement naturel reposant sur un contenu optimisé intégré dans le maillage stratégique des pages d’un site internet.Focus sur cette technique SEO (Search Engine Optimisation) efficace pour gagner en visibilité sur les moteurs de recherche mais aussi faciliter la navigation des internautes et attirer…

SEO et blog : un duo performant

SEO et blog : un duo performant

Le référencement naturel vise à améliorer la visibilité de son site internet dans les pages des moteurs de recherche et notamment de Google. Dans cette stratégie qui se doit d’être globale, un des meilleurs atouts est d’alimenter un blog de qualité. En plus d’accroître votre visibilité, un blog  orienté SEO…

SEO : pourquoi faut-il des textes de qualité sur son site internet ?

SEO : pourquoi faut-il des textes de qualité sur son site internet ?

Pour un référencement naturel réussi, l’aspect technique est bien sûr primordial : Balise Title, code HTML « nettoyé », backlinks de qualité, site responsive, etc. Cependant, les textes qui jalonnent votre site (pages principales, articles de blogs, fiches-produits) doivent eux aussi être optimisés, et ce n’est pas une mince affaire. Le référencement naturel ou…

Les plateformes d’achat de backlinks : la garantie d’un lien indexé ?

Les plateformes d’achat de backlinks : la garantie d’un lien indexé ?

J’ai vu fleurir ces derniers jours de nombreux messages sur Twitter où les gens se plaignaient qu’ils leur semblaient que les backlinks achetés chez telle ou telle plateforme de liens n’étaient pas indexés. Comme à leur habitude, les SEO semblaient se baser sur leur ressenti et non pas sur des…

Comment vérifier en masse si vos URL sont bien indexées dans Google

Comment vérifier en masse si vos URL sont bien indexées dans Google

Savoir si les URL de son site mais également si les backlinks que l’on a créé ou acheté sont bien indexés est une chose importante.Plusieurs solutions s’offrent à vous pour savoir si votre URL est ou non indexée par Google. Vérifier à la main si une URL est indexée Pour…

Qu’est-ce que la balise H1 et pourquoi est-elle importante pour le référencement ?

Qu’est-ce que la balise H1 et pourquoi est-elle importante pour le référencement ?

Une page internet comporte généralement plusieurs rubriques ou paragraphes. La balise H1 est un élément de la page que l’on utilise généralement comme titre de la page ou de l’article.C’est très généralement le premier élément que l’on verra sur la page. La manière de créer une balise H1, quel que…