Table des matières :
Google a lancé sa V3 de Pengouin le 06 octobre 2012 : c’est un de ses algos qui lutte contre le spamindexing, principalement le Netlinking artificiel et sur-optimisé (certains évoquent que la sur-optimisation interne des balises <title> / <hx> / ancres du maillage interne / keyword stuffing peuvent amener à cette pénalité aussi).
C’est le filtre anti-referenceur par excellence qui sème la terreur chez pas mal de professionnels qui ne savent pas trop comment modifier leur habitude.
Les caractéristiques de Pingouin :
- Pénalise les sites web page par page –et non pas l’ensemble du site–
- L’ensemble des expressions de recherche liées à une page pénalisée sont déclassées
- Si vous tombez dedans, il faudra attendre le prochain refresh du manchot pour –esperer- en sortir
J’ai un de mes sites qui a été touché début octobre, comme beaucoup de consultants SEO / webmasters.
Je vous propose de partager le cheminement qui m’a permis de comprendre quelles parties étaient pénalisées et trouver des solutions pour sortir de Pengouin :
- Etat des lieux complet du trafic perdu
- Lister les pages pénalisée
- Lister les requêtes de recherches déclassées
- Actions à mettre en place
Ma check list d’urgence quand j’ai un problème sur un de mes sites :
- Vérification des messages d’erreurs affichés dans Google Webmaster Tools
- Est ce que j’y ai fais des modifications récemment dans GWT? (surtout ce qui concerne la rubrique Configuration et éventuellement les demandes de suppression de liens entrant)
- Robots.txt : vérifier si les crawlers sont bien autorisés
- Tester si votre site est toujours présent dans l’index de google avec les commandes site:monsite.com , monsite.com , monsite.com/& (pour avoir une idée de l’ampleur des dégâts)
- Rechercher les 404, les mauvaises redirection et les <title> dupliquées avec Xenu
- Est ce que mes URLs canoniques sont correctes?
- Est ce qu’il y a eu une mise en production récente sur le site?
- Est ce que j’ai des erreurs javascript bloquantes sous Firefox / Chrome / Internet Explorer? (J’ai déjà eu des régies publicitaires qui arrivaient à me casser l’affichage de la page)
- Mon site est il blacklisté (malware, iframes malveillantes, etc…)?
- Vérification des logs apache et des logs d’erreurs (serveur)
- Contacter l’hébergeur pour savoir si il y a eu un problème chez eux
Est ce qu’il y a eu une mise à jour chez Google?
Deuxième étape, si aucune piste sérieuse ne se profile à l’horizon avec cette liste, vérifier si la chute de trafic correspond à une MAJ d’un algorithme ou d’un filtre chez Google (regarder sur Webrankinfo ou Abondance)
Dates des mises à jours de Pengouin en France
- 10/2013 : Pingouin 5 (aussi appelé pengouin 2.1 – en cours)
- 05/2013 : Pingouin 4 (aussi appelé pengouin 2.0)
- 05/10/2012 : Pingouin 3
- 26/05/2012 : Pingouin 2
- 24/04/2012 : Pingouin 1
Dates des mises à jours de Panda en France
- 07/2013 : Panda 27 (milieu de mois)
- 05/2013 : Panda 26 (début de mois)
- 03/2013 : Panda 25 (milieu de mois)
- 22/01/2013 : Panda 24 (en cours)
- 21/12/2012 : Panda 23
- 21/11/2012 : Panda 22
- 05/11/2012 : Panda 20
- 27/09/2012 : Panda 20
- 18/09/2012 : Panda 3.9.2
- 19/08/2012 : Panda 3.9.1
- 25/07/2012 : Panda 3.9
- 25/06/2012 : Panda 3.8
- 08/06/2012 : Panda 3.7
- 27/04/2012 : Panda 3.6
- 19/04/2012 : Panda 3.5
- 23/03/2012 : Panda 3.4
- 27/02/2012 : Panda 3.3
- 18/01/2012 : Panda 3.2
- 18/11/2011 : Panda 3.1
- 19/10/2011 : Panda 2.5.3
- 13/10/2011 : Panda 2.5.2
- 09/10/2011 : Panda 2.5.1
- 28/09/2011 : Panda 2.5
- 12/08/2011 : Panda 2.4
Sortie de l’algorithme sur les noms de domaines bourrés de mots clefs (Exact Match Domain)
- 28/09/2012
Google Pony
- 17/11/2012 : Pony 1 (?)
Si votre baisse de trafic correspond à la date d’une de ces updates (je n’ai mis que celles qui impactaient les sites français), vous avez probablement trouvé la cause.
Dans mon cas avec freemobileavis.com c’est Pingouin 3 qui m’a pénalisé à partir du 06 octobre 2012 :
Les pages et les mots clefs pénalisées par Pengouin avec Google Analytics
Quelle est la baisse de trafic?
Pour avoir une vision objective, j’ai attendu à peu près 2 semaines avant de faire cette analyse.
J’ai comparé les 15 jours précédents Pingouin 3 (22/09 au 05/10) et les 15 jours suivants (06/10 au 19/10).
Pour comparer 2 périodes dans Google Analytics, vous sélectionnez votre date de début et votre date de fin, ensuite vous cochez la case ‘Comparer à’ et vous choisissez la 2ème période.
Dans la rubrique AUDIENCE > Vue d’ensemble, je peux constater :
- Fréquentation : -28% de visites
- Pages vues : -28%
Lister les pages touchées par Pengouin
Comme le filtre Pengouin ne touche que certaines pages , il faut désormais cibler les URLs qui ont été pénalisées.
Dans la rubrique CONTENU > Contenu du site > Toutes les pages
La ligne Modification (en %) avec des valeurs en rouge correspond à une baisse du nombre d’affichage d’une page.
Dans mon cas, j’arrive à cette liste principale (en filtrant les plus fréquentées) :
- -33% sur la HP
- –64% sur /avis/493-Souscrire-au-forfait-free-mobile
- -46% sur /avis/
- -81% sur /coup-de-gueule/711-Free-voleurs
- -77% /coup-de-gueule/1146-baisse-de-debit-de-la-3g
- -39% /prod/telephones_mobiles_smartphones/Samsung…
Etat des lieux de la perte de trafic naturel
Les visiteurs arrivent sur votre site via le trafic organique (moteurs de recherche), en tapant directement l’URL dans le navigateur (accès directs), par des sites référents ou des liens commerciaux.
Comme Pengouin est un filtre de google, on va analyser la perte de visiteurs venant des moteurs.
Rubrique SOURCES DE TRAFIC > Recherche >Vue d’ensemble
Expressions retrogradées par Pingouin
Pengouin rétrograde les requêtes de recherches qui sont liées aux pages qu’il considère comme sur-optimisées.
Toujours dans le menu de gauche, vous avez la rubrique Résultats naturels.
Cette rubrique affiche les expressions de recherche tapées par les internautes pour arriver sur votre site.
Dans mon cas, j’arrive à cette liste principale :
- –25% sur la requête ‘free mobile avis’
- –60% sur la requête ‘avis free mobile’
- –17% sur la requête ‘avis sur free mobile’
- –83% sur la requête ‘mobile.free.fr’
- –55% sur la requête ‘free mobile avis client’
Note : je ne suis pas positionné sur des expressions liées à l’actualité
Complément d’analyse avec GOOGLE WEBMASTER TOOLS
Dans google webmaster tools (GWT), qui est un autre outil gratuit proposé par Google, j’ai utilisé les données présentes dans la rubrique TRAFIC > Requêtes de recherche afin d’avoir les variations des requêtes, des impressions et des clics.
Dans GWT, il faut sélectionner une période et cliqer sur le bouton gris ‘Avec Modifications’ pour qu’il la comparer avec la précédente.
- Impression : -45%
- Clics : -33%
L’onglet Pages les plus populaires confirme que les pages qui ont le plus perdues sont les mêmes que dans google analytics, avec un peu plus de détails.
- HP : -33% d’impressions, -43% de clics
- /avis/493-Souscrire… : -83% d’impressions, -69% de clics
- /avis/ -80% d’impressions, -82% de clics
- /coup-de-gueule/711-Free-voleurs : -95% d’impressions, -94% de clics
- /coup-de-gueule/1146-baisse-de-debit… : -80% d’impressions, -86% de clics
Grâce à la rubrique TRAFIC > liens vers votre site, vous avez une liste de liens qui pointent vers vos pages, d’ancres et de pages les plus référencées .
- HP : + de 10 000 liens sur – de 150 domaines
- /avis/493-Souscrire-… : – de 60 liens sur – de 30 domaines
- /avis/ : + de 1000 liens sur sur – de 50 domaines
- /coup-de-gueule/711-Free… : – de 30 de liens sur – de 15 domaines
- /coup-de-gueule/1146-…- : – de 10 de liens sur – de 10 domaines
- /prod/telephones… : + de 5 000 liens sur – de 50 domaines
Indicateurs supplémentaires : le cache google et les visites du crawler
Pages en Cache
Souvent lorsque l’on tombe dans une pénalité ou dans un filtre, le crawler Google a tendance à moins venir sur le site (ce qui ne nous arrange pas pour remonter quand les corrections sont faites) et à moins rafraîchir les version en cache de nos pages web.
Sur les pages suivantes, la version en cache avant Pengouin ne dépassait que très rarement 3 jours. Désormais, ça varie entre 8 et 10 jours :
- /avis/493-Souscrire-au-forfait-free-mobile : + de 10 jours
- /question/243-parametrage-mms-samsung-chez-free-mobile : + de 10 jours
- /coup-de-gueule/711-Free-voleurs : + de 8 jours
Crawler de google
Vous pouvez avoir un aperçu de son passage dans GWT mais c’est très imprécis.
Il y a divers logiciels qui vous permettent de suivre le comportement du Bot
Les causes de la pénalité Pengouin et les solutions
Synthèse
- ~30% de baisse de trafic
- -28 % de pages vues
- -45% d’impressions
- 5 pages principales pénalisées qui perdent ~50% de vues
- 5 Top requêtes de recherches qui perdent 48% de trafic
Les mauvais backlinks
Un des grands axes de Pingouin est le ciblage des mauvais liens qui pointent vers nos sites.
Quelques profils de liens qui peuvent vous nuire :
- Repartition quantitative : trop de backlinks viennent de seulement quelques domaines.
- Les liens viennent de sites hors thématique et/ou ne sont pas contextualisés
- Repartition qualitative : trop de liens en blog roll ou en footer
- Ancres trop optimisées sur de l’exact match
- Ancres pas assez variées
- Réseaux de sites
Conseils si vous estimez que ce sont les backlinks qui vous ont pénalisé :
- Supprimer les liens hors thématiques, surtout si ils ont des ancres optimisées ou sur des pages spammys. Vous pouvez éventuellement les conserver si ils sont en très faible quantité avec une ancre marque ou URL.
- Supprimer les ancres trop optimisées si elles représentent la majorité ou un pourcentage important de vos ancres. Google recherche le naturel, c’est plus que rare ce genre de liens hypertexte. Si on analyse des gros sites comme la Fnac, wikipedia, rue du commerce, on se rend compte que dans les 10 ancres les plus importantes il n’y a aucune ancre optimisée!
- Dilluer les ancres
Les backlinks de freemobileavis.com
Je ne souhaite pas rentrer dans les détails du maillage externe de ce site mais pour que vous ayez une idée, il possèdait plusieurs dizaines de milliers de backlinks quand il a été touché
Ceux qui me paraissent être pénalisants :
- 12% d’entre eux viennent presque tous d’1 site hors thématique (automobile) et pour la plupart en nofollow.
500 pointent vers la HP - 5% d’entre eux viennent presque tous d’1 site hors thématique (immobilier) et pour la plupart en nofollow
1333 pointent vers la HP - 5,5% de liens qui linkent /prod/telephones_mobiles_smartphones/Samsung/s3-s_3-SIII-s_III/200/1000 avec des ancres sur-optimisées de type samsung s3 pas cher.
- Fiches annuaires ayant peu de contenu et des ancres optimisées
J’ai 17% de mes liens qui sont hors thématique, 5.5% d’ancres sur-optimisées sur une page qui n’est pas concernée par la baisse d’octobre et trop d’ancres optimisées en exact match sur des fiches annuaires assez pauvres.
Rien d’extraordinaire ou de flagrant, juste l’accumulation d’erreurs qui s’accumulent et rendent le profile pas vraiment naturel, ni qualitatif.
La plupart des liens proviennent d’annuaires, blogs et forums : pas de site de référence ou trusté (pas de partenariat, pas de guest blog …).
A vue d’oeil, des ancres moins optimisées sur les annuaires et un % de liens hors thematiques raisonnable et je passais sous le radar.
Dans le doute, j’ai fais une demande concernant 2 sites hors thématique dans l’outil GWT pour désavouer les backlinks en novembre : 1 an après, je ne sais pas si ça a changé quelquechose ^^
La sur-optimisation des critères onpage : critères secondaires
Les principaux
- Balise <title> bourrées uniquement de mots clefs
- Idem pour les balises <h1>, <h2> et <h3>, surtout si elles sont quasiement identiques à la balise <title>
- Keyword stuffing
- Ancre internes sur optimisées
Balises <title> de freemobileavis.com
J’ai lancé un scan du site avec Xenu et à ce niveau là aucune sur-optimisation générale constatée, comme elles ont toutes été faites à la main : unicité, taille correcte, pas de succession de mots clefs mais des balises un minimum rédigées et leur contenu en rapport avec la page.
Balises <h1>, <h2>, <h3>,…
Elles sont générées automatiquement et c’est là que le bas blesse : en effet j’ai constaté que les pages les plus touchées ont le point commun de comporter plus de 25 réponses chacunes.
L’architecture générée automatiquement est la suivante :
- <title> : manuelle
- <h1> : le titre laissé par l’internaute
- <h2> : pour chaque réponse, elle est générée de la sorte : Réponse de [nom] le [date] a [type d’avis] : [<h1>]
Concrètement, la page /news/2817-FREE-activer-le-reseau-4G-LTE avait cette trame :
- 1x <title> : <title>Activation de la 4G chez FREE MOBILE</title>
- 1x <h1> : <h1>FREE : activer le reseau 4G LTE</h1>
- Xx <h2> : Réponse de [nom] > activer le reseau 4G LTE
Je me retrouvais dans une configuration où j’ai une quantité importante de balises <h2> qui reprennent en partie la balise <h1> et dont le contenu, après certaines, ne dépassaient pas quelques mots (= J’ai une <h2> qui est parfois plus grande que le contenu qui la suit).
Une règle de base lorsque l’on utilise des titres et inter titres c’est qu’il doit y avoir du contenu après…
Keyword stuffing / ancres internes / cloacking
Nada.
Conclusion
Il s’est passé plusieurs mises à jours de Pengouin et les résultats ne sont pas revenus à ceux d’avant. Le problème avec cette analyse c’est que l’environnement a énormément changé (j’ai lancé le site au lancement de free mobile) et la concurrence est plus nombreuse et forte. J’ai repris pas mal de positions mais pas retrouvé le TOP 1, 2 ou 3?
Si vous avez des réflexions ou des points que j’ai oublié, n’hésitez pas à laisser un commentaire en dofollow 🙂
Entrepreneur et Geek depuis plus de 20 ans.
Mon pauvre, tu t’es fait déchiré, tu t’en es pris plein dans les gencives. Google t’a pas raté
Pour ceux qui suivent de près les cas pratiques de sanctions liées au Pingouin il y a aussi http://www.convertic.fr/blog/google-pingouin-3-cas-pratique/
C’est pas faux 🙂
Conclusion : faites des sites mal optimisé et vous serez bien référencé 🙂
C’est pas faux 🙂
tu ne fais pas d’analyse sur le duplicate content sur les pages ?…
ca peut être aussi la cause si les critères se sont renforcés ! c’est ce que je soupçonne sur un de mes blogs.
Logiquement le duplicate c’est Panda. Je vais re-vérifier quand même mais je ne pense pas que ce soit ça ou bien c’est pas de chance qu’1 sujet + les réponses soient toutes en duplicate.
je te redis ça
Analyse très détaillée. Quand on voit les mise à jours à répétition de Google, on comprend mieux l’importance de diversifier ses sources de trafic. Je suis personnellement spécialisé dans le e-commerce et c’est vrai que c’est un domaine où il est plus évident de diversifier ses sources (comparateur de prix, ebay, adwords,affiliation).
Après pour d’autres types de site, c’est parfois un peu plus compliqué.
Content= king, J’aime Google Panda et pingouin.
Intéressé par le fait de savoir ce que ça va donner, en tous cas beau travail de recherche.
De mon côté, je suis parti du principe qu’un site “penguiné” allait couter trop de travail pour revenir et sans aucune garanti, et qu’il était plus rentable de “repartir à zéro”, mais ce n’est malheureusement pas toujours aussi simple que ça !
J’espère que ça va marché … en tous cas je peux dire que ça fait pas plaisir de se réveiller un matin et de voir qu’on est déclassé!(j’en ai fait l’expérience plusieurs fois)
Le plus dur c’est effectivement de savoir pourquoi et comment réparer!
Jeremy
Une nouvelle version est sortie apparemment. Tu as vu des améliorations ?
Sinon pour moi c’est à n’y rien comprendre.
Je remarque également une lenteur énorme d’indexation des nouvelles pages et parfois l’inverse, c’est très rapide. Et souvent elle se déclasse très vite. Ca devient neuneu.
Bonjour, article riche et très bien écrit. après 1 année est-ce que le site est sortie de la sanction pingouin ?
Merci,
Il est partiellement remonté mais pas à son niveau avant la pénalité (d’un autre côté l’environnement concurrentiel a changé). Depuis j’ai passé le site sur un autre nom de domaine.
Malgré tout ce que l’on peut en dire, pingouin, panda et autres … ils ont au moins le gros avantage, pour nous blogueurs ou webmaster, de réduire un peu les arrivées de commentaires ‘ étranges ‘ … juste à la recherche d’un lien !!! Pour moi, ça c’est une très bonne chose … 🙂
Quant à tous ceux qui ont vraiment abusé, il faudrait aussi qu’ils arrêtent de se plaindre car ils l’ont bien cherché, non ?
Pour tout le reste, ce n’est que débat, rumeurs et le début d’une très longue histoire …
@bientôt
Pas de mise à jour de Pingouin depuis plus de 6 mois, doit-on s’attendre à une grosse MAJ sous peu selon vous ?
Bonsoir, un “grosse mise à jour” je ne sais pas mais une mise à jour devrait arriver dans les mois qui viennent logiquement
Ne pas oublier que l’ancienneté du site et le rythme des mises à jours (et bien sur, la qualité des updates) est un facteur important. Avoir une arborescence de balises H bien propre va forcément aider mais pas à coup sûr. Et parfois, comme dit plus haut, un vieux site mal optimisé (en fait, pas optimisé) peut très bien se faufiler dans les SERPs de manière incompréhensible. Merci pour cette article très clair. Personnellement, j’en suis arrivé à la conclusion que pour un site récent, une seule balise H1 et H2 sur tout le site, et des H3 sur les toutes les autres pages était un choix pertinent. Les balises Metatitle doivent toujours être en corrélation avec la principale H de la page mais sans sur optimisation. La qualité du rédactionnel de la page, même si il est très court, n’est pas une priorité absolu mais cela dépend énormement de la visibilité du site. En bref, j’ai pu constaté que tant que l’on ne sur optimisé pas, tout allez bien. Et enfin, ne pas surréagir, il est primordial de bien s’assurer de quel type de pénalité il s’agit, prendre son temps c’est important. Merci pour cet article “de qualité”.
L’article date un peu, mais quand on vois les sites de “Voyance” ou “Pocker” ou les mecs bourrent a mort d’ancres sur-optimisés et qui sont la depuis des années, je me demande ou sont les filtres de GG…
@Rod, c’est clair.
D’un autre côté ce qu’on “voit” sur nos outils et ce que voit Google c’est souvent différent (ça cloacke à mort sur ces thématiques)