Découvrez dans cette vidéo de 18 minutes comment utiliser le logiciel Screaming Frog. Il s'agit d'une demo pour analyser en profondeur un site web et identifier des points d'amélioration SEO.
Cet outil est un indispensable pour les passionnés du référencement qui souhaitent auditer et optimiser des sites de façon efficace.
Nous allons passer en revue les principaux onglets de Screaming Frog et voir concrètement comment les exploiter :
Pour info, l'onglet Overview donne une vue d'ensemble des problèmes détectés lors du crawl comme les erreurs 404, redirections, temps de chargement, etc. Il permet d'avoir rapidement une idée de l'état de santé du site. Il se situe à droite juste après analyse.
.
Ensuite, l'onglet Internal liste toutes les URL internes crawlées. Il est essentiel pour analyser les liens brisés (entre autres).
.
Les onglets Response Codes sont très utiles pour identifier les codes de statut HTTP problématiques et les redirections en chaîne qui peuvent nuire au référencement et à l'expérience utilisateur
.
Un focus sera fait sur l'onglet Page Titles and Meta Description qui permet de repérer et d'optimiser ces balises méta essentielles pour le SEO. Vous saurez comment rédiger des titres et descriptions attractifs en fonction des recommandations de longueur
.
L'onglet Images détaille toutes les images du site. Vous verrez comment détecter celles qui n'ont pas d'attribut alt ou des attributs non optimisés pour le référencement
D'autres fonctionnalités avancées seront abordées comme :
La configuration du crawler pour gérer les sites sous authentification, les paramètres d'URL, les certificats SSL, etc
En bonus, je partagerai des astuces et réglages personnels pour aller encore plus loin dans l'utilisation de Screaming Frog. Ici : https://www.youtube.com/watch?v=Zdmuwnj-HaU
Show More Show Less View Video Transcript
0:00
bonjour à tous et à toutes Aujourd'hui
0:02
c'est Sébastien pierrepac qui vous fait
0:04
une deuxième vidéo concernant le
0:06
logiciel screaming frog puisque
0:09
aujourd'hui on va s'attaquer à l'analyse
0:11
d'un site web à une plutôt à une démo
0:15
aujourd'hui on va plutôt s'attaquer à
0:17
une démo pour vous présenter brièvement
0:20
les capacités du logiciel screaming frog
0:24
la dernière fois que j'ai fait une vidéo
0:27
je vous ai présenté une démo de
0:28
configuration du logiciel maintenant que
0:31
le logiciel est configuré je lance un
0:33
cro et on va explorer les différents
0:36
onglets d'analyse j'ai pris un site de
0:38
test qui ne m'appartient pas et je
0:42
premièrement je vais sur l'onglet
0:43
interne alors qu'est-ce que signifie
0:45
interne et ben tout bêtement il s'agit
0:47
des liens internes du site je classe par
0:51
code HTTP en général il est préférable
0:55
d'avoir un maximum de code de de code de
0:58
sens ça veut dire que l'URL est ok est
1:01
accessible directement voit que sur ce
1:04
site de test il y a 5 erreurs en 404
1:07
alors pour pouvoir détecter facilement
1:10
où sont placés ces 404 vous avez un
1:13
onglet tout en bas à gauche qui
1:15
s'appelle lien entrant voilà vous vous
1:18
apercevez que il y a un bug au niveau
1:21
euh du plan de site du signemap
1:25
c'est-à-dire lié aux pages alors quand
1:27
les pages ont été supprimées le plugin
1:30
SEO du site n'a clairement pas supprimé
1:34
les pages en 404 du S map alors c'est
1:37
peut-être dû au fait que le plugin SEO
1:39
n'a pas été configuré aspect que l'on
1:42
pourrait voir c'est les 301 il est
1:44
préférable d' lieu d'avoir des 301 comme
1:47
je l' dit tout à l'heure des URL en code
1:50
200 mais en général si vous avez pas si
1:53
ça ne représente pas la majorité du site
1:56
c'est c'est pas un détail vraiment
2:00
pénalisant par contre il faut que les
2:02
redirections soient correctes alors pour
2:04
les liens externes là c'est une autre
2:06
paire de manche c'est moins grave
2:08
d'avoir des liens externes Invalides que
2:10
des liens internes mais il est
2:12
préférable de les corriger comme tout à
2:14
l'heure ben je m'aperçois qu'il y a des
2:18
faux amis Twitter euh enfin des faux
2:21
amis c'est des 404 pour les bot mais
2:25
pour
2:26
l'utilisateur ça la affiche du contenu
2:28
personnalisé en fait c'est lié aux
2:30
icônes de partage de Twitter c'est le
2:32
réseau de Twitter ou x si vous préférez
2:35
renvoie code 404 pour les icônes de
2:38
partage bon d'autres réseaux sociaux ont
2:41
préféré une meilleure méthode bon c'est
2:44
leur choix après il y a les erreurs 403
2:46
alors deux solutions qu'est-ce qui se
2:49
passe ça ve signifie que le craoller il
2:52
a été rejeté que l'URL est effectivement
2:56
inaccessible un accès interdit effectif
2:59
alors on peut peut par exemple prendre
3:00
le lien et vérifier un par un là par
3:03
exemple ça prendrait pas beaucoup de
3:05
temps puce que là il y en a trois ou
3:06
quatre et d'aller dans un navigateur
3:09
ouais c'est une sécurité li à cloud
3:10
flare donc le site r
3:13
algere.dz fonctionne bien mais il y a
3:16
des protocoles de sécurité qui empêchent
3:18
grifog par défaut de le coller
3:21
correctement voilà pour trouver ces 404
3:23
ou ces éventuels 403 à corriger le cœur
3:26
vous en dit vous allez toujours dans le
3:29
lien entrant et vous trouvez page en
3:31
question qui contient ce lien bon là
3:33
pour Twitter c'est plutôt un faux ami
3:37
c'est vraiment quelques cas
3:38
exceptionnels voilà donc au niveau
3:41
externe il y a pas vraiment de lien
3:43
invalid par contre là quand on va dans
3:46
l'onglet sécurité c'est là que pour ce
3:48
site il y a des soucis terme de contenu
3:52
mixte on vérifie au cas où ah non
3:55
effectivement non c'est c'est très ils
3:58
sont très peu nombreux mais ils sont
4:00
présents alors c'est assez tordu il y en
4:02
aurait qu'un HTTP vers la page d'accueil
4:06
mais le souci c'est qui se répercute sur
4:10
la sur la plupart des pages du site et
4:13
ça c'est un frein qui fait brancher
4:16
Google Google n'aime pas trouver des
4:18
liens internes en http sur un site en
4:22
https si vous voulez il y a l'onglet
4:25
code de réponse qui permet d'avoir une
4:27
vision globale de tous les codes CTP des
4:30
pages pour voir si on en a pas loupé un
4:32
tiens si par exemple expiration du délai
4:35
de connexion on n pas réussi à se
4:37
connecté à airfrance.fr peut-être un
4:40
protocole de sécurité où le site est
4:42
momentanément indisponible je ne pense
4:45
pas que ça soit la deuxième possibilité
4:46
c'est plus un lié à un protocole de
4:49
sécurité réinitialiser on attend
4:51
quelques temps bon bah si au bout de
4:53
quelque temps bon apparemment j'ai
4:55
cliqué sur l'URL clic droit et j'ai fait
4:58
réaniser j'ai fait analyser l'URL et ça
5:01
revient soit le site est indisponible
5:04
vérifier avec un navigateur c'est plutôt
5:07
un prot li un protocole de sécurité on
5:10
va attaquer un un onglet qui peut-être
5:13
dans certains cas très important il faut
5:15
analyser ça peut être très important si
5:17
on veut bien anticiper la refonde que
5:21
par exemple là dans ce cas-là on a si
5:24
pages avec des URL qui contiennent des
5:26
majuscules lors d'une refonte ben
5:30
de site web bon courage si on migre d'un
5:33
serveur à un autre les URL avec
5:36
paramètres dans certains empêcher leur
5:39
coll comme par exemple les paramètres à
5:41
tout car parce que sur un site où il y a
5:44
plusieurs dizaines de milliers d'URL
5:46
c'est bête de se retrouver avec des
5:48
pages plus ou moins en doublon avec ce
5:51
type de paramètres en ce qui concerne la
5:53
partie titre départ maintenant on va
5:55
s'intéresser au titre départ alors
5:58
screaming frog à a tendance à brancher à
6:02
pas être content à partir du moment où
6:03
on dépasse par défaut 60 caractères vous
6:06
avez la colonne pour trier en ordre
6:08
croissant décroissant pour voir si vous
6:10
avez des titres SEO manquant ou
6:12
carrément trop court ou vraiment trop
6:14
long bon la page Contact pourra avoir un
6:16
titre plus accrocheur qui est l'
6:18
indexable voilà mais bon c'est une page
6:20
administrative en
6:22
général pas trop passer de temps bon
6:25
toujours agréable d'avoir une page de
6:27
contact personnalisée ça fait fait
6:29
toujours plaisir et euh il faut vérifier
6:33
aussi la longueur ne dépend pas
6:36
uniquement du nombre de caractères car
6:39
les caractères n'ont pas tous la même
6:42
longueur il faut vérifier aussi qu'il
6:45
faut avoir des titresau qui ne dépassent
6:48
pas 554 pixels toujours selon je clique
6:53
sur la barre de l'histogramme et j'ai
6:56
dans le menu dérolant en haut à gauche
6:58
les URL fil
7:00
en fonction du paramètre que je vais
7:01
analyser ici les titres qui font plus de
7:05
554 pixels met ta description il y a
7:08
quelques oublis c'est vraiment dommage
7:10
parce que une description qui résume
7:13
bien un article et qui est légèrement
7:15
accrocheuse pour l'utilisateur et pour
7:19
Google la balise MTA keyword bon s'il y
7:23
en a pas c'est pas grave puisque c'est
7:24
une balise c'est une balise qui n'est
7:26
plus prise en compte par Google ni
7:29
d'ailleurs
7:30
ping il me semble on va s'attaquer à la
7:33
partie H1 est-ce que les pages ont un
7:36
titre principal est-ce que toutes les
7:38
pages indexables ont un principal il y a
7:40
des pages qui devraient pas être
7:42
indexables ou rediriger c'est normal
7:44
qu'il nit pas besoin de travailler leur
7:46
titre globalement à part des titres en
7:50
doublon pas terrible et puis quelle idée
7:53
pour un thème de mettre le titre un
7:56
Hachin dans une balise alternative il
7:59
est préférable d'afficher clairement aux
8:02
yeux de l'utilisateur une balise h H2 là
8:05
aussi a certaines pages qui sont pauvres
8:08
en structure donc c'est à euh
8:10
retravailler ça c'est souvent dû à au
8:13
fait que il s'agit d'un bloc d'actualité
8:16
avec des articles un peu courts donc il
8:18
y a pas forcément besoin d'Inter ti qui
8:20
à mon avis est un peu dommage parce que
8:23
faut des titres euh et des intertitres
8:26
organisés de manière séquentielle H1
8:29
quelqu H2 et entre chaque H2 quelques H3
8:32
et cetera et cetera après il faut
8:34
vérifier qu'il y a pas des doublons
8:37
comme pour les titrons H1 il y en a là
8:39
ici on en voit rapidement trois et puis
8:42
pour voir quels sont les autres pages
8:45
qu' y a un
8:47
onlet détail sur les doublons voilà dans
8:49
la première colonne on a l'adresse la
8:53
première adresse
8:55
et dans la deuxème on a le l'autre URL
8:59
qui contient le même titre en H2 et on a
9:03
même le taux de similarité ici 100 %
9:05
c'est-à-dire que c'est un doublon par
9:08
défaut screaming frog détecte il me
9:11
semble à partir de 80 %. pour la partie
9:15
multiplle avoir plusieurs h dans une
9:18
page c'est pas forcément gênant mais il
9:21
faut quand même vérifier qu'il n'y ait
9:22
pas plusieurs fois le même H2 dans une
9:25
même page ou sur une autre page dans
9:28
bien des on va s'intéresser maintenant à
9:31
l'onglet Contenu apparemment scriamif d'
9:34
pas détecté de doublons n'a pas détecter
9:38
de doublon cependant il y aurait des
9:40
pages en quasi dououblon voilà par
9:43
exemple sur ce site là on on utilise
9:46
plusieurs articles pour traiter du même
9:48
sujet pourquoi parce que c'est un bloc
9:51
d'actualité voilà bon il y a c'est une
9:54
stratégie comme une autre mais proposer
9:57
d'avoir la stratégie du contenu uni
9:59
souvent réactualisé en supprimant la
10:02
date le format dans le format de l'URL
10:05
qu'elle soit en chiffre ou en lettrre
10:07
maintenant on va s'attaquer à la partie
10:10
image dans un premier temps je regarde
10:12
au niveau de la taille il y a pas des
10:14
images trop lourd bon à part peut-être
10:17
une image avec une ur qui contient une
10:20
majuscule ce qui ne plaît pas
10:22
globalement les images sont légères on
10:25
vérifie si sont tout indexable parfait
10:27
là il y en a une qui fait fait largement
10:29
plus de 50 K donc il faudrait la
10:32
l'exporter la redimensionner la
10:35
compresser la
10:37
réuploader et il faut regarder
10:40
aussi la présence de texte alternatif et
10:44
on s'aperçoit ici en cliquant sur la
10:47
barre en question il manque il y a 17
10:50
images qui sont sans Balis sans texte
10:53
alternatif donc il faudra voir les pages
10:55
et intégrer un texte alternatif sur ces
10:58
images en terme de version canonique
11:00
alors il est idéal d'avoir en cha
11:02
contenu unique une URL canonique dédié
11:06
j'ai fait une une vidéo sur le concept
11:09
de l'URL canonique je vous invite à la
11:11
visionner d'ailleurs je remercie tous
11:13
ceux qui l'ont visionné liker ça me
11:16
donne envie de continuer à faire des
11:18
vidéos et je regarde ici éventuellement
11:21
ce qui pourrait me gêner c'est la partie
11:23
canonisé bon il y en a très peu comme il
11:25
y en a très peu je peux pas cliquer sur
11:26
la barre donc je vais dans l'onglet
11:32
canonisé
11:34
alors normalement c'est un problème de
11:37
sécurité on devrait pas avoir accès
11:40
pourquoi c'est URL canonie problème dans
11:43
de code dans le thème on devrait pas
11:45
avoir accès à cette elle bref ça ça se
11:47
corrige facilement avec un plugin SEO ou
11:51
euh mieux en regardant dans le thème
11:55
regardons le système de pagination parce
11:57
que il pourrait y avoir des pièges alors
11:59
ici il y a pas vraiment de système de
12:02
pagination sur ce sur ce blog hormis sur
12:05
la page archive auuteur mais celle-ci
12:08
est vraiment inutile et à rediriger vers
12:12
une page personnalisée ou vers la page
12:15
d'accueil du site s'il n'y a qu'un seul
12:17
auteur effectivement on peut mettre en
12:19
place ce type de page autre point très
12:22
important ce qui concerne les directives
12:25
les pages en index ok a mais je
12:27
m'aperçois qu'il y a des pages en no
12:29
index est-ce que ça peut est-ce que ça
12:32
peut porter préjudice au blog s map no
12:36
index follow donc il y a pas de souci
12:39
c'est normal qu'il soit en N index
12:40
follow puisque ce sont des SMAP il sont
12:42
pas destinés à être indexés dans cette
12:45
démo je ne vois pas pour le moment
12:47
d'erreur capitale l'onglet href langue
12:51
concerne le balissage linguistique bon
12:53
le on reviendra peut-être sur une autre
12:56
vidéo à ce sujet parce que il s'agit
12:59
d'un blog uniquement en français dans la
13:01
section JavaScript on pourraz voir s'il
13:04
y a des problèmes voyez il y a alors
13:07
qu'est-ce que c'est que cette section en
13:08
fait lorsqu'on utilise un javascript sur
13:12
le sur un blog ou un site il faut savoir
13:15
que s'il est mal codé on peut avoir des
13:18
mauvaises surprises du style un visiteur
13:21
peut voir le contenu alors que les
13:26
craollers ceux de Google ou de Bing par
13:29
exemple ne puisse pas voir le contenu du
13:31
à du code invalide alors vous avez toute
13:34
une section à revoir ici sur la droite
13:37
pour le moment il semblerait pas qu'il y
13:39
ait de problème Javascript vous avez un
13:41
onglet très intéressant sur lequel on va
13:44
travailler c'est l'onglet lien alors là
13:47
il s'agit de la partie maillage interne
13:50
alors moi ce que je traque dans un
13:52
premier temps avec streamic frog c'est
13:54
voir s'il y a en terme de profondeur des
13:57
pages qui sont acc ible à un niveau
14:00
supérieur à 3 c'est pas le cas mais on
14:03
dirait qu'il y ait des pages dont stream
14:06
form a du mal à définir le niveau de
14:09
profondeur page d'exemple page d'exemple
14:12
normalement c'est normal est normalement
14:15
inaccessible doit être accessible
14:18
uniquement depuis un sign map ou
14:20
plusieurs sign map voilà ici accessible
14:23
depuis un seul s map alors au niveau
14:27
niveau du craoll de profondeur il y a a
14:29
pas de page profonde en terme de lien
14:31
entrant bon ça va c'est pas P mais
14:34
comment dire en terme de lien entrant la
14:37
plupart des pages on assez de lien
14:39
entrant on vers cette page mais il faut
14:41
analyser un peu plus loin pour voir s'il
14:43
y a pas des opportunités en terme de
14:45
maillage interne en regardant le nombre
14:48
de liens entrant uni certains disent
14:50
qu'en dessous de 4 le la page est pauvre
14:55
en matière de réputation c'est-à-dire
14:57
qu'elle ne reçoit pas assez de liens
14:59
rentrant uni sachant qu'avec streingmck
15:00
frog il faut parfois faire le tri parce
15:03
que des textes d'ancrage d'ancrage sont
15:07
pas vraiment parlant du style par
15:08
exemple ici on regarde en bas il y a les
15:12
Tex ancrages type 3 3 next logi là ça va
15:16
pas aider à améliorer la réputation de
15:18
la page donc c'est un peu normal
15:20
puisqu'on est sur une page d'archive on
15:24
regarde un peu plus loin on pourrait
15:25
prendre un article on regarde le nombre
15:27
de liens entrant unique 6 ça va sauf
15:30
qu'on pourrait en supprimer en matière
15:32
de de pertinence de la date la date
15:36
éventuellement enfin plutôt que on
15:39
devrait ignorer dans le décomte celui
15:42
qui concerne la date 13 avril 13 avril
15:45
donc il nous en reste finalement plus
15:48
que quatre vous pouvez aussi détecter
15:51
avec streaming frog si un site on des
15:53
pages à bon celui-là n'en contient pas
15:56
c'est pas plus mal donc on reviendra
15:59
dans une autre vidéo pour l'onglet AMP
16:01
autre onglet qui me semble important à
16:03
parler aujourd'hui c'est l'onglet s il
16:06
faut bien s'assurer sur un gros site
16:09
normalement que la totalité des URL sont
16:12
présents qui sont indexables et
16:15
importante présente dans le S map dédier
16:19
alors ici il y en a qui devrait sans
16:22
Doutre figurer dans le SMAP vérifie
16:25
voilà il y en a qui sont access S mais
16:29
pas dans le SAP vu le format de l'URL je
16:33
pense que c'est une URL non pertinente
16:35
on va vérifier oui effectivement c'est
16:38
une URL d'archive qui a été créé je ne
16:41
sais pas pourquoi peut-être pour plus
16:43
tard mais elle devrait pas être pour le
16:46
moment indexable à l'inverse nous avons
16:48
les URL orpheline c'est-à-dire les URL
16:51
qui sont présentes uniquement dans des
16:53
sign map mais qui sont pas présentes sur
16:55
le site comme il y en a très peu ici je
16:57
vais aller dans onglet la URL orpheline
17:01
et je m'aperçois que il y a une page
17:04
échantillon qui aurait dû être supprimé
17:07
du signemap avant mise en prod on va pas
17:10
trop s'attarder sur l'onglet Données
17:12
structuré parce que la vidéo est déjà
17:14
assez longue mais on s'aperçoit que le
17:17
site en contient déjà et je vous renvoie
17:20
à une autre vidéo sur les données
17:22
structurées sur ma chaîne dans la
17:23
section Google cherche console pour en
17:26
savoir plus sur les données structurées
17:28
si vous avez aimé cette vidéo n'hésitez
17:31
pas à me le dire comme d'habitude à la
17:33
liker à me poser des questions
17:35
j'essayerai d'y répondre comme je peux
17:38
et je vous dis à bientôt pour une
17:40
prochaine vidéo et n'oubliez pas de vous
17:42
abonner bye bye
#Search Engine Optimization & Marketing
#Web Stats & Analytics
#Search Engines
