0:00
bonjour à tous et à toutes Aujourd'hui
0:02
c'est Sébastien pierrepac qui vous fait
0:04
une deuxième vidéo concernant le
0:06
logiciel screaming frog puisque
0:09
aujourd'hui on va s'attaquer à l'analyse
0:11
d'un site web à une plutôt à une démo
0:15
aujourd'hui on va plutôt s'attaquer à
0:17
une démo pour vous présenter brièvement
0:20
les capacités du logiciel screaming frog
0:24
la dernière fois que j'ai fait une vidéo
0:27
je vous ai présenté une démo de
0:28
configuration du logiciel maintenant que
0:31
le logiciel est configuré je lance un
0:33
cro et on va explorer les différents
0:36
onglets d'analyse j'ai pris un site de
0:38
test qui ne m'appartient pas et je
0:42
premièrement je vais sur l'onglet
0:43
interne alors qu'est-ce que signifie
0:45
interne et ben tout bêtement il s'agit
0:47
des liens internes du site je classe par
0:51
code HTTP en général il est préférable
0:55
d'avoir un maximum de code de de code de
0:58
sens ça veut dire que l'URL est ok est
1:01
accessible directement voit que sur ce
1:04
site de test il y a 5 erreurs en 404
1:07
alors pour pouvoir détecter facilement
1:10
où sont placés ces 404 vous avez un
1:13
onglet tout en bas à gauche qui
1:15
s'appelle lien entrant voilà vous vous
1:18
apercevez que il y a un bug au niveau
1:21
euh du plan de site du signemap
1:25
c'est-à-dire lié aux pages alors quand
1:27
les pages ont été supprimées le plugin
1:30
SEO du site n'a clairement pas supprimé
1:34
les pages en 404 du S map alors c'est
1:37
peut-être dû au fait que le plugin SEO
1:39
n'a pas été configuré aspect que l'on
1:42
pourrait voir c'est les 301 il est
1:44
préférable d' lieu d'avoir des 301 comme
1:47
je l' dit tout à l'heure des URL en code
1:50
200 mais en général si vous avez pas si
1:53
ça ne représente pas la majorité du site
1:56
c'est c'est pas un détail vraiment
2:00
pénalisant par contre il faut que les
2:02
redirections soient correctes alors pour
2:04
les liens externes là c'est une autre
2:06
paire de manche c'est moins grave
2:08
d'avoir des liens externes Invalides que
2:10
des liens internes mais il est
2:12
préférable de les corriger comme tout à
2:14
l'heure ben je m'aperçois qu'il y a des
2:18
faux amis Twitter euh enfin des faux
2:21
amis c'est des 404 pour les bot mais
2:26
l'utilisateur ça la affiche du contenu
2:28
personnalisé en fait c'est lié aux
2:30
icônes de partage de Twitter c'est le
2:32
réseau de Twitter ou x si vous préférez
2:35
renvoie code 404 pour les icônes de
2:38
partage bon d'autres réseaux sociaux ont
2:41
préféré une meilleure méthode bon c'est
2:44
leur choix après il y a les erreurs 403
2:46
alors deux solutions qu'est-ce qui se
2:49
passe ça ve signifie que le craoller il
2:52
a été rejeté que l'URL est effectivement
2:56
inaccessible un accès interdit effectif
2:59
alors on peut peut par exemple prendre
3:00
le lien et vérifier un par un là par
3:03
exemple ça prendrait pas beaucoup de
3:05
temps puce que là il y en a trois ou
3:06
quatre et d'aller dans un navigateur
3:09
ouais c'est une sécurité li à cloud
3:13
algere.dz fonctionne bien mais il y a
3:16
des protocoles de sécurité qui empêchent
3:18
grifog par défaut de le coller
3:21
correctement voilà pour trouver ces 404
3:23
ou ces éventuels 403 à corriger le cœur
3:26
vous en dit vous allez toujours dans le
3:29
lien entrant et vous trouvez page en
3:31
question qui contient ce lien bon là
3:33
pour Twitter c'est plutôt un faux ami
3:37
c'est vraiment quelques cas
3:38
exceptionnels voilà donc au niveau
3:41
externe il y a pas vraiment de lien
3:43
invalid par contre là quand on va dans
3:46
l'onglet sécurité c'est là que pour ce
3:48
site il y a des soucis terme de contenu
3:52
mixte on vérifie au cas où ah non
3:55
effectivement non c'est c'est très ils
3:58
sont très peu nombreux mais ils sont
4:00
présents alors c'est assez tordu il y en
4:02
aurait qu'un HTTP vers la page d'accueil
4:06
mais le souci c'est qui se répercute sur
4:10
la sur la plupart des pages du site et
4:13
ça c'est un frein qui fait brancher
4:16
Google Google n'aime pas trouver des
4:18
liens internes en http sur un site en
4:22
https si vous voulez il y a l'onglet
4:25
code de réponse qui permet d'avoir une
4:27
vision globale de tous les codes CTP des
4:30
pages pour voir si on en a pas loupé un
4:32
tiens si par exemple expiration du délai
4:35
de connexion on n pas réussi à se
4:37
connecté à airfrance.fr peut-être un
4:40
protocole de sécurité où le site est
4:42
momentanément indisponible je ne pense
4:45
pas que ça soit la deuxième possibilité
4:46
c'est plus un lié à un protocole de
4:49
sécurité réinitialiser on attend
4:51
quelques temps bon bah si au bout de
4:53
quelque temps bon apparemment j'ai
4:55
cliqué sur l'URL clic droit et j'ai fait
4:58
réaniser j'ai fait analyser l'URL et ça
5:01
revient soit le site est indisponible
5:04
vérifier avec un navigateur c'est plutôt
5:07
un prot li un protocole de sécurité on
5:10
va attaquer un un onglet qui peut-être
5:13
dans certains cas très important il faut
5:15
analyser ça peut être très important si
5:17
on veut bien anticiper la refonde que
5:21
par exemple là dans ce cas-là on a si
5:24
pages avec des URL qui contiennent des
5:26
majuscules lors d'une refonte ben
5:30
de site web bon courage si on migre d'un
5:33
serveur à un autre les URL avec
5:36
paramètres dans certains empêcher leur
5:39
coll comme par exemple les paramètres à
5:41
tout car parce que sur un site où il y a
5:44
plusieurs dizaines de milliers d'URL
5:46
c'est bête de se retrouver avec des
5:48
pages plus ou moins en doublon avec ce
5:51
type de paramètres en ce qui concerne la
5:53
partie titre départ maintenant on va
5:55
s'intéresser au titre départ alors
5:58
screaming frog à a tendance à brancher à
6:02
pas être content à partir du moment où
6:03
on dépasse par défaut 60 caractères vous
6:06
avez la colonne pour trier en ordre
6:08
croissant décroissant pour voir si vous
6:10
avez des titres SEO manquant ou
6:12
carrément trop court ou vraiment trop
6:14
long bon la page Contact pourra avoir un
6:16
titre plus accrocheur qui est l'
6:18
indexable voilà mais bon c'est une page
6:22
général pas trop passer de temps bon
6:25
toujours agréable d'avoir une page de
6:27
contact personnalisée ça fait fait
6:29
toujours plaisir et euh il faut vérifier
6:33
aussi la longueur ne dépend pas
6:36
uniquement du nombre de caractères car
6:39
les caractères n'ont pas tous la même
6:42
longueur il faut vérifier aussi qu'il
6:45
faut avoir des titresau qui ne dépassent
6:48
pas 554 pixels toujours selon je clique
6:53
sur la barre de l'histogramme et j'ai
6:56
dans le menu dérolant en haut à gauche
7:00
en fonction du paramètre que je vais
7:01
analyser ici les titres qui font plus de
7:05
554 pixels met ta description il y a
7:08
quelques oublis c'est vraiment dommage
7:10
parce que une description qui résume
7:13
bien un article et qui est légèrement
7:15
accrocheuse pour l'utilisateur et pour
7:19
Google la balise MTA keyword bon s'il y
7:23
en a pas c'est pas grave puisque c'est
7:24
une balise c'est une balise qui n'est
7:26
plus prise en compte par Google ni
7:30
ping il me semble on va s'attaquer à la
7:33
partie H1 est-ce que les pages ont un
7:36
titre principal est-ce que toutes les
7:38
pages indexables ont un principal il y a
7:40
des pages qui devraient pas être
7:42
indexables ou rediriger c'est normal
7:44
qu'il nit pas besoin de travailler leur
7:46
titre globalement à part des titres en
7:50
doublon pas terrible et puis quelle idée
7:53
pour un thème de mettre le titre un
7:56
Hachin dans une balise alternative il
7:59
est préférable d'afficher clairement aux
8:02
yeux de l'utilisateur une balise h H2 là
8:05
aussi a certaines pages qui sont pauvres
8:08
en structure donc c'est à euh
8:10
retravailler ça c'est souvent dû à au
8:13
fait que il s'agit d'un bloc d'actualité
8:16
avec des articles un peu courts donc il
8:18
y a pas forcément besoin d'Inter ti qui
8:20
à mon avis est un peu dommage parce que
8:23
faut des titres euh et des intertitres
8:26
organisés de manière séquentielle H1
8:29
quelqu H2 et entre chaque H2 quelques H3
8:32
et cetera et cetera après il faut
8:34
vérifier qu'il y a pas des doublons
8:37
comme pour les titrons H1 il y en a là
8:39
ici on en voit rapidement trois et puis
8:42
pour voir quels sont les autres pages
8:47
onlet détail sur les doublons voilà dans
8:49
la première colonne on a l'adresse la
8:55
et dans la deuxème on a le l'autre URL
8:59
qui contient le même titre en H2 et on a
9:03
même le taux de similarité ici 100 %
9:05
c'est-à-dire que c'est un doublon par
9:08
défaut screaming frog détecte il me
9:11
semble à partir de 80 %. pour la partie
9:15
multiplle avoir plusieurs h dans une
9:18
page c'est pas forcément gênant mais il
9:21
faut quand même vérifier qu'il n'y ait
9:22
pas plusieurs fois le même H2 dans une
9:25
même page ou sur une autre page dans
9:28
bien des on va s'intéresser maintenant à
9:31
l'onglet Contenu apparemment scriamif d'
9:34
pas détecté de doublons n'a pas détecter
9:38
de doublon cependant il y aurait des
9:40
pages en quasi dououblon voilà par
9:43
exemple sur ce site là on on utilise
9:46
plusieurs articles pour traiter du même
9:48
sujet pourquoi parce que c'est un bloc
9:51
d'actualité voilà bon il y a c'est une
9:54
stratégie comme une autre mais proposer
9:57
d'avoir la stratégie du contenu uni
9:59
souvent réactualisé en supprimant la
10:02
date le format dans le format de l'URL
10:05
qu'elle soit en chiffre ou en lettrre
10:07
maintenant on va s'attaquer à la partie
10:10
image dans un premier temps je regarde
10:12
au niveau de la taille il y a pas des
10:14
images trop lourd bon à part peut-être
10:17
une image avec une ur qui contient une
10:20
majuscule ce qui ne plaît pas
10:22
globalement les images sont légères on
10:25
vérifie si sont tout indexable parfait
10:27
là il y en a une qui fait fait largement
10:29
plus de 50 K donc il faudrait la
10:32
l'exporter la redimensionner la
10:37
réuploader et il faut regarder
10:40
aussi la présence de texte alternatif et
10:44
on s'aperçoit ici en cliquant sur la
10:47
barre en question il manque il y a 17
10:50
images qui sont sans Balis sans texte
10:53
alternatif donc il faudra voir les pages
10:55
et intégrer un texte alternatif sur ces
10:58
images en terme de version canonique
11:00
alors il est idéal d'avoir en cha
11:02
contenu unique une URL canonique dédié
11:06
j'ai fait une une vidéo sur le concept
11:09
de l'URL canonique je vous invite à la
11:11
visionner d'ailleurs je remercie tous
11:13
ceux qui l'ont visionné liker ça me
11:16
donne envie de continuer à faire des
11:18
vidéos et je regarde ici éventuellement
11:21
ce qui pourrait me gêner c'est la partie
11:23
canonisé bon il y en a très peu comme il
11:25
y en a très peu je peux pas cliquer sur
11:26
la barre donc je vais dans l'onglet
11:34
alors normalement c'est un problème de
11:37
sécurité on devrait pas avoir accès
11:40
pourquoi c'est URL canonie problème dans
11:43
de code dans le thème on devrait pas
11:45
avoir accès à cette elle bref ça ça se
11:47
corrige facilement avec un plugin SEO ou
11:51
euh mieux en regardant dans le thème
11:55
regardons le système de pagination parce
11:57
que il pourrait y avoir des pièges alors
11:59
ici il y a pas vraiment de système de
12:02
pagination sur ce sur ce blog hormis sur
12:05
la page archive auuteur mais celle-ci
12:08
est vraiment inutile et à rediriger vers
12:12
une page personnalisée ou vers la page
12:15
d'accueil du site s'il n'y a qu'un seul
12:17
auteur effectivement on peut mettre en
12:19
place ce type de page autre point très
12:22
important ce qui concerne les directives
12:25
les pages en index ok a mais je
12:27
m'aperçois qu'il y a des pages en no
12:29
index est-ce que ça peut est-ce que ça
12:32
peut porter préjudice au blog s map no
12:36
index follow donc il y a pas de souci
12:39
c'est normal qu'il soit en N index
12:40
follow puisque ce sont des SMAP il sont
12:42
pas destinés à être indexés dans cette
12:45
démo je ne vois pas pour le moment
12:47
d'erreur capitale l'onglet href langue
12:51
concerne le balissage linguistique bon
12:53
le on reviendra peut-être sur une autre
12:56
vidéo à ce sujet parce que il s'agit
12:59
d'un blog uniquement en français dans la
13:01
section JavaScript on pourraz voir s'il
13:04
y a des problèmes voyez il y a alors
13:07
qu'est-ce que c'est que cette section en
13:08
fait lorsqu'on utilise un javascript sur
13:12
le sur un blog ou un site il faut savoir
13:15
que s'il est mal codé on peut avoir des
13:18
mauvaises surprises du style un visiteur
13:21
peut voir le contenu alors que les
13:26
craollers ceux de Google ou de Bing par
13:29
exemple ne puisse pas voir le contenu du
13:31
à du code invalide alors vous avez toute
13:34
une section à revoir ici sur la droite
13:37
pour le moment il semblerait pas qu'il y
13:39
ait de problème Javascript vous avez un
13:41
onglet très intéressant sur lequel on va
13:44
travailler c'est l'onglet lien alors là
13:47
il s'agit de la partie maillage interne
13:50
alors moi ce que je traque dans un
13:52
premier temps avec streamic frog c'est
13:54
voir s'il y a en terme de profondeur des
13:57
pages qui sont acc ible à un niveau
14:00
supérieur à 3 c'est pas le cas mais on
14:03
dirait qu'il y ait des pages dont stream
14:06
form a du mal à définir le niveau de
14:09
profondeur page d'exemple page d'exemple
14:12
normalement c'est normal est normalement
14:15
inaccessible doit être accessible
14:18
uniquement depuis un sign map ou
14:20
plusieurs sign map voilà ici accessible
14:23
depuis un seul s map alors au niveau
14:27
niveau du craoll de profondeur il y a a
14:29
pas de page profonde en terme de lien
14:31
entrant bon ça va c'est pas P mais
14:34
comment dire en terme de lien entrant la
14:37
plupart des pages on assez de lien
14:39
entrant on vers cette page mais il faut
14:41
analyser un peu plus loin pour voir s'il
14:43
y a pas des opportunités en terme de
14:45
maillage interne en regardant le nombre
14:48
de liens entrant uni certains disent
14:50
qu'en dessous de 4 le la page est pauvre
14:55
en matière de réputation c'est-à-dire
14:57
qu'elle ne reçoit pas assez de liens
14:59
rentrant uni sachant qu'avec streingmck
15:00
frog il faut parfois faire le tri parce
15:03
que des textes d'ancrage d'ancrage sont
15:07
pas vraiment parlant du style par
15:08
exemple ici on regarde en bas il y a les
15:12
Tex ancrages type 3 3 next logi là ça va
15:16
pas aider à améliorer la réputation de
15:18
la page donc c'est un peu normal
15:20
puisqu'on est sur une page d'archive on
15:24
regarde un peu plus loin on pourrait
15:25
prendre un article on regarde le nombre
15:27
de liens entrant unique 6 ça va sauf
15:30
qu'on pourrait en supprimer en matière
15:32
de de pertinence de la date la date
15:36
éventuellement enfin plutôt que on
15:39
devrait ignorer dans le décomte celui
15:42
qui concerne la date 13 avril 13 avril
15:45
donc il nous en reste finalement plus
15:48
que quatre vous pouvez aussi détecter
15:51
avec streaming frog si un site on des
15:53
pages à bon celui-là n'en contient pas
15:56
c'est pas plus mal donc on reviendra
15:59
dans une autre vidéo pour l'onglet AMP
16:01
autre onglet qui me semble important à
16:03
parler aujourd'hui c'est l'onglet s il
16:06
faut bien s'assurer sur un gros site
16:09
normalement que la totalité des URL sont
16:12
présents qui sont indexables et
16:15
importante présente dans le S map dédier
16:19
alors ici il y en a qui devrait sans
16:22
Doutre figurer dans le SMAP vérifie
16:25
voilà il y en a qui sont access S mais
16:29
pas dans le SAP vu le format de l'URL je
16:33
pense que c'est une URL non pertinente
16:35
on va vérifier oui effectivement c'est
16:38
une URL d'archive qui a été créé je ne
16:41
sais pas pourquoi peut-être pour plus
16:43
tard mais elle devrait pas être pour le
16:46
moment indexable à l'inverse nous avons
16:48
les URL orpheline c'est-à-dire les URL
16:51
qui sont présentes uniquement dans des
16:53
sign map mais qui sont pas présentes sur
16:55
le site comme il y en a très peu ici je
16:57
vais aller dans onglet la URL orpheline
17:01
et je m'aperçois que il y a une page
17:04
échantillon qui aurait dû être supprimé
17:07
du signemap avant mise en prod on va pas
17:10
trop s'attarder sur l'onglet Données
17:12
structuré parce que la vidéo est déjà
17:14
assez longue mais on s'aperçoit que le
17:17
site en contient déjà et je vous renvoie
17:20
à une autre vidéo sur les données
17:22
structurées sur ma chaîne dans la
17:23
section Google cherche console pour en
17:26
savoir plus sur les données structurées
17:28
si vous avez aimé cette vidéo n'hésitez
17:31
pas à me le dire comme d'habitude à la
17:33
liker à me poser des questions
17:35
j'essayerai d'y répondre comme je peux
17:38
et je vous dis à bientôt pour une
17:40
prochaine vidéo et n'oubliez pas de vous