Comment construire le plan d'un site Web ?


Un site Web est constitué de pages Web reliées entre elles par des liens hypertexte

Chaque page Web est un fichier texte qui peut être ouvert et parcouru par une macro VB ou VBA.
La macro va rechercher dans le fichier texte correspondant à la première page Web tous les liens vers d'autres pages :
   - les balises "A HREF"
   - et les cadres, balises "FRAME",
puis noter dans une feuille Excel la liste de ces liens.

En réitérant l'opération sur les pages correspondant à chacun des liens, la macro peut tracer l'arborescence du site.

En reportant dans un nouveau fichier texte cette liste de liens, la macro peut ensuite créer un plan de site au format HTML.
Le fichier est enregistré dans le répertoire contenant le site sous le nom "plan_du_site_.html" et ouvert en html par la macro.

Télécharger le fichier .xls (73 ko)

Attention, la macro fonctionne sur un site enregistré sur le disque dur
elle ne prend pas en compte les liaisons créées par JavaScript
ni les redirections de sites utilisant par exemple META HTTP-EQUIV="REFRESH"



Une autre solution, qui présente notamment l'intérêt de pouvoir fonctionner même pour un site déjà implanté sur le serveur, consiste à ouvrir successivement chaque page du site sous Excel pour en extraire tous les liens.
Une macro VBA peut ainsi, de proche en proche, atteindre tous les liens du site, les recopier dans un classeur Excel, avant de les présenter sous forme de feuille html.

Télécharger le fichier .xls (53 ko)

Pas plus que la précédente, cette macro ne prend en compte les liaisons créées par JavaScript
ou les redirections de sites utilisant par exemple META HTTP-EQUIV="REFRESH"