Combien de bookmarks vers les pages d'un site Web? Ce script teste la popularité
d'un site en retrouvant les pages markées sur le site de favoris partagés
Del.icio.us, et en calcule la somme.
C'est donc un moyen d'évaluer la popularité d'un site si celui-ci
est suffisamment important pour obtenir des bookmarks sur plusieurs pages.
Le programme dépend de la disponibilité du site de bookmarks et peut mettre un bon moment pour accomplir sa tâche.
Mise à jour 2014: Le programme ne fonctionne plus parce que le site ne donne plus accès à ses données.
Popularity Checker fonctionne en mode HTTP. Il parcourt le site en partant de la page d'accueil et en suivant les liens internes.
Pour chaque page du site, il effectue une recherche sur Del.icio.sus afin d'obtenir le nombre de "saved". Pour ce faire il télécharge la page du site de favoris et extrait le nombre de favoris grâce à une expression régulière.
Le programme teste les liens brisés internes et affiche une erreur
dans ce cas.
Il sait interpréter les liens relatifs, mais il ne reconnait pas les
redirections. Cela peut provoquer des erreurs et des liens brisés fictifs
dont il ne faut pas tenir compte.
Il est recommandé d'utiliser sur son site plutôt des chemins
absolus pour les liens internes, comprenant le protocole http:// et le domaine.
Le programme retourne aussi des erreurs s'il ne peut accéder aux pages de bookmarks ce qui arrive lorsque les requêtes se succèdent trop rapidemment car l'accès est alors bloqué.
La syntaxe de commande est la suivante:
php popche [options] url
L'URL est la page de départ, normalement la page d'accueil, sous la forme:
http://www.scriptol.fr/
Ne pas omettre le slash en suffixe ou sinon ajouter le nom du fichier.
Options:
-r recursif, tester aussi les pages liées. -v verbeux, affiche chaque page traitée. -q silencieux, n'affiche rien.
Un sous-répertoire peut être lié sous la forme http://www.scriptol.fr/seo/
ou http://www.scriptol.fr/seo/index.php.
Pour éviter les doublons, le programme tente de reconstituer le chemin
complet en essayant les noms et extensions usuels pour une page d'accueil.
Ce système ne peut prendre en compte tous les cas possibles.
Une fois le script lancé, commencez une autre tâche en attendant qu'il ait fini. Le programme n'est pas rapide, et il ne doit pas l'être car le site de bookmarks interdit les requêtes trop rapprochées.
L'utilisation du script comme service Web est déconseillée.
Le site Del.icio.us interdit temporairement l'accès à
ses pages à toute source qui les consulte trop fréquemment pour éviter le spam.
Même en ligne de commande, le programme ne doit pas être utilisé
trop souvent et son fonctionnement ne doit pas être accéléré.
L'archive contient le code source en langage Scriptol et le code binaire
PHP. Il fonctionne sur tout ordinateur où l'on a installé l'interpréteur
PHP 5.
Il est distribué sous licence GPL 2.0. Vous pouvez l'utiliser sans
réserve et le distribuer à condition de conserver la notice
de copyright dans le code Scriptol et le code PHP.
Script gratuit sous licence GNU GPL 2.0
© Scriptol.fr 2008-2014