Script de test de popularité sur Delicious

Combien de bookmarks vers les pages d'un site Web? Ce script teste la popularité d'un site en retrouvant les pages markées sur le site de favoris partagés Del.icio.us, et en calcule la somme.
C'est donc un moyen d'évaluer la popularité d'un site si celui-ci est suffisamment important pour obtenir des bookmarks sur plusieurs pages.

Le programme dépend de la disponibilité du site de bookmarks et peut mettre un bon moment pour accomplir sa tâche.

Mise à jour 2014: Le programme ne fonctionne plus parce que le site ne donne plus accès à ses données.

Comment fonctionne le programme

Popularity Checker fonctionne en mode HTTP. Il parcourt le site en partant de la page d'accueil et en suivant les liens internes.

Pour chaque page du site, il effectue une recherche sur Del.icio.sus afin d'obtenir le nombre de "saved". Pour ce faire il télécharge la page du site de favoris et extrait le nombre de favoris grâce à une expression régulière.

Liens brisés et erreurs

Le programme teste les liens brisés internes et affiche une erreur dans ce cas.
Il sait interpréter les liens relatifs, mais il ne reconnait pas les redirections. Cela peut provoquer des erreurs et des liens brisés fictifs dont il ne faut pas tenir compte.
Il est recommandé d'utiliser sur son site plutôt des chemins absolus pour les liens internes, comprenant le protocole http:// et le domaine.

Le programme retourne aussi des erreurs s'il ne peut accéder aux pages de bookmarks ce qui arrive lorsque les requêtes se succèdent trop rapidemment car l'accès est alors bloqué.

Comment utiliser le script

La syntaxe de commande est la suivante:

php popche [options] url

L'URL est la page de départ, normalement la page d'accueil, sous la forme:

http://www.scriptol.fr/

Ne pas omettre le slash en suffixe ou sinon ajouter le nom du fichier.

Options:

-r    recursif, tester aussi les pages liées.
-v   verbeux, affiche chaque page traitée.
-q   silencieux, n'affiche rien.

Un sous-répertoire peut être lié sous la forme http://www.scriptol.fr/seo/ ou http://www.scriptol.fr/seo/index.php.
Pour éviter les doublons, le programme tente de reconstituer le chemin complet en essayant les noms et extensions usuels pour une page d'accueil. Ce système ne peut prendre en compte tous les cas possibles.

Une fois le script lancé, commencez une autre tâche en attendant qu'il ait fini. Le programme n'est pas rapide, et il ne doit pas l'être car le site de bookmarks interdit les requêtes trop rapprochées.

Utilisation comme service Web

L'utilisation du script comme service Web est déconseillée. Le site Del.icio.us interdit temporairement l'accès à ses pages à toute source qui les consulte trop fréquemment pour éviter le spam.
Même en ligne de commande, le programme ne doit pas être utilisé trop souvent et son fonctionnement ne doit pas être accéléré.

Changements dans les versions

Obtenir le programme

L'archive contient le code source en langage Scriptol et le code binaire PHP. Il fonctionne sur tout ordinateur où l'on a installé l'interpréteur PHP 5.
Il est distribué sous licence GPL 2.0. Vous pouvez l'utiliser sans réserve et le distribuer à condition de conserver la notice de copyright dans le code Scriptol et le code PHP.

Script gratuit sous licence GNU GPL 2.0

© Scriptol.fr 2008-2014