Questions sur la création de site Web

Toutes les questions concernant la création et la conception de site web et les problèmes que rencontre un webmaster, complété par la FAQ du Web design pour les questions sur la conception.

Design

Qu'est-ce qu'un CMS?

CMS signifie "Content Management System", et c'est un logiciel ou une ensemble de scripts pour créer dynamiquement le site à partir d'une présentation prédéfinie et à partir de fiches textuelles, que l'on peut entrer éventuellement avec le navigateur, en ligne.
Il existe des CMS généraux et d'autres spécialisés dans les blogs, les wikis, les faqs, etc....
Le CMS délivre le webmaster des tâches de gestion du site pour qu'il se concentre sur le contenu. Il offre des outils tels que nuage de tags, générateur de flux RSS et autres...
Voir l'article sur les systèmes de gestion de contenu et la liste des CMS en PHP et SQL.

Qu'est-ce que RSS?

Really Simple Syndication est un format de fichier destiné à faire connaître par des liens les articles d'un site Web. L'objectif principal est la promotion d'un site, mais il existe de nombreuses applications au format RSS, pratique pour obtenir des nouvelles et autres informations en souscrivant à une liste dont le contenu évolue dans le temps.

Le choix de l'extension du nom de domaine est-il important?

L'extension, ou TLD (Top-Level Domain) est pris en compte par les moteurs de recherche, notamment par Google. Un site en FR arrive en meilleure position pour une recherche en français (ou en France).

Comment savoir si un autre site reprend mes pages?

On peut le savoir en lançant une recherche sur un moteur de recherche, en tapant une phrase contenue dans une page de votre site, et en la mettant entre guillemets.
Ou plus simplement encore, vous allez sur le site Copyscape et vous entrez l'URL de votre page.

Comment savoir si les robots des moteurs de recherche trouvent mes pages?

Pour cela il faut tester les liens sur votre site à partir de la page d'accueil. Le meilleur moyen serait de créer une sitemap et de comparer la liste générée avec la liste des pages du site.
Plus simple encore, le site Spider Simulator peut parser votre site et donner les liens internes qu'il trouve. Il suffit de taper l'URL du site.

Comment avoir des statistiques des visites?

Si votre hébergement ne founit pas de statistiques, vous avez le choix des solutions pour intégrer un outil de statistiques gratuit. Google Analytics notamment. Ce système nécessite un code JavaScript dans les pages. Pas de limitations de trafic.
PhpMyVisites est un logiciel que l'on installe sur son hébergement et qui requiert PHP 4.3 et MySQL. Il semble qu'il soit limité en trafic, autour de 1500 visiteurs par jour.

Peut-on avoir un nom de domaine d'une lettre?

L'ICANN interdit les noms de domaines en une lettre. Il y a eu toutefois quelques exceptions: I.NET, Q.COM, Q.NET, X.COM, Z.COM et G.COM, le dernier étant Google.

Peut-on avoir un nom de marque dans un nom de domaine?

Non car on peut penser que votre site à un rapport avec l'entreprise qui détient la marque, ce qu'elle ne souhaiterait pas. Elle pourrait vous demander de rétrocéder le nom de domaine. Les grandes marques s'efforcent d'ailleurs de déposer la plupart des noms qui pourraient créer la confusion.

Quelle est la différence entre Web et Internet?

Le Web est l'interface graphique du réseau Internet, que l'on appelle aussi familièrement le Net. Web est l'abbréviation de World Wide Web, et désigne plutôt la documentation accessible que le Net, que le réseau lui-même dans ses aspects pratiques et ses protocoles. Le sous-domaine www qui est un raccourci de World Wide Web est destiné à l'origine à pointer sur des documents reconnus par les navigateurs et le répertoire www à contenir les fichiers accessibles au public et partagés sur le Net.http://googlewebmastercentral.blogspot.com/2008/06/duplicate-content-due-to-scrapers.html

Que fait Google quand il trouve une page en double (duplicate content)?

Google l'explique sur son blog. Il y a deux cas possibles, une page est en double sur un même site, dans ce cas il faut simplement indiquer à Google quelle page indexer, il suffit de placer l'URL dans la sitemap. L'autre sera ignorée.
L'autre cas c'est quand un site récupère votre contenu pour l'afficher sur son site ou par des proxies. Alors Google se charge de trouver quel site est l'original et lequel est la copie, cela ne lui est pas trop difficile car il connait les sites. Dans tous les cas votre site ne sera pas pénalisé par une page en double.
Noter que lorsqu'un site est accessible par deux noms de domaines, Google ne peut savoir lequel est l'original! Dans ce cas vous serez forcément pénalisé.

Nom de domaine et gestion de site

Puis-je rediriger mon nom de domaine sur un hébergement free.fr?

"J'ai acquis un nom de domaine chez un registrar. Ce que je voudrais, c'est que le domaine pointe sur mon hébergement xxx.free.fr et que ce soit le nom de domaine qui apparaisse dans le champ d'URL du navigateur."

C'est une question très fréquente. Malheureusement ce n'est pas permis par l'hébergeur. Bien sûr, les registrars permettent de rediriger un nom de domaine par une redirection 301 ou 302, ou par des frames.
Dans le premier cas c'est l'URL cible qui apparait dans la barre des tâches (donc l'adresse sur free) et qui est indexée par les moteurs de recherche.
Dans le second cas le nom de domaine est affiché, mais pas les pages et les moteurs de recherche ne suivent pas le lien.
La redirection invisible n'est possible que lorsque l'hébergeur prend en compte la gestion des DNS.
Plus d'infos.

Puis-je faire pointer plusieurs noms de domaines sur un même site?

Cela est déconseillé par les moteurs de recherche.
Vos autres noms de domaine doivent pointer sur des pages différentes, et celles-ci peuvent contenir un lien ou une redirection 301 qui redirige l'internaute sur le contenu hébergé. Dans les deux cas les moteurs de recherche sont informés de la redirection et cela évite qu'ils ne voient dans les deux domaines une tentative de truster les résultats des moteurs de recherche grâce à une double indexation.
Depuis la prise en compte de l'attribut canonical, si l'URL de toutes les pages est défini par l'attribut, il n'y a pas d'inconvénient à utiliser plusieurs domaines pour un même site.

Puis-je placer une même page sur deux sites différents?

Le "duplicate content", autrement dit contenu en double, est prohibé par les moteurs de recherche.
Vous pouvez éviter la sandbox en excluant la page en double des moteurs de recherches, voir sur la FAQ référencement à la question "comment exclure une page du référencement".

Comment exécuter PHP 5

En plaçant la commande suivante dans .htaccess pour Apache:

SetEnv PHP_VER 5

Sur d'autres serveurs UNIX ce peut être:

AddType x-mapp-php5 .php

Consulter les instructions de votre hébergeur pour vérifier que la variable d'environnement utilisée est la même.

Comment changer l'extension des fichiers que le serveur doit exécuter?

Si l'on a placé du code PHP dans une page d'extension .html par exemple, comment faire pour que le serveur traite ce code PHP?
En plaçant une commande comme la suivante dans .htaccess:

AddType application/x-httpd-php .htm .html
Les extensions .htm et .html sont des exemples. La commande fera que les fichiers avec ces extensions seront traités par le serveur comme les fichiers d'extension .php

Comment protéger un répertoire par mot de passe?

En modifiant le fichier .htaccess ce qui peut se faire plus simplement en utilisant un outil qui va générer automatiquement le fichier.

Comment bloquer les aspirateurs de sites?

Vous pouvez insérez le code suivant dans votre fichier .htaccess (source Webrankinfo).

Comment empêcher un site de spam de lier mon site?

Dans le fichier .htaccess, ajoutez les lignes suivantes:

SetEnvIfNoCase Referer ".*(domaine | autre domaine | etc. ).*" spammer=yes      
Order allow, deny 
allow from all 
deny from env=spammer
Les noms des sites, domaine avec extension sont placés dans une liste entre parenthèses et séparés par la barre verticale.
Ce code associe un code a un ensemble de domaines, et les lignes suivantes donnent permission à tous sites sauf les sites désignés par le code d'envoyer des visiteurs. Pour ces derniers l'accès est dénié.

Pourquoi le chargement de mes pages est-il si lent?

Cela peut dépendre de facteurs variés: d'un script mal conçu, d'une base de données dont les requêtes sont lentes à s'effectuer ou toute autre cause. Vous pouvez avoir un diagnostic de votre site avec cet outil en ligne de test de site.

Comment connaître le site d'une adresse IP?

L'adress IP est un numéro qui identifie votre ordinateur dans le cas d'une adresse statique, ou votre connexion à Internet dans le cas d'une adresse dynamique attribuée par un fournisseur d'accès.
C'est aussi un nombre qui identifie un site internet, mais c'est le nom de domaine associé à ce nombre par le registre, qui permet d'accéder au site.
En tapant "mon ip" sur un moteur de recherche, un site affichera votre adresse IP sur la page d'accueil.
Le site Ripe donne accès à la base de données qui relie les noms de domaines aux adresses IP. Tapez simplement l'IP pour avoir le nom de domaine et son propriétaire.

Vaut-il mieux utiliser un chemin relatif ou absolu dans les liens internes?

L'URL d'un lien interne peut avoir trois formes:

Certains éditeurs comme Dreamweaver favorisent les chemins locaux, mais cette forme d'URL est à déconseiller.

Le chemin absolu est à privilégier. Il renvoit vers votre site quand la page est affichée sur un aggrégateur.
Le chemin relatif ne fonctionne que si le serveur est configuré pour définir "/" comme la racine du site (plutôt que la racine du compte sur le serveur). C'est utile uniquement pour changer de domaine.
Le chemin local est à éviter. Les chemins locaux ne sont pas pris en compte pas Analytics pour les statistiques de répartition des clics.

Faut-il mettre un / terminal dans les URLs?

On peut écrire une URL sous la forme:

http://www.scriptol.fr/webmaster ou
http://www.scriptol.fr/webmaster/ 

En général, le serveur s'il s'agit d'un répertoire redirige la première sur la seconde. Mais la première peut être un fichier, c'est souvent le cas avec Wordpress.
Ce n'est pas un problème pour Google qui lorsqu'il y a deux liens différents indexe le fichier et le répertoire. Lorsque le serveur redirige une URL sans slash terminal sur un répertoire,il n'y a pas de contenu dupliqué mais pour les crawlers des moteurs de recherche, c'est une complication à éviter.
Il faut donc dans le cas d'un répertoire toujours ajouter le slash.
Plus de précision: To slash or not to slash.

Design

Frames ou pas frames?

Il parait que les frames posent un problème à Google. Doit-on les éviter?

Il vaut mieux éviter d'utiliser les frames. Elles peuvent être remplacées de façon plus avantageuse par
les feuilles de style CSS.
Les frames sont un inconvénient en général. Si l'en-tête et le menu sont dans une page du frameset et les pages du contenu dans d'autres éléments du frameset, lorsque quelqu'un accède à une page directement par un moteur de recherche, il ignore sur quel site il se trouve et comment accéder aux autres pages.
Quand au référencement, le fichier qui reçoit le plus de liens de la part d'autres sites (c'est le fichier qui contient le frameset) n'a pas de contenu et ce n'est pas une bonne chose pour le PageRank.
L'outil Site Update, fourni par Scriptol.fr, permet de s'affranchir des frames en copiant l'en-tête ou le menu du site sur toutes les pages.

Dois-je séparer les mots par un tiret ou par un caractère de soulignement?

Dans un nom de fichier, une ancre, etc., le caractère de soulignement "_" ne sépare pas les mots pour les moteurs de recherche, donc guide_tricot est vu comme un seul mot, tandis que guide-tricot avec un tiret, contient deux mots pour le moteur.
Le caractère de soulignement est un séparateur de termes dans un identifieur en programmation, par exemple: file_exists(). Un identifieur (comprenant éventuellement des caractères de soulignement) est dans son entier un mot dans le langage humain et donc aussi pour les moteurs de recherche.

En ce qui concerne MSN, les références contenant plus d'un tiret ne sont pas prises en compte pour les recherches.

L'URL complète pour les liens internes

Faut-il inclure l'adresse URL complète du site (genre http://www.scriptol.fr/) dans les liens internes? Cela améliore-t'il le référencement?

Si votre site est édité localement, puis transféré sur un l'espace fourni par un hébergeur, l'inclusion de l'URL empêchera de naviguer localement dans l'image du site.
Les moteurs de recherche sont évidemment capables de rajouter l'URL pour référencer les pages du site, mais on sait que certains d'entre eux, le plus important notamment, sont un peu paresseux, et qu'il vaut mieux leur faciliter la tâche.
On peut aussi fournir une sitemap qui contiendra l'URL complète de chaque page.

Dois-je créer les méta-tags? On dit que Google ne les lit pas.

Google lit au moins la méta "robots" et quelquefois il utilise la méta "description".
Les autres moteurs utilisent également la méta "keyword" et ils ne sont pas à négliger.
Notez que vous pouvez générer automatiquement les métas avec l'utilitaire gratuit Spider SEO, réalisé par moi-même.

Est-ce un inconvénient, des pages de tailles importantes?

Pour un ensemble de raisons (moteurs de recherche, temps de chargement, etc.) la taille généralement recommandée se situerait entre 10000 à 20000 caractères et cela est souvent pratiqué par les professionnels. Les robots accordent plus d'importance à la première partie des pages.
Cependant des pages de taille importante donnent plus de chance d'obtenir des liens retour.

Comment avoir une image devant le nom de mon site dans la barre d'URL des navigateurs?

Cette image s'appelle une favicon. Il apparaît également dans le panneau des favoris.
C'est un fichier de type icône de Windows, nommé favicon.ico, de taille 16x16 pixels ou 32x32 pixels, qui doit être placé dans le répertoire racine.
Voir sur cette page de logiciels graphiques pour trouver un éditeur d'icones standard.

Quelle taille doivent avoir les pages Web?

La taille des pages Web en moyenne augmente d'année en année. Selon l'étude publiée par le site Websiteoptimization, en 2008 la taille moyenne des pages était de 312 ko.

Mais il existe aussi des outils permettant de connaître le temps de chargement d'une page, notamment les Outils du webmaster de Google. Et c'est ce qui importe surtout.