5 astuces pour optimiser l’espace disque de son site web
Que ce soit un blog, un site web perso, un site marchand ou toute autre forme de site web, cela vous est peut-être arrivé: impossible de télécharger de nouveaux fichiers sur le serveur FTP (ou alors, si, mais ils sont tous vides, et votre site est « cassé »). Le plus souvent, l’explication est simple: overquota, vous avez utilisé tout l’espace disque alloué.
Voici quelques astuces et outils pour « faire de la place ». Mais avant, tâchez de vous renseigner sur l’espace disque qui vous est alloué. Et de quelle manière: les emails, la base de données sont-ils comptabilisés? Il n’y a pas de réponse unique, tout dépend de votre hébergeur. Enfin, dans certains cas très particuliers (serveur partagé par de nombreux sites web), il arrive que ce ne soit pas vos quotas qui sont atteints, mais ceux du groupe (de sites web). Le symptôme est le même, mais la solution toute autre: vous pouvez alors enlever autant de fichiers que vous voulez, vous ne gagnerez pas d’espace, mais en libererez pour les autres…
Un peu de méthode
Comme pour le tri des emails d’ailleurs, il y a deux approches: éliminer (ou archiver) les fichiers inutiles, ou éliminer (ou archiver) les plus gros fichiers. Les plus méthodiques attaqueront par les fichiers pas ou peu utilisés. C’est certainement l’approche la plus « logique », mais pas la plus efficace, si votre objectif est de « gagner de la place ».
En règle général, je conseil d’attaquer par les gros fichiers, et tant pis pour les petits qui trainent… sauf que…
Les petits fichiers occupent beaucoup de place
Là encore, ce que je dis est valables dans d’autres cas, comme les disques durs d’ordinateurs (logique, un serveur web, c’est avant tout un ordinateur…). Il faut savoir qu’un fichier, même vide, occupe plus que sa taille. Sur un gros fichier, c’est sans importance, cela représent très vite moins de 1% de perte de place. Mais un petit fichier occupera une taille minimum, même si « théoriquement », il contient moins de données. Ainsi, un fichier de 0 octet peut occuper 4Kilo-Octets (soit 4000 octets de perdus, inutilisés mais inutilisables).
Pour lutter contre ce gaspillage, une seule solution: lorsque vous créez votre site web, évitez de multiplier les petits fichiers. Ce conseil s’adresse surtout aux développeurs ou aux utilisateurs de logiciels web (CMS, blog) tout faits, comme drupal, joomla, wordpress ou dotclear par exemple. Concrètement, même si le répertoire contenant les fichiers des langues étrangères ou la documentation ne fait que quelques centaines de Kilo-Octets, il peut occuper 4 à 10 fois plus de place sur l’espace disque, et donc grignoter vos quotas.
Vérifiez que votre site ne contient pas des dossiers remplis de (petits) fichiers que vous n’utilisez pas: fichiers de langues « exotiques », fichiers d’aide que vous avez de toutes les façons sur votre ordinateur ou sur le web, ou encore bibliothèques d’images (smileys, avatars, illustrations)… et faites le ménage!
Identifier les gros fichiers
Sous Windows, il est relativement facile d’identifier les gros fichiers: afficher les dossiers et s’attaquer au plus gros, puis le plus gros sous-dossier, jusqu’à identifier les plus gros fichiers en utilisant le tri par taille. Autre solution, utiliser la fonction de recherche de windows pour cibler les fichiers ayant une taille supérieure à 100 Kilo-Octets par exemple. Enfin, il est possible d’utiliser un logiciel spécialisé, comme WinDirUsage.
Dans votre espace web, C’est à peine plus compliqué:
Si vous disposez d’un accès à votre hébergement par telnet ou SSH, profitez-en pour lancer quelques commandes Unix. Pour identifier seulement les fichiers de taille supérieure à, par exemple, 100 Kilo-Octets, lancer la commande:
find . -size +100k
Vous serez surpris par les fichiers qui dépasse cette taille. Peut-être identifierez-vous des photos qui supporteraient bien un redimensionnement ou tout au moins une recompression.
Si vous ne disposez pas d’un accès telnet ou SSH, vous pouvez faire une copie de sauvegarde de votre site Internet dans un dossier de votre ordinateur (de toutes les façons, c’était à faire…), et utiliser les techniques Windows décrites juste au dessus pour identifier les plus gros fichiers… et effacer les fichiers sur le serveur, pas de votre copie locale
Mutualisez les gros fichiers
Vous avez peut-être remarqué, lors des étapes précédentes, que certains fichiers apparaissent plusieurs fois. C’est notamment le cas lorsque votre site utilise plusieurs « logiciels » (CMS, blog, …) différents. Construits autour de briques OpenSource standard, ils contiennent parfois exactement les mêmes fichiers.
Le premier élément à essayer de mutualiser (ou d’éliminer…), c’est TinyMCE, l’éditeur de texte WYSIWYG. A lui seul, il occupe près de 2 Méga-Octets! Mutualiser de tels fichiers est cependant une opération complexe, qui requiert quelques connaissances techniques. Vous pouvez soit modifier le code PHP pour utiliser une seule copie de la brique opensource (ou du répertoire image, etc.), soit créer au niveau system une copie virtuelle (un lien symbolique sous Unix)… Enfin, si vous avez plusieurs blogs, envisagez d’utiliser WordPress mu plutôt que WordPress…
Maitriser la croissance de son site
Selon les critères pris en compte pour déterminer votre espace disque disponible (base de donnée MysQL, comptes email, fichiers), tâcher de vous rappeler quels sont les éléments qui sont mis à jour (ajoutés) automatiquement. Avez-vous installé (ou créé) un script de statistiques qui stocke les informations collectées dans un fichier ou une base de données?
Désactivez tous les scripts de collecte de données que vous n’utilisez plus, ou dont vous n’exploitez pas les données. Pour ceux que vous conservez, activer les limitations de taille, et/ou l’effacement automatique des anciennes données (au-delà d’un certain temps ou d’une certaine taille).
En appliquant ces règles, j’ai récupéré près de 75% de l’espace disque de mon hébergement… et vous?