Les données log de votre serveur Web révèlent toutes sortes de choses sur l’arrière-plan et le com­por­te­ment de vos visiteurs. Ainsi une ins­pec­tion des fichiers log (que l’on nomme aussi fichiers de traces ou fichiers journaux) peut vous apporter de nom­breuses in­for­ma­tions. Par exemple le na­vi­ga­teur utilisé par l’uti­li­sa­teur, le temps passé par ce dernier sur votre site Internet ou encore le nombre de pages qu’il a consulté et enfin le moteur de recherche ou le lien qui lui a permis d’accéder à votre projet Web. C’est notamment pour cela que le fichier log est une source d’in­for­ma­tions précieuse pour vérifier l’uti­li­sa­bi­lité de votre site et pour l’op­ti­mi­sa­tion d’un projet Web. Il est cependant im­pos­sible d’analyser ma­nuel­le­ment ces données qui sont bien trop vo­lu­mi­neuses. Toutefois, Il existe plusieurs outils d’analyse de fichiers log ou ana­ly­seurs de fichiers log qui peuvent réaliser cette tâche et présenter les résultats avec des visuels et des gra­phiques. Un re­pré­sen­tant em­blé­ma­tique de ces ana­ly­seurs est l’outil open source GoAccess.

Les fon­da­men­taux de GoAccess

En juillet 2010, le dé­ve­lop­peur Gerardo Orellana a publié la première version de l’outil d’analyse de fichiers log GoAccess sur la pla­te­forme GitHub qui est cons­tam­ment développé jusqu’aujourd’hui. GoAccess peut être utilisé comme un logiciel libre sous la licence GNU et depuis 2016 sous la licence MIT et peut ainsi être librement adapté et utilisé selon les besoins. L’idée et la fonction première de GoAccess est l’analyse et la pré­sen­ta­tion visuelle de sta­tis­tiques Web en temps réel. Pour cela, l’analyseur de fichier log évalue les dif­fé­rents formats de fichiers log (ou fichiers journaux) des serveurs Web et des services de Cloud comme Apache, nginx, Amazon S3 ou Cloud­Front et affiche les résultats gra­phi­que­ment dans un tableau de bord. On peut y accéder via le système UNIX ou à partir du na­vi­ga­teur ou d’une ligne de commande. De plus, les sta­tis­tiques peuvent également être émises au format HTML, JSON ou CSV. GoAccess ne nécessite qu‘une con­fi­gu­ra­tion de système minimale et comme il est écrit en langage de pro­gram­ma­tion C, seule la bi­blio­thèque de programme C, ncurses, doit être pré­sé­lec­tion­née. Pour utiliser l’outil d’analyse de fichiers log sur un système d’ex­ploi­ta­tion Windows, vous avez besoin de la col­lec­tion d’outils Cygwin, qui est né­ces­saire pour exécuter des ap­pli­ca­tions Linux sur un système Microsoft.

Ces fonc­tion­na­li­tés qui dis­tin­guent l’outil open source

Pour utiliser GoAccess aucune con­fi­gu­ra­tion n’est requise. Il vous suffit de sé­lec­tion­ner le fichier log à analyser, de lancer l’analyse et ainsi vous pouvez vi­sua­li­ser fa­ci­le­ment les in­for­ma­tions en temps réel. Les dif­fé­rentes données sont ré­per­to­riées dans des sections in­di­vi­duelles, avec deux valeurs : une pour les périodes de mesure in­di­vi­duelles et une valeur pour l’ensemble de la période d’examen. Par défaut, ces listes sont classées par ordre chro­no­lo­gique, vous pouvez cependant les trier par le nombre de pages vues ou de visiteurs, la quantité de bande passante consommée ou le temps né­ces­saire pour charger le site Internet (total, moyenne ou maximale). Vous pouvez aussi afficher certaines valeurs dans des gra­phiques à barres ou courbes. En plus des in­for­ma­tions actuelles, GoAccess sous la rubrique « Overall Analyzed Requests » apporte un résumé de toutes les données de log évaluées jusqu’à présent.

Le terminal ainsi que le tableau de bord du na­vi­ga­teur (tous les deux en anglais) pré­sen­tent fa­ci­le­ment les dif­fé­rentes sections et dia­grammes et cela de manière intuitive afin de pouvoir très ra­pi­de­ment tirer des con­clu­sions sur les visiteurs et sur le site Web. Le tableau suivant montre les dif­fé­rents domaines que l’analyseur de fichiers log couvre et ré­ca­pi­tule les résultats et con­clu­sions que l’on peut tirer de ces valeurs.

Sections Tra­duc­tion Valeurs clefs Intérêt pour l’analyse Web.
Unique visitors per day – including spiders Les visiteurs in­di­vi­duels par jour, y compris les pro­grammes in­for­ma­tiques Appels, visiteurs, date (Data) Les visiteurs qui viennent de la même adresse IP sont perçus comme un seul visiteur. En observant le nombre de visiteurs sur une plus longue période de temps, vous pouvez dé­ter­mi­ner si les campagnes pu­bli­ci­taires et/ou un nouveau contenu sont ou non cou­ron­nées de succès.
Requested Files (URLs) Fichiers demandés (URL) Appels, bande passante, temps de char­ge­ment (Avg., Cum., Max. T.S.), URL (Data) Dans cette section, vous obtenez un aperçu des URL les plus fré­quem­ment demandées. Cela indique quelles pages de votre projet Web sont par­ti­cu­liè­re­ment po­pu­laires, combien de bande passante est consommé ainsi que la stabilité des temps de char­ge­ment des pages.
Static Requests Requêtes statiques Appels, bande passante, temps de char­ge­ment, données (Data) Comme dans la section pré­cé­dente, il s’agit des données les plus demandées, mais uni­que­ment les contenus statiques comme les images, les icônes ou les éléments de la mise en page.
Not Found URLs (404s) URL in­trou­vable (erreur 404) Appels, URL (Data) Cette section liste les URL des visiteurs qui sont con­fron­tés à une erreur 404. A l’aide de ces sta­tis­tiques, vous pouvez détecter les problèmes de réseau et corriger les liens dé­fec­tueux. Ces derniers sont en effet évalués né­ga­ti­ve­ment par les uti­li­sa­teurs et les moteurs de recherche.
Visitor Hostnames and IPs Nom d’hôte et adresse IP des visiteurs Ville, pays, nom d‘hôte, adresse IP (Data) Dans cette section vous obtenez des in­for­ma­tions sur le four­nis­seur et l’adresse IP de vos visiteurs, GoAccess délivre même des données sur le pays d’origine et l’em­pla­ce­ment. L’avantage est de présenter aux uti­li­sa­teurs un contenu plus per­son­na­lisé et ciblé. Cependant, l’obtention des adresses IP complètes et la géo­lo­ca­li­sa­tion peut être en con­tra­dic­tion avec la ju­ri­dic­tion sur la pro­tec­tion des données, notamment en Europe.
Operating Systems Système d‘ex­ploi­ta­tion appels, visiteurs, système d‘ex­ploi­ta­tion (Data) Dans cette section vous pouvez voir, triés en fonction de la fréquence, les systèmes d’ex­ploi­ta­tion utilisés par vos uti­li­sa­teurs, visiteurs. Ceci est notamment in­té­res­sant pour calculer le volume du trafic mobile.
Browsers Na­vi­ga­teur Appels, visiteurs, na­vi­ga­teur (Data) Cette section présente les types d’accès des clients, visiteurs. Vous pouvez voir tout d’abord le volume des dif­fé­rents na­vi­ga­teurs, mais aussi par exemple si des robots ont parcouru votre site Internet.
Time Dis­tri­bu­tion Dis­tri­bu­tion tem­po­relle des appels Appels, visiteurs, temps de char­ge­ment, heures (Data) Pour avoir un aperçu du trafic en fonction des heures. Ainsi vous pouvez savoir à quelle période vos uti­li­sa­teurs sont le plus actif et ainsi ajuster la pu­bli­ca­tion de campagnes pu­bli­ci­taires ou de nouveaux contenus.
Virtual Hosts Hôtes virtuels Appels, bande passante, Hôtes (Data) Si vous exécuter plusieurs serveurs virtuels (domaines, adresses IP) sur votre serveur Web, vous pouvez utiliser ces sta­tis­tiques pour filtrer les res­sources de votre serveur et voir celles qui sont ac­ca­pa­rées.
Referrers URLs Référent URL Appels, URL (Data) Le référent est une in­for­ma­tion sur l’URL de vos visiteurs qui apparait dans le fichier log. Vous pouvez utiliser cette sta­tis­tique pour filtrer les pages par­te­naires fortes et pour connaitre quels sont les mots-clés rédigés par le visiteur dans un moteur de recherche pour arriver sur vos pages.
Referring Sites Sites référents Appels, adresse Web(Data) Con­trai­re­ment à la sta­tis­tique pré­cé­dente, vous n’obtenez pas l’URL, mais l’adresse Web du site d’origine.
Key­phrases from Google’s search engine Mots-clés et termes de recherche utilisés par le moteur de recherche Google Appels, mots-clés,(Data) GoAccess fournit en plus des sta­tis­tiques de référents, une liste distincte des requêtes de recherche, au moins pour Google. Cela vous évite de réaliser le fas­ti­dieux travail d’éva­lua­tion des URL référents. Les résultats présentés ici con­tri­buent beaucoup à votre stratégie des mots-clés.
Geo Location Géo­lo­ca­li­sa­tion Visiteurs, origine (Data) Sous la section « Geo Location », vous trouverez l’al­lo­ca­tion précise des adresses IP à l’em­pla­ce­ment géo­gra­phique du système de l’uti­li­sa­teur. La question de la con­fi­den­tia­lité des données se pose aussi pour ces sta­tis­tiques, comme pour le nom de l‘hôte et l’IP de l’uti­li­sa­teur. (nécessite aussi GeoIP par MaxMind)
HTTP Status Codes Liste des codes HTTP Appels, liste des codes (Data) Cette rubrique affiche une vue d’ensemble des réponses de votre serveur. Vous pouvez voir si votre serveur Web fonc­tionne cor­rec­te­ment et vous pouvez récupérer tout le contenu sans erreur.

Comment installer et utiliser GoAccess ?

Pour être certains d’installer la dernière version de GoAccess, nous vous re­com­man­dons de té­lé­char­ger le fichier d’ins­tal­la­tion di­rec­te­ment à partir du site Web officiel. Té­lé­char­gez et installez la version avec la ligne de commande suivante:

$ wget http://tar.goaccess.io/goaccess-1.0.tar.gz
$ tar -xzvf goaccess-1.0.tar.gz
$ cd goaccess-1.0/
$ ./configure --enable-utf8
$ make
# make install

N’oubliez pas que ncurses est requis pour les fonc­tion­na­li­tés de l’analyseur de log Apache et nginx et doit être installé sur votre système avec la dernière version. Si ce n’est pas déjà fait, vous pouvez con­fi­gu­rer la bi­blio­thèque C avec le code suivant :

$ wget http://ftp.gnu.org/pub/gnu/ncurses/ncurses-5.7.tar.gz
$ tar xzf ncurses-6.0.tar.gz
$ cd ncurses-6.0
$ ./configure --prefix=/opt/ncurses
$ make
# make install
$ ls -la /opt/ncurses

Un aperçu détaillé des options de con­fi­gu­ra­tion de l’outil d’analyse de fichiers log est dis­po­nible en anglais dans le manuel.

Aller au menu principal