2. Activité du stage

Cet article fait parti de la série Audit réseau avec Webtrends. Article 4 sur 7.

2.1 Introduction

Cette partie exposera les principales activités qui ont rythmé mon stage durant deux mois. Elle sera présentée en trois parties :

La première partie traitera du stage en lui-même. Elle énoncera les points de départ de mon stage et plus particulièrement la mission et les objectifs à atteindre.

Le second sera un descriptif du travail effectué pendant ces deux mois. Nous y trouverons les différentes tâches réalisées durant le stage.

Enfin, dans une troisième partie, je présenterai le travail rendu.

2.2 Mon stage à la CCI

2.2.1 Le contexte de stage

2.2.1.1 Les rapports humains

Ceux-ci ont été exemplaires durant tout le stage. En effet, je n’ai rencontré aucune difficulté pour m’intégrer au sein du service dans la mesure où les employés ont tous l’habitude d’accueillir des stagiaires. De plus, l’ambiance décontractée et appliquée qui règne est des plus motivantes. Elle m’a permis d’assimiler les fonctionnements internes assez rapidement.

De plus, les employés sont tous sympathiques et proposent régulièrement de l’aide qui s’est avérée parfois précieuse et éclairée.

Tout est ici réuni pour permettre aux informaticiens de travailler en toute quiétude.

2.2.1.2 Les rapports avec la direction

Ceux-ci furent agréables et bien organisés. Ce fut essentiellement des rendez-vous qui avaient pour but d’évaluer l’ampleur de la tache dans un premier temps, puis de faire un suivi du travail effectué. Ils permettaient à chaque fois de recadrer ou de préciser certains points afin de rendre le travail plus efficace.

Ces entrevues ont été pour moi une source d’information très importante pour la qualité du travail à rendre car elles permettaient à tout moment de révéler les détails qui en fin de compte constituèrent le cœur de la tâche.

2.2.2 La mission de stage

2.2.2.1 Énoncé

Mettre en place un système informatique capable de générer des statistiques d’utilisation du site Intranet de la CCI. Ces statistiques seront destinées d’une part à la direction informatique et d’autre part à différents élus et directeurs de la chambre.

2.2.2.2 Précisions concernant la mission

Durant les premiers jours de stage, la mission s’est peu à peu précisée. Elle allait se dérouler en trois parties distinctes :

1) Le choix de l’outil n’ayant pas encore été fait au début, il fallait réaliser une réelle étude de cas pour déterminer l’orientation à prendre.

Les solutions étaient au nombre de trois :

  • développer une application ou un ensemble de scripts,
  • acheter un logiciel adapté à ce genre de calcul statistique,
  • recourir à une solution interne parmi les logiciels déjà présents.

2) Ensuite, il fallait effectuer une série de tests préalables sur la solution choisie afin de pouvoir exploiter au maximum ses capacités.

3) Enfin, mettre en place le système au cœur du système informatique de la chambre.

2.2.2.3 Les objectifs à atteindre

Lors des premières entrevues avec Mr T. et Mr N., nous avons pu définir ensemble les objectifs réels escomptés. Mr N. avait déjà défini quelques priorités.

Dans un premier temps, le plus important était de pouvoir évaluer l’utilisation d’une certaine partie du site Intranet concernant la Gestion de la Relation Client (G.R.C) de la CCI. Cette partie était dénommée E-racine et contenait des logiciels et autres pages contenant des informations concernant les relations de la chambre avec ses administrés (les entreprises du département). Les utilisateurs peuvent par exemple gérer des documents en lignes, faire des modifications dans des listes, …. Nous verrons plus tard que cette partie du site n’est pas hébergée sur le serveur Lotus Domino mais sur un autre serveur HTTP (Microsoft IIS).

Ensuite, il fallait pouvoir générer deux types de statistiques différentes : Des statistiques très techniques, destinées aux informaticiens et développeurs du site, et par ailleurs des statistiques plus accessibles destinées aux membres et directeurs de la CCI.

Enfin, étendre le domaine des statistiques à l’ensemble de l’Intranet, afin d’obtenir une information complète. Les statistiques E-racine devaient tout de même être démarquées par rapport au reste.

2.3 Le travail réalisé

2.3.1 L’étude de cas : Audience d’un Intranet

2.3.1.1 Définition d’une audience web

Une audience web est un ensemble de statistiques, graphiques et tableaux présentant chacun un aspect de l’ensemble des visites sur le site en question. Elle permet de mettre en évidence certaines caractéristiques d’un site web :

  • les pages les plus / moins populaires,
  • le temps passé sur certaines pages,
  • les erreurs des serveurs ou des visiteurs,
  • etc. …

Deux techniques d’audience s’affrontent :

  • les systèmes de statistiques à distance (intégration d’un module dans le code html permettant de compter (hits) des évènements de même nature),
  • les analyses de fichiers logs générés par les serveurs web (fichiers textes dont les lignes formatées correspondent aux événements sur les pages hébergées).

2.3.1.2 Les solutions proposées

Comme nous l’avons dit précédemment, la réalisation de la mission nécessitait au préalable une étude de cas. Celle-ci visait à déterminer la meilleure solution logicielle pour l’audience de l’Intranet de la CCI. Les objectifs étaient clarifiés très tôt : les statistiques demandées devaient être précises et proches de la réalité. Il fallait une solution adaptée et optimisée pour obtenir des chiffres représentatifs du trafic sur l’Intranet.

Trois solutions étaient envisageables pour cela :

La solution ‘développement’ :
Cette solution était donc très envisageable car elle présentait deux avantages majeurs : le coût et la précision. En revanche, elle demandait un travail important, très suivi et relativement long. Il se posait également la question de la maintenance du code.

La solution ‘achat de logiciel’ :
Là encore, l’option était envisageable mais dépendait de plusieurs critères : le coût du produit, la flexibilité de celui-ci, le service après vente, …

De plus, il fallait que le produit soit adaptable au système informatique de la CCI.

La solution ‘interne’ :
La direction informatique avait déjà en sa possession un ensemble d’outils d’audience informatiques de la suite Webtrends. Il fallait alors déterminer si les logiciels déjà achetés pour d’autres utilisations n’étaient pas suffisants pour de telles études d’audiences.

2.3.1.3 Le choix

Il s’en est suivi une période de recherche d’information sur Internet afin de me documenter et de pouvoir choisir la solution la plus adaptée.

Solution 1 :
Concernant la première solution, il était clair que le langage utilisé serait de type script (Javascript ou VBScript) à intégrer dans une technologie de type PHP ou ASP. Ayant déjà utilisé de l’ASP lors d’un stage antérieur, la solution paraissait bonne. En revanche, elle impliquait une modification de chaque page du site !

En effet, celle-ci aurait nécessité l’utilisation de ‘compteur d’accès’ (variable globale qui s’incrémente à chaque événement web sur la page concernée). Le travail aurait été considérable car le nombre de page de l’Intranet est relativement important.

De plus, lors d’une réunion, j’ai appris que l’Intranet allait être en partie refondu et mis à jour durant le mois de septembre. Si j’avais dû ainsi retravailler chaque page pour qu’elles soient par la suite supprimées ou remodelées, le travail n’aurait pas porté ses fruits …

Il aurait alors fallut penser à une solution plus généraliste, qui aurait pu être reprise ensuite par les développeurs web de la CCI.

Solution 2 :
Cette seconde solution était la moins plausible. En effet, les outils d’audience que l’on peut trouver sur Internet peuvent être classés en trois catégories :

  • Les freewares, logiciels gratuits ou peu coûteux ne garantissant pas une grande précision ni une flexibilité suffisante (le jeu de statistiques et les options sont insuffisants).
  • Les logiciels payant, mieux adaptés mais dont les prix sont très variables (150€ à 15000€), offraient pour certain de bon compromis mais il n’y avait aucune certitude quant à leur utilisation. De plus, un logiciel de ce type avait déjà été acheté par la chambre mais n’était pas encore (ou peu) utilisé.
  • Les services de société web spécialisées dont les tarifs pouvaient être parfois très importants. Cette solution est techniquement difficile à mettre en œuvre car l’Intranet n’est bien évidemment accessible qu’en local. Or de tels services passent en général par une connexion de type HTTP sur le web !

Avant d’envisager cette hypothèse, il fallait déterminer les possibilités déjà présentes. La troisième solution serait donc analysée avant.

Solution 3 :
La direction informatique (DI) avait en sa possession un ensemble de logiciels de la société Netiq, de la gamme Webtrends spécialisée dans l’étude d’audience. Parmi eux, le logiciel Webtrends for Lotus Domino v5.5 avait été acheté pour établir quelques statistiques très simples concernant ce même Intranet.

A l’époque de l’achat, La partie E-racine de l’Intranet n’existait pas. Il s’agissait donc de savoir si ce logiciel déjà acheté permettrait de générer les statistiques escomptées.

Nous nous sommes rendu compte que Webtrends était un outil tout à fait adapté à nos besoins et répondait à beaucoup de nos exigences :

  • Coût peu élevé (déjà acheté pour moins de 10.000fr, soit ~1500€),
  • Nombre d’option et possibilité de configuration impressionnantes (plus de 70 graphiques différents),
  • Compatibilité avec le matériel déjà installé (conçu pour le type de serveur HTTP utilisé par la CCI)

Toutes ces premières informations nous ont orientés vers cette solution.

2.3.2 Webtrends, l’outil principal du stage

Pour bien comprendre comment fonctionne ce logiciel, il faut d’abord comprendre la notion de fichier logs(appelés aussi fichiers journaux ou log file).

2.3.2.1 Les fichiers logs

Définition :
Tous les serveurs industriels peuvent créer des journaux (fichiers) documentant les appels effectués. Ces logs se trouvent en fait sur tous les types de serveur. Le contenu et le format des logs varient naturellement avec le type de serveur et peuvent aussi éventuellement être désarmés ou paramétrés par l’administrateur du serveur. Trop de logs dégrade la performance du serveur et pas assez rend la détection d’anomalies difficile, voir impossible.

Il se trouve qu’en ce qui concerne les logs de serveurs HTTP (qui nous intéressent ici), il existe une norme, qui est celle d’Apache, légèrement modifiés par IIS (Internet Information Serveur de Microsoft).

Nous présenterons le détail d’un fichier log un peu plus loin mais il contient à l’évidence des informations:

  • de date et d’heure,
  • sur le serveur (son adresse),
  • sur la requête (adresse du visiteur, type de requête, durée, page demandée).

Nous employons ici le terme de requête pour désigner tous les évènements qui se déroulent sur le site web hébergé par notre serveur. Ce peut être un clic sur un lien, un changement de page, une erreur 404, le téléchargement de données, etc. …

Un fichier log se présente sous la forme d’un fichier texte classique dont les lignes sont formatées de la manière suivante (Il existe une trentaine de formats différents mais seul l’ordre des paramètres suivant diffère de l’un à l’autre ) :

  • l’adresse IP de celui qui a effectué la requête,
  • le nom de l’utilisateur. Ce champ n’est documenté que pour les sites exigeant que l’utilisateur s’identifie, ce qui n’est pas le cas de notre site,
  • la date,
  • l’heure,
  • le service,
  • le nom du serveur,
  • l’URL du serveur,
  • le temps écoulé,
  • les octets reçus,
  • les octets envoyés,
  • le code de statut HTTP de la requête,
  • le code de statut NT,
  • referrer: Indique les infos de clicks sur le lien spécifié,
  • la méthode (GET par exemple),
  • la page visée,
  • les autres paramètres.

Exemple d’une ligne d’un fichier log :
10.1.1.44, -, 09/07/02, 08:56:51, W3SVC1, CONTACT, 10.1.1.226, 94, 463, 121, 304, 0, GET, /eracines/logBAS.htm, -,

Toutes les données présentes dans cette ligne de code seront utiles pour l’élaboration de l’analyse statistique.

Quelle est leur utilité ?

Voici quelques exemples d’interprétation de tels fichiers :

Les indicateurs de tendance :

Les données stockées dans les logs permettent dans un premier temps de comptabiliser les utilisateurs du site. Ceci est réalisable par l’utilisation de simples compteurs à incrémentations (scripts serveurs CGI de type VBScripts ou javascripts). Mais cette solution n’est pas forcément sûre car les incrémentations peuvent ne pas avoir lieu selon l’emplacement des pages HTTPs.
Les logs offrent une information stable et systématique  !

Les statistiques par page :

Ces statistiques peuvent indiquer qu’une page web n’est pas ou peu visitée et donc peut faire l’objet d’une restructuration ou d’une suppression. Elles conduisent souvent à des restructurations.

Le cheminement dans les pages :

Ces statistiques peuvent indiquer que 35 % des internautes ne dépassent pas le second click. Il semble donc fondamental que la première page soit pertinente. Le log peut fournir ici une information précieuse. Il est ainsi possible de regrouper les utilisateurs par ensemble de pages visitées : les utilisateurs qui téléchargent beaucoup, ceux qui visitent l’ensemble du site, ceux qui s’attardent sur les textes, …

Les accès aux pages webs :

Grâce à certaines statistiques, il est possible aussi de savoir si les utilisateurs peuvent accéder aux diverses pages que propose le site en question. Prenons pour exemple un site commercial de grande envergure proposant sur ses pages un applet java permettant la visualisation de produits en trois dimensions. Si les chiffres de leurs logs permettent de déduire que seulement 40% des visiteurs du site peuvent visualiser cet applet, c’est que celui-ci n’est absolument pas adapté. Et ces informations prennent alors tout leur sens.
Les logs prennent ici un intérêt économique, logistique et graphique pour le webmaster ou les commerciaux de la société qui les utilise.

2.3.2.2 Webtrends, outil d’audience de site web

Qu’est ce que Webtrends ?
WebTrends « Enterprise suite » est un outil permettant de surveiller le trafic et les consultations d’un serveur web, et d’en tirer des statistiques. Il est basé sur l’analyse des fichiers logs, dont les caractéristiques sont celles décrites précédemment.

WebTrends produit des rapports d’audience très détaillés, par consultation et par utilisateur. Cela représente globalement plus de 70 tableaux et graphiques. À noter qu’on peut facilement éditer ces rapports de synthèse : ils sont créés au format html, Word, Excel ou texte.

Parmi les questions auxquelles répond l’application:

  • Combien de visiteurs mon site reçoit-il quotidiennement ?
  • Quel chemin empruntent-ils à travers le site ?
  • D’où se connectent-ils ?
  • Quels sont les utilisateurs les plus actifs ?
  • Comment se répartissent les visites par heure et par jour de la semaine ?
  • Quelles sont les pages les plus populaires ?
  • Quels sont les navigateurs et les systèmes d’exploitation utilisés par les visiteurs ?

Autre atout de WebTrends: sa flexibilité. On peut indiquer au logiciel de ne traiter qu’une partie d’un fichier log. On peut ainsi préciser la période à auditer : par exemple la dernière semaine, le dernier mois, etc.

Fonctionnement de webtrends :
Le fonctionnement de Webtrends est assez simple et permet une flexibilité accrue des statistiques produites. Il permet de faire plusieurs types d’analyses parmi :

  • Analyse du trafic web,
  • Analyse du trafic sur le serveur proxy,
  • Analyse du trafic sur le serveur de média,
  • Analyse des contrôles, alertes et rétablissements d’erreurs,
  • Analyse des liens hypertextes et contrôle de qualité .

Dans notre cas, nous n’avions besoin que de l’analyse du trafic web mais les autres options seront certainement utilisées ultérieurement lors de la refonte du service Intranet .

Pour ce faire, il  utilise des objets qui lui sont propres et qui définissent l’ensemble des caractéristiques des statistiques que l’on veut faire apparaître dans le rapport d’audience.

Ces objets sont les ‘profiles’ et les ‘reports’. Ils sont configurables à l’aide des options et du Scheduler.

Les profiles

Ce sont les objets qui vont permettre de définir :

  • L’emplacement des fichiers logs à analyser,
  • Le type de fichiers logs à analyser (Webtrends (WT) est capable de le détecter automatiquement),
  • L’adresse de la page d’accueil du site à analyser,
  • Les éventuels serveurs proxy à franchir,
  • L’utilisation (ou pas) des Fastrends Databases (1) pour une catalyse des opérations.

(1) Ce sont des bases de données interne à WT qui stockent les données récupérées dans les logs. Cela permet de limiter les accès à ceux-ci et donc de catalyser les opérations.

La définition d’un profile est bien entendue indispensable à l’élaboration d’un rapport d’audience.

Les reports

Ces objets sont les plus importants et font la renommée du logiciel. Ils permettent de spécifier tous les détails qui permettront au rapport d’analyse de prendre forme. C’est en quelque sorte le squelette du rapport d’audience.

Lors de la définition d’un report, on peut attribuer les caractéristiques suivantes :

  • Période de l’étude (le mois en cours, le dernier mois, les quinze derniers jours, …),
  • Le format du rapport à générer (HTML, document Word, document Excel, …),
  • Le répertoire, l’adresse ftp ou le mail de destination du rapport,
  • Le style (langue, style graphique et titre sont au choix)
  • La liste des statistiques à fournir (parmi 70 choix dont l’énumération est en annexe)

Pour créer une analyse, il faut obligatoirement un report associé à un profile :

Rapport webtrends

Les reports sont eux même paramétrables grâce aux options .

Les options

Il existe plusieurs options qui définissent chacune un aspect important du rapport final. Ces options sont regroupées par type d’analyse. Celles qui sont décrites ici concernent l’analyse du trafic web. L’ensemble des options de WT permettent de :

  • déterminer la durée limite des sessions des utilisateurs (au delà, la session est considérée comme terminée),
  • renommer des pages dont le titre n’est pas significatif,
  • déterminer des groupes de pages qui engloberont un ensemble de pages HTML sous un nom générique,

La connaissance et la maîtrise de ces options est capitale pour pouvoir utiliser le logiciel à ‘plein régime’.

Les scheduled events

Ce sont les tâches planifiées de Webtrends. Le logiciel peut générer une analyse, l’enregistrer ou l’envoyer par mail et ce sans avoir besoin de démarrer l’interface.

Il faut pour cela créer une tache planifiée (scheduled event) en précisant :

  • l’heure et la date de début de tâche,
  • la période de renouvellement (la tâche s’effectuera tous les X jours),
  • le répertoire, l’adresse ou le mail de destination du rapport d’audience,
  • le profile souhaité,
  • le report souhaité,
  • éventuellement :
  • le programme ou la routine à démarrer avant le début de la tache planifiée,
  • le programme ou la routine à démarrer après le début de la tache planifiée.

Cet outil est très pratique et permet par exemple de ne pas surcharger la CPU du serveur (ou l’ordinateur qui héberge WT) en programmant une heure d’exécution tardive (00h00 par exemple).

2.3.2.3 Intérêts de Webtrends pour la mission

De nombreux logiciels proposent des outils d’analyse des logs. Certains en domaine public, en source, d’autres commerciaux. Toute la gamme allant du gratuit au très cher (15000 €).

Comme nous l’avons dis plus haut, Les avantages de Webtrends sont le prix (environs 1200 €), abordable pour les entreprises,  mais surtout ses capacités. Il donne un nombre incroyable de chiffres en les structurant très lisiblement. Il est donc complet, ce qui fait son succès auprès des entreprises.

Dans notre cas, les besoins statistiques étaient doubles. Je devais pouvoir générer deux analyses statistiques différentes.

La première était destinée au service informatique lui-même. Elle devait contenir toutes les informations utiles et nécessaires aux développeurs, aux administrateurs réseaux et aux informaticiens en général. Cette analyse devait donc être tout à fait complète et orientée de manière à détailler au plus les statistiques utiles.

Par exemple, les classements de pages web par ordre de préférence devaient contenir beaucoup de références et devaient s’accompagner de chiffres très précis s’adressant à des personnes pouvant rechercher une information très technique.

En revanche, la seconde s’adressait plutôt à certaines personnes de la chambre telles que les dirigeants , les chefs de services et les chefs de projet. Ces personnes ne sont pas forcément réceptives à toutes les informations techniques. Ainsi, les chiffres proposés par mes statistiques devaient être clairs, perspicaces et surtout accessibles à tous. La précision du paramétrage logiciel était donc très importante.

Ces deux perspectives nous ont donc conduit à choisir Webtrends.

Voici un extrait de la liste des statistiques extractibles à partir de Webtrends pour des fichiers logs classiques :

Statistiques générales
Graphique des sessions des utilisateurs
Tableau statistiques générales
Ressources utilisées
Graphique et tableau des pages les plus populaires
Graphique et tableau des pages dynamiques et formulaires
Graphique et tableau des pages d’entrées
Graphique et tableau des pages de sorties
Graphique des répertoires les plus visités
Graphique et tableau des fichiers le plus souvent demandé
Graphique et tableau des types de fichiers le plus souvent demandés
Publicité
Graphique et tableau des publicités présentées
Graphique et tableau des clics sur les publicités
Visiteurs et démographie
Graphique et tableau du nombre d’utilisateurs par fréquence de visite
Graphique et tableau des visiteurs nouveaux ou anciens
Graphique et tableau des visiteurs les plus actifs
Statistiques d’activité
Graphique et tableau Statistiques d’activités par incrément de temps
Graphique et tableau de temps moyen de desserte de documents
Graphique et tableau de desserte des pages dynamiques et formulaires
Statistiques techniques
Graphique et tableau des statistiques techniques
Référents et recherche
Graphique et tableau des sites référents le plus souvent
Graphique et tableau des principaux services de recherche
Graphique et tableau des expressions cherchées
Navigateurs et plates-formes
Graphique et tableau des navigateurs les plus populaires
Graphique et tableau des plates-formes les plus utilisées

2.3.3 Le travail rendu

2.3.3.1 L’aide mémoire pour Webtrends log analyser for lotus domino v5.5

Durant ces deux mois, le travail effectué fût essentiellement de la recherche, de la prise d’information, de la configuration (test et version définitive) et de l’installation .

Dans ce contexte, le travail papier rendu s’est limité à la rédaction d’un document d’aide rédigé tout au long du stage. Ce document avait pour fonction de présenter les points essentiels de Webtrends afin de permettre à mes supérieurs de modifier si nécessaire la configuration du logiciel.

En effet, durant ces deux mois, j’ai été amené à maîtriser parfaitement ce logiciel pour en exploiter les moindres possibilités. Ainsi, j’ai rédigé ce document d’aide adapté à l’utilisation de Webtrends par le service informatique.

Dans ce document, je présente les points importants de configuration du logiciel ainsi que son fonctionnement général. Ce document se trouve en annexe. Il permettra à Mr N, par exemple, de changer une option de configuration ou de rajouter un report différent. Et cela sans avoir besoin de lire (et traduire !) le manuel d’utilisation de a à z, celui-ci étant lourd et difficile à exploiter. Ce document se veut avant tout pratique et optimisé pour permettre des interventions plus rapides et efficaces.

J’y ai également regroupé toutes les réponses aux questions que l’on peut se poser ainsi que les solutions des problèmes les plus courants.

2.3.3.2 L’installation et la configuration du logiciel

Cela a été pour moi la tâche la plus aisée du stage dans la mesure où la longue phase de test et l’étude qui l’avait précédée m’avait assurée le bon déroulement de celle –ci.

Configuration :
La configuration du logiciel devait permettre d’obtenir les résultats suivants :

  • Accès à deux types de statistiques : des statistiques abordables, facile à interpréter et des statistiques plus complètes pour le service informatique lui-même ;
  • Mise en avant de stats concernant l’utilisation de la partie Eracine de l’Intranet par ses visiteurs ;
  • Possibilité de mise à jour fréquente des chiffres publiés ;

Comme nous l’avons dit précédemment, Webtrends était l’outil idéal. Pour répondre aux exigences ci-dessus, j’ai utilisé une grande partie des ressources du logiciel.

Tout d’abord, nous avons décidé (lors des réunions) d’éditer quatre analyses d’audience :

  • La première est un rapport léger et accessible montrant globalement les caractéristiques de l’utilisation d’Eracine. Entre autre, il donne un classement des pages les plus visitées (regroupées par thèmes) et des statistiques classiques telles que la durée moyenne des sessions utilisateurs.
  • La seconde est du même type mais qui s’intéresse au reste du site Intranet.
  • Enfin, les deux autres analyses traitent respectivement des deux thèmes évoqués ci-dessus mais rentrent dans les détails et offrent des chiffres plus concrets et plus nombreux. Ils sont utiles notamment aux développeurs web.

J’ai donc créé deux profiles correspondants aux deux répertoires contenant les fichiers logs qui nous intéressaient :

  • Le profile Eracine permet de récupérer l’ensemble des fichiers logs IIS par un protocole ftp (client FTP interne à Webtrends) vers les Fastrends databases du logiciel (mémoire cache nommée Fastrends Databases).
  • Le profile Domino permet quant à lui de copier simplement les logs Lotus dans les bases internes.

De même, il m’a fallu créer quatre reports, un pour chaque analyse détaillée précédemment. Ils différent par leur nom et leur contenu.

Vous trouverez en annexe la liste des statistiques présentes dans ces rapports .

Installation :
Physiquement, les fichiers logs concernant Eracine et le reste du site ne sont pas situés sur le même serveur. En effet, la partie Eracine du site est essentiellement applicative et constituée d’exécutables. La DI a donc stocké ces applications sur un autre serveur que le serveur web Domino qui héberge la majeure partie du site.

Il fallait donc trouver une solution simple qui permettrait à Webtrends d’effectuer ses tâches le plus rapidement possible. Pour cela, nous avons adopté la solution suivante.

Fonctionnement Webtrends

Sur le schéma ci-dessus, nous pouvons voir le transit des informations qui circulent pour cette installation. Il s’agit des étapes qui rythment la fabrication d’un rapport d’analyse donné. Elles sont au nombre de quatre :

Etape 1 et 2  : Il s’agit de récupérer les informations contenues dans les journaux IIS sur le serveur domino. Cette étape ne s’effectue qu’une fois par mois (pour les rapports concernant Eracine) et est commandée par Webtrends. En fait, WT récupère les données et les stocke dans ses bases de données internes. Ainsi, si les tâches ultérieures demandent le même support d’information (même fichiers logs sur la même période), le logiciel n’aura pas à refaire un transfert. Il ira automatiquement chercher l’information en local.

Etape 3  : Elle correspond au traitement des données par le logiciel. Il utilise les informations contenues dans ses bases internes et en tire des statistiques. Il les organise ensuite sous forme de rapports pré-formatés par les doublons profile – report (préalablement configurés) et passe à l’étape suivante.

Etape 4  : Webtrends enregistre les rapports sur un répertoire prédéfini qui va être utilisé par l’Intranet (au format HTML). Ceux–ci seront en accès sécurisé.

Nous avons choisi d’utiliser quatre scheduled events correspondants aux quatre rapports souhaités. Nous les avons programmés pour être générés en fin mois (tout les trente jours).

2.4 Conclusion

Cette section du rapport s’achève par la description de l’installation effectuée en fin de stage sur le serveur Lotus Domino de la DI. Comme cela est montré ici, elle n’a été qu’une petite partie de la mission mais répond à l’ensemble des espérances de début de stage.

En effet, la qualité des rapports d’audience de Webtrends est exempte de tout reproche. Le logiciel en lui-même est remarquable par sa flexibilité et son nombre d’option. En revanche, il faut un certain temps pour maîtriser l’ensemble de ses possibilités et un stage de deux mois n’était pas de trop pour mener à bien cette mission.

L’étude de cas a montré que l’analyse d’audience de site web est un domaine très vaste dans lequel il est facile de faire fausse route . Pour choisir une solution vraiment adaptée aux besoins, il faut étudier et parfois tester plusieurs solutions avant de pouvoir en implanter une dans un SI.

Mais la solution est parfois à portée de mains …

Navigation dans les chapitres<< 1. Présentation de la CCI3. Bilan général : de l’IUT à la CCI >>

Laisser un commentaire