Configuration

 
Cette page a pour but à vous aider à générer votre propre fichier de configuration. Si vous disposez d'un serveur Web, je vous recommande fortement d'utiliser l'interface d'adminstration qui vous permettra de fabriquer un fichier de configuration pas à pas.
En premier lieu, il est préférable d'utiliser un fichier de configuration fourni en exemples. Plusieurs sont disponibles dans le répertoire /config/ ou dans C:\Program Files\W3Perl\ pour les gens sous Windows.

Ne commenter aucune variable. Si vous ignorez quelle valeur donnée, il est préférable de ne rien toucher, les valeurs par défaut étant le plus souvent le mieux adaptées.

 
Platforme

 
 
Dans cette premiere partie, seule la variable
- $type_serveur
a besoin d'être changée selon votre OS.
Evitez de modifier les autres variables.

Système
$type_serveur OS sur lequel W3Perl va fonctionner
Valeur Commentaire
0 Unix
1 Windows
2 Lotus Domino

 
Logfiles

 
 

- $logfile_format
Il faut ici définir quels types de fichier de configuration votre serveur utilise. Si vous n'y connaissez rien dans ce domaine, il suffit d'extraire quelques lignes de votre fichier de log et de le comparer avec ces quelques lignes.

Les personnes utilisant un serveur IIS sous Windows ont le choix entre :

  • format IIS format
  • format W3C format (défaut)
  • format CLF format
A noter que les variations du format W3C sont automatiquement détectées par W3Perl.

Format
$struct_logfile Definition du format
Valeur Commentaire
%host %null %login %date %hourshift %method %page %protocol %status %requetesize Common Log File
%host %login %date %hour %null %null %null %null %null %requetesize %status %null %method %page IIS
%hour %host %method %page %status W3C
%date %transfert_time %host %requetesize %page %null %null %direction %null %login %method %null %null %status FTP

- $struct_logfile
Si vous n'avez rien changer dans la configuration de votre serveur, il faut indiquer ici la définition du format de log utilisé. If you have changed the default value from your server configuration Voir ici pour les valeurs possibles.

- $struct_compressed_logfile
Il faut ici indiquer a quoi ressemble le nom de vos fichiers de log. La liste des mots-clés est disponible ici.

Nom des fichiers de log
$struct_compressed_logfile Définition du nom
Valeur Commentaire
%year.%month.%day.%prefixlog ex : 1998.03.20.access_log
%prefixlog ex : access
%prefixlog.%year-%lettermonth.log ex : access.2006-Mar.log

- $date_format
Les utilisateurs de serveur IIS doivent spécifier quel format de date ils utilisent car celui-ci est tres variable suivant les versions de IIS.
Si vous avez opter pour le format IIS, utilisez %day%month%year
Si vous avez opter pour le format par défaut W3C, laissez ce champ vide car la date n'est pas stockée dans le fichier de log , mais si vous avez ajouter le stcokage de la date dans le fichier de log, il vous faudra utiliser ceci %year%month%day
Si vous utilisez une version plus vieille que la 5.1, il faut alors lancer l'interface d'administration de IIS et regardez par vous-même quel est le format de date utilisé.

- $virtualfilter and $virtualCLF
Si vous utilisez un seul fichier de log pour plusieurs sites web, le champ 'virtual host' est alors inclus dans le fichier de log, qui permet de séparer par la suite les requêtes pour les differents sites Web.
    - NECLF (New Extended Common Log File)
    Le champ 'virtual host' est stocké comme un champ à part

    Une ligne de votre fichier de log ressemble à :
    server.freshmeat.com - - [01/Jan/97:23:12:24 +0000] (www.iap.fr) "GET /fr/docs/config.html HTTP/1.0" 200 1220 "http://www.w3perl.com/" "Mozilla/5 (X11; I; Linux)"
    pc202.club-internet.fr - - [01/Jan/97:23:12:24 +0000] (www.obspm.fr) "GET /index.html HTTP/1.0" 200 1220 "http://www.w3perl.com/" "Mozilla/4.01 (X11; I; SunOS)"
    où www.obspm.fr et www.iap.fr sont les virtual hosts.

    Selectionnez $virtualfilter = "www.obspm.fr" pour ne prendre en compte que ce domaine et rejetez tous les autres.

    - CLF (Common Log File)
    Choississez $virtualCLF = 1 si votre champ virtual host est caché dans un format de log Common Log File comme ceci :
    server.freshmeat.com - - [01/Jan/97:23:12:24 +0000] "GET http://www.iap.fr/fr/docs/config.html HTTP/1.0" 200 1220 "http://www.w3perl.com/" "Mozilla/5 (X11; I; Linux)"

- $retrieve_external_log
Mettez la valeur à 1 et les fichiers de log seront télécharger depuis un serveur distant.
    Les informations suivantes doivent alors être renseignées :
    Variable Description Commentaire
    $wget_bin le chemin où se trouve wget wget est installé par défaut avec W3Perl pour Windows
    $wget_user le compte utilisateur distant Si vos fichiers sont dans un espace protégé
    $wget_pass le mot de passe associé au compte utilisateur Si vos fichiers sont dans un espace protégé
    $wget_host_log Le nom du site distant Le nom du site distant où se trouve les fichiers de log
    $wget_host_port Le port du site distant La valeur par défaut est de 80 pour un site Web
    $wget_host_dir Le chemin sur la machine distante répertoire où se situe les fichiers de log
 
Chemin

 
 

- $path
Le chemin de sortie où les fichiers seront crées. Peut se situer n'importe où. Il faut juste vérifier que W3Perl est capable d'écrire dans ce répertoire.
(Ex : $path = "/export/home/www/htdocs/w3perl/")

- $pathinit
Le chemin du répertoire d'installation de W3Perl (où le package a été installé).
(Ex : $pathinit = "/export/home/www/htdocs/w3perl/")

- $pathserver
Le chemin où se situe les fichiers html de votre serveur
(Ex : $pathserver = "/export/home/www/htdocs/")

- $linkpathserver
Le chemin relatif où vos fichiers html sont présents.
De manière générale $linkpathserver vaut / à l'exception des pages personnelles
(Ex : $linkpathserver = "/")

- $cgipath
Le chemin où se situe votre répertoire cgi-bin
Si vous ne disposez pas d'un tel répertoire, ne changez rien.
(Ex : $cgipath = "/export/home/www/cgi-bin/")

- $fileroot
Le chemin où se trouve les fichiers de log
(Ex : $fileroot = "/export/home/www/apache/logs/";

- $prefixlog
Le nom de vos fichiers de log (situé dans $fileroot). Si vous avez des fichiers découpés, il faut donner la partie constante ('access' pour 'access.200610.gz')
en g7eacute;néral 'access_log' pour un serveur NCSA, 'httpd-log' pour un serveur CERN, Les personnes sous Windows peuvent avoir 'ex' pour le format W3C (valeur par défaut pour IIS), 'in' pour le format IIS (IIS) ou 'nc' pour le format CLF
(Ex : $prefixlog = "access_log")

- $referlog
Le nom de vos fichiers de log de reference (situé dans $fileroot)
si vous ne disposez pas de tel fichier, laissez une valeur vide.
(Ex : $referlog = "referer_log")

- $agentlog
Le nom de vos fichiers de log d'agent OS/navigateurs (situé dans $fileroot)
si vous ne disposez pas de tel fichier, laissez une valeur vide.
(Ex : $agentlog = "agent_log")

- $errorlog
Le nom de vos fichiers de log d'erreurs (situé dans $fileroot)
si vous ne disposez pas de tel fichier, laissez une valeur vide.
(Ex : $errorlog = "error_log")

- $FLY
Le chemin de votre utilitaire Fly
Ce logiciel convient d'être installé au préalable
(Ex : $FLY = "/usr/local/bin/fly" sous Unix ou $FLY = "C:/Progra~1/W3Perl/fly.exe" pour Windows)

- $GZIP
Le chemin de votre outil gzip
Executez 'whereis <command>' ou 'which <command>' pour connaitre ce chemin.
N'effacez pas l'option '-dc' !
(Ex : $GZIP = "/opt/bin/gzip -dc" sous Unix ou $GZIP = "D:/bin/unzip" sous Windows)

 
Filtrages

 
 

- $localserver
Nom de votre serveur WWW
(Ex : $localserver = "www.orstom.fr")

- $tri
Utilisez '/' pour tout scanner. Sinon entrez une URL et seules les URL qui contiendront votre valeur seront scannées. Tres utile pour ne scanner qu'une partie de votre site Web. (Ex : $tri = "/subdirectory/")

- $country_filtering
Pour rejeter certains pays. Il faut utiliser les extensions internet pour les pays
(Ex : $contry_filtering = ".com" pour exclure toutes les machines de .com)

- $nolog
Pour exclure certaines machines ou domaines de machines
(Ex : @nolog = ('194.51.174','.grolier.') va exclure 194.51.174.* et toutes les machines de grolier)

- @selection
Pour obtenir des statistiques tres précises sur certaines pages ... évitez d'en mettre trop !
(Ex : @selection = ('/raydream/index.html'))

- @selecrepert
Sélection de sous-répertoires pour des stats graphiques. Le niveau de profondeur dans l'arborescence doit être identique. En général les principaux sous-répertoires.
(Ex : @selecrepert = ('/raydream/','/astro/'))

- @excluderepert
Pour exclure certains sous-répertoires.
(Ex : @excluderepert = ('/private/'))

- $precision
Configure le niveau de précision souhaité. la valeur par défaut est 3
(Ex : $precision = 1 à 4)

- $locallog
Pour avoir des stats sur son domaine local également.
(Ex : $locallog = 1 pour activer les stats sur son domaine local)

- $localonly
Pour n'avoir QUE sont domaine local
(Ex : $locallog = 1 ne génerera des stats QUE pour le domaine local)

- $zip
Mettre à 1 si on utilise des fichiers de log compressés.
(Ex : $zip = 0 pour des fichiers non compressés ou $zip = 1 pour des fichiers compressés)

- $zipcut
Si vos fichiers de log sont en plusieurs morceaux. Valeur de '1' pour un découpage mensuel, '2' pour des fichiers de log quotidien, ou '3' pour utiliser la rotation des logs d'apache
(Ex : $zipcut = 0 signifie qu'il n'y a qu'un seul fichier de log)

- Seuillage
    - $topten
    N'affiche que les $topten meilleurs fichiers
    (Ex : $topten = 10)

    - $seuilpage
    N'affiche que les fichiers ayant plus de $seuilpage requêtes.
    Cela permet de ne pas avoir des pages de résultats trop long. (Ex : $seuilpage = 100)

    - $seuilsite
    N'affiche que les sites ayant plus de $seuilsite requêtes.
    (Ex : $seuilsite = 9 affiche les sites avec plus de 10 requêtes)

    - $seuilscript
    N'affiche que les fichiers ayant plus de $seuilscript requêtes.
    (Ex : $seuilscript = 5 affiche les scripts avec plus de 5 acces)

    - $seuilrepert
    N'affiche que les fichiers ayant plus de $seuilrepert requêtes.
    (Ex : $seuilrepert = 0 pour afficher tous les répertoires)

- $optdirsize
Type de graphes pour le trafic sur les répertoires
1-2-3 html uniquement (total, externe, domain)
4-5-6 tous les fichiers (total, externe, domain)
(Ex : $optdirsize = 4 affiche le trafic externe et interne pour les fichiers HTML, GIF...)

- $nbdays
Nombre de jours affiché pour le graphe de stats quotidiennes (0 pour une année)
(Ex : $nbdays = 50)

- $virtualserver
Selection d'un serveur virtuel si on utilise le format NECLF
(Ex : $virtualserver = "www.detector.com")

- $defaulthomepage
Nom de la page par défaut de votre serveur Web
(Ex : $defaulthomepage = "index" (défaut))

- $titlename
Permet de convertir les URL des fichiers en leur titre
(Ex : $titlename = 1 si activé)

- $localdomaine
Ajouter ici les adresses IP de votre domaine local (si ces machines n'ont pas de résolution DNS)
(Ex : $localdomaine = "$localdomainename|^145\.238\.44\.[4567]" permet d'associer les adresses IP 145.238.44.4 à 7 au domaine local)

- $mailadr
Votre adresse email si des utilisateurs veulent vous contacter.
Si certaines personnes veulent vous contacter pour rajouter certaines de leur page dans la liste des pages avec un maximum de précision
(Ex : $mailadr = "webmaster\@hplyot.obspm.fr")

- $tildealias
Votre alias pour accéder aux répertoires de vos comptes utilisateurs
(Ex : $tildealias = "public_html" ou "www")

- $yellowfile
Si vous utilisez un serveur NIS pour votre intranet
(Ex : $yellowfile = "" n'utilise pas le services des yellow page)

- $reverse_dns
Permet la conversion d'une adresse IP en nom de machine (ATTENTION : tres lent !!!)
(Ex : $reverse_dns = 1 pour activer la résolution DNS)

- @extension et @extensionimage
Definit quels sont les extensions que W3Perl va reconnaitre

Extensions à parser
@extension Selection des extensions a prendre en compte
Valeur Commentaire
('html','htm','shtml') fichiers html
('html','htm','shtml','php','php3') fichier html et php
('html','php') fichier html et php uniquement
('rm','ra','smi','smile','ram') fichier d'un serveur realserver
@extensionimage Selection des extensions a prendre en compte
Valeur Commentaire
('gif','jpg','jpeg') images gif et jpeg uniquement
('jpg','gif','png') images gif, jpg et png

 
Display

 
 

- @homepages
Le nom des fichiers de sortie pour chaque langue.
Il est impératif d'avoir le même nombre d'éléments que dans @lang. Le fichier par défaut est la page index
(Ex : @lang = ('index','index-fr') pour une page en anglais et français, la première étant celle par défaut.)

- @lang
Choix de vos langues de sortie. Il faut utiliser le nom du pays des extensions internet, cf liste dans le fichier resources/lang/
(Ex : @lang = ('uk','fr') pour une sortie en anglais et français)

- $frame_updown
Choix entre des frames verticales ou horizontales
(Ex : $frame_updown = 1 donnera des frames horizontales)

- $topframelinks
Configure de votre liens hypertext dans la frame du haut
(Ex : $topframelinks = "My_server")

- $bargraph (Histo) , $tridim (Histo 3D) , $linegraph (lignes) , $fillgraph (lignes pleines)
Mettez à 1 quel type de graphes vous souhaitez utiliser
(Ex : $tridim = 1 pour des graphes avec histogramme 3D)

- People without CSS
    - $custom_text
    Couleur hexadécimale du texte
    (Ex : $custom_text = "#000000" pour noir)

    - $custom_link
    Couleur hexadécimale pour les liens
    (Ex : $custom_link = "#000080")

    - $custom_vlink
    Couleur hexadécimale pour les liens visités
    (Ex : $custom_vlink = "#800000")

    - $bgcolor
    Couleur du fond
    (Ex : $bgcolor = "#FFFFFF" pour un fond blanc)

- $background et $backgrd
Si vous préférez utiliser une image de fond
Placez votre image dans le répertoire /w3perl/resources/ en la renommant paper_background.jpg
(Ex : $background = "background.gif" et ensuite $backgrd = "BACKGROUND=\"$background\"")

 
Scripts

 
 
-  Quels scripts utilisés
Pour activer, mettre la valeur à '1'.
$actif_inc pour les stats incrémentales
$actif_real pour les stats temps-réel.
$actif_hour pour les stats sur les heures.
$actif_day pour les stats quotidiennes.
$actif_week pour les stats hebdomadaires.
$actif_month pour les stats mensuelles.
$actif_agent pour les stats sur les navigateurs/OS.
$actif_refer pour les stats sur les references.
$actif_session pour les stats sur les sessions.
$actif_error pour les stats sur les erreurs.
$actif_history pour les stats sur l'utilisation CPU de W3Perl.
$actif_url pour les stats sur vos documents Web.

Les scripts susceptibles d'être désactivés sont url, session, history, error et real. Il est conseillé de laisser les autres actifs..

-  Quand effectuer les mises à jour
Indiquer le nombre de jour entre deux lancements d'un script. Une valeur de '1' correspond à un lancement quotidien. $url_launch, $week_launch peuvent être mis à une semaine : '7'. $month_launch est utile pour une valeur de '30'.

-  Quand lancer les stats

  back