Format des fichiers de log

Choisir le bon format pour le fichier de log est tres important car c'est celui-ci qui servira de base pour extraire toutes vos statistiques. Les utilisateurs d'Apache ont le choix entre le format CLF ou ECLF, ce dernier étant plus conseillé car il permet d'obtenir des stats sur les navigateurs et les pages de provenances. Si vous utilisez un serveur sous Windows, il est possible de choisir entre le format natif de Microsoft, celui du W3C (celui par défaut) ou le CLF.

W3Perl gére ces différents formats :

  • Common LogFile
  • Extended Common LogFile
    (ajout des pages de provenances et des navigateurs/OS)
  • New Extended Common LogFile
    (ajout des serveurs virtuels et du temps d'exécution)
  • IIS 3.0 standard logfile
  • Domino logfile
  • IIS 3.0 patched logfile
    (ajout des pages de provenances et des navigateurs/OS)
  • IIS 4.0 et supérieur
  • FTP logfile
  • Sendmail/Postfix/Exim mailer logfile
  • Proxy logfile
  • RealServer logfile

Les fichiers d'erreurs des serveurs CERN, Apache, Netscape, NCSA et Domino sont supportés. Les references et les navigateurs dans un des fichiers a part sont également gérés.

De nouveaux formats peuvent être facilement ajoutés, n'hésitez pas à me contacter si tels est le cas.
Les serveurs IIS ne stockant pas les erreurs dans le fichier de log mais dans une base de donnée, ces informations ne sont pas disponibles pour W3Perl , sauf si vous choississez de stocker explicitement ces erreurs dans votre fichier de log.

CLF %host %null %login %date %hourshift %method %page %protocol %status %requetesize
www.lyot.obspm.fr - - [01/Jan/97:23:12:24 +0000] "GET /index.html HTTP/1.0" 200 1220
ECLF %host %null %login %date %hourshift %method %page %protocol %status %requetesize %referer %agent
www.lyot.obspm.fr - - [01/Jan/97:23:12:24 +0000] "GET /index.html HTTP/1.0" 200 1220 "http://www.w3perl.com/" "Mozilla/4.01 (X11; I; SunOS 5.3 sun4m)"
Microsoft %host %login %date %hour %null %null %null %null %null %requetesize %status %null %method %page
129.142.90.150, -, 5/5/97, 14:33:27, W3SVC, RHINO, 194.182.141.6, 2601, 207, 1272, 200, 0, GET, /frabout.htm, -,
W3C %hour %host %method %page %status
19:05:37 193.149.100.108 GET /images/ap.gif 304
FTP %date %transfert_time %host %requetesize %page %null %null %direction %null %login %method %null %null %status
Tue May 7 15:28:51 2002 920 mix.iap.fr 668499968 /ftp1/linux/redhat-7.3/valhalla-i386-disc1.iso b _ o a guest@unknown ftp 0 * c
RealServer %host %null %login %date %hourshift %method %page %protocol %status %requetesize %agent
62.123.125.30 - - [09/Apr/2003:16:32:10 +0200] "GET admin/xblib.js HTTP/1.0" 200 0 [Mozilla/5.0 (X11;U;Linux i686;en-US;rv:1.3a) Gecko/20021212] [] [UNKNOWN] 0 0 0 0 0 398
Squid %date %elapsed %host %codestatus %requetesize %method %page %null %peerstatus %mimetype
1042153466.411 120 4.1.200.248 TCP_REFRESH_HIT/304 258 GET http://www.voyages-sncf.com/img/seldate.gif - DEFAULT_PARENT/127.0.0.1 - ALLOW
Sendmail/Postfix %date %null %module %id %message
Jan 7 12:09:36 portal postfix/lmtp[21014]: B43F5744258: to=, relay=/var/lib/imap/socket/lmtp[/var/lib/imap/socket/lmtp], delay=1, status=sent (250 2.1.5 Ok)

Il est possible d'ajouter votre propre format avec l'aide des chaines %host,%login,%date...


Extended Common LogFile pour Apache
Si votre serveur ne fournit qu'un fichier de log au format CLF, il suffit de mofifier cette valeur dans la configuration d'Apache pour passer au format ECLF.

CustomLog logs/access_log common
devient
CustomLog logs/access_log combined

Ensuite il faut redémarrer votre serveur Apache.


back