Webalizer: Unterschied zwischen den Versionen

Aus Foxwiki
KKeine Bearbeitungszusammenfassung
KKeine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
[[Image:Bild1.png|top|alt="./webalizer_head.gif"]]


Das Programm [http://www.webalizer.org/ Webalizer] 🇬🇧 dient zur Auswertung der [https://wiki.ubuntuusers.de/Logdateien/ Logdateien], die [https://wiki.ubuntuusers.de/Serverdienste/ Webserver] auf Basis von Besucheranfragen erstellen. Die Software erzeugt Berichte im HTML-Format, die anschließend mit einem beliebigen Webbrowser betrachtet werden können. [http://www.webalizer.org/sample/ Demoseiten] 🇬🇧 zeigen beispielhaft das Ergebnis einer solchen Auswertung, die in mehr als 30 Sprachen erfolgen kann. Die konkret verwendete Sprache hängt von den [https://wiki.ubuntuusers.de/Spracheinstellungen/ Spracheinstellungen] des verwendeten Rechners ab.


Häufig kritisiert wird bei Webalizer die fehlende Auswertung von [https://de.wikipedia.org/wiki/Toter_Link 404]-Fehlern, die besonders für Webmaster und -designer interessant ist. Die beiden Projekte [http://www.patrickfrei.ch/webalizer/ Webalizer Xtended] 🇬🇧 und [http://www.stonesteps.ca/projects/webalizer/ Stone Steps Webalizer] 🇬🇧 sind Weiterentwicklungen des ursprünglichen Programms und lösen nicht nur dieses Problem.
Das Programm [http://www.webalizer.org/ Webalizer] dient zur Auswertung der [https://wiki.ubuntuusers.de/Logdateien/ Logdateien], die [https://wiki.ubuntuusers.de/Serverdienste/ Webserver] auf Basis von Besucheranfragen erstellen. Die Software erzeugt Berichte im HTML-Format, die anschließend mit einem beliebigen Webbrowser betrachtet werden können. [http://www.webalizer.org/sample/ Demoseiten] zeigen beispielhaft das Ergebnis einer solchen Auswertung, die in mehr als 30 Sprachen erfolgen kann. Die konkret verwendete Sprache hängt von den [https://wiki.ubuntuusers.de/Spracheinstellungen/ Spracheinstellungen] des verwendeten Rechners ab.


Eine Alternative zu Webalizer ist [https://de.wikipedia.org/wiki/AWStats AWStats], dessen Konfiguration allerdings um einiges komplexer ist. Noch umfangreichere Optionen zur Auswertung (u.a. eine Echtzeitanalyse) bieten die Projekte [https://goaccess.io/ GoAccess] 🇬🇧 und [https://de.wikipedia.org/wiki/Piwik Piwik].
Häufig kritisiert wird bei Webalizer die fehlende Auswertung von [https://de.wikipedia.org/wiki/Toter_Link 404]-Fehlern, die besonders für Webmaster und -designer interessant ist. Die beiden Projekte [http://www.patrickfrei.ch/webalizer/ Webalizer Xtended] und [http://www.stonesteps.ca/projects/webalizer/ Stone Steps Webalizer] sind Weiterentwicklungen des ursprünglichen Programms und lösen nicht nur dieses Problem.
 
Eine Alternative zu Webalizer ist [https://de.wikipedia.org/wiki/AWStats AWStats], dessen Konfiguration allerdings um einiges komplexer ist. Noch umfangreichere Optionen zur Auswertung (u.a. eine Echtzeitanalyse) bieten die Projekte [https://goaccess.io/ GoAccess] und [https://de.wikipedia.org/wiki/Piwik Piwik].


== Installation ==
== Installation ==
 
  # apt-get install webalizer  
  <nowiki># apt-get install webalizer </nowiki>


== Konfiguration ==
== Konfiguration ==
Webalizer ist unter Ubuntu bereits passend für den Webserver [https://wiki.ubuntuusers.de/Apache/ Apache] vorkonfiguriert, so dass man das Programm sofort einsetzen kann – vorausgesetzt, es sind Webserver-Logdateien vorhanden. Wer selbst Hand anlegen will, nimmt Änderungen über die gut dokumentierte Konfigurationsdatei '''/etc/webalizer/webalizer.conf''' vor. Zum Bearbeiten [https://wiki.ubuntuusers.de/Webalizer/#source-2 [2]] dieser Datei werden Root-Rechte [https://wiki.ubuntuusers.de/Webalizer/#source-3 [3]] vorausgesetzt.
* Um Duplikate in den Logfiles zu ignorieren, wird folgende Option gesetzt:
Incremental yes
* Verwendet man statt Apache den Server [https://wiki.ubuntuusers.de/lighttpd/ lighttpd]:
LogFile /var/log/lighttpd/access.log.1


Webalizer ist unter Ubuntu bereits passend für den Webserver [https://wiki.ubuntuusers.de/Apache/ Apache] vorkonfiguriert, so dass man das Programm sofort einsetzen kann – vorausgesetzt, es sind Webserver-Logdateien vorhanden. Wer selbst Hand anlegen will, nimmt Änderungen über die gut dokumentierte Konfigurationsdatei '''/etc/webalizer/webalizer.conf''' vor. Zum Bearbeiten [https://wiki.ubuntuusers.de/Webalizer/#source-2 [2]] dieser Datei werden Root-Rechte [https://wiki.ubuntuusers.de/Webalizer/#source-3 [3]] vorausgesetzt.* Um Duplikate in den Logfiles zu ignorieren, wird folgende Option gesetzt: <br/>Incremental    yes
* Und ein anderes Ausgabeverzeichnis (Standard: '''/var/www/webalizer/''') wird so konfiguriert:  
* Verwendet man statt Apache den Server [https://wiki.ubuntuusers.de/lighttpd/ lighttpd]: <br/>LogFile /var/log/lighttpd/access.log.1
OutputDir /var/www/www.beispiel.de/webalizer
* Und ein anderes Ausgabeverzeichnis (Standard: '''/var/www/webalizer/''') wird so konfiguriert: <br/>OutputDir /var/www/www.beispiel.de/webalizer
 
 


== Verwendung ==
== Verwendung ==
[[Image:Bild3.png|top|alt="./webalizer_statistics.jpg"]]
Das Programm besitzt keine grafische Oberfläche, sondern wird über einen [https://wiki.ubuntuusers.de/Cron/ Cronjob] regelmäßig gestartet. Bereits bei der Installation wird über die Datei '''/etc/cron.daily/webalizer''' festgelegt, dass Webalizer automatisch einmal pro Tag startet. Es werden dabei alle '''.conf'''-Dateien unter '''/etc/webalizer/''' verwendet, d.h. man kann z.B. für jeden vHost eine separate anlegen. Direkt nach der Installation und Anpassung der Konfigurationsdatei ist es sinnvoll, das Programm einmalig von Hand zu starten:
Das Programm besitzt keine grafische Oberfläche, sondern wird über einen [https://wiki.ubuntuusers.de/Cron/ Cronjob] regelmäßig gestartet. Bereits bei der Installation wird über die Datei '''/etc/cron.daily/webalizer''' festgelegt, dass Webalizer automatisch einmal pro Tag startet. Es werden dabei alle '''.conf'''-Dateien unter '''/etc/webalizer/''' verwendet, d.h. man kann z.B. für jeden vHost eine separate anlegen. Direkt nach der Installation und Anpassung der Konfigurationsdatei ist es sinnvoll, das Programm einmalig von Hand zu starten:
 
  # /etc/cron.daily/webalizer  
  <nowiki># /etc/cron.daily/webalizer </nowiki>


Die Auswertung erfolgt normalerweise inkrementell, wodurch nur neue Log-Einträge berücksichtigt werden. Weitere Informationen liefert die [https://wiki.ubuntuusers.de/man/ Manpage] zum Programm.
Die Auswertung erfolgt normalerweise inkrementell, wodurch nur neue Log-Einträge berücksichtigt werden. Weitere Informationen liefert die [https://wiki.ubuntuusers.de/man/ Manpage] zum Programm.
Zeile 34: Zeile 31:
** <tt>http://localhost/webalizer/</tt> (nur auf dem Server selbst möglich)  
** <tt>http://localhost/webalizer/</tt> (nur auf dem Server selbst möglich)  


 
=== Hinweis ===
 
=== Hinweis: ===
 
Webalizer verwendet in der Standardkonfiguration nicht die aktuelle Logdatei, sondern quasi die "vorletzte" Version. Diese Thematik wird im Artikel [https://wiki.ubuntuusers.de/Logdateien/#Logrotate Logdateien (Abschnitt „Logrotate“)] näher erläutert.  
Webalizer verwendet in der Standardkonfiguration nicht die aktuelle Logdatei, sondern quasi die "vorletzte" Version. Diese Thematik wird im Artikel [https://wiki.ubuntuusers.de/Logdateien/#Logrotate Logdateien (Abschnitt „Logrotate“)] näher erläutert.  


== Problembehebung ==
== Problembehebung ==
=== Auswertung in englisch ===
=== Auswertung in englisch ===
Wie in der Einleitung erwähnt, richtet sich die in der Auswertung verwendete Sprache nach den Spracheinstellungen. Dies führt unter Umständen zu dem unschönen Effekt, dass der manuelle Aufruf von Webalizer eine deutsche Auswertung, der automatische Aufruf über '''/etc/cron.daily/webalizer''' aber eine englische Auswertung ergibt. Falls diese Situation auftritt, sollte man die systemweiten [https://wiki.ubuntuusers.de/Spracheinstellungen/#Systemweite-nderung Spracheinstellungen (Abschnitt „Systemweite-nderung“)] überprüfen.
Wie in der Einleitung erwähnt, richtet sich die in der Auswertung verwendete Sprache nach den Spracheinstellungen. Dies führt unter Umständen zu dem unschönen Effekt, dass der manuelle Aufruf von Webalizer eine deutsche Auswertung, der automatische Aufruf über '''/etc/cron.daily/webalizer''' aber eine englische Auswertung ergibt. Falls diese Situation auftritt, sollte man die systemweiten [https://wiki.ubuntuusers.de/Spracheinstellungen/#Systemweite-nderung Spracheinstellungen (Abschnitt „Systemweite-nderung“)] überprüfen.


=== HostnameLookups aktivieren ===
=== HostnameLookups aktivieren ===
In der Monatsauswertung erscheint für die Länder (<tt>Countries</tt> oder <tt>Locations</tt>), aus denen Seiten abgerufen wurden, statt eines bunten Tortendiagramms nur ein einfarbiges mit der Aufschrift ''"unresolved/unknown (100%)"''. Dieses scheinbare Fehlverhalten liegt nicht am Webalizer, sondern ist in der Konfiguration des Webservers begründet: jede Abfrage des Hostnamens erzeugt unnötigen "Traffic" auf dem Webserver. Daher ist die Namensauflösung normalerweise abgeschaltet.
In der Monatsauswertung erscheint für die Länder (<tt>Countries</tt> oder <tt>Locations</tt>), aus denen Seiten abgerufen wurden, statt eines bunten Tortendiagramms nur ein einfarbiges mit der Aufschrift ''"unresolved/unknown (100%)"''. Dieses scheinbare Fehlverhalten liegt nicht am Webalizer, sondern ist in der Konfiguration des Webservers begründet: jede Abfrage des Hostnamens erzeugt unnötigen "Traffic" auf dem Webserver. Daher ist die Namensauflösung normalerweise abgeschaltet.


Um sie z.B. für den Webserver [https://wiki.ubuntuusers.de/Apache/ Apache] zu aktivieren, bearbeitet man mit Root-Rechten die Datei '''/etc/apache2/apache2.conf''' und ändert den Eintrag
Um sie z.B. für den Webserver [https://wiki.ubuntuusers.de/Apache/ Apache] zu aktivieren, bearbeitet man mit Root-Rechten die Datei '''/etc/apache2/apache2.conf''' und ändert den Eintrag
  HostnameLookups Off
  HostnameLookups Off
in
in
  HostnameLookups On
  HostnameLookups On


Anschließend muss der Webserver neu gestartet werden. Diese Umstellung gilt nur für neue Log-Einträge.
Anschließend muss der Webserver neu gestartet werden. Diese Umstellung gilt nur für neue Log-Einträge.


Wer zusätzliche Abfragen während des Betriebs lieber vermeiden möchte, kann auch das Hilfsprogramm logresolv verwenden, um die Adressen im Nachhinein aufzulösen. Dazu folgendes Paket installieren:
Wer zusätzliche Abfragen während des Betriebs lieber vermeiden möchte, kann auch das Hilfsprogramm logresolv verwenden, um die Adressen im Nachhinein aufzulösen.  


  '''<nowiki># </nowiki>'''sudo apt-get install apache2-utils
Dazu folgendes Paket installieren:
  # '''sudo apt-get install apache2-utils'''


=== HostnameLookups offline nutzen ===
=== HostnameLookups offline nutzen ===
Als Alternative zur oben beschriebenen Methode oder wenn die Apache-Konfiguration nicht geändert werden soll/darf, kann die Offline-Geo-Auflösung verwendet werden. Auf der Projektseite gibt es im Downloadbereich die [http://www.webalizer.org/download.html Latest Webalizer GeoDB database] ⮷ zum Herunterladen. Die Hostauflösung geschieht dann ausschließlich mit Hilfe einer lokalen Geo-Datenbank.# Datenbank herunterladen:


Als Alternative zur oben beschriebenen Methode oder wenn die Apache-Konfiguration nicht geändert werden soll/darf, kann die Offline-Geo-Auflösung verwendet werden. Auf der Projektseite gibt es im Downloadbereich die [http://www.webalizer.org/download.html Latest Webalizer GeoDB database] 🇬🇧 ⮷ zum Herunterladen. Die Hostauflösung geschieht dann ausschließlich mit Hilfe einer lokalen Geo-Datenbank.# Datenbank herunterladen: <br/>wget ftp://ftp.mrunix.net/pub/webalizer/webalizer-geodb-latest.tgz  
wget ftp://ftp.mrunix.net/pub/webalizer/webalizer-geodb-latest.tgz  
# Nach '''/usr/share/GeoDB''' entpacken: <br/>sudo tar -xzf webalizer-geodb-latest.tgz -C /usr/share/GeoDB  
# Nach '''/usr/share/GeoDB''' entpacken:  
# In der '''/etc/webalizer/webalizer.conf''' muss dann die GeoDB noch aktiviert werden: <br/>GeoDB         yes
sudo tar -xzf webalizer-geodb-latest.tgz -C /usr/share/GeoDB  
# Der korrekte Pfad zur GeoDB kann ebenfalls in der Konfigurationsdatei von Webalizer angegeben werden, oder man schaut sich die Ausgabe von <br/>webalizer -vV <br/>an, wie die Standard-Verzeichnisse lauten.
# In der '''/etc/webalizer/webalizer.conf''' muss dann die GeoDB noch aktiviert werden:  
 
GeoDB yes
 
# Der korrekte Pfad zur GeoDB kann ebenfalls in der Konfigurationsdatei von Webalizer angegeben werden, oder man schaut sich die Ausgabe von  
webalizer -vV  
an, wie die Standard-Verzeichnisse lauten.


== Links ==
== Links ==
* [http://www.webalizer.org/ Projektseite] 🇬🇧
* [http://www.webalizer.org/ Projektseite]  
* [https://de.wikipedia.org/wiki/Webalizer Webalizer] und [https://en.wikipedia.org/wiki/Webalizer Webalizer] - Wikipedia
* [https://de.wikipedia.org/wiki/Webalizer Webalizer] und [https://en.wikipedia.org/wiki/Webalizer Webalizer] - Wikipedia
* [http://mikiwiki.org/wiki/Webalizer#Wie_wird_eine_Webalizer-Statistik_gelesen.3F Wie wird eine Webalizer-Statistik gelesen?] 🇩🇪 - 08/2011
* [http://mikiwiki.org/wiki/Webalizer#Wie_wird_eine_Webalizer-Statistik_gelesen.3F Wie wird eine Webalizer-Statistik gelesen?] 🇩🇪 - 08/2011
* [http://www.programmierer-forum.de/webalizer-tuning-wie-man-die-auswertung-optimiert-t85297.htm Webalizer Tuning] 🇩🇪 - wie man die Auswertung optimiert, 01/2009
* [http://www.programmierer-forum.de/webalizer-tuning-wie-man-die-auswertung-optimiert-t85297.htm Webalizer Tuning] 🇩🇪 - wie man die Auswertung optimiert, 01/2009
* [http://www.ubuntugeek.com/webalizer-apache-web-server-log-file-analysis-tool.html Webalizer – Apache web server log file analysis Tool] 🇬🇧 - UbuntuGeek 06/2008
* [http://www.ubuntugeek.com/webalizer-apache-web-server-log-file-analysis-tool.html Webalizer – Apache web server log file analysis Tool] - UbuntuGeek 06/2008
* [http://www.beesign.com/webdesign/besucher-zaehlen.html Wie die Besucher zählen] 🇩🇪 - Webalizer, AWStats und Google Analytics im Vergleich
* [http://www.beesign.com/webdesign/besucher-zaehlen.html Wie die Besucher zählen] 🇩🇪 - Webalizer, AWStats und Google Analytics im Vergleich
* [http://t3n.de/magazin/17-tools-website-analyse-alternativen-google-analytics-222450/ 17 Tools zur Website-Analyse] 🇩🇪 - Alternativen zu Google Analytics, 10/2009
* [http://t3n.de/magazin/17-tools-website-analyse-alternativen-google-analytics-222450/ 17 Tools zur Website-Analyse] 🇩🇪 - Alternativen zu Google Analytics, 10/2009
* [https://kofler.info/web-stats-mit-goaccess/ Web-Stats mit GoAccess] 🇩🇪 - Blogbeitrag, 04/2017
* [https://kofler.info/web-stats-mit-goaccess/ Web-Stats mit GoAccess] 🇩🇪 - Blogbeitrag, 04/2017
= Problembehebung =
== Country is showing as Unresolved ==
[[File:webalizerCountryUnresolved.png|none]]
* Check webalizer config file /etc/webalizer/webalizer.conf to see if you enabled the DNSCache.
* Without DNS cache, no lookups will be made.
# https://webalizer.net/
[[Kategorie:Netzwerke:Web:Analyse]]

Version vom 27. Februar 2022, 11:42 Uhr


Das Programm Webalizer dient zur Auswertung der Logdateien, die Webserver auf Basis von Besucheranfragen erstellen. Die Software erzeugt Berichte im HTML-Format, die anschließend mit einem beliebigen Webbrowser betrachtet werden können. Demoseiten zeigen beispielhaft das Ergebnis einer solchen Auswertung, die in mehr als 30 Sprachen erfolgen kann. Die konkret verwendete Sprache hängt von den Spracheinstellungen des verwendeten Rechners ab.

Häufig kritisiert wird bei Webalizer die fehlende Auswertung von 404-Fehlern, die besonders für Webmaster und -designer interessant ist. Die beiden Projekte Webalizer Xtended und Stone Steps Webalizer sind Weiterentwicklungen des ursprünglichen Programms und lösen nicht nur dieses Problem.

Eine Alternative zu Webalizer ist AWStats, dessen Konfiguration allerdings um einiges komplexer ist. Noch umfangreichere Optionen zur Auswertung (u.a. eine Echtzeitanalyse) bieten die Projekte GoAccess und Piwik.

Installation

# apt-get install webalizer 

Konfiguration

Webalizer ist unter Ubuntu bereits passend für den Webserver Apache vorkonfiguriert, so dass man das Programm sofort einsetzen kann – vorausgesetzt, es sind Webserver-Logdateien vorhanden. Wer selbst Hand anlegen will, nimmt Änderungen über die gut dokumentierte Konfigurationsdatei /etc/webalizer/webalizer.conf vor. Zum Bearbeiten [2] dieser Datei werden Root-Rechte [3] vorausgesetzt.

  • Um Duplikate in den Logfiles zu ignorieren, wird folgende Option gesetzt:
Incremental yes
  • Verwendet man statt Apache den Server lighttpd:
LogFile /var/log/lighttpd/access.log.1
  • Und ein anderes Ausgabeverzeichnis (Standard: /var/www/webalizer/) wird so konfiguriert:
OutputDir /var/www/www.beispiel.de/webalizer

Verwendung

Das Programm besitzt keine grafische Oberfläche, sondern wird über einen Cronjob regelmäßig gestartet. Bereits bei der Installation wird über die Datei /etc/cron.daily/webalizer festgelegt, dass Webalizer automatisch einmal pro Tag startet. Es werden dabei alle .conf-Dateien unter /etc/webalizer/ verwendet, d.h. man kann z.B. für jeden vHost eine separate anlegen. Direkt nach der Installation und Anpassung der Konfigurationsdatei ist es sinnvoll, das Programm einmalig von Hand zu starten:

# /etc/cron.daily/webalizer 

Die Auswertung erfolgt normalerweise inkrementell, wodurch nur neue Log-Einträge berücksichtigt werden. Weitere Informationen liefert die Manpage zum Programm.

Das Ergebnis kann mit einem Webbrowser auf zweierlei Arten betrachtet werden:* Öffnen der Datei /var/www/webalizer/index.html

Hinweis

Webalizer verwendet in der Standardkonfiguration nicht die aktuelle Logdatei, sondern quasi die "vorletzte" Version. Diese Thematik wird im Artikel Logdateien (Abschnitt „Logrotate“) näher erläutert.

Problembehebung

Auswertung in englisch

Wie in der Einleitung erwähnt, richtet sich die in der Auswertung verwendete Sprache nach den Spracheinstellungen. Dies führt unter Umständen zu dem unschönen Effekt, dass der manuelle Aufruf von Webalizer eine deutsche Auswertung, der automatische Aufruf über /etc/cron.daily/webalizer aber eine englische Auswertung ergibt. Falls diese Situation auftritt, sollte man die systemweiten Spracheinstellungen (Abschnitt „Systemweite-nderung“) überprüfen.

HostnameLookups aktivieren

In der Monatsauswertung erscheint für die Länder (Countries oder Locations), aus denen Seiten abgerufen wurden, statt eines bunten Tortendiagramms nur ein einfarbiges mit der Aufschrift "unresolved/unknown (100%)". Dieses scheinbare Fehlverhalten liegt nicht am Webalizer, sondern ist in der Konfiguration des Webservers begründet: jede Abfrage des Hostnamens erzeugt unnötigen "Traffic" auf dem Webserver. Daher ist die Namensauflösung normalerweise abgeschaltet.

Um sie z.B. für den Webserver Apache zu aktivieren, bearbeitet man mit Root-Rechten die Datei /etc/apache2/apache2.conf und ändert den Eintrag

HostnameLookups Off

in

HostnameLookups On

Anschließend muss der Webserver neu gestartet werden. Diese Umstellung gilt nur für neue Log-Einträge.

Wer zusätzliche Abfragen während des Betriebs lieber vermeiden möchte, kann auch das Hilfsprogramm logresolv verwenden, um die Adressen im Nachhinein aufzulösen.

Dazu folgendes Paket installieren:

# sudo apt-get install apache2-utils

HostnameLookups offline nutzen

Als Alternative zur oben beschriebenen Methode oder wenn die Apache-Konfiguration nicht geändert werden soll/darf, kann die Offline-Geo-Auflösung verwendet werden. Auf der Projektseite gibt es im Downloadbereich die Latest Webalizer GeoDB database ⮷ zum Herunterladen. Die Hostauflösung geschieht dann ausschließlich mit Hilfe einer lokalen Geo-Datenbank.# Datenbank herunterladen:

wget ftp://ftp.mrunix.net/pub/webalizer/webalizer-geodb-latest.tgz

  1. Nach /usr/share/GeoDB entpacken:
sudo tar -xzf webalizer-geodb-latest.tgz -C /usr/share/GeoDB 
  1. In der /etc/webalizer/webalizer.conf muss dann die GeoDB noch aktiviert werden:
GeoDB yes
  1. Der korrekte Pfad zur GeoDB kann ebenfalls in der Konfigurationsdatei von Webalizer angegeben werden, oder man schaut sich die Ausgabe von
webalizer -vV 

an, wie die Standard-Verzeichnisse lauten.

Links