Zum Inhalt springen
Marketing Factory Digital GmbH
Kontakt
Logo Marketing Factory Digital GmbH
  • Agentur
    • Aktuelles
    • Über uns
    • Geschichte
  • Leistungen
    • Beratung, Analyse und Strategie
    • Programmierung und Entwicklung
      • Schnittstellen
      • PIM-/ERP-Anbindungen
      • Individualentwicklungen
      • Seamless CMS Integration
    • Hosting und Betreuung
      • Betrieb auf unserer Colocation-Hardware
      • Cloud-Strategien
    • Leistungen mit Dritten
  • Technologie
    • TYPO3
      • Aktuelle TYPO3-Versionen
    • Shopware
    • IT-Sicherheit
      • DDoS-Protection
      • Continuous Upgrading
      • Privacy First
    • Tech Stack
      • Bekenntnis zu Open Source
      • Technologieauswahl
      • PHP-Ökosystem
      • Containerisierung & Clustering
      • Content Delivery Networks
      • Suchtechnologien
  • Referenzen
    • Projekte
    • Kunden
      • Kundenliste
    • Screenshot der Homepage der neuen Maxion Wheels WebsiteNEU: Relaunch der Corporate Website von Maxion Wheels
  • Community
    • Community-Initiativen
  • Blog
  • Kontakt
  • Deutsch
  • English

Sie sind here:

  1. Blog
  2. AWS CloudFront Logfileauswertung in Matomo
Das Bild zeigt den Prozess der Analyse von CloudFront-Logs in Matomo. Es sind Symbole für AWS CloudFront, die Matomo-Logografie und Dokumentenverarbeitung zu sehen, die den Zusammenhang zwischen den beiden Plattformen verdeutlichen.
  • Hosting
  • Tech Stack
14.05.2025

AWS CloudFront Logfileauswertung in Matomo


AWS CloudFront Logfileauswertung in Matomo

Bei mehreren Kunden setzen wir AWSCloudFront als CDN und Reverse Proxy vor dem Webserver ein. Das beschleunigt die Auslieferung von Seiten und Assets und entlastet gleichzeitig den Webserver. Bei richtig konfigurierten TYPO3-Caches und passenden Cache-Headern erreichen wir im CDN eine Hit-Rate von bis zu 91 %. Das ist eine spürbare Entlastung für den Webserver.

Eine Auswertung der Besucher durch die Analyse der Webserver Logs mit einer entsprechenden Software ist aber bei dem Betrieb hinter einem Reverse Proxy nicht möglich: Da CloudFront vorgeschaltet ist, landen nur noch wenige Anfragen im Webserver-Log. Klassische Logfile-Analyse wird dadurch weitgehend nutzlos. Natürlich könnte man clientseitiges Tracking wie Matomo oder Google Analytics einbauen – genau das wollten wir aber aus Performance- und Datenschutz-Gründen (und weil es nicht immer nötig ist) vermeiden.

Wie können wir die Logfiles aus CloudFront in Matomo sinnvoll auswerten? 

 

AWS CloudFront bietet aktuell drei Möglichkeiten, Web-Access-Logfiles für die Requests zu erhalten. 

  1. Logfiles werden in ein S3 Bucket geschrieben
  2. RealTime Logs, die dann z.B. mittels Amazon Kinesis verarbeitet werden
  3. Lambda@Edge-Logs die an CloudWatch gesendet werden  

Wir haben uns für die klassische S3-Variante entschieden: 

 

Dabei schreibt CloudFront für jeden verwendeten Point of Presence (PoP) ein eigenes Logfile. Gut zu wissen: Die Dauer, die ein solches Log abdeckt, ist nicht festgelegt. Auch wann genau das Log im S3-Bucket abgelegt wird, verrät Amazon nicht. Nur, dass es bis zu 48 Stunden dauern kann, bis einzelne Logs im S3 Bucket sind.

Zum Glück ist die Reihenfolge der Logfiles und der Zeitpunkt der Verarbeitung bei Matomo egal. Außerdem kann Matomo die Logs von AWS Cloudfront nativ verarbeiten. 

Was jetzt noch fehlte, war ein kleines Skript, welches die Logs nacheinander aus dem S3 Bucket abholt, verarbeitet und in ein Archiv verschiebt. Um die automatische Löschung nach 30 Tagen kümmert sich die S3-Retention-Policy.

Fertig. 

 

Das Skript gibt es auf GitHub.

Patche und sogar Issues sind willkommen.

Ingo Schmitt

Spricht TypoScript, php und sql. Perl und bash verhandlungssicher; besitzt java-Grundkenntnisse. Seit 1996 dabei und mittlerweile als geschäftsführender Gesellschafter zuständig für Entwicklung und Betrieb und bloggt hier über alles, was technisch interessant und nachhaltig ist.

Weitere Beiträge dieses Autors

Blog als RSS-Feed abonnieren

Verwandte Beiträge

  • Effiziente Entwicklungsumgebungen: Warum wir Kubernetes durch Virtual Machines ersetzt haben
  • Die große Firewall – Herausforderungen beim Hosting in China
  • Domainverwaltung (2): Domainadministration im Unternehmen
  • Domainverwaltung (1): Das ideale Domain-Portfolio für Unternehmen

Wir freuen uns, wenn Ihr diesen Beitrag teilt.


Kommentare

Keine Kommentare gefunden.

Kommentar verfassen.

Ich bin darauf hingewiesen worden, dass die Verarbeitung meiner Daten auf freiwilliger Basis erfolgt und dass ich mein Einverständnis ohne für mich nachteilige Folgen verweigern bzw. jederzeit gegenüber der Marketing Factory Digital GmbH per Post (Marienstraße 14, D-40212 Düsseldorf) oder E-Mail (info@marketing-factory.de) widerrufen kann.

Mir ist bekannt, dass die oben angegebenen Daten so lange gespeichert werden, wie ich die Kontaktaufnahme durch Marketing Factory wünsche. Nach meinem Widerruf werden meine Daten gelöscht. Eine weitergehende Speicherung kann im Einzelfall erfolgen, wenn dies gesetzlich vorgeschrieben ist.

  • Datenschutzerklärung
  • Impressum

© Marketing Factory Digital GmbH

Bildnachweise
  1. Bild: Urheber / Created with DALL·E, an AI system by OpenAI