Effectieve alerting strategie visualisatie

Alerting Dat Werkt: Van Alert Fatigue naar Actionable Notificaties

Je telefoon trilt om 3 uur ’s nachts. Je checkt slaperig: “High CPU usage on node-worker-3.” Je kijkt naar de grafiek, ziet dat hij 10 minuten op 75% staat, en gaat weer slapen. Morgen, dezelfde alert. Volgende week check je niet meer. Dit is alert fatigue, en het is gevaarlijk. Als alles alert, doet niets het. Echte incidenten verdwijnen in de ruis. Ik ben aan beide kanten geweest — verdrinken in alerts, en systemen draaien waar pages zeldzaam zijn en altijd actionable. Het verschil is niet betere tools. Het is beter nadenken over wat aandacht verdient. ...

16 april 2026 · 7 min leestijd · Tom Meurs
Thanos remote write push architectuur met edge clusters

Thanos Remote Write: Push-Based Metrics voor Edge en Multi-Cluster

In mijn vorige post over Prometheus en Thanos behandelde ik de sidecar architectuur — Thanos Sidecar draait naast Prometheus, uploadt TSDB blocks naar object storage, en stelt data beschikbaar aan de Querier. Het werkt uitstekend voor clusters met stabiele connectiviteit naar je centrale infrastructuur. Maar wat als je clusters aan de edge staan? Als ze uren of dagen connectiviteit kunnen verliezen? Als je tientallen of honderden kleine clusters draait en geen sidecar complexiteit op elk daarvan wilt? ...

27 maart 2026 · 8 min leestijd · Tom Meurs
Prometheus en Thanos metrics architectuur visualisatie

Prometheus en Thanos: Metrics op Schaal

Je kunt niet fixen wat je niet kunt zien. Je kunt niet optimaliseren wat je niet kunt meten. Prometheus is de standaard voor Kubernetes metrics. Het werkt prachtig — totdat je lange-termijn opslag nodig hebt, of meerdere clusters, of hoge beschikbaarheid. Dan loop je tegen de limieten aan. Thanos breidt Prometheus uit zonder het te vervangen. Behoud je bestaande setup, voeg Thanos componenten toe, krijg onbeperkte retentie en globale queries. ...

31 augustus 2025 · 7 min leestijd · Tom Meurs