Jetzt abonnieren, um Benachrichtigungen über neue Beiträge zu erhalten:

Neue Tools zur Serverüberwachung und Vermeidung von Ausfallzeiten

2019-12-11

Lesezeit: 4 Min.
Dieser Beitrag ist auch auf English, Español, und Français verfügbar.

Wenn Ihr Server ausfällt, ist das ein großes Problem. Heute stellt Cloudflare zwei neue Tools vor, mit denen Sie bei Ausfällen besser verstehen, was vorgeht, und schneller reagieren können; außerdem einen neuen Dienst, mit dem sich Ausfallzeiten automatisch vermeiden lassen.

Die neuen Features sind:

  • Standalone Health Checks, durch die Sie informiert werden, sobald wir Probleme auf Ihrem Ursprungsserver erkennen. Dafür wird kein Cloudflare Load Balancer benötigt.

  • Passive Origin Monitoring, die passive Überwachung des Ursprungsservers, durch die Sie darüber informiert werden, wann Ihr Ursprungsserver nicht erreicht werden kann. Dafür ist keine Konfiguration erforderlich.

  • Zero-Downtime Failover, das Ausfälle durch erneute Ausführung von Anfragen auf dem Ursprungsserver automatisch beheben kann.

Standalone Health Checks

Das erste neue Tool sind die Standalone Health Checks, durch die Sie informiert werden, sobald wir Probleme auf Ihrem Ursprungsserver erkennen. Dafür wird kein Cloudflare Load Balancer benötigt.

Ein Health Check ist ein Dienst, der in unserem Edge-Netzwerk ausgeführt wird und überwacht, ob Ihr Ursprungsserver online ist. Health Checks sind ein wichtiger Bestandteil unseres Lastverteilungsdienstes. Mit ihnen können wir Traffic schnell und aktiv an Ursprungsserver weiterleiten, die live und einsatzbereit sind. Mit den Standalone Health Checks können Sie den Zustand Ihres Ursprungsservers auch dann überwachen, wenn Sie nur einen solchen Ursprungsserver haben oder noch keine Lastverteilung über Ihre Infrastruktur benötigen.

Wir stellen viele Dimensionen für gezielte Überprüfungen bereit, zum Beispiel Antwortcode, Protokolltyp und Intervall. Sie können einen bestimmten Pfad angeben, wenn Ihr Ursprungsserver mehrere Anwendungen bereitstellt, oder Sie können eine größere Teilmenge der Antwortcodes für Ihre Staging-Umgebung überprüfen. Mit all diesen Optionen können Sie den Health Check gezielt konfigurieren und sich so ein genaues Bild davon verschaffen, was möglicherweise das Problem mit Ihrem Ursprungsserver ist.

Wenn einer Ihrer Ursprungsserver nicht mehr verfügbar ist, erhalten Sie eine Benachrichtigung und werden über die Zustandsänderung informiert. Sie bekommen detaillierte Informationen über den Ausfall, damit Sie Maßnahmen ergreifen und die Integrität Ihres Ursprungsservers wiederherstellen können.

Sobald Sie die Health Checks für die verschiedenen Ursprungsserver eingerichtet haben, können Sie sich auch über Trends oder die am häufigsten betroffenen Ursprungsserver informieren. Mit Health Check Analytics können Sie alle Änderungsereignisse für einen bestimmten Health Check aufrufen, Ursprungsserver isolieren, die möglicherweise besonders problematisch sind oder unterdurchschnittliche Performance aufweisen, und das Problem beheben. Darüber hinaus arbeiten wir daran, Ihnen demnächst auch Zugriff auf alle Ereignis-Rohdaten für Health Checks anzubieten. Damit bekommen Sie einen so genauen Einblick, dass Sie Protokolle der Cloudflare Health Check Events mit internen Serverprotokollen vergleichen können.

Anwender mit einem Pro, Business oder Enterprise Plan bekommen Zugriff auf Standalone Health Checks und Health Check Analytics und können damit die Zuverlässigkeit ihrer wichtigsten Anwendungen fördern und das Vertrauen ihrer Kunden in ihre Marke steigern. Sie können über die Traffic-App im Dashboard auf Standalone Health Checks und Health Check Analytics zugreifen.

Passive Origin Monitoring

Standalone Health Checks sind eine äußerst flexible Möglichkeit, das Geschehen auf Ihrem Ursprungsserver nachzuvollziehen. Sie müssen aber sorgfältig konfiguriert werden, bevor ein Ausfall tatsächlich eintritt. Deshalb bieten wir jetzt auch passive Überwachung von Ursprungsservern an. Dabei werden Sie automatisch benachrichtigt, wenn ein Problem auftritt. Es ist keine Konfiguration erforderlich.

Cloudflare weiß, wenn Ihr Ursprungsserver ausfällt, denn wir sind ja diejenigen, die ihn zu erreichen versuchen, um den Traffic weiterzuleiten! Wenn wir Ausfallzeiten feststellen, die länger dauern als ein paar Minuten, senden wir Ihnen eine E-Mail.

Ab heute können Sie Warnmeldungen für die Überwachung der Ursprungsserver konfigurieren und sie an mehrere E-Mail-Adressen senden lassen. Warnmeldungen für das Origin Monitoring sind im neuen Benachrichtigungszentrum (mehr dazu unten!) im Cloudflare-Dashboard verfügbar:

Passive Origin Monitoring steht unseren Kunden bei allen Cloudflare-Tarifen zur Verfügung.

Zero-Downtime Failover

Was könnte besser sein, als über Ausfallzeiten informiert zu werden? Wenn Ausfallzeiten erst gar nicht eintreten! Mit Zero-Downtime Failover können wir Anfragen erneut auf dem Ursprungsserver ausführen, noch bevor das Load Balancing aktiv wird.

Wie funktioniert das? Wenn eine Anfrage an Ihren Ursprungsserver fehlschlägt und Cloudflare einen weiteren Eintrag für Ihren Ursprungsserver hat, versuchen wir es einfach innerhalb derselben HTTP-Anfrage mit dem anderen Ursprungsserver. Der alternative Eintrag kann entweder ein A/AAAA-Eintrag sein, der über Cloudflare-DNS konfiguriert ist, oder ein anderer Ursprungsserver im gleichen Load-Balancing-Pool.

Nehmen wir an, für die Website example.com gibt es Webserver mit zwei verschiedenen IP-Adressen: 203.0.113.1 und 203.0.113.2. Ohne Zero-Downtime Failover läuft das so ab: wenn 203.0.113.1 nicht mehr verfügbar ist, versucht Cloudflare, eine Verbindung herzustellen; dies schlägt fehl und dem Nutzer wird letztendlich eine Fehlerseite angezeigt. Mit Zero-Downtime Failover versucht der Proxy von Cloudflare, wenn 203.0.113.1 nicht erreicht werden kann, übergangslos eine Verbindung mit 203.0.113.2 herzustellen. Wenn der zweite Server antworten kann, braucht Cloudflare dem Besucher von example.com keine Fehlermeldung zu senden.

Seit wir vor ein paar Wochen Zero-Downtime Failover eingeführt haben, konnten wir täglich Millionen fehlgeschlagener Anfragen vermeiden!

Durch die Kombination von Zero-Downtime Failover, Load Balancing, Standalone Health Checks und Passive Origin Monitoring läuft Ihre Website so reibungslos wie noch nie. Health Checks und Load Balancing können Ausfälle verhindern, es dauert aber eine gewisse Zeit, bis sie wirksam werden. Zero-Downtime Failover funktioniert ohne Verzögerung, dafür muss man aber bei jedem Verbindungsversuch zusätzliche Latenz in Kauf nehmen. In der Praxis hilft Zero-Downtime Failover zu Beginn eines Vorfalls, denn es kann Fehler unmittelbar beheben. Wenn ein Health Check ein Problem erkannt hat, kann ein Load Balancer einspringen und den Traffic sinnvoll umleiten. Und wenn kein Ursprungsserver zur Verfügung steht, senden wir über Passive Origin Monitoring eine Warnmeldung.

Schauen wir uns ein Beispiel aus der Praxis an, einen Vorfall, der kürzlich bei einem Kunden auftrat. Dieser Kunde erlebte eine Zunahme der Fehler auf seinem Ursprungsserver. Normalerweise hätte dies zu einem Einbruch der Verfügbarkeit geführt (rote Linie), aber dank Zero-Downtime Failover blieb die tatsächliche Verfügbarkeit praktisch unverändert (blaue Linie).

Im Verlauf von 30 Minuten wurde die Gesamtverfügbarkeit durch Zero-Downtime Failover von 99,53 % auf 99,98 % verbessert und es konnte für 140.000 HTTP-Anfragen eine Fehlermeldung verhindert werden.

Es ist wichtig zu beachten, dass wir nur bei solchen Anfragen, die während der TCP- oder TLS-Verbindungsphase fehlgeschlagen sind, einen erneuten Versuch machen. HTTP-Header und Nutzlast wurden zu diesem Zeitpunkt noch nicht übertragen. Dank dieses Sicherheitsmechanismus können wir Zero-Downtime Failover für Pro, Business und Enterprise Pläne als Standardeinstellung von Cloudflare verwenden. Anders ausgedrückt: Durch Zero-Downtime Failover werden Verbindungen zu Ihren Ursprungsservern zuverlässiger. Sie müssen dafür nichts unternehmen oder konfigurieren.

Demnächst: mehr Benachrichtigungen, mehr Flexibilität

Unsere Kunden wünschen sich immer umfassendere Erkenntnisse über den Status ihrer kritischen Edge-Infrastruktur. Health Checks und Passive Origin Monitoring sind für Cloudflare ein wichtiger Schritt in Richtung eines proaktiven statt reaktiven Vorgehens im Hinblick auf diese Erkenntnisse.

Um diese Arbeit zu unterstützen, machen wir das Benachrichtigungszentrum jetzt zur zentralen Anlaufstelle für Benachrichtigungen. Es ist ab sofort im Dashboard verfügbar, direkt von der Startseite Ihres Kontos aus.

Von hier aus können Sie neue Benachrichtigungen erstellen und alle vorhandenen Benachrichtigungen aufrufen, die Sie bereits eingerichtet haben. Mit der heutigen Version können Sie Benachrichtigungen für Passive Origin Monitoring konfigurieren und mehrere E-Mail-Empfänger festlegen.

Wir freuen uns darüber, dass unsere Kunden mit diesen Neuerungen Ausfallzeiten noch besser vermeiden können. Auf der Grundlage Ihrer Rückmeldungen haben wir noch weitere Verbesserungen geplant, damit Sie zeitnah die Erkenntnisse erhalten, die Sie brauchen:

  • Neue Mechanismen für die Zustellung von Benachrichtigungen

  • Weitere Ereignisse, die Benachrichtigungen auslösen können

  • Erweiterte Konfigurationsoptionen für Health Checks, einschließlich zusätzlicher Protokolle sowie Benachrichtigungen und Statusänderungen auf Basis von Schwellenwerten.

  • Weitere Möglichkeiten, Passive Health Checks zu konfigurieren, z. B. Schwellenwerte hinzuzufügen und bestimmte Statuscodes zu filtern

Wir schützen komplette Firmennetzwerke, helfen Kunden dabei, Internetanwendungen effizient zu erstellen, jede Website oder Internetanwendung zu beschleunigen, DDoS-Angriffe abzuwehren, Hacker in Schach zu halten, und unterstützen Sie bei Ihrer Umstellung auf Zero Trust.

Greifen Sie von einem beliebigen Gerät auf 1.1.1.1 zu und nutzen Sie unsere kostenlose App, die Ihr Internet schneller und sicherer macht.

Wenn Sie mehr über unsere Mission, das Internet besser zu machen, erfahren möchten, beginnen Sie hier. Sie möchten sich beruflich neu orientieren? Dann werfen Sie doch einen Blick auf unsere offenen Stellen.
InsightsAnalytics (DE)Produkt-News

Folgen auf X

Jon Levine|@jplevine
Steven Pack|@steven_pack
Cloudflare|@cloudflare

Verwandte Beiträge

24. Oktober 2024 um 13:00

Durable Objects aren't just durable, they're fast: a 10x speedup for Cloudflare Queues

Learn how we built Cloudflare Queues using our own Developer Platform and how it evolved to a geographically-distributed, horizontally-scalable architecture built on Durable Objects. Our new architecture supports over 10x more throughput and over 3x lower latency compared to the previous version....

08. Oktober 2024 um 13:00

Cloudflare acquires Kivera to add simple, preventive cloud security to Cloudflare One

The acquisition and integration of Kivera broadens the scope of Cloudflare’s SASE platform beyond just apps, incorporating increased cloud security through proactive configuration management of cloud services. ...

27. September 2024 um 13:00

AI Everywhere with the WAF Rule Builder Assistant, Cloudflare Radar AI Insights, and updated AI bot protection

This year for Cloudflare’s birthday, we’ve extended our AI Assistant capabilities to help you build new WAF rules, added new AI bot & crawler traffic insights to Radar, and given customers new AI bot blocking capabilities...