Der Fehler, der heute dazu führte, dass 1.1.1.3 LGBTQIA+ Websites blockierte

Heute haben wir einen Fehler gemacht. Dieser Fehler führte dazu, dass der neue Dienst 1.1.1.1 for Families ungewollt eine Reihe von LGBTQIA+ Websites blockierte. Hier möchte ich durchgehen, was passiert ist, warum es passiert ist, und was wir getan haben, um den Fehler zu beheben.

In den letzten drei Jahren haben wir es uns zur Tradition gemacht, an jedem 1. April neue Produkte für private Verbraucher einzuführen. In diesem Jahr war eines dieser Produkte ein gefilterter DNS-Dienst, 1.1.1.1 for Families. Mit diesem Dienst können Nutzer bestimmte Kategorien von Websites einschränken.

Gefiltertes vs. ungefiltertes DNS

Der neue gefilterten DNS-Dienst ändert nichts an dem ursprünglichen ungefilterten 1.1.1.1-Dienst. Wir haben jedoch erkannt, dass einige Nutzer nach einer Möglichkeit suchen, die Inhalte auf ihren privaten Geräten zu kontrollieren. Ich selbst blockiere zum Beispiel die Auflösung von Social-Media-Seiten, wenn ich mich auf meine Arbeit konzentrieren will, weil ich dadurch produktiver arbeite. 1.1.1.1-Nutzer hatten vor allem eine Bitte an uns: eine Version des Dienstes für den privaten Gebrauch zu Hause, um bestimmte Website-Kategorien zu blockieren. Wir haben auf die Bitte unserer Nutzer reagiert. Vor ein paar Stunden startete 1.1.1.1 for Families.

Nach und nach werden wir den Nutzern von 1.1.1.1 for Families die Möglichkeit geben, die blockierten Kategorien punktgenau anzupassen (z. B. wie ich Social-Media-Seiten blockiere, um Produktivität zu erhöhen). Für den Anfang haben wir jedoch zwei Standardeinstellungen erstellt. Sie beziehen sich auf die Arten von Inhalten, die Nutzer am häufigsten blockieren wollen: Malware (die Sie blockieren können, indem Sie 1.1.1.2 und 1.0.0.2 als Ihre DNS-Resolver einstellen) und Malware + jugendgefährdende Inhalte (die Sie blockieren können, indem Sie 1.1.1.3 und 1.0.0.3 als Ihre DNS-Resolver einstellen).

Lizenzierte Kategorisierungsdaten

Um Daten für 1.1.1.1 for Families zu erhalten, haben wir Feeds von mehreren Providern lizenziert. Es handelt sich dabei um Provider, die sich auf die Kategorisierung von Websites spezialisiert haben. Wir haben die letzten Monate damit verbracht, die Klassifizierungsanbieter zu überprüfen, um diejenigen auszuwählen, die die höchste Genauigkeit und die geringsten falsch-positive Ergebnisse aufweisen.

Man ist sich weitgehend einig darüber, welche Cyber-Sicherheitsbedrohungen die Kategorie „Malware“ umfassen. Von den beiden, war es war also die einfachere Kategorie. Was jugendgefährdende Inhalte angeht, wollten wir die SafeSearch-Kategorien von Google übernehmen. Google hat in diesem Bereich gute Arbeit geleistet; und das Google-SafeSearch-Tool ist so konzipiert, dass es die Suchergebnisse für „sexuell explizite Inhalte“ einschränkt. Die Definition konzentriert sich auf Pornografie und folgt weitgehend den Anforderungen des US-amerikanischen „Children's Internet Protection Act“ (CIPA), dem Gesetz, das Schulen und Bibliotheken in den USA zum Schutz von Kindern befolgen müssen.

Da es der Standard für den 1.1.1.3-Dienst war und da wir für die Zukunft geplant haben, dass Nutzer ihre eigenen Spezifikationen über die Standardeinstellung hinaus festlegen können, wollten wir die Kategorie „jugendgefährdende Inhalte“ enger fassen. Was wir nicht in die Kategorie „jugendgefährdende Inhalte“ aufnehmen wollten, waren Inhalte rund um LGBTQIA+. Doch zu unserem Entsetzen wurde uns nach dem Start gemeldet, dass diese Seiten herausgefiltert wurden.

Falscher Feed ausgewählt

Was ist schiefgelaufen? Die Data Provider, von denen wir Inhalte lizenzieren, arbeiten mit unterschiedlichen Kategorisierungen. Diese Kategorisierungen sind zwischen den Providern nicht perfekt abgestimmt. Einer der Provider hat mehrere Kategorien von „jugendgefährdenden Inhalten“. Eine der Kategorien umfasst Inhalte, die die Google SafeSearch/CIPA-Definition widerspiegeln. Eine weitere Inhaltskategorie „jugendgefährdender Inhalte“ umfasst eine breitere Palette von Themen, einschließlich Websites rund um LGBTQIA+.

Wir haben wir die Kategorie „jugendgefährdende Inhalte“ speziell überprüft, um sicherzustellen, dass sie eng auf die SafeSearch von Google/CIPA-Definition zugeschnitten ist. Aber bei der Veröffentlichung der Produktionsversion heute Morgen haben wir dennoch die falsche Kategorie „jugendgefährdender Inhalte“ aufgenommen. Infolgedessen wurde bei den ersten 1.1.1.3-Nutzern eine breitere Palette von Websites gefiltert als ursprünglich beabsichtigt, darunter auch Inhalte zum Thema LGBTQIA+. Wir haben dieses Problem sofort behoben.

Langsame Aktualisierung von Datenstrukturen

Um die Liste der Sites schnell an alle unsere Rechenzentren zu verteilen, verwenden wir eine kompakte Datenstruktur. Das Gute daran ist, dass wir die Datenstruktur weltweit sehr effizient replizieren können. Der Nachteil ist, dass es mehrere Stunden dauert, eine neue Version der Datenstruktur zu generieren. Sofort nachdem wir unseren Fehler bemerkten, nahmen wir den falschen Data Provider heraus und begannen mit der Replizierung einer neuen Datenstruktur.

Während die neue Datenstruktur in unserem Netzwerk repliziert wurde, haben wir einzelne Sites direkt auf eine Zulassungsliste gesetzt. Die Listen entstanden anhand von Nutzerberichten und anderen Quellen zum Thema LGBTQIA+. Diese Updates gingen sofort raus. Wir fügten der Zulassungsliste kontinuierlich neue Seiten hinzu, sobald sie uns gemeldet wurden oder wir welche entdeckten.

Um 16:51 UTC, etwa zwei Stunden, nachdem wir den ersten Bericht über die irrtümliche Sperrung erhalten hatten, war die Datenstruktur mit der richtigen Definition von jugendgefährdenden Inhalten generiert worden und ging raus. Die einzigen Nutzer, die von der zu breiten Blockierung betroffen waren, sind diejenigen, die den 1.1.1.3-Dienst bereits aktiviert hatten. Nutzer von 1.1.1.1 – das weiterhin ungefiltert bleiben wird – und Nutzer von 1.1.1.2 waren von dieser unbeabsichtigten Blockierung nicht betroffen.

Ab jetzt ist die Filterung durch die Standardeinstellung von 1.1.1.3 so, wie wir es ursprünglich beabsichtigt haben. Sie sollte ungefähr dem entsprechen, was Sie über Google SafeSearch finden. Seiten rund um LGBTQIA+ werden nicht blockiert. Wenn Sie bemerken, dass eine Website fälschlicherweise blockiert wird, melden Sie uns dies bitte hier.

https://report.teams.cloudflare.com/

Zukünftiger Schutz

Für die Zukunft haben wir eine Reihe von Überprüfungen bekannter Sites eingerichtet, die nicht in die vorgesehenen Kategorien fallen sollten, darunter viele, die wir heute fälschlicherweise aufgelistet haben. Bei den zukünftigen Aktualisierungen der Standardeinstellungen wird unser Build-System bestätigen, dass keine dieser Sites aufgeführt ist. Wir hoffen, dass dies dazu beitragen wird, Fehler wie diesen in Zukunft zu vermeiden.

Ich entschuldige mich für den Fehler. Ich verstehe zwar, wie es passiert ist, aber es hätte niemals passieren dürfen. Ich danke unserem Team dafür, dass es so schnell auf unseren Fehler reagiert hat.

Der Cloudflare-Blog

Der Fehler, der heute dazu führte, dass 1.1.1.3 LGBTQIA+ Websites blockierte

Gefiltertes vs. ungefiltertes DNS

Lizenzierte Kategorisierungsdaten

Falscher Feed ausgewählt

Langsame Aktualisierung von Datenstrukturen

Zukünftiger Schutz

Countdown für die Olympische Spiele 2024 in Paris: Frankreich in Sachen Web-Interesse führend

Empieza la cuenta atrás para los Juegos Olímpicos de París 2024: Francia lidera el interés digital

Compte à rebours avant Paris 2024 : la France se distingue en termes d'intérêt sur le web

2024 年第二季網際網路中斷摘要