AI Security for Apps ya está disponible para todos

La solución AI Security for Apps de Cloudflare detecta y mitiga las amenazas a las aplicaciones con IA. Hoy queremos anunciar que ya está disponible para todos.

Hemos añadido nuevas funciones, como la detección de temas personalizados, y ahora el servicio de detección de puntos finales que utilizan IA es gratuito para todos los clientes de Cloudflare — incluidos aquellos con planes gratuito, Pro y Business — para que todos puedan ver dónde está implementada la IA en sus aplicaciones conectadas a Internet.

También anunciamos una mayor colaboración con IBM, que ha elegido a Cloudflare para ofrecer seguridad basada en IA a sus clientes de servicios en la nube. Además, nos hemos asociado con Wiz para ofrecer a nuestros clientes comunes una visión global de su estado de seguridad basada en IA.

Un nuevo tipo de superficie de ataque

Las aplicaciones web tradicionales tienen operaciones definidas, como consultar el saldo bancario o hacer una transferencia. Puedes escribir reglas determinadas para proteger esas interacciones.

Las aplicaciones y los agentes basados en IA son diferentes. Aceptan el lenguaje natural y generan respuestas impredecibles. No hay un conjunto fijo de operaciones para permitir o denegar, porque los datos de entrada y los resultados son probabilidades. Los atacantes pueden manipular los modelos de lenguaje de gran tamaño (LLM) para realizar acciones no autorizadas o filtrar datos confidenciales. La inyección de instrucciones, la divulgación de información confidencial y el consumo ilimitado son solo algunos de los riesgos que figuran en la lista de los 10 principales riesgos de OWASP para aplicaciones de LLM.

Estos riesgos aumentan a medida que las aplicaciones de IA se convierten en agentes. Cuando una herramienta de IA tiene acceso a operaciones en las que se procesan reembolsos, se modifican cuentas, se aplican descuentos o se accede a datos de clientes, una sola instrucción maliciosa se convierte inmediatamente en un incidente de seguridad.

Los clientes nos cuentan a qué se enfrentan. "La mayoría de los equipos de Newfold Digital están implementando sus propias medidas de seguridad para la IA generativa, pero todo el mundo está innovando tan rápido que, tarde o temprano, es inevitable que surjan algunas deficiencias", afirma Rick Radinger, arquitecto principal de sistemas en Newfold Digital, que opera Bluehost, HostGator y Domain.com.

Qué hace AI Security for Apps

Hemos creado AI Security for Apps para solucionarlo. Se integra con tus aplicaciones basadas en IA, tanto si utilizas un modelo de terceros como si alojas el tuyo propio, como parte del proxy inverso de Cloudflare. Te ayuda a (1) detectar aplicaciones basadas en IA en tu propiedad web, (2) detectar comportamientos maliciosos o fuera de la política en esos puntos finales, y (3) mitigar las amenazas mediante el conocido creador de reglas WAF.

Discovery, ¡ya es gratis para todos!

Antes de que puedas proteger tus aplicaciones basadas en LLM, debes saber dónde se utilizan. A menudo, los equipos de seguridad nos comentan que no tienen una visión completa de las implementaciones de IA en sus aplicaciones, sobre todo ahora que el mercado de los LLM está en constante evolución y los desarrolladores van cambiando de modelos y proveedores.

AI Security for Apps identifica automáticamente los puntos finales basados en LLM en tus propiedades web, independientemente de dónde estén alojados o de cuál sea el modelo. A partir de hoy, esta función es gratuita para todos los clientes de Cloudflare, incluidos aquellos con planes gratuito, Pro y Business.

^{Página del panel de control de Cloudflare con los activos web, en la que se muestran dos puntos finales de ejemplo etiquetados como}^cf-llm

La detección automática de estos puntos finales requiere algo más que la coincidencia de patrones de ruta comunes como /chat/completions. Muchas aplicaciones basadas en IA no tienen una interfaz de chat. Piensa, por ejemplo, en la búsqueda de productos, las herramientas de valoración inmobiliaria o los motores de recomendación. Hemos desarrollado un sistema de detección que analiza cómo se comportan los puntos finales, no cómo se llaman. Para identificar con confianza los puntos finales que utilizan IA, se requiere suficiente tráfico válido.

Los puntos finales que utilizan IA que se hayan detectado serán visibles en Seguridad → Activos web, etiquetados como cf-llm. Para los clientes con el plan gratuito, la detección de puntos finales se inicia la primera vez que accedes a la página Discovery. Para los clientes con un plan de pago, la detección se produce automáticamente en segundo plano de forma recurrente. Si se han detectado puntos finales basados en IA, puedes revisarlos inmediatamente.

Detección

Las detecciones de AI Security for Apps siguen el enfoque siempre activo para el tráfico a tus puntos finales que usan IA. Cada instrucción se ejecuta a través de varios módulos de detección para la inyección de instrucciones, la exposición de información de identificación personal y temas sensibles o tóxicos. Los resultados — ya sea que la instrucción fuera maliciosa o no — se adjuntan como metadatos que puedes usar en reglas WAF personalizadas para aplicar tus políticas. Buscamos constantemente formas de aprovechar nuestra red global, que registra el tráfico de aproximadamente el 20 % de la web, para detectar nuevos patrones de ataque en millones de sitios web antes de que lleguen al tuyo.

Disponibilidad general: Detección de temas personalizados

El producto incluye detección integrada de amenazas comunes: inyecciones de instrucciones, extracción de información de identificación personal y temas peligrosos. Sin embargo, cada empresa tiene su propia definición de lo que está prohibido. Una empresa de servicios financieros podría necesitar detectar conversaciones sobre valores específicos. Una empresa del sector sanitario podría necesitar marcar las conversaciones que traten sobre datos de pacientes. Un minorista puede querer saber cuándo los clientes preguntan por productos de la competencia.

La nueva función de temas personalizados te permite definir estas categorías. Tú especificas el tema, nosotros inspeccionamos la instrucción y emitimos una puntuación de relevancia que puedes utilizar para registrar, bloquear o gestionar como prefieras. Nuestro objetivo es crear una herramienta adaptable que se ajuste a tus necesidades.

^{Puntuación de relevancia de la Instrucción dentro de AI Security for Apps}

Disponibilidad general: Extracción de instrucciones personalizadas

AI Security for Apps aplica medidas de seguridad antes de que las instrucciones no seguras puedan llegar a tu infraestructura. Para ejecutar las detecciones con precisión y proporcionar protección en tiempo real, primero debemos identificar las instrucciones dentro de la carga malintencionada de la solicitud. Las instrucciones pueden estar en cualquier lugar del cuerpo de una solicitud, y los diferentes proveedores de LLM estructuran sus API de forma diferente. OpenAI y la mayoría de los proveedores utilizan $.messages[*].content para las sugerencias de chat. La API por lotes de Anthropic integra las solicitudes dentro de $.requests[*].params.messages[*].content. Tu herramienta de valoración de propiedades personalizada podría utilizar $.property_description.

Desde el primer momento, admitimos los formatos estándar utilizados por OpenAI, Anthropic, Google Gemini, Mistral, Cohere, xAI, DeepSeek, entre otros. Cuando no podemos hacer coincidir un patrón conocido, aplicamos una postura segura por defecto y ejecutamos la detección en todo el cuerpo de la solicitud. Si la carga malintencionada contiene campos que son sensibles pero que no se envían directamente a un modelo de IA, esto puede provocar falsos positivos. Por ejemplo, un campo como $customer_name junto con la indicación real podría activar la detección de datos de identificación personal de forma innecesaria.

En breve, podrás definir tus propias expresiones JSONPath para indicarnos exactamente dónde encontrar la instrucción. De este modo, se reducirán los falsos positivos y las detecciones serán más precisas. También estamos desarrollando una función de aprendizaje de instrucciones que se adaptará automáticamente a la estructura de tu aplicación con el tiempo.

Mitigación

Una vez identificada y puntuada una amenaza, puedes bloquearla, registrarla o proporcionar respuestas personalizadas, utilizando el mismo motor de reglas WAF que ya utilizas para el resto de la seguridad de tus aplicaciones. La eficacia de la plataforma compartida de Cloudflare es que puedes combinar señales específicas de la IA con todo lo demás que sabemos sobre una solicitud, representado por cientos de campos disponibles en el WAF. Un intento de inyección de instrucciones es sospechoso. Pero que una dirección IP que ha estado investigando tu página de inicio de sesión intente inyectar código de forma inmediata, utilizando una huella digital del navegador relacionada con ataques anteriores y rotando a través de una red de bots, eso ya es otra historia. Las soluciones específicas que solo ven la capa de IA no pueden hacer estas conexiones.

Esta capa de seguridad unificada es exactamente lo que necesitan en Newfold Digital para detectar, etiquetar y proteger los puntos finales de IA, afirma Radinger: "Estamos deseando usarla en todos estos proyectos para que nos sirva de medida de seguridad".

Ecosistema en crecimiento

AI Security for Apps también estará disponible a través del cada vez más amplio ecosistema de Cloudflare, incluida la integración con IBM Cloud. A través de IBM Cloud Internet Services (CIS), los usuarios finales ya pueden adquirir soluciones avanzadas de seguridad de aplicaciones y gestionarlas directamente a través de su cuenta de IBM Cloud.

También nos asociamos con Wiz para conectar AI Security for Apps con Wiz AI Security, lo que ofrece a nuestros clientes comunes una visión unificada de su estado de seguridad en materia de IA, desde la detección de modelos y agentes en la nube hasta las medidas de protección en la capa de aplicaciones en el perímetro.

Cómo empezar

AI Security for Apps ya está disponible para los clientes Enterprise de Cloudflare. Ponte en contacto con tu equipo de cuenta para empezar, o comprueba cómo funciona el producto con una visita autoguiada.

Si tienes un plan gratuito, Pro o Business, puedes usar la detección de puntos finales de IA hoy mismo. Inicia sesión en tu panel de control y ve a Seguridad → Activos web para ver qué puntos finales hemos identificado. ¡Atentos! Pronto pondremos a disposición de los clientes de todos los planes todas las funciones de "AI Security for Apps".

Para obtener más información sobre la configuración, consulta nuestra documentación.

Blog de Cloudflare