3 min de lectura

Snapchat reduce 76% sus costos con IA acelerada por GPU: la estrategia que está revolucionando el A/B testing

Snap logró 76% de ahorro en costos migrando sus pruebas A/B a GPU con NVIDIA cuDF. Descubre cómo aplicar esta estrategia de IA acelerada en tu empresa.

ia-acelerada-gpuab-testingoptimizacion-datossnapchat
Ilustración abstracta de flujos de datos y procesamiento acelerado con elementos geométricos en azul y amarillo

Snapchat procesa más de 10 petabytes de datos cada mañana en apenas tres horas. Esa cifra astronómica no es casualidad: cada nueva función que llega a los 940 millones de usuarios mensuales de la plataforma pasa por miles de experimentos A/B que miden casi 6,000 métricas diferentes. Y ahora, gracias a una migración estratégica hacia IA acelerada por GPU, Snap ha logrado reducir sus costos operativos en un 76% mientras cuadruplica la velocidad de procesamiento.

La clave del éxito fue adoptar las librerías de código abierto NVIDIA cuDF sobre Apache Spark en la infraestructura de Google Cloud. "Cambiar nuestra infraestructura de datos de CPUs a GPUs nos permite escalar eficientemente la experimentación a más funciones, más métricas y más usuarios", explica Prudhvi Vatala, gerente senior de ingeniería en Snap. Los números hablan por sí solos: donde antes proyectaban necesitar 5,500 GPUs ejecutándose simultáneamente, ahora requieren solo 2,100.

Según datos internos de Snap recopilados entre enero y febrero, el ahorro del 76% se logró sin cambios en el código existente. Las librerías cuDF permiten ejecutar aplicaciones Apache Spark en GPUs de NVIDIA sin modificaciones, facilitando enormemente la migración. Joshua Sambasivam, ingeniero backend del equipo de A/B testing, confirma: "Cuando vi los resultados de los experimentos iniciales, fueron increíbles: vimos ahorros de costos mucho mayores de lo esperado".

Cómo aplicar esta estrategia de IA acelerada en tu empresa

La experiencia de Snapchat ofrece un blueprint concreto para empresas que buscan optimizar sus cargas de trabajo de datos sin explotar sus presupuestos. Aquí están las lecciones clave que puedes implementar:

Identifica tus workloads críticos primero: Snap no migró todo de golpe. Comenzaron con su pipeline "Daily Sum", una de sus 10 sub-pipelines más importantes. Si tu empresa procesa grandes volúmenes de datos, empieza por identificar qué procesos consumen más recursos y tienen mayor impacto en el negocio.

Evalúa el perfil de tus cargas de trabajo: Las mayores ganancias se obtienen en trabajos dominados por joins, shuffles y reparticiones de datos. Si tus pipelines de datos incluyen operaciones intensivas de agregación, joins complejos o transformaciones que requieren redistribuir datos, eres candidato ideal para la aceleración GPU.

Considera el ecosistema completo: Snap no solo adoptó cuDF, sino que aprovechó todo el stack: NVIDIA CUDA-X libraries con Google Kubernetes Engine. La plataforma completa les permitió gestionar la infraestructura automáticamente mientras se enfocaban en la optimización.

Planifica la migración gradual: El equipo de Snap trabajó con expertos de NVIDIA para optimizar sus pipelines específicamente para las máquinas virtuales G2 con GPUs NVIDIA L4. No subestimes la importancia de tener soporte especializado durante la transición.

Mide todo desde el día uno: Snap recopiló datos detallados desde enero hasta marzo para documentar sus mejoras. Establece métricas claras de rendimiento y costo antes de migrar para poder demostrar ROI a los stakeholders.

Según información adicional del blog de ingeniería de Snap, la migración también les permitió escalar su plataforma de experimentación a más de 1,600 usuarios únicos y mantener más de 1,200 estudios activos simultáneamente. El sistema ahora procesa resultados tanto por horas como diarios, con todos los trabajos batch ejecutándose en una ventana SLA estricta de 3 AM a 6 AM.

¿Tu empresa está lista para acelerar sus pipelines de datos con IA? La experiencia de Snapchat demuestra que la migración a GPU no es solo posible, sino rentable. Como dice Vatala: "No nos dimos cuenta de que estábamos sentados sobre esta mina de oro. Hemos migrado nuestros dos pipelines más grandes, pero hay mucha oportunidad por delante".