Tienes un balanceador repartiendo tráfico entre varios servidores. Pero queda una pregunta: ¿quién crea esos servidores y cuántos debe haber? Si pones 10 fijos, pagas de más por la noche cuando hay poco tráfico; si pones 2, te saturas en hora punta. La solución es el Auto Scaling Group (ASG): el componente que crea y elimina servidores automáticamente según la demanda. Esta es la otra mitad de una arquitectura elástica.

El problema: la demanda no es constante

El tráfico de casi cualquier aplicación sube y baja:

Tráfico de una tienda online a lo largo del día:

  Alto │           ██████
       │        ███      ███
       │      ██            ██
  Bajo │ ████                ████
       └────────────────────────────
        00h    12h    18h    24h

Si dimensionas para el pico, desperdicias dinero la mayor parte del tiempo. Si dimensionas para la media, te caes en los picos. La respuesta es no tener un número fijo: ajustar la cantidad de servidores en tiempo real. Eso es el autoescalado, y es una de las grandes ventajas de la nube que vimos en el Capítulo 1 (elasticidad).

Qué es un Auto Scaling Group

Un Auto Scaling Group (ASG) es un grupo de instancias EC2 que AWS mantiene y ajusta automáticamente. Tú defines unos límites y unas reglas, y el ASG se encarga de crear o destruir servidores para cumplirlas.

Se configura con tres números clave:

┌─────────── Auto Scaling Group ───────────┐
│  Mínimo:  2 servidores  (nunca menos)    │
│  Deseado: 3 servidores  (ahora mismo)    │
│  Máximo:  10 servidores (nunca más)      │
└───────────────────────────────────────────┘
  • Mínimo: el número que siempre habrá, aunque no haya tráfico (garantiza disponibilidad).
  • Deseado: cuántos hay en este momento; este es el que el ASG va ajustando.
  • Máximo: el tope, para que un pico (o un error) no dispare la factura sin control.

La autorreparación: una ventaja enorme

El ASG no solo escala: también se autorrepara. Si una instancia se cae o falla su health check, el ASG la detecta y crea una nueva para mantener el número deseado.

Deseado = 3, pero un servidor se cae:

  Servidor 1 ✓   Servidor 2 ✓   Servidor 3 ✗ (caído)
                                      │
                          El ASG lo detecta y...
                                      ▼
  Servidor 1 ✓   Servidor 2 ✓   Servidor 4 ✓ (nuevo, recién creado)

Esto es potentísimo: combinado con el balanceador del subcapítulo anterior, tu aplicación se cura sola. Si un servidor muere a las 3 de la madrugada, nadie tiene que levantarse: el ASG crea uno nuevo y el balanceador empieza a usarlo en cuanto está sano. Aquí cobra sentido el user_data del subcapítulo 12.2: cada servidor nuevo se autoconfigura solo al nacer.

Las políticas de escalado: cuándo crear o quitar servidores

¿Cómo decide el ASG que hace falta escalar? Mediante políticas de escalado basadas en métricas (datos de CloudWatch, que veremos en el Capítulo 24). La más común es el uso de CPU.

Target Tracking (seguimiento de objetivo): la más sencilla y recomendada

Le dices al ASG un objetivo y él hace lo necesario para mantenerlo. Por ejemplo: «mantén el uso medio de CPU en el 50 %».

Política: mantener CPU media al 50%

  CPU sube al 80%  →  el ASG AÑADE servidores  → la CPU media baja
  CPU baja al 20%  →  el ASG QUITA servidores   → la CPU media sube

Es como el climatizador de un coche: le dices «mantén 22 grados» y él solito enciende o apaga el aire según haga falta. No te preocupas de los detalles. Por su sencillez, es la política recomendada para empezar.

Otras políticas (para conocer)

Política Cómo funciona Cuándo usarla
Target Tracking Mantiene una métrica en un valor objetivo La opción por defecto, la más fácil
Step Scaling Añade/quita N servidores según escalones de la métrica Control más fino del escalado
Scheduled Escala según un horario previsto Picos predecibles (ej. rebajas a las 9h)

Un ejemplo de escalado programado (scheduled): una web de venta de entradas sabe que cada lunes a las 10:00 saca entradas y recibe una avalancha. Programa el ASG para subir a 20 servidores a las 9:55, antes de que llegue la gente, en vez de esperar a que la CPU suba.

Métricas: en qué se basa la decisión

Las políticas reaccionan a métricas. Las más habituales:

  • Uso de CPU: la más común; alta CPU = servidores saturados.
  • Número de peticiones por servidor: muy útil con un balanceador (peticiones del Target Group).
  • Uso de memoria o de red.
  • Métricas personalizadas: por ejemplo, el número de mensajes en una cola (lo veremos con SQS, Capítulo 15).

El conjunto completo: balanceador + ASG

Juntando los tres subcapítulos, esta es la arquitectura elástica clásica:

              Usuarios
                 │
         ┌───────▼────────┐
         │  Balanceador   │  (reparte tráfico, subcap. 13.1-13.2)
         └───────┬────────┘
        ┌────────┼────────┐
        ▼        ▼        ▼
   Servidor  Servidor  Servidor   ← Auto Scaling Group
   (el ASG crea/destruye según la demanda y los repara)

El balanceador reparte entre los servidores que haya; el ASG ajusta cuántos hay y los mantiene sanos. Juntos dan una aplicación que escala sola y se cura sola.

Lo que debes recordar

  • Un Auto Scaling Group (ASG) crea y elimina servidores automáticamente según la demanda, dentro de unos límites: mínimo, deseado y máximo.
  • El ASG también se autorrepara: si un servidor falla, crea uno nuevo para mantener el número deseado (aquí brilla el user_data que autoconfigura cada servidor).
  • Las políticas de escalado deciden cuándo escalar según métricas (la más común, el uso de CPU).
  • Target Tracking («mantén la CPU al 50 %») es la política más sencilla y recomendada para empezar; existen también Step y Scheduled (escalado programado para picos previsibles).
  • Balanceador + ASG = arquitectura que escala sola y se cura sola.

En el último subcapítulo del capítulo veremos dos técnicas avanzadas para afinar el autoescalado: los warm pools y los lifecycle hooks.

Cloud, AWS & Terraform — De cero a experto

Capítulo 1 · Qué es el cloud computing

Capítulo 2 · El mercado cloud y los grandes proveedores

Capítulo 3 · Regiones, zonas de disponibilidad y edge

Capítulo 4 · Cómputo: EC2

Capítulo 5 · Almacenamiento: S3

Capítulo 6 · Redes: VPC

Capítulo 7 · Identidad y acceso: IAM

Capítulo 8 · Bases de datos gestionadas

Capítulo 9 · Por qué Infraestructura como Código

Capítulo 10 · HCL: el lenguaje de Terraform

Capítulo 11 · Providers y estado

Capítulo 12 · Tu primera infraestructura real en Terraform

Capítulo 13 · Balanceo de carga y autoescalado

Capítulo 14 · Serverless con Lambda

Capítulo 15 · Mensajería y eventos

Capítulo 16 · Entrega de contenido y DNS

Capítulo 17 · Contenedores en AWS

Capítulo 18 · Módulos: reutilización y composición

Capítulo 19 · Workspaces y gestión de entornos

Capítulo 20 · Backends remotos y locking

Capítulo 21 · Testing de infraestructura

Capítulo 22 · Terraform en CI/CD

Capítulo 23 · Seguridad en profundidad

Capítulo 24 · Observabilidad: logs, métricas y trazas

Capítulo 25 · Optimización de costes

Capítulo 26 · Alta disponibilidad y disaster recovery

Capítulo 27 · Well-Architected Framework de AWS

Capítulo 28 · Arquitecturas serverless a escala

Capítulo 29 · Plataformas de datos en AWS

Capítulo 30 · Multi-cuenta y landing zones

Capítulo 31 · Platform Engineering e Internal Developer Platform

Capítulo 32 · Certificaciones AWS relevantes

Capítulo 33 · Proyectos para consolidar lo aprendido

Capítulo 34 · Recursos y comunidad

© Copyright 2024. Todos los derechos reservados