Cierra el capítulo con dos técnicas avanzadas que afinan el autoescalado: los warm pools (servidores precalentados) y los lifecycle hooks (ganchos de ciclo de vida). No son imprescindibles para empezar, pero entenderlos te ayuda a resolver un problema muy real: el escalado a veces es demasiado lento.
El problema: arrancar un servidor lleva tiempo
Recuerda el ciclo de vida de una instancia (subcapítulo 4.3) y el user_data (subcapítulo 12.2). Cuando el Auto Scaling Group decide añadir un servidor, este no está listo al instante: hay que arrancarlo, ejecutar su script de configuración, instalar software, descargar la aplicación... Eso puede tardar varios minutos.
El ASG decide escalar (la CPU está al 90%)
│
▼
Arrancar instancia ──► user_data ──► instalar app ──► listo
└──────────── varios minutos ────────────────┘
│
▼
Recién ahora el servidor recibe tráficoEl problema: durante esos minutos, tus servidores actuales siguen saturados. Si el pico de tráfico es muy brusco (una avalancha repentina), llegar «unos minutos tarde» puede significar una mala experiencia para los usuarios. Aquí entran los warm pools.
Warm pools: servidores precalentados esperando
Un warm pool (grupo en caliente) es un conjunto de instancias ya arrancadas y configuradas, pero detenidas o en pausa, esperando «entre bastidores». Cuando el ASG necesita escalar, en vez de crear una instancia desde cero, toma una del warm pool, que ya tiene todo instalado, y la pone en marcha en segundos en lugar de minutos.
┌─── Auto Scaling Group ───┐ ┌──── Warm Pool ────┐
│ Servidores activos: │ │ En reserva (ya │
│ ✓ ✓ ✓ sirviendo tráfico │ │ configurados): │
│ │ │ ⏸ ⏸ esperando │
└───────────────────────────┘ └─────────────────────┘
▲ │
└──── al escalar, se toma ─────┘
uno del warm pool (¡rápido!)Analogía: un warm pool es como tener pizzas a medio hacer en la cocina de una pizzería. Cuando entra una avalancha de pedidos, no empiezas desde la masa: metes al horno las que ya tenías preparadas y salen enseguida. Pagas un poco por tenerlas listas, pero respondes muchísimo más rápido al pico.
El compromiso: las instancias detenidas del warm pool tienen un pequeño coste (sobre todo de almacenamiento), pero a cambio ganas velocidad de escalado. Se usa cuando arrancar un servidor es lento y necesitas reaccionar muy rápido a los picos.
Lifecycle hooks: pausar en momentos clave del ciclo de vida
Un lifecycle hook (gancho de ciclo de vida) es una pausa que el ASG hace en momentos concretos —cuando un servidor está naciendo o cuando va a ser eliminado— para darte tiempo a hacer algo antes de continuar.
Instancia naciendo:
Pendiente ──[HOOK: pausa]── En servicio
│
└─► tiempo para: terminar de instalar, registrarse,
calentar cachés, avisar a otro sistema...
Instancia muriendo:
En servicio ──[HOOK: pausa]── Terminada
│
└─► tiempo para: vaciar conexiones, guardar logs,
avisar de que se va, terminar peticiones en curso...Hook al crear: que no reciba tráfico antes de tiempo
Sin un hook, el ASG podría dar por «listo» un servidor que aún está terminando de configurarse, y el balanceador empezaría a enviarle usuarios demasiado pronto (que verían errores). Un lifecycle hook de creación retiene la instancia hasta que confirmas que está realmente lista.
Hook al eliminar: apagado elegante (graceful shutdown)
Este es el caso más valioso. Cuando el ASG va a reducir servidores (la CPU bajó), no quieres que apague de golpe un servidor que está atendiendo peticiones en ese momento, porque esos usuarios verían un error. Un lifecycle hook de eliminación da tiempo a un apagado elegante:
- Dejar de aceptar peticiones nuevas.
- Terminar las peticiones que ya estaba atendiendo (drenaje de conexiones).
- Guardar logs o datos pendientes.
- Solo entonces, apagarse.
Ejemplo del mundo real: una tienda online reduce servidores tras el pico de mediodía. Uno de los servidores a eliminar está procesando el pago de un cliente. Sin un lifecycle hook, AWS lo apagaría de golpe y el pago fallaría. Con el hook, el servidor termina ese pago, confirma que ya no tiene nada pendiente, y entonces se apaga. El cliente nunca nota nada.
Tabla resumen
| Técnica | Qué hace | Para qué sirve |
|---|---|---|
| Warm pool | Servidores ya configurados, en reserva | Escalar en segundos ante picos bruscos |
| Lifecycle hook (creación) | Pausa al nacer una instancia | Que no reciba tráfico antes de estar lista |
| Lifecycle hook (eliminación) | Pausa antes de apagar | Apagado elegante: terminar lo pendiente sin cortar a usuarios |
¿Necesito esto para empezar?
No. Un balanceador + un Auto Scaling Group básico (subcapítulos 13.1-13.3) ya te dan una arquitectura elástica y resiliente excelente para la mayoría de proyectos. Los warm pools y los lifecycle hooks son optimizaciones que añadirás cuando:
- Tus arranques sean lentos y los picos muy bruscos → warm pools.
- No puedas permitirte cortar peticiones al reducir servidores → lifecycle hooks.
Quédate con la idea de que existen y qué problema resuelven; ya los aplicarás cuando los necesites.
Lo que debes recordar
- Arrancar un servidor desde cero lleva minutos, lo que puede hacer el escalado demasiado lento ante picos bruscos.
- Un warm pool mantiene servidores ya configurados en reserva para escalar en segundos (con un pequeño coste extra); como tener «pizzas a medio hacer».
- Un lifecycle hook introduce una pausa al crear o eliminar una instancia para hacer algo antes de continuar.
- El hook de eliminación permite un apagado elegante: terminar peticiones en curso (un pago, por ejemplo) sin cortar a los usuarios.
- Son optimizaciones avanzadas: no las necesitas para empezar, pero conviene saber qué problema resuelven.
¡Has terminado el Capítulo 13! Ya dominas las arquitecturas elásticas y resilientes. En el Capítulo 14 daremos otro gran salto conceptual: el mundo serverless con AWS Lambda, donde ni siquiera tendrás que pensar en servidores.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
