Empezamos el capítulo de mensajería y eventos, las piezas que conectan los distintos componentes de una arquitectura moderna. La primera y más fundamental es SQS (Simple Queue Service): el servicio de colas de AWS. Ya lo asomamos como trigger de Lambda (subcapítulo 14.2); ahora lo entenderemos a fondo.
El problema: conectar servicios sin que dependan unos de otros
Imagina una tienda online. Cuando un cliente hace un pedido, hay que: cobrar, actualizar el inventario, enviar un email, avisar al almacén... Si el servicio que recibe el pedido tuviera que hacer todo eso de golpe y esperar a que cada paso termine, sería lento y frágil: si el servicio de email está caído, ¿se pierde el pedido entero?
La solución es desacoplar los servicios con una cola en medio. El servicio de pedidos solo deja un «mensaje» («procesa este pedido») en la cola y sigue con lo suyo. Otros servicios van sacando mensajes de la cola y procesándolos a su ritmo.
Qué es una cola SQS
Una cola es como una lista de tareas pendientes compartida. Un servicio mete mensajes (tareas) por un lado, y otro servicio los saca y procesa por el otro.
Productor Cola SQS Consumidor
(mete mensajes) [msg][msg][msg][msg] (saca y procesa)
│ ──────────────► ──────────────► │- Productor: quien crea mensajes y los mete en la cola (ej. el servicio de pedidos).
- Consumidor: quien saca mensajes y los procesa (ej. una Lambda o un servidor).
Analogía: una cola SQS es como la comanda en un restaurante. El camarero (productor) anota los pedidos y los cuelga en la cocina. Los cocineros (consumidores) van cogiendo las comandas y preparándolas a su ritmo. El camarero no se queda esperando en la cocina: deja la comanda y sigue atendiendo mesas. Si llegan muchos pedidos de golpe, se acumulan en el pinche y se van haciendo; nada se pierde.
La gran ventaja: desacoplamiento y resiliencia
La cola separa a productor y consumidor, lo que aporta enormes ventajas:
- Resiliencia: si el consumidor se cae, los mensajes esperan en la cola sin perderse. Cuando vuelve, los procesa. El productor ni se entera.
- Amortiguación de picos: si llega una avalancha de mensajes (Black Friday), la cola los acumula y el consumidor los procesa a un ritmo sostenible, sin saturarse.
- Escalado independiente: puedes añadir más consumidores para vaciar la cola más rápido, sin tocar el productor.
Profundizaremos en este desacoplamiento en el subcapítulo 15.4.
Los dos tipos de colas: Estándar vs FIFO
SQS ofrece dos tipos de colas, y elegir bien es importante.
Cola estándar (Standard)
Es la cola por defecto. Prioriza el máximo rendimiento (procesa cantidades enormes de mensajes). A cambio, tiene dos peculiaridades que debes conocer:
- No garantiza el orden: los mensajes pueden procesarse en un orden ligeramente distinto al de entrada.
- Entrega «al menos una vez»: en raras ocasiones, un mensaje podría entregarse duplicado.
Cola FIFO (First In, First Out)
FIFO significa «primero en entrar, primero en salir». Garantiza dos cosas que la estándar no:
- Orden estricto: los mensajes se procesan exactamente en el orden en que entraron.
- Sin duplicados: cada mensaje se entrega exactamente una vez.
A cambio, tiene un rendimiento más limitado que la estándar (aunque más que suficiente para la mayoría de casos).
¿Cuál elijo?
| Cola Estándar | Cola FIFO | |
|---|---|---|
| Orden | No garantizado | Estricto (orden de entrada) |
| Duplicados | Posibles (raros) | No (exactamente una vez) |
| Rendimiento | Altísimo | Alto, pero limitado |
| Cuándo usarla | Cuando el orden no importa | Cuando el orden o los duplicados son críticos |
Ejemplos para decidir:
- Estándar: redimensionar imágenes subidas. No importa el orden en que se procesen, y procesar una dos veces no es grave.
- FIFO: operaciones bancarias de una cuenta. El orden importa («ingresa 100» antes que «retira 50») y un duplicado sería un desastre (cobrar dos veces).
Regla práctica: usa estándar por defecto; usa FIFO solo cuando el orden o evitar duplicados sean realmente importantes.
Dead Letter Queue (DLQ): la cola de mensajes problemáticos
¿Qué pasa si un mensaje no se puede procesar? Por ejemplo, viene con datos corruptos y la función falla cada vez que lo intenta. Sin protección, ese mensaje se reintentaría una y otra vez, bloqueando la cola y desperdiciando recursos (un «mensaje envenenado»).
Para eso existe la Dead Letter Queue (DLQ), la «cola de mensajes muertos». Configuras que, tras un número de intentos fallidos (por ejemplo, 3), el mensaje problemático se mueva automáticamente a una cola aparte:
Cola principal
[msg ✓][msg ✗][msg ✓]
│
│ falla 3 veces
▼
Dead Letter Queue (DLQ)
[msg ✗] ← aquí se guarda para revisarlo despuésAsí, el mensaje problemático deja de bloquear la cola principal, pero no se pierde: queda guardado en la DLQ para que lo investigues con calma.
Analogía: la DLQ es como el cajón de «pedidos con problemas» de la cocina. Si una comanda es ilegible o imposible de preparar, en vez de bloquear a los cocineros, se aparta en ese cajón para que el encargado la revise luego. La cocina sigue funcionando.
Lo que debes recordar
- SQS es el servicio de colas de AWS: un productor mete mensajes y un consumidor los saca y procesa, a su ritmo.
- La cola desacopla los servicios: aporta resiliencia (los mensajes esperan si el consumidor cae), amortigua picos y permite escalar consumidores de forma independiente.
- Cola estándar: máximo rendimiento, pero sin orden garantizado y con posibles duplicados. Es la opción por defecto.
- Cola FIFO: garantiza orden estricto y sin duplicados, con rendimiento más limitado. Úsala cuando el orden o los duplicados sean críticos (ej. operaciones bancarias).
- La Dead Letter Queue (DLQ) recoge los mensajes que fallan repetidamente, evitando que bloqueen la cola sin perderlos, para revisarlos después.
En el siguiente subcapítulo veremos el complemento de las colas: SNS, el servicio de notificaciones, que en vez de «uno a uno» permite enviar un mensaje a muchos destinatarios a la vez.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
