Cerramos el capítulo de mensajería juntando las piezas (SQS, SNS, EventBridge) en los grandes patrones de arquitectura que habilitan. Más que servicios concretos, aquí hablamos de formas de diseñar sistemas que son robustos, flexibles y escalables. Entender estos patrones te convierte en arquitecto, no solo en usuario de servicios.
Patrón 1: Publicador/Suscriptor (pub/sub)
Ya lo vimos con SNS (subcapítulo 15.2): un publicador emite un mensaje y muchos suscriptores lo reciben, sin que el publicador sepa quiénes son.
La idea de fondo: quien emite el evento no conoce ni le importa quién lo va a recibir. Esto permite añadir nuevos suscriptores sin tocar al publicador.
Ejemplo: hoy, cuando hay un nuevo pedido, avisas a facturación e inventario. Mañana, marketing quiere enterarse también para enviar ofertas. Con pub/sub, solo añades un suscriptor al topic; el servicio de pedidos no se toca. El sistema crece sin romper lo existente.
Se implementa con SNS (difusión simple) o EventBridge (enrutado inteligente).
Patrón 2: Desacoplamiento
Es quizá el patrón más importante de todo el capítulo. Desacoplar significa que los componentes de un sistema no dependen directamente unos de otros: se comunican a través de un intermediario (una cola o un bus), no «llamándose» entre ellos.
Sistema acoplado (frágil) vs desacoplado (robusto)
ACOPLADO (frágil): Servicio A ──llama directamente──► Servicio B Si B está caído o lento, A se bloquea o falla. DESACOPLADO (robusto): Servicio A ──► [Cola SQS] ──► Servicio B A deja el mensaje y sigue. Si B está caído, el mensaje espera.
Las ventajas del desacoplamiento (que ya vimos con SQS, subcapítulo 15.1):
- Resiliencia: si un componente falla, los demás siguen funcionando; los mensajes esperan.
- Escalado independiente: puedes escalar cada componente por separado según su carga.
- Mantenibilidad: puedes cambiar, actualizar o reemplazar un componente sin afectar a los demás (mientras respete el formato de los mensajes).
- Amortiguación de picos: la cola absorbe las avalanchas de tráfico.
Analogía: un sistema acoplado es como una conversación telefónica: ambos tienen que estar disponibles al mismo tiempo; si uno no contesta, no hay comunicación. Un sistema desacoplado es como enviar un mensaje de WhatsApp: lo envías y sigues con tu vida; la otra persona lo lee cuando puede. Mucho más flexible y resistente.
El desacoplamiento se logra con colas (SQS), notificaciones (SNS) y buses de eventos (EventBridge): todas las piezas de este capítulo.
Patrón 3: Saga (transacciones distribuidas)
Este es más avanzado, pero conviene conocerlo. Surge de un problema real: ¿cómo coordinas una operación que afecta a varios servicios, cuando alguno puede fallar a mitad?
El problema
Imagina una compra que implica tres pasos en tres servicios distintos:
1. Cobrar al cliente (servicio de pagos) 2. Reservar el producto (servicio de inventario) 3. Programar el envío (servicio de logística)
¿Qué pasa si el paso 1 (cobro) tiene éxito, pero el paso 2 (inventario) falla porque no hay stock? Has cobrado al cliente por un producto que no puedes enviar. En un solo sistema usarías una «transacción» que lo deshace todo de golpe, pero aquí son servicios separados: no hay una transacción única que los abarque.
La solución: el patrón saga
Una saga descompone la operación en una secuencia de pasos, donde cada paso tiene definida una acción compensatoria (cómo deshacerlo). Si un paso falla, se ejecutan las compensaciones de los pasos anteriores en orden inverso, dejando el sistema coherente.
Paso 1: Cobrar ✓ → compensación: Reembolsar
Paso 2: Reservar stock ✗ ← FALLA AQUÍ
Reacción de la saga:
→ ejecuta la compensación del paso 1: REEMBOLSAR al cliente
→ el sistema queda coherente (nadie pagó por nada)Analogía: una saga es como una reserva de viaje con vuelo, hotel y coche. Si reservas el vuelo y el hotel, pero no hay coches disponibles, no te quedas con un vuelo y un hotel inútiles: el sistema cancela (compensa) el vuelo y el hotel para dejarte como al principio. Cada reserva sabe cómo cancelarse.
En AWS, las sagas se orquestan a menudo con Step Functions (lo veremos en el Capítulo 28), que coordina los pasos y las compensaciones, apoyándose en colas y eventos para comunicar los servicios.
Tabla resumen de patrones
| Patrón | Qué resuelve | Se implementa con |
|---|---|---|
| Pub/Sub | Avisar a muchos sin que el emisor los conozca | SNS, EventBridge |
| Desacoplamiento | Que los servicios no dependan directamente entre sí | SQS, SNS, EventBridge |
| Saga | Coordinar operaciones entre varios servicios con posibilidad de fallo | Step Functions + colas/eventos |
La mentalidad de las arquitecturas dirigidas por eventos
Todos estos patrones comparten una misma filosofía, la de las arquitecturas dirigidas por eventos (event-driven): en vez de un gran sistema monolítico donde todo está entrelazado, construyes componentes pequeños e independientes que se comunican mediante mensajes y eventos. El resultado: sistemas más resilientes (un fallo no derrumba el todo), más escalables (cada pieza escala por su cuenta) y más fáciles de evolucionar (añades piezas sin romper las demás).
Lo que debes recordar
- Pub/Sub: el emisor publica y muchos reciben, sin conocerlos; permite añadir suscriptores sin tocar al publicador. Se hace con SNS o EventBridge.
- Desacoplamiento (el patrón más importante): los servicios se comunican a través de colas/buses, no directamente. Aporta resiliencia, escalado independiente, mantenibilidad y amortiguación de picos. Como pasar de una llamada telefónica a un WhatsApp.
- Saga: coordina una operación entre varios servicios definiendo, para cada paso, una acción compensatoria que lo deshace si algo falla, dejando el sistema coherente. Se orquesta con Step Functions (Capítulo 28).
- Todos comparten la filosofía event-driven: componentes pequeños e independientes comunicados por eventos, más resilientes, escalables y evolucionables.
¡Has terminado el Capítulo 15! Ya sabes conectar y desacoplar servicios. En el Capítulo 16 cambiamos de tema hacia la entrega de contenido y el DNS: cómo los usuarios llegan a tu aplicación de forma rápida y segura (Route 53, CloudFront, certificados SSL y WAF).
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
