En el subcapítulo anterior, al hablar del patrón Saga, mencionamos que necesitábamos una forma de orquestar procesos de varios pasos: dirigir el orden, decidir qué hacer si un paso falla, esperar, reintentar... Cuando tienes muchas Lambdas (Capítulo 14) que deben colaborar en un flujo complejo, coordinarlas «a mano» se vuelve un caos. Para eso existe AWS Step Functions: un servicio que te permite orquestar flujos de trabajo de varios pasos de forma visual, ordenada y fiable. Es como tener un director de orquesta para tus funciones serverless.
El problema: coordinar muchas funciones es un lío
Imagina un proceso de negocio con varios pasos: validar un pedido, cobrar, reservar stock, programar envío, notificar... Cada paso podría ser una Lambda. Si intentas coordinarlas haciendo que una llame a la siguiente directamente, surgen problemas:
❌ Coordinación "a mano" (Lambda llama a Lambda): - ¿Qué pasa si un paso falla? ¿Cómo reintento? - ¿Cómo sé en qué paso va el proceso ahora mismo? - ¿Cómo manejo pasos que tardan, esperas, decisiones (si esto, haz aquello)? - El flujo queda "escondido" dentro del código, difícil de ver y cambiar
Esta «coordinación oculta en el código» es frágil, difícil de seguir y de modificar. Necesitas separar la lógica del flujo (el orden de los pasos, qué hacer si fallan) de la lógica de cada paso (lo que hace cada Lambda).
Qué es Step Functions
AWS Step Functions es un servicio para orquestar flujos de trabajo (workflows): defines una secuencia de pasos —con su orden, decisiones, reintentos y manejo de errores— y Step Functions la ejecuta y la coordina por ti. El flujo se define de forma visual y declarativa, separado del código de cada paso.
Step Functions ejecuta un flujo así:
[Validar pedido] → ¿válido?
├─ sí → [Cobrar pago] → [Reservar stock] → [Enviar] → [Fin]
└─ no → [Rechazar] → [Fin]
(con reintentos y manejo de errores en cada paso)Analogía: Step Functions es como el director de una orquesta. Cada músico (Lambda) sabe tocar su instrumento (hacer su tarea), pero es el director quien marca el orden, cuándo entra cada uno, qué hacer si alguien se equivoca, y mantiene a todos coordinados para que suene una sinfonía y no un caos. Sin director, 50 músicos tocando a la vez sin coordinación serían un desastre. Step Functions dirige tus funciones para que colaboren en un flujo ordenado.
Otra forma de verlo: es como un diagrama de flujo que se ejecuta de verdad. Dibujas el proceso (este paso, luego este, si pasa esto haz aquello) y Step Functions lo lleva a cabo.
Qué te da Step Functions
- Flujo visual y claro
El flujo de trabajo se ve como un diagrama: de un vistazo entiendes el proceso completo (qué pasos hay, en qué orden, qué decisiones se toman). Esto hace que el proceso sea fácil de entender y de modificar, en vez de estar enterrado en el código.
- Manejo de errores y reintentos integrado
Step Functions gestiona automáticamente qué hacer cuando un paso falla: puede reintentar (con esperas crecientes), saltar a un paso de manejo de error, o ejecutar compensaciones (¡justo lo que necesita el patrón Saga del subcapítulo 28.2!). No tienes que programar toda esa lógica a mano.
- Seguimiento del estado
Step Functions recuerda en qué paso va cada ejecución y guarda el historial. Puedes ver exactamente por dónde va un proceso, qué pasos se completaron y dónde falló si algo salió mal. Esto da una visibilidad enorme (complementa la observabilidad del Capítulo 24).
- Pasos que esperan o tardan
Maneja con naturalidad flujos que tardan (minutos, horas o incluso días) o que deben esperar algo (una aprobación humana, una respuesta externa). Algo muy difícil de hacer solo con Lambdas (que tienen un tiempo máximo de ejecución, recuerda el subcapítulo 14.5).
Step Functions y el patrón Saga
Step Functions es la herramienta ideal para implementar una Saga por orquestación (subcapítulo 28.2): defines los pasos del proceso y, para cada uno, qué compensación ejecutar si algo falla más adelante. Step Functions se encarga de ejecutar las compensaciones en orden si un paso falla, manteniendo la consistencia, todo de forma visual y controlada.
Saga con Step Functions:
[Cobrar] → [Reservar] → [Enviar] ✗ falla
└─ Step Functions ejecuta compensaciones automáticamente:
[Liberar reserva] → [Reembolsar] → estado consistenteEjemplo del mundo real: una empresa procesa solicitudes de préstamo, un proceso de muchos pasos: validar datos, comprobar el historial crediticio (llamada a un servicio externo que tarda), calcular el riesgo, esperar la aprobación de un humano si el importe es alto, y finalmente desembolsar o rechazar. Lo implementan con Step Functions: el flujo completo se ve como un diagrama claro, los pasos que tardan o esperan (como la aprobación humana, que puede tardar días) se manejan sin problema, y si algún paso falla, hay reintentos y manejo de errores definidos. El equipo puede ver en qué punto está cada solicitud en tiempo real. Lo que coordinar a mano con Lambdas habría sido frágil e ilegible, con Step Functions es un proceso claro, robusto y fácil de modificar.
Cuándo usar Step Functions
- Cuando tienes un proceso de varios pasos que coordinar (especialmente con Lambdas).
- Cuando necesitas manejo de errores, reintentos o compensaciones robustos (como en una Saga).
- Cuando el flujo tiene decisiones («si esto, haz aquello»), esperas o pasos que tardan.
- Cuando quieres ver y entender el proceso claramente, no esconderlo en el código.
💡 Para una sola tarea simple, una Lambda suelta basta. Step Functions brilla cuando hay un flujo de varios pasos que coordinar.
Lo que debes recordar
- Coordinar muchas funciones haciendo que una llame a la siguiente es frágil y difícil de seguir; conviene separar la lógica del flujo de la lógica de cada paso.
- AWS Step Functions orquesta flujos de trabajo de varios pasos: defines el orden, decisiones, reintentos y manejo de errores de forma visual y declarativa, y él los ejecuta y coordina. Como el director de una orquesta (o un diagrama de flujo que se ejecuta).
- Te da: flujo visual claro, manejo de errores y reintentos integrado, seguimiento del estado (en qué paso va cada ejecución) y soporte para pasos que esperan o tardan (incluso días).
- Es la herramienta ideal para implementar el patrón Saga por orquestación (ejecuta las compensaciones automáticamente si un paso falla).
- Úsalo para procesos de varios pasos con decisiones, esperas o manejo de errores robusto. 💡 Para una tarea simple, basta una Lambda suelta.
En el último subcapítulo del capítulo veremos cómo ejecutar lógica serverless muy cerca de los usuarios, en el borde de la red, con Lambda@Edge y CloudFront Functions.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
