Hasta ahora has trabajado solo, ejecutando apply desde tu ordenador. Pero en una empresa, la infraestructura la gestiona un equipo, y aplicar cambios a la nube de producción «a mano» es peligroso. En este subcapítulo cerramos el capítulo (y la Parte III) viendo cómo los equipos profesionales gestionan Terraform de forma segura y colaborativa: mediante Pull Requests y revisión de planes.
El problema de trabajar en equipo
Imagina cinco personas modificando la misma infraestructura desde sus portátiles. Surgen problemas inmediatos:
- ¿Quién aplicó ese cambio que rompió producción? Nadie lo sabe.
- Dos personas hacen
applya la vez y corrompen el estado (recuerda el subcapítulo 11.3). - Alguien aplica un cambio sin que nadie lo revise, y borra una base de datos.
- No hay registro de qué cambió, cuándo ni por qué.
La solución es tratar la infraestructura igual que el código de una aplicación: con Git, ramas, Pull Requests y revisión entre compañeros.
El flujo GitOps para infraestructura
El flujo profesional (a menudo llamado GitOps) funciona así:
1. Creas una rama → git checkout -b add-segundo-servidor 2. Modificas el código .tf → (añades un recurso, cambias una variable...) 3. Abres un Pull Request → propones tus cambios al equipo 4. CI ejecuta terraform plan → el plan aparece automáticamente en el PR 5. Un compañero REVISA el plan → ¿hace lo que esperamos? ¿algo peligroso? 6. Aprueba y se fusiona → merge a la rama principal 7. CI ejecuta terraform apply → el cambio se aplica de forma controlada
La idea central: nadie aplica cambios desde su portátil. Todo pasa por un Pull Request revisado, y es un sistema automático (CI/CD) quien ejecuta apply.
El paso clave: revisar el plan en el PR
La pieza más valiosa de este flujo es el paso 5: revisar el plan. Cuando abres un Pull Request, una herramienta automática (lo veremos en el Capítulo 22) ejecuta terraform plan y publica el resultado como comentario en el PR. Así, antes de aprobar, todos ven exactamente qué va a pasar:
Terraform Plan (comentario automático en el PR):
# aws_instance.web2 will be created
+ resource "aws_instance" "web2" {
+ instance_type = "t3.micro"
+ ami = "ami-0abc123"
...
}
Plan: 1 to add, 0 to change, 0 to destroy.El revisor mira ese plan y se pregunta:
- ¿Crea lo que el autor dice que quería crear?
- ¿Hay algún
destroyinesperado? (¡Una señal de alarma!) - ¿Toca recursos críticos como bases de datos?
Esta es la red de seguridad definitiva. El plan en el PR convierte cada cambio de infraestructura en algo visible y revisable. Si alguien propone, sin querer, un cambio que destruiría la base de datos de producción, el plan lo mostrará con un
- destroy, y el revisor lo frenará antes de que ocurra. Recuerda lo que vimos en el subcapítulo 11.4: leer el plan con atención evita desastres; aquí ese hábito se vuelve un proceso de equipo obligatorio.
Un ejemplo del mundo real
Imagina que en una empresa de comercio electrónico, Ana necesita añadir un segundo servidor para soportar más tráfico. En lugar de entrar en producción y crearlo a mano:
- Ana crea una rama
feature/segundo-servidory añade el recurso en el código. - Abre un Pull Request titulado «Añadir segundo servidor web para el Black Friday».
- El sistema de CI publica el plan:
Plan: 1 to add, 0 to change, 0 to destroy. - Carlos, su compañero, revisa el plan. Ve que solo se añade una instancia, nada más. Todo correcto.
- Carlos aprueba el PR. Se fusiona.
- El CI ejecuta
applyautomáticamente. El servidor nuevo aparece.
Resultado: hay un registro permanente (el PR) de qué se cambió, quién lo propuso, quién lo revisó y por qué. Si algo falla, basta con revertir el PR. Trazabilidad total.
Buenas prácticas del trabajo en equipo con Terraform
Resumimos las reglas de oro, que recogen mucho de lo aprendido en la Parte III:
| Práctica | Por qué |
|---|---|
| Estado remoto con locking (subcap. 11.3) | Evita que dos personas apliquen a la vez y corrompan el estado |
| Nadie aplica desde su portátil | Solo el CI/CD aplica, de forma controlada y registrada |
| Todo cambio pasa por un PR | Revisión obligatoria antes de tocar la nube |
| Revisar siempre el plan del PR | Detectar destroy inesperados u operaciones peligrosas |
fmt y validate en CI (subcap. 11.4) |
Código limpio y válido antes de fusionar |
| Commits y PRs descriptivos | Trazabilidad: saber qué cambió y por qué |
Lo que debes recordar
- En equipo, nunca se aplica Terraform «a mano» desde el portátil: todo pasa por Git, Pull Requests y CI/CD.
- El flujo GitOps: rama → cambias el código → PR → el CI publica el plan → un compañero lo revisa → se aprueba y fusiona → el CI hace
apply. - El paso estrella es revisar el plan en el PR: hace cada cambio visible y permite frenar operaciones peligrosas (como un
destroyinesperado) antes de que ocurran. - Este flujo da trazabilidad total: quién cambió qué, cuándo, por qué y quién lo aprobó.
- Se apoya en lo aprendido: estado remoto con locking,
fmt/validate, y el hábito de leer el plan con atención.
¡Enhorabuena! Has cerrado la Parte III y tienes las bases sólidas de Terraform: lenguaje, providers, estado, comandos, una infraestructura real construida y el flujo de trabajo en equipo. En la Parte IV daremos un salto: arquitecturas más avanzadas en AWS, empezando por el balanceo de carga y el autoescalado (Capítulo 13).
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
