En el subcapítulo anterior añadimos una tabla de DynamoDB a nuestro backend «para el locking». Ahora vamos a entender bien qué es el state locking y por qué es imprescindible cuando varias personas trabajan sobre la misma infraestructura. Es la pieza que evita uno de los peores desastres posibles con Terraform: la corrupción del estado.
El problema: dos personas a la vez
Recuerda que el estado (Capítulo 11) es el archivo que registra qué recursos existen y cómo se relacionan. Es la «fuente de la verdad» de Terraform. Ahora imagina esta situación en un equipo:
Ana ejecuta "terraform apply" ┐
├─► ¡a la VEZ! sobre el MISMO estado
Carlos ejecuta "terraform apply" ┘Si ambos modifican el estado al mismo tiempo, sus cambios se mezclan y se corrompen. El archivo de estado puede quedar inconsistente: registros a medias, recursos duplicados, o un estado que ya no refleja la realidad. Un estado corrupto es una pesadilla: Terraform pierde la noción de qué existe, y arreglarlo a mano es lento y peligroso.
Analogía: es como dos personas editando el mismo documento a la vez sin coordinación, cada una guardando encima de la otra. El resultado es un documento destrozado donde se pierden cambios y nada tiene sentido. Necesitas que, mientras uno edita, el otro espere su turno.
La solución: el state locking (bloqueo del estado)
El state locking (bloqueo del estado) resuelve esto con una regla sencilla: mientras alguien está modificando el estado, nadie más puede hacerlo a la vez. Terraform pone un «cerrojo» (lock) antes de empezar a trabajar y lo quita al terminar.
Ana ejecuta apply → Terraform pone el CERROJO 🔒
(Ana trabaja tranquila)
Carlos ejecuta apply → "El estado está bloqueado, espera..."
(Carlos espera)
Ana termina → Terraform quita el cerrojo 🔓
Carlos → ahora sí, pone su cerrojo y trabajaAsí, las operaciones se serializan: ocurren una detrás de otra, nunca a la vez. El estado nunca se corrompe por accesos simultáneos.
Cómo funciona con DynamoDB
Aquí entra la tabla de DynamoDB que configuramos en el subcapítulo 20.1. Funciona como el «portero del cerrojo»:
- Cuando alguien ejecuta
apply(oplan), Terraform escribe un registro de bloqueo en la tabla DynamoDB (en la claveLockID). - Si otra persona intenta ejecutar Terraform, este comprueba la tabla, ve que ya hay un bloqueo activo y espera (o avisa de que está bloqueado).
- Cuando el primero termina, Terraform borra el registro de bloqueo, liberando el cerrojo.
DynamoDB (tabla de locks)
LockID: "mi-estado" → ocupado por Ana desde las 10:32 🔒
(Carlos ve esto y espera)DynamoDB es ideal para esto porque garantiza operaciones atómicas y consistentes: dos personas no pueden «coger el cerrojo» a la vez; solo uno gana.
Qué ves cuando el estado está bloqueado
Si intentas ejecutar Terraform mientras otra persona tiene el cerrojo, verás un mensaje parecido a este:
Error: Error acquiring the state lock Lock Info: ID: a1b2c3d4-... Who: [email protected] Created: 2024-...
Esto te dice quién tiene el bloqueo y desde cuándo. No es un error «malo»: es Terraform protegiéndote. Simplemente esperas a que la otra persona termine y vuelves a intentarlo.
El locking ocurre automáticamente
La buena noticia: una vez configurado el backend con DynamoDB (subcapítulo 20.1), el locking funciona solo, sin que tengas que hacer nada. Terraform pone y quita el cerrojo automáticamente en cada operación. Tú simplemente trabajas con normalidad, y el sistema te protege por detrás.
Cuando un lock se queda «atascado»
Ocasionalmente, un bloqueo puede quedarse «pegado»: por ejemplo, si la conexión de alguien se corta a mitad de un apply, el cerrojo podría no liberarse. En esos casos raros, existe el comando terraform force-unlock para quitar el cerrojo manualmente:
⚠️ Úsalo con muchísimo cuidado. Antes de forzar el desbloqueo, asegúrate de que de verdad nadie está trabajando sobre el estado. Si fuerzas el desbloqueo mientras otra persona realmente está aplicando cambios, vuelves a arriesgarte a la corrupción que el locking pretendía evitar. Confirma siempre con tu equipo primero.
Por qué esto es tan importante
El state locking, junto con el estado remoto (subcapítulo 20.1), es lo que hace que Terraform sea seguro en equipo. Sin él, la colaboración sería una bomba de relojería: tarde o temprano dos personas coincidirían y corromperían el estado. Con él, decenas de personas pueden trabajar sobre la misma infraestructura sin miedo. Es la base, junto con el flujo de PR (subcapítulo 12.5), del trabajo profesional con Terraform.
Lo que debes recordar
- Si dos personas modifican el estado a la vez, este se corrompe (queda inconsistente), lo que es un desastre difícil de arreglar. Como dos personas editando el mismo documento sin coordinación.
- El state locking (bloqueo) evita esto: mientras alguien trabaja, pone un cerrojo que impide que otros modifiquen el estado a la vez. Las operaciones se serializan (una tras otra).
- Con el backend S3 + DynamoDB, el locking funciona automáticamente: Terraform escribe un registro de bloqueo en DynamoDB al empezar y lo borra al terminar.
- Si el estado está bloqueado, verás un mensaje indicando quién lo tiene; no es un error malo, es protección. Simplemente esperas.
- En casos raros de bloqueo «atascado», existe
terraform force-unlock, pero úsalo con extremo cuidado y solo tras confirmar que nadie está trabajando.
En el siguiente subcapítulo veremos cómo mover el estado entre backends de forma segura, algo necesario cuando reorganizas o migras tu infraestructura.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
