En el subcapítulo anterior vimos los seis pilares del Well-Architected Framework. Pero leer unas buenas prácticas es una cosa, y evaluar tu arquitectura concreta contra ellas de forma rigurosa es otra. ¿Cómo revisas, de manera sistemática y sin que se te escape nada, si tu sistema cumple esas buenas prácticas? Para eso AWS ofrece la Well-Architected Tool: una herramienta gratuita que te guía en una revisión estructurada de tu arquitectura.
El problema: revisar una arquitectura es difícil de hacer bien
Imagina que quieres comprobar si tu sistema está bien diseñado según los seis pilares. Podrías hacerlo «de memoria», pero es fácil:
- Olvidar comprobar aspectos importantes.
- Ser demasiado optimista («seguro que está bien...») sin evidencias.
- No tener un registro de qué revisaste y qué decidiste mejorar.
- Hacerlo de forma inconsistente (cada persona revisa cosas distintas).
Necesitas una forma estructurada y guiada de evaluar, que te haga las preguntas correctas y registre los resultados.
Qué es la Well-Architected Tool
La AWS Well-Architected Tool es una herramienta gratuita dentro de AWS que te guía para evaluar tu arquitectura contra los seis pilares mediante un cuestionario estructurado. Te hace preguntas sobre tu sistema, identifica riesgos y te da recomendaciones de mejora.
Well-Architected Tool: 1. Defines tu "carga de trabajo" (workload = tu aplicación a revisar) 2. Respondes un cuestionario guiado, pilar por pilar 3. La herramienta identifica RIESGOS (altos/medios) 4. Te da RECOMENDACIONES concretas de mejora 5. Guardas el resultado y mides el progreso con el tiempo
Analogía: la Well-Architected Tool es como una inspección técnica del vehículo (ITV) guiada por un checklist oficial. No revisas el coche «a ojo»: sigues una lista estructurada de comprobaciones (frenos, luces, emisiones, dirección...), cada punto se evalúa, y al final obtienes un informe claro de qué está bien y qué hay que arreglar, con su nivel de gravedad. La herramienta hace lo mismo con tu arquitectura: una revisión rigurosa y sistemática, no improvisada.
Cómo funciona la revisión
- Defines tu carga de trabajo (workload)
Indicas qué sistema o aplicación quieres revisar. En el vocabulario del framework, a una aplicación o sistema concreto que se evalúa se le llama carga de trabajo (workload).
- Respondes el cuestionario, pilar por pilar
La herramienta te plantea una serie de preguntas para cada pilar. Por ejemplo, para el pilar de fiabilidad podría preguntar: «¿Cómo gestionas los fallos de un componente?», «¿Tienes una estrategia de recuperación ante desastres?» (recuerda el Capítulo 26). Tú respondes según cómo está realmente diseñado tu sistema, con honestidad.
- Identifica riesgos
Según tus respuestas, la herramienta detecta riesgos y los clasifica por gravedad (por ejemplo, riesgo alto o riesgo medio). Un riesgo alto es algo importante que deberías arreglar pronto; uno medio, algo a mejorar cuando puedas.
Resultado de la revisión: 🔴 Riesgos altos: 3 (atender pronto) 🟡 Riesgos medios: 7 (mejorar cuando se pueda) ✓ Buenas prácticas cumplidas: 45
- Da recomendaciones de mejora
Para cada riesgo, la herramienta sugiere cómo mejorarlo, a menudo enlazando a documentación y buenas prácticas concretas de AWS. Obtienes una lista de acciones priorizadas para mejorar tu arquitectura.
Por qué es valiosa: una foto honesta y un plan de mejora
El gran valor de la Well-Architected Tool es darte una evaluación honesta y estructurada de tu arquitectura, con un plan de acción concreto. En lugar de «creemos que está bien», obtienes: «estos son tus 3 riesgos altos y esto es lo que deberías hacer». Además:
- Registro y seguimiento: guardas las revisiones y puedes repetirlas con el tiempo para ver tu progreso (¿hemos reducido los riesgos altos respecto a la revisión anterior?).
- Lenguaje común: da al equipo un marco compartido para hablar de la calidad de la arquitectura.
- Es gratis: no cuesta nada usarla, así que no hay excusa para no revisar.
Ejemplo del mundo real: antes de lanzar una aplicación importante a producción, un equipo hace una revisión con la Well-Architected Tool. El cuestionario les hace ver, en el pilar de fiabilidad, que no tienen ninguna estrategia de recuperación ante desastres (un riesgo alto que habían pasado por alto con las prisas). También detecta un riesgo de seguridad: ciertos datos sin cifrar. Gracias a la revisión, antes de lanzar, añaden un plan de DR (Capítulo 26) y activan el cifrado (Capítulo 23). Tres meses después repiten la revisión: los riesgos altos han desaparecido. La herramienta convirtió «creemos que está listo» en «sabemos que está bien diseñado, y lo hemos verificado».
Cuándo usar la Well-Architected Tool
- Antes de lanzar un sistema importante a producción (para detectar problemas a tiempo).
- Periódicamente sobre sistemas existentes (las arquitecturas se degradan con el tiempo; una revisión regular mantiene la calidad).
- Tras cambios importantes en la arquitectura.
- Como ejercicio de aprendizaje: el propio cuestionario te enseña buenas prácticas que quizá no conocías.
Lo que debes recordar
- Revisar una arquitectura «de memoria» es propenso a olvidos, optimismo y falta de registro; hace falta una forma estructurada y guiada.
- La AWS Well-Architected Tool es una herramienta gratuita que guía una evaluación estructurada de tu arquitectura (tu «carga de trabajo» o workload) contra los seis pilares, mediante un cuestionario. Como una ITV guiada por checklist.
- El proceso: defines la carga de trabajo → respondes el cuestionario pilar por pilar (con honestidad) → identifica riesgos (altos/medios) → da recomendaciones de mejora priorizadas.
- Su valor: una evaluación honesta con un plan de acción concreto, registro para seguir el progreso, un lenguaje común para el equipo, y es gratis.
- Úsala antes de lanzar a producción, periódicamente, tras cambios importantes y como ejercicio de aprendizaje.
En el último subcapítulo del capítulo veremos cómo aplicar en la práctica el framework y la herramienta en tu día a día, para que no se queden en una revisión puntual.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
