Comenzamos la Parte VII: Arquitecturas de referencia y patrones expertos, donde damos el salto de «saber usar servicios» a «diseñar sistemas bien construidos». Y empezamos por el marco que AWS ofrece precisamente para eso: el Well-Architected Framework (Marco de Buena Arquitectura). Es un conjunto de buenas prácticas destiladas de miles de arquitecturas reales, organizadas en seis pilares. En este subcapítulo vemos qué son esos seis pilares: las seis dimensiones que debes equilibrar para construir un buen sistema en la nube.
El problema: ¿qué es una «buena» arquitectura?
Ya conoces muchos servicios de AWS. Pero saber qué piezas existen no es lo mismo que saber combinarlas bien. ¿Cómo sabes si tu diseño es «bueno»? ¿Es seguro? ¿Aguantará fallos? ¿Es eficiente en coste? Sin un marco de referencia, es fácil olvidar dimensiones importantes y construir algo que funciona... hasta que falla, o se vuelve carísimo, o resulta inseguro.
AWS recopiló la experiencia de revisar miles de arquitecturas de clientes y la condensó en el Well-Architected Framework: una guía de buenas prácticas para que cualquiera pueda evaluar y mejorar sus diseños.
Qué es el Well-Architected Framework
El Well-Architected Framework es un conjunto de principios y buenas prácticas de AWS para diseñar sistemas bien construidos en la nube. No es una herramienta ni un servicio: es un marco de pensamiento, organizado en seis pilares, que cubren todas las dimensiones que importan en una buena arquitectura.
Los 6 pilares del Well-Architected Framework: 1. 🏆 Excelencia operativa 2. 🔒 Seguridad 3. 🛡️ Fiabilidad 4. ⚡ Eficiencia del rendimiento 5. 💰 Optimización de costes 6. 🌱 Sostenibilidad
Analogía: el Well-Architected Framework es como las normas de construcción de un edificio que un buen arquitecto debe respetar. No basta con que el edificio «se tenga en pie»: debe ser seguro (no se derrumba), habitable (funciona bien para vivir), eficiente (no derrocha energía), sólido (aguanta terremotos), etc. Los seis pilares son esas dimensiones de calidad que todo buen «edificio digital» debe cumplir. Reconoces que muchos de estos temas ya los hemos tratado en el libro; el framework los organiza en un todo coherente.
Pilar 1: Excelencia operativa
Trata de operar y mejorar el sistema de forma eficaz: automatizar tareas, monitorizar todo, responder bien a incidentes y aprender de los errores para mejorar continuamente.
- Pregunta clave: «¿Operamos nuestro sistema de forma eficiente y mejoramos constantemente?»
- Relación con el libro: la infraestructura como código (Parte II), CI/CD (Capítulo 22) y la observabilidad (Capítulo 24) son la base de este pilar.
Pilar 2: Seguridad
Trata de proteger los datos, los sistemas y los accesos: controlar quién puede hacer qué, cifrar la información, detectar amenazas y cumplir las normativas.
- Pregunta clave: «¿Están protegidos nuestros datos y sistemas frente a accesos indebidos y ataques?»
- Relación con el libro: IAM (Capítulo 7), redes (Capítulo 6) y toda la seguridad en profundidad (Capítulo 23).
Pilar 3: Fiabilidad
Trata de que el sistema funcione correctamente y se recupere de los fallos: soportar caídas, escalar ante la demanda y recuperarse de desastres.
- Pregunta clave: «¿Sigue funcionando nuestro sistema cuando algo falla?»
- Relación con el libro: balanceo y autoescalado (Capítulo 13), alta disponibilidad y disaster recovery (Capítulo 26).
Pilar 4: Eficiencia del rendimiento
Trata de usar los recursos de forma eficiente para cumplir los requisitos: elegir los servicios y tamaños adecuados, y adaptarse a medida que cambian las necesidades.
- Pregunta clave: «¿Usamos los recursos adecuados y rinden bien según evolucionan las necesidades?»
- Relación con el libro: elegir el cómputo adecuado (Lambda, contenedores, EC2), rightsizing (Capítulo 25), cachés y CDN (Capítulo 16).
Pilar 5: Optimización de costes
Trata de obtener el máximo valor al menor coste: evitar el gasto innecesario, dimensionar bien y aprovechar los modelos de precio ventajosos.
- Pregunta clave: «¿Estamos obteniendo el máximo valor por lo que gastamos?»
- Relación con el libro: todo el Capítulo 25 (Cost Explorer, rightsizing, Savings Plans, FinOps).
Pilar 6: Sostenibilidad
El más reciente. Trata de minimizar el impacto medioambiental de tu infraestructura: usar los recursos de forma eficiente para reducir el consumo de energía y la huella de carbono.
- Pregunta clave: «¿Es nuestro sistema eficiente y respetuoso con el medioambiente?»
- Relación con el libro: usar recursos eficientemente (serverless, rightsizing, apagar lo que no se usa) también reduce el impacto ambiental. Eficiencia y sostenibilidad van de la mano.
La idea clave: equilibrio entre pilares
Lo más importante: los seis pilares hay que equilibrarlos, porque a veces compiten entre sí. Mejorar uno puede afectar a otro, y el arte de la buena arquitectura está en encontrar el equilibrio adecuado para tu caso:
Ejemplos de tensiones entre pilares: Más fiabilidad (duplicar todo) ↔ más coste Más seguridad (controles extra) ↔ ¿menos rendimiento o agilidad? Más rendimiento (recursos potentes) ↔ más coste y más consumo
No existe una arquitectura «perfecta» en abstracto: existe la adecuada para tus necesidades y prioridades. Una startup quizá priorice coste y agilidad; un banco priorizará seguridad y fiabilidad por encima del coste. El framework no te dice qué priorizar, sino que te obliga a pensar en las seis dimensiones y a decidir conscientemente el equilibrio.
Ejemplo del mundo real: un equipo va a diseñar una nueva aplicación. En lugar de lanzarse a montar servicios, repasan los seis pilares como una lista de comprobación: ¿cómo la operaremos y monitorizaremos (excelencia operativa)?, ¿cómo protegemos los datos (seguridad)?, ¿qué pasa si una región cae (fiabilidad)?, ¿qué cómputo es el más eficiente (rendimiento)?, ¿cómo evitamos gastar de más (coste)?, ¿podemos usar recursos eficientes (sostenibilidad)? Este simple repaso les hace descubrir huecos que habrían pasado por alto, como que no tenían plan de recuperación ante desastres. Pensar en los seis pilares antes de construir les ahorra problemas graves después.
Lo que debes recordar
- El Well-Architected Framework es un conjunto de buenas prácticas de AWS (destiladas de miles de arquitecturas reales) para diseñar sistemas bien construidos, organizado en seis pilares. Es un marco de pensamiento, no una herramienta.
- Los seis pilares: Excelencia operativa (operar y mejorar), Seguridad (proteger), Fiabilidad (resistir fallos), Eficiencia del rendimiento (recursos adecuados), Optimización de costes (máximo valor) y Sostenibilidad (impacto ambiental).
- Cada pilar conecta con temas ya vistos en el libro; el framework los organiza en un todo coherente. Son como las normas de construcción de un buen edificio.
- Lo esencial es equilibrar los pilares, porque a veces compiten (más fiabilidad ↔ más coste, etc.). No hay arquitectura «perfecta», sino la adecuada a tus prioridades.
- El framework te obliga a pensar en las seis dimensiones conscientemente, ayudándote a descubrir huecos antes de construir.
En el siguiente subcapítulo veremos la herramienta que AWS ofrece para evaluar tus arquitecturas contra estos pilares de forma sistemática: la Well-Architected Tool.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
