En el subcapítulo anterior vimos los logs, métricas y alarmas de CloudWatch. Tienes muchísima información valiosa... pero dispersa. ¿Cómo la presentas de forma que se entienda de un vistazo? Para eso están los Dashboards (paneles), que reúnen tus métricas en pantallas visuales. Y veremos Contributor Insights, una herramienta para descubrir quién o qué está detrás de un comportamiento.
El problema: muchos datos, poca visión de conjunto
Tienes métricas de tus servidores, tu base de datos, tu balanceador, tus Lambdas... cada una por separado. Para saber «cómo va el sistema en general», tendrías que ir mirando una por una. Necesitas una vista de conjunto: una sola pantalla donde ver el estado de todo lo importante a la vez.
Qué es un Dashboard de CloudWatch
Un Dashboard (panel) de CloudWatch es una pantalla personalizable donde colocas las gráficas de las métricas que te importan, juntas, para verlas de un vistazo. Tú eliges qué mostrar y cómo organizarlo:
┌─────────────── Dashboard "Producción" ───────────────┐ │ CPU servidores │ Peticiones/seg │ │ ▁▂▅▇▅▂▁ │ ▃▅▆▇▆▅▃ │ │──────────────────────┼───────────────────────────────│ │ Errores HTTP │ Latencia base de datos │ │ ▁▁▁▂▁▁▁ │ ▂▂▃▂▂▂▃ │ └──────────────────────┴───────────────────────────────┘
Analogía: un Dashboard es como el panel de control de la cabina de un avión o la sala de control de una central: todos los indicadores importantes reunidos en un sitio, organizados para que el piloto (u operador) vea el estado completo del sistema de un solo vistazo, sin tener que ir mirando instrumento por instrumento en sitios distintos.
Para qué sirven los Dashboards
- Visión general de un vistazo: ¿está todo el sistema sano ahora mismo? Una mirada al dashboard te lo dice.
- Pantallas de operación: muchos equipos tienen dashboards en pantallas grandes en la oficina (o siempre abiertos) para vigilar producción continuamente.
- Investigar incidentes: cuando algo va mal, un buen dashboard te muestra todas las métricas relacionadas juntas, lo que ayuda a correlacionar («cuando subió la CPU, también subió la latencia... están relacionados»).
- Compartir el estado: sirven para que todo el equipo (técnico o no) vea cómo va el sistema.
Puedes tener varios dashboards: uno general, uno por aplicación, uno para el equipo de negocio con métricas de negocio (pedidos, ingresos), etc.
Ejemplo del mundo real: un equipo que gestiona una plataforma de streaming tiene un dashboard siempre visible en una pantalla de la oficina. Muestra: usuarios conectados, ancho de banda usado, errores de reproducción y latencia. Durante el estreno de una serie muy esperada, el equipo ve en directo cómo suben los usuarios conectados, y vigila que los errores se mantengan bajos. Cuando ven un pequeño repunte de errores, actúan antes de que afecte a más gente. El dashboard les da el pulso del sistema en tiempo real.
El problema más difícil: ¿QUIÉN causa esto?
Las métricas normales te dicen cuánto (ej.: «hay 10.000 peticiones por minuto»). Pero a veces necesitas saber quién o qué está detrás de un número:
- «Hay muchísimo tráfico... ¿de qué usuario o IP viene?»
- «La base de datos está saturada... ¿qué consulta o qué cliente la satura?»
- «¿Cuáles son los 10 usuarios que más recursos consumen?»
Esto es difícil de ver en una gráfica normal, que solo muestra el total. Aquí entra Contributor Insights.
Qué es Contributor Insights
CloudWatch Contributor Insights analiza tus logs para identificar a los principales contribuyentes a un comportamiento: quiénes o qué están generando la mayor parte de cierta actividad. Te muestra rankings de los «mayores responsables»:
Contributor Insights — "IPs con más peticiones": 1. 203.0.113.5 → 45.000 peticiones ← sospechoso 2. 198.51.100.2 → 3.200 peticiones 3. 192.0.2.10 → 2.800 peticiones ...
Analogía: Contributor Insights es como el detective que, ante una multitud, identifica a los cabecillas. La métrica normal te dice «hay mucha gente y mucho ruido»; Contributor Insights te dice «el ruido lo están causando estas tres personas concretas». Te lleva del «cuánto» al «quién».
Para qué sirve Contributor Insights
- Detectar abusos: identificar la IP o el usuario que está haciendo un uso anormal (posible ataque o cliente que satura el sistema).
- Encontrar al culpable de un problema: «¿qué está saturando la base de datos?» → ver qué cliente o consulta domina.
- Entender el uso real: «¿qué endpoints de mi API se usan más?», «¿qué clientes consumen más recursos?».
Ejemplo del mundo real: una API empieza a ir lenta porque recibe muchísimo tráfico. La métrica «peticiones totales» confirma el volumen alto, pero no la causa. Con Contributor Insights, el equipo ve al instante que una sola IP está generando el 80 % de las peticiones: un cliente con un bug que llama a la API en bucle. Bloquean esa IP y el sistema se normaliza. Sin Contributor Insights, habrían tardado horas en encontrar al culpable entre miles de clientes.
Cómo encajan: del «cuánto» al «quién»
DASHBOARDS → visión general de un vistazo (¿cómo va todo?) MÉTRICAS + ALARMAS → cuánto está pasando y cuándo avisar (Cap. 24.1) CONTRIBUTOR INSIGHTS → QUIÉN o qué está detrás de un comportamiento
Los dashboards te dan la foto general; las métricas y alarmas, los números y avisos; y Contributor Insights, cuando hace falta, te lleva al detalle de quién causa algo.
Lo que debes recordar
- Un Dashboard de CloudWatch es una pantalla personalizable que reúne las gráficas de las métricas que te importan, para ver el estado de todo de un vistazo. Como el panel de control de una cabina.
- Sirven para: visión general, pantallas de operación siempre visibles, investigar incidentes (correlacionar métricas) y compartir el estado con el equipo.
- Las métricas normales dicen cuánto; a veces necesitas saber quién o qué lo causa.
- Contributor Insights analiza los logs para identificar a los principales contribuyentes a un comportamiento (rankings de «mayores responsables»). Como el detective que identifica a los cabecillas de una multitud.
- Sirve para detectar abusos (una IP que ataca), encontrar al culpable de un problema (qué satura la BD) y entender el uso real.
En el siguiente subcapítulo daremos un paso más en la observabilidad: seguir el rastro de una petición a través de muchos servicios con el trazado distribuido y X-Ray.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
