En los subcapítulos anteriores vimos las herramientas de observabilidad de AWS: CloudWatch (logs, métricas) y X-Ray (trazas). Funcionan muy bien, pero tienen una pega: son específicas de AWS. ¿Y si quieres una forma de instrumentar tus aplicaciones que no dependa de un proveedor concreto, para no quedarte atado? Para eso existe OpenTelemetry, el estándar abierto de observabilidad que se está convirtiendo en el lenguaje común de la industria.
El problema: quedar atado a las herramientas de un proveedor
Cuando instrumentas tu aplicación (es decir, le añades el código para que emita logs, métricas y trazas) usando herramientas específicas de un proveedor, tu código queda acoplado a ese proveedor. Esto trae problemas:
- Si quieres cambiar de herramienta de observabilidad (o usar otra mejor), tienes que reescribir la instrumentación.
- En entornos multi-nube o híbridos, cada nube tendría su propia forma de instrumentar: un lío.
- Quedas encerrado (vendor lock-in): cambiar cuesta tanto que en la práctica no puedes.
Recuerda el concepto de portabilidad que valoramos tanto al hablar de contenedores (Capítulo 17) y de Terraform multi-nube (Capítulo 10). Lo mismo aplica a la observabilidad: sería ideal instrumentar una vez y poder enviar esos datos a donde quieras.
Qué es OpenTelemetry
OpenTelemetry (a menudo abreviado OTel) es un estándar abierto para generar y recopilar datos de observabilidad (logs, métricas y trazas) de forma independiente del proveedor. Es un proyecto de la comunidad (de la CNCF, la misma fundación que cuida Kubernetes) y se ha convertido en el estándar de la industria.
La idea central: instrumentas tu aplicación una sola vez usando OpenTelemetry, y luego puedes enviar esos datos a cualquier herramienta de observabilidad que entienda el estándar (CloudWatch, Grafana, Datadog, Jaeger... lo que sea).
Tu aplicación instrumentada con OpenTelemetry (UNA vez)
│
▼
(datos en formato estándar)
│
┌───────────┼───────────┐
▼ ▼ ▼
CloudWatch Grafana otra herramienta
(cambias el destino sin tocar tu código)Analogía: OpenTelemetry es como usar un enchufe estándar (tipo USB-C) en vez de un cargador propietario distinto para cada aparato. Si todos tus dispositivos usan USB-C, puedes enchufarlos en cualquier cargador del mundo. Con cargadores propietarios, cada aparato te ata a su marca. OTel es el «USB-C de la observabilidad»: instrumentas con un estándar y enchufas a donde quieras.
Las dos grandes ventajas
- Independencia del proveedor (no lock-in)
Como instrumentas con un estándar, no quedas atado a ninguna herramienta. ¿Quieres pasar de CloudWatch a Grafana, o probar otra solución? Solo cambias a dónde envías los datos, sin reescribir la instrumentación de tu aplicación. Tu inversión en instrumentar el código se conserva.
- Consistencia (un solo estándar para todo)
Usas la misma forma de instrumentar en todas tus aplicaciones, sin importar el lenguaje (OTel soporta muchos: Python, Java, Go, JavaScript...) ni dónde se ejecuten (AWS, otra nube, tu propio centro de datos). Un único estándar para todo tu ecosistema, lo que simplifica enormemente.
OpenTelemetry en AWS: el ADOT
AWS apoya OpenTelemetry y ofrece su propia distribución lista para usar: AWS Distro for OpenTelemetry (ADOT). Es la versión de OpenTelemetry que AWS proporciona, probada y soportada por ellos, que te permite:
- Instrumentar tus aplicaciones con el estándar OpenTelemetry.
- Enviar esos datos a CloudWatch y X-Ray (para integrarte con el ecosistema AWS).
- O enviarlos a otras herramientas si lo prefieres (manteniendo la libertad).
App con ADOT (OpenTelemetry) ──► CloudWatch / X-Ray (integración AWS)
└──► o a Grafana, Datadog... (libertad)Así obtienes lo mejor de ambos mundos: el estándar abierto (libertad, sin lock-in) y la integración cómoda con AWS cuando la quieres.
Ejemplo del mundo real: una empresa instrumenta todas sus aplicaciones con OpenTelemetry (vía ADOT). Hoy envían los datos a CloudWatch porque están en AWS. Al cabo de un tiempo, deciden adoptar una herramienta de observabilidad más avanzada que usan en toda la compañía. Como instrumentaron con el estándar, solo tienen que cambiar el destino de los datos: ni una línea del código de instrumentación de sus aplicaciones cambia. Lo que con herramientas propietarias habría sido meses de reescritura, con OpenTelemetry es un cambio de configuración. La empresa conserva la libertad de elegir siempre la mejor herramienta.
Cuándo te importa OpenTelemetry
- Si quieres evitar el lock-in y mantener la libertad de cambiar de herramienta de observabilidad.
- Si trabajas en multi-nube o entornos híbridos y quieres una forma uniforme de instrumentar.
- Si tu organización ya ha estandarizado en OpenTelemetry (cada vez más empresas lo hacen).
Si estás empezando y solo usas AWS, CloudWatch y X-Ray directamente son perfectos. Pero conocer OpenTelemetry te prepara para entornos más grandes y para el rumbo que ha tomado la industria.
Lo que debes recordar
- Instrumentar con herramientas específicas de un proveedor acopla tu código a ese proveedor y dificulta cambiar (vendor lock-in); falta portabilidad.
- OpenTelemetry (OTel) es un estándar abierto para generar y recopilar logs, métricas y trazas de forma independiente del proveedor. Es el estándar de la industria.
- Instrumentas una sola vez con OTel y envías los datos a cualquier herramienta que entienda el estándar. Como el USB-C de la observabilidad.
- Ventajas: independencia del proveedor (cambias el destino sin reescribir) y consistencia (un mismo estándar para todos los lenguajes y entornos).
- AWS ofrece ADOT (AWS Distro for OpenTelemetry): usar el estándar abierto e integrarte con CloudWatch/X-Ray (o con otras herramientas), lo mejor de ambos mundos.
- Te importa si buscas evitar lock-in, trabajas multi-nube, o tu organización ha estandarizado en OTel.
En el último subcapítulo del capítulo veremos dos servicios gestionados muy potentes para visualizar y consultar métricas: Managed Grafana y Managed Prometheus.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
