A veces el problema no es dónde guardar los datos, sino cuántas veces los pides. Si tu aplicación consulta una y otra vez la misma información a la base de datos, la estás sobrecargando y ralentizando. La solución es una caché en memoria, y en AWS se llama ElastiCache. Este subcapítulo te explica qué es y por qué puede transformar el rendimiento de tu aplicación.
El problema: pedir lo mismo una y otra vez
Imagina una web de noticias donde 100.000 personas leen el mismo artículo popular. Sin caché, cada visita hace que la aplicación vaya a la base de datos a buscar el mismo artículo, una y otra vez. La base de datos hace el mismo trabajo 100.000 veces y se satura.
Las bases de datos guardan los datos en disco, que es relativamente lento. ¿Y si guardáramos los datos más pedidos en un lugar mucho más rápido para no molestar a la base de datos cada vez?
Qué es una caché en memoria
Una caché es un almacén temporal y muy rápido donde guardas los datos que más se consultan, para servirlos al instante sin ir a la fuente original (la base de datos).
La clave: la caché guarda los datos en memoria RAM, que es muchísimo más rápida que el disco. Leer de memoria es cuestión de microsegundos.
Analogía: Imagina a un cocinero en un restaurante con mucho trajín.
- Sin caché: cada vez que necesita sal, baja al almacén del sótano (la base de datos, en disco: lento). Mil platos = mil viajes al sótano.
- Con caché: tiene la sal y los ingredientes más usados en la encimera, a mano (la caché, en memoria: rapidísimo). Solo baja al sótano para lo poco frecuente.
El resultado: sirve los platos muchísimo más rápido y el almacén (la base de datos) descansa.
Qué es ElastiCache
ElastiCache es el servicio gestionado de AWS para ejecutar cachés en memoria. Soporta dos tecnologías muy populares:
| Motor | Características |
|---|---|
| Redis (ElastiCache for Redis / Valkey) | Más rico en funciones: estructuras de datos avanzadas, persistencia, alta disponibilidad, pub/sub |
| Memcached | Más simple, solo caché básica, muy ligero |
En la mayoría de casos modernos se usa Redis por sus funciones adicionales, pero Memcached sigue siendo válido para cachés sencillas.
Como servicio gestionado (igual que RDS), AWS se encarga de la instalación, los parches y la infraestructura; tú solo usas la caché.
Cómo funciona en la práctica
El patrón más común se llama cache-aside («caché al lado»). Funciona así:
1. La app necesita un dato. Pregunta primero a la CACHÉ.
¿Está en la caché?
├── SÍ (cache hit) → lo devuelve al instante. ¡Rapidísimo!
│
└── NO (cache miss) → va a la BASE DE DATOS (lento),
guarda una copia en la caché para la próxima,
y devuelve el dato.- La primera vez que se pide un dato, no está en la caché (miss): se busca en la base de datos y se guarda en la caché.
- Las siguientes veces, ya está en la caché (hit): se sirve al instante sin tocar la base de datos.
Ejemplo real: En la web de noticias, el primer lector del artículo popular hace que se cargue desde la base de datos y se guarde en la caché. Los siguientes 99.999 lectores lo reciben directamente desde la caché, en microsegundos, sin molestar a la base de datos. La web va volando y la base de datos apenas trabaja.
Para qué se usa ElastiCache
- Acelerar lecturas frecuentes: los datos «calientes» (los más pedidos) se sirven desde memoria.
- Aliviar la base de datos: menos consultas repetidas = base de datos más descansada y barata.
- Guardar sesiones de usuario: información de la sesión de cada usuario, accesible al instante.
- Tablas de clasificación (leaderboards) en videojuegos: Redis es excelente para rankings en tiempo real.
- Limitar peticiones (rate limiting): controlar cuántas veces alguien hace algo en un periodo.
El concepto clave: datos temporales
Lo más importante que debes entender: la caché es temporal y puede perderse. No es la fuente «de verdad» de tus datos; es una copia rápida de lo que ya está en la base de datos.
Por eso:
- Los datos en caché tienen un tiempo de vida (TTL): caducan tras un periodo para no servir información obsoleta.
- Nunca uses la caché como único lugar para datos importantes. La fuente de la verdad es siempre la base de datos; la caché solo acelera el acceso.
El reto de las cachés — la invalidación: existe una famosa frase en informática: «solo hay dos cosas difíciles en programación: invalidar la caché y nombrar las cosas». El reto es asegurarte de que, cuando un dato cambia en la base de datos, la copia en caché se actualiza o se borra, para no servir información vieja. Por eso se usan los TTL y estrategias de actualización.
Lo que debes recordar
- Una caché en memoria guarda los datos más consultados en RAM (rapidísima) para no ir a la base de datos (disco, más lento) cada vez.
- ElastiCache es el servicio gestionado de AWS para cachés, con Redis (más completo) y Memcached (más simple).
- El patrón típico (cache-aside): mira la caché primero; si está (hit), respuesta instantánea; si no (miss), va a la base de datos y guarda una copia.
- Beneficios: acelera las lecturas y alivia la base de datos. Ideal para datos «calientes», sesiones y rankings.
- La caché es temporal: usa TTL, mantenla actualizada y nunca la conviertas en el único lugar de datos importantes.
En el último subcapítulo del capítulo (y de la Parte II) pondremos orden a todo: cuándo usar cada tipo de base de datos que hemos visto.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
