Casi toda aplicación necesita guardar datos de forma organizada: usuarios, pedidos, productos… Para eso usamos bases de datos. AWS te permite ejecutar bases de datos sin tener que administrarlas tú, gracias a servicios gestionados. El más importante es RDS, y es donde empezamos este capítulo.
El problema que resuelve RDS
Montar y mantener una base de datos «a mano» es un trabajo duro y delicado:
- Instalar y configurar el software de base de datos.
- Aplicar parches de seguridad.
- Hacer copias de seguridad periódicas.
- Configurar la alta disponibilidad por si el servidor falla.
- Monitorizar el rendimiento.
Hacer todo esto bien requiere un especialista (un DBA, administrador de bases de datos) y mucho tiempo. RDS automatiza casi todo esto por ti.
Qué es RDS
RDS significa Relational Database Service. Es un servicio gestionado para ejecutar bases de datos relacionales sin ocuparte de la administración pesada.
Recuerda el Capítulo 1: RDS es un ejemplo de PaaS. AWS se encarga del sistema operativo, la instalación, los parches, las copias de seguridad y la infraestructura; tú solo te ocupas de tus datos y tus consultas.
«Base de datos relacional» significa que los datos se organizan en tablas con filas y columnas, relacionadas entre sí (como hojas de cálculo conectadas). Se consultan con el lenguaje SQL. Son las bases de datos «de toda la vida», ideales cuando los datos tienen una estructura clara y consistente.
Analogía: Usar RDS es como alquilar un coche con conductor y mantenimiento incluido en lugar de comprar el coche y encargarte tú de las revisiones, el seguro y las averías. Tú decides a dónde ir (tus datos); del resto se encarga AWS.
Los motores que soporta RDS
RDS no es una base de datos nueva: ejecuta los motores de bases de datos populares que ya existen. Eliges el que prefieras:
| Motor | Notas |
|---|---|
| PostgreSQL | Muy potente y popular, código abierto |
| MySQL | El más usado del mundo, código abierto |
| MariaDB | Derivado de MySQL, código abierto |
| Oracle | Comercial, común en grandes empresas |
| SQL Server | De Microsoft, común en entornos Windows |
| Aurora | El motor propio de AWS (lo vemos en el subcapítulo 8.2) |
Ventaja clave: si tu aplicación ya usaba, por ejemplo, MySQL o PostgreSQL, puedes moverla a RDS sin cambiar el código. Es el mismo motor, pero gestionado por AWS.
Multi-AZ: alta disponibilidad automática
Aquí RDS brilla en seguridad y resiliencia. Recuerda las zonas de disponibilidad del Capítulo 3. La opción Multi-AZ de RDS hace lo siguiente:
- Mantiene una copia exacta (réplica de reserva) de tu base de datos en OTRA zona de disponibilidad, sincronizada en tiempo real.
- Si la base de datos principal falla (por un problema de hardware o una caída de la AZ), RDS conmuta automáticamente a la copia de reserva, normalmente en uno o dos minutos, sin que tú hagas nada.
Analogía: Es como tener un conductor de repuesto sentado al lado en un viaje largo. Si el conductor principal se encuentra mal, el de repuesto toma el volante al instante y el viaje continúa casi sin interrupción.
Aplicación
│
▼
[BD Principal - AZ-a] ──sincroniza──► [BD Reserva - AZ-b]
│
Si la principal falla, RDS conmuta ────────┘
automáticamente a la de reservaImportante: La réplica de reserva de Multi-AZ no se usa para consultar; solo está «esperando» por si la principal falla. Su único propósito es la alta disponibilidad. Para repartir la carga de lectura se usan las réplicas de lectura (lo vemos ahora).
Réplicas de lectura: repartir la carga de lectura
A veces el problema no es que la base de datos falle, sino que recibe demasiadas consultas de lectura y se satura. Para eso están las réplicas de lectura (read replicas).
Una réplica de lectura es una copia adicional de tu base de datos que sirve solo para leer (consultas), no para escribir. Repartes las lecturas entre la principal y las réplicas, aliviando la carga.
Analogía: Imagina una biblioteca con un único bibliotecario desbordado por la gente que viene a consultar libros. Contratas varios ayudantes (réplicas) que solo atienden consultas. Las modificaciones del catálogo (escrituras) las sigue haciendo solo el bibliotecario jefe (la principal), para evitar descontrol.
Ejemplo real: Una web de noticias tiene muchísima gente leyendo artículos y poca gente escribiéndolos. Crea varias réplicas de lectura: los millones de lectores consultan las réplicas, mientras que los pocos periodistas escriben en la base de datos principal. Así la web aguanta picos enormes de tráfico de lectura.
Multi-AZ vs Réplicas de lectura: no confundir
Es el error conceptual más típico de este tema:
| Multi-AZ | Réplica de lectura | |
|---|---|---|
| Para qué | Alta disponibilidad (tolerar fallos) | Escalar las lecturas (rendimiento) |
| La copia se usa para consultar | No (está en espera) | Sí (atiende lecturas) |
| Conmutación automática si falla | Sí | No (no es su función) |
| Sincronización | Inmediata (síncrona) | Con leve retraso (asíncrona) |
Regla mental: Multi-AZ = disponibilidad (un repuesto en espera). Réplica de lectura = rendimiento (ayudantes que atienden lecturas). A menudo se usan las dos a la vez.
Lo que RDS hace por ti (resumen)
- Copias de seguridad automáticas y la posibilidad de restaurar a un momento concreto del pasado.
- Parches del motor y del sistema operativo.
- Alta disponibilidad con Multi-AZ.
- Escalado de lecturas con réplicas.
- Monitorización integrada.
- Cifrado de los datos en reposo y en tránsito.
Lo que debes recordar
- RDS es un servicio gestionado (PaaS) para bases de datos relacionales (tablas + SQL): AWS se ocupa de parches, copias y administración; tú, de tus datos.
- Soporta los motores populares (PostgreSQL, MySQL, MariaDB, Oracle, SQL Server y Aurora); puedes migrar sin cambiar el código.
- Multi-AZ = alta disponibilidad: copia de reserva en otra AZ que toma el relevo automáticamente si la principal falla.
- Réplicas de lectura = rendimiento: copias que atienden consultas de lectura para aliviar la carga.
- No confundas ambas: una es para tolerar fallos, la otra para escalar lecturas. Suelen combinarse.
En el siguiente subcapítulo veremos Aurora, el motor de base de datos propio de AWS, y por qué a menudo supera al RDS «clásico».
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
