S3 guarda tus datos, pero ¿quién puede verlos o modificarlos? Controlar el acceso a tus buckets es uno de los aspectos más críticos de la seguridad en la nube. Las filtraciones de datos por buckets mal configurados han sido noticia muchas veces. En este subcapítulo aprenderás a controlar quién accede a qué, y los errores que nunca debes cometer.
El punto de partida: todo está bloqueado
Buena noticia para empezar: por defecto, un bucket nuevo es completamente privado. Solo tu cuenta puede acceder a él. Para que alguien más (otra cuenta, un servicio, o el público) pueda acceder, tú tienes que concederlo explícitamente. AWS aplica aquí el principio de «denegar por defecto».
El problema casi siempre viene cuando alguien abre el acceso de más sin querer. Vamos a ver las herramientas para abrirlo (con cuidado).
Las formas de controlar el acceso
Hay varias maneras de gestionar permisos en S3. Las principales:
- Políticas de bucket (la herramienta principal)
Una bucket policy es un documento (en formato JSON) que se adjunta a un bucket y define reglas detalladas sobre quién puede hacer qué con los objetos.
Analogía: Es como el reglamento de acceso de un edificio, colgado en la entrada: «los repartidores pueden entrar al almacén; el público solo a la recepción; nadie entra a las oficinas sin tarjeta».
Una política de bucket especifica, en cada regla:
- Quién (qué cuenta, usuario o servicio, o «todo el mundo»).
- Qué acción (leer, escribir, borrar…).
- Sobre qué objetos (todo el bucket o una parte).
- Permitir o denegar.
Ejemplo conceptual de una política:
"Permitir a CUALQUIERA (público) LEER los objetos que estén dentro de la carpeta /publico/ de este bucket."
Esto serviría, por ejemplo, para una web estática (subcapítulo 5.5) donde quieres que todo el mundo vea ciertos archivos pero no otros.
Aquí tienes un ejemplo real de bucket policy que permite lectura pública de una carpeta:
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "LecturaPublicaWeb",
"Effect": "Allow",
"Principal": "*",
"Action": "s3:GetObject",
"Resource": "arn:aws:s3:::mi-bucket-web/publico/*"
}
]
}No te preocupes por entender cada línea ahora; lo veremos en detalle con IAM en el Capítulo 7. Lo importante: Effect es permitir/denegar, Principal es quién, Action es qué puede hacer y Resource es sobre qué.
- ACLs (el método antiguo)
Las ACLs (Access Control Lists, listas de control de acceso) son un mecanismo más antiguo y simple para dar permisos básicos a objetos o buckets.
Recomendación de AWS: evita las ACLs. Hoy en día AWS recomienda usar políticas de bucket e IAM en su lugar, porque son más claras y potentes. De hecho, AWS ahora deshabilita las ACLs por defecto en los buckets nuevos. Debes conocer que existen (las verás en documentación antigua), pero no las uses si puedes evitarlo.
- Políticas de IAM
También puedes controlar el acceso desde el lado del usuario con políticas de IAM (Capítulo 7): «este usuario puede leer de estos buckets». Es complementario a las políticas de bucket. La diferencia: las políticas de bucket se adjuntan al recurso (el bucket), las de IAM se adjuntan a la identidad (el usuario o rol).
La red de seguridad: Block Public Access
AWS aprendió de los muchos incidentes de buckets expuestos y creó una protección extra llamada Block Public Access (bloquear el acceso público).
Es un interruptor de seguridad que, cuando está activado (lo está por defecto en buckets nuevos), impide que el bucket se haga público, aunque alguien escriba por error una política que lo permita. Es como un doble seguro.
⚠️ Regla de oro: Deja Block Public Access activado salvo que tengas una razón muy concreta y consciente para desactivarlo (como alojar una web pública). Y aun así, valora poner CloudFront delante en lugar de exponer el bucket directamente. Desactivarlo «por probar» y olvidarse es exactamente cómo ocurren las filtraciones.
Los errores que NUNCA debes cometer
Estos son los fallos que han causado filtraciones de datos famosas:
- Hacer un bucket público sin querer. Si pones datos sensibles (datos de clientes, copias de seguridad) en un bucket público, cualquiera en internet puede descargarlos. Esto ha expuesto millones de registros en empresas reales.
- Desactivar Block Public Access sin necesidad.
- Dar permisos demasiado amplios («que cualquiera pueda escribir/borrar»). Un atacante podría borrar o secuestrar tus datos.
- Usar ACLs heredadas en lugar de políticas claras.
Caso real (patrón repetido): Numerosas empresas han sufrido filtraciones porque un desarrollador dejó un bucket con datos de clientes configurado como público «temporalmente» y se olvidó. Investigadores de seguridad (y atacantes) escanean internet buscando estos buckets abiertos. La lección: trata cada bucket como privado por defecto y abre solo lo imprescindible.
Buenas prácticas resumidas
- Privado por defecto: abre acceso solo cuando sea estrictamente necesario.
- Mínimo privilegio: da los permisos justos, ni uno más (concepto clave que veremos en el Capítulo 7).
- Usa políticas de bucket e IAM, no ACLs.
- Mantén Block Public Access activado salvo excepción justificada.
- Cifra los datos (S3 cifra en reposo por defecto; lo veremos con KMS en el Capítulo 23).
- Para webs públicas, sirve a través de CloudFront en lugar de exponer el bucket directamente.
Lo que debes recordar
- Los buckets son privados por defecto; tú concedes el acceso explícitamente.
- Las políticas de bucket (JSON) son la forma principal y recomendada de controlar el acceso: definen quién, qué acción, sobre qué y si se permite o deniega.
- Las ACLs son el método antiguo: evítalas, AWS las desactiva por defecto.
- Block Public Access es una red de seguridad que impide exponer el bucket por error: déjalo activado.
- El error más grave y frecuente es hacer público un bucket con datos sensibles. Privado por defecto, mínimo privilegio.
En el último subcapítulo de S3 veremos un uso muy práctico y popular: alojar un sitio web estático directamente en S3.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
