No todos los archivos se usan igual: algunos los consultas a diario y otros casi nunca, pero debes conservarlos. Sería absurdo pagar lo mismo por ambos. Por eso S3 ofrece varias clases de almacenamiento: distintos «niveles» con diferente coste y velocidad de acceso. Elegir bien la clase puede reducir tu factura de almacenamiento drásticamente.
La idea central: coste vs frecuencia de acceso
La regla es sencilla:
Cuanto menos accedes a un archivo, más barato puede ser guardarlo… pero recuperarlo cuesta más tiempo o dinero.
Acceso frecuente ◄──────────────────────────► Acceso casi nunco S3 Standard S3 Standard-IA Glacier (archivo) (caro almacenar, (medio) (baratísimo almacenar, gratis leer) lento/caro de recuperar)
Analogía: Piensa en tus pertenencias.
- Lo que usas a diario lo tienes en tu mesa (acceso instantáneo, pero el espacio en la mesa es «caro»). → Standard.
- Lo que usas de vez en cuando lo guardas en un cajón (un poco más de esfuerzo). → IA.
- Lo que casi nunca usas pero debes conservar (documentos antiguos) lo metes en cajas en el trastero (baratísimo, pero tardas en sacarlo). → Glacier.
Las clases principales
S3 Standard — el día a día
- Para: datos de acceso frecuente.
- Coste de almacenamiento: el más alto.
- Acceso: instantáneo, sin coste extra de recuperación.
- Uso típico: archivos de una web activa, imágenes de una app, datos que se leen a menudo.
S3 Standard-IA (Infrequent Access) — acceso poco frecuente
- Para: datos que necesitas tener disponibles al instante, pero que consultas pocas veces al mes.
- Coste de almacenamiento: más barato que Standard.
- Pero: pagas una pequeña tarifa cada vez que recuperas un objeto.
- Uso típico: copias de seguridad recientes, archivos que podrías necesitar de repente pero no a diario.
S3 One Zone-IA — más barato, menos resiliente
- Igual que Standard-IA pero guarda los datos en una sola zona de disponibilidad (en lugar de varias).
- Más barato, pero si esa AZ tiene un problema grave, podrías perder los datos.
- Uso típico: datos que puedes regenerar si se pierden (copias secundarias, miniaturas que puedes volver a crear).
S3 Glacier — archivo a largo plazo
La familia Glacier es para archivar datos que casi nunca consultas pero debes conservar (por ejemplo, por motivos legales). Tiene variantes según lo rápido que necesites recuperarlos:
| Variante | Tiempo de recuperación | Coste |
|---|---|---|
| Glacier Instant Retrieval | Milisegundos (instantáneo) | Barato almacenar |
| Glacier Flexible Retrieval | Minutos a horas | Más barato |
| Glacier Deep Archive | Horas (hasta ~12 h) | El más barato de todos |
- Uso típico: archivos históricos, copias de seguridad de hace años, registros que la ley obliga a guardar 7-10 años.
Ejemplo real: Un hospital debe conservar historiales médicos durante 15 años por ley, pero rara vez los consulta. Los guarda en Glacier Deep Archive: paga una cantidad mínima por guardarlos y, si alguna vez necesita uno, acepta esperar unas horas para recuperarlo. El ahorro frente a Standard es enorme.
S3 Intelligent-Tiering — que AWS decida por ti
Si no sabes con qué frecuencia se accederá a tus datos, esta clase mueve automáticamente cada objeto a la capa más barata según cómo lo uses. Tú no haces nada; AWS optimiza el coste por ti (a cambio de una pequeña tarifa de monitorización).
- Uso típico: datos con patrones de acceso impredecibles o cambiantes. Es una opción «cómoda y segura» cuando hay dudas.
Tabla resumen
| Clase | Acceso | Coste almacenar | Coste recuperar | Ideal para |
|---|---|---|---|---|
| Standard | Frecuente, instantáneo | Alto | Gratis | Datos activos del día a día |
| Standard-IA | Poco frecuente, instantáneo | Medio | Tarifa por lectura | Backups recientes |
| One Zone-IA | Poco frecuente, 1 sola AZ | Más bajo | Tarifa por lectura | Datos regenerables |
| Glacier Instant | Archivo, instantáneo | Bajo | Tarifa | Archivo que a veces consultas |
| Glacier Flexible | Archivo, minutos/horas | Muy bajo | Tarifa | Archivo histórico |
| Glacier Deep Archive | Archivo, horas | El más bajo | Tarifa | Conservación legal a largo plazo |
| Intelligent-Tiering | Automático | Variable | Automático | Acceso impredecible |
Cómo se asignan las clases
Puedes asignar la clase de un objeto al subirlo, o dejar que se muevan solos con el tiempo mediante reglas de ciclo de vida (lo veremos en el subcapítulo 5.3). Por ejemplo: «los archivos pasan a IA a los 30 días y a Glacier a los 90». Así optimizas costes automáticamente sin tocar nada.
Lo que debes recordar
- S3 ofrece varias clases de almacenamiento que equilibran coste y velocidad/coste de acceso.
- Standard para datos del día a día; Standard-IA para acceso poco frecuente; Glacier para archivo a largo plazo (cuanto más profundo, más barato pero más lento de recuperar).
- One Zone-IA ahorra a cambio de menos resiliencia (datos regenerables).
- Intelligent-Tiering deja que AWS optimice el coste automáticamente cuando no conoces el patrón de acceso.
- Las reglas de ciclo de vida mueven objetos entre clases automáticamente.
En el siguiente subcapítulo veremos el versionado (mantener varias versiones de un objeto) y el ciclo de vida (automatizar el paso entre clases y el borrado), dos funciones clave de S3.
Cloud, AWS & Terraform — De cero a experto
Capítulo 1 · Qué es el cloud computing
- 1.1 El modelo cliente-servidor tradicional
- 1.2 Problemas que venía a resolver la nube
- 1.3 On-premise vs cloud vs híbrido
- 1.4 Los tres modelos de servicio: IaaS, PaaS, SaaS
- 1.5 Los cinco pilares del cloud (según NIST)
- 1.6 Ventajas reales: elasticidad, pago por uso, disponibilidad global
Capítulo 2 · El mercado cloud y los grandes proveedores
- 2.1 AWS, Azure y GCP: diferencias y cuotas de mercado
- 2.2 Por qué aprender AWS primero
- 2.3 Conceptos que son universales entre proveedores
Capítulo 3 · Regiones, zonas de disponibilidad y edge
- 3.1 Qué es una región AWS y cómo elegirla
- 3.2 Availability Zones: alta disponibilidad desde el diseño
- 3.3 Edge locations y CloudFront
- 3.4 Latencia, resiliencia y soberanía de datos
Capítulo 4 · Cómputo: EC2
- 4.1 Instancias: tipos, familias y cuándo elegir cada una
- 4.2 AMIs, key pairs y Security Groups
- 4.3 Ciclo de vida de una instancia
- 4.4 Elastic IPs y Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítulo 5 · Almacenamiento: S3
- 5.1 Buckets, objetos y claves
- 5.2 Clases de almacenamiento (Standard, IA, Glacier…)
- 5.3 Versionado y ciclo de vida de objetos
- 5.4 Políticas de bucket y ACLs
- 5.5 Hosting de sitios web estáticos
Capítulo 6 · Redes: VPC
- 6.1 Qué es una VPC y por qué la necesitas
- 6.2 Subredes públicas y privadas
- 6.3 Internet Gateway y NAT Gateway
- 6.4 Route Tables y Network ACLs
- 6.5 VPC Peering y endpoints
Capítulo 7 · Identidad y acceso: IAM
- 7.1 Usuarios, grupos, roles y políticas
- 7.2 El principio de mínimo privilegio
- 7.3 Políticas basadas en identidad vs en recurso
- 7.4 MFA y credenciales temporales (STS)
- 7.5 Buenas prácticas de seguridad IAM
Capítulo 8 · Bases de datos gestionadas
- 8.1 RDS: motores, Multi-AZ y réplicas de lectura
- 8.2 Aurora y sus ventajas sobre RDS vanilla
- 8.3 DynamoDB: modelo clave-valor / documentos
- 8.4 ElastiCache para caché en memoria
- 8.5 Cuándo usar cada tipo de base de datos
Capítulo 9 · Por qué Infraestructura como Código
- 9.1 Problemas del aprovisionamiento manual
- 9.2 IaC declarativo vs imperativo
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El ciclo plan → apply → destroy
Capítulo 10 · HCL: el lenguaje de Terraform
- 10.1 Bloques resource, variable, output, locals
- 10.2 Tipos de datos: string, number, bool, list, map, object
- 10.3 Expresiones, referencias y funciones built-in
- 10.4 Condicionales y bucles (count, for_each, for)
Capítulo 11 · Providers y estado
- 11.1 Cómo funciona el provider de AWS
- 11.2 El fichero terraform.tfstate y su importancia
- 11.3 State local vs state remoto (S3 + DynamoDB)
- 11.4 Comandos esenciales: init, plan, apply, destroy, fmt, validate
Capítulo 12 · Tu primera infraestructura real en Terraform
- 12.1 Crear una VPC con subredes desde cero
- 12.2 Levantar una instancia EC2 pública
- 12.3 Asociar un Security Group y una Elastic IP
- 12.4 Outputs y referencias entre recursos
- 12.5 Flujo de trabajo en equipo: PR review de planes
Capítulo 13 · Balanceo de carga y autoescalado
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners y reglas
- 13.3 Auto Scaling Groups: políticas y métricas
- 13.4 Warm pools y lifecycle hooks
Capítulo 14 · Serverless con Lambda
- 14.1 El modelo de ejecución de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestión de dependencias y capas (Layers)
- 14.4 Cold starts y estrategias para reducirlos
- 14.5 Límites y antipatrones
Capítulo 15 · Mensajería y eventos
- 15.1 SQS: colas estándar vs FIFO, DLQ
- 15.2 SNS: topics, suscripciones, fan-out
- 15.3 EventBridge: event buses y reglas
- 15.4 Patrones: pub/sub, desacoplamiento, saga
Capítulo 16 · Entrega de contenido y DNS
- 16.1 Route 53: tipos de registros y routing policies
- 16.2 CloudFront: distribuciones, cachés y origins
- 16.3 ACM: certificados SSL/TLS gratuitos
- 16.4 WAF integrado con CloudFront
Capítulo 17 · Contenedores en AWS
- 17.1 Docker: repaso exprés de conceptos clave
- 17.2 ECR: registro privado de imágenes
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: cuándo Kubernetes y cuándo no
Capítulo 18 · Módulos: reutilización y composición
- 18.1 Anatomía de un módulo Terraform
- 18.2 Variables de entrada, outputs y dependencias
- 18.3 Módulos locales vs módulos del Terraform Registry
- 18.4 Versionado de módulos con Git tags
- 18.5 Diseño de módulos genéricos vs específicos de dominio
Capítulo 19 · Workspaces y gestión de entornos
- 19.1 Workspaces de Terraform: casos de uso y limitaciones
- 19.2 Estrategia de directorios por entorno (dev/stg/prod)
- 19.3 Terragrunt: DRY para configuraciones de entorno
- 19.4 Variables de entorno y archivos .tfvars
Capítulo 20 · Backends remotos y locking
- 20.1 Configurar S3 + DynamoDB como backend
- 20.2 State locking: evitar corrupción en equipo
- 20.3 Migración de estado entre backends
- 20.4 terraform import: traer recursos existentes al estado
Capítulo 21 · Testing de infraestructura
- 21.1 Terraform validate y fmt en CI
- 21.2 Checkov y tfsec: análisis de seguridad estático
- 21.3 Terratest: tests de integración en Go
- 21.4 Contract testing entre módulos
Capítulo 22 · Terraform en CI/CD
- 22.1 Pipeline básico: lint → plan → apply en GitHub Actions
- 22.2 Atlantis: GitOps para Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection y reconciliación automática
Capítulo 23 · Seguridad en profundidad
- 23.1 AWS Organizations y Service Control Policies
- 23.2 AWS Config: compliance continuo
- 23.3 GuardDuty: detección de amenazas
- 23.4 Security Hub: visión centralizada
- 23.5 KMS: gestión de claves y rotación
- 23.6 Secrets Manager vs Parameter Store
Capítulo 24 · Observabilidad: logs, métricas y trazas
- 24.1 CloudWatch Logs, métricas y alarmas
- 24.2 CloudWatch Dashboards y Contributor Insights
- 24.3 X-Ray: trazado distribuido
- 24.4 OpenTelemetry en AWS
- 24.5 Managed Grafana y Managed Prometheus
Capítulo 25 · Optimización de costes
- 25.1 AWS Cost Explorer y presupuestos con alertas
- 25.2 Trusted Advisor y Compute Optimizer
- 25.3 Rightsizing: cómo detectar sobredimensionamiento
- 25.4 Savings Plans vs Reserved Instances: decisión estratégica
- 25.5 FinOps: cultura y procesos para controlar el gasto
Capítulo 26 · Alta disponibilidad y disaster recovery
- 26.1 RTO y RPO: definir los objetivos
- 26.2 Estrategias: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks y failover automático
- 26.4 AWS Backup: política centralizada de copias
Capítulo 27 · Well-Architected Framework de AWS
- 27.1 Los seis pilares: excelencia operacional, seguridad, fiabilidad, eficiencia de rendimiento, optimización de costes, sostenibilidad
- 27.2 Well-Architected Tool: revisiones formales
- 27.3 Cómo aplicar el framework en decisiones de diseño
Capítulo 28 · Arquitecturas serverless a escala
- 28.1 Event-driven architecture con Lambda + EventBridge
- 28.2 Saga pattern para transacciones distribuidas
- 28.3 Step Functions: orquestación de workflows complejos
- 28.4 Lambda@Edge y CloudFront Functions
Capítulo 29 · Plataformas de datos en AWS
- 29.1 Data Lake con S3, Glue y Athena
- 29.2 Kinesis Data Streams y Firehose para streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: gobierno del dato
Capítulo 30 · Multi-cuenta y landing zones
- 30.1 Por qué separar workloads en cuentas distintas
- 30.2 AWS Control Tower y Account Factory
- 30.3 Gestión centralizada de logs y seguridad
- 30.4 Terraform a escala multi-cuenta con módulos compartidos
Capítulo 31 · Platform Engineering e Internal Developer Platform
- 31.1 Golden paths y abstracciones sobre Terraform
- 31.2 Service Catalog de AWS
- 31.3 Backstage como portal de desarrolladores
- 31.4 Módulos Terraform como producto interno
Capítulo 32 · Certificaciones AWS relevantes
- 32.1 Cloud Practitioner: ¿vale la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítulo 33 · Proyectos para consolidar lo aprendido
- 33.1 Proyecto 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Proyecto 2: API REST con ECS Fargate + RDS + ALB
- 33.3 Proyecto 3: plataforma de datos con Glue + Athena + Redshift
- 33.4 Proyecto 4: landing zone multi-cuenta con Terraform y Control Tower
