La distribución normal, también conocida como distribución de Gauss o campana de Gauss, es una de las distribuciones de probabilidad más importantes en estadística. Esta distribución es fundamental debido a su prevalencia en fenómenos naturales y su aplicación en inferencia estadística.
Conceptos Clave
Características de la Distribución Normal
- Forma de Campana: La distribución normal tiene una forma simétrica de campana.
- Media, Mediana y Moda: En una distribución normal, la media, la mediana y la moda son iguales y se encuentran en el centro de la distribución.
- Simetría: La distribución es simétrica alrededor de su media.
- Asintótica: Las colas de la distribución se acercan al eje horizontal pero nunca lo tocan.
- Desviación Estándar: La desviación estándar determina la dispersión de los datos alrededor de la media.
Función de Densidad de Probabilidad
La función de densidad de probabilidad (PDF) de una variable aleatoria \(X\) que sigue una distribución normal con media \(\mu\) y desviación estándar \(\sigma\) está dada por:
\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]
Propiedades Importantes
- Regla Empírica (68-95-99.7):
- Aproximadamente el 68% de los datos se encuentran dentro de una desviación estándar de la media.
- Aproximadamente el 95% de los datos se encuentran dentro de dos desviaciones estándar de la media.
- Aproximadamente el 99.7% de los datos se encuentran dentro de tres desviaciones estándar de la media.
Estandarización
La estandarización transforma una variable normal \(X\) con media \(\mu\) y desviación estándar \(\sigma\) en una variable normal estándar \(Z\) con media 0 y desviación estándar 1. La fórmula de estandarización es:
\[ Z = \frac{X - \mu}{\sigma} \]
Ejemplos Prácticos
Ejemplo 1: Cálculo de Probabilidades
Supongamos que los puntajes de un examen siguen una distribución normal con una media de 70 y una desviación estándar de 10. Queremos encontrar la probabilidad de que un estudiante obtenga un puntaje entre 60 y 80.
-
Estandarización:
- Para \(X = 60\): \( Z = \frac{60 - 70}{10} = -1 \)
- Para \(X = 80\): \( Z = \frac{80 - 70}{10} = 1 \)
-
Uso de la Tabla Z:
- \( P(Z \leq 1) = 0.8413 \)
- \( P(Z \leq -1) = 0.1587 \)
-
Cálculo de la Probabilidad:
- \( P(60 \leq X \leq 80) = P(Z \leq 1) - P(Z \leq -1) = 0.8413 - 0.1587 = 0.6826 \)
Ejemplo 2: Intervalos de Confianza
Si se toma una muestra aleatoria de 30 estudiantes y se encuentra que la media de sus puntajes es 72, con una desviación estándar de 10, podemos construir un intervalo de confianza del 95% para la media poblacional.
-
Cálculo del Error Estándar:
- Error estándar \( = \frac{\sigma}{\sqrt{n}} = \frac{10}{\sqrt{30}} \approx 1.83 \)
-
Valor Crítico para 95%:
- Para un nivel de confianza del 95%, el valor crítico \(Z\) es aproximadamente 1.96.
-
Intervalo de Confianza:
- \( \mu \in [\bar{X} - Z \cdot \text{Error Estándar}, \bar{X} + Z \cdot \text{Error Estándar}] \)
- \( \mu \in [72 - 1.96 \cdot 1.83, 72 + 1.96 \cdot 1.83] \)
- \( \mu \in [68.41, 75.59] \)
Ejercicios Prácticos
Ejercicio 1: Cálculo de Probabilidades
Dada una distribución normal con media 50 y desviación estándar 5, calcula la probabilidad de que una observación esté entre 45 y 55.
Solución:
-
Estandarización:
- Para \(X = 45\): \( Z = \frac{45 - 50}{5} = -1 \)
- Para \(X = 55\): \( Z = \frac{55 - 50}{5} = 1 \)
-
Uso de la Tabla Z:
- \( P(Z \leq 1) = 0.8413 \)
- \( P(Z \leq -1) = 0.1587 \)
-
Cálculo de la Probabilidad:
- \( P(45 \leq X \leq 55) = P(Z \leq 1) - P(Z \leq -1) = 0.8413 - 0.1587 = 0.6826 \)
Ejercicio 2: Intervalos de Confianza
Una muestra aleatoria de 40 empleados tiene una media salarial de $50000 con una desviación estándar de $8000. Construye un intervalo de confianza del 95% para la media salarial poblacional.
Solución:
-
Cálculo del Error Estándar:
- Error estándar \( = \frac{\sigma}{\sqrt{n}} = \frac{8000}{\sqrt{40}} \approx 1264.91 \)
-
Valor Crítico para 95%:
- Para un nivel de confianza del 95%, el valor crítico \(Z\) es aproximadamente 1.96.
-
Intervalo de Confianza:
- \( \mu \in [\bar{X} - Z \cdot \text{Error Estándar}, \bar{X} + Z \cdot \text{Error Estándar}] \)
- \( \mu \in [50000 - 1.96 \cdot 1264.91, 50000 + 1.96 \cdot 1264.91] \)
- \( \mu \in [47481.99, 52518.01] \)
Conclusión
En esta sección, hemos explorado la distribución normal, sus características y cómo se utiliza en el cálculo de probabilidades y la construcción de intervalos de confianza. La comprensión de la distribución normal es esencial para el análisis estadístico, ya que muchos métodos de inferencia estadística se basan en esta distribución. En el siguiente módulo, profundizaremos en otras distribuciones de probabilidad importantes.