En este tema, exploraremos las distribuciones de probabilidad, que son fundamentales para entender cómo se comportan los datos en diferentes contextos. Las distribuciones de probabilidad nos permiten modelar y predecir eventos aleatorios, lo cual es esencial en la estadística y en muchas aplicaciones prácticas.
Objetivos del Tema
- Comprender qué es una distribución de probabilidad.
- Conocer las principales distribuciones de probabilidad y sus características.
- Aprender a calcular probabilidades utilizando distribuciones de probabilidad.
Conceptos Básicos
¿Qué es una Distribución de Probabilidad?
Una distribución de probabilidad describe cómo se distribuyen los valores de una variable aleatoria. Puede ser discreta o continua:
- Distribución Discreta: Se aplica a variables que pueden tomar un número finito o contable de valores (por ejemplo, el número de caras al lanzar una moneda).
- Distribución Continua: Se aplica a variables que pueden tomar cualquier valor dentro de un rango continuo (por ejemplo, la altura de las personas).
Función de Probabilidad y Función de Densidad de Probabilidad
- Función de Probabilidad (FP): Para variables discretas, la función de probabilidad \( P(X = x) \) asigna una probabilidad a cada valor posible de la variable aleatoria \( X \).
- Función de Densidad de Probabilidad (FDP): Para variables continuas, la función de densidad de probabilidad \( f(x) \) describe la densidad de probabilidad en cada punto del espacio de la variable.
Propiedades de las Distribuciones de Probabilidad
- No Negatividad: Las probabilidades son siempre no negativas.
- Suma de Probabilidades: La suma de las probabilidades de todos los posibles valores de una variable aleatoria discreta es 1.
- Integral de la FDP: La integral de la función de densidad de probabilidad sobre todo el espacio es 1.
Principales Distribuciones de Probabilidad
Distribución Binomial
La distribución binomial modela el número de éxitos en una serie de ensayos independientes de Bernoulli (cada uno con dos posibles resultados: éxito o fracaso).
Parámetros:
- \( n \): Número de ensayos.
- \( p \): Probabilidad de éxito en cada ensayo.
Función de Probabilidad: \[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \]
Ejemplo: Supongamos que lanzamos una moneda 10 veces. La probabilidad de obtener cara (éxito) en cada lanzamiento es 0.5. Queremos calcular la probabilidad de obtener exactamente 6 caras.
from scipy.stats import binom n = 10 # Número de ensayos p = 0.5 # Probabilidad de éxito k = 6 # Número de éxitos deseados probabilidad = binom.pmf(k, n, p) print(f"La probabilidad de obtener exactamente 6 caras es: {probabilidad:.4f}")
Distribución Normal
La distribución normal es una distribución continua que es simétrica alrededor de su media, y su forma es la famosa "campana de Gauss".
Parámetros:
- \( \mu \): Media.
- \( \sigma \): Desviación estándar.
Función de Densidad de Probabilidad: \[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]
Ejemplo: Supongamos que la altura de los adultos en una población sigue una distribución normal con una media de 170 cm y una desviación estándar de 10 cm. Queremos calcular la probabilidad de que una persona seleccionada al azar mida entre 160 cm y 180 cm.
from scipy.stats import norm mu = 170 # Media sigma = 10 # Desviación estándar probabilidad = norm.cdf(180, mu, sigma) - norm.cdf(160, mu, sigma) print(f"La probabilidad de que una persona mida entre 160 cm y 180 cm es: {probabilidad:.4f}")
Otras Distribuciones Importantes
- Distribución de Poisson: Modela el número de eventos que ocurren en un intervalo de tiempo o espacio.
- Distribución Exponencial: Modela el tiempo entre eventos en un proceso de Poisson.
- Distribución Uniforme: Todos los valores en un rango tienen la misma probabilidad.
Ejercicios Prácticos
Ejercicio 1: Distribución Binomial
Un dado justo se lanza 8 veces. ¿Cuál es la probabilidad de obtener exactamente 3 seises?
Solución:
n = 8 # Número de ensayos p = 1/6 # Probabilidad de éxito (obtener un seis) k = 3 # Número de éxitos deseados probabilidad = binom.pmf(k, n, p) print(f"La probabilidad de obtener exactamente 3 seises es: {probabilidad:.4f}")
Ejercicio 2: Distribución Normal
La duración de vida de una bombilla sigue una distribución normal con una media de 1000 horas y una desviación estándar de 100 horas. ¿Cuál es la probabilidad de que una bombilla dure más de 1200 horas?
Solución:
mu = 1000 # Media sigma = 100 # Desviación estándar probabilidad = 1 - norm.cdf(1200, mu, sigma) print(f"La probabilidad de que una bombilla dure más de 1200 horas es: {probabilidad:.4f}")
Conclusión
En esta sección, hemos aprendido sobre las distribuciones de probabilidad, sus tipos y algunas de las distribuciones más comunes. Estas herramientas son esenciales para modelar y entender fenómenos aleatorios en diversas áreas. En el próximo módulo, profundizaremos en las distribuciones específicas como la binomial y la normal, y exploraremos otras distribuciones importantes en la estadística.
¡Continúa practicando con los ejercicios y asegúrate de comprender bien estos conceptos antes de avanzar!