En este tema, exploraremos algunas distribuciones de probabilidad adicionales que son fundamentales en el análisis estadístico. Estas distribuciones tienen aplicaciones específicas y son útiles en diferentes contextos. Las distribuciones que cubriremos son:
- Distribución de Poisson
- Distribución Exponencial
- Distribución t de Student
- Distribución Chi-cuadrado
- Distribución F
- Distribución de Poisson
Conceptos Básicos
La distribución de Poisson es una distribución de probabilidad discreta que describe el número de eventos que ocurren en un intervalo de tiempo o espacio fijo. Es útil para modelar eventos que ocurren de manera independiente y con una tasa promedio constante.
Fórmula
La función de probabilidad de la distribución de Poisson está dada por:
\[ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \]
donde:
- \( \lambda \) es la tasa promedio de ocurrencia de eventos.
- \( k \) es el número de eventos.
- \( e \) es la base del logaritmo natural (aproximadamente 2.71828).
Ejemplo
Supongamos que el número promedio de llamadas que recibe una central telefónica por minuto es 3. ¿Cuál es la probabilidad de recibir exactamente 5 llamadas en un minuto?
import math # Parámetros lambda_ = 3 k = 5 # Cálculo de la probabilidad probabilidad = (lambda_**k * math.exp(-lambda_)) / math.factorial(k) print(f"La probabilidad de recibir exactamente 5 llamadas en un minuto es: {probabilidad:.4f}")
Ejercicio Práctico
Supongamos que en una tienda, el número promedio de clientes que llegan por hora es 10. ¿Cuál es la probabilidad de que lleguen exactamente 8 clientes en una hora?
Solución:
lambda_ = 10 k = 8 probabilidad = (lambda_**k * math.exp(-lambda_)) / math.factorial(k) print(f"La probabilidad de que lleguen exactamente 8 clientes en una hora es: {probabilidad:.4f}")
- Distribución Exponencial
Conceptos Básicos
La distribución exponencial es una distribución de probabilidad continua que describe el tiempo entre eventos en un proceso de Poisson. Es útil para modelar el tiempo de espera entre eventos que ocurren de manera independiente y con una tasa constante.
Fórmula
La función de densidad de probabilidad de la distribución exponencial está dada por:
\[ f(x; \lambda) = \lambda e^{-\lambda x} \]
donde:
- \( \lambda \) es la tasa de ocurrencia de eventos.
- \( x \) es el tiempo entre eventos.
Ejemplo
Supongamos que el tiempo promedio entre llegadas de autobuses en una parada es de 10 minutos. ¿Cuál es la probabilidad de que el próximo autobús llegue en menos de 5 minutos?
import math # Parámetros lambda_ = 1/10 # Tasa de ocurrencia (1/tiempo promedio) x = 5 # Cálculo de la probabilidad probabilidad = 1 - math.exp(-lambda_ * x) print(f"La probabilidad de que el próximo autobús llegue en menos de 5 minutos es: {probabilidad:.4f}")
Ejercicio Práctico
Supongamos que el tiempo promedio entre fallos de una máquina es de 20 horas. ¿Cuál es la probabilidad de que la máquina falle en menos de 15 horas?
Solución:
lambda_ = 1/20 x = 15 probabilidad = 1 - math.exp(-lambda_ * x) print(f"La probabilidad de que la máquina falle en menos de 15 horas es: {probabilidad:.4f}")
- Distribución t de Student
Conceptos Básicos
La distribución t de Student es una distribución de probabilidad continua que se utiliza cuando se estima la media de una población normalmente distribuida en situaciones donde el tamaño de la muestra es pequeño y la varianza de la población es desconocida.
Fórmula
La función de densidad de probabilidad de la distribución t de Student está dada por:
\[ f(t; \nu) = \frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi} \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}} \]
donde:
- \( \nu \) es el número de grados de libertad.
- \( \Gamma \) es la función gamma.
Ejemplo
Supongamos que tenemos una muestra de 10 estudiantes y queremos calcular el intervalo de confianza para la media de sus calificaciones con un nivel de confianza del 95%.
import scipy.stats as stats # Parámetros n = 10 media_muestra = 75 desviacion_estandar_muestra = 10 nivel_confianza = 0.95 # Cálculo del intervalo de confianza grados_libertad = n - 1 t_critico = stats.t.ppf((1 + nivel_confianza) / 2, grados_libertad) margen_error = t_critico * (desviacion_estandar_muestra / math.sqrt(n)) intervalo_confianza = (media_muestra - margen_error, media_muestra + margen_error) print(f"El intervalo de confianza del 95% para la media es: {intervalo_confianza}")
Ejercicio Práctico
Supongamos que tenemos una muestra de 15 empleados y queremos calcular el intervalo de confianza para la media de sus salarios con un nivel de confianza del 99%. La media muestral es de $50,000 y la desviación estándar muestral es de $5,000.
Solución:
n = 15 media_muestra = 50000 desviacion_estandar_muestra = 5000 nivel_confianza = 0.99 grados_libertad = n - 1 t_critico = stats.t.ppf((1 + nivel_confianza) / 2, grados_libertad) margen_error = t_critico * (desviacion_estandar_muestra / math.sqrt(n)) intervalo_confianza = (media_muestra - margen_error, media_muestra + margen_error) print(f"El intervalo de confianza del 99% para la media es: {intervalo_confianza}")
- Distribución Chi-cuadrado
Conceptos Básicos
La distribución Chi-cuadrado es una distribución de probabilidad continua que se utiliza principalmente en pruebas de hipótesis y análisis de varianza. Es la distribución de la suma de los cuadrados de \( k \) variables aleatorias independientes y normalmente distribuidas con media cero y varianza uno.
Fórmula
La función de densidad de probabilidad de la distribución Chi-cuadrado está dada por:
\[ f(x; k) = \frac{1}{2^{k/2} \Gamma(k/2)} x^{(k/2)-1} e^{-x/2} \]
donde:
- \( k \) es el número de grados de libertad.
- \( \Gamma \) es la función gamma.
Ejemplo
Supongamos que queremos realizar una prueba de bondad de ajuste con 5 grados de libertad. ¿Cuál es el valor crítico de Chi-cuadrado para un nivel de significancia del 0.05?
import scipy.stats as stats # Parámetros grados_libertad = 5 nivel_significancia = 0.05 # Cálculo del valor crítico valor_critico = stats.chi2.ppf(1 - nivel_significancia, grados_libertad) print(f"El valor crítico de Chi-cuadrado para un nivel de significancia del 0.05 es: {valor_critico:.4f}")
Ejercicio Práctico
Supongamos que queremos realizar una prueba de independencia con 10 grados de libertad. ¿Cuál es el valor crítico de Chi-cuadrado para un nivel de significancia del 0.01?
Solución:
grados_libertad = 10 nivel_significancia = 0.01 valor_critico = stats.chi2.ppf(1 - nivel_significancia, grados_libertad) print(f"El valor crítico de Chi-cuadrado para un nivel de significancia del 0.01 es: {valor_critico:.4f}")
- Distribución F
Conceptos Básicos
La distribución F es una distribución de probabilidad continua que se utiliza principalmente en análisis de varianza (ANOVA) y en pruebas de hipótesis para comparar dos varianzas. Es la distribución de la razón de dos variables aleatorias Chi-cuadrado independientes, cada una dividida por sus grados de libertad.
Fórmula
La función de densidad de probabilidad de la distribución F está dada por:
\[ f(x; d_1, d_2) = \frac{\left(\frac{d_1 x}{d_1 x + d_2}\right)^{d_1/2} \left(\frac{d_2}{d_1 x + d_2}\right)^{d_2/2}}{x B(d_1/2, d_2/2)} \]
donde:
- \( d_1 \) y \( d_2 \) son los grados de libertad del numerador y denominador, respectivamente.
- \( B \) es la función beta.
Ejemplo
Supongamos que queremos realizar una prueba de ANOVA con 3 y 20 grados de libertad. ¿Cuál es el valor crítico de F para un nivel de significancia del 0.05?
import scipy.stats as stats # Parámetros grados_libertad_numerador = 3 grados_libertad_denominador = 20 nivel_significancia = 0.05 # Cálculo del valor crítico valor_critico = stats.f.ppf(1 - nivel_significancia, grados_libertad_numerador, grados_libertad_denominador) print(f"El valor crítico de F para un nivel de significancia del 0.05 es: {valor_critico:.4f}")
Ejercicio Práctico
Supongamos que queremos realizar una prueba de ANOVA con 5 y 15 grados de libertad. ¿Cuál es el valor crítico de F para un nivel de significancia del 0.01?
Solución:
grados_libertad_numerador = 5 grados_libertad_denominador = 15 nivel_significancia = 0.01 valor_critico = stats.f.ppf(1 - nivel_significancia, grados_libertad_numerador, grados_libertad_denominador) print(f"El valor crítico de F para un nivel de significancia del 0.01 es: {valor_critico:.4f}")
Conclusión
En esta sección, hemos explorado varias distribuciones de probabilidad importantes: Poisson, Exponencial, t de Student, Chi-cuadrado y F. Cada una de estas distribuciones tiene aplicaciones específicas en el análisis estadístico y es fundamental para realizar inferencias y pruebas de hipótesis. Asegúrate de practicar con los ejercicios proporcionados para reforzar tu comprensión de estos conceptos. En el próximo módulo, profundizaremos en la inferencia estadística, comenzando con la estimación de parámetros.