En este tema, exploraremos algunas distribuciones de probabilidad adicionales que son fundamentales en el análisis estadístico. Estas distribuciones tienen aplicaciones específicas y son útiles en diferentes contextos. Las distribuciones que cubriremos son:

  1. Distribución de Poisson
  2. Distribución Exponencial
  3. Distribución t de Student
  4. Distribución Chi-cuadrado
  5. Distribución F

  1. Distribución de Poisson

Conceptos Básicos

La distribución de Poisson es una distribución de probabilidad discreta que describe el número de eventos que ocurren en un intervalo de tiempo o espacio fijo. Es útil para modelar eventos que ocurren de manera independiente y con una tasa promedio constante.

Fórmula

La función de probabilidad de la distribución de Poisson está dada por:

\[ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \]

donde:

  • \( \lambda \) es la tasa promedio de ocurrencia de eventos.
  • \( k \) es el número de eventos.
  • \( e \) es la base del logaritmo natural (aproximadamente 2.71828).

Ejemplo

Supongamos que el número promedio de llamadas que recibe una central telefónica por minuto es 3. ¿Cuál es la probabilidad de recibir exactamente 5 llamadas en un minuto?

import math

# Parámetros
lambda_ = 3
k = 5

# Cálculo de la probabilidad
probabilidad = (lambda_**k * math.exp(-lambda_)) / math.factorial(k)
print(f"La probabilidad de recibir exactamente 5 llamadas en un minuto es: {probabilidad:.4f}")

Ejercicio Práctico

Supongamos que en una tienda, el número promedio de clientes que llegan por hora es 10. ¿Cuál es la probabilidad de que lleguen exactamente 8 clientes en una hora?

Solución:

lambda_ = 10
k = 8

probabilidad = (lambda_**k * math.exp(-lambda_)) / math.factorial(k)
print(f"La probabilidad de que lleguen exactamente 8 clientes en una hora es: {probabilidad:.4f}")

  1. Distribución Exponencial

Conceptos Básicos

La distribución exponencial es una distribución de probabilidad continua que describe el tiempo entre eventos en un proceso de Poisson. Es útil para modelar el tiempo de espera entre eventos que ocurren de manera independiente y con una tasa constante.

Fórmula

La función de densidad de probabilidad de la distribución exponencial está dada por:

\[ f(x; \lambda) = \lambda e^{-\lambda x} \]

donde:

  • \( \lambda \) es la tasa de ocurrencia de eventos.
  • \( x \) es el tiempo entre eventos.

Ejemplo

Supongamos que el tiempo promedio entre llegadas de autobuses en una parada es de 10 minutos. ¿Cuál es la probabilidad de que el próximo autobús llegue en menos de 5 minutos?

import math

# Parámetros
lambda_ = 1/10  # Tasa de ocurrencia (1/tiempo promedio)
x = 5

# Cálculo de la probabilidad
probabilidad = 1 - math.exp(-lambda_ * x)
print(f"La probabilidad de que el próximo autobús llegue en menos de 5 minutos es: {probabilidad:.4f}")

Ejercicio Práctico

Supongamos que el tiempo promedio entre fallos de una máquina es de 20 horas. ¿Cuál es la probabilidad de que la máquina falle en menos de 15 horas?

Solución:

lambda_ = 1/20
x = 15

probabilidad = 1 - math.exp(-lambda_ * x)
print(f"La probabilidad de que la máquina falle en menos de 15 horas es: {probabilidad:.4f}")

  1. Distribución t de Student

Conceptos Básicos

La distribución t de Student es una distribución de probabilidad continua que se utiliza cuando se estima la media de una población normalmente distribuida en situaciones donde el tamaño de la muestra es pequeño y la varianza de la población es desconocida.

Fórmula

La función de densidad de probabilidad de la distribución t de Student está dada por:

\[ f(t; \nu) = \frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi} \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}} \]

donde:

  • \( \nu \) es el número de grados de libertad.
  • \( \Gamma \) es la función gamma.

Ejemplo

Supongamos que tenemos una muestra de 10 estudiantes y queremos calcular el intervalo de confianza para la media de sus calificaciones con un nivel de confianza del 95%.

import scipy.stats as stats

# Parámetros
n = 10
media_muestra = 75
desviacion_estandar_muestra = 10
nivel_confianza = 0.95

# Cálculo del intervalo de confianza
grados_libertad = n - 1
t_critico = stats.t.ppf((1 + nivel_confianza) / 2, grados_libertad)
margen_error = t_critico * (desviacion_estandar_muestra / math.sqrt(n))

intervalo_confianza = (media_muestra - margen_error, media_muestra + margen_error)
print(f"El intervalo de confianza del 95% para la media es: {intervalo_confianza}")

Ejercicio Práctico

Supongamos que tenemos una muestra de 15 empleados y queremos calcular el intervalo de confianza para la media de sus salarios con un nivel de confianza del 99%. La media muestral es de $50,000 y la desviación estándar muestral es de $5,000.

Solución:

n = 15
media_muestra = 50000
desviacion_estandar_muestra = 5000
nivel_confianza = 0.99

grados_libertad = n - 1
t_critico = stats.t.ppf((1 + nivel_confianza) / 2, grados_libertad)
margen_error = t_critico * (desviacion_estandar_muestra / math.sqrt(n))

intervalo_confianza = (media_muestra - margen_error, media_muestra + margen_error)
print(f"El intervalo de confianza del 99% para la media es: {intervalo_confianza}")

  1. Distribución Chi-cuadrado

Conceptos Básicos

La distribución Chi-cuadrado es una distribución de probabilidad continua que se utiliza principalmente en pruebas de hipótesis y análisis de varianza. Es la distribución de la suma de los cuadrados de \( k \) variables aleatorias independientes y normalmente distribuidas con media cero y varianza uno.

Fórmula

La función de densidad de probabilidad de la distribución Chi-cuadrado está dada por:

\[ f(x; k) = \frac{1}{2^{k/2} \Gamma(k/2)} x^{(k/2)-1} e^{-x/2} \]

donde:

  • \( k \) es el número de grados de libertad.
  • \( \Gamma \) es la función gamma.

Ejemplo

Supongamos que queremos realizar una prueba de bondad de ajuste con 5 grados de libertad. ¿Cuál es el valor crítico de Chi-cuadrado para un nivel de significancia del 0.05?

import scipy.stats as stats

# Parámetros
grados_libertad = 5
nivel_significancia = 0.05

# Cálculo del valor crítico
valor_critico = stats.chi2.ppf(1 - nivel_significancia, grados_libertad)
print(f"El valor crítico de Chi-cuadrado para un nivel de significancia del 0.05 es: {valor_critico:.4f}")

Ejercicio Práctico

Supongamos que queremos realizar una prueba de independencia con 10 grados de libertad. ¿Cuál es el valor crítico de Chi-cuadrado para un nivel de significancia del 0.01?

Solución:

grados_libertad = 10
nivel_significancia = 0.01

valor_critico = stats.chi2.ppf(1 - nivel_significancia, grados_libertad)
print(f"El valor crítico de Chi-cuadrado para un nivel de significancia del 0.01 es: {valor_critico:.4f}")

  1. Distribución F

Conceptos Básicos

La distribución F es una distribución de probabilidad continua que se utiliza principalmente en análisis de varianza (ANOVA) y en pruebas de hipótesis para comparar dos varianzas. Es la distribución de la razón de dos variables aleatorias Chi-cuadrado independientes, cada una dividida por sus grados de libertad.

Fórmula

La función de densidad de probabilidad de la distribución F está dada por:

\[ f(x; d_1, d_2) = \frac{\left(\frac{d_1 x}{d_1 x + d_2}\right)^{d_1/2} \left(\frac{d_2}{d_1 x + d_2}\right)^{d_2/2}}{x B(d_1/2, d_2/2)} \]

donde:

  • \( d_1 \) y \( d_2 \) son los grados de libertad del numerador y denominador, respectivamente.
  • \( B \) es la función beta.

Ejemplo

Supongamos que queremos realizar una prueba de ANOVA con 3 y 20 grados de libertad. ¿Cuál es el valor crítico de F para un nivel de significancia del 0.05?

import scipy.stats as stats

# Parámetros
grados_libertad_numerador = 3
grados_libertad_denominador = 20
nivel_significancia = 0.05

# Cálculo del valor crítico
valor_critico = stats.f.ppf(1 - nivel_significancia, grados_libertad_numerador, grados_libertad_denominador)
print(f"El valor crítico de F para un nivel de significancia del 0.05 es: {valor_critico:.4f}")

Ejercicio Práctico

Supongamos que queremos realizar una prueba de ANOVA con 5 y 15 grados de libertad. ¿Cuál es el valor crítico de F para un nivel de significancia del 0.01?

Solución:

grados_libertad_numerador = 5
grados_libertad_denominador = 15
nivel_significancia = 0.01

valor_critico = stats.f.ppf(1 - nivel_significancia, grados_libertad_numerador, grados_libertad_denominador)
print(f"El valor crítico de F para un nivel de significancia del 0.01 es: {valor_critico:.4f}")

Conclusión

En esta sección, hemos explorado varias distribuciones de probabilidad importantes: Poisson, Exponencial, t de Student, Chi-cuadrado y F. Cada una de estas distribuciones tiene aplicaciones específicas en el análisis estadístico y es fundamental para realizar inferencias y pruebas de hipótesis. Asegúrate de practicar con los ejercicios proporcionados para reforzar tu comprensión de estos conceptos. En el próximo módulo, profundizaremos en la inferencia estadística, comenzando con la estimación de parámetros.

© Copyright 2024. Todos los derechos reservados