El análisis de regresión es una técnica estadística utilizada para modelar y analizar la relación entre una variable dependiente y una o más variables independientes. Este método permite predecir el valor de la variable dependiente basado en los valores de las variables independientes.

Conceptos Clave

  1. Variable Dependiente (Y): La variable que se desea predecir o explicar.
  2. Variable Independiente (X): La variable que se utiliza para predecir la variable dependiente.
  3. Modelo de Regresión Lineal: Una ecuación que describe la relación lineal entre la variable dependiente y una o más variables independientes.
  4. Coeficientes de Regresión: Los valores que multiplican a las variables independientes en el modelo de regresión.
  5. Error Residual: La diferencia entre el valor observado y el valor predicho por el modelo.

Modelo de Regresión Lineal Simple

El modelo de regresión lineal simple se representa con la siguiente ecuación:

\[ Y = \beta_0 + \beta_1 X + \epsilon \]

Donde:

  • \( Y \) es la variable dependiente.
  • \( X \) es la variable independiente.
  • \( \beta_0 \) es el intercepto del modelo.
  • \( \beta_1 \) es el coeficiente de regresión.
  • \( \epsilon \) es el término de error.

Ejemplo Práctico

Supongamos que queremos predecir el precio de una casa (Y) basado en su tamaño en pies cuadrados (X). Los datos recolectados son los siguientes:

Tamaño (X) Precio (Y)
1500 300000
1600 320000
1700 340000
1800 360000
1900 380000

Para encontrar el modelo de regresión, necesitamos calcular los coeficientes \( \beta_0 \) y \( \beta_1 \).

Cálculo de los Coeficientes

Los coeficientes se calculan utilizando las siguientes fórmulas:

\[ \beta_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2} \]

\[ \beta_0 = \bar{Y} - \beta_1 \bar{X} \]

Donde \( \bar{X} \) y \( \bar{Y} \) son las medias de \( X \) y \( Y \), respectivamente.

Paso 1: Calcular las Medias

\[ \bar{X} = \frac{1500 + 1600 + 1700 + 1800 + 1900}{5} = 1700 \]

\[ \bar{Y} = \frac{300000 + 320000 + 340000 + 360000 + 380000}{5} = 340000 \]

Paso 2: Calcular \( \beta_1 \)

\[ \beta_1 = \frac{(1500-1700)(300000-340000) + (1600-1700)(320000-340000) + (1700-1700)(340000-340000) + (1800-1700)(360000-340000) + (1900-1700)(380000-340000)}{(1500-1700)^2 + (1600-1700)^2 + (1700-1700)^2 + (1800-1700)^2 + (1900-1700)^2} \]

\[ \beta_1 = \frac{(-200)(-40000) + (-100)(-20000) + (0)(0) + (100)(20000) + (200)(40000)}{(-200)^2 + (-100)^2 + (0)^2 + (100)^2 + (200)^2} \]

\[ \beta_1 = \frac{8000000 + 2000000 + 0 + 2000000 + 8000000}{40000 + 10000 + 0 + 10000 + 40000} \]

\[ \beta_1 = \frac{20000000}{100000} = 200 \]

Paso 3: Calcular \( \beta_0 \)

\[ \beta_0 = 340000 - 200 \times 1700 \]

\[ \beta_0 = 340000 - 340000 = 0 \]

Por lo tanto, el modelo de regresión es:

\[ Y = 200X \]

Interpretación del Modelo

El modelo indica que por cada incremento de un pie cuadrado en el tamaño de la casa, el precio de la casa aumenta en $200.

Ejercicios Prácticos

Ejercicio 1

Dado el siguiente conjunto de datos, encuentra el modelo de regresión lineal simple:

X Y
1 2
2 3
3 5
4 4
5 6

Solución

  1. Calcular las medias:

\[ \bar{X} = \frac{1 + 2 + 3 + 4 + 5}{5} = 3 \]

\[ \bar{Y} = \frac{2 + 3 + 5 + 4 + 6}{5} = 4 \]

  1. Calcular \( \beta_1 \):

\[ \beta_1 = \frac{(1-3)(2-4) + (2-3)(3-4) + (3-3)(5-4) + (4-3)(4-4) + (5-3)(6-4)}{(1-3)^2 + (2-3)^2 + (3-3)^2 + (4-3)^2 + (5-3)^2} \]

\[ \beta_1 = \frac{(-2)(-2) + (-1)(-1) + (0)(1) + (1)(0) + (2)(2)}{(-2)^2 + (-1)^2 + (0)^2 + (1)^2 + (2)^2} \]

\[ \beta_1 = \frac{4 + 1 + 0 + 0 + 4}{4 + 1 + 0 + 1 + 4} \]

\[ \beta_1 = \frac{9}{10} = 0.9 \]

  1. Calcular \( \beta_0 \):

\[ \beta_0 = 4 - 0.9 \times 3 \]

\[ \beta_0 = 4 - 2.7 = 1.3 \]

Por lo tanto, el modelo de regresión es:

\[ Y = 0.9X + 1.3 \]

Ejercicio 2

Utiliza el modelo de regresión obtenido en el Ejercicio 1 para predecir el valor de \( Y \) cuando \( X = 6 \).

Solución

\[ Y = 0.9 \times 6 + 1.3 \]

\[ Y = 5.4 + 1.3 = 6.7 \]

Por lo tanto, cuando \( X = 6 \), el valor predicho de \( Y \) es 6.7.

Conclusión

El análisis de regresión es una herramienta poderosa para entender y predecir relaciones entre variables. En esta sección, hemos cubierto los conceptos básicos del modelo de regresión lineal simple, cómo calcular los coeficientes de regresión y cómo interpretar el modelo. En los siguientes módulos, exploraremos modelos de regresión más complejos y sus aplicaciones prácticas.

© Copyright 2024. Todos los derechos reservados