Introducción

Los gráficos de dispersión son una herramienta fundamental en la visualización de datos, especialmente útiles para mostrar la relación entre dos variables cuantitativas. En este módulo, aprenderás qué son los gráficos de dispersión, cómo interpretarlos y cómo crearlos utilizando diferentes herramientas.

Conceptos Básicos

¿Qué es un Gráfico de Dispersión?

Un gráfico de dispersión (scatter plot) es un tipo de gráfico que utiliza puntos para representar los valores de dos variables diferentes. Cada punto en el gráfico representa un par de valores.

¿Cuándo Usar un Gráfico de Dispersión?

  • Relación entre dos variables: Ideal para mostrar cómo una variable afecta a otra.
  • Identificación de patrones: Útil para detectar tendencias, correlaciones y agrupaciones.
  • Detección de valores atípicos: Ayuda a identificar outliers que no siguen el patrón general.

Componentes de un Gráfico de Dispersión

  • Eje X: Representa una de las variables.
  • Eje Y: Representa la otra variable.
  • Puntos: Cada punto representa un par de valores (x, y).

Ejemplos Prácticos

Ejemplo 1: Creación de un Gráfico de Dispersión en Excel

  1. Datos de Ejemplo: | Altura (cm) | Peso (kg) | |-------------|-----------| | 150 | 50 | | 160 | 55 | | 170 | 65 | | 180 | 70 | | 190 | 80 |

  2. Pasos:

    • Selecciona los datos.
    • Ve a la pestaña "Insertar".
    • Selecciona "Gráfico de Dispersión".
    • Ajusta los ejes y el título del gráfico.

Ejemplo 2: Creación de un Gráfico de Dispersión en Python con Matplotlib

import matplotlib.pyplot as plt

# Datos de ejemplo
altura = [150, 160, 170, 180, 190]
peso = [50, 55, 65, 70, 80]

# Crear el gráfico de dispersión
plt.scatter(altura, peso)

# Añadir etiquetas y título
plt.xlabel('Altura (cm)')
plt.ylabel('Peso (kg)')
plt.title('Relación entre Altura y Peso')

# Mostrar el gráfico
plt.show()

Ejemplo 3: Creación de un Gráfico de Dispersión en R con ggplot2

# Instalar y cargar ggplot2
install.packages("ggplot2")
library(ggplot2)

# Datos de ejemplo
datos <- data.frame(
  altura = c(150, 160, 170, 180, 190),
  peso = c(50, 55, 65, 70, 80)
)

# Crear el gráfico de dispersión
ggplot(datos, aes(x = altura, y = peso)) +
  geom_point() +
  labs(title = "Relación entre Altura y Peso", x = "Altura (cm)", y = "Peso (kg)")

Ejercicios Prácticos

Ejercicio 1: Gráfico de Dispersión en Excel

Datos: | Edad (años) | Ingreso ($) | |-------------|-------------| | 25 | 30000 | | 30 | 40000 | | 35 | 50000 | | 40 | 60000 | | 45 | 70000 |

Instrucciones:

  1. Crea un gráfico de dispersión en Excel utilizando los datos proporcionados.
  2. Ajusta los ejes y añade un título al gráfico.

Ejercicio 2: Gráfico de Dispersión en Python

Datos:

edad = [25, 30, 35, 40, 45]
ingreso = [30000, 40000, 50000, 60000, 70000]

Instrucciones:

  1. Utiliza Matplotlib para crear un gráfico de dispersión con los datos proporcionados.
  2. Añade etiquetas a los ejes y un título al gráfico.

Ejercicio 3: Gráfico de Dispersión en R

Datos:

datos <- data.frame(
  edad = c(25, 30, 35, 40, 45),
  ingreso = c(30000, 40000, 50000, 60000, 70000)
)

Instrucciones:

  1. Utiliza ggplot2 para crear un gráfico de dispersión con los datos proporcionados.
  2. Añade etiquetas a los ejes y un título al gráfico.

Soluciones

Solución 1: Gráfico de Dispersión en Excel

  1. Selecciona los datos.
  2. Ve a la pestaña "Insertar".
  3. Selecciona "Gráfico de Dispersión".
  4. Ajusta los ejes y el título del gráfico.

Solución 2: Gráfico de Dispersión en Python

import matplotlib.pyplot as plt

edad = [25, 30, 35, 40, 45]
ingreso = [30000, 40000, 50000, 60000, 70000]

plt.scatter(edad, ingreso)
plt.xlabel('Edad (años)')
plt.ylabel('Ingreso ($)')
plt.title('Relación entre Edad e Ingreso')
plt.show()

Solución 3: Gráfico de Dispersión en R

library(ggplot2)

datos <- data.frame(
  edad = c(25, 30, 35, 40, 45),
  ingreso = c(30000, 40000, 50000, 60000, 70000)
)

ggplot(datos, aes(x = edad, y = ingreso)) +
  geom_point() +
  labs(title = "Relación entre Edad e Ingreso", x = "Edad (años)", y = "Ingreso ($)")

Conclusión

En esta sección, hemos aprendido qué son los gráficos de dispersión, cuándo utilizarlos y cómo crearlos utilizando diferentes herramientas como Excel, Python (Matplotlib) y R (ggplot2). Los gráficos de dispersión son una herramienta poderosa para visualizar la relación entre dos variables y detectar patrones, tendencias y valores atípicos.

En el próximo tema, exploraremos los gráficos de pastel, otra herramienta útil para la visualización de datos.

© Copyright 2024. Todos los derechos reservados