La representación gráfica de datos es una herramienta fundamental en estadística que permite visualizar y comprender mejor la información contenida en un conjunto de datos. A través de gráficos, podemos identificar patrones, tendencias y anomalías de manera más intuitiva que con tablas de números. En esta sección, exploraremos los tipos más comunes de gráficos y cómo se utilizan.

Objetivos de Aprendizaje

Al finalizar esta sección, deberías ser capaz de:

  1. Identificar y describir los diferentes tipos de gráficos estadísticos.
  2. Seleccionar el tipo de gráfico adecuado para representar un conjunto de datos específico.
  3. Crear gráficos básicos utilizando herramientas estadísticas.

Tipos de Gráficos

  1. Gráficos de Barras

Los gráficos de barras son útiles para comparar cantidades entre diferentes categorías.

Ejemplo:

Categoría | Cantidad
---------------------
A         | 10
B         | 15
C         | 7
D         | 20

Código en Python:

import matplotlib.pyplot as plt

categorias = ['A', 'B', 'C', 'D']
cantidades = [10, 15, 7, 20]

plt.bar(categorias, cantidades)
plt.xlabel('Categoría')
plt.ylabel('Cantidad')
plt.title('Gráfico de Barras')
plt.show()

  1. Histogramas

Los histogramas son útiles para mostrar la distribución de una variable continua.

Ejemplo:

Valores: [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5]

Código en Python:

import matplotlib.pyplot as plt

valores = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5]

plt.hist(valores, bins=5, edgecolor='black')
plt.xlabel('Valor')
plt.ylabel('Frecuencia')
plt.title('Histograma')
plt.show()

  1. Gráficos de Líneas

Los gráficos de líneas son ideales para mostrar tendencias a lo largo del tiempo.

Ejemplo:

Mes   | Ventas
--------------
Enero | 100
Feb   | 120
Mar   | 140
Abr   | 130

Código en Python:

import matplotlib.pyplot as plt

meses = ['Enero', 'Feb', 'Mar', 'Abr']
ventas = [100, 120, 140, 130]

plt.plot(meses, ventas, marker='o')
plt.xlabel('Mes')
plt.ylabel('Ventas')
plt.title('Gráfico de Líneas')
plt.show()

  1. Diagramas de Dispersión

Los diagramas de dispersión son útiles para mostrar la relación entre dos variables continuas.

Ejemplo:

Horas de Estudio | Calificación
-------------------------------
1                | 50
2                | 55
3                | 65
4                | 70
5                | 80

Código en Python:

import matplotlib.pyplot as plt

horas_estudio = [1, 2, 3, 4, 5]
calificaciones = [50, 55, 65, 70, 80]

plt.scatter(horas_estudio, calificaciones)
plt.xlabel('Horas de Estudio')
plt.ylabel('Calificación')
plt.title('Diagrama de Dispersión')
plt.show()

  1. Gráficos de Sectores (Pastel)

Los gráficos de sectores son útiles para mostrar proporciones de un todo.

Ejemplo:

Categoría | Porcentaje
----------------------
A         | 25%
B         | 35%
C         | 20%
D         | 20%

Código en Python:

import matplotlib.pyplot as plt

categorias = ['A', 'B', 'C', 'D']
porcentajes = [25, 35, 20, 20]

plt.pie(porcentajes, labels=categorias, autopct='%1.1f%%')
plt.title('Gráfico de Sectores')
plt.show()

Ejercicios Prácticos

Ejercicio 1: Crear un Gráfico de Barras

Dado el siguiente conjunto de datos, crea un gráfico de barras.

Producto | Ventas
-----------------
P1       | 30
P2       | 45
P3       | 20
P4       | 50

Solución:

import matplotlib.pyplot as plt

productos = ['P1', 'P2', 'P3', 'P4']
ventas = [30, 45, 20, 50]

plt.bar(productos, ventas)
plt.xlabel('Producto')
plt.ylabel('Ventas')
plt.title('Ventas por Producto')
plt.show()

Ejercicio 2: Crear un Histograma

Dado el siguiente conjunto de datos, crea un histograma.

Edades: [22, 25, 25, 27, 30, 30, 30, 32, 35, 35, 35, 35, 40, 40, 45]

Solución:

import matplotlib.pyplot as plt

edades = [22, 25, 25, 27, 30, 30, 30, 32, 35, 35, 35, 35, 40, 40, 45]

plt.hist(edades, bins=5, edgecolor='black')
plt.xlabel('Edad')
plt.ylabel('Frecuencia')
plt.title('Histograma de Edades')
plt.show()

Ejercicio 3: Crear un Diagrama de Dispersión

Dado el siguiente conjunto de datos, crea un diagrama de dispersión.

Horas de Sueño | Rendimiento
----------------------------
6              | 70
7              | 75
8              | 80
9              | 85
10             | 90

Solución:

import matplotlib.pyplot as plt

horas_sueno = [6, 7, 8, 9, 10]
rendimiento = [70, 75, 80, 85, 90]

plt.scatter(horas_sueno, rendimiento)
plt.xlabel('Horas de Sueño')
plt.ylabel('Rendimiento')
plt.title('Diagrama de Dispersión: Sueño vs Rendimiento')
plt.show()

Resumen

En esta sección, hemos explorado varios tipos de gráficos estadísticos, incluyendo gráficos de barras, histogramas, gráficos de líneas, diagramas de dispersión y gráficos de sectores. Cada tipo de gráfico tiene su propio uso y es importante seleccionar el adecuado según el tipo de datos y el mensaje que se desea transmitir. Además, hemos practicado la creación de estos gráficos utilizando Python y la biblioteca matplotlib.

En la siguiente sección, profundizaremos en los conceptos básicos de probabilidad, que son fundamentales para el análisis estadístico avanzado.

© Copyright 2024. Todos los derechos reservados