El análisis estadístico es una parte crucial de la investigación de mercado, ya que permite transformar los datos recolectados en información útil y accionable. En esta sección, aprenderás sobre los conceptos básicos del análisis estadístico, las técnicas más comunes y cómo aplicarlas en el contexto de la investigación de mercado.
Conceptos Básicos del Análisis Estadístico
- Estadística Descriptiva
La estadística descriptiva se utiliza para resumir y describir las características de un conjunto de datos. Los métodos más comunes incluyen:
- Medidas de Tendencia Central: Media, mediana y moda.
- Medidas de Dispersión: Rango, varianza y desviación estándar.
- Distribuciones de Frecuencia: Tablas y gráficos que muestran la frecuencia de diferentes valores en un conjunto de datos.
Ejemplo:
import numpy as np
# Datos de ejemplo: puntuaciones de satisfacción del cliente
data = [4, 5, 3, 4, 5, 2, 4, 5, 3, 4]
# Media
mean = np.mean(data)
print(f"Media: {mean}")
# Mediana
median = np.median(data)
print(f"Mediana: {median}")
# Moda
from scipy import stats
mode = stats.mode(data)
print(f"Moda: {mode.mode[0]}")
# Desviación estándar
std_dev = np.std(data)
print(f"Desviación estándar: {std_dev}")
- Estadística Inferencial
La estadística inferencial se utiliza para hacer generalizaciones sobre una población a partir de una muestra. Incluye técnicas como:
- Pruebas de Hipótesis: T-test, ANOVA, chi-cuadrado.
- Intervalos de Confianza: Rango de valores dentro del cual se espera que se encuentre un parámetro de la población.
- Regresión y Correlación: Análisis de la relación entre variables.
Ejemplo:
import pandas as pd
import statsmodels.api as sm
# Datos de ejemplo: ventas y gasto en publicidad
data = {
'ventas': [100, 150, 200, 250, 300],
'publicidad': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
# Variable dependiente y variable independiente
X = df['publicidad']
y = df['ventas']
# Añadir constante para el modelo
X = sm.add_constant(X)
# Modelo de regresión lineal
model = sm.OLS(y, X).fit()
predictions = model.predict(X)
# Resumen del modelo
print(model.summary())Técnicas Comunes de Análisis Estadístico
- Análisis de Varianza (ANOVA)
El ANOVA se utiliza para comparar las medias de tres o más grupos. Es útil para determinar si existen diferencias significativas entre los grupos.
Ejemplo:
import scipy.stats as stats
# Datos de ejemplo: puntuaciones de satisfacción de tres grupos de clientes
group1 = [4, 5, 3, 4, 5]
group2 = [2, 3, 4, 2, 3]
group3 = [5, 4, 5, 4, 5]
# ANOVA
f_val, p_val = stats.f_oneway(group1, group2, group3)
print(f"F-valor: {f_val}, P-valor: {p_val}")
- Prueba T
La prueba T se utiliza para comparar las medias de dos grupos. Puede ser una prueba T de muestras independientes o una prueba T de muestras relacionadas.
Ejemplo:
# Datos de ejemplo: puntuaciones de satisfacción antes y después de una intervención
before = [3, 4, 3, 4, 3]
after = [4, 5, 4, 5, 4]
# Prueba T de muestras relacionadas
t_stat, p_val = stats.ttest_rel(before, after)
print(f"T-valor: {t_stat}, P-valor: {p_val}")Herramientas de Análisis Estadístico
- Software de Análisis
- Excel: Herramientas básicas de análisis estadístico.
- SPSS: Software especializado en análisis estadístico.
- R: Lenguaje de programación para análisis estadístico y gráficos.
- Python: Bibliotecas como
pandas,numpy,scipyystatsmodelspara análisis estadístico.
- Visualización de Datos
- Gráficos de Barras y Columnas: Para comparar diferentes categorías.
- Histogramas: Para mostrar la distribución de una variable.
- Diagramas de Dispersión: Para analizar la relación entre dos variables.
- Boxplots: Para mostrar la distribución y los valores atípicos de una variable.
Ejemplo de Visualización:
import matplotlib.pyplot as plt
# Datos de ejemplo: puntuaciones de satisfacción del cliente
data = [4, 5, 3, 4, 5, 2, 4, 5, 3, 4]
# Histograma
plt.hist(data, bins=5, edgecolor='black')
plt.title('Distribución de Puntuaciones de Satisfacción')
plt.xlabel('Puntuación')
plt.ylabel('Frecuencia')
plt.show()Ejercicios Prácticos
Ejercicio 1: Estadística Descriptiva
Dado el siguiente conjunto de datos de ventas mensuales, calcula la media, mediana, moda y desviación estándar.
Ejercicio 2: Prueba T
Realiza una prueba T para comparar las puntuaciones de satisfacción del cliente antes y después de una campaña de marketing.
Ejercicio 3: Regresión Lineal
Utiliza los datos de ventas y gasto en publicidad para realizar un análisis de regresión lineal y determinar la relación entre estas dos variables.
data = {
'ventas': [100, 150, 200, 250, 300, 350, 400, 450, 500, 550],
'publicidad': [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
}Soluciones
Solución 1: Estadística Descriptiva
import numpy as np
from scipy import stats
ventas = [150, 200, 250, 300, 350, 400, 450, 500, 550, 600]
# Media
mean = np.mean(ventas)
print(f"Media: {mean}")
# Mediana
median = np.median(ventas)
print(f"Mediana: {median}")
# Moda
mode = stats.mode(ventas)
print(f"Moda: {mode.mode[0]}")
# Desviación estándar
std_dev = np.std(ventas)
print(f"Desviación estándar: {std_dev}")Solución 2: Prueba T
import scipy.stats as stats
before_campaign = [3, 4, 3, 4, 3, 4, 3, 4, 3, 4]
after_campaign = [4, 5, 4, 5, 4, 5, 4, 5, 4, 5]
# Prueba T de muestras relacionadas
t_stat, p_val = stats.ttest_rel(before_campaign, after_campaign)
print(f"T-valor: {t_stat}, P-valor: {p_val}")Solución 3: Regresión Lineal
import pandas as pd
import statsmodels.api as sm
data = {
'ventas': [100, 150, 200, 250, 300, 350, 400, 450, 500, 550],
'publicidad': [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
}
df = pd.DataFrame(data)
# Variable dependiente y variable independiente
X = df['publicidad']
y = df['ventas']
# Añadir constante para el modelo
X = sm.add_constant(X)
# Modelo de regresión lineal
model = sm.OLS(y, X).fit()
predictions = model.predict(X)
# Resumen del modelo
print(model.summary())Conclusión
En esta sección, hemos cubierto los conceptos básicos del análisis estadístico, incluyendo la estadística descriptiva e inferencial, y hemos explorado algunas técnicas comunes como el ANOVA y la prueba T. También hemos visto cómo utilizar herramientas de software para realizar análisis estadísticos y visualización de datos. Con estos conocimientos, estarás mejor preparado para analizar los datos de tu investigación de mercado y tomar decisiones informadas basadas en los resultados.
Curso de Investigación de Mercado
Módulo 1: Introducción a la Investigación de Mercado
Módulo 2: Diseño de la Investigación
Módulo 3: Recolección de Datos
- Fuentes de Datos Primarios y Secundarios
- Técnicas de Recolección de Datos
- Muestreo y Selección de la Muestra
