Power Query es una herramienta de Microsoft que permite a los usuarios extraer, transformar y cargar (ETL) datos desde una variedad de fuentes. Es una parte integral de Power BI, Excel y otros productos de Microsoft, y facilita la preparación de datos para análisis y visualización. En este módulo, aprenderemos los conceptos básicos de Power Query, cómo acceder a él y cómo realizar algunas transformaciones iniciales.
Objetivos del Módulo
- Comprender qué es Power Query y su importancia.
- Aprender a acceder a Power Query en Power BI.
- Realizar transformaciones básicas de datos.
¿Qué es Power Query?
Power Query es una herramienta de ETL que permite:
- Extracción: Obtener datos de diversas fuentes como bases de datos, archivos de Excel, servicios web, etc.
- Transformación: Limpiar y modificar los datos para que estén en el formato adecuado para el análisis.
- Carga: Importar los datos transformados a Power BI para su visualización y análisis.
Características Clave de Power Query
- Interfaz de usuario intuitiva: Permite a los usuarios realizar transformaciones sin necesidad de escribir código.
- Conectividad: Soporta una amplia gama de fuentes de datos.
- Transformaciones avanzadas: Ofrece una variedad de opciones para limpiar y transformar datos.
- Automatización: Permite automatizar procesos de ETL mediante la creación de consultas reutilizables.
Accediendo a Power Query en Power BI
Para acceder a Power Query en Power BI Desktop, sigue estos pasos:
- Abrir Power BI Desktop: Inicia Power BI Desktop en tu computadora.
- Conectar a una fuente de datos:
- Haz clic en el botón "Obtener datos" en la cinta de opciones.
- Selecciona la fuente de datos deseada (por ejemplo, Excel, SQL Server, Web, etc.).
- Haz clic en "Conectar" y sigue las instrucciones para importar los datos.
- Abrir el Editor de Power Query:
- Una vez que los datos se han importado, haz clic en "Transformar datos" en la cinta de opciones.
- Esto abrirá el Editor de Power Query, donde puedes realizar transformaciones en los datos.
Realizando Transformaciones Básicas
Ejemplo Práctico: Limpieza de Datos
Supongamos que tenemos un archivo de Excel con datos de ventas que contiene algunas inconsistencias. Queremos limpiar estos datos antes de analizarlos.
- Cargar los datos:
- Conecta a la fuente de datos (archivo de Excel) y carga los datos en Power BI.
- Eliminar columnas innecesarias:
- En el Editor de Power Query, selecciona las columnas que no necesitas.
- Haz clic derecho y selecciona "Eliminar columnas".
- Eliminar filas duplicadas:
- Selecciona las columnas que deben ser únicas.
- En la cinta de opciones, haz clic en "Quitar duplicados".
- Cambiar el tipo de datos:
- Selecciona la columna que deseas cambiar.
- En la cinta de opciones, selecciona el tipo de datos adecuado (por ejemplo, "Fecha", "Número entero", etc.).
Ejemplo de Código en Power Query (M)
let Source = Excel.Workbook(File.Contents("C:\Ruta\A\TuArchivo.xlsx"), null, true), Ventas_Sheet = Source{[Name="Ventas"]}[Data], #"Columnas Eliminadas" = Table.RemoveColumns(Ventas_Sheet,{"ColumnaInnecesaria1", "ColumnaInnecesaria2"}), #"Filas Duplicadas Eliminadas" = Table.Distinct(#"Columnas Eliminadas"), #"Tipo de Datos Cambiado" = Table.TransformColumnTypes(#"Filas Duplicadas Eliminadas",{{"Fecha", type date}, {"Cantidad", Int64.Type}}) in #"Tipo de Datos Cambiado"
Explicación del Código
- Source: Carga el archivo de Excel.
- Ventas_Sheet: Selecciona la hoja de cálculo llamada "Ventas".
- #"Columnas Eliminadas": Elimina las columnas innecesarias.
- #"Filas Duplicadas Eliminadas": Elimina las filas duplicadas.
- #"Tipo de Datos Cambiado": Cambia el tipo de datos de las columnas especificadas.
Ejercicio Práctico
Ejercicio 1: Limpieza de Datos de Clientes
- Conectar a una fuente de datos: Importa un archivo de Excel que contenga datos de clientes.
- Eliminar columnas innecesarias: Elimina las columnas que no son relevantes para el análisis.
- Eliminar filas duplicadas: Asegúrate de que no haya duplicados en los datos.
- Cambiar el tipo de datos: Asegúrate de que las columnas tengan el tipo de datos correcto.
Solución del Ejercicio
let Source = Excel.Workbook(File.Contents("C:\Ruta\A\Clientes.xlsx"), null, true), Clientes_Sheet = Source{[Name="Clientes"]}[Data], #"Columnas Eliminadas" = Table.RemoveColumns(Clientes_Sheet,{"ColumnaInnecesaria1", "ColumnaInnecesaria2"}), #"Filas Duplicadas Eliminadas" = Table.Distinct(#"Columnas Eliminadas"), #"Tipo de Datos Cambiado" = Table.TransformColumnTypes(#"Filas Duplicadas Eliminadas",{{"FechaRegistro", type date}, {"Edad", Int64.Type}}) in #"Tipo de Datos Cambiado"
Conclusión
En este módulo, hemos aprendido los conceptos básicos de Power Query, cómo acceder a él en Power BI y cómo realizar algunas transformaciones iniciales. Estas habilidades son fundamentales para preparar los datos para su análisis y visualización en Power BI. En el próximo módulo, profundizaremos en técnicas más avanzadas de limpieza y transformación de datos.
Próximo Módulo: Limpieza y transformación de datos
Curso de Power BI
Módulo 1: Introducción a Power BI
- ¿Qué es Power BI?
- Instalación de Power BI Desktop
- Descripción general de la interfaz de Power BI
- Conectando a fuentes de datos
Módulo 2: Transformación y modelado de datos
- Introducción a Power Query
- Limpieza y transformación de datos
- Creación de relaciones entre tablas
- Mejores prácticas de modelado de datos
Módulo 3: Visualización de datos
- Creación de visualizaciones básicas
- Uso de filtros y segmentadores
- Personalización de visuales
- Creación y uso de jerarquías
Módulo 4: Análisis de datos avanzado
- Introducción a DAX
- Creación de columnas calculadas y medidas
- Funciones de inteligencia de tiempo
- Funciones avanzadas de DAX
Módulo 5: Informes y paneles
- Diseño de informes efectivos
- Creación de paneles interactivos
- Uso de marcadores y botones
- Publicación y compartición de informes
Módulo 6: Servicio de Power BI
- Introducción al servicio de Power BI
- Trabajo con espacios de trabajo
- Creación y gestión de flujos de datos
- Programación de actualización de datos
Módulo 7: Administración y seguridad de Power BI
- Gestión de permisos y roles
- Mejores prácticas de seguridad de datos
- Monitoreo y auditoría
- Gobernanza de Power BI