Power Query es una herramienta de Microsoft que permite a los usuarios extraer, transformar y cargar (ETL) datos desde una variedad de fuentes. Es una parte integral de Power BI, Excel y otros productos de Microsoft, y facilita la preparación de datos para análisis y visualización. En este módulo, aprenderemos los conceptos básicos de Power Query, cómo acceder a él y cómo realizar algunas transformaciones iniciales.

Objetivos del Módulo

  • Comprender qué es Power Query y su importancia.
  • Aprender a acceder a Power Query en Power BI.
  • Realizar transformaciones básicas de datos.

¿Qué es Power Query?

Power Query es una herramienta de ETL que permite:

  • Extracción: Obtener datos de diversas fuentes como bases de datos, archivos de Excel, servicios web, etc.
  • Transformación: Limpiar y modificar los datos para que estén en el formato adecuado para el análisis.
  • Carga: Importar los datos transformados a Power BI para su visualización y análisis.

Características Clave de Power Query

  • Interfaz de usuario intuitiva: Permite a los usuarios realizar transformaciones sin necesidad de escribir código.
  • Conectividad: Soporta una amplia gama de fuentes de datos.
  • Transformaciones avanzadas: Ofrece una variedad de opciones para limpiar y transformar datos.
  • Automatización: Permite automatizar procesos de ETL mediante la creación de consultas reutilizables.

Accediendo a Power Query en Power BI

Para acceder a Power Query en Power BI Desktop, sigue estos pasos:

  1. Abrir Power BI Desktop: Inicia Power BI Desktop en tu computadora.
  2. Conectar a una fuente de datos:
    • Haz clic en el botón "Obtener datos" en la cinta de opciones.
    • Selecciona la fuente de datos deseada (por ejemplo, Excel, SQL Server, Web, etc.).
    • Haz clic en "Conectar" y sigue las instrucciones para importar los datos.
  3. Abrir el Editor de Power Query:
    • Una vez que los datos se han importado, haz clic en "Transformar datos" en la cinta de opciones.
    • Esto abrirá el Editor de Power Query, donde puedes realizar transformaciones en los datos.

Realizando Transformaciones Básicas

Ejemplo Práctico: Limpieza de Datos

Supongamos que tenemos un archivo de Excel con datos de ventas que contiene algunas inconsistencias. Queremos limpiar estos datos antes de analizarlos.

  1. Cargar los datos:
    • Conecta a la fuente de datos (archivo de Excel) y carga los datos en Power BI.
  2. Eliminar columnas innecesarias:
    • En el Editor de Power Query, selecciona las columnas que no necesitas.
    • Haz clic derecho y selecciona "Eliminar columnas".
  3. Eliminar filas duplicadas:
    • Selecciona las columnas que deben ser únicas.
    • En la cinta de opciones, haz clic en "Quitar duplicados".
  4. Cambiar el tipo de datos:
    • Selecciona la columna que deseas cambiar.
    • En la cinta de opciones, selecciona el tipo de datos adecuado (por ejemplo, "Fecha", "Número entero", etc.).

Ejemplo de Código en Power Query (M)

let
    Source = Excel.Workbook(File.Contents("C:\Ruta\A\TuArchivo.xlsx"), null, true),
    Ventas_Sheet = Source{[Name="Ventas"]}[Data],
    #"Columnas Eliminadas" = Table.RemoveColumns(Ventas_Sheet,{"ColumnaInnecesaria1", "ColumnaInnecesaria2"}),
    #"Filas Duplicadas Eliminadas" = Table.Distinct(#"Columnas Eliminadas"),
    #"Tipo de Datos Cambiado" = Table.TransformColumnTypes(#"Filas Duplicadas Eliminadas",{{"Fecha", type date}, {"Cantidad", Int64.Type}})
in
    #"Tipo de Datos Cambiado"

Explicación del Código

  • Source: Carga el archivo de Excel.
  • Ventas_Sheet: Selecciona la hoja de cálculo llamada "Ventas".
  • #"Columnas Eliminadas": Elimina las columnas innecesarias.
  • #"Filas Duplicadas Eliminadas": Elimina las filas duplicadas.
  • #"Tipo de Datos Cambiado": Cambia el tipo de datos de las columnas especificadas.

Ejercicio Práctico

Ejercicio 1: Limpieza de Datos de Clientes

  1. Conectar a una fuente de datos: Importa un archivo de Excel que contenga datos de clientes.
  2. Eliminar columnas innecesarias: Elimina las columnas que no son relevantes para el análisis.
  3. Eliminar filas duplicadas: Asegúrate de que no haya duplicados en los datos.
  4. Cambiar el tipo de datos: Asegúrate de que las columnas tengan el tipo de datos correcto.

Solución del Ejercicio

let
    Source = Excel.Workbook(File.Contents("C:\Ruta\A\Clientes.xlsx"), null, true),
    Clientes_Sheet = Source{[Name="Clientes"]}[Data],
    #"Columnas Eliminadas" = Table.RemoveColumns(Clientes_Sheet,{"ColumnaInnecesaria1", "ColumnaInnecesaria2"}),
    #"Filas Duplicadas Eliminadas" = Table.Distinct(#"Columnas Eliminadas"),
    #"Tipo de Datos Cambiado" = Table.TransformColumnTypes(#"Filas Duplicadas Eliminadas",{{"FechaRegistro", type date}, {"Edad", Int64.Type}})
in
    #"Tipo de Datos Cambiado"

Conclusión

En este módulo, hemos aprendido los conceptos básicos de Power Query, cómo acceder a él en Power BI y cómo realizar algunas transformaciones iniciales. Estas habilidades son fundamentales para preparar los datos para su análisis y visualización en Power BI. En el próximo módulo, profundizaremos en técnicas más avanzadas de limpieza y transformación de datos.


Próximo Módulo: Limpieza y transformación de datos

© Copyright 2024. Todos los derechos reservados