Rescatando el Legado con el Poder del ETL
Objetivo General
El estudiante diseñará y ejecutará un flujo de trabajo de Extracción, Transformación y Carga (ETL) utilizando un conjunto de datos desordenado para generar un tablero de control que permita tomar decisiones estratégicas basadas en evidencia.
Introducción Contextual
¡Bienvenido al equipo de analítica de "La Herencia"! Al igual que Mateo, te has encontrado con un desastre: los datos de ventas están en un archivo, el inventario en otro, y las ubicaciones geográficas tienen errores de escritura. Si no logramos consolidar esta información hoy mismo, la empresa seguirá enviando botas de nieve al desierto. Tu misión es limpiar el caos y encender la luz de la inteligencia de negocios.
Duración Estimada
- En el aula: 90 minutos.
- Trabajo independiente: 60 minutos (Refinamiento de visualización y reporte).
Materiales o Recursos Necesarios
- Computadora con conexión a internet.
- Software: Microsoft Excel / Google Sheets (para el proceso manual) o Power BI / Tableau (para el proceso automatizado).
- Set de datos "La Herencia" (proporcionado por el docente en formato CSV o XLSX).
Instrucciones Paso a Paso
1. Extracción (The Hunt)
- Identifica y abre las tres fuentes de datos:
Ventas_2025.csv,Inventario_Maestro.xlsxyClientes_Region.csv. - Verifica que los archivos se abran correctamente y que los encabezados sean legibles.
2. Transformación: Limpieza de Ruido
- Estandarización: Busca nombres de ciudades mal escritos (ej. "Meksico", "México", "CDMX") y unifícalos bajo un solo nombre.
- Tratamiento de nulos: Identifica filas con valores vacíos en la columna "Precio" y asígnales el valor promedio o elimínalas si no tienen salvación.
- Conversión de Tipos: Asegúrate de que las fechas tengan formato de fecha y los valores monetarios sean numéricos.
3. Transformación: Enriquecimiento (Merge)
- Utiliza una función de búsqueda (como
BUSCARVoMergeen Power Query) para unir la tabla de ventas con la de inventario usando el ID de Producto como llave común. - Calcula una nueva columna llamada "Stock Crítico": Resta las ventas del inventario actual.
4. Carga (The Warehouse)
- Carga tus datos limpios y combinados en una nueva hoja de cálculo "Maestra" o en el modelo de datos de tu herramienta de visualización. Este será tu "Data Warehouse" miniatura.
5. Visualización (La Luz)
- Crea un gráfico de barras que muestre las ventas por región.
- Crea un mapa de calor que identifique dónde hay exceso de stock (productos que no se venden).
Recomendaciones
- Cuestiona todo: Si un dato parece demasiado alto o bajo, probablemente sea un error de carga.
- Orden ante todo: Ponle nombres claros a tus columnas y tablas desde el principio.
- Itera: No intentes que el gráfico sea perfecto a la primera; primero asegúrate de que el dato es correcto.
- Piensa en el usuario: Diseña tu tablero para que el papá de Mateo (que no sabe de tecnología) pueda entenderlo en 10 segundos.
- No borres, transforma: Guarda siempre una copia de los datos originales antes de empezar a limpiar.
Posible Problema y Solución Rápida
- Problema: "Al intentar unir las tablas, todos los valores me aparecen como
#N/Ao vacíos". - Solución: Revisa que el ID de Producto en ambas tablas sea del mismo tipo (ambos números o ambos texto). A veces un espacio invisible al final del código rompe la conexión.
