Soy Ingeniero en Información y Control de Gestión especializado en transformar ecosistemas de datos fragmentados en infraestructuras escalables de Big Data y Lakehouse . Mi enfoque combina la eficiencia técnica con el control de gestión para garantizar una Única Fuente de Verdad y optimizar la rentabilidad operativa mediante la automatización de pipelines de alta disponibilidad .
Actualmente lidero RootCode, diseñando arquitecturas modernas de datos y modelos de gobernanza (BI/ML) para empresas que requieren escalar su analítica eficientemente .
| Categoría | Herramientas & Frameworks |
|---|---|
| Data Engineering | Azure Databricks, Apache Spark (PySpark), Delta Lake, Medallion Architecture |
| Orquestación & CI/CD | Apache Airflow, Kedro, dbt (Core/Cloud), GitHub Actions, Terraform (IaC) |
| Cloud & Storage | Azure, GCP (BigQuery), AWS, Snowflake, MinIO (S3) |
| Bases de Datos | SQL Avanzado (PostgreSQL, T-SQL, MySQL), MongoDB |
| Gobernanza & Calidad | Great Expectations, Unity Catalog, dbt tests, Deequ, Data Catalog |
| Infraestructura | Docker, Docker Compose, Git/GitHub |
- Eficiencia en Azure: Reducción del 25% en el tiempo de procesamiento y entrega de datos médicos masivos mediante Spark SQL y Databricks .
- Optimización Comercial: Reducción del 30% en la carga operativa mediante el diseño de Data Marts bajo metodología Kimball .
- Calidad de Datos: Integridad del 99.38% en capas Gold, eliminando ruidos geoespaciales y registros inconsistentes .
- Rendimiento Marketing: Incremento del 20% en la eficiencia de gestión de audiencias en BigQuery .
- Core: Ingesta y Storage en Data Lake (MinIO/S3) con validación de esquemas y enriquecimiento vía API REST .
- Detección: Lógica para identificar anomalías mediante segmentación de flujos y alertas en tiempo real con Apache Kafka .
- Stack: Python, Kafka, PostgreSQL, Docker, MinIO .
- Core: Arquitectura Medallion en ADLS Gen2 con procesamiento distribuido en PySpark para +19M de registros .
- Analytics: Modelado para análisis de rentabilidad por zona orquestado con Kedro, garantizando la disponibilidad de activos analíticos .
- Stack: PySpark, Azure Databricks, Delta Lake, Kedro, Power BI .
- LinkedIn: in/javierlopez-iicg
- Website: rootcode.cl
- Email: javier.lopez.iicg@gmail.com
- Ubicación: Puerto Montt, Chile 🇨🇱
