Skip to content
View J-Lopez-IICG's full-sized avatar
🎯
Focusing
🎯
Focusing

Block or report J-Lopez-IICG

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
J-Lopez-IICG/README.md

Javier Ignacio López Marín 🚀

Data Solutions Architect | Analytics Engineer Specialist

LinkedIn Portfolio Email


👨‍💻 Sobre mí

Soy Ingeniero en Información y Control de Gestión especializado en transformar ecosistemas de datos fragmentados en infraestructuras escalables de Big Data y Lakehouse . Mi enfoque combina la eficiencia técnica con el control de gestión para garantizar una Única Fuente de Verdad y optimizar la rentabilidad operativa mediante la automatización de pipelines de alta disponibilidad .

Actualmente lidero RootCode, diseñando arquitecturas modernas de datos y modelos de gobernanza (BI/ML) para empresas que requieren escalar su analítica eficientemente .


🛠️ Stack Tecnológico

Categoría Herramientas & Frameworks
Data Engineering Azure Databricks, Apache Spark (PySpark), Delta Lake, Medallion Architecture
Orquestación & CI/CD Apache Airflow, Kedro, dbt (Core/Cloud), GitHub Actions, Terraform (IaC)
Cloud & Storage Azure, GCP (BigQuery), AWS, Snowflake, MinIO (S3)
Bases de Datos SQL Avanzado (PostgreSQL, T-SQL, MySQL), MongoDB
Gobernanza & Calidad Great Expectations, Unity Catalog, dbt tests, Deequ, Data Catalog
Infraestructura Docker, Docker Compose, Git/GitHub

📈 Impacto Comprobado en Cifras

  • Eficiencia en Azure: Reducción del 25% en el tiempo de procesamiento y entrega de datos médicos masivos mediante Spark SQL y Databricks .
  • Optimización Comercial: Reducción del 30% en la carga operativa mediante el diseño de Data Marts bajo metodología Kimball .
  • Calidad de Datos: Integridad del 99.38% en capas Gold, eliminando ruidos geoespaciales y registros inconsistentes .
  • Rendimiento Marketing: Incremento del 20% en la eficiencia de gestión de audiencias en BigQuery .

🌟 Proyectos Destacados

  • Core: Ingesta y Storage en Data Lake (MinIO/S3) con validación de esquemas y enriquecimiento vía API REST .
  • Detección: Lógica para identificar anomalías mediante segmentación de flujos y alertas en tiempo real con Apache Kafka .
  • Stack: Python, Kafka, PostgreSQL, Docker, MinIO .
  • Core: Arquitectura Medallion en ADLS Gen2 con procesamiento distribuido en PySpark para +19M de registros .
  • Analytics: Modelado para análisis de rentabilidad por zona orquestado con Kedro, garantizando la disponibilidad de activos analíticos .
  • Stack: PySpark, Azure Databricks, Delta Lake, Kedro, Power BI .

📫 Conectemos

Pinned Loading

  1. Technical-Challenge-JavierLopez Technical-Challenge-JavierLopez Public

    Pipeline de Datos End-to-End para Fintech: Ingesta Batch/Streaming con Airflow, Kafka, MinIO (S3) y PostgreSQL (Star Schema).

    Python

  2. Lomar-ModernStack Lomar-ModernStack Public

    Pipeline End-to-End de Modern Data Stack para el análisis de producción. Implementa orquestación avanzada con Airflow y Kedro, procesamiento distribuido con PySpark y persistencia en Google Cloud S…

    Python 1

  3. NY-TripData-Databricks NY-TripData-Databricks Public

    Pipeline ELT End-to-End para datos de NYC Taxi. Implementación de Arquitectura Medallion usando Azure Databricks, Spark SQL, Kedro y Power BI.

    Python 1

  4. MedicalCost-RegressionAndClassification MedicalCost-RegressionAndClassification Public

    Este proyecto predice costos de seguros médicos y clasifica el riesgo de pacientes. Se usó modelos de Regresión para costos además de optimizar múltiples Modelos de Clasificación.

    Jupyter Notebook 1

  5. LifeStyle-DBT LifeStyle-DBT Public

    Este proyecto dbt transforma datos brutos de estilo de vida en un formato estructurado y analizable, utilizando un enfoque por capas para asegurar calidad y consistencia, listo para informes y anál…

    1

  6. RentaPtoMontt-WebScraping.PowerBI RentaPtoMontt-WebScraping.PowerBI Public

    Este proyecto extrae datos usando Web Scraping y API's para poseer el precio en tiempo real en UF, con resultados en Power BI.

    Jupyter Notebook 1