👋 ¡Hola! Soy Guillermo, un profesional con más de 10 años de experiencia liderando la convergencia entre ciencia de datos, modelamiento ambiental y geomática. Mi carrera se ha centrado en transformar datos crudos (satelitales, climáticos, territoriales) en soluciones estratégicas y productos de datos de alto impacto.
Como Consultor Senior y Coordinador Académico, mi trabajo abarca desde la dirección de consultorías complejas para la gran minería y el sector público, hasta la formación de la próxima generación de expertos en tecnología geoespacial. Este portafolio es una muestra de mi doble pasión: resolver problemas del mundo real con código y compartir ese conocimiento.
Geomática & Teledetección:
ArcGIS Pro/Online QGIS Google Earth Engine PostGIS GRASS SAGA FRAGSTATS
Ciencia de Datos & ML:
Python (Scikit-Learn, GeoPandas, Rasterio) R (Tidyverse, Caret, Shiny) SQL XGBoost SHAP
Modelamiento Ambiental:
MODFLOW WEAP CALPUFF AERMOD OpenAir (R) Stella Vensim
BI & Desarrollo Web:
Power BI R Shiny Leaflet React JavaScript HTML/CSS
Reproducible Hydroclimatic Analysis of Central Chile (2015-2024) Pipeline de Python automatizado para evaluar la disponibilidad hídrica y la sequía en Chile central usando datos ERA5-Land. Incluye cálculo de SPI, balance hídrico y análisis de tendencias.
🌬️ Análisis Eddy Patagonia-Chile Estudio completo · Ejemplo Colab
Estaciones para estudios ecosistémicos en Chile y la Patagonia (Eddy Covariance) Pipeline reproducible para descubrir, descargar, estandarizar y analizar datos de estaciones de covarianza de remolinos (eddy covariance) en Chile y Sudamérica austral. Integra 6 estaciones validadas con datos 2014–2024 (+11.000 observaciones estandarizadas), interfaz web interactiva y un notebook de Google Colab para demostración end-to-end de los flujos de carbono, agua y energía en ecosistemas patagónicos.
Advanced Spatial Analysis & Environmental Data Distribution Paquete de R para análisis espacial avanzado. Implementa GWR (Geographically Weighted Regression) con procesamiento en paralelo y técnicas de downscaling para variables ambientales.
ML Model Monitoring Framework Framework integral para detectar Data Drift y degradación de performance en modelos de producción, asegurando la trazabilidad en pipelines de datos territoriales.
Interactive Shiny-based GIS Tool Herramienta interactiva para análisis de ráster en tiempo real. Incluye filtrado de series temporales (Whittaker/Savitzky-Golay) y visualización dinámica para evaluaciones ambientales rápidas.
Specialized R Library for Agro-Climatic Analysis Librería de R especializada en la automatización de indicadores agroclimáticos (horas frío, acumulación térmica) para la agricultura de precisión.
Guía Técnica y Educativa sobre Datos Faltantes e Imputación Recurso técnico reproducible sobre estrategias para el manejo de valores ausentes en ciencia de datos. Cubre desde métodos simples (media, moda) hasta técnicas avanzadas (KNN, imputación múltiple), con código Python, visualizaciones y documentación completa publicada en GitHub Pages bajo licencia CC-BY 4.0.
Full-Stack Financial Dashboard Dashboard financiero (React/Vite) que consume APIs en tiempo real, aplica un algoritmo de scoring y genera recomendaciones de inversión.
Proyectos de análisis y modelamiento aplicados a sectores fuera del ámbito ambiental, orientados a negocio y sector público.
Análisis Estratégico del Mercado de Compras Públicas en Chile (2019–2025) Pipeline de análisis sobre más de 807.000 licitaciones de ChileCompra, con ETL para datasets de +30 GB, índice de oportunidad de mercado por sector y modelos Prophet/XGBoost para proyecciones 2025–2028. Identifica sectores con mayor crecimiento de demanda estatal e incluye visualizaciones interactivas publicadas vía GitHub Actions.
Pipeline ML End-to-End para Predicción de Churn en Telecomunicaciones Pipeline completo para identificar clientes en riesgo de abandono: ingeniería de características, comparación de modelos (XGBoost, LightGBM, Regresión Logística), manejo de desbalance con SMOTE e interpretabilidad con SHAP. Mejor modelo alcanza ROC-AUC de 0.85 sobre el dataset IBM Telco (7.043 clientes).
Segmentación de Clientes con RFM, K-Means y CLV para Telecomunicaciones Pipeline de segmentación no supervisada basado en análisis RFM, K-Means y clustering jerárquico, con estimación de Customer Lifetime Value (CLV) por segmento. Genera perfiles accionables con estrategias de retención, cross-selling y comunicación personalizadas para cada grupo de clientes.
Desarrollo de un método para estimar la distribución espacial de la precipitación mensual en alta resolución en el desierto de Atacama (Chile) a partir de productos CHIRPS Landing y repositorio dedicados a mi tesis de magíster en la Universidad de Chile, centrada en downscaling de precipitación, modelamiento espacial y análisis territorial del desierto de Atacama.
| Recurso | Enlace |
|---|---|
| Landing académica | https://djwillichile.github.io/tesis-atacama-chirps/ |
| Repositorio del proyecto | https://github.com/djwillichile/tesis-atacama-chirps |
| Repositorio institucional U. de Chile | https://repositorio.uchile.cl/handle/2250/200362 |
| PDF institucional | https://repositorio.uchile.cl/bitstream/handle/2250/200362/2022_Guillermo_Fuentes_Jaque.pdf |
- Investigación Científica: Autor de más de 15 publicaciones, incluyendo artículos en Scientific Reports (Nature), Remote Sensing e Hydrology. Mi trabajo se centra en la aplicación de teledetección para estudiar el cambio climático y sus efectos en recursos hídricos y ecosistemas.
- Consultoría Estratégica: He liderado y participado en proyectos de alto perfil para clientes como Anglo American, SQM, ENAP, Aguas Andinas, SAG, INE y CORFO, desarrollando desde líneas base ambientales y modelamiento de dispersión hasta el rediseño territorial para el Censo 2024.
- Liderazgo Académico: Como Coordinador y docente en 4 universidades chilenas (U. de Chile, U. San Sebastián, U. Mayor, U. Bernardo O'Higgins), he diseñado y liderado programas de formación en SIG, Data Science y Modelamiento Ambiental, además de dirigir capacitaciones para el sector público y privado.
Mi objetivo es doble: aplicar la ciencia y la tecnología para resolver los desafíos ambientales más urgentes de nuestro tiempo, y empoderar a otros para que hagan lo mismo.



