1. Contexto del proyecto
Este proyecto analiza el comportamiento operativo de una turbina de gas industrial utilizada para generación de energía, con el objetivo de estudiar la relación entre variables ambientales, térmicas y de presión sobre dos dimensiones críticas del sistema: el rendimiento energético y las emisiones contaminantes.
El análisis se enfoca en variables como la temperatura de entrada a la turbina, la presión de descarga del compresor, la presión de escape, la energía generada y las emisiones de CO y NOx. A partir de estas variables, el proyecto busca identificar condiciones de operación más favorables, donde la turbina pueda producir mayor energía mientras mantiene menores niveles de emisiones.
La optimización no se plantea como un control automático en tiempo real, sino como una metodología analítica basada en datos históricos. Primero se realiza un análisis exploratorio para comprender los patrones del sistema, luego se evalúan modelos predictivos para estimar el comportamiento de la turbina y finalmente se construye un subconjunto de condiciones óptimas mediante un criterio estadístico basado en percentiles.
2. Herramientas utilizadas
- Python: limpieza, exploración, análisis estadístico y preparación de datos.
- Pandas: transformación del dataset, creación de subconjuntos analíticos y cálculo de condiciones óptimas.
- Scikit-learn: entrenamiento y evaluación de modelos de regresión.
- XGBoost: modelado predictivo para estimar energía generada y emisiones.
- Power BI: diseño del dashboard interactivo, visualización operativa y storytelling industrial.
- DAX: creación de KPIs, métricas comparativas y medidas para análisis dinámico.
- Power Query: ajustes de datos y preparación final para visualización.
3. Demostración en video
En este video presento una navegación guiada por el proyecto, explicando el funcionamiento general de una turbina de gas, el análisis exploratorio de variables operativas, el desempeño de los modelos predictivos y la identificación de condiciones óptimas mediante percentiles.
Video próximamente: esta sección quedará lista para insertar el enlace de YouTube una vez que la demostración final sea publicada.
4. Capturas del dashboard
A continuación se muestran las principales etapas del proyecto: la comprensión del funcionamiento de la turbina, el resumen ejecutivo del sistema, el análisis exploratorio, la evaluación predictiva y la identificación de condiciones operativas óptimas.
Funcionamiento de una turbina de gas industrial
Esta sección introduce el contexto técnico del proyecto mediante una explicación visual del funcionamiento de una turbina de gas. Se presentan las principales etapas del proceso: entrada de aire, compresión, combustión, expansión, escape y generación eléctrica.
El objetivo de esta imagen es ayudar al lector a entender por qué variables como la presión del compresor, la temperatura de entrada a la turbina, la presión de escape y las emisiones tienen relevancia directa en el desempeño del sistema. Antes de analizar datos o modelos, esta vista establece la lógica física y operativa del proceso.
Resumen ejecutivo del desempeño operativo
Esta vista resume los principales indicadores del sistema: energía generada promedio, emisiones promedio de CO y NOx, número de observaciones óptimas y desempeño global del modelo predictivo. También muestra la relación entre TEY y NOx, la distribución entre condiciones óptimas y no óptimas, y una matriz de correlación entre variables clave.
El propósito de esta página es ofrecer una visión ejecutiva del sistema. Permite identificar rápidamente que las condiciones óptimas representan una porción específica del dataset y que existen relaciones importantes entre variables operativas como TIT, CDP, GTEP y la energía generada por la turbina.
Análisis exploratorio de variables operativas y emisiones
Esta página profundiza en la distribución y relación entre las variables más relevantes del sistema. Se analizan las distribuciones de TEY, CO y NOx, junto con gráficos de dispersión que muestran relaciones entre variables como TIT vs TEY, CO vs NOx y CDP vs TEY.
El análisis exploratorio permitió identificar patrones clave: la energía generada se relaciona fuertemente con variables operativas como la temperatura de entrada a la turbina y la presión de descarga del compresor, mientras que las emisiones presentan comportamientos diferenciados. Esta etapa fue fundamental para definir posteriormente el criterio estadístico de condiciones óptimas.
Modelado predictivo de energía y emisiones
En esta sección se comparan modelos de regresión para predecir tres variables objetivo: energía generada por la turbina, emisiones de CO y emisiones de NOx. Se evaluaron modelos individuales y un enfoque multisalida, donde XGBoost mostró el mejor desempeño global en términos de error.
Los gráficos de valores reales vs predichos permiten evaluar visualmente la capacidad del modelo para capturar el comportamiento del sistema. El modelado predictivo no se utilizó directamente para seleccionar las condiciones óptimas, sino como una capa analítica para validar que las variables operativas contienen información suficiente para explicar y anticipar el desempeño energético y ambiental de la turbina.
Condiciones operativas óptimas mediante percentiles
Esta página presenta el resultado final del análisis: la identificación de un subconjunto de 1.031 observaciones consideradas óptimas. Estas observaciones fueron seleccionadas mediante un criterio estadístico basado en percentiles: energía generada en el cuartil superior y emisiones de CO y NOx en el cuartil inferior.
La comparación entre el promedio global del dataset y el promedio de las condiciones óptimas muestra una mejora relevante en la generación energética, junto con una reducción de emisiones. En este sentido, la optimización se entiende como la identificación de patrones históricos asociados a un mejor equilibrio entre rendimiento energético y sostenibilidad ambiental.
5. Principales insights
- Las variables operativas TIT, CDP y GTEP muestran una relación fuerte con la generación energética de la turbina.
- La generación de energía aumenta en condiciones asociadas a mayor temperatura de entrada a la turbina y mayor presión de descarga del compresor.
- Las emisiones de CO y NOx no se comportan de la misma forma, por lo que deben analizarse como objetivos ambientales separados.
- El modelo multisalida basado en XGBoost presentó el mejor desempeño global para predecir simultáneamente TEY, CO y NOx.
- Las condiciones óptimas no fueron seleccionadas directamente por el modelo, sino mediante un criterio estadístico reproducible basado en percentiles.
- El subconjunto óptimo permitió identificar un perfil operativo con mayor generación energética promedio y menores emisiones frente al comportamiento global del dataset.
- El análisis demuestra que los datos históricos pueden convertirse en una referencia operativa para identificar condiciones más eficientes y ambientalmente favorables.
6. Acciones recomendadas
A partir de los patrones identificados en el análisis, se proponen las siguientes acciones como líneas de trabajo analítico para apoyar la operación, el monitoreo y la mejora continua del sistema:
- Monitorear variables críticas de operación: dar seguimiento a TIT, CDP y GTEP como variables asociadas al rendimiento energético de la turbina.
- Usar percentiles como referencia de benchmarking operativo: comparar nuevas observaciones contra el perfil histórico óptimo para detectar condiciones favorables o desviaciones.
- Evaluar energía y emisiones de forma conjunta: evitar optimizar únicamente la generación energética sin considerar el impacto en CO y NOx.
- Incorporar modelos predictivos como soporte analítico: utilizar modelos como XGBoost para estimar escenarios y anticipar el comportamiento esperado de energía y emisiones.
- Desarrollar alertas operativas futuras: crear reglas o indicadores que indiquen cuándo la turbina se aleja de las condiciones históricamente más favorables.
- Validar los hallazgos con conocimiento de ingeniería: complementar el análisis con restricciones reales de operación, seguridad, mantenimiento y límites técnicos del fabricante.
7. Metodología técnica
El desarrollo del proyecto siguió un flujo de trabajo estructurado orientado a comprender, modelar y segmentar el comportamiento operativo de la turbina:
- Comprensión del sistema: análisis del funcionamiento general de una turbina de gas y de las variables asociadas al ciclo de operación.
- Exploración de datos: revisión de distribuciones, correlaciones y relaciones entre variables ambientales, operativas, energéticas y de emisiones.
- Modelado predictivo individual: entrenamiento de modelos de regresión separados para TEY, CO y NOx.
- Modelado predictivo multisalida: evaluación de modelos capaces de predecir simultáneamente energía generada y emisiones.
- Comparación de modelos: análisis de métricas como MAE, RMSE y R² para seleccionar los enfoques con mejor desempeño.
- Definición de condiciones óptimas: creación de un criterio estadístico basado en percentiles: TEY en el cuartil superior, CO en el cuartil inferior y NOx en el cuartil inferior.
- Construcción del subconjunto óptimo: aislamiento de 1.031 observaciones que cumplen simultáneamente las condiciones de alta generación y bajas emisiones.
- Visualización en Power BI: diseño de un dashboard industrial con enfoque ejecutivo, exploratorio, predictivo y operativo.
Este proyecto no utiliza Machine Learning como una caja negra para encontrar el óptimo, sino como parte de una metodología analítica más amplia que combina EDA, modelado predictivo y segmentación estadística para identificar condiciones históricas de operación más eficientes y ambientalmente favorables.