Comunicación presentada al VII Congreso Smart Grids
Autores
- Leónidas Sayas Poma, Gerente de Supervisión de Electricidad, Osinergmin (Perú)
- Alex Rufino Rojas Aucarure, Asesor Técnico(e) DSE, Osinergmin (Perú)
- Ernesto Cocler Rosales Laurente, Especialista de Sistemas DSE, Osinergmin (Perú)
Resumen
La indisponibilidad y la tasa de falla son indicadores indispensables para evaluar la confiabilidad de un determinado componente dentro del sistema eléctrico. Si se pudieran reconocer con anticipación las fallas que se presentan en los activos físicos se tendría un mejor control sobre ellas reduciendo considerablemente la indisponibilidad y la tasa de falla de los activos físicos. Esta situación ha motivado en construir un modelo de predicción de las indisponibilidades y la tasa de falla donde el objeto de estudio son los elementos (líneas y equipos) del Sistema Interconectado Nacional – SEIN. El modelo utiliza Redes Neuronales Artificiales (ANN), Algoritmos ARIMA, Regresión Lineal Múltiple y Convolución Gaussiana para analizar el problema de predicciones de desconexiones y encausarlas en un problema de predicción de múltiples series de tiempo.
Para el estudio se cuentan con 2 variables dependientes y 46 variables independientes que intentan explicar la indisponibilidad y la tasa de falla según la causa de interrupción, la fuente de interrupción o el tipo de interrupción. La visualización de los resultados hace el uso del software Power BI donde se muestra en una serie de tiempo los datos históricos y las predicciones para los diferentes elementos del SEIN. La implementación de los algoritmos descritos y su entrenamiento se realizan haciendo uso de la librería Scikit-learn del lenguaje de programación multipropósito Python.
Palabras clave
Predicción de Indisponibilidad, Redes Neuronales, Filtros Gaussianos
Introducción
La Energía Eléctrica se ha convertido en uno de los servicios básicos para el desarrollo humano, por lo que el acceso a la electricidad debe estar garantizado en todo momento con los niveles adecuados de calidad. Por su parte la infraestructura eléctrica tiene que estar preparado para brindar un servicio seguro, fiable y sin interrupciones. Mantener el estado operativo continuo conlleva muchos desafíos debido a situaciones anómalas del propio sistema y de externalidades (fenómenos naturales, atentados, maniobras de mantenimiento, etc.) que ocasionan fallas del sistema y/o componente eléctrico generando cortes de suministro de energía eléctrica produciendo graves distorsiones en el desarrollo habitual de muchas actividades.
La posibilidad de reconocer con anticipación las fallas que se presentan en los activos físicos se denomina predicción de fallos y es de mucha ayuda para mantener la disponibilidad y la fiabilidad de las redes e incluso iniciar apropiadas acciones en la restauración del sistema. Esto ha motivado implementar un modelo para predecir la indisponibilidad y la tasa de falla de los elementos (Líneas y equipos) del SEIN.
El análisis predictivo son modelos que agrupa gran variedad de técnicas estadísticas de modelización, aprendizaje automático y minería de datos que se encargan de extraer información existente en los datos y su utilización para predecir tendencias y patrones de comportamiento, pudiendo aplicarse a cualquier evento desconocido. El análisis Predictivo se fundamenta en la identificación de relaciones entre variables en eventos pasados, para explorar dichas relaciones y predecir posibles resultados futuros (W. Yan, «Toward Automatic Time-Series Forecasting Using Neural Networks,» IEEE Transactions on Neural Networks and Learning Systems, vol. 23, no. 7, p. July 2012, 1028-1039).
Dentro de la industria eléctrica existen trabajos de investigación que centran esfuerzos en la predicción de fallas y mejoras de la confiabilidad en los componentes un sistema. En (K. Venugopal y P. Madhusudan, «Artificial neural network based fault prediction framework for transformers in power systems,» 2017 International Conference on Computing Methodologies and Communication [ICCMC]) teniendo en cuenta la antigüedad de las redes eléctricas en India no era suficiente el manteniendo oportuno por lo que desarrollaron un modelo de predicción de fallas en transformadores empleando Redes Neuronales Artificiales (RNA) obteniendo resultados de predicciones óptimas para condiciones de falla potencialmente peligrosas.
En (A. Dube, R. Dashora, P. Saraf y R. Singh, «Monte Carlo-rough based mixed-integer probablistic non-linear programming model for predicting and minimizing unavailability of power system components,») proponen un modelo para predecir fallas y probabilidad de indisponibilidad en equipos de alto voltaje, el enfoque tiene varios pasos: análisis de datos en tiempo real creación y población de la base de datos, preprocesamiento de datos y uso de algoritmos de minería de datos para determinar el conjunto de reglas que puedan predecir el comportamiento de los componentes eléctricos. En (L. Zhao, S. Goh, Y. Chan, B. Yeoh, H. Hu y M. Tho, «Prediction of Electrical and Physical Failure Analysis Success Using Artificial Neural Networks,») desarrollan un RNA con la finalidad de predecir el nivel de confianza del análisis de fallas, donde los parámetros de entrada son las corrientes dinámicas desde diferentes fuentes de alimentación logrando que la RNA tenga una precisión de salida del 80% en promedio.
Los modelos más usados para pronosticar series temporales estacionarias son los modelos ARIMA (autoregressive integrated moving average) que mediante el uso de variaciones y regresiones de los datos estadísticos se pueden encontrar patrones para una predicción hacia el futuro estos modelos se usan generalmente para hacer predicciones a corto plazo porque la mayoría de ellos pone énfasis en el pasado reciente (S. Noureen, S. Atique, V. Roy y S. Bayne, «Analysis and application of seasonal ARIMA model in Energy Demand Forecasting: A case study of small scale agricultural). Por su parte las Redes Neuronales Artificiales (RNA) es un modelo computacional que tiene por objetivo resolver problemas asemejándose al cerebro humano. Estos modelos aprenden y se forman a si mismos en lugar de ser programados de forma explicita y son usadas para resolver una gama amplia de problemas incluyendo la predicción de series temporales (P. Karampelas, V. Vita, C. Pavlatos, V. Mladenov y L. Ekonomou, «Design of artificial neural network models for the prediction of the Hellenic energy consumption).
Antecedentes conceptuales
El Sistema Interconectado Nacional
Conjunto de líneas de transmisión y subestaciones eléctricas conectadas entre sí, así como sus respectivos centros de despacho de carga, el cual permite la transferencia de energía eléctrica entre los diversos sistemas de generación eléctrica de Perú. Administrado por un Comité de Operación Económica del Sistema Interconectado Nacional (COES)
Desconexiones
Indisponibilidad de un sistema y/o componente eléctrico, no previsto debido a fallas o razones de operación.
Objeto de Estudio
Un objeto de estudio es una entidad o elemento de la realidad que se desea estudiar, para ello es necesario conocer sus variables (atributos o propiedades) sean estas constantes o variables en el tiempo. El objeto de estudio para este proyecto corresponde a eventos de desconexiones sean de líneas o de equipos al que denominaremos elementos del SEIN.
Variables.
Una variable es una magnitud, característica o propiedad de un objeto de estudio, al que denominaremos dimensión. Puede ser una cantidad, un periodo tiempo, una suma, un estado, una ratio, una constante, permiten conocer el estado del objeto de estudio en un momento determinado.
En caso que la variable tenga un comportamiento en el tiempo, se le puede medir en intervalos fijos de tiempo, a esta secuencia de valores se le denomina serie de tiempo. Para el desarrollo de nuestra investigación, una variable corresponde a uno de los indicadores de interés, En la tabla I se presenta la lista de variables que se implementan en las tareas de pronostico.
Dimensión
Una dimensión corresponde a una característica o propiedad de un objeto de estudio. Las dimensiones permiten establecer mayor nivel de detalle de las variables.
Para propósitos de este proyecto las dimensiones de estudio corresponden a: Tipo Periodo (Mes, Bimestre, Trimestre, Semestre, Año), Periodo, Tipo Elemento (Línea, Equipo), Elemento, Tipo Empresa (Generadora, Distribuidora, Transmisora), Empresa, Zona, Fuente Interrupción (Externa, Propia), Causa Interrupción (Forzada Externa, Forzada Propia, Programada Externa, Programada Propia), Tipo Interrupción ́(Fenómenos Naturales, Condiciones Ambientales, Falla de Equipamiento, Error Humano, Terceros, Otras Causa, Ajuste y Calibración de Protección, Adelanto o Retraso de Mantenimiento).
Pronósticos de series de tiempo
El pronóstico de series de tiempo significa que tenemos que extender las variables históricas al futuro, donde aun no hay mediciones disponibles.
Medidas de desempeño (MAPE)
Con la finalidad de evaluar el desempeño del modelo se implementa el indicador Error Porcentual Absoluto Medio (MAPE o Mean Absolute Porcentage Error), que permite medir el tamaño del error (absoluto) en términos porcentual. La fórmula para el cálculo de MAPE es:
- At: es el dato real; Ft: es el pronóstico calculado y n: número de muestras
Algoritmos para el pronóstico de series de tiempo
Arima
Este modelo fue desarrollado por Box y Jenkins (G. E. P. &. J. G. M. Box, «Some comments on a paper by Chatfield and Prothero and on a review by Kendall,» Journal of the Royal Statistical Society. Series A (General), pp. 337-352, 1973) y analiza series de tiempo desde un punto de vista clásico.
En general, se dice que una serie temporal Y(t) admite una representación autorregresiva integrada y de medias móviles de órdenes p, d y q respectivamente, y se denota por ARIMA(p, d, q), mediante la siguiente ecuación:
- p: denota el número de términos autorregresivos, d: en numero de veces que la serie debe ser diferenciada para hacerla estacionaria y q: el número de términos de la media móvil invertible
El objetivo de análisis es trazar, examinar y preparar series para modelar y extraer el componente de estacionalidad de la serie temporal, probar la estacionalidad y aplicar las transformaciones apropiadas.
Regresión Lineal Múltiple
La regresión lineal múltiple es un modelo matemático usado para aproximar la relación de dependencia entre una variable dependiente Y y con muchas variables independientes Xi. Este modelo puede ser expresada como:
- Yt: variable dependiente o variable objetivo, Xi: Variable independientes o explicativas y βi: Parámetros, miden la influencia que las variables explicativas tienen sobre la variable dependiente.
Redes Neuronales Artificiales (RNA)
Este modelo esta basado en el trabajo de Rumelhart y McClelland (D. E. Rumelhart y J. L. McClelland, Parallel Distributed Processing: Explorations in the Microstructure of Cognition., MIT Press, 1986), que define un elemento de proceso (EP), o neurona artificial, como un dispositivo que a partir de un conjunto de entradas Xi (i=1,2,3…n) o vector x, genera una única salida Y.
La regla de propagación suele ser una suma ponderada del productor escalar del vector de entrada y el vector de pesos:
La arquitectura de una RNA es la estructura o patrón de conexiones de la red. Es conveniente recordar que las conexiones sinápticas son direccionales, es decir, la información sólo se transmite en un sentido. Las neuronas suelen agruparse en unidades estructurales llamadas capas. Dentro de una capa, las neuronas suelen ser del mismo tipo. Se pueden distinguir tres tipos de capas:
- De entrada: reciben datos o señales procedentes del entorno.
- De salida: proporcionan la respuesta de la red a los estímulos de la entrada.
- Ocultas: no reciben ni suministran información al entorno (procesamiento interno de la red).
Las conexiones se realizan entre neuronas de distintas capas, pero puede haber conexiones Inter capa o laterales y conexiones de realimentación que siguen un sentido contrario al de entrada-salida.
Filtros Gaussianos
Este método se implementa en el caso de las curvas que tiene comportamiento sucesos eventuales, en particular en los casos donde en el periodo de análisis el elemento presenta tres o menos eventos. En estos casos no se busca maximizar el rendimiento del modelo de regresión, lo que se busca es mantener la conducta del elemento analizado. Una convolución es un operador matemático que transforma dos curvas f y h en una tercera curva que representa la magnitud en la que se superponen f y una versión trasladada e invertida de h, a la curva h se le denomina el kernel. Una convolución es una forma de media móvil.
En la Figura 5 se presenta la curva de datos originales y la curva de datos pronosticados. Dado que la curva de datos originales contiene sucesos eventuales, no es posible diseñar un procedimiento para predecir la ocurrencia del siguiente evento. El criterio que se usa es, que si un suceso ha ocurrido en un periodo entonces es bastante probable que pueda ocurrir en el siguiente periodo.
Arquitectura de la solución
El método planteado para resolver el problema de pronóstico de múltiples series de tiempo no todas de ellas con indicios de autoregresión, se presenta en la figura 6.
El procedimiento para preparar las series de datos, recibe las tuplas de todos los eventos de desconexiones del SEIN en el rango de periodos planteado de líneas y equipos, para proceder a transformarlos en una estructura de datos gestionable por el modelo. Las series de datos se preparan para cada una de las variables dependientes del elemento y de sus líneas de entrada y líneas de salida, conformando la tupla S°.
El procedimiento de ranking de pronóstico, recibe la tupla S° e itera sobre cada una de las variables independientes para proceder a crear un modelo de pronóstico, con su respectivo MAPE, luego procede a ordenarlos en orden descendente por el MAPE (de menos error a más error), el procedimiento se completa seleccionado el modelo con el menor error posible, se evita probar combinaciones de más de una variable independiente, reduciendo de esta forma el tiempo necesario para encontrar el mejor modelo de pronóstico. El modelo de pronóstico se implementa usando redes neuronales y filtros gaussianos.
El procedimiento de pronóstico de desconexión, permite pronosticar la serie de tiempo en el horizonte de periodos dado por el tipo de periodo, así como calcular el MAPE final de la serie de tiempo.
Preparación de las series de tiempo
Las series de tiempo se implementan mediante nueve tablas (ver la Figura 7), ellas pueden agrupar como las de datos originales (PRE_TD_EVENTO_LINEA y PRE_TD_EVENTO_EQUIPO) frecuencia original (PRE_TD_EVENTO_RAYO_FREQ, PRE_TD_EVENTO_LINEA_FRE y PRE_TD_EVENTO_EQUIPO_FRE,), las de configuración del periodo (PRE_TM_PERIODO), la tabla de configuración de variables (PRE_TM_VARIABLE_CONFIGURA) y la tabla visualización de resultados (PRE_TD_VARIABLE y PRE_TD_CURVA).
Esquema del proyecto
El esquema básico de operación del modelo se presenta en la figura 8. Los periodos corresponden a intervalos de días, que estos pueden ser: semana, quincena, mes, bimestre, trimestre, semestre o año, que dado el periodo actual el modelo calcula a los más 3 periodos, que mientras más lejos sea el horizonte de pronóstico, menos confiables serán los resultados.
Implementación de proyecto
Para la construcción de los modelos de predicciones se plantea la implementación de tres algoritmos de series de tiempo: ARIMA, Redes Neuronales Artificiales y Regresión Lineal Múltiple, para predecir conductas futuras en función a las tendencias del comportamiento del pasado. Los algoritmos se implementan en el lenguaje de programación Python utilizando librerías de Scikit-learn. Complementando estos tres algoritmos, se implementa la convolución gaussiana, este se utiliza en el caso de que la cantidad de puntos (valores) es pequeño.
Resultados del estudio
Ranking de tasas de fallas
Este primer reporte permite visualizar una lista de elementos rankeados según la tasa de fallas predecida, cada elemento expone la tasa de fallas predecida y la tasa de fallas real. El reporte presenta seis filtros que permite ubicar rápidamente a un elemento dentro del sistema del SEIN, estos filtros son los siguientes: Zona, Tipo de Empresa, Empresa, Tipo de Elemento, SE de Salida, SE de Llegada.
En Figura 9. El primer elemento que presenta mayor tasa de falla es A4891_ELC_D-CONSTITUCION-I418720 perteneciente a la empresa Electrocentro tiene una tasa de falla histórica de 116 fallas/años, para el mismo elemento el pronóstico de tasa falla para el año 2020 es de 87,45 fallas/año. De la misma manera se puede visualizar la tasa de falla y sus respectivas predicciones para los demás elementos pertenecientes al SEIN.
Ranking de Indisponibilidad
Este segundo reporte permite visualizar una lista de elementos rankeados según la indisponibilidad predecida, cada elemento expone la indisponibilidad predecida y la indisponibilidad real. El reporte presenta seis filtros que permite ubicar rápidamente a un elemento dentro del sistema del SEIN, estos filtros son los siguientes: Zona, Tipo de Empresa, Empresa, Tipo de Elemento, SE de Salida, SE de Llegada.
En Figura 10, el primer elemento que presenta mayor indisponibilidad es L-1002_EGM_G-MACHUPICCHU-QUENCORO perteneciente a la empresa de Generación Machupicchu tiene una indisponibilidad histórica de 318,03 horas/años, para el mismo elemento el pronóstico de tasa falla para el año 2020 es de 291,34 horas/año.
Tendencia de elementos
Este tercer reporte permite visualizar la tendencia detallada de los elementos según la tasa de fallas. El reporte presenta seis filtros que permite ubicar rápidamente a un elemento dentro del sistema del SEIN, estos filtros son los siguientes: Zona, Tipo de Empresa, Empresa, Tipo de Elemento, SE de Salida, SE de Llegada.
En la Figura 11 se muestra la tendencia del elemento A4891_ELC_D-CONSTITUCION-I418720 con pronósticos de tasa de falla de hasta tres meses. Además, muestra los pronósticos de tasa de falla de las causas.
Conclusiones
Los pronósticos por series temporales son herramientas de inteligencia artificial que se pueden aplicar a cualquier variable en el tiempo esto permite predecir el comportamiento futuro de estas variables. Los pronósticos son una herramienta de ayuda, los cuales según la información que suministra ayudan a evaluar el desempeño de los equipos y tomar acciones oportunas que mejoren las deficiencias. El Modelo de predicción de fallas desarrollado en el presente trabajo se aplico al sistema electrico del Perú, en base a la cuantificación objetiva de las características de operativas de los elementos de transmisión y su entorno de operación, la misma que se utilizo para alertar a las concesionarias para que planifiquen su programa de corrección, de manera que se mejore la continuidad del servicio eléctrico.