Métodos de Aprendizado de Máquina para Limpeza AUTOMÁTICA de Curvas de Potência UTILIZANDO Autoencoders e Rede NEURAL KOLMOGOROV-ARNOLD
Energia eólica; Dados SCADA; Limpeza de curvas de potência; DBSCAN; Autoencoders; Rede Kolmogorov-Arnold.
A energia proveniente da fonte eólica tem cada vez mais confirmado a sua importância na produção de energia elétrica renovável no Brasil e no mundo. Em tempos de transição energética, desastres climáticos e metas cada vez mais ambiciosas na redução de emissão de gases de efeito estufa, a eólica tem se firmado como uma opção não só viável, como essencial, na produção de energia limpa. Uma das formas de se avaliar o desempenho de uma turbina eólica se dá através da análise de dados SCADA, essenciais no monitoramento, tanto da condição, quanto da performance da turbina, fornecendo informações cruciais aos operadores. Além da avaliação de desempenho da turbina através dos dados SCADA, também é possível utilizá-los para estimar a curva de potência histórica do parque e fazer previsões futuras da produção de energia. Para que isso seja possível de ser realizado, a limpeza dos dados é essencial; tanto de dados espúrios, quanto para isolar problemas como indisponibilidade, curtailments e problemas de desempenho como, por exemplo, no sistema de pitch e de yaw. A depender da quantidade de dados a serem avaliados, esta tarefa pode ser exaustiva e computacionalmente custosa. Este trabalho propõe uma nova metodologia para a limpeza automática de curvas de potência, explorando técnicas de aprendizado de máquina ainda pouco aplicadas na análise de dados de turbinas eólicas. A abordagem inicia-se com o pré-processamento de dados operacionais de parques eólicos, seguido da aplicação de diferentes algoritmos para limpeza automática. Inicialmente, foi testado o DBSCAN, que, apesar de sua capacidade de detectar anomalias, não atendeu aos requisitos necessários para a segmentação dos dados. Em seguida, autoencoders clássicos e variacionais foram utilizados como etapa de pré-processamento para alimentar uma rede baseada no teorema de Kolmogorov-Arnold (KAN). Esta abordagem demonstrou desempenho superior, sendo capaz de identificar padrões e sendo mais eficiente na separação entre classes. A avaliação dos resultados foi realizada comparando-se as curvas de potência limpas pelo modelo com aquelas processadas manualmente por um especialista do setor, utilizando uma ferramenta previamente validada e adotada na indústria.