Addressing Real-World Variability in Power Line Inspections with
Unsupervised Visual Anomaly Detection
detecção de anomalias, transmissão de energia, aprendizado
não supervisionado, segmentação semântica, deep learning, mecanismos de
atenção, inspeção industrial.
A detecção visual de anomalias em infraestruturas de transmissão de energia
elétrica é fundamental para prevenir falhas críticas e garantir a
confiabilidade da rede. À medida que essas redes se expandem para regiões
remotas e complexas, inspeções manuais tradicionais enfrentam desafios
operacionais, como alto custo, riscos à segurança e baixa escalabilidade.
Embora métodos recentes de inspeção visual automatizada baseados em deep
learning apresentem avanços, a maioria é avaliada em cenários controlados,
o que limita sua eficácia em aplicações reais.
O problema central abordado neste trabalho é a baixa capacidade de
generalização de modelos não supervisionados de detecção de anomalias
quando aplicados a imagens aéreas obtidas em condições reais de inspeção.
Modelos supervisionados exigem grandes volumes de dados anotados com falhas
raras e variadas—algo impraticável nesse domínio. Por isso, métodos não
supervisionados, que aprendem apenas a partir de dados normais, são mais
viáveis, mas enfrentam dificuldades ao lidar com ruído de fundo, variações
de iluminação e anomalias sutis.
Este trabalho demonstra que a integração de mecanismos de atenção e
técnicas de remoção de fundo pode aprimorar significativamente a detecção
de anomalias em cenários não controlados. Para isso, foi desenvolvido o
InsPLAD-seg, um novo conjunto de dados com anotações em nível de pixel de
falhas reais. Além disso, foram aplicados módulos de atenção (SENet e CBAM)
e segmentação por objetos utilizando YOLO, com o objetivo de refinar a
extração de características e reduzir interferências visuais.
Os resultados mostram que a combinação de atenção e remoção de fundo
melhora consistentemente os escores de AUROC em níveis de imagem e pixel,
com destaque para a detecção de corrosões e pequenas falhas. Modelos como
RD++ e DifferNet, aprimorados com atenção, alcançaram desempenho de ponta,
enquanto a remoção de fundo aumentou a robustez frente à variabilidade
visual.
Esses achados reforçam que mecanismos de atenção e pré-processamentos que
simulam condições controladas são essenciais para aproximar os modelos de
detecção do uso prático em campo. Ao modelar diretamente anomalias em
inspeções reais, esta abordagem contribui para sistemas de monitoramento
mais robustos e escaláveis.
Este trabalho viabiliza a aplicação prática de modelos de detecção de
anomalias em ambientes ruidosos, nos quais precisão e escalabilidade são
requisitos críticos.