AVALIAÇÃO DO DESEMPENHO DE MODELOS DE APRENDIZADO DE MÁQUINA EM FUNÇÃO DO COMPRIMENTO DE SÉRIES TEMPORAIS DE IMAGENS DE SATÉLITE PARA O MAPEAMENTO DE DESMATAMENTO NA AMAZÔNIA
Mapeamento; Desmatamento; Sensoriamento Remoto Aprendizado
de máquina; Séries temporais; Avaliação de desempenho.
A Amazônia desempenha papel fundamental na regulação do clima e regime de
chuvas, bem como na manutenção dos recursos hídricos, conservação da
biodiversidade e proteção dos povos tradicionais. Apesar de toda essa
importância, o bioma está severamente ameaçado pelo processo de ocupação e
exploração predatória dos seus recursos naturais. Os sistemas de
monitoramento do desmatamento são fundamentais para subsidiar políticas
públicas para controle e fiscalização, além orientar e apoiar a comunidade
científica na compreensão dos impactos da perda de vegetação sobre o bioma.
As técnicas de mapeamento a partir de imagens de sensoriamento remoto
evoluíram com o aumento da capacidade de armazenamento e processamento de
dados. Mais recentemente, métodos de aprendizado de máquina aplicados a
séries temporais de imagens orbitais têm se destacado por explorar
explicitamente o contexto temporal, superando limitações de abordagens
baseadas em imagens individuais. Apesar desses avanços, ainda não está
claro em que medida o comprimento da série temporal influencia o
treinamento e desempenho dos modelos e como esse efeito varia entre
algoritmos e classes temáticas. O objetivo deste trabalho é avaliar em que
medida a extensão das séries temporais de imagens de satélite influencia o
desempenho de modelos de aprendizado de máquina no mapeamento de
desmatamento na Amazônia. Foi conduzido um experimento de avaliação
quantitativa com cinco modelos (Random Forest, XGBoost, Residual Neural
Network, Temporal Convolutional Neural Network e Light Temporal Attention
Encoder). O dataset utilizado para treinamento é composto por 6007 séries
temporais rotuladas a partir de abordagem baseada em eventos, e
distribuídas em nove classes relacionadas a desmatamento e cobertura
natural do solo. Tais séries foram extraídas de cubos de dados Sentinel-2
produzidos pelo Brazil Data Cube (BDC) para o estado de Rondônia. As séries
foram organizadas em quatro configurações, formadas por 23, 46, 69 e 92
composições temporais, e os modelos foram avaliados a partir de validação
cruzada k-fold utilizando o pacote Satellite Image Time Series Analysis on
Earth Observation Data Cubes (SITS). As métricas de desempenho avaliadas
foram Acurácia Global, Kappa, Precision, Recall e F1-Score. Os resultados
indicam uma tendência consistente de aumento de desempenho à medida que o
comprimento das séries temporais é ampliado. Os modelos apresentaram
acurácia entre 0,89 e 0,92 na configuração de referência (23-TS) e passaram
a variar entre 0,93 e 0,96 quando treinados nas configurações temporais
mais extensas. Os padrões de F1-Score mostram que todas as classes se
beneficiam do aumento temporal, com destaque para as classes de
desmatamento que apresentaram ganhos médios de F1 entre 5,28% e 8,58%. Na
comparação entre modelos, o TempCNN atingiu os maiores valores absolutos de
Acurácia (0,9602) e F1 macro (0,9537), enquanto a ResNet foi o modelo que
mais se beneficiou do aumento da séries, com ganho de F1 macro em torno de
11% nas configurações mais longas. Esses resultados evidenciam que a
extensão temporal das séries de imagens de satélite exerce influência
significativa no desempenho dos modelos avaliados, especialmente na
discriminação de padrões associados ao desmatamento