Otimização de Modelos de Redes Neurais Profundas para Dispositivos
Móveis
Redes Neurais. Aprendizado profundo. Otimização de modelos.
Aplicações para celular. Visão Computacional.
O Aprendizado Profundo alcançou resultados expressivos em visão
computacional, impulsionado principalmente pelo aumento do poder de
processamento das GPUs. No entanto, a execução desses modelos modernos em
dispositivos móveis impõe desafios de latência, consumo energético e,
principalmente, memória RAM. Embora técnicas clássicas de compressão, como
a quantização e o pruning, reduzam a complexidade, elas podem degradar a
fidelidade visual necessária para aplicações de imagem de alta qualidade.
Diante desse cenário, esta tese propõe estratégias de otimização na
arquitetura de redes neurais e de fluxo de processamento que viabilizam a
execução eficiente no dispositivo sem prejudicar a qualidade visual. O
trabalho apresenta três contribuições aplicadas ao contexto móvel, mais
especificamente, smartphones. Primeiro, no processamento de sinal de
imagens (ISP), propomos uma arquitetura de rede compacta baseada em UNet
capaz de substituir o pipeline tradicional, processando dados RAW
diretamente para RGB com alta fidelidade e baixo custo de memória. Segundo,
para a transferência de estilo, desenvolvemos uma abordagem híbrida que
combina uma rede neural leve com um algoritmo baseado em pedaços
(patch-based), permitindo a geração de imagens em alta resolução em
dispositivos com RAM restrita (4GB), superando limitações de métodos
puramente neurais. Por fim, no preenchimento de imagem (inpainting),
apresentamos a arquitetura CRConv, que utiliza convoluções com gate guiadas
pela Transformada de Distância Euclidiana. Este método atinge um equilíbrio
ótimo entre qualidade visual e eficiência, reduzindo o tempo de inferência
em 17% comparado ao estado da arte (LaMa).