ROBUST AND FRAGILE IMAGE WATERMARKING SCHEMES BASED ON DEEP LEARNING.
Marca d’água em imagens; aprendizado profundo; redes adversárias generativas; sequências caóticas; código corretor de erros; redes neurais convolucionais; robustez.
A segurança multimídia tem se consolidado como uma questão relevante na pesquisa científica, impulsionando o estudo de marcas d'água robustas e frágeis como soluções eficazes contra o uso não autorizado de conteúdos multimídia. Neste trabalho, propomos três esquemas de marca d'água para imagens: um esquema de marca d'água robusto baseada em aprendizagem profunda paralelizável (CoPaD-Mark), um esquema de marca d’água frágil baseado em uma rede neural modular (MoNeF-Mark) e um esquema robusto para imagens de campo luminoso (light-field). No primeiro esquema, as camadas de inserção e extração são submetidas a treinamento iterativo para obter um processamento robusto de marca d'água em imagem. A camada de inserção emprega uma estrutura paralela com redes neurais convolucionais semelhantes à rede Inception Net, enquanto a camada de extração usa convoluções deformáveis. Essas convoluções permitem uma extração de características mais dinâmica, permitindo que os filtros convolucionais ajustem seus campos receptivos com base no conteúdo da imagem. Os bits de marca d'água incorporados na imagem são derivados dos bits de paridade de um código corretor de erros. A mensagem deste código é construída combinando uma sequência binária caótica com os bits originais da marca d'água. A inclusão de sequências caóticas introduz um elemento de aleatoriedade e complexidade ao processo de codificação, tornando-o mais robusto contra tentativas de remoção ou alteração da marca d'água. O segundo método proposto consiste em um esquema modular de marca d’água frágil que integra a detecção de adulteração e a recuperação de imagem. A detecção de adulteração é realizada por meio de uma rede generativa adversária (GAN), enquanto a recuperação da imagem é obtida por meio de dois módulos adicionais, também baseados em GANs. Por fim, estendemos a arquitetura CoPaD-Mark para imagens de campo luminoso, incorporando uma camada de ataque JPEG não diferenciável modelada por meio de um estimador straight-through, de modo a emular compressões realistas durante o treinamento. Além disso, a rede de extração é aprimorada com duas redes transformadoras espaciais, capazes de compensar distorções introduzidas pelos ataques. Em todos os esquemas propostos, as imagens com marca d'água são submetidas a diversos ataques comumente estudados na literatura. Os resultados obtidos são comparados com aqueles obtidos a partir de métodos existentes, demonstrando a eficácia e competitividade da abordagem proposta.