Dynamic Ensemble of Classifiers and Security Relevant Methods of
Android’s API: An Empirical Study
Security Relevant Methods. Métodos de Ensemble. Sistema de
Múltiplos Classificadores. Ensenmble Dinâmico.
O sistema operacional Android disponibiliza funções e métodos de manuseio
de dados sensíveis para proteger os dados dos usuários. Dados sensíveis são
todo tipo de dados que podem identificar o usuário, como localização de
GPS, dados biométricos e informações bancárias. A literatura de segurança
Android propõe extrair features binárias de um método e classificar-lo em
uma das classes de Security Relevant Methods, agregando informação de o
método manuseia dados sensíveis. Entretanto, existe uma lacuna na
literatura onde não são avaliados algoritmos de Ensemble Dinâmico. Os
algoritmos de Ensemble Dinâmico são estado da arte para Sistemas de
Múltiplos classificadores, que por sua vez, não atacam objetivamente o tipo
específico de features binárias. Assim sendo, este trabalho endereça a
lacuna em relação a algoritmos de Ensemble Dinâmicos aplicados ao problema
de classificação de Security Relevant Methods. Nossas análises mostram que,
ao contrário do que é inicialmente posto pela literatura, SVM não é o
melhor classificador para esse problema, sendo MLP, Random Forest, Gradient
Boosted Decision Trees e META-DES usando \text{Random Forest como geração
do pool os melhores resultados. Também constatamos que, em geral,
algoritmos de Ensemble Dinâmico possuem uma desvantagem em relação aos
classificadores monolíticos. Ademais, essa desvantagem é exarcebada em
algoritmos que utilizam classificadores baseados em distância, como o OLP.
Quando utlizamos o algoritmo de embedding Triplet Loss, observamos um
aumento de performance para o kNN e OLP, mas não de outras técnicas de
Ensemble Dinâmico, mostrando que um conjunto de features binárias tem
impacto mais significativo sobre esses algoritmos.