Métodos de Aprendizagem Estatística para Dados Simbólicos Poligonais
Dados Simbólicos Poligonais. Análise de Agrupamento Poligonal. Regressão Intervalar Bivariada. Análise de Dados Simbólicos. Outliers. Pacote em R..
Ciência de Dados é um campo que diz respeito à análise e extração de conhecimento e informações valiosas de dados estruturados e não estruturados. A Análise de Dados Simbólicos fornece uma estrutura que fornece respostas para dados grandes e complexos. Nesta tese, propomos ferramentas para manipulação e extração de conhecimento em dados simbólicos poligonais, um tipo de dado simbólico multivalorado. Dessa forma, modelos bivariados poligonais são discutidos a partir de um caso especial desses modelos para dados intervalares. O modelo bivariado é menos sensível na presença de valores discrepantes de intervalo. Além disso, desenvolvemos um cluster dinâmico considerando a distância de Hausdorff para dados poligonais, onde os protótipos são obtidos a partir de uma solução analítica independente do número de lados. Outra contribuição desta tese é a criação de um pacote na linguagem R, chamado psda para análise de dados simbólicos poligonais. Este pacote fornece ferramentas que permitem agregação de dados por classes, representação de dados no centro e raio do polígono, análise descritiva e modelagem de dados poligonais. Para ilustrar a aplicabilidade do modelo, algoritmo de clusterização e do pacote, alguns exemplos são exibidos.