Banca de DEFESA: CLEBER TAVARES DE MOURA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: CLEBER TAVARES DE MOURA
DATA : 26/02/2025
HORA: 14:00
LOCAL: Virtual
TÍTULO:

AVALIAÇÃO DE DESEMPENHO DAS ESTRATÉGIAS DE PARTICIONAMENTO DE GRANDES VOLUMES DE DADOS APLICADA AO JUMP


PALAVRAS-CHAVES:

avaliação de desempenho, particionamento de dados, estratégias de particionamento, grandes volumes de dados, big data, bancos de dados relacionais, modelos de dados particionados, mineração de processos, log de eventos, performance,escalabilidade.


PÁGINAS: 102
RESUMO:

O crescimento exponencial na geração e no armazenamento de dados,
impulsionado por fontes como dispositivos conectados, redes sociais e aplicativos
móveis, tem gerado desafios significativos para o processamento e a análise
eficiente dessas informações. Nesse contexto, é essencial que as organizações
desenvolvam e implementem estratégias eficazes para gerenciar o grande volume
de dados. No caso dos sistemas de processo judicial eletrônico (PJ-e), o aumento
no número de processos judiciais resulta em um volume massivo de dados, o que
cria desafios adicionais e exige estratégias adequadas de particionamento e
gerenciamento. Com o objetivo de abordar essas questões, foi realizada uma
pesquisa para avaliar detalhadamente e comparar três estratégias de
particionamento: por intervalo, por hash e a estratégia dinâmica (que combina hash
com a criação dinâmica das partições), aplicadas a soluções que processam
grandes volumes de dados. Para isso, foi conduzido um experimento para analisar o
desempenho dessas estratégias utilizando o JuMP (Judiciário com Mineração de
Processos). Antes da aplicação das estratégias de particionamento, foram coletadas
métricas de desempenho do JuMP no seu estado atual, simulando cargas típicas de
trabalho com dados provenientes de registros de eventos processuais do PJ-e. Os
testes foram conduzidos em um ambiente controlado, utilizando o particionamento
padrão atualmente implementado. Essas métricas serviram como referência
(baseline) para comparação com os resultados obtidos após a aplicação das
estratégias selecionadas. As métricas de desempenho selecionadas para a
comparação foram o tempo de processamento, a utilização de recursos e a
escalabilidade. Cada estratégia foi configurada de acordo com suas características
específicas e, para garantir uma avaliação justa, todos os parâmetros relevantes,
como o número de nós de processamento e a configuração de hardware, foram
mantidos constantes entre os diferentes testes. Os resultados experimentais
mostraram que o particionamento por intervalo foi eficiente em testes de carga com
até 13 usuários simultâneos, especialmente para consultas que abrangem dados
dos últimos 5 anos. O particionamento por hash permitiu consolidar dados de
tribunais em uma única tabela, mas o tempo de resposta foi semelhante ao do
particionamento por intervalo. A estratégia dinâmica (hash + criação dinâmica de partições) se destacou como a mais adequada, pois não apenas distribui os dados
de forma eficiente, mas também permitiu a criação automática de partições
conforme os dados crescem. Isso trouxe ganhos significativos em escalabilidade e
manutenção, pois adaptou-se automaticamente ao aumento do volume de dados.
Logo, conclui-se que estratégia dinâmica se mostrou a solução mais eficiente em
termos de desempenho, flexibilidade e facilidade de manutenção, sendo a mais
recomendada para sistemas como o PJ-e, que lidam com grandes volumes de
dados.


MEMBROS DA BANCA:
Presidente - 1699034 - ADRIANO LORENA INACIO DE OLIVEIRA
Externo à Instituição - RAPHAEL JOSE DCASTRO - OUTRA
Interno - 2227477 - RICARDO MASSA FERREIRA LIMA
Notícia cadastrada em: 11/02/2025 08:40
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2025 - UFRN - sigaa11.ufpe.br.sigaa11