STOCHASTIC MODELING OF DATA STORAGE SYSTEMS FOR EVALUATING
PERFORMANCE, DEPENDABILITY, AND ENERGY CONSUMPTION
Avaliação de Desempenho. Armazenamento Híbrido. Redes de Petri Estocásti- cas. Computação em Nuvem. Gerenciamento de dados. Consumo Energético. Performabilidade.
O aperfeiçoamento de sistemas de armazenamento de dados pode ser limitado pelo baixo desempenho de dispositivos de disco rígido (HDDs) e pelo alto custo por gigabyte de dispositivos de estado sólido (SSDs). Para mitigar essas questões, diversas arquiteturas têm sido concebidas, baseadas em sistemas de armazenamento híbrido. No entanto, o consumo energético é geralmente negligenciado, e novas abordagens não consideram os impactos nos componentes mecânicos de HDDs, o que pode resultar em um mau funcionamento e perda de dados. Da mesma forma, os SSDs podem ter seu tempo de vida reduzido devido ao número limitado de operações em memórias flash. Esta tese apresenta uma abordagem baseada em redes de Petri estocásticas generalizadas (GSPN) para a avaliação de desempenho e consumo energético de sistemas de armazenamento homogêneos (HDD e SSD) e híbridos. Os modelos propostos podem representar diferentes cargas de trabalho e também estimar vazão, consumo energético e tempo de resposta. Além disso, um modelo de performabilidade foi concebido utilizando os formalismos GSPN e diagrama de blocos de confiabilidade (RBD) para avaliar o impacto de falhas no desempenho de sistemas de armazenamento. Uma abordagem de modelagem hierárquica foi adotada, e o modelo pode estimar disponibilidade e tempo médio de resposta. Uma ferramenta de benchmark é adotada nesse estudo para gerar cargas de trabalho e coletar dados para a caracterização dos dispositivos de armazenamento. Simultaneamente, esta investigação estima a potência demandada por HDDs e SSDs por meio de medições. Os resultados são utilizados para validar os modelos GSPN através de técnicas estatísticas e experimentos baseados em benchmarks padrões da indústria. Um planejamento de experimento (DoE) foi realizado para investigar os fatores mais impactantes assumidos nesse estudo. Uma análise exploratória foi conduzida utilizando datasets das companhias Alibaba e Backblaze para investigar os diferentes efeitos de aplicações na falha de dispositivos de armazenamento de dados. Os resultados demonstram a viabilidade dos modelos propostos e fornecem importantes observações em relação a soluções de armazenamento de dados para diferentes aplicações.