Dissertações/Teses

Clique aqui para acessar os arquivos diretamente da Biblioteca Digital de Teses e Dissertações da UFPE

2024
Dissertações
1
  • KLEBER HENRIQUE DOS SANTOS
  • A new dynamic beta prime model with application to hydro-environmental data

  • Orientador : FRANCISCO CRIBARI NETO
  • MEMBROS DA BANCA :
  • FRANCISCO CRIBARI NETO
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • TARCIANA LIBERAL PEREIRA DE ARAUJO
  • Data: 26/02/2024

  • Mostrar Resumo
  • Resumo: We introduce a dynamic model tailored for positively valued time series. It accommodates both autoregressive and moving average dynamics and allows for explanatory variables. The underlying assumption is that each random variable follows, conditional on the set of previous information, the beta prime distribution. A novel feature of the proposed model is that both the conditional mean and conditional precision evolve over time. The model thus comprises two dynamic submodels, one for each parameter. The proposed model for the conditional precision is parsimonious, incorporating first-order time dependence. Changes over time in the shape of the density are determined by the time evolution of two parameters, and not just of the  conditional mean. We present simple closed-form expressions for the model's conditional log-likelihood function, score vector and Fisher's information matrix. We also present Monte Carlo simulation results on the finite-sample performance of the conditional maximum likelihood estimators of the parameters that index the model. Finally, we use proposed approach to model and forecast a seasonal hydrological time series.


  • Mostrar Abstract
  • Resumo: We introduce a dynamic model tailored for positively valued time series. It accommodates both autoregressive and moving average dynamics and allows for explanatory variables. The underlying assumption is that each random variable follows, conditional on the set of previous information, the beta prime distribution. A novel feature of the proposed model is that both the conditional mean and conditional precision evolve over time. The model thus comprises two dynamic submodels, one for each parameter. The proposed model for the conditional precision is parsimonious, incorporating first-order time dependence. Changes over time in the shape of the density are determined by the time evolution of two parameters, and not just of the  conditional mean. We present simple closed-form expressions for the model's conditional log-likelihood function, score vector and Fisher's information matrix. We also present Monte Carlo simulation results on the finite-sample performance of the conditional maximum likelihood estimators of the parameters that index the model. Finally, we use proposed approach to model and forecast a seasonal hydrological time series.

2
  • ANA CECILIA DIAZ BACCA
  • Modelos de transmissão de informação em anéis 𝑘-regulares

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • ALEXSANDRO GIACOMO GRIMBERT GALLO
  • FABIO MARCELLUS LIMA SA MAKIYAMA LOPES
  • PABLO MARTIN RODRIGUEZ
  • Data: 15/04/2024

  • Mostrar Resumo
  • O presente trabalho foca no estudo do modelo de rumor de Maki-Thompson em grafos
    de anel k-regulares. Este modelo, amplamente explorado na literatura, analisa a propagação de um boato em uma população fechada e mista, dividida em três grupos de indivíduos: ignorantes, informantes e neutros. A pesquisa concentra-se em representar a população por meio de grafos de anel k-regulares e busca abordar a influência do grau do grafo na propagação do boato. Dada a crescente complexidade dos cálculos com o aumento de k, o estudo é limitado a dois casos particulares: anéis 2 e 4 regulares. Para esses casos, a estratégia adotada envolve inicialmente o estudo do modelo em Z. Posteriormente, por meio de métodos de acoplamento, relacionam-se os resultados obtidos em Z com os dois grafos de interesse. Como resultado, foi possível calcular o valor esperado da quantidade de informados ao final do processo para ambos os casos. Especificamente, no grafo 2-regular, esse resultado se estende a situações em que os indivíduos têm um número determinado de tentativas frustradas de propagação e no caso do grafo 4-regular, foi utilizado o método da maioria para obter os resultados.


  • Mostrar Abstract
  • O presente trabalho foca no estudo do modelo de rumor de Maki-Thompson em grafos
    de anel k-regulares. Este modelo, amplamente explorado na literatura, analisa a propagação de um boato em uma população fechada e mista, dividida em três grupos de indivíduos: ignorantes, informantes e neutros. A pesquisa concentra-se em representar a população por meio de grafos de anel k-regulares e busca abordar a influência do grau do grafo na propagação do boato. Dada a crescente complexidade dos cálculos com o aumento de k, o estudo é limitado a dois casos particulares: anéis 2 e 4 regulares. Para esses casos, a estratégia adotada envolve inicialmente o estudo do modelo em Z. Posteriormente, por meio de métodos de acoplamento, relacionam-se os resultados obtidos em Z com os dois grafos de interesse. Como resultado, foi possível calcular o valor esperado da quantidade de informados ao final do processo para ambos os casos. Especificamente, no grafo 2-regular, esse resultado se estende a situações em que os indivíduos têm um número determinado de tentativas frustradas de propagação e no caso do grafo 4-regular, foi utilizado o método da maioria para obter os resultados.

3
  • CLARICE DE OLIVEIRA NOGUEIRA
  • CORREÇÃO DE VIÉS NO MODELO DE REGRESSÃO BETA NÃO LINEAR.

  • Orientador : AUDREY HELEN MARIZ DE AQUINO CYSNEIROS
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • AUDREY HELEN MARIZ DE AQUINO CYSNEIROS
  • MIGUEL ANGEL URIBE OPAZO
  • Data: 22/04/2024

  • Mostrar Resumo
  • Em contextos de análise do comportamento de uma variável em relação a outras, os modelos de regressão desempenham um papel amplamente empregado. A categoria de modelos de regressão beta é particularmente adequada para esse propósito, sendo aplicada quando a variável resposta assume valores no intervalo (0,1), o que é comum em cenários que envolvem taxas e proporções. Ferrari e Cribari-Neto (2004), introduziram um modelo de regressão beta que adota uma abordagem alternativa para a distribuição beta, na qual os parâmetros são definidos com base na média e no parâmetro de precisão. Este modelo foi objeto de duas extensões notáveis, sendo uma delas proposta por Smithson e Verkuilen (2006), que aborda a variação da precisão. Nessa extensão, tanto a média quanto a precisão são modeladas de forma simultânea, permitindo uma análise mais abrangente. A outra extensão, apresentada por Simas, Barreto-Souza e Rocha (2010), amplia ainda mais as possibilidades ao considerar que a média e/ou a precisão podem estar relacionadas a preditores não lineares, o que confere maior flexibilidade ao modelo na captura de relacionamentos complexos entre as variáveis envolvidas. Essas extensões representam avanços valiosos na modelagem e interpretação de dados dentro deste contexto específico. Nessa dissertação, o objetivo foi propor a correção de viés (de segunda ordem) para os estimadores de máxima verossimilhança no modelo de regressão beta não linear, tanto para os estimadores dos parâmetros relacionados à média, quanto para os estimadores dos parâmetros relacionados ao parâmetro de precisão, para isso desenvolvemos uma ex-pressão matricial fechada para o estimador de viés de Cox e Snell (1968) e analisamos, via simulação de Monte Carlo, os desempenhos dos EMV e suas versões corrigidas via Cox e Snell (1968) e através da metodologia bootstrap (EFRON, 1979). Fornecemos resultados numéricos que mostram que as versões corrigidas do EMV apresentam desempenho superior ao do usual em amostras de tamanho pequeno ou moderado. Para finalizar, apresentamos e discutimos uma aplicação em dados reais.


  • Mostrar Abstract
  • Em contextos de análise do comportamento de uma variável em relação a outras, os modelos de regressão desempenham um papel amplamente empregado. A categoria de modelos de regressão beta é particularmente adequada para esse propósito, sendo aplicada quando a variável resposta assume valores no intervalo (0,1), o que é comum em cenários que envolvem taxas e proporções. Ferrari e Cribari-Neto (2004), introduziram um modelo de regressão beta que adota uma abordagem alternativa para a distribuição beta, na qual os parâmetros são definidos com base na média e no parâmetro de precisão. Este modelo foi objeto de duas extensões notáveis, sendo uma delas proposta por Smithson e Verkuilen (2006), que aborda a variação da precisão. Nessa extensão, tanto a média quanto a precisão são modeladas de forma simultânea, permitindo uma análise mais abrangente. A outra extensão, apresentada por Simas, Barreto-Souza e Rocha (2010), amplia ainda mais as possibilidades ao considerar que a média e/ou a precisão podem estar relacionadas a preditores não lineares, o que confere maior flexibilidade ao modelo na captura de relacionamentos complexos entre as variáveis envolvidas. Essas extensões representam avanços valiosos na modelagem e interpretação de dados dentro deste contexto específico. Nessa dissertação, o objetivo foi propor a correção de viés (de segunda ordem) para os estimadores de máxima verossimilhança no modelo de regressão beta não linear, tanto para os estimadores dos parâmetros relacionados à média, quanto para os estimadores dos parâmetros relacionados ao parâmetro de precisão, para isso desenvolvemos uma ex-pressão matricial fechada para o estimador de viés de Cox e Snell (1968) e analisamos, via simulação de Monte Carlo, os desempenhos dos EMV e suas versões corrigidas via Cox e Snell (1968) e através da metodologia bootstrap (EFRON, 1979). Fornecemos resultados numéricos que mostram que as versões corrigidas do EMV apresentam desempenho superior ao do usual em amostras de tamanho pequeno ou moderado. Para finalizar, apresentamos e discutimos uma aplicação em dados reais.

4
  • DÉBORA DE SOUSA CORDEIRO
  • Estudo de variações de modelos discretos de filas a partir de processos de ramificação.

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • ALEX DIAS RAMOS
  • DIVANILDA FERREIRA MAIA
  • PABLO MARTIN RODRIGUEZ
  • Data: 30/04/2024

  • Mostrar Resumo
  • A busca por serviços que resultam em espera faz parte do cotidiano da população de uma forma geral e a Teoria das Filas surge para modelar analiticamente esses processos ou sistemas que possuem filas devido a espera. Neste trabalho serão estudadas propriedades de modelos discretos de filas através de processos de ramificação. Após uma introdução de resultados básicos da teoria de processos de ramificação a tempo discreto, serão analisadas variações de modelos discretos de filas Geom/G/\infty. Provamos teoremas relacionados às medidas de desempenho de modelos com desistências, limitação e catástrofes, respectivamente. Para os modelos considerados, serão obtidas condições necessárias e suficientes para garantir a explosão ou não do sistema, e o número médio de clientes em um período de serviço contínuo.


  • Mostrar Abstract
  • A busca por serviços que resultam em espera faz parte do cotidiano da população de uma forma geral e a Teoria das Filas surge para modelar analiticamente esses processos ou sistemas que possuem filas devido a espera. Neste trabalho serão estudadas propriedades de modelos discretos de filas através de processos de ramificação. Após uma introdução de resultados básicos da teoria de processos de ramificação a tempo discreto, serão analisadas variações de modelos discretos de filas Geom/G/\infty. Provamos teoremas relacionados às medidas de desempenho de modelos com desistências, limitação e catástrofes, respectivamente. Para os modelos considerados, serão obtidas condições necessárias e suficientes para garantir a explosão ou não do sistema, e o número médio de clientes em um período de serviço contínuo.

5
  • EWELLYN KAROLLYNE ALVES DE ALENCAR FERREIRA
  • O uso da distribuição Lindley Generalizada na construção de um novo processo autorregressivo de primeira ordem

  • Orientador : MARIA DO CARMO SOARES DE LIMA
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • AGATHA SACRAMENTO RODRIGUES
  • MARIA DO CARMO SOARES DE LIMA
  • Data: 28/06/2024

  • Mostrar Resumo
  • A Teoria de Novas distribuições foi amplamente explorada nas últimas décadas com o intuito de se
    propor modelos mais flexíveis e que cujos ajustes ofertados fossem superiores aos obtidos através de
    distribuições estabelecidas na literatura. Apesar disso, é notória a lacuna existente no que diz respeito à
    proposta de novos processos de séries temporais. Dessa forma, com o intuito de trazer alguma
    contribuição na área, o presente trabalho propõe um novo processo autorregressivo de ordem um com
    marginal Lindley Generalizada (Zakerzadeh e Dolati[1], 2009). Para o modelo aqui apresentado, é
    provado que uma distribuição aproximada para a distribuição dos erros aleatórios é dada por uma
    mistura de duas distribuições Gama com vetores paramétricos (α,θ) e (α+1,θ). Algumas medidas
    estatísticas do processo proposto são estudadas, a saber, esperança e variância condicional, distribuição
    conjunta, densidade espectral e funções de autocorrelação e autocorrelação parcial. Os parâmetros do
    processo são estimados através dos métodos de estimação Gaussiano e de mínimos quadrados
    condicionais. Simulações de Monte Carlo são realizadas em cinco diferentes cenários com o objetivo de
    avaliar o comportamento dos estimadores encontrados. Enfim, três aplicações a dados reais são
    realizadas, nas quais os ajustes do processo autorregressivo aqui proposto são comparados com os
    ajustes obtidos para outros sete modelos autorregressivos não-Gaussianos de ordem um.


  • Mostrar Abstract
  • A Teoria de Novas distribuições foi amplamente explorada nas últimas décadas com o intuito de se
    propor modelos mais flexíveis e que cujos ajustes ofertados fossem superiores aos obtidos através de
    distribuições estabelecidas na literatura. Apesar disso, é notória a lacuna existente no que diz respeito à
    proposta de novos processos de séries temporais. Dessa forma, com o intuito de trazer alguma
    contribuição na área, o presente trabalho propõe um novo processo autorregressivo de ordem um com
    marginal Lindley Generalizada (Zakerzadeh e Dolati[1], 2009). Para o modelo aqui apresentado, é
    provado que uma distribuição aproximada para a distribuição dos erros aleatórios é dada por uma
    mistura de duas distribuições Gama com vetores paramétricos (α,θ) e (α+1,θ). Algumas medidas
    estatísticas do processo proposto são estudadas, a saber, esperança e variância condicional, distribuição
    conjunta, densidade espectral e funções de autocorrelação e autocorrelação parcial. Os parâmetros do
    processo são estimados através dos métodos de estimação Gaussiano e de mínimos quadrados
    condicionais. Simulações de Monte Carlo são realizadas em cinco diferentes cenários com o objetivo de
    avaliar o comportamento dos estimadores encontrados. Enfim, três aplicações a dados reais são
    realizadas, nas quais os ajustes do processo autorregressivo aqui proposto são comparados com os
    ajustes obtidos para outros sete modelos autorregressivos não-Gaussianos de ordem um.

6
  • MARIA YESSENIA ÁLVAREZ GIL
  • Modelos de Regressão Linear para Dados Incompletos utilizando Distribuições Assimétricas

  • Orientador : ALDO WILLIAM MEDINA GARAY
  • MEMBROS DA BANCA :
  • ALDO WILLIAM MEDINA GARAY
  • FRANCISCO JOSE DE AZEVEDO CYSNEIROS
  • CELSO RÔMULO BARBOSA CABRAL
  • Data: 23/07/2024

  • Mostrar Resumo
  • As distribuições de misturas de escala skew-normal (SMSN) é uma classe de distribuições assimétricas com caudas pesadas, que inclue distribuições como a skew-normal, skew-t e skew-normal contaminada. Este trabalho propõe um modelo de regressão linear, com censura intervalar, supondo que os erros seguem distribuições da classe SMSN, resultando em modelos mais robustos e flexíveis do que os modelos de regressão censurados que
    supõem distribuição normal para os erros. Implementamos um algoritmo para a estimação dos parâmetros via maximização condicional da função de verossimilhança (ECME), que apresenta expressões analíticas para o passo E. Essas expressões se baseiam em fórmulas para a média e variância de distribuições de misturas de escala skew-normal truncadas, que podem ser calculadas utilizando o pacote MomTrunc disponível no software R-project.
    Ilustramos a aplicação e adequação da metodologia proposta por meio de estudos de simulação e análise de três conjuntos de dados reais.


  • Mostrar Abstract
  • As distribuições de misturas de escala skew-normal (SMSN) é uma classe de distribuições assimétricas com caudas pesadas, que inclue distribuições como a skew-normal, skew-t e skew-normal contaminada. Este trabalho propõe um modelo de regressão linear, com censura intervalar, supondo que os erros seguem distribuições da classe SMSN, resultando em modelos mais robustos e flexíveis do que os modelos de regressão censurados que
    supõem distribuição normal para os erros. Implementamos um algoritmo para a estimação dos parâmetros via maximização condicional da função de verossimilhança (ECME), que apresenta expressões analíticas para o passo E. Essas expressões se baseiam em fórmulas para a média e variância de distribuições de misturas de escala skew-normal truncadas, que podem ser calculadas utilizando o pacote MomTrunc disponível no software R-project.
    Ilustramos a aplicação e adequação da metodologia proposta por meio de estudos de simulação e análise de três conjuntos de dados reais.

7
  • MARIA MARIANA ALVES DE FRANÇA
  • Recorrência e transiência do passeio aleatório em árvores e sua conexão com redes elétricas

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • NEVENA MARIC
  • PABLO MARTIN RODRIGUEZ
  • ÉLCIO LEBENSZTAYN
  • Data: 24/07/2024

  • Mostrar Resumo
  • Neste trabalho estudamos a recorrência e transiência do passeio aleatório em árvores com raiz. O passeio aleatório é definido de tal forma que quando uma partícula encontra-se em um vértice de grau n+1 de uma árvore T, então ela escolhe pular para o vértice antecessor com probabilidade \lambda/\lambda + n, ou para um, dos n vértices sucessores, com probabilidade 1/\lambda + n. Estudamos os argumentos de Lyons (1990) para mostrar que este passeio aleatório é recorrente se \lambda > br(T) e transiente se \lambda < br(T). Isto envolve a análise de propriedades de árvores e da conexão entre passios aleatórios e redes elétricas.


  • Mostrar Abstract
  • Neste trabalho estudamos a recorrência e transiência do passeio aleatório em árvores com raiz. O passeio aleatório é definido de tal forma que quando uma partícula encontra-se em um vértice de grau n+1 de uma árvore T, então ela escolhe pular para o vértice antecessor com probabilidade \lambda/\lambda + n, ou para um, dos n vértices sucessores, com probabilidade 1/\lambda + n. Estudamos os argumentos de Lyons (1990) para mostrar que este passeio aleatório é recorrente se \lambda > br(T) e transiente se \lambda < br(T). Isto envolve a análise de propriedades de árvores e da conexão entre passios aleatórios e redes elétricas.

8
  • ERIC CARDOSO SOARES
  • Métodos de Agrupamento com Pesos Ponderados por Grupo para Dados Simbólicos Intervalares

  • Orientador : GETULIO JOSE AMORIM DO AMARAL
  • MEMBROS DA BANCA :
  • ADRIANO LORENA INACIO DE OLIVEIRA
  • GETULIO JOSE AMORIM DO AMARAL
  • KLAUS LEITE PINTO VASCONCELLOS
  • Data: 25/07/2024

  • Mostrar Resumo
  • O desenvolvimento de métodos para a Análise de Dados Simbólicos é necessário para lidar com dados de elevado grau de complexidade. Diante disso, propomos novos métodos de nuvens dinâmicas utilizando a distância City-Block para dados simbólicos intervalares. Nestes métodos, que são adaptações de dados pontuais, introduzimos o peso do cluster, que busca minimizar problemas recorrentes de agrupamento, como péssima inicialização e obtenção de um mínimo local pobre. Para a validação dos métodos propostos, foram realizados experimentos com dados sintéticos balanceados, desbalanceados e dados reais, nos quais a qualidade do agrupamento foi avaliada por meio do Índice de Rand Ajustado e da Informação Mútua Normalizada. Para os dados sintéticos, foram necessárias a realização da simulação de Monte Carlo e testes estatísticos. Os experimentos evidenciaram que o desempenho dos métodos que utilizam o peso do cluster é superior aos métodos que não o utilizam, mostrando que essa ponderação tem potencial para corrigir os problemas de inicialização e de obtenção
    de um mínimo local pobre.


  • Mostrar Abstract
  • O desenvolvimento de métodos para a Análise de Dados Simbólicos é necessário para lidar com dados de elevado grau de complexidade. Diante disso, propomos novos métodos de nuvens dinâmicas utilizando a distância City-Block para dados simbólicos intervalares. Nestes métodos, que são adaptações de dados pontuais, introduzimos o peso do cluster, que busca minimizar problemas recorrentes de agrupamento, como péssima inicialização e obtenção de um mínimo local pobre. Para a validação dos métodos propostos, foram realizados experimentos com dados sintéticos balanceados, desbalanceados e dados reais, nos quais a qualidade do agrupamento foi avaliada por meio do Índice de Rand Ajustado e da Informação Mútua Normalizada. Para os dados sintéticos, foram necessárias a realização da simulação de Monte Carlo e testes estatísticos. Os experimentos evidenciaram que o desempenho dos métodos que utilizam o peso do cluster é superior aos métodos que não o utilizam, mostrando que essa ponderação tem potencial para corrigir os problemas de inicialização e de obtenção
    de um mínimo local pobre.

9
  • ANTÔNIO MATHEUS OSTERNO LEITÃO
  • PROCESSO AUTORREGRESSIVO DE PRIMEIRA ORDEM COM DISTRIBUIÇÃO MARGINAL XLINDLEY

  • Orientador : MARIA DO CARMO SOARES DE LIMA
  • MEMBROS DA BANCA :
  • LEONARDO HENRIQUE SILVA FERNANDES
  • MARIA DO CARMO SOARES DE LIMA
  • PEDRO MONTEIRO DE ALMEIDA JUNIOR
  • Data: 29/07/2024

  • Mostrar Resumo
  • O surgimento de novas distribuições estatísticas desempenha importante contribuição no avanço das
    diversas áreas do conhecimento. Essa contribuição é dada pelo fornecimento de modelo estatístico
    adequado a cada conjunto de dados específicos. Uma dessas possíveis formas de ampliar o escopo de
    novas distribuições é a partir de misturas finitas de distribuições. Esse processo funciona, basicamente,
    como uma combinação linear de 2 ou mais modelos, cada um deles associados a um peso. O modelo
    XLindley é gerado a partir desse processo de misturas finitas, concebido a partir de duas distribuições:
    exponencial e Lindley. Apesar da fundamental importância no avanço de novas distribuições estatísticas,
    por vezes, esses novos modelos não avançam na seara de diversas técnicas sofisticadas, o que de certa forma reduz o escopo de aplicação dessas novas distribuições. Desse modo, este trabalho visa utilizar o modelo XLindley no contexto de séries temporais, especificamente um processo autorregressivo de ordem 1, AR(1), com o objetivo de ampliar esse escopo de atuação. O novo processo proposto é denominado autorregressivo de ordem 1 com distribuição marginal XLindley, XLAR(1). Diversas propriedades do novo processo foram avaliadas, tais como: medidas condicionais, função de autocorrelação, densidade espectral além de uma forma para realizar previsão. O processo XLAR(1), ainda, teve 2 métodos de estimação estudados, método de mínimos quadrados condicionais e método gaussiano, além de um estudo de simulação via replicações de Monte Carlo com diferentes combinações paramétricas e tamanhos amostrais. Por fim, foi realizada uma aplicação do processo XLAR(1) a dados dos níveis de um lago, bem como uma comparação com outros 6 processos autorregressivos com distribuição marginal não-gaussiano para demonstrar a superioridade novo modelo proposto.


  • Mostrar Abstract
  • O surgimento de novas distribuições estatísticas desempenha importante contribuição no avanço das
    diversas áreas do conhecimento. Essa contribuição é dada pelo fornecimento de modelo estatístico
    adequado a cada conjunto de dados específicos. Uma dessas possíveis formas de ampliar o escopo de
    novas distribuições é a partir de misturas finitas de distribuições. Esse processo funciona, basicamente,
    como uma combinação linear de 2 ou mais modelos, cada um deles associados a um peso. O modelo
    XLindley é gerado a partir desse processo de misturas finitas, concebido a partir de duas distribuições:
    exponencial e Lindley. Apesar da fundamental importância no avanço de novas distribuições estatísticas,
    por vezes, esses novos modelos não avançam na seara de diversas técnicas sofisticadas, o que de certa forma reduz o escopo de aplicação dessas novas distribuições. Desse modo, este trabalho visa utilizar o modelo XLindley no contexto de séries temporais, especificamente um processo autorregressivo de ordem 1, AR(1), com o objetivo de ampliar esse escopo de atuação. O novo processo proposto é denominado autorregressivo de ordem 1 com distribuição marginal XLindley, XLAR(1). Diversas propriedades do novo processo foram avaliadas, tais como: medidas condicionais, função de autocorrelação, densidade espectral além de uma forma para realizar previsão. O processo XLAR(1), ainda, teve 2 métodos de estimação estudados, método de mínimos quadrados condicionais e método gaussiano, além de um estudo de simulação via replicações de Monte Carlo com diferentes combinações paramétricas e tamanhos amostrais. Por fim, foi realizada uma aplicação do processo XLAR(1) a dados dos níveis de um lago, bem como uma comparação com outros 6 processos autorregressivos com distribuição marginal não-gaussiano para demonstrar a superioridade novo modelo proposto.

10
  • THALITA ALVES DA SILVA
  • Conceitos de Estabilidade com Horizonte Variável no Modelo de Grafos para Resolução de Conflitos com Preferências Probabilísticas

  • Orientador : LEANDRO CHAVES REGO
  • MEMBROS DA BANCA :
  • CARLOS DIEGO RODRIGUES
  • GIANNINI ITALINO ALVES VIEIRA
  • LEANDRO CHAVES REGO
  • Data: 30/07/2024

  • Mostrar Resumo
  • Esta dissertação investiga avanços no Modelo de Grafos para Resolução de Conflitos (GMCR),

    destacando a implementação de preferências probabilísticas em estabilidades com horizonte variável. O estudo visa aprimorar a análise de conflitos no GMCR, introduzindo novos conceitos que consideram a incerteza e a probabilidade dos diferentes desfechos nas decisões dos agentes. A motivação deste estudo reside na lacuna existente na literatura sobre como as preferências probabilísticas podem afetar os conceitos de estabilidade com horizonte variável no GMCR. Incorporar essas preferências possibilita uma abordagem mais flexível e realista, crucial para a modelagem precisa de situações conflituosas e para a tomada de decisões eficaz em cenários complexos. Dentre objetivos principais desta dissertação, esteve a preocupação de definir a estabilidade Movimento Limitado com preferências probabilísticas, (𝛼, 𝛽) − 𝐿ℎ, e propor a definição da estabilidade (𝛼, 𝛽) − 𝑀𝑎𝑥𝑖𝑚𝑖𝑛ℎ, também considerando preferências probabilísticas. Além disso, buscamos estabelecer relações entre os novos conceitos de estabilidade e os já existentes na literatura sobre o GMCR. A dissertação consiste em seis capítulos.

    Após capítulo introdutório, no qual fizemos uma revisão de literatura, nós revisamos o modelo GMCR e o GMCR com preferências probabilísticas, apresentamos a estabilidade Movimento Limitado (𝛼, 𝛽) − 𝐿ℎ no GMCR com preferências probabilísticas e a noção da estabilidade (𝛼, 𝛽) − 𝑀𝑎𝑥𝑖𝑚𝑖𝑛ℎ, também, no GMCR com preferências probabilísticas. Fizemos a aplicação dos conceitos que propusemos em um conflito real apresentado na literatura sobre o GMCR. Nossa pesquisa foi conduzida de forma teórica. E com a análise do conflito que fizemos, pudemos ilustrar a utilidade desses novos conceitos, mostrando como a estabilidade do conflito pode variar com os parâmetros 𝛼 e 𝛽 e o horizonte considerado. Portanto, nossos resultados fornecem insights valiosos para a formulação de estratégias de resolução de conflitos, permitindo adaptações conforme as condições específicas do contexto.


  • Mostrar Abstract
  • Esta dissertação investiga avanços no Modelo de Grafos para Resolução de Conflitos (GMCR),

    destacando a implementação de preferências probabilísticas em estabilidades com horizonte variável. O estudo visa aprimorar a análise de conflitos no GMCR, introduzindo novos conceitos que consideram a incerteza e a probabilidade dos diferentes desfechos nas decisões dos agentes. A motivação deste estudo reside na lacuna existente na literatura sobre como as preferências probabilísticas podem afetar os conceitos de estabilidade com horizonte variável no GMCR. Incorporar essas preferências possibilita uma abordagem mais flexível e realista, crucial para a modelagem precisa de situações conflituosas e para a tomada de decisões eficaz em cenários complexos. Dentre objetivos principais desta dissertação, esteve a preocupação de definir a estabilidade Movimento Limitado com preferências probabilísticas, (𝛼, 𝛽) − 𝐿ℎ, e propor a definição da estabilidade (𝛼, 𝛽) − 𝑀𝑎𝑥𝑖𝑚𝑖𝑛ℎ, também considerando preferências probabilísticas. Além disso, buscamos estabelecer relações entre os novos conceitos de estabilidade e os já existentes na literatura sobre o GMCR. A dissertação consiste em seis capítulos.

    Após capítulo introdutório, no qual fizemos uma revisão de literatura, nós revisamos o modelo GMCR e o GMCR com preferências probabilísticas, apresentamos a estabilidade Movimento Limitado (𝛼, 𝛽) − 𝐿ℎ no GMCR com preferências probabilísticas e a noção da estabilidade (𝛼, 𝛽) − 𝑀𝑎𝑥𝑖𝑚𝑖𝑛ℎ, também, no GMCR com preferências probabilísticas. Fizemos a aplicação dos conceitos que propusemos em um conflito real apresentado na literatura sobre o GMCR. Nossa pesquisa foi conduzida de forma teórica. E com a análise do conflito que fizemos, pudemos ilustrar a utilidade desses novos conceitos, mostrando como a estabilidade do conflito pode variar com os parâmetros 𝛼 e 𝛽 e o horizonte considerado. Portanto, nossos resultados fornecem insights valiosos para a formulação de estratégias de resolução de conflitos, permitindo adaptações conforme as condições específicas do contexto.

11
  • ARTHUR CARNEIRO LEAO MACHADO
  • MODELO ARMA ESPACIAL LOG-SIMÉTRICO PARA EXTRAÇÃO DE ATRIBUTOS EM IMAGENS SAR

  • Orientador : ABRAAO DAVID COSTA DO NASCIMENTO
  • MEMBROS DA BANCA :
  • FRANCISCO ALIXANDRE AVILA RODRIGUES
  • FRANCISCO JOSE DE AZEVEDO CYSNEIROS
  • FÁBIO MARIANO BAYER
  • Data: 30/07/2024

  • Mostrar Resumo
  • Resolver problemas de sensoriamento remoto (SR) é crucial para a sociedade quando se
    trata de dinâmica ambiental e climática, para citar apenas alguns exemplos. Uma fonte eficiente
    de SR é o uso de radar de abertura sintética (SAR) para descrever fenômenos naturais
    por meio de imagens. Esta dissertação adota um processamento de imagens considerando que
    os valores de intensidades associados a cada pixel são possíveis realizações de variáveis aleatórias
    positivas. Em particular, a entrada de uma imagem SAR é estocástica tendo argumento
    num espaço regular e descrevemos a natureza da intensidade SAR (que é uma característica
    estritamente positiva e assimétrica afetada pelo ruído speckle) usando uma nova proposta de
    modelo de regressão log-simétrica (LOGSYM) adaptado a duas dimensões, o modelo autoregressivos
    de médias móveis 2-D LOGSYM (2-D LOGSYMARMA). Além de uma discussão
    sobre a relação física entre o modelo proposto e a intensidade do SAR, derivam-se algumas propriedades
    matemáticas do 2-D LOGSYMARMA: função escore e matriz informação de Fisher.
    Discutimos em detalhes a estimativa de máxima verossimilhança condicional (MVC) para os
    parâmetros do 2-D LOGSYMARMA. Realizamos um estudo de Monte Carlo para quantificar
    o desempenho das estimativas resultantes e verificar a velocidade de convergência ao que se
    espera assintoticamente dos estimadores de MVC. Por fim, realizamos uma aplicação a dados
    SAR reais. A flexibilidade do modelo proposto é avaliada para diferentes tipos de cenários, oceano,
    floresta e áreas urbanas. Os resultados de experimentos simulados e reais mostram que o
    modelo proposto nesta dissertação é uma ferramenta importante para extração de informações
    espaciais em imagens SAR.


  • Mostrar Abstract
  • Resolver problemas de sensoriamento remoto (SR) é crucial para a sociedade quando se
    trata de dinâmica ambiental e climática, para citar apenas alguns exemplos. Uma fonte eficiente
    de SR é o uso de radar de abertura sintética (SAR) para descrever fenômenos naturais
    por meio de imagens. Esta dissertação adota um processamento de imagens considerando que
    os valores de intensidades associados a cada pixel são possíveis realizações de variáveis aleatórias
    positivas. Em particular, a entrada de uma imagem SAR é estocástica tendo argumento
    num espaço regular e descrevemos a natureza da intensidade SAR (que é uma característica
    estritamente positiva e assimétrica afetada pelo ruído speckle) usando uma nova proposta de
    modelo de regressão log-simétrica (LOGSYM) adaptado a duas dimensões, o modelo autoregressivos
    de médias móveis 2-D LOGSYM (2-D LOGSYMARMA). Além de uma discussão
    sobre a relação física entre o modelo proposto e a intensidade do SAR, derivam-se algumas propriedades
    matemáticas do 2-D LOGSYMARMA: função escore e matriz informação de Fisher.
    Discutimos em detalhes a estimativa de máxima verossimilhança condicional (MVC) para os
    parâmetros do 2-D LOGSYMARMA. Realizamos um estudo de Monte Carlo para quantificar
    o desempenho das estimativas resultantes e verificar a velocidade de convergência ao que se
    espera assintoticamente dos estimadores de MVC. Por fim, realizamos uma aplicação a dados
    SAR reais. A flexibilidade do modelo proposto é avaliada para diferentes tipos de cenários, oceano,
    floresta e áreas urbanas. Os resultados de experimentos simulados e reais mostram que o
    modelo proposto nesta dissertação é uma ferramenta importante para extração de informações
    espaciais em imagens SAR.

12
  • JOAO PEDRO COELHO AMORIM DE LAVOR
  • Explorando Técnicas de Aprendizado de Máquina para a Classificação de Formas Tridimensionais.

  • Orientador : GETULIO JOSE AMORIM DO AMARAL
  • MEMBROS DA BANCA :
  • ALEX DIAS RAMOS
  • CARLA ALMEIDA VIVACQUA
  • GETULIO JOSE AMORIM DO AMARAL
  • Data: 06/08/2024

  • Mostrar Resumo
  • Esta dissertação tem como objetivo propor novos métodos supervisionados de classificação para dados de pré-forma, considerando dados tridimensionais para a classificação de dois ou mais grupos conhecidos. Os novos métodos são baseados em técnicas discriminantes e modelos de machine learning já estabelecidos no contexto de classificação, como K vizinhos mais próximos, análise discriminante linear e análise discriminante quadrática.Para dados simulados, gerados a partir de uma distribuição normal multivariada, propomos um cenário de classificação usando a acurácia para medir o desempenho dos algoritmos. Nesses testes, todos os modelos atingiram uma boa acurácia, com destaque para o K vizinhos mais próximos e o Discriminante Linear. Para o caso real, utilizamos dados de landmarks faciais com o objetivo de classificar entre três classes distintas. Nesse cenário, o modelo discriminante quadrático se mostrou superior, seguido pelo K vizinhos mais próximos e pelo Discriminante Linear. Dessa forma, podemos concluir que, em ambos os cenários, os novos métodos conseguiram classificar com precisão as classes dos dados.


  • Mostrar Abstract
  • Esta dissertação tem como objetivo propor novos métodos supervisionados de classificação para dados de pré-forma, considerando dados tridimensionais para a classificação de dois ou mais grupos conhecidos. Os novos métodos são baseados em técnicas discriminantes e modelos de machine learning já estabelecidos no contexto de classificação, como K vizinhos mais próximos, análise discriminante linear e análise discriminante quadrática.Para dados simulados, gerados a partir de uma distribuição normal multivariada, propomos um cenário de classificação usando a acurácia para medir o desempenho dos algoritmos. Nesses testes, todos os modelos atingiram uma boa acurácia, com destaque para o K vizinhos mais próximos e o Discriminante Linear. Para o caso real, utilizamos dados de landmarks faciais com o objetivo de classificar entre três classes distintas. Nesse cenário, o modelo discriminante quadrático se mostrou superior, seguido pelo K vizinhos mais próximos e pelo Discriminante Linear. Dessa forma, podemos concluir que, em ambos os cenários, os novos métodos conseguiram classificar com precisão as classes dos dados.

13
  • CAMILA FERREIRA DA SILVA
  • ESTIMAÇÃO DE INDICADOR DE AGRICULTURA PRODUTIVA E SUSTENTÁVEL UTILIZANDO MODELOS DE PEQUENAS ÁREAS PARA DADOS AGROPECUÁRIOS NO BRASIL.

  • Orientador : FERNANDA DE BASTIANI
  • MEMBROS DA BANCA :
  • DENISE BRITZ DO NASCIMENTO SILVA
  • CRISTIANO FERRAZ
  • MARIA CRISTINA FALCAO RAPOSO
  • Data: 22/08/2024

  • Mostrar Resumo
  • Indicadores são criados para monitorar avanços relativos a metas estabelecidas. O Objetivo de Desenvolvimento Sustanetável 2 da Organização das Nações Unidas, cujo propósito é atingir um nível de Fome Zero e Agricultura Sustentável até 2030, tem dentre suas metas, a 2.3, que preconiza dobrar a produtividade agrícola e a renda dos pequenos produtores de alimentos, particularmente das mulheres, povos indígenas, agricultores familiares, pastores e pescadores. Esta meta é monitorada por dois indicadores, um deles sendo o 2.3.1, definido pelo volume de produção por unidade de trabalho por dimensão do estabelecimento agrícola, pastoril e florestal. Esta dissertação se propõe a estudar a viabilidade de estimação do indicador 2.3.1 para domínios subnacionais com nível de desagregação municipal. Embora o Brasil ainda não possua uma Pesquisa Nacional Agropecuária (PNAgro), estudos tem sido realizados ao longo dos anos para tornar possível a realização de tal levantamento, suprindo uma necessidade de estatísticas agropecuárias nacionais entre censos agropecuários, amparada por método probabilístico de amostragem, que há muito tem sido sentida. Prover estimativas com nível de desagregação avançado, como o municipal, raramente está dentre os objetivos de levantamentos nacionais, como uma PNAgro, por razões orçamentárias. No entanto, a disponibilidade de estudos que possibilitem
    a identificação de modelos de estimação de pequenas áreas com potencial para gerar estatísticas agropecuárias municipais, representa ganho metodológico que vem a acrescentar aos diversos motivos pelos quais o Brasil se beneficiaria com uma PNAgro. O estudo apresentado nesta dissertação é uma tentativa de contribuição nesta direção, na medida em que simula uma situação de estimação do indicador 2.3.1 para municipios de Pernambuco, tendo como base dados de uma amostra aleatória nacional. Os resultados obtidos permitiram
    a composição de um conjunto de dados auxiliares promissor, bem como de um modelo de regressão factível para a estimação de pequenas áreas, com base em informações de uma amostra agropecuária nacional simulada.


  • Mostrar Abstract
  • Indicadores são criados para monitorar avanços relativos a metas estabelecidas. O Objetivo de Desenvolvimento Sustanetável 2 da Organização das Nações Unidas, cujo propósito é atingir um nível de Fome Zero e Agricultura Sustentável até 2030, tem dentre suas metas, a 2.3, que preconiza dobrar a produtividade agrícola e a renda dos pequenos produtores de alimentos, particularmente das mulheres, povos indígenas, agricultores familiares, pastores e pescadores. Esta meta é monitorada por dois indicadores, um deles sendo o 2.3.1, definido pelo volume de produção por unidade de trabalho por dimensão do estabelecimento agrícola, pastoril e florestal. Esta dissertação se propõe a estudar a viabilidade de estimação do indicador 2.3.1 para domínios subnacionais com nível de desagregação municipal. Embora o Brasil ainda não possua uma Pesquisa Nacional Agropecuária (PNAgro), estudos tem sido realizados ao longo dos anos para tornar possível a realização de tal levantamento, suprindo uma necessidade de estatísticas agropecuárias nacionais entre censos agropecuários, amparada por método probabilístico de amostragem, que há muito tem sido sentida. Prover estimativas com nível de desagregação avançado, como o municipal, raramente está dentre os objetivos de levantamentos nacionais, como uma PNAgro, por razões orçamentárias. No entanto, a disponibilidade de estudos que possibilitem
    a identificação de modelos de estimação de pequenas áreas com potencial para gerar estatísticas agropecuárias municipais, representa ganho metodológico que vem a acrescentar aos diversos motivos pelos quais o Brasil se beneficiaria com uma PNAgro. O estudo apresentado nesta dissertação é uma tentativa de contribuição nesta direção, na medida em que simula uma situação de estimação do indicador 2.3.1 para municipios de Pernambuco, tendo como base dados de uma amostra aleatória nacional. Os resultados obtidos permitiram
    a composição de um conjunto de dados auxiliares promissor, bem como de um modelo de regressão factível para a estimação de pequenas áreas, com base em informações de uma amostra agropecuária nacional simulada.

14
  • FERNANDO KELLER
  • Análise estatística de crimes em Matelândia baseado em clusterização não-supervisionada de centroides para suporte à decisão na construção de nova base da polícia militar

  • Orientador : THYAGO CELSO CAVALCANTE NEPOMUCENO
  • MEMBROS DA BANCA :
  • THYAGO CELSO CAVALCANTE NEPOMUCENO
  • JODAVID DE ARAUJO FERREIRA
  • TARCISIO DA COSTA LOBATO
  • Data: 29/10/2024

  • Mostrar Resumo
  • Este estudo investiga a criminalidade na cidade de Matelândia, estado do Paraná, utilizando técnicas de machine learning para agrupar dados referente a crimes ocorrido no município em clusters usando o método k-means. O objetivo é avaliar a necessidade da construção de uma nova base para a Polícia Militar e também avaliar se a atual base está bem localizada em relação aos crimes que ocorreram, como também avaliar se a posição atual está satisfatória, usando uma técnica que dará grau de importância para cada natureza criminal. Foram quatro os crimes escolhidos para serem analisados neste trabalho, sendo eles furto, roubo, “Maria da Penha” (violência doméstica) e estupro, referente ao período de outubro de 2022 à outubro de 2023 e foram fornecidos pela Polícia Militar do Estado do Paraná. Foi feito um estudo sobre a criminalidade em um contexto nacional, além do impacto dos crimes escolhidos na sociedade. Foi realizado um estudo e análise dos dados criminais, aprofundando em suas características principais e como estão distribuídos na período temporal observado. Os resultados propostos foram alcançados, e após aplicar métodos matematicamente relevantes, foi possível afirmar que a localização atual está satisfatória, assim como foi possível concluir que uma segunda base policial militar seria de grande valia no combate ao crime na região. Dessa forma este estudo pode proporcionar uma melhor alocação de recursos da segurança pública do estado do Paraná na cidade de Matelândia.


  • Mostrar Abstract
  • This study investigates crime in the city of Matelândia, state of Paraná, using machine learning techniques to group data related to crimes that occurred in the municipality into clusters using the k-means method. The objective is to evaluate the need to build a new database for the Military Police and also to evaluate whether the current database is well located in relation to the crimes that occurred, as well as to evaluate whether the current position is satisfactory, using a technique that will give a degree of importance to each criminal nature. Four crimes were chosen to be analyzed in this work, namely theft, robbery, “Maria da Penha” (domestic violence) and rape, referring to the period from October 2022 to October 2023 and were provided by the Military Police of the State of Paraná. A study was carried out on crime in a national context, in addition to the impact of the chosen crimes on society. A study and analysis of criminal data was carried out, deepening its main characteristics and how they are distributed in the observed time period. The proposed results were achieved, and after applying mathematically relevant methods, it was possible to state that the current location is satisfactory, as well as concluding that a second military police base would be of great value in combating crime in the region. In this way, this study can provide a better allocation of public security resources in the state of Paraná in the city of Matelândia.

15
  • MARIA JÚLIA NEVES GREGÓRIO
  • ABORDAGEM BAYESIANA PARA PROCESSOS RCINAR(1): ESTIMAÇÃO, INFERÊNCIA E PREVISÃO

  • Orientador : ALDO WILLIAM MEDINA GARAY
  • MEMBROS DA BANCA :
  • FRANCYELLE DE LIMA MEDINA
  • VINICIUS QUINTAS SOUTO MAIOR
  • RODRIGO LAMBERT
  • Data: 30/10/2024

  • Mostrar Resumo
  • Neste trabalho propomos um modelo autorregressivo de valores inteiros não negativos, com coeficiente aleatório, cuja inovação segue uma distribuição Poisson inflacionada de zeros, definido como RCZINAR(1). Essa abordagem é útil para modelar dados de contagem que apresentam um número maior de zeros que o esperado. Desenvolvemos um algoritmo via abordagem Bayesiana para estimação dos parâmetros dos modelos RCINAR(1) e RCZINAR(1). Implementamos estudos de simulação com o intuito de avaliar as metodologias propostas. Além disso, aplicamos em um conjunto de dados reais os modelos, comparamos seus resultados e estimamos a distribuição de previsão utilizando Bootstrap em blocos.


  • Mostrar Abstract
  • Neste trabalho propomos um modelo autorregressivo de valores inteiros não negativos, com coeficiente aleatório, cuja inovação segue uma distribuição Poisson inflacionada de zeros, definido como RCZINAR(1). Essa abordagem é útil para modelar dados de contagem que apresentam um número maior de zeros que o esperado. Desenvolvemos um algoritmo via abordagem Bayesiana para estimação dos parâmetros dos modelos RCINAR(1) e RCZINAR(1). Implementamos estudos de simulação com o intuito de avaliar as metodologias propostas. Além disso, aplicamos em um conjunto de dados reais os modelos, comparamos seus resultados e estimamos a distribuição de previsão utilizando Bootstrap em blocos.

Teses
1
  • NICOLLAS STEFAN SOARES DA COSTA
  • EXAMINING THE GENERALIZED ODD LOG-LOGISTIC FAMILY: A REGRESSION COMPILATION.

  • Orientador : MARIA DO CARMO SOARES DE LIMA
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • FERNANDO ARTURO PEÑA RAMÍREZ
  • JOSIMAR MENDES DE VASCONCELOS
  • MARIA DO CARMO SOARES DE LIMA
  • RENATA ROJAS GUERRA
  • Data: 03/04/2024

  • Mostrar Resumo
  • In this work, considering the new family of distributions, generalized odd log-logisticG, several applications were proposed with different real data using regression models. The distributions in this family accommodate asymmetric, bimodal and fat tail shapes, showing flexibility when compared to other generators. Based on the new generating family of distributions, regression models were introduced with distinct systematic structures and all the computational modeling is implemented via R software. The results obtained using complex data sets demonstrated that the proposed models are a viable alternative to competing distributions and corroborate previous studies.


  • Mostrar Abstract
  • In this work, considering the new family of distributions, generalized odd log-logisticG, several applications were proposed with different real data using regression models. The distributions in this family accommodate asymmetric, bimodal and fat tail shapes, showing flexibility when compared to other generators. Based on the new generating family of distributions, regression models were introduced with distinct systematic structures and all the computational modeling is implemented via R software. The results obtained using complex data sets demonstrated that the proposed models are a viable alternative to competing distributions and corroborate previous studies.

2
  • JOAS SILVA DOS SANTOS
  • APRIMORAMENTO DE TESTES DE HIPÓTESES PARA MODELOS DE SUPERDISPERSÃO E MODELOS BETA PRIME.

  • Orientador : AUDREY HELEN MARIZ DE AQUINO CYSNEIROS
  • MEMBROS DA BANCA :
  • AUDREY HELEN MARIZ DE AQUINO CYSNEIROS
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • ROBERTO FERREIRA MANGHI
  • MIGUEL ANGEL URIBE OPAZO
  • MARIANA CORREIA DE ARAÚJO
  • Data: 26/04/2024

  • Mostrar Resumo
  • O uso dos modelos lineares generalizados tornou-se comum em vários campos de estudo. No entanto, em algumas aplicações, a variabilidade inerente à resposta é maior do que aquela capturada pela função de variância implícita em tais modelos. Este fenômeno é conhecido como superdispersão e ocorre, principalmente, em relação às distribuições de Poisson e binomial. Os modelos não lineares generalizados superdispersados (MNLGS) são úteis para a análise de dados com superdispersão. O teste da razão de verossimilhança é tipicamente empregado para realizar inferências sobre os parâmetros nos MNLGS. Tal teste usa uma aproximação qui-quadrado, e essa aproximação pode ser pobre quando o tamanho da amostra não é grande, resultando em distorções de tamanho. Assim, é importante ter alternativas que possam fornecer inferências mais confiáveis em amostras pequenas. Derivamos uma correção para o teste da razão de verossimilhança nos MNLGS. Os resultados de simulação de Monte Carlo apresentados mostram que, em pequenas amostras, o teste corrigido proposto tem melhor desempenho que o teste usual e um teste corrigido alternativo, e desempenho semelhante ao do teste corrigido alternativo bootstrap. Duas aplicações são apresentadas e discutidas. Além disso, obtivemos uma correção de Bartlett para um teste de dispersão de verossimilhança perfilada modificada nos MNLGS. Também derivamos uma correção de Bartlett para o modelo de regressão beta prime com dispersão variável, útil na análise de respostas positivas. Com base nesse resultado definimos três testes corrigidos que podem ser usados em análises de regressão beta prime. A evidência numérica apresentada mostra que todos os três testes corrigidos têm melhor comportamento de amostra finita que o teste da razão de verossimilhança usual, e que um dos testes corrigidos apresenta um controle superior da frequência do Erro tipo I. Apresentamos e discutimos duas aplicações empíricas.


  • Mostrar Abstract
  • Os modelos lineares generalizados superdispersados (MLGS), propostos por Dey et al. (1997), permitem que tanto a média quanto a dispersão sejam modeladas simultaneamente no contexto dos modelos lineares generalizados. Os MLGS são muito úteis para modelar a dispersão quando a variância da variável resposta excede a variância nominal predita pelo modelo.  Nesta tese, tratamos  de refinamentos para testes de hipóteses nos MNLGS. Nós obtivemos um fator  de correção de Bartlett para o teste da razão de verossimilhanças baseado em verossimilhança perfilada  modificada proposta por Cox e Reid (1987). Além disso, desenvolvemos novos ajustes para a estatística  da razão de verossimilhanças com base nos trabalhos de Skovgaard (1996, 2001). Estudos de simulação de  Monte Carlo foram considerados para avaliar e comparar numericamente os desempenhos dos testes em amostras  finitas, no que tange ao tamanho e poder.


3
  • ADENICE VASCONCELOS FERREIRA
  • Distâncias Estocásticas para Agrupamento de Formas em 2D e Dados Direcionais

  • Orientador : GETULIO JOSE AMORIM DO AMARAL
  • MEMBROS DA BANCA :
  • ALEX DIAS RAMOS
  • GETULIO JOSE AMORIM DO AMARAL
  • LUCIA PEREIRA BARROSO
  • RENATA MARIA CARDOSO RODRIGUES DE SOUZA
  • ROBERTO FERREIRA MANGHI
  • Data: 20/06/2024

  • Mostrar Resumo
  •  Métodos não supervisionados são utilizados para distribuir dados em grupos distintos entre si, e com elementos com maior similaridade dentro dos grupos. Novas técnicas têm sido estudadas a fim de melhorar a eficácia do agrupamento em diversos cenários. Na primeira parte deste trabalho, o foco está na melhora do agrupamento em cenários com baixa concentração dos dados. Assim, o objetivo principal foi apresentar novas abordagens de técnicas de agrupamento, no contexto da análise de formas em cenários com dados menos concentrados. Utilizando a metodologia dos K vizinhos mais próximos aliada às distâncias com base na distribuição Bingham, propomos nove adaptações do algoritmo k-médias. As análises iniciaram com estudo de simulações, avaliando o número de K vizinhos, e, posteriormente, foram realizadas simulações de Monte Carlo. Os resultados simulados foram analisados por meio de estatísticas descritivas e testes de hipóteses. As nove adaptações propostas obtiveram desempenho semelhante entre si. Quando comparados com o algoritmo KMPS, os novos algoritmos mostraram desempenho melhor nos cenários de baixa concentração dos dados. Foram feitas três aplicações em base de dados reais nas quais os algoritmos que se destacaram foram o BB1JB,  BR2 e o algoritmo KMPS. A segunda parte desta tese apresenta três propostas de distâncias no contexto de dados direcionais, sendo as três baseadas na distribuição Von Mises-Fisher matricial. O objetivo principal foi utilizá-las na composição de algoritmos para agrupamento de dados direcionais. Assim, foram propostos seis variações do algoritmo base. As análises tiveram início com a avaliação gráfica do desempenho das distâncias propostas, visando identificar mudanças em uma matriz tomada como base. Também foi verificado o impacto do número de direções nos desempenhos dos algoritmos, bem como suas performances em três cenários com características distintas. Foram realizadas aplicações em base de dados reais com informações tridimensionais de remanências magnéticas de rochas. As seis adaptações obtiveram desempenhos semelhantes, com índices de Rand variando alcançando valores iguais a 1.00, nos cenários com dois grupos.


  • Mostrar Abstract
  • Métodos não supervisionados são utilizados para distribuir dados em grupos distintos entre si, e com elementos com maior similaridade dentro dos grupos. Novas técnicas têm sido estudadas a fim de melhorar a eficácia do agrupamento em diversos cenários. Na primeira parte deste trabalho, o foco está na melhora do agrupamento em cenários com baixa concentração dos dados. Assim, o objetivo principal foi apresentar novas abordagens de técnicas de agrupamento, no contexto da análise de formas em cenários com dados menos concentrados. Utilizando a metodologia dos K vizinhos mais próximos aliada às distâncias com base na distribuição Bingham apresentadas por Felix (2019), propomos nove adaptações do algoritmo k-médias. Foram realizados estudos de simulações e  três aplicações em base de dados reais: duas bases de marcos anatômicos de crianças para distinguir entre sexo masculino e feminino, e outro banco com dados de landmarks da face de motoristas em trânsito. A parte 2 da tese, por sua vez, apresenta três propostas de distâncias para o âmbito multidimensional, no contexto de dados direcionais, sendo as três baseadas na distribuição Von Mises-Fisher. O objetivo, nesta etapa, foi construir testes de hipóteses para comparar matrizes de parâmetros com distribuição Von Mises-Fisher. Os resultados das simulações são apresentados e discutidos.


4
  • HUGO DELEON PEREIRA DE MEDEIROS
  • Operadores de percolação em Z: Limites mais precisos para o valor crítico eexistência de distribuição invariante

  • Orientador : ALEX DIAS RAMOS
  • MEMBROS DA BANCA :
  • ALDO WILLIAM MEDINA GARAY
  • ALEX DIAS RAMOS
  • GETULIO JOSE AMORIM DO AMARAL
  • GLAUCO VALLE DA SILVA COELHO
  • LUIZ RENATO GONÇALVES FONTES
  • Data: 30/07/2024

  • Mostrar Resumo
  • Neste trabalho, investigamos a teoria de Processos Estocásticos com Interação Local em tempo discreto, conhecidos como Autômatos Celulares Probabilísticos (ACP). Exploramos uma classe de ACP, a qual é conhecida por operadores de percolação. O Processo de Stavskaya é um dos exemplo mais simples de operador de percolação. Essa classe de operadores apresenta o fenômeno de transição de fase entre os comportamentos de ergodicidade e nãoergodicidade, o qual é função de um parâmetro α ∈ [0, 1]. A fim de obter melhores estimativas para os limites inferior e superior para o valor crítico, α , que delimita os comportamentos de ergodicidade versus não-ergodicidade, estabelecemos e aplicamos novas metodologias, a qual nos forneceram novos limites, melhorando resultados previamente conhecidos na literatura. O limite inferior obtido foi 0, 113 de modo que quando α < 0, 113, o sistema tem um comportamento não-ergódico, tal estimativa foi alcançada fazendo uso do conceito de matriz de adjacência para quantificar o número de caminhos do grafo associado a evolução de nosso processo. Por outro lado, o limite superior obtido foi αn < (n − 1)/(n + 1). Para obter este resultado, mostramos que α depende somente do número, n,  de vizinhos, não de suas posições, de modo que quando α > αn o sistema tem comportamento ergódico. Destacamos ainda que a noção de monotonicidade para estes operadores, nos permitiu estabelecer condições para a existência de medidas invariantes não triviais. Além disso, realizamos análises numéricas, utilizando a aproximação de campo médio, e modelagem computacional para estimar α .


  • Mostrar Abstract
  • O fenômeno de percolação pode ser visto na passagem de um fluido através
    de um meio poroso. Isto é o que ocorre em alguns processos de  extração de petróleo bruto. O estudo de percolação tem atraído e ainda atrai a atenção. Uma grande quantidade  processos matemáticos são propostos, como intuito de compreender este fenômeno em diferentes ambientes.
    Mesmo nos autômatos celulares probabilísticos foi estabelecido uma classe de operadores, a qual é conhecida por operadores de percolação. Essa classe apresenta uma transição de fase entre os fenômenos de ergodicidade e não-ergodicidade em função de um parâmetro, alpha. Para obter um  limite inferior para alpha, nós estabelecemos e aplicamos uma nova metodologia, a qual nos deu um limite inferiore, que comparado com os conhecidos mostrou-se quantitativamente equivalente. Além disso, sugerimos extender estes operadores considerando-se uma interação variável no tempo.    

5
  • JOAO EUDES MIQUEIAS MACIEL TORRES
  • Estimação assistida por modelos lineares generalizados em planos amostrais de cadastros múltiplos.

  • Orientador : CRISTIANO FERRAZ
  • MEMBROS DA BANCA :
  • ANDREA DINIZ DA SILVA
  • CRISTIANO FERRAZ
  • HEMILIO FERNANDES CAMPOS COELHO
  • LUCIA PEREIRA BARROSO
  • MAURICIO FRANCA LILA
  • Data: 30/08/2024

  • Mostrar Resumo
  • Esta tese considera o problema de estimação de parâmetros de populações finitas usando um estimador assistido por modelo linear generalizado (GEREG), quando a amostra é selecionada a partir de múltiplos cadastros sobrepostos. O GEREG considera a disponibilidade de variáveis auxiliares relacionadas à variável de interesse através de um modelo linear generalizado adequado. Nas situações em que a distribuição empírica da variável de interesse pode ser considerada como membro da família exponencial, espera-se que o GEREG apresente um melhor desempenho estatístico do que o estimador de regressão geral usual (GREG). Esta tese estende o GEREG para um plano amostral de cadastros múltiplos, utilizando a abordagem de estimação por multiplicidade. Sua forma geral, bem como propriedades estatísticas são introduzidas. É apresentado um estudo de Monte Carlo, comparando o GEREG com concorrentes, para estimar totais e proporções populacionais, considerando um plano amostral de múltiplos cadastros em pesquisa agrícola usando um cadastro de área de segmentos quadrados e dois cadastros de lista de produtores.


  • Mostrar Abstract
  • Neste tese, o problema de estimar proporções e totais populacionais incorporando informações auxiliares através de um modelo multinomial logístico de regressão será abordado, utilizando o plano amostral de cadastros múltiplos, tendo como principal motivação a aplicação em pesquisas agropecuárias.

6
  • FRANCE EVELLYN GOMES DE OLIVEIRA
  • REPRESENTAÇÕES MATRICIAIS DE CONCEITOS DE ESTABILIDADE COM HORIZONTES VARIÁVEIS NO MODELO DE GRAFOS PARA RESOLUÇÃO DE CONFLITOS.


  • Orientador : LEANDRO CHAVES REGO
  • MEMBROS DA BANCA :
  • EMERSON RODRIGUES SABINO
  • GIANNINI ITALINO ALVES VIEIRA
  • LEANDRO CHAVES REGO
  • MAISA MENDONCA SILVA
  • RAYDONAL OSPINA MARTINEZ
  • ROBERTO FERREIRA MANGHI
  • Data: 19/11/2024

  • Mostrar Resumo
  • Decisões cotidianas podem levar a situações conflituosas em que as partes com poder de decisão podem ter interesses distintos em um determinado contexto. Neste sentido, o uso de métodos de resolução de conflitos se  mostra uma maneira sistemática de representar e analisar tais situações. Neste contexto, esta tese busca  contribuir na análise de estabilidade com horizonte variável de conflitos através do uso de métodos matriciais no  Modelo de Grafos para Resolução de Conflitos (GMCR). Mais especificamente, nesta tese, propusemos resultados  sobre representações matriciais para determinar estados estáveis de acordo com os conceitos solução de  estabilidades sequenciais de ordem superior, Maximinh e Lh (em desenvolvimento) no âmbito do GMCR  considerando conflitos bilaterais e multilaterais. Com base nos sistemas lógicos já existentes na literatura, são desenvolvidos os sistemas matriciais para 2 e n tomadores de decisão (DMs). No conceito original de  estabilidade do Maximinh, nenhuma informação prévia sobre as preferências de outros tomadores de decisão (DMs) é necessária, já no caso da estabilidade Lh é necessário ter o conhecimento prévio. Além disso, a  estabilidade Maximinh é facilmente adequada para modelar conflitos nos quais os DMs têm perfis cautelosos. Conceitos clássicos de estabilidade, como metaracionalidade simétrica, metaracionalidade geral e estabilidade de Nash são casos particulares da estabilidade de Maximinh. Com os métodos propostos neste trabalho, análises  de estabilidade com horizonte variável em conflitos envolvendo um grande número de estados ou DMs podem  ser feitas de forma eficiente. Após o desenvolvimento dos sistemas matriciais, a fim de demonstrar a utilidade  das representações matriciais obtidas neste trabalho, foram feitas aplicações da representação matricial m-SEQ  para o caso de uma disputa com dois DMs, o clássico jogo Matching Pennies, e para o caso de n-DMs, o conflito  da renovação de área de instalação industrial privada. No caso da estabilidade Maximinh, realizamos uma  aplicação ao conflito chinês de seleção de tecnologia em neurociência. Como esperado, as representações  matriciais propostas quando comparadas ao sistema lógico apresentaram maior eficiência e facilidade nos  cálculos de estabilidade.


  • Mostrar Abstract
  • Decisões cotidianas podem levar a situações conflituosas em que as
    partes com poder de decisão podem ter interesses distintos em um
    determinado contexto. Neste sentido, o uso
    de métodos de resolução de conflitos se mostra uma maneira sistemática
    de representar e analisar tais situações. Neste contexto, esta tese
    busca contribuir na análise de estabilidade com horizonte variável de
    conflitos através do uso de métodos matriciais no Modelo de Grafos
    para Resolução de Conflitos (GMCR). Mais especificamente, nesta tese,
    propusemos resultados sobre representações matriciais para determinar
    estados estáveis de acordo com os conceitos solução de estabilidades
    sequenciais de ordem superior, Maximinh e Lh (em desenvolvimento) no
    âmbito do GMCR considerando conflitos bilaterais e multilaterais. Com
    base nos sistemas lógicos já existentes na literatura, são
    desenvolvidos os sistemas matriciais para 2 e n tomadores de decisão
    (DMs). No conceito original de estabilidade do Maximinh, nenhuma
    informação prévia sobre as preferências de outros tomadores de decisão
    (DMs) é necessária, já no caso da estabilidade Lh é necessário ter o
    conhecimento prévio. Além disso, a estabilidade Maximinh é facilmente
    adequada para modelar conflitos nos quais os DMs têm perfis
    cautelosos. Conceitos clássicos de estabilidade, como
    metaracionalidade simétrica, metaracionalidade geral e estabilidade de
    Nash são casos particulares da estabilidade de Maximinh. Com os
    métodos propostos neste trabalho, análises de estabilidade com
    horizonte variável em conflitos envolvendo um grande número de estados
    ou DMs podem ser feitas de forma eficiente. Após o desenvolvimento dos
    sistemas matriciais, a fim de demonstrar a utilidade das
    representações matriciais obtidas neste trabalho, foram feitas
    aplicações da representação matricial m-SEQ para o caso de uma disputa
    com dois DMs, o clássico jogo Matching Pennies, e para o caso de
    n-DMs, o conflito da renovação de área de instalação industrial
    privada. No caso da estabilidade Maximinh, realizamos uma aplicação ao
    conflito chinês de seleção de tecnologia em neurociência. Como
    esperado, as representações matriciais propostas quando comparadas ao
    sistema lógico apresentaram maior eficiência e facilidade nos cálculos
    de estabilidade.

2023
Dissertações
1
  • JONATHA SOUSA PIMENTEL
  • Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: Uma nova abordagem através da fusão de SVM's fracos e esféricos.

  • Orientador : RAYDONAL OSPINA MARTINEZ
  • MEMBROS DA BANCA :
  • ANDERSON ARA
  • LEANDRO CHAVES REGO
  • TELMO DE MENEZES E SILVA FILHO
  • Data: 10/02/2023

  • Mostrar Resumo
  • A capacidade de geração de dados nos últimos anos, atingiu níveis nunca antes vistos. Mais dados em apenas dois anos do que em 5 mil anos de história, aumento em 50 vezes do volume gerado em um período de 10 anos, termos como Big Data, Machine Learning e Inteligência Artificial cada vez mais comumente vistos e falados. Tudo isso provocado pela evolução humana, obrigou-nos a sermos capazes de coletar, armazenar e analisar tal quantidade de dados, surgindo e desenvolvendo-se o campo de estudo das técnicas de aprendizado de máquina (ML - do inglês Machine Learning). Dentre as diversas técnicas existentes e que tem ganhado força e destaque, a técnica a ser aqui trabalhada são as máquinas de vetores de suporte (SVM - do inglês Support Vector Machine), que apesar de despertar grande interesse da comunidade científica desde sua introdução por Vapnik em 1995, assim como muitos modelos de aprendizagem, possui uma limitação quando utilizada para dados massivos. Frente a esta dificuldade, neste trabalho, buscamos a implementação, utilização e comparação da técnica Sphere SVM, utilizada para acelerar o tempo de estimação de um modelo SVM, bem como propor um modelo que possa combinar a ideia de coresets com a utilização de weak's SVM. Os resultados obtidos ao comparar os modelos para diferentes bases de dados simuladas e reais, apresentam modelos que permitem a manutenção da capacidade preditiva do modelo SVM tradicional, bem como a sua estimação em um décimo do tempo para o modelo completo.


  • Mostrar Abstract
  • A capacidade de geração de dados nos últimos anos, atingiu níveis nunca antes vistos. Mais dados em apenas dois anos do que em 5 mil anos de história, aumento em 50 vezes do volume gerado em um período de 10 anos, termos como Big Data, Machine Learning e Inteligência Artificial cada vez mais comumente vistos e falados. Tudo isso provocado pela evolução humana, obrigou-nos a sermos capazes de coletar, armazenar e analisar tal quantidade de dados, surgindo e desenvolvendo-se o campo de estudo das técnicas de aprendizado de máquina (ML - do inglês Machine Learning). Dentre as diversas técnicas existentes e que tem ganhado força e destaque, a técnica a ser aqui trabalhada são as máquinas de vetores de suporte (SVM - do inglês Support Vector Machine), que apesar de despertar grande interesse da comunidade científica desde sua introdução por Vapnik em 1995, assim como muitos modelos de aprendizagem, possui uma limitação quando utilizada para dados massivos. Frente a esta dificuldade, neste trabalho, buscamos a implementação, utilização e comparação da técnica Sphere SVM, utilizada para acelerar o tempo de estimação de um modelo SVM, bem como propor um modelo que possa combinar a ideia de coresets com a utilização de weak's SVM. Os resultados obtidos ao comparar os modelos para diferentes bases de dados simuladas e reais, apresentam modelos que permitem a manutenção da capacidade preditiva do modelo SVM tradicional, bem como a sua estimação em um décimo do tempo para o modelo completo.

2
  • LUIS GONZAGA PINHEIRO FELIX
  •  Explorando seleção de variáveis explicativas no contexto dos modelos aditivos generalizados de locação, escala e forma.

  • Orientador : FERNANDA DE BASTIANI
  • MEMBROS DA BANCA :
  • FERNANDA DE BASTIANI
  • GETULIO JOSE AMORIM DO AMARAL
  • MARCELO DOS SANTOS
  • Data: 17/02/2023

  • Mostrar Resumo
  • A seleção de variáveis explicativas em modelos estatísticos é um problema atual e importante dentro da estatística e para o qual diferentes soluções já foram propostas para os diversos tipos de modelos. No caso específico dos modelos aditivos generalizados de locação escala e forma (GAMLSS), a seleção de variáveis explicativas é feita usando métodos stepwise. Na atual implementação de seleção de variáveis nos GAMLSS tem-se disponível duas estratégias conhecidas como estratégia A e estratégia B chamamos de estratégia A e estratégia B, sendo que ambas selecionam variáveis explicativas para modelar todos os parâmetros da distribuição, mas de forma diferente. Neste trabalho estas metodologias foram descritas detalhadamente e por meio de estudos de simulação, foram investigados e comparados métodos de seleção de variáveis, usando modelos com uma estruturas lineares, com estruturas não lineares usando funções de suavização para diferentes distribuições de probabilidade. Foi introduzida uma nova proposta de seleção de modelos e esta também foi comparada com as estratégias A e B. Uma aplicação a dados reais ilustra a metodologia apresentada.


  • Mostrar Abstract
  • A seleção de variáveis explicativas em modelos estatísticos é um problema atual e importante dentro da estatística e para o qual diferentes soluções já foram propostas para os diversos tipos de modelos. No caso específico dos modelos aditivos generalizados de locação escala e forma (GAMLSS), a seleção de variáveis explicativas é feita usando métodos stepwise. Na atual implementação de seleção de variáveis nos GAMLSS tem-se disponível duas estratégias conhecidas como estratégia A e estratégia B chamamos de estratégia A e estratégia B, sendo que ambas selecionam variáveis explicativas para modelar todos os parâmetros da distribuição, mas de forma diferente. Neste trabalho estas metodologias foram descritas detalhadamente e por meio de estudos de simulação, foram investigados e comparados métodos de seleção de variáveis, usando modelos com uma estruturas lineares, com estruturas não lineares usando funções de suavização para diferentes distribuições de probabilidade. Foi introduzida uma nova proposta de seleção de modelos e esta também foi comparada com as estratégias A e B. Uma aplicação a dados reais ilustra a metodologia apresentada.

3
  • MARIA FRANCIELE DA SILVA SANTOS SOUSA
  • Correção de viés para o modelo de regressão G0I: Uma aplicação à extração de atributos em imagens SAR.

  • Orientador : ABRAAO DAVID COSTA DO NASCIMENTO
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • AUDREY HELEN MARIZ DE AQUINO CYSNEIROS
  • PEDRO MONTEIRO DE ALMEIDA JUNIOR
  • Data: 24/02/2023

  • Mostrar Resumo
  • Os sistemas de radar de abertura sintética (Synthetic Aperture Radar - SAR) têm sido uma ferramenta bastante eficiente na resolução de problemas de sensoriamento remoto. Tais sistemas apresentam diversas vantagens; tais como, eles podem operar independentemente das condições atmosféricas e produzir imagens com alta resolução espacial. Entretanto, as imagens SAR são contaminadas por um tipo de interferência denominada ruído speckle, dificultando assim a análise e o processamento delas. Assim, a proposta de técnicas estatísticas que consideram o ruído speckle se torna uma importante etapa para usuários do sistema SAR, em particular modelos de regressão. Vasconcelos 2018 propôs o modelo de regressão G0I (RG0I), indicando que ele tem uma grande importância na interpretação de imagens de intensidade SAR. É sabido da Teoria Assintótica de primeira ordem que o viés do estimador de máxima verossimilhança é de ordem O(1/n), podendo ser significativo para tamanhos de amostra pequenos e moderados. Nesta dissertação, objetiva-se propor um estimador melhorado para os parâmetros de (RG0I) a partir da derivação do viés de segunda ordem proposto por Cox-Snell. Esta proposta encontra justificação uma vez que o processamento de imagens SAR é requerido o uso de janelas pequenas e moderadas, como no estudo de atributos na vizinhança de pixels para classificação e filtragem. Assim a proposta de métodos de Teoria Assintótica de segunda ordem ou ordem superior se torna necessária. Nesta dissertação, apresentam-se os primeiros avanços nesta direção considerando o suposto da regressão G0I . Primeiramente, várias expressões em forma fechada para cumulantes de terceira ordem para RG0I são apresentadas. Subsequentemente, propõe-se uma expressão em forma fechada para viés de segunda ordem segundo a expressão de Cox-Snell. A fim de quantificar o desempenho da estimação melhorada, sua performance é quantificada comparativamente àquela das estimativas de máxima verossimilhança original. Finalmente uma aplicação a dados reais é realizada. Em todos os resultados numéricos, é possível observar a importância da proposta desta dissertação.


  • Mostrar Abstract
  • Os sistemas de radar de abertura sintética (Synthetic Aperture Radar - SAR) têm sido uma ferramenta bastante eficiente na resolução de problemas de sensoriamento remoto. Tais sistemas apresentam diversas vantagens; tais como, eles podem operar independentemente das condições atmosféricas e produzir imagens com alta resolução espacial. Entretanto, as imagens SAR são contaminadas por um tipo de interferência denominada ruído speckle, dificultando assim a análise e o processamento delas. Assim, a proposta de técnicas estatísticas que consideram o ruído speckle se torna uma importante etapa para usuários do sistema SAR, em particular modelos de regressão. Vasconcelos 2018 propôs o modelo de regressão G0I (RG0I), indicando que ele tem uma grande importância na interpretação de imagens de intensidade SAR. É sabido da Teoria Assintótica de primeira ordem que o viés do estimador de máxima verossimilhança é de ordem O(1/n), podendo ser significativo para tamanhos de amostra pequenos e moderados. Nesta dissertação, objetiva-se propor um estimador melhorado para os parâmetros de (RG0I) a partir da derivação do viés de segunda ordem proposto por Cox-Snell. Esta proposta encontra justificação uma vez que o processamento de imagens SAR é requerido o uso de janelas pequenas e moderadas, como no estudo de atributos na vizinhança de pixels para classificação e filtragem. Assim a proposta de métodos de Teoria Assintótica de segunda ordem ou ordem superior se torna necessária. Nesta dissertação, apresentam-se os primeiros avanços nesta direção considerando o suposto da regressão G0I . Primeiramente, várias expressões em forma fechada para cumulantes de terceira ordem para RG0I são apresentadas. Subsequentemente, propõe-se uma expressão em forma fechada para viés de segunda ordem segundo a expressão de Cox-Snell. A fim de quantificar o desempenho da estimação melhorada, sua performance é quantificada comparativamente àquela das estimativas de máxima verossimilhança original. Finalmente uma aplicação a dados reais é realizada. Em todos os resultados numéricos, é possível observar a importância da proposta desta dissertação.

4
  • LUDMILA DE PINHO CAVALCANTI
  • Um Modelo Biológico com Operador de Substituição

  • Orientador : ALEX DIAS RAMOS
  • MEMBROS DA BANCA :
  • ANATOLI IAMBARTSEV
  • ALEX DIAS RAMOS
  • GETULIO JOSE AMORIM DO AMARAL
  • Data: 28/04/2023

  • Mostrar Resumo
  • Muitos organismos biológicos são constituídos por bilhões de células, e durante seu desenvolvimento algumas delas podem apresentar a reprodução celular, isto é, o processo de divisão celular, conhecido como mitose, tornando-se duas células semelhantes. Outras células sofrem morte celular. Neste trabalho, propomos e analisamos um modelo matemático, em tempo discreto, para descrever a reprodução e morte celular. Assumimos que essas células estão localizadas em Z e as células que sofreram a morte celular permanecem no sistema. O conceito utilizado para essa modelagem
    não é recente, contudo sua apresentação formal é. Em nosso modelo, a célula que
    sofreu morte celular é representada por 1 (um) e a célula ativa por 0 (zero). Cada
    célula ativa pode sofrer morte celular com probabilidade p ou sofrer reprodução celular
    com probabilidade 1 − p. Isto ocorre de forma independente para cada célula. Para o
    nosso modelo, P, fomos capazes de trazer uma formalização matemática, a qual exibe
    a existência de uma transição de fase entre os comportamentos de ergodicidade versus
    não ergodicidade. Contudo, outras características ainda merecem atenção.


  • Mostrar Abstract
  • Muitos organismos biológicos são constituídos por bilhões de células, e durante seu desenvolvimento algumas delas podem apresentar a reprodução celular, isto é, o processo de divisão celular, conhecido como mitose, tornando-se duas células semelhantes. Outras células sofrem morte celular. Neste trabalho, propomos e analisamos um modelo matemático, em tempo discreto, para descrever a reprodução e morte celular. Assumimos que essas células estão localizadas em Z e as células que sofreram a morte celular permanecem no sistema. O conceito utilizado para essa modelagem
    não é recente, contudo sua apresentação formal é. Em nosso modelo, a célula que
    sofreu morte celular é representada por 1 (um) e a célula ativa por 0 (zero). Cada
    célula ativa pode sofrer morte celular com probabilidade p ou sofrer reprodução celular
    com probabilidade 1 − p. Isto ocorre de forma independente para cada célula. Para o
    nosso modelo, P, fomos capazes de trazer uma formalização matemática, a qual exibe
    a existência de uma transição de fase entre os comportamentos de ergodicidade versus
    não ergodicidade. Contudo, outras características ainda merecem atenção.

5
  • JOAO ANTONIO MIRANDA GONDIM
  • Sapos, Árvores e Partículas Coalescentes

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • NEVENA MARIC
  • RINALDO BRUNO SCHINAZI
  • ALEX DIAS RAMOS
  • PABLO MARTIN RODRIGUEZ
  • Data: 13/07/2023

  • Mostrar Resumo
  • Esta dissertação considera alguns modelos estocásticos discretos. No primeiro modelo,
    analisamos um modelo em árvores n-árias no qual variáveis aleatórias uniformes independentes
    são associadas aos vértices. Chamamos essa variável aleatória de fitness do vértice e estamos
    interessados em determinar quando existe um caminho acessível, isto é, um caminho da raiz
    até uma folha ao longo do qual o fitness é crescente. Isso fornece uma interpretação biológica
    do problema, pois o modelo pode representar um genótipo que sofre uma mutação a cada
    geração. Por seleção natural, é esperado que surjam genótipos mais adaptados ao ambiente
    no decorrer desse processo. Em seguida, abordamos modelos sobre os inteiros. Um deles diz
    respeito a partículas coalescentes em um intervalo. Inicialmente, temos uma partícula em cada
    inteiro do intervalo [0, n] e, a cada instante (discreto) de tempo, sorteamos aleatoriamente
    uma delas (exceto a que está em 0), a qual salta para o inteiro imediatamente à esquerda,
    coalescendo com qualquer partícula que eventualmente já ocupe esta posição. O resultado
    apresentado neste texto estuda o tempo esperado para que todas as partículas coalesçam em 0.
    Finalmente, fechamos o trabalho com o modelo dos sapos, o qual considera um número infinito
    de partículas realizando passeios aleatórios independentes sobre os inteiros, e estudamos a
    condição para que o modelo seja recorrente.


  • Mostrar Abstract
  • Esta dissertação considera alguns modelos estocásticos discretos. No primeiro modelo,
    analisamos um modelo em árvores n-árias no qual variáveis aleatórias uniformes independentes
    são associadas aos vértices. Chamamos essa variável aleatória de fitness do vértice e estamos
    interessados em determinar quando existe um caminho acessível, isto é, um caminho da raiz
    até uma folha ao longo do qual o fitness é crescente. Isso fornece uma interpretação biológica
    do problema, pois o modelo pode representar um genótipo que sofre uma mutação a cada
    geração. Por seleção natural, é esperado que surjam genótipos mais adaptados ao ambiente
    no decorrer desse processo. Em seguida, abordamos modelos sobre os inteiros. Um deles diz
    respeito a partículas coalescentes em um intervalo. Inicialmente, temos uma partícula em cada
    inteiro do intervalo [0, n] e, a cada instante (discreto) de tempo, sorteamos aleatoriamente
    uma delas (exceto a que está em 0), a qual salta para o inteiro imediatamente à esquerda,
    coalescendo com qualquer partícula que eventualmente já ocupe esta posição. O resultado
    apresentado neste texto estuda o tempo esperado para que todas as partículas coalesçam em 0.
    Finalmente, fechamos o trabalho com o modelo dos sapos, o qual considera um número infinito
    de partículas realizando passeios aleatórios independentes sobre os inteiros, e estudamos a
    condição para que o modelo seja recorrente.

6
  • JHON FRANKLIN PUERRES TIPAS
  • MODELOS DE RUMORES EM ÁRVORES

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • PABLO MARTIN RODRIGUEZ
  • VALDIVINO VARGAS JÚNIOR
  • ÉLCIO LEBENSZTAYN
  • Data: 04/08/2023

  • Mostrar Resumo
  • Neste trabalho, estudamos o modelo de boato de Maki-Thompson em árvores homogêneas infinitas e uma variante desse modelo em árvores especiais. O modelo padrão é definido supondo-se que uma população representada por um grafo seja subdividida em três classes de indivíduos: ignorantes, propagadores e neutros. Um propagador transmite informações a qualquer de seus vizinhos ignorantes mais próximos à taxa de um. Na mesma proporção, um propagador se torna neutro após entrar em contato com outros propagadores ou neutros. Neste trabalho, estudamos uma variante de este modelo, atribuindo uma probabilidade p em (0, 1) a um propagador para transmitir ou boato, isso nos permitiu estender o modelo para árvores especiais. Definimos um parâmetro crítico p_c do modelo como o valor crítico em torno do qual o boato se extingue ou sobrevive com probabilidade positiva.


  • Mostrar Abstract
  • Neste trabalho, estudamos o modelo de boato de Maki-Thompson em árvores homogêneas infinitas e uma variante desse modelo em árvores especiais. O modelo padrão é definido supondo-se que uma população representada por um grafo seja subdividida em três classes de indivíduos: ignorantes, propagadores e neutros. Um propagador transmite informações a qualquer de seus vizinhos ignorantes mais próximos à taxa de um. Na mesma proporção, um propagador se torna neutro após entrar em contato com outros propagadores ou neutros. Neste trabalho, estudamos uma variante de este modelo, atribuindo uma probabilidade p em (0, 1) a um propagador para transmitir ou boato, isso nos permitiu estender o modelo para árvores especiais. Definimos um parâmetro crítico p_c do modelo como o valor crítico em torno do qual o boato se extingue ou sobrevive com probabilidade positiva.

Teses
1
  • CESAR LEONARDO BARBOSA DA SILVA
  • Uma nova família baseada na transformaçao M-O

  • Orientador : MARIA DO CARMO SOARES DE LIMA
  • MEMBROS DA BANCA :
  • CÍCERO CARLOS RAMOS DE BRITO
  • FRANK SINATRA GOMES DA SILVA
  • HEMILIO FERNANDES CAMPOS COELHO
  • MARCELO BOURGUIGNON PEREIRA
  • MARIA DO CARMO SOARES DE LIMA
  • Data: 23/01/2023

  • Mostrar Resumo
  • Este trabalho, na área de Probabilidade e Estatística Matemática, tem seu núcleo baseado na Teoria de Novas Distribuições, suas propriedades e aplicações. É estabelecida uma sequência de fatos que vão, desde de um breve resumo introdutório, tratando da necessidade de novas distribuições, até à proposição de uma classe de transformações, dentre as quais, a conhecida Marshal-Olkin, cuja expressão pode ser derivada. Essa classe, então, é aplicada segundo à referida transformação, a distribuições conhecidas como, por exemplo, Exponencial, Weibull, entre outras. Algumas propriedades são estudadas segundo uma família geométrica log-logística, desenvolvida por do Carmo, bem como uma ênfase geométrica associada à classificação da função de risco, das distribuições em análise, segundo as regiões nas quais suas curvas- das funções de risco-, estão imersas, de acordo com um critério desenvolvido por Qian. Antes, porém, das aplicações propriamente ditas, algumas propriedades matemáticas relacionadas aos cálculos de momentos são apresentadas, fazendo-se referência a métodos canônicos, bem como métodos em desenvolvimento, usando técnicas não-canônicas, e uso de funções especiais de Spence. As aplicações, parte essencial do trabalho, têm caráter interdisciplinar, transitando entre dados epidemiológicos oriundos da atual crise mundial, devido ao Covid-19, passando por climatologia e refletindo as chuvas intensas que afligiram o Estado de Pernambuco, em particular, no ano de 2022. As novas distribuições são, também, aplicadas a sistemas físicos que demandam tratamento estatístico, qual seja, o problema da turbulência. Tempos de transições de regimes hidrodinâmicos para a turbulência são analisados. Esses estudos desempenham importante papel na ciência teórica e aplicações que vão desde a construção de aviões e navios, até processos biológicos envolvendo a dinâmica do sangue no coração.


  • Mostrar Abstract
  • This work, in the area of Probability and Mathematical Statistics, has its nucleus based on the Theory of New 
    Distributions, its properties and applications. A sequence of facts is established, ranging from a brief introductory
     summary, dealing with the need for new distributions, to the proposition of a class of transformations, among which, 
    the well-known Marshal-Olkin, whose expression can be derived. This class, then, is applied according to the 
    aforementioned transformation, to known distributions such as, for example, Exponential, Weibull, among others. 
    Some properties are studied according to a log-logistic geometric family, developed by do Carmo, as well as a 
    geometric emphasis associated with the classification of the risk function, of the distributions under analysis, 
    according to the regions in which their curves - of the risk functions -, are immersed, according to a criterion
     developed by Qian. Before, however, the actual applications, some mathematical properties related to moment
     calculations are presented, making reference to canonical methods, as well as methods under development,
     using non-canonical techniques, and use of special Spence functions. The applications, an essential part of the
     work, are interdisciplinary in nature, moving between epidemiological data from the current global crisis, due 
    to Covid-19, passing through climatology and reflecting the intense rains that afflicted the State of Pernambuco,
     in particular, in the year 2022 The new distributions are also applied to physical systems that demand statistical 
    treatment, that is, the problem of turbulence. Times of transitions from hydrodynamic regimes to turbulence are 
    analyzed. These studies play an important role in theoretical science and applications ranging from the construction
    of airplanes and ships, to biological processes involving the dynamics of blood in the heart.

2
  • LUCAS DAVID RIBEIRO REIS
  • Some extensions of the Chen distribution and the proposal of two new distribution families: a study focused on simulations, regression and applications.

  • Orientador : GAUSS MOUTINHO CORDEIRO
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • EDWIN MOISES MARCOS ORTEGA
  • GAUSS MOUTINHO CORDEIRO
  • MARCELO BOURGUIGNON PEREIRA
  • MARIA DO CARMO SOARES DE LIMA
  • PABLO MARTIN RODRIGUEZ
  • Data: 06/02/2023

  • Mostrar Resumo
  • Nos recentes anos, varias novas distribuições tem sido surgido na literatura. Estas novas distribuições são  obtidas adicionando parâmetros extras às distribuições de base, a partir de geradores de distribuições. Os geradores mais conhecidos são, Beta- G, Kumasrawamy-G, Marshall-Olkin-G, odd-log-logistic-G, em que G é a função de distribuição acumulada de uma distribuição arbitrária. Inúmeras novas distribuições, utilizando estes diversos geradores foram introduzidas. Neste trabalho, duas outras novas famílias de distribuições e três outras novas distribuições são propostas. As duas familias de distribuições propostas são: Stacy-G, que é introduzida a partir da distribuição Stacy (Stacy, 1962) e a gamma unitária-G, baseada na distribuição gamma-unitária (Grassia, 1977). Estas duas famílias de distribuições adiciona dois parâmetros extras às distribuições de base. Quando estes dois parâmetros são iguais a 1, a distribuição de base é obtida. A família Stacy-G possui ainda a família gamma-G como especial caso. Nas duas famílias é demostrado que as suas respectivas funções densidade pode ser escrita como uma combinação linear de densidades exp-G. Tomando ainda o log de uma variável aleatória não-negativa da distribuição de base, e reparametrizando para a família de locação, modelos de regressão para estas duas classes de distribuições são introduzidos. Com relação às três novas distribuições introduzidas, estas foram obtidas a partir da distribuição bi-parametrica Chen (Chen, 2000), que possui função taxa de falha em forma de banheira. A distribuição Chen foi inserida nos geradores gamma-G, Mcdonald-G e logistic-X, dando assim nomes às distribuições gamma-Chen, Mcdonald-Chen e logistic-Chen. Os parâmetros destas distribuições são estimados pelo método de máxima verossimilhança. Estudos de simulações e aplicações a dados reais são consideradas para mostrar a potencialidade das três novas distribuições e das duas famílias de distribuições. Na distribuição losgistic-Chen, um modelo de regressão para dados censurados, tendo reparametrização na mediana, é também introduzido.


  • Mostrar Abstract
  • In recent years, several new distributions have appeared in the literature. These new distributions are introduced by adding extra parameters to the baseline distributions, from distribution generators. The more known generators are, Beta-G (Eugene et al., 2002), Kumasrawamy-G (Cordeiro and de Castro, 2011), Marshall-Olkin-G (Marshall and Olkin, 1997), odd-log-logistic-G (Gleaton and Lynch, 2006), where G is the cumulativedistribution function of an arbitrary baseline distribution. Numerous new distributions using these various generators have been introduced. In this work, two other new families of distributions and three others new distributions are proposed. The two families of distributions proposed are: the Stacy-G, which is introduced from the Stacy distribution and the unit gamma-G, based on the unit gamma distribution. These two families ofdistributions add two extra parameters to the baseline distributions. When these two parameters are equal to 1, the baseline distribution is obtained. The Stacy-G family also has the gamma-G family as a special case. In both families it is shown that their respective density functions can be written as a linear combination of exp-G densities. Taking the log of a non-negative random variable from the baseline distribution, and reparameterizing for the location-scale family, the regression model for these two classes of distributions are introduced. With respect to the three new distributions introduced, these were obtained from the bi-parametric Chen (Chen, 2000) distribution, which has a bathtub-shaped failure rate function. The Chen distribution was inserted in the generators gamma-G, Mcdonald-G and logistic-X, thus giving names to gamma-Chen, Mcdonald-Chen and logistic-Chen distributions. The parameters of these distributions are estimated by the maximum likelihood method. Simulation studies and applications to real data are considered to show the potentiality of the three new distributions and the two families of distributions. In the losgistic-Chen distribution, a regression model for censored data, having reparameterization at the median, is also introduced.

3
  • ROMMY CAMASCA OLIVARI
  • Modelos não lineares de efeitos mistos para dados censurados com erros elípticos autorregressivos.


  • Orientador : FRANCISCO JOSE DE AZEVEDO CYSNEIROS
  • MEMBROS DA BANCA :
  • ALDO WILLIAM MEDINA GARAY
  • FRANCYELLE DE LIMA MEDINA
  • ROBERTO FERREIRA MANGHI
  • CELSO RÔMULO BARBOSA CABRAL
  • JUVENCIO SANTOS NOBRE
  • Data: 14/02/2023

  • Mostrar Resumo
  • Os modelos de efeitos mistos são ferramentas frequentemente utilizadas para o estudo de dados longitudinais. No entanto, devido à possível complexidade deste tipo de dados, torna-se atrativo o desenvolvimento de extensões destes modelos com suposições mais flexíveis com a finalidade de melhorar o ajuste dos dados. Neste contexto, propomos uma extensão mais flexível dos modelos de efeitos mistos com respostas censuradas e erros normais autorregressivos de ordem $p$. Para isso, atribuímos inicialmente a classe de distribuição elíptica às componentes aleatórias do modelo. Esta família de distribuições nos permitirá trabalhar com conjuntos de dados com caudas mais leves ou mais pesadas que a normal, possibilitando um ajuste menos sensível à presença de observações atípicas. Dessa forma, um algoritmo do tipo EM foi desenvolvido para obter as estimativas de máxima verossimilhança e os erros padrão dessas estimativas utilizando a matriz de informação empírica.  Por outro lado, nos últimos anos, há um interesse crescente em métodos estatísticos para a análise de dados longitudinais com efeitos espaciais. Nesse contexto, propomos uma segunda extensão do modelo proposto inicialmente, incluindo dependência espacial na distribuição do efeito aleatoreo. Para avaliar a qualidade do ajuste e as premissas dos modelos propostos foram utilizados os resíduos martingais e medidas de diagnóstico com base na abordagem de influência global e local. Apresentamos estudos de simulação sob diferentes cenários para avaliar as propriedades assintóticas dos estimadores e o desempenho dessa classe de modelos na presença de observações atípicas. Finalmente, foram analisados exemplos práticos com dados reais.

     


  • Mostrar Abstract
  • Mixed effects models are frequently used tools for studying longitudinal data. However, due to the possible complexity of this type of data, it is attractive to develop extensions of these models with more flexible assumptions aimed at improving the fit of the data. In this context, we propose a more flexible extension of mixed effects models with censored responses and autoregressive normal errors of order $p$. For this, we initially assign the elliptical distribution class to the random components of the model. This family of distributions will allow us to work with datasets with lighter or heavier tails than normal, allowing a less sensitive fit to the presence of atypical observations. Thus, an EM-type algorithm was developed to obtain the maximum likelihood estimates and the standard errors of these estimates using the empirical information matrix. On the other hand, in the last few years, there has been a growing interest in statistical methods for analyzing longitudinal data with spatial effects. In this context, we propose a second extension of the initially proposed model, including spatial dependence in the distribution of the random effect. To assess the goodness of fit and assumptions of the proposed models, martingale residuals and diagnostic measures were used based on the global and local influence approach. We present simulation studies under different scenarios to evaluate the asymptotic properties of the estimators and the performance of this class of models in the presence of outliers. Finally, practical examples with real data were analyzed.

4
  • ALEXSANDRA GOMES DE LIMA
  • Análise de Agrupamentos com Informação Espacial

  • Orientador : RAYDONAL OSPINA MARTINEZ
  • MEMBROS DA BANCA :
  • JOSE LUIZ DE AMORIM RATTON JUNIOR
  • MARCEL DE TOLEDO VIEIRA
  • PEDRO LUIS DO NASCIMENTO SILVA
  • RAYDONAL OSPINA MARTINEZ
  • VINICIUS QUINTAS SOUTO MAIOR
  • Data: 27/02/2023

  • Mostrar Resumo
  • Este trabalho apresenta um estudo sob a perspectiva da análise de agrupamento envolvendo informação espacial e dados criminais. Foram considerados cinco métodos de agrupamento: K-Means, PAM, VNSKMED, Ward-Like e SKATER, além disso, foi proposta uma alteração nos algoritmos Ward-Like e SKATER modificando a estrutura de pesos e o processo de partição dos grupos usando a distância Gower, nomeados de Ward-Like. New e SKATER. New, respectivamente. Os métodos foram comparados, por meio de três índices de validação: índice Calinski-Harabasz, índice Dunn e índice Davies-Bouldin. Para o estudo de caso, foram utilizados dados de 2007 a 2015 sobre a ocorrência de crimes dos bairros da cidade de Recife envolvendo as classificações das Áreas Integradas de Segurança. Os algorítmos permitiram explorar os padrões relacionados aos crimes, possibilitando mapeá-los em clusters de bairros da capital pernambucana. Os resultados mostraram que os métodos Ward-Like e SKATER produziram os melhores resultados e a modificação SKATER.New atestou maior qualidade na partição dos grupos.
     
     

  • Mostrar Abstract
  • Este trabalho apresenta um estudo sob a perspectiva da análise de agrupamento envolvendo informação espacial e dados criminais. Foram considerados cinco métodos de agrupamento: K-Means, PAM, VNSKMED, Ward-Like e SKATER, além disso, foi proposta uma alteração nos algoritmos Ward-Like e SKATER modificando a estrutura de pesos e o processo de partição dos grupos usando a distância Gower, nomeados de Ward-Like. New e SKATER. New, respectivamente. Os métodos foram comparados, por meio de três índices de validação: índice Calinski-Harabasz, índice Dunn e índice Davies-Bouldin. Para o estudo de caso, foram utilizados dados de 2007 a 2015 sobre a ocorrência de crimes dos bairros da cidade de Recife envolvendo as classificações das Áreas Integradas de Segurança. Os algorítmos permitiram explorar os padrões relacionados aos crimes, possibilitando mapeá-los em clusters de bairros da capital pernambucana. Os resultados mostraram que os métodos Ward-Like e SKATER produziram os melhores resultados e a modificação SKATER.New atestou maior qualidade na partição dos grupos.
     
     
5
  • ALISSON DOS SANTOS SILVA
  • Teoria da Informação aplicada a distribuições conjuntas induzidas do atributo SPAN (Total Scattering Power Image) em imagens PolSAR

  • Orientador : ABRAAO DAVID COSTA DO NASCIMENTO
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • ALEJANDRO CESAR FRERY ORGAMBIDE
  • ANDERSON A. DE BORBA
  • GETULIO JOSE AMORIM DO AMARAL
  • JODAVID DE ARAUJO FERREIRA
  • Data: 27/02/2023

  • Mostrar Resumo
  • O sistema de radar de abertura sintética polarimétrica (PolSAR) é uma das ferramentas de maior sucesso para resolver problemas de sensoriamento remoto. Tal como em todos os recursos imagéticos que utilizam iluminação coerente, as imagens PolSAR são contaminadas por um ruído multidimensional granular denominado como speckle, que impõe uma natureza não normal e multiplicativa aos dados resultantes. Portanto, é necessário um processamento sob medida das imagens PolSAR, por exemplo, melhores testes de hipóteses e detectores de mudança. Nesta proposta de tese, usamos a distribuição gama bivariada (MBG) da McKay para descrever uma distribuição conjunta resultante de dois componentes da imagem de poder de dispersão total (SPAN). Ainda no contexto de uma modelagem especializada, propõe-se (a partir da MBG e da abordagem de modelagem multiplicativa) uma nova distribuição bivariada — chamada 𝒢0𝐼 McKay bivariada (𝒢 0 𝐼 MB) - para descrever um par aleatório induzido do SPAN, bem como são derivadas algumas propriedades associadas a 𝒢0𝐼 MB: como esperança, covariância, função geradora de momento e função geradora de cumulantes. O objeto de investigação aplicada desta proposta de tese é construir novos detectores de mudança com base nas distribuições induzidas pelo SPAN, a saber MBG e 𝒢 0 𝐼 MB. Para este fim, derivaram se expressões de forma fechada para as divergências de Kullback-Leibler e Rényi para as distribuições MBG e 𝒢 0 𝐼 MB. Como consequência, novos testes de hipótese para duas amostras em divergência são introduzidos, sendo seus desempenhos analisados via experimentos de Monte Carlo. Finalmente, aplicamos os novos testes às imagens reais da PolSAR para avaliar as mudanças causadas pelos processos de urbanização em Los Angeles e regiões da Califórnia. Os resultados mostraram que nossas propostas conseguem detectar mudanças nas imagens PolSAR, sendo determinadas técnicas recomendadas para específicas naturezas dos dados. 


  • Mostrar Abstract
  • O sistema de radar de abertura sintética polarimétrica (PolSAR) é uma das ferramentas de maior sucesso para resolver problemas de sensoriamento remoto. Tal como em todos os recursos imagéticos que utilizam iluminação coerente, as imagens PolSAR são contaminadas por um ruído multidimensional granular denominado como speckle, que analisa a natureza não normal e multiplicativa aos dados resultantes. Portanto, é necessário um processamento sob medida das imagens PolSAR, por exemplo, melhores testes de hipóteses e detectores de mudança. Nesta proposta de tese, usamos a distribuição gama bivariada (MBG) da McKay para descrever uma distribuição conjunta resultante de dois componentes da imagem de poder de dispersão total (SPAN). Ainda no contexto de uma modelagem especializada, propõe-se (a partir da MBG e da abordagem de modelagem multiplicativa) uma nova distribuição bivariada — chamada GI0 McKay bivariada (GI0 MB) - para descrever um par aleatório induzido do SPAN, bem como são derivadas algumas propriedades associadas a GI0 MB: como esperança, covariância, função geradora de momento e função geradora de cumulantes. O objeto de investigação aplicada desta proposta de tese é construir novos detectores de mudança com base das distribuições induzidas pelo SPAN, a saber MBG e GI0 MB. Para este fim, derivaram- se expressões de forma fechada para as divergências de Kullback-Leibler e Rényi para a as distribuições MBG e GI0 MB. Como consequência, novos testes de hipótese para duas amostras em divergência são introduzidos, sendo seus desempenhos analisados via experimentos de Monte Carlo. Finalmente, aplicamos os novos testes às imagens reais da PolSAR para avaliar as mudanças causadas pelos processos de urbanização em Los Angeles e regiões da Califórnia. Os resultados mostraram que nossas propostas conseguem detectar mudanças nas imagens PolSAR, sendo determinadas técnicas recomendadas para especificas naturezas dos dados.

6
  • CODJO OLIVIER SOSSA
  • Teoria Assintótica de Alta Ordem nos Modelos Não Lineares Simétricos Heteroscedásticos

  • Orientador : AUDREY HELEN MARIZ DE AQUINO CYSNEIROS
  • MEMBROS DA BANCA :
  • ALDO WILLIAM MEDINA GARAY
  • AUDREY HELEN MARIZ DE AQUINO CYSNEIROS
  • FRANCISCO JOSE DE AZEVEDO CYSNEIROS
  • MARIANA CORREIA DE ARAÚJO
  • MIGUEL ANGEL URIBE OPAZO
  • Data: 28/02/2023

  • Mostrar Resumo
  • Cysneiros et al. (2010) propuseram a classe dos modelos não lineares
    simétricos heteroscedásticos (MNLSH). No nosso trabalho, estendemos a classe dos MNLSH permitindo que as funções de ligação da média e da dispersão possam ser funções não lineares que dependem de um conjunto de
    parâmetros desconhecidos a serem estimados, tendo a heteroscedasticidade
    multiplicativa como um caso particular. Três linhas de pesquisa são
    abordadas neste trabalho. A primeira, trata da derivação de expressões analíticas que permitam calcular os vieses dos estimadores de máxima verossimilhança na classe dos MNLSH, possibilitando a obtenção de estimadores corrigidos, que, em princípio, são mais precisos que os não corrigidos. Estimadores com vieses corrigidos por bootstrap também foram considerados. Adicionalmente, apresentamos diferentes tipos de intervalos de confiança. A segunda linha de pesquisa, aborda a derivação de ajustes
    às estatísticas de testes da razão de verossimilhanças e escore, com o objetivo
    de melhorar a qualidade das inferências acerca dos parâmetros de regressão da média e da dispersão nos MNLSH. Os desempenhos dos estimadores e testes de hipóteses foram avaliados numericamente e comparados às suas versões não corrigidas através de estudos de simulação de Monte Carlo, no que tange ao tamanho e ao poder, em amostras finitas. A terceira linha de pesquisa trata de técnicas de diagnóstico para os MNLSH, a saber: alavancagem generalizada, influência local e global. Finalmente, um conjunto de dados é utilizado para avaliar os nossos resultados teóricos. 


  • Mostrar Abstract
  • Cysneiros et al. (2010) propuseram a classe dos modelos não lineares simétricos heteroscedásticos (MNLSH). Esta classe de modelos inclui todas as distribuições contínuas simétricas e tem uma ampla variedade de aplicações práticas em vários campos, a saber: engenharia, biologia, medicina, economia, entre outros. No nosso trabalho, consideramos uma estrutura não linear qualquer para a dispersão, tendo a heteroscedasticidade multiplicativa como um caso particular, estendendo portanto, os artigos de Cysneiros et al (2010) e Araújo et al. (2022). Duas linhas de pesquisa são abordadas neste trabalho. A primeira, trata da derivação de expressões analíticas que permitam calcular os vieses dos estimadores de máxima verossimilhança na classe dos MNLSH, possibilitando a obtenção de estimadores corrigidos, que, em princípio, são mais precisos que os não corrigidos. Estimadores com vieses corrigidos por bootstrap são também considerados. Adicionalmente, apresentamos diferentes tipos de intervalos de confiança. A segunda linha de pesquisa, aborda a derivação de ajustes para as estatísticas de testes (razão de verossimilhanças,escore e gradiente), com o objetivo de melhorar a qualidade das inferências acerca dos parâmetros de regressão da média e da dispersão nos MNLSH. Os desempenhos dos estimadores e testes de hipóteses serão avaliados numericamente e comparados às suas contrapartidas usuais através de estudos de simulação de Monte Carlo, no que tange ao tamanho e ao poder, em amostras finitas. Adicionalmente, a utilidade dos refinamentos desenvolvidos será ilustrada através de aplicações a conjunto de dados reais.

7
  • LUAN PORTELLA DA SILVA
  • Algoritmos recursivos com aproximações de baixa complexidade para estimação

    espectral e autocorrelação.

  • Orientador : RENATO JOSE DE SOBRAL CINTRA
  • MEMBROS DA BANCA :
  • BRUNA GREGORY PALM
  • FÁBIO MARIANO BAYER
  • RENATO JOSE DE SOBRAL CINTRA
  • RICARDO MENEZES CAMPELLO DE SOUZA
  • THIAGO LOPES TRUGILLO DA SILVEIRA
  • VITOR DE ANDRADE COUTINHO
  • Data: 27/03/2023

  • Mostrar Resumo
  • A importância da transformada discreta de Fourier (DFT) decorre da sua rica
    interpretação física e de seus princípios matemáticos. Em processamento de sinais, a
    DFT desempenha um papel fundamental em estimação espectral, filtragem, econvoluções rápidas de sinais. Para reduzir o custo computacional da DFT, uma série
    de algoritmos, denominados transformadas rápidas de Fourier (FFT) têm sidodesenvolvidos. Capazes de reduzir a complexidade multiplicativa, os algoritmos rápidospermitiram que o uso da DFT fosse difundido. No entanto, mesmo com a reduçãoda
    complexidade aritmética oriunda das FFTs, o cômputo da DFT pode ser um obstáculoem aplicações que apresentam condições restritivas, como consumo de energia, áreade
    ocupação no chip e tempo. Se pequenos desvios de acurácia forempermitidos em tais
    condições, o cálculo da DFT pode ser realizado de forma aproximada. O presentetrabalho aborda quatro diferentes tópicos relacionados com a estimação da DFT.
    Primeiramente, baseado em iterações do algoritmo radix-N de Cooley-Tukey, são
    propostas transformadas aproximadas para sinais de comprimento N^2^n. Segundo, uma versão aproximada do algoritmo de Good-Thomas capaz de realizar todo o cálculoda DFT sem necessidade de multiplicações é apresentada. Terceiro, aproximaçõespara
    as matrizes de transformação e fatores de rotação são apresentadas utilizando o dígito
    de sinal canônico (CSD) com o intuito de também propor um algoritmo de Cooley-Tukey livre de multiplicações. Por último, um estimador de baixa complexidade éproposto para o cálculo da autocorrelação baseado nas propriedades da DFT. Todasas
    propostas contêm (i) construção de algoritmos rápidos, (ii) avaliação da complexidade
    aritmética e (iii) análise de erro.


  • Mostrar Abstract
  • A importância da transformada discreta de Fourier (DFT) decorre da sua rica interpretação física e de seus princípios matemáticos. Em processamento de sinais, a DFT desempenha um papel fundamental em análise espectral, filtragem e convoluções rápidas de sinais. Na intenção de reduzir o custo computacional da DFT, uma série de algoritmos, denominados algoritmos rápidos de Fourier (FFT), foram desenvolvidos. Capazes de reduzir a complexidade multiplicativa de ON2para ONlog2N, os algoritmos rápidos permitiram que o uso da DFT fosse difundido. No entanto, o cômputo exato da DFT pode ser um obstáculo em aplicações que apresentam condições restritivas, como consumo de energia, área de ocupação no chip, tempo, entre outras. Se, em tais condições, pequenos desvios de acurácias forem permitidos, o cálculo da DFT pode ser realizado de forma aproximada. O presente trabalho aborda três tópicos da DFT. Primeiramente, uma versão aproximada do algoritmo de Good-Thomas  capaz de realizar todo o cálculo da DFT sem necessidade de multiplicações é apresentada. Segundo, baseado em iterações do algoritmo Radix-N de Cooley-Tukey são propostas transformadas aproximadas para sinais de comprimento N2n. E por último, baseado nas propriedades da DFT, um estimador de baixa complexidade é proposto para o cálculo da autocorrelação. Todas as propostas contêm: (i) construção de algoritmos rápidos, (ii) avaliação da complexidade aritmética, e (iii) análise de erro. Embora preliminares, os resultados das propostas mencionadas são promissores e possuem contribuições relevantes para a área de processamento de sinais.

8
  • ANABETH PETRY RADÜNZ
  • Aproximações de baixa complexidade para transformadas discretas: projeto, algoritmos rápidos, codificação de imagens e inferência estatística.

  • Orientador : RENATO JOSE DE SOBRAL CINTRA
  • MEMBROS DA BANCA :
  • THIAGO LOPES TRUGILLO DA SILVEIRA
  • ANDRE LEITE WANDERLEY
  • DIEGO FELIPE GOMES COELHO
  • FÁBIO MARIANO BAYER
  • RENATO JOSE DE SOBRAL CINTRA
  • RICARDO MENEZES CAMPELLO DE SOUZA
  • Data: 31/03/2023

  • Mostrar Resumo
  • Transformadas discretas desempenham um papel importante no contexto de processamento de sinais. Elas são ferramentas pivotais pois permitem analisar e interpretar dados no domínio das transformadas, que frequentemente revelam padrões úteis. Em particular, podemos citar a transformada discreta de Fourier (DFT), a transformada de Karhunen-Loève (KLT) e a transformada discreta do cosseno (DCT) como as transformadas mais relevantes no contexto de processamento de sinais e imagens. Embora a relevância do uso dessas transformadas tenha sido amplamente corroborado em diversos estudos, os custos computacionais necessários para suas implementações podem se tornar proibitivos em contextos em que temos grande quantidade de dados e/ou a demanda por dispositivos de baixa complexidade. Nesse sentido, algoritmos rápidos podem ser uma solução para a redução das operações aritméticas necessárias para a computação das transformadas, porém, ainda é preciso lidar com a aritmética do ponto flutuante. Dessa forma, diversas aproximações matriciais de baixa complexidade vêm sendo propostas, como sendo uma alternativa de baixo custo para o computo destas transformadas. A presente tese está dividida em duas partes. Na primeira parte, propomos diversas classes de aproximações de baixa complexidade para a KLT, algoritmos rápidos, e demonstramos sua usabilidade no contexto de processamento de imagens. Na segunda parte da tese, abordamos a DFT, apresentamos classes de aproximação para esta transformada e sua aplicabilidade em problemas de inferência estatística, como no contexto de detecção de sinais e na estimação de parâmetros de baixa complexidade. Particularmente, abordamos a estimação do bispectro, que pode ser calculado como a DFT da sequência de cumulantes de terceira ordem. Dos resultados obtidos, podemos concluir que as aproximações de baixa complexidade para as transformadas podem ser consideradas excelentes alternativas em contextos em que há uma quantidade massiva de dados a ser processada ou no caso de implementação em hardware de baixo consumo.


  • Mostrar Abstract
  • Transformadas discretas desempenham um papel importante no contexto de processamento de sinais. Elas são ferramentas pivotais pois permitem analisar e interpretar dados no domínio das transformadas, que frequentemente revelam padrões úteis. Em particular, podemos citar a transformada discreta de Fourier (DFT), a transformada de Karhunen-Loève (KLT) e a transformada discreta do cosseno (DCT) como as transformadas mais relevantes no contexto de processamento de sinais e imagens. Embora a relevância do uso dessas transformadas tenha sido amplamente corroborado em diversos estudos, os custos computacionais necessários para suas implementações podem se tornar proibitivos em contextos em que temos grande quantidade de dados e/ou a demanda por dispositivos de baixa complexidade. Nesse sentido, algoritmos rápidos podem ser uma solução para a redução das operações aritméticas necessárias para a computação das transformadas, porém, ainda é preciso lidar com a aritmética do ponto flutuante. Dessa forma, diversas aproximações matriciais de baixa complexidade vêm sendo propostas, como sendo uma alternativa de baixo custo para o cômputo destas transformadas. A presente tese está dividida em duas partes. Na primeira parte, abordamos a transformada de Karhunen-Loève, propomos diversas classes de aproximações de baixa complexidade para esta transformada, algoritmos rápidos, e demonstramos sua usabilidade no contexto de processamento de imagens. Na segunda parte da tese, abordamos a transformada discreta de Fourier (DFT), apresentamos classes de aproximação para esta transformada e sua aplicabilidade em problemas de inferência estatística, como no contexto de detecção de sinais e na estimação de parâmetros de baixa complexidade. Particularmente, abordamos a estimação do bispectro, que pode ser calculado como a DFT da sequência de cumulantes de terceira ordem. Dos resultados obtidos, podemos concluir que as aproximações de baixa complexidade para as transformadas podem ser consideradas excelentes alternativas em contextos em que há uma quantidade massiva de dados a ser processada ou no caso de implementação em hardware de baixo consumo.

9
  • ALECIO SOARES SILVA
  • Um estudo sobre alguns conceitos de estabilidade com horizonte variável no Modelo de Grafos para Resolução de Conflitos

  • Orientador : LEANDRO CHAVES REGO
  • MEMBROS DA BANCA :
  • ALEXANDRE BEVILACQUA LEONETI
  • GIANNINI ITALINO ALVES VIEIRA
  • LEANDRO CHAVES REGO
  • MAISA MENDONCA SILVA
  • RAYDONAL OSPINA MARTINEZ
  • ROBERTO FERREIRA MANGHI
  • Data: 07/06/2023

  • Mostrar Resumo
  • Nesta tese abordamos conceitos de estabilidade de horizonte variável, os quais, apesar de serem mais flexíveis, ainda não são muito explorados na literatura sobre o Modelo de Grafos para Resolução de Conflitos (GMCR). Nosso objetivo é aumentar o entendimento sobre tais conceitos proporcionando alguns avanços e correções na literatura. Assim, dentre os avanços apresentados, temos um teorema que estabelece a equivalência entre os conceitos das estabilidades Maximinℎ e Metarracionalidade generalizada 𝑀 𝑅ℎ, para conflitos bilaterais, a qual foi justificada pela construção de uma política Maximin, baseada na construção de uma árvore Maximin. O segundo avanço foram resultados que estabelecem a relação entre as estabilidades Maximinℎ e Metarracionalidade Generalizada Alternativa,
    para conflitos multilaterais, que diferente do caso de conflitos com dois decisores, não são equivalentes. O terceiro avanço foi propor uma generalização alternativa para o conceito da estabilidade Movimento
    Limitado, na qual consideramos os oponentes do decisor focal como uma coalizão, que busca atingir estados finais do conflito que não são Pareto dominados por algum outro possível estado final. Além disso, estudamos as relações deste conceito com os conceitos clássicos de estabilidade do GMCR. No que se refere às correções sugeridas, a primeira delas foi o fato de o estado antecipado de acordo com a estabilidade 𝐿ℎ não ser único, gerando uma ambiguidade, para a qual, também, sugerimos uma desambiguação. A segunda, foi apontar que o corolário apresentado na literatura sobre o GMCR, sobre equilíbrio em políticas e Metarracionalidade Generalizada está incorreto, o que mostramos por meio de um exemplo. A terceira correção proposta, refere-se à justificativa para o fato de a estabilidade Movimento Limitado implicar a estabilidade Metarracional Generalizada, para o caso de conflitos bilaterais. Apesar desta implicação ser verdadeira, a justificativa não considera que em um conflito, um estado 𝑠 pode ser 𝐿ℎ estável para o decisor focal, mas seu oponente pode, ao buscar maximizar seu payoff, acessar estados diferentes a partir de um mesmo estado, quando este aparecer mais uma vez na árvore que representa seus possíveis movimentos. Daí, apresentamos uma justificativa correta
    para a implicação. Por fim, a quarta correção sugerida foi o fato de o estado antecipado de acordo com a estabilidade Maximinℎ não ser único, o que assim como no caso anterior da estabilidade 𝐿ℎ, também gera uma ambiguidade, e mais uma vez, sugerimos uma desambiguação.


  • Mostrar Abstract
  • Nesta tese abordamos conceitos de estabilidade de horizonte variável,
    os quais, apesar de serem mais flexíveis, ainda não são muito
    explorados na literatura sobre o Modelo de Grafos
    para Resolução de Conflitos (GMCR). Nosso objetivo é aumentar o
    entendimento sobre tais conceitos proporcionando alguns avanços e
    correções na literatura. Assim, dentre os avanços apresentados, temos
    um teorema que estabelece a equivalência entre os conceitos das
    estabilidades Maximinℎ e Metarracionalidade generalizada 𝑀 𝑅ℎ, para
    conflitos bilaterais, a qual foi justificada pela construção de uma
    política Maximin, baseada na construção de uma árvore Maximin. O
    segundo avanço foram resultados que estabelecem a relação entre as
    estabilidades Maximinℎ e Metarracionalidade Generalizada Alternativa,
    para conflitos multilaterais, que diferente do caso de conflitos com
    dois decisores, não são equivalentes. O terceiro avanço foi propor uma
    generalização alternativa para o conceito da estabilidade Movimento
    Limitado, na qual consideramos os oponentes do decisor focal como uma
    coalizão, que busca atingir estados finais do conflito que não são
    Pareto dominados por algum outro possível estado final. Além disso,
    estudamos as relações deste conceito com os conceitos clássicos de
    estabilidade do GMCR. No que se refere às correções sugeridas, a
    primeira delas foi o fato de o estado antecipado de acordo com a
    estabilidade 𝐿ℎ não ser único, gerando uma ambiguidade, para a qual,
    também, sugerimos uma desambiguação. A segunda, foi apontar que o
    corolário apresentado na literatura sobre o GMCR, sobre equilíbrio em
    políticas e Metarracionalidade Generalizada está incorreto, o que
    mostramos por meio de um exemplo. A terceira correção proposta,
    refere-se à justificativa para o fato de a estabilidade Movimento
    Limitado implicar a estabilidade Metarracional Generalizada, para o
    caso de conflitos bilaterais. Apesar desta implicação ser verdadeira,
    a justificativa não considera que em um conflito, um estado 𝑠 pode
    ser 𝐿ℎ estável para o decisor focal, mas seu oponente pode, ao buscar
    maximizar seu payoff, acessar estados diferentes a partir de um mesmo
    estado, quando este aparecer mais uma vez na árvore que representa
    seus possíveis movimentos. Daí, apresentamos uma justificativa correta
    para a implicação. Por fim, a quarta correção sugerida foi o fato de o
    estado antecipado de acordo com a estabilidade Maximinℎ não ser único,
    o que assim como no caso anterior da estabilidade 𝐿ℎ, também gera uma
    ambiguidade, e mais uma vez, sugerimos uma desambiguação.

10
  • JOSÉ JAIRO DE SANTANA E SILVA
  • Essays on Misspecification Detection in Double Bounded Random Variables Modeling 
  • Orientador : FRANCISCO CRIBARI NETO
  • MEMBROS DA BANCA :
  • ALDO WILLIAM MEDINA GARAY
  • FRANCISCO CRIBARI NETO
  • GETULIO JOSE AMORIM DO AMARAL
  • GILBERTO ALVARENGA PAULA
  • SILVIA LOPES DE PAULA FERRARI
  • Data: 27/07/2023

  • Mostrar Resumo
  • The beta distribution is routinely used to model variables that assume values in the standard unit interval. Several alternative laws have, nonetheless, been proposed in the literature, such as the Kumaraswamy and simplex distributions. A natural and empirically motivated question is: does the beta law provide an adequate representation for a given dataset? We test the null hypothesis that the beta model is correctly specified against the alternative hypothesis that it does not provide an adequate data fit. Our tests are based on the information matrix equality, which only holds when the model is correctly specified. They are thus sensitive to model misspecification. Simulation evidence shows that the tests perform well, especially when coupled with bootstrap resampling. We model state and county Covid-19 mortality rates in the United States. The misspecification tests indicate that the beta law successfully represents Covid-19 death rates when they are computed using either data from prior to the start of the vaccination campaign or data collected when such a campaign was under way. In the latter case, the beta law is only accepted when the negative impact of vaccination reach on death rates is moderate. The beta model is rejected under data heterogeneity, i.e., when mortality rates are computed using information gathered during both time periods.

    The beta regression model is tailored for responses that assume values in the standard unit interval. In its more general formulation, it comprises two submodels, one for the mean response and another for the precision parameter. We develop tests of correct specification for such a model. The tests are based on the information matrix equality, which fails to hold when the model is incorrectly specified. We establish the validity of the tests in the class of varying precision beta regressions, provide closed-form expressions for the quantities used in the test statistics, and present simulation evidence on the tests' null and non-null behavior. We show it is possible to achieve very good control of the type I error probability when data resampling is employed and that the tests are able to reliably detect incorrect model specification, especially when the sample size is not small. Two empirical applications are presented and discussed.

    Diagnostic analysis in regression modeling is usually carried out based on residual or local influence analysis. We develop a new approach for detecting atypical data points in models for which parameter estimation is performed by maximum likelihood. The new approach uses the information matrix equality which holds when the model is correctly specified. We consider different measures of the distance between two symmetric matrices and use them with sample counterparts of the matrices in the information matrix equality in such a way that zero distance corresponds to correct model specification. The distance measures we use thus quantify the degree of model adequacy. We show that they can be used to identify observations that disproportionately contribute to altering the degree of model adequacy. We also introduce a modified generalized Cook distance and a new criterion that uses the two generalized Cook's distances (modified and unmodified). Empirical applications are presented and discussed.


  • Mostrar Abstract
  • A distribuição beta é usada rotineiramente para modelar variáveis que assumem valores no intervalo unitário padrão. Várias leis alternativas foram, contudo, propostas na literatura, tais como as distribuições Kumaraswamy e simplex. Uma questão natural e empiricamente motivada é: a lei beta fornece uma representação adequada para os dados sob análise? Nós testamos a hipótese nula de que o modelo beta está corretamente especificado contra a hipótese alternativa de que ele não fornece um ajuste adequado aos dados. Nossos testes são baseados na igualdade da matriz de informação, que somente é válida quando o modelo se encontra corretamente especificado. Os testes são, portanto, sensíveis a qualquer forma de especificação incorreta do modelo. Resultados de simulação mostram que os testes têm bom desempenho, especialmente quando utilizados com reamostragem bootstrap. Nós modelamos as taxas de mortalidade estaduais e municipais de Covid-19 nos Estados Unidos. Nossos testes de má especificação indicam que a lei beta representa adequadamente as taxas de mortalidade do Covid-19 quando estas são computadas com base em dados anteriores ao início da campanha de vacinação de Covid-19 ou com base em dados coletados quando tal campanha já se encontrava em andamento. No último caso, a lei beta só é aceita quando o impacto da vacinação sobre as taxas de mortalidade é moderado. O modelo beta é rejeitado sob heterogeneidade de dados, ou seja, quando as taxas de mortalidade são computadas usando informações coletadas durante ambos os períodos de tempo. Os testes de má especificação são estendidos para cobrir o modelo beta de regressão de precisão variável. Apresentamos expressões em forma fechada para tais estatísticas de teste na classe de modelos de regressão em que a variável de resposta segue distribuição beta com estruturas de regressão separadas para sua média e precisão. São apresentados resultados de simulação de Monte Carlo sobre o comportamento dos testes, tanto sob a hipótese nula como sob a hipótese alternativa. 
11
  • ELISÂNGELA CANDEIAS BIAZATTI
  • Algumas novas distribuições e novas famílias de distribuições: teoria e aplicações

  • Orientador : GAUSS MOUTINHO CORDEIRO
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • EDWIN MOISES MARCOS ORTEGA
  • GAUSS MOUTINHO CORDEIRO
  • MARCELO BOURGUIGNON PEREIRA
  • MARIA DO CARMO SOARES DE LIMA
  • Data: 07/11/2023

  • Mostrar Resumo
  • Várias classes de distribuições foram introduzidas nas últimas duas décadas para estender distribuições bem conhecidas e fornecer maior flexibilidade na modelagem de dados reais. Neste trabalho, serão apresentadas três novas famílias de distribuições: Dual Dagum-G, Exponentiated-Weibull-G e Weibull Flexible-G; e duas novas distribuições de probabilidade: Weibull Beta Prime e Weibull extended Weibull. Algumas propriedades das novas distribuições são apresentadas e o método de máxima verossimilhança foi utilizado para estimar os parâmetros das distribuições propostas. Novos modelos de regressão também são propostos com base nas novas famílias e distribuições.


  • Mostrar Abstract
  • Several classes of distributions have been introduced over the past two decades to extend well-known distributions and provide greater flexibility in modeling real data. In this work, three new families of distributions will be presented: Dual Dagum-G, Exponentiated-Weibull-G and Weibull Flexible-G; and two new distributions of probability: Weibull Beta Prime and Weibull
    extended Weibull. Some properties of the new distributions are presented and the maximum likelihood method was used to estimate the parameters of the proposed distributions. New regression models are also proposed based on new families and distributions.

12
  • JEAN CARLOS CARDOSO
  • PERCOLAÇÃO ACESSÍVEL EM ÁRVORES

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • PABLO ALMEIDA GOMES
  • NEVENA MARIC
  • PABLO MARTIN RODRIGUEZ
  • VALDIVINO VARGAS JÚNIOR
  • ÉLCIO LEBENSZTAYN
  • Data: 17/11/2023

  • Mostrar Resumo
  • Embora a percolação acessível seja um conceito recente, muitos trabalhos foram desenvolvidos na ultima década abordando esse tema tão em voga. A possibilidade de modelar problemas reais usando a teoria de percolação sem dúvida é o que faz essa área ser tão interessante e aclamada. O objetivo principal do nosso trabalho é encontrar condições para percolação acessível em árvores esfericamente simétricas. Sendo assim, neste trabalho introduzimos uma nova forma de caracterizar árvores esfericamente simétrica, denotada por2-power. Este novo conceito é baseado na velocidade do crescimento da árvore. Para provar a percolação acessível dessas novas árvores foi necessário a criação do que chamamos de percolaçãoδ-acessível. Esta por sua vez é uma forma mais restrita da já conhecida percolação acessível.Vários resultados foram derivados da criação desses conceitos e
    exemplos selecionados foram utilizados para a compreensão dos principais resultados.
    Finalizamos nosso trabalho explicitamos também condições para a extinção de árvores
    esfericamente simétricas


  • Mostrar Abstract
  • Embora a percolação acessível seja um conceito recente, muitos trabalhos foram desenvolvidos na ultima década abordando esse tema tão em voga. A possibilidade de modelar problemas reais usando a teoria de percolação sem dúvida é o que faz essa área ser tão interessante e aclamada. O objetivo principal do nosso trabalho é encontrar condições para percolação acessível em árvores esfericamente simétricas. Sendo assim, neste trabalho introduzimos uma nova forma de caracterizar árvores esfericamente simétrica, denotada por2-power. Este novo conceito é baseado na velocidade do crescimento da árvore. Para provar a percolação acessível dessas novas árvores foi necessário a criação do que chamamos de percolaçãoδ-acessível. Esta por sua vez é uma forma mais restrita da já conhecida percolação acessível.Vários resultados foram derivados da criação desses conceitos e
    exemplos selecionados foram utilizados para a compreensão dos principais resultados.
    Finalizamos nosso trabalho explicitamos também condições para a extinção de árvores
    esfericamente simétricas

2022
Dissertações
1
  • JAIME PHASQUINEL LOPES CAVALCANTE
  • VARIABILIDADE E ADERÊNCIA EM MODELOS DE APRENDIZADO DE MÁQUINA COM DISTRIBUIÇÃO BETA

  • Orientador : PATRICIA LEONE ESPINHEIRA OSPINA
  • MEMBROS DA BANCA :
  • RAFAEL IZBICKI
  • FRANCISCO CRIBARI NETO
  • PATRICIA LEONE ESPINHEIRA OSPINA
  • RAYDONAL OSPINA MARTINEZ
  • Data: 07/02/2022

  • Mostrar Resumo
  • Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido
    objeto de estudo de diversos autores devido a sua relevância para a modelagem
    de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1).
    No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al.
    (2008) apresentaram a definição de resíduos baseados no processo iterativo
    Scoring de Fisher, sendo esta amplamente utilizada para a generalização e
    proposição de novos resíduos para as extensões dos modelos de regressão
    beta. Com o foco na distribuição de probabilidade e observando que a mesma
    forma uma família exponencial bidimensional, utilizamos o Teorema da Função
    Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para
    propor uma nova classe de resíduos e critérios do tipo baseados nas estatísticas
    suficientes e completas com a finalidade de avaliar a variabilidade e aderência,
    além de realizar diagnósticos em modelos de aprendizado de máquina (machine
    learning) com distribuição beta. Além disso, para o modelo de regressão beta,
    propomos um novo resíduo baseado no processo iterativo Scoring de Fisher.
    Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de
    predição , introduzido por Espinheira et al. (2019) para a classe de modelos de
    regressão beta lineares e não-lineares. O desempenho das propostas é avaliado
    por meio de três aplicações, associadas a um conjunto de dados reais, relativas
    ao estudo do risco a doenças cardiovasculares.


  • Mostrar Abstract
  • Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido
    objeto de estudo de diversos autores devido a sua relevância para a modelagem
    de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1).
    No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al.
    (2008) apresentaram a definição de resíduos baseados no processo iterativo
    Scoring de Fisher, sendo esta amplamente utilizada para a generalização e
    proposição de novos resíduos para as extensões dos modelos de regressão
    beta. Com o foco na distribuição de probabilidade e observando que a mesma
    forma uma família exponencial bidimensional, utilizamos o Teorema da Função
    Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para
    propor uma nova classe de resíduos e critérios do tipo baseados nas estatísticas
    suficientes e completas com a finalidade de avaliar a variabilidade e aderência,
    além de realizar diagnósticos em modelos de aprendizado de máquina (machine
    learning) com distribuição beta. Além disso, para o modelo de regressão beta,
    propomos um novo resíduo baseado no processo iterativo Scoring de Fisher.
    Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de
    predição , introduzido por Espinheira et al. (2019) para a classe de modelos de
    regressão beta lineares e não-lineares. O desempenho das propostas é avaliado
    por meio de três aplicações, associadas a um conjunto de dados reais, relativas
    ao estudo do risco a doenças cardiovasculares.

2
  • JACIELE DE JESUS OLIVEIRA
  • Modelos SIR e algoritmos tipo ensemble com aplicações a COVID-19

  • Orientador : RAYDONAL OSPINA MARTINEZ
  • MEMBROS DA BANCA :
  • ALEX DIAS RAMOS
  • HEMILIO FERNANDES CAMPOS COELHO
  • RAYDONAL OSPINA MARTINEZ
  • Data: 14/02/2022

  • Mostrar Resumo
  • Em janeiro de 2020 o mundo foi surpreendido com uma nova epidemia, o COVID-19, causada pelo vírus Sars-Cov-2.  O surto deste vírus teve início na China e se espalhou rapidamente pelo mundo, de forma que no dia 11 de março de  2020 a Organização Mundial de Saúde (OMS) classificou o alastramento do vírus como uma pandemia. Por se tratar  de um vírus novo, até então, não havia conhecimento sobre o seu comportamento, tornando crucial o uso de ferramentas estatísticas e matemáticas que permitissem descrever o curso da epidemia. Neste trabalho abordaremos algumas dessas  ferramentas, que podem ser utilizadas para descrever a propagação de doenças infecciosas. Ajustamos o modelo  compartimentado SIR aos dados de COVID-19 do estado da Paraíba para estimar as taxas de infecção e recuperação da  doença e comparamos com resultados de prevalência estimados por uma pesquisa amostral sorológica probabilística  realizada no estado. Os resultados obtidos pelo modelo SIR indicam subestimação com base em dados com possível  subnotificação. Numa tentativa de aprimorar a análise dos dados, passamos a trabalhar com as curvas acumuladas de  óbitos, uma vez que essas curvas são mais estáveis e os números de óbitos não dependem do registro de casos confirmados.  Para isso utilizamos uma abordagem via modelo combinados (ensemble). Este tipo de abordagem usa modelos dinâmicos  de crescimento integrando a predição de vários modelos através de uma combinação ponderada, o que permite diminuir  o erro de previsão. Para a construção do modelo ensemble utilizamos os modelos de crescimento logístico, de Gompertz  e de Richards. O modelo ensemble se ajustou de forma satisfatória aos dados se mostrando uma metodologia promissora  para predição dos dados da COVID-19.


  • Mostrar Abstract
  • Em janeiro de 2020 o mundo foi surpreendido com uma nova epidemia, o COVID-19, causada pelo vírus Sars-Cov-2.  O surto deste vírus teve início na China e se espalhou rapidamente pelo mundo, de forma que no dia 11 de março de  2020 a Organização Mundial de Saúde (OMS) classificou o alastramento do vírus como uma pandemia. Por se tratar  de um vírus novo, até então, não havia conhecimento sobre o seu comportamento, tornando crucial o uso de ferramentas estatísticas e matemáticas que permitissem descrever o curso da epidemia. Neste trabalho abordaremos algumas dessas  ferramentas, que podem ser utilizadas para descrever a propagação de doenças infecciosas. Ajustamos o modelo  compartimentado SIR aos dados de COVID-19 do estado da Paraíba para estimar as taxas de infecção e recuperação da  doença e comparamos com resultados de prevalência estimados por uma pesquisa amostral sorológica probabilística  realizada no estado. Os resultados obtidos pelo modelo SIR indicam subestimação com base em dados com possível  subnotificação. Numa tentativa de aprimorar a análise dos dados, passamos a trabalhar com as curvas acumuladas de  óbitos, uma vez que essas curvas são mais estáveis e os números de óbitos não dependem do registro de casos confirmados.  Para isso utilizamos uma abordagem via modelo combinados (ensemble). Este tipo de abordagem usa modelos dinâmicos  de crescimento integrando a predição de vários modelos através de uma combinação ponderada, o que permite diminuir  o erro de previsão. Para a construção do modelo ensemble utilizamos os modelos de crescimento logístico, de Gompertz  e de Richards. O modelo ensemble se ajustou de forma satisfatória aos dados se mostrando uma metodologia promissora  para predição dos dados da COVID-19.

3
  • JERFSON BRUNO DO NASCIMENTO HONÓRIO
  • Classificação Não Supervisionada no Contexto de Tamanho e Forma

  • Orientador : GETULIO JOSE AMORIM DO AMARAL
  • MEMBROS DA BANCA :
  • FERNANDA DE BASTIANI
  • GETULIO JOSE AMORIM DO AMARAL
  • LUCIA PEREIRA BARROSO
  • Data: 17/02/2022

  • Mostrar Resumo
  • A dissertação tem como objetivo propor métodos de classificação não supervisionados no contexto de tamanho e forma considerando imagens bidimensionais (formas planas). Apresentamos novos métodos de classificação baseados em testes de hipóteses e no algoritmo K-médias. Também propomos combinações de algoritmos usando métodos de ensemble: Bagging e Boosting.

    Para avaliar os métodos propostos foram analisados dados simulados e dados reais. Com os dados simulados, três cenários foram usados para avaliar o desempenho dos métodos propostos.  Os cenários correspondem a grupos de alta, média e baixa variabilidade. Os resultados numéricos indicaram que para os conjuntos de dados, quando os tamanhos dos centróides se diferenciam, o desempenho dos algoritmos melhora. Além disso, os algoritmos baseados em Boosting e Bagging superam suas versões básicas. Três conjuntos de dados do mundo real são considerados: dados de referência de crânios de grandes macacos; dados de vértebras de camundongos e imagens de ressonância magnética de pessoas com esquizofrenia. Esses conjuntos de dados têm configurações diferentes, como vários pontos de referência e variabilidade. Os métodos K-médias Bagging e K-médias Boosting tem o melhor desempenho nos conjuntos de dados. Por fim, considerando os resultados com dados sintéticos e reais, o k-médias Bagging é escolhido como o melhor método.


  • Mostrar Abstract
  • A dissertação tem como objetivo propor métodos de classificação não supervisionados no contexto de tamanho e forma considerando imagens bidimensionais (formas planas). Apresentamos novos métodos de classificação baseados em testes de hipóteses e no algoritmo K-médias. Também propomos combinações de algoritmos usando métodos de ensemble: Bagging e Boosting.

    Para avaliar os métodos propostos foram analisados dados simulados e dados reais. Com os dados simulados, três cenários foram usados para avaliar o desempenho dos métodos propostos.  Os cenários correspondem a grupos de alta, média e baixa variabilidade. Os resultados numéricos indicaram que para os conjuntos de dados, quando os tamanhos dos centróides se diferenciam, o desempenho dos algoritmos melhora. Além disso, os algoritmos baseados em Boosting e Bagging superam suas versões básicas. Três conjuntos de dados do mundo real são considerados: dados de referência de crânios de grandes macacos; dados de vértebras de camundongos e imagens de ressonância magnética de pessoas com esquizofrenia. Esses conjuntos de dados têm configurações diferentes, como vários pontos de referência e variabilidade. Os métodos K-médias Bagging e K-médias Boosting tem o melhor desempenho nos conjuntos de dados. Por fim, considerando os resultados com dados sintéticos e reais, o k-médias Bagging é escolhido como o melhor método.

4
  • RAFAEL ZIMMERLE DA NOBREGA
  • Causal Inference in Sampling From Finite Populations

  • Orientador : CRISTIANO FERRAZ
  • MEMBROS DA BANCA :
  • CRISTIANO FERRAZ
  • VINICIUS QUINTAS SOUTO MAIOR
  • MAURICIO TEIXEIRA LEITE VASCONCELLOS
  • Data: 18/02/2022

  • Mostrar Resumo
  • A inferência causal lida com a estimação do efeito de intervenções específicas sobre uma variável de resposta. A estratégia de estimação envolve a comparação de unidades expostas a níveis de fatores de intervenção, com unidades não expostas, as quais formam um grupo de controle. O grupo de controle serve como base para estimar o contrafactual da resposta no grupo de tratamento. Em estudos observacionais, uma grande preocupação na construção desses grupos é garantir a comparabilidade entre eles, a partir do controle de outras características que não o próprio tratamento, as quais podem causar interferência indesejada sobre estimativas dos efeitos causais, provocando um viés sistemático. Embora a teoria por trás de estudos observacionais tenha avançado com métodos para reduzir esse viés, os dados utilizados em diversos desses estudos são obtidos por meio de amostragem probabilística complexa raramente levados em consideração no processo de estimação.  A presente dissertação considera que, além de representar uma fonte de variabilidade que deve ser incorporada na estimação de efeitos causais, planos e técnicas de estimação de amostragem podem ter um papel central para estimar efeitos causais de forma eficiente. São realizados estudos para investigar o uso de amostras balanceadas que garantam a comparabilidade entre grupos de tratamento e controle, no que diz respeito às distribuições das covariáveis, e de estimadores para a média da variável de resposta no grupo de controle baseados em calibração, a fim de melhorar as estimativas da resposta média contrafactual do grupo de tratamento. Comparam-se esses métodos com aqueles já disponíveis na literatura, por meio de simulações de Monte Carlo.



  • Mostrar Abstract
  • Causal inference deals with estimating the effects of specific interventions on a response variable. The estimation strategy involves comparing units exposed to intervention factor’s levels, forming a treatment group, with those units not exposed, forming a control group. The control group serves as the base to estimate the counterfactual response of the treatment group. In observational studies, a major concern when building such groups is to ensure their comparability, controlling for characteristics others than the treatment itself, that may cause undesired interference on causal effects estimates, leading to systematic bias. Although the theory behind observational studies has advanced with methods to reduce such bias using conditional inference, in several of these studies data is obtained through complex probability sampling designs seldom taken into account in the estimation process.  This thesis considers that, beyond representing a source of variability that must be incorporated in the analysis, sample design and estimation techniques can have a central role to estimate causal effects efficiently. Studies are carried out to investigate the use of balanced samples to ensure comparability between treatment and control groups with respect to the distributions of covariates, and the use of calibration estimates for the control group average response, improving estimates of the average counterfactual treatment response. The methods are compared with those already available in the literature, via Monte Carlo simulation.

5
  • PAULO RICARDO PEIXOTO DE ALENCAR FILHO
  • Amostragem Inversa de Bernoulli e Aplicações

  • Orientador : CRISTIANO FERRAZ
  • MEMBROS DA BANCA :
  • CRISTIANO FERRAZ
  • FERNANDA DE BASTIANI
  • PEDRO LUIS DO NASCIMENTO SILVA
  • Data: 18/02/2022

  • Mostrar Resumo
  • A ausência de uma listagem, ou cadastro, que identifique e dê acesso aos elementos da população-alvo é uma das adversidades mais recorrentes enfrentadas em levantamentos amostrais.  Quando cadastros estão disponíveis, não raro necessitam de atualização de cobertura para serem utilizados. Quando os elementos da população estão agrupados em conglomerados, o desafio recai com frequência na ausência ou desatualização de listagens de elementos dentro de cada conglomerado.  Nesta dissertação, o plano de amostragem inversa de Bernoulli é apresentado, suas propriedades estatísticas discutidas, e o potencial de seu uso no segundo estágio de planos amostrais de dois estágios, para selecionar a amostra durante o processo de atualização do cadastro, investigado. O desempenho de planos em dois estágios combinando o uso de Amostragem de Pareto ou Amostragem Sequencial de Poisson no primeiro estágio, com Amostragem Inversa de Bernoulli ou Amostragem Sistemática no segundo estágio, é estudado através de um experimento computacional de Monte Carlo utilizando dados da Pesquisa Sorológica Continuar Cuidando, realizada no Estado da Paraíba, para monitoramento da epidemia de COVID-19.


  • Mostrar Abstract
  • The absence of a listing frame that identify and provides access to the elements of a target-population is one of the most recurrent adversities faced by sampling surveys. When sample frames are available not seldom, they need to be updated to be used in practice. When the elements of a target-population are grouped in clusters, the challenge very often rely on the non-existence or the outdating of existing listing frame of elements within clusters. In this Thesis the Inverse Bernoulli Sampling design is presented, its statistical properties discussed and its potential use in the second stage of two-stage sampling designs, to select a sample at the same time an updating screening process is carried out, is investigated. The performance of two-stage designs combining Pareto Sampling or Sequential Poisson sampling in the first stage, with Inverse Bernoulli Sampling or Systematic Sampling in the second stage, is studied by a computational Monte Carlo experiment using data from the serological Survey Sample Continuar Cuidando, carried out in the Brazilian state of Paraiba, to monitor the COVID-19 epidemics.

6
  • THOMÁS FREUD DE MORAIS GONÇALVES
  • Acerca do Processo-Bell-Touchard: proposta de um processo de contagem baseado na distribuição Bell-Touchard

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • PABLO MARTIN RODRIGUEZ
  • ÉLCIO LEBENSZTAYN
  • VALDIVINO VARGAS JÚNIOR
  • Data: 22/02/2022

  • Mostrar Resumo
  • Uma das limitações do processo Poisson é a hipótese de saltos unicamente unitários em intervalos infinitesimais. Todavia essa limitação é contornada pelo processo Poisson composto. Entretanto, em muitos casos a distribuição de probabilidade dos incrementos não tem forma conhecida no processo Poisson composto, limitando sua modelagem ao uso de funções geradoras de probabilidades ou técnicas numéricas e simulações. Neste trabalho, propomos um novo processo de contagem baseado na distribuição Bell-Touchard, denominado processo Bell-Touchard. Entre suas propriedades, verificamos que o processo é membro da família de processos Poisson compostos e Poisson múltiplos e que também é fechado para convolução e decomposição. Mostramos que o processo decorrente da composição de processos Poisson é Bell-Touchard. Apresentamos duas generalizações, o processo Bell-Touchard composto e o processo Bell-Touchard não homogêneo, mostrando que este último pode ser obtido pela composição de um processo Poisson não homogêneo em um processo Poisson homogêneo. Ademais, apresentamos uma estratégia para simulação do novo processo, bem como uma aplicação em teoria da ruína, mediante uma modificação do processo Cramér-Lundberg


  • Mostrar Abstract
  • Uma das limitações do processo Poisson é a hipótese de saltos unicamente unitários em intervalos infinitesimais. Todavia essa limitação é contornada pelo processo Poisson composto. Entretanto, em muitos casos a distribuição de probabilidade dos incrementos não tem forma conhecida no processo Poisson composto, limitando sua modelagem ao uso de funções geradoras de probabilidades ou técnicas numéricas e simulações. Neste trabalho, propomos um novo processo de contagem baseado na distribuição Bell-Touchard, denominado processo Bell-Touchard. Entre suas propriedades, verificamos que o processo é membro da família de processos Poisson compostos e Poisson múltiplos e que também é fechado para convolução e decomposição. Mostramos que o processo decorrente da composição de processos Poisson é Bell-Touchard. Apresentamos duas generalizações, o processo Bell-Touchard composto e o processo Bell-Touchard não homogêneo, mostrando que este último pode ser obtido pela composição de um processo Poisson não homogêneo em um processo Poisson homogêneo. Ademais, apresentamos uma estratégia para simulação do novo processo, bem como uma aplicação em teoria da ruína, mediante uma modificação do processo Cramér-Lundberg

7
  • DIEGO DA SILVA SANTOS
  • MODELOS DE REGULARIZAÇÃO COM IMPUTAÇÃO E CURVAS DE DECISÃO APLICADOS A DADOS DE MEDICINA

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • PABLO MARTIN RODRIGUEZ
  • FLORENCIA GRACIELA LEONARDI
  • TATIANA ANDREA BENAGLIA CARVALHO
  • Data: 22/02/2022

  • Mostrar Resumo
  • Na análise estatística é comum a presença de dados faltantes em muitas aplicações e estudos em inúmeras áreas com especial ênfase a área da saúde. Estudos foram sendo desenvolvidos ao longo da segunda metade do século XX para contornar o problema de dados faltantes dos quais destacam-se os trabalhos de Rubin (1988) e Schafer (1997) em imputação de dados. Além do tratamento do banco de dados e preenchimento dos dados para utilização das técnicas estatísticas de modelagem que em sua grande maioria são restritas a dados completos, outra questão que se levanta após o tratamento dos dados é a técnica estatística mais adequada a ser utilizada para o determinado objetivo inferencial. Na área de análise de regressão os modelos com regularização vem sendo cada vez mais utilizados em problemas de alta dimensão onde tem-se muitas covariáveis a serem estimadas ou problemas de multicolinearidade. Esta dissertação aborda o problema da modelagem de regressão regularizada aplicada aos dados imputados, em especial ao modelo de regressão LASSO para dados multi-imputados conhecida como MI-LASSO (Chen e Wang, 2013), também utiliza-se a técnica de validação cruzada aninhada (Bates, Hastie e Tibshirani, 2021) para obtenção da variância empírica de validação cruzada e intervalos de confiança mais largos para o erro de validação dentro da amostra envolvidos nos modelos de regularização. Desta forma, é proposta uma abordagem utilizando a imputação múltipla através do Bootstrap Bayesiano atrelado ao modelo LASSO com validação cruzada aninhada para correção da estimativa de variância da validação cruzada usual, e busca-se o modelo com melhor poder de predição (ou classificação para problemas envolvendo modelo logístico com variável resposta de interesse dicotômica). Por fim, utiliza-se da metodologia de curvas de decisão proposta por Vickers e Elkin (2006) para a aplicação em dados de Covid-19 com o intuito de propor uma abordagem correta na tomada de decisões de profissionais da saúde em problemas de diagnóstico clínico na presença de dados faltantes.


  • Mostrar Abstract
  • Na análise estatística é comum a presença de dados faltantes em muitas aplicações e estudos em inúmeras áreas com especial ênfase a área da saúde. Estudos foram sendo desenvolvidos ao longo da segunda metade do século XX para contornar o problema de dados faltantes dos quais destacam-se os trabalhos de Rubin (1988) e Schafer (1997) em imputação de dados. Além do tratamento do banco de dados e preenchimento dos dados para utilização das técnicas estatísticas de modelagem que em sua grande maioria são restritas a dados completos, outra questão que se levanta após o tratamento dos dados é a técnica estatística mais adequada a ser utilizada para o determinado objetivo inferencial. Na área de análise de regressão os modelos com regularização vem sendo cada vez mais utilizados em problemas de alta dimensão onde tem-se muitas covariáveis a serem estimadas ou problemas de multicolinearidade. Esta dissertação aborda o problema da modelagem de regressão regularizada aplicada aos dados imputados, em especial ao modelo de regressão LASSO para dados multi-imputados conhecida como MI-LASSO (Chen e Wang, 2013), também utiliza-se a técnica de validação cruzada aninhada (Bates, Hastie e Tibshirani, 2021) para obtenção da variância empírica de validação cruzada e intervalos de confiança mais largos para o erro de validação dentro da amostra envolvidos nos modelos de regularização. Desta forma, é proposta uma abordagem utilizando a imputação múltipla através do Bootstrap Bayesiano atrelado ao modelo LASSO com validação cruzada aninhada para correção da estimativa de variância da validação cruzada usual, e busca-se o modelo com melhor poder de predição (ou classificação para problemas envolvendo modelo logístico com variável resposta de interesse dicotômica). Por fim, utiliza-se da metodologia de curvas de decisão proposta por Vickers e Elkin (2006) para a aplicação em dados de Covid-19 com o intuito de propor uma abordagem correta na tomada de decisões de profissionais da saúde em problemas de diagnóstico clínico na presença de dados faltantes.

8
  • WILLAMS BATISTA FERREIRA DA SILVA
  • Processo ARMA Gama Generalizado Aplicado a Imagens de Amplitude e Intensidade SAR

  • Orientador : ABRAAO DAVID COSTA DO NASCIMENTO
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • FERNANDA VITAL DE PAULA
  • LEANDRO CHAVES REGO
  • Data: 25/02/2022

  • Mostrar Resumo
  • Os problemas de sensoriamento remoto são resolvidos usando imagens de radar de aber-tura sintética (SAR). Porém, essas imagens sofrem com o ruído speckle, que exige uma certa modelagem de seus atributos (como intensidade e amplitude). É comum trabalhar com abordagens separadas para dados de intensidade e amplitude. Neste trabalho, propomos um novo processo autoregressivo de médias móveis (ARMA) com distribuição marginal Gama Generalizada (GΓ), denominado GΓ-ARMA e conseguimos modelar ambos os atributos com o mesmo modelo. Derivamos algumas de suas propriedades matemáticas: expressões de forma fechada baseadas em momento, função escore e matriz de informação de Fisher. Um procedimento para obter estimativas de máxima verossimilhança dos parâmetros GΓ-ARMA é fornecido e seu desempenho é quantificado e discutido usando experimentos de Monte Carlo, considerando (entre outras) várias funções de ligação. Por fim, a proposta é aplicada a dados reais obtidos deimagens das regiões de Munique e São Francisco. Os resultados demonstram que GΓ-ARMA descreve as vizinhanças dos pixels da imagem SAR melhor do que o processo  Γ-ARMA (que é uma referência para dados positivos assimétricos). Ao modelar raios de pixel reais, nossaproposta supera os modelos GI0 e Γ-ARMA.


  • Mostrar Abstract
  • Os problemas de sensoriamento remoto são resolvidos usando imagens de radar de aber-tura sintética (SAR). Porém, essas imagens sofrem com o ruído speckle, que exige uma certa modelagem de seus atributos (como intensidade e amplitude). É comum trabalhar com abordagens separadas para dados de intensidade e amplitude. Neste trabalho, propomos um novo processo autoregressivo de médias móveis (ARMA) com distribuição marginal Gama Generalizada (GΓ), denominado GΓ-ARMA e conseguimos modelar ambos os atributos com o mesmo modelo. Derivamos algumas de suas propriedades matemáticas: expressões de forma fechada baseadas em momento, função escore e matriz de informação de Fisher. Um procedimento para obter estimativas de máxima verossimilhança dos parâmetros GΓ-ARMA é fornecido e seu desempenho é quantificado e discutido usando experimentos de Monte Carlo, considerando (entre outras) várias funções de ligação. Por fim, a proposta é aplicada a dados reais obtidos deimagens das regiões de Munique e São Francisco. Os resultados demonstram que GΓ-ARMA descreve as vizinhanças dos pixels da imagem SAR melhor do que o processo  Γ-ARMA (que é uma referência para dados positivos assimétricos). Ao modelar raios de pixel reais, nossaproposta supera os modelos GI0 e Γ-ARMA.

9
  • NOEMIR DOS SANTOS SOUSA LIMA
  • Associação em Tabelas de Contingência de Dupla Entrada com Dados Amostrais Complexos de COVID-19.

  • Orientador : CRISTIANO FERRAZ
  • MEMBROS DA BANCA :
  • ALEX DIAS RAMOS
  • CRISTIANO FERRAZ
  • HEMILIO FERNANDES CAMPOS COELHO
  • Data: 29/06/2022

  • Mostrar Resumo
  • A associação em tabelas de contingência é averiguada através de estudos que analisam a independência das variáveis ou a homogeneidade, através de testes hipóteses. Nesta dissertação são efetuadas análises com dados amostrais complexos, que são os que possuem: estratificação, conglomeração e/ou probabilidade proporcional a uma medida de tamanho. Utilizamos os dados de COVID-19 da Pesquisa Sorológica Continuar Cuidando, do estado da Paraíba, com o objetivo de apresentar os testes de Rao-Scott e de Wald para investigar a associação em tabelas de contingência de dupla entrada, enfatizando a importância de considerar corretamente o plano amostral.


  • Mostrar Abstract
  • A associação em tabelas de contingência é averiguada através de estudos que analisam a independência das variáveis ou a homogeneidade, através de testes hipóteses. Nesta dissertação são efetuadas análises com dados amostrais complexos, que são os que possuem: estratificação, conglomeração e/ou probabilidade proporcional a uma medida de tamanho. Utilizamos os dados de COVID-19 da Pesquisa Sorológica Continuar Cuidando, do estado da Paraíba, com o objetivo de apresentar os testes de Rao-Scott e de Wald para investigar a associação em tabelas de contingência de dupla entrada, enfatizando a importância de considerar corretamente o plano amostral.

10
  • SUELEM TORRES DE FREITAS
  • Análise bayesiana dos Modelos de Regressão Linear com Erros simétricos autorregressivos e dados incompletos 

  • Orientador : ALDO WILLIAM MEDINA GARAY
  • MEMBROS DA BANCA :
  • ALDO WILLIAM MEDINA GARAY
  • FRANCYELLE DE LIMA MEDINA
  • CELSO RÔMULO BARBOSA CABRAL
  • Data: 29/08/2022

  • Mostrar Resumo
  • Os modelos de regressão com erros autorregressivos considerando dados incompletos, isto é, quando a variável de interesse não está completamente disponível, seja pelo fato de ser censurados ou dados ausentes, comumente denotado por missing data, tem se tornado um grande desafio para muitos pesquisadores. Uma suposição rotineira neste tipo de modelos é considerar as inovações seguindo distribuição normal, no entanto é conhecido que esta suposição pode não ser apropriada em especial na presença da dados discordantes, assim este trabalho tem como objetivo principal apresentar uma abordagem Bayesiana dos modelos de regressão com erros autorregressivos, de ordem p, para dados incompletos (censurados ou missingdata) supondo que as inovações seguem distribuições mais flexíveis, que possui como casos particulares as distribuições t de Student, slash, normal contaminada e normal. 

     


  • Mostrar Abstract
  • Os modelos de regressão com erros autorregressivos considerando dados incompletos, isto é, quando a variável de interesse não está completamente disponível, seja pelo fato de ser censurados ou dados ausentes, comumente denotado por missing data, tem se tornado um grande desafio para muitos pesquisadores. Uma suposição rotineira neste tipo de modelos é considerar as inovações seguindo distribuição normal, no entanto é conhecido que esta suposição pode não ser apropriada em especial na presença da dados discordantes, assim este trabalho tem como objetivo principal apresentar uma abordagem Bayesiana dos modelos de regressão com erros autorregressivos, de ordem p, para dados incompletos (censurados ou missingdata) supondo que as inovações seguem distribuições mais flexíveis, que possui como casos particulares as distribuições t de Student, slash, normal contaminada e normal. 

     

11
  • LUCIANO SOARES MENDES JÚNIOR
  • Estudo da correlação entre vizinhos adjacentes em modelos de transmissão definidos em grafos finitos

  • Orientador : PABLO MARTIN RODRIGUEZ
  • MEMBROS DA BANCA :
  • ANGÉLICA YOHANA PACHÓN PINZÓN
  • LEON ALEXANDER VALENCIA HENAO
  • PABLO MARTIN RODRIGUEZ
  • ÉLCIO LEBENSZTAYN
  • Data: 29/08/2022

  • Mostrar Resumo
  • Este trabalho é um estudo teórico e numérico sobre o comportamento das correlações envolvidas nos modelos SIS, SIR e MT. Inicialmente, foram desenvolvidos estudos de argumentos apresentados recentemente na literatura. Esta etapa envolveu a aplicação da desigualdade FKG para mostrar que as variáveis de interesse têm correlação não-negativa. Posteriormente foi analisado um outro argumento em que é exibido um contra-exemplo mostrando que os argumentos estudados anteriormente não são válidos para o modelo SIR. Então, foram desenvolvidos métodos de simulação de Monte Carlo para verificar o comportamento das correlações nos modelos mencionados. O primeiro método desenvolvido estima a correlação média ao longo do processo em um par de vértices vizinhos, o segundo método por sua vez, estima a correlação média em cada unidade de tempo do processo. Os métodos desenvolvidos foram aplicados em dois tipos de grafos, um grafo k-regular e
    um outro grafo formado por duas estrelas com n vértices conectadas pelos seus respectivos vértices centrais. Verificamos que para os modelos SIR e MT definidos no grafo k-regular as correlações apresentam um comportamento não-negativo. Por outro lado, esse comportamento não se repete para os mesmos modelos definidos no grafo formado por duas estrelas ligadas pelos seus respectivos vértices centrais.


  • Mostrar Abstract
  • This paper is a theoretical and numerical study of the correlation behavior involved in the
    SIS, SIR, and MT models. Initially, were developed studies about recent arguments in
    the literature. In this step was applied the FKG inequality to show that the variables of
    interest have a non-negative correlation. Subsequently, another argument was analyzed
    with a counterexample and consequently showed that the arguments previously studied
    are not valid for the SIR model. Then, Monte Carlo simulation methods were developed
    to verify the behavior of the correlations in the mentioned models.The first method
    developed estimates the average correlation along the process in a pair of neighboring
    vertices. The second method, in turn, estimates the average correlation in each unit of
    process time. The developed methods were applied in two types of graphs: a k-regular
    graph and another graph formed by two stars with n vertices connected by their respective
    central vertices.We verified that in the SIR and MT models defined in the k-regular
    graph, the correlations present a non-negative behavior. On the other hand, this behavior
    is not repeated by the same models defined in the graph formed by two stars connected
    by their respective central vertices.

Teses
1
  • FERNANDA CLOTILDE DA SILVA
  • Um critério de Seleção Para Modelos Beta Baseado no Trade-off Predição e Variabilidade

  • Orientador : PATRICIA LEONE ESPINHEIRA OSPINA
  • MEMBROS DA BANCA :
  • PATRICIA LEONE ESPINHEIRA OSPINA
  • FRANCISCO CRIBARI NETO
  • RAYDONAL OSPINA MARTINEZ
  • MICHEL H. MONTORIL
  • RAFAEL IZBICKI
  • Data: 16/02/2022

  • Mostrar Resumo
  • Muitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0; 1), e quando o interesse consiste em ajustar modelos de regressão para tais dados, o uso do modelo de regressão normal linear pode fornecer valores mal ajustados, excedendo os limites do intervalo. Nesse caso, podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que tem se mostrado uma ferramenta muito eficiente. Tal modelo se baseia em supor que a variável resposta segue uma distribuição beta, assumindo uma nova parametrização, indexando a média da resposta e um parâmetro de precisão. O uso desse modelo tem crescido consideravelmente nos últimos anos, e diversos trabalhos têm sido desenvolvidos, propondo algumas extensões, como é possível ver em Smithson e Verkuilen (2006), Simas et al. (2010), Carrasco et al. (2014), entre outros. Além das extensões do modelo beta, alguns métodos de análise de diagnóstico também foram desenvolvidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas para o modelo. Entretanto, o uso das técnicas de diagnóstico normalmente segue após a escolha de um conjunto de covariáveis consideradas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e muitos métodos e critérios têm sido desenvolvidos para sua realização, dentre eles destacam-se os pseudos R^2, que avaliam a proporção de variação da variável resposta que pode ser explicada pelo modelo ajustado, essas medidas foram estudadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos betas. Além dessas quantidades, dispomos também de mais um critério para selecionar modelos, denotado por P^2, que identifica a habilidade do modelo em predizer bons valores para a variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição de alguns critérios de seleção tem como interesse verificar o poder de explicação da variabilidade da resposta, ou o poder de predição dos valores desta variável, esse trabalho, tem como objetivo apresentar mais uma medida para selecionar modelos de regressão beta, no entanto, considerando ambos os interesses, isto é, desenvolvemos uma medida que considera tanto a quantidade de variabilidade explicada pelo modelo como também a predição de bons valores. Avaliamos o desempenho da medida proposta por meio de estudos de simulação de Monte Carlo, considerando diversos cenários, também aplicamos bancos de dados reais que reafirmam a eficácia da nossa medida.


  • Mostrar Abstract
  • Muitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0; 1), e quando o interesse consiste em ajustar modelos de regressão para tais dados, o uso do modelo de regressão normal linear pode fornecer valores mal ajustados, excedendo os limites do intervalo. Nesse caso, podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que tem se mostrado uma ferramenta muito eficiente. Tal modelo se baseia em supor que a variável resposta segue uma distribuição beta, assumindo uma nova parametrização, indexando a média da resposta e um parâmetro de precisão. O uso desse modelo tem crescido consideravelmente nos últimos anos, e diversos trabalhos têm sido desenvolvidos, propondo algumas extensões, como é possível ver em Smithson e Verkuilen (2006), Simas et al. (2010), Carrasco et al. (2014), entre outros. Além das extensões do modelo beta, alguns métodos de análise de diagnóstico também foram desenvolvidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas para o modelo. Entretanto, o uso das técnicas de diagnóstico normalmente segue após a escolha de um conjunto de covariáveis consideradas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e muitos métodos e critérios têm sido desenvolvidos para sua realização, dentre eles destacam-se os pseudos R^2, que avaliam a proporção de variação da variável resposta que pode ser explicada pelo modelo ajustado, essas medidas foram estudadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos betas. Além dessas quantidades, dispomos também de mais um critério para selecionar modelos, denotado por P^2, que identifica a habilidade do modelo em predizer bons valores para a variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição de alguns critérios de seleção tem como interesse verificar o poder de explicação da variabilidade da resposta, ou o poder de predição dos valores desta variável, esse trabalho, tem como objetivo apresentar mais uma medida para selecionar modelos de regressão beta, no entanto, considerando ambos os interesses, isto é, desenvolvemos uma medida que considera tanto a quantidade de variabilidade explicada pelo modelo como também a predição de bons valores. Avaliamos o desempenho da medida proposta por meio de estudos de simulação de Monte Carlo, considerando diversos cenários, também aplicamos bancos de dados reais que reafirmam a eficácia da nossa medida.

2
  • VINICIUS TEODORO SCHER
  • Essays on Double Bounded Time Series Analysis

  • Orientador : FRANCISCO CRIBARI NETO
  • MEMBROS DA BANCA :
  • FRANCISCO CRIBARI NETO
  • PATRICIA LEONE ESPINHEIRA OSPINA
  • RAYDONAL OSPINA MARTINEZ
  • AIRLANE PEREIRA ALENCAR
  • PEDRO ALBERTO MORETTIN
  • Data: 18/02/2022

  • Mostrar Resumo
  • Duas etapas importantes na modelagem de séries temporais são seleção de modelos e análise de diagnóstico. No que diz respeito à análise de diagnóstico, nós abordamos a realização de inferências via testes portmanteau utilizando séries temporais que assumem valores no intervalo da unitário padrão. Nosso foco reside na classe de modelos beta autorregressivos e de médias móveis (βARMA). Em particular, desejamos testar a adequacidade de tais modelos. Nós consideramos diversos testes que foram propostos para modelos de séries temporais gaussianas e dois novos testes recentemente introduzidos na literatura. Derivamos a distribuição nula assintótica das duas novas estatísticas de teste em dois cenários diferentes, a saber: quando os testes são aplicados a uma série temporal observada e quando são aplicados a resíduos de um modelo βARMA. Vale a pena notar que nossos resultados implicam a validade assintótica dos testes portmanteau padrão na classe de modelos βARMA que são, sob hipótese nula, assintoticamente equivalente aos dois novos testes. Usamos simulação de Monte Carlo para avaliar os méritos relativos dos diferentes testes portmanteau quando usados conjuntamente com o modelo βARMA. Os resultados de simulação que apresentamos mostram que os novos testes são tipicamente mais poderosos que um teste bem conhecido, cuja estatística de teste também é baseada em autocorrelações parciais dos resíduos. No geral, os dois novos testes funcionam muito bem. Adicionalmente, modelamos a dinâmica da proporção de energia hidrelétrica armazenada no sul do Brasil. Os resultados mostram que o modelo βARMA supera três modelos alternativos e um algoritmo de suavização exponencial. Num segundo estudo, avaliamos a eficácia de estratégias de seleção de modelos com base em diferentes critérios de informação no modelo βARMA. A evidência numérica para modelos autorregressivos, de médias móveis e mistos (autorregressivos e de médias móveis) mostra que, em geral, um critério de seleção de modelos baseado em bootstrap apresenta o melhor desempenho. Nossa aplicação empírica mostra que as previsões mais precisas são obtidas usando seleção de modelo baseada em bootstrap.


  • Mostrar Abstract
  • Two important steps in time series analysis are model selection and diagnostic analysis. We address the issue of performing diagnostic analysis through portmanteau testing inferences using time series data that assume values in the standard unit interval. Our focus lies in the class of beta autoregressive moving average (βARMA) models. In particular, we wish to test the goodness-of-fit of such models. We consider several testing criteria that have been proposed for Gaussian time series models and two new tests that were recently introduced in the literature. We derive the asymptotic null distribution of the two new test statistics in two different scenarios, namely: when the tests are applied to an observed time series and when they are applied to residuals from a fitted βARMA model. It is worth noticing that our results imply the asymptotic validity of standard portmanteau tests in the class of ARMA models that are, under the null hypothesis, asymptotically equivalent to the two new tests. We use Monte Carlo simulation to assess the relative merits of the different portmanteau tests when used with fitted βARMA. The simulation results we present show that the new tests are typically more powerful than a well known test whose test statistic is also based on residual partial autocorrelations. Overall, the two new tests perform quite well. We also model the dynamics of the proportion of stocked hydroelectric energy in South of Brazil. The results show that the βARMA model outperforms three alternative models and an exponential smoothing algorithm. We also consider the issue of performing model selection with double bounded time series. We evaluate the effectiveness of βARMA model selection strategies based on different information criteria. The numerical evidence for autoregressive, moving average, and mixed autoregressive and moving average models shows that, overall, a bootstrap-based model selection criterion is the best performer. An empirical application which we present and discuss shows that the most accurate out-of-sample forecasts are obtained using bootstrap-based model selection.

3
  • ANA CRISTINA GUEDES PEREIRA
  • ESSAYS ON REGRESSION MODELS FOR DOUBLE BOUNDED AND EXTREME-VALUE RANDOM VARIABLES: IMPROVED TESTING INFERENCES AND EMPIRICAL ANALYSES

  • Orientador : FRANCISCO CRIBARI NETO
  • MEMBROS DA BANCA :
  • FRANCISCO CRIBARI NETO
  • FERNANDA DE BASTIANI
  • RAYDONAL OSPINA MARTINEZ
  • FÁBIO MARIANO BAYER
  • GILBERTO ALVARENGA PAULA
  • Data: 21/02/2022

  • Mostrar Resumo
  • Regressões beta são comumente usadas com respostas que assumem valores no intervalo de unidade padrão, tais como taxas, proporções e índices de concentração. Inferências de teste de hipóteses sobre os parâmetros do modelo são normalmente realizadas utilizando o teste de razão de verossimilhanças. Tal teste fornece inferências precisas quando o tamanho da amostra é grande, mas pode conduzir a conclusões imprecisas quando o número de observações é pequeno. Portanto, é importante desenvolver testes alternativos com comportamento superior em pequenas amostras. Derivamos o fator de correção de Bartlett para o teste da razão de verossimilhanças sob a formulação mais geral do modelo de regressão beta, ou seja, sob precisão variável. O modelo contém dois submodelos, um para a resposta média e outro para o parâmetro de precisão. Nosso interesse reside na realização de testes sobre os parâmetros que indexam os dois submodelos. Usamos três estatísticas de teste da razão de verossimilhanças corrigidas por Bartlett que devem apresentar desempenho superior quando o tamanho da amostra é pequeno relativamente ao teste usual. Apresentamos resultados de simulações de Monte Carlo sobre os comportamentos em pequenas amostras dos testes corrigidos por Bartlett, do teste da razão de verossimilhanças usual e de dois testes melhorados que se baseiam em uma abordagem alternativa. A evidência numérica apresentada mostra que um dos testes corrigidos por Bartlett tipicamente conduz a inferências muito precisas mesmo quando o tamanho da amostra é muito pequeno. Uma aplicação empírica relacionada a biometria comportamental é apresentada e discutida.Também consideramos a realização de inferências de teste de hipóteses sobre os parâmetros que indexam um modelo geral de regressão de valor extremo. O modelo contém submodelos separados para os parâmetros de localização e dispersão e permite não linearidades. Com base em tal modelo, é possível avaliar os impactos de diferentes covariáveis sobre a ocorrência de eventos extremos. As inferências de teste são frequentemente baseadas no teste da razão de verossimilhanças, incluindo aquelas realizadas para determinar quais variáveis independentes devem ser incluídas no modelo. Tal teste utiliza valores críticos assintóticos e pode apresentar distorções de tamanho apreciáveis quando o número de observações é pequeno. Em particular, ele tende a ser liberal, ou seja, tipicamente fornece taxas de erro do tipo I que superam o nível de significância selecionado pelo usuário. Derivamos o fator de correção de Bartlett para o teste de razão de verossimilhanças e o utilizamos para definir três estatísticas de teste corrigidas. Embora os testes corrigidos também utilizem valores críticos assintóticos, suas distorções de tamanho convergem para zero mais rapidamente do que as do teste não modificado e, portanto, os novos testes tendem a produzir melhor controle da frequência de erro do tipo I. São apresentados e discutidos resultados de simulações Monte Carlo e também uma aplicação empírica que utiliza dados relacionados à pandemia de Covid-19.


  • Mostrar Abstract
  • Beta regressions are commonly used with responses that assume values in the standard unit interval, such as rates, proportions and concentration indices. Hypothesis testing inferences on the model parameters are typically performed using the likelihood ratio test. It delivers accurate inferences when the sample size is large, but can otherwise lead to unreliable conclusions. It is thus important to develop alternative tests with superior finite sample behavior. We derive the Bartlett correction to the likelihood ratio test under the more general formulation of the beta regression model, i.e.\ under varying precision. The model contains two submodels, one for the mean response and a separate one for the precision parameter. Our interest lies in performing testing inferences on the parameters that index both submodels. We use three Bartlett-corrected likelihood ratio test statistics that are expected to yield superior performance when the sample size is small. We present Monte Carlo simulation evidence on the finite sample behavior of the Bartlett-corrected tests relative to the standard likelihood ratio test and to two improved tests that are based on an alternative approach. The numerical evidence shows that one of the Bartlett-corrected typically delivers accurate inferences even when the sample is quite small. An empirical application related to behavioral biometrics is presented and discussed. We also address the issue of performing testing inference in a general extreme value regression model when the sample size issmall. The model contains separate submodels for the location and dispersion parameters. It allows practitioners to investigate the impacts of different covariates on extreme events. Testing inferences are frequently based on the likelihood test, including those carried out to determine which independent variables are to be included into the model. The test is based on asymptotic critical values and may be considerably size-distorted when the number of data points is small. In particular, it tends to be liberal, i.e., it yields rates of type I errors that surpass the test's nominal size. We derive the Bartlett correction to the likelihood ratio test and use it to define three Bartlett-corrected test statistics. Even though these tests also use asymptotic critical values, their size distortions vanish faster than that of the unmodified test and thus they yield better control of the type I error frequency. Extensive Monte Carlo evidence and an empirical application that uses Covid-19 related data are presented and discussed.

4
  • CÉSAR DIOGO BEZERRA DA SILVA
  • Novos Paradigmas para o Processo de Stavskaya

  • Orientador : ALEX DIAS RAMOS
  • MEMBROS DA BANCA :
  • ALEX DIAS RAMOS
  • FABIO PRATES MACHADO
  • GETULIO JOSE AMORIM DO AMARAL
  • MARIA EULALIA VARES
  • PABLO MARTIN RODRIGUEZ
  • Data: 21/02/2022

  • Mostrar Resumo
  • O processo de Stavskaya, o qual denotaremo Stav por simplicidade, é uma versão a tempo discreto do conhecido processo de contato. Neste trabalho, revisitamos o processo de Stavskaya com comprimento variável, um sistema de partículas interagentes unidimensional que difere dos tradicionalmente estudados. Nele, as partículas podem aparecer ou desaparecer durante a evolução do sistema. Neste sistema, cada partícula assume estado mais ou menos e evolui da seguinte forma: entre duas partículas vizinhas, nasce uma partícula no estado mais com probabilidade β, independente do que ocorre nos outros lugares. Sempre que uma partícula no estado mais é a vizinha mais próxima a direita de uma partícula no estado menos, então este mais desaparece com probabilidade α. Diferente de Stav, foi mostrado que esta versão variável não apresenta o mesmo tipo de transição de fase. Mais especificamente, o processo variável sempre converge para a mesma delta medida (ergódico), independente dos parâmetros fixados. Em nosso estudo, estabelecemos e analisamos a existência de um outro tipo de transição de fase. Além de termos explorado outros aspectos da sua dinâmica.

    No processo de Stavskaya clássico, em cada passo de tempo, dois operadores atuam: o primeiro determinístico, D, seguido por um aleatório. Tomamos um processo de difusão, descrito por uma equação diferencial parcial. Mostramos que sua equação de diferença finita, a qual denotamos por Difus, é levada via ultradiscretização em D. Motivados por essa correspondência, definimos o processo de Stavskaya de difusão, denotada PSD por simplicidade. Assim como o Stav, o PSD evolui em tempo discreto, da seguinte forma: Em cada passo de tempo discreto, dois operadores atuam, primeiro Difus seguido de um outro aleatório. Diferente de Stav, cada partícula do PSD assume valor num conjunto não enumerável. Mais especificamente, ele atua no conjunto de medidas de probabilidade em [1,∞)Z. Verificamos se o PSD e o processo de Stavskaya são qualitativamente equivalentes, por exemplo, se há uma transição de fase e se propriedades, como: monotonicidade e linearidade são mantidas. Em adição, desenvolvemos, para o processo de stavskaya de comprimento variável e o PSD, alguns estudos numéricos.


  • Mostrar Abstract
  • Revisitamos o processo de Stavskaya com comprimento variável,  um sistema de partículas interagentes unidimensional que difere dos tradicionalmente estudados. 
    Nele, as partículas podem aparecer ou desaparecer durante a evolução do sistema . Ele foi  inspirado no clássico processo de Stavskaya, que é uma versão a tempo discreto do bem conhecido  processo de contato. É provado que ambos processos apresentam um tipo de transição de fase. 
    Foi mostrado que para a versão variável destes processos, essa transição de fase não existe. Mais especificamente, o processo é sempre ergódico. Em nosso estudo, estabelecemos e  analisamos a existência de um outro tipo de transição de fase. Além de explorar outros  aspectos da sua dinâmica. No sistema que estamos estudando, cada partícula assume  o estado mais ou menos. Entre duas partículas, nasce uma partícula mais com  probabilidade β independente do que ocorre nos outros lugares. Sempre que uma partícula mais é a  vizinha mais próxima a direita de uma partícula menos, então ela desaparece com probabilidade α.  Desenvolvemos alguns estudos computacionais.
5
  • MARIA IONERIS OLIVEIRA SILVA
  • Modelos de Tempo de Vida Acelerado Birnbaum-Saunders Multivariados

  • Orientador : FRANCISCO JOSE DE AZEVEDO CYSNEIROS
  • MEMBROS DA BANCA :
  • FRANCISCO JOSE DE AZEVEDO CYSNEIROS
  • ALINE BARBOSA TSUYUGUCHI
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • JUVENCIO SANTOS NOBRE
  • FILIDOR EDILFONSO VILCA LABRA
  • Data: 21/02/2022

  • Mostrar Resumo
  • Modelos de regressão Birnbaum-Saunders têm sido utilizados com frequência nos últimos anos. Uma das principais premissas nos modelos de regressão tradicionais é o pressuposto de independência entre as observações. No entanto, em alguns casos, essa suposição não é válida, como no caso de eventos observados no mesmo indivíduo. A este respeito, modelos de regressão multivariados com estrutura de dependência são uma possível alternativa para modelagem de dados deste tipo. Dessa forma, neste trabalho, introduzimos inicialmente o modelo de regressão Birnbaum-Saunders bivariado com estrutura de dependência modelada através da abordagem de fragilidade. Posteriormente, propomos uma nova distribuição Birnbaum-Saunders multivariada e derivamos algumas propriedades da mesma. Propomos uma extensão do modelo bivariado acima mencionado, isto é, desenvolvemos um novo modelo de regressão Birnbaum-Saunders multivariado. Alguns estudos de simulação foram desenvolvidos para avaliar o desempenho dos estimadores propostos. Finalmente, desenvolvemos o modelo Birnbaum- Saunders generalizado multivariado em que, particularmente, propomos o modelo t de Student Birnbaum-Saunders multivariado. Utilizamos o método de máxima verossimilhança para estimar os parâmetros dos modelos propostos, bem como, derivamos alguns resíduos para avaliar o ajuste dos mesmos. Propomos alguns resíduos e derivamos medidas de diagnósticos sob o enfoque de influência local para os modelos propostos. Para ilustrar a metodologia desenvolvida, no que se refere ao modelo bivariado,utilizamos o conjunto de dados reais que reporta os tempos de recorrência de infecções de 38 pacientes renais usando uma máquina de diálise portátil. No caso do modelo Birnbaum-Saunders multivariado, consideramos dois conjuntos de dados reais: o primeiro conjunto de dados retrata o acompanhamento realizado por pesquisadores da escola de odontologia da universidade da Carolina do Norte sobre o crescimento das crianças (16 meninos, 11 meninas) com idade entre 8 e 14 anos; o segundo conjunto de dados reporta a duração do tempo de exercício necessário até provocar a angina em 21 pacientes com cardiopatia.


  • Mostrar Abstract
  • Modelos de regressão de Birnbaum-Saunders têm sido utilizados com frequência nos últimos anos. É bem conhecido que modelos multivariados desempenham um papel importante na modelagem de dados correlacionados. Dessa forma, neste trabalho, introduzimos inicialmente o modelo de regressão Birnbaum-Saunders bivariado e através do método da máxima verossimilhança estimamos os parâmetros do modelo. Derivamos resíduos e medidas de diagnósticos sob o enfoque de influência local. Posteriormente, propomos uma nova distribuição Birnbaum-Saunders multivariada e derivamos algumas propriedades da mesma. Propomos um novo modelo de regressão Birnbaum-Saunders multivariado, em que o método de máxima verossimilhança é usado para estimar os parâmetros, bem como, derivamos alguns resíduos para avaliar o ajuste do modelo proposto. Alguns estudos de simulação foram desenvolvidos para avaliar o desempenho dos estimadores e dos resíduos supracitados. Realizamos uma análise de diagnóstico para este modelo e aplicamos a metodologia estudada a conjuntos de dados reais.

6
  • JOSÉ IRAPONIL COSTA LIMA
  • Diagnóstico por influência no modelo de regressão Birnbaum-saunders valor extremo
  • Orientador : RAYDONAL OSPINA MARTINEZ
  • MEMBROS DA BANCA :
  • RAYDONAL OSPINA MARTINEZ
  • FRANCYELLE DE LIMA MEDINA
  • KLAUS LEITE PINTO VASCONCELLOS
  • ANTONIO MURILO SANTOS MACEDO
  • CAROLINA IVONNE MARCHANT FUENTES
  • Data: 23/02/2022

  • Mostrar Resumo
  • A implementação de ações de diagnóstico baseadas em avaliação de influência local é uma etapa relevante em uma análise estatística cuja modelagem é constituída por uma estrutura de regressão, pois possibilita a identificação de observações que interferem de forma desproporcional nos resultados inferências quando pequenas perturbações são impostas sobre as mesmas. O objetivo do nosso trabalho é desenvolver análise de diagnóstico por meio de influência local sobre o modelo de regressão Birnbaum-Saunders Valor Extremo (EVBS). Mais precisamente, obter expressões que possibilitam o cálculo das curvaturas normal e conforme associadas a diferentes esquemas de perturbações: ponderação de casos, perturbação na resposta e perturbação em uma variável explicativa. Ao mesmo tempo, buscamos identificar se certas formas de perturbação são apropriadas para se perturbar o modelo de regressão EVBS (caso regular), segundo critérios estabelecidos na literatura estatística. No tocante ao modelo de regressão alvo do estudo, deduzimos algumas propriedades da função densidade de probabilidade da componente estocástica do modelo, abordarmos o problema de estimação por máxima verossimilhança e realizamos simulações de Monte Carlo com o propósito de verificar a existência de suporte empírico que corrobora com a hipótese de consistência assintótica do estimador de máxima verossimilhança (EMV) dos parâmetros. Paralelamente, derivamos uma nova família de distribuições, chamada distribuição Birnbaum-Saunders-Pareto generalizada (GPD-BS), por meio de uma mudança no núcleo da transformação que determina a BS clássica em termos da normal padrão, o qual passa a assumir uma distribuição Pareto generalizada. Ao longo do trabalho, analisamos conjuntos de dados reais de natureza meteorológica com o propósito de ilustrar a eficácia das ferramentas desenvolvidas ou exemplificar o potencial do modelo EVBS na modelagem de dados extremos.

  • Mostrar Abstract
  • A implementação de ações de diagnóstico baseadas em avaliação de influência local é uma etapa relevante em uma análise estatística cuja modelagem é constituída por uma estrutura de regressão, pois possibilita a identificação de observações que interferem de forma desproporcional nos resultados inferências quando pequenas perturbações são impostas sobre as mesmas. O objetivo do nosso trabalho é desenvolver análise de diagnóstico por meio de influência local sobre o modelo de regressão Birnbaum-Saunders Valor Extremo (EVBS). Mais precisamente, obter expressões que possibilitam o cálculo das curvaturas normal e conforme associadas a diferentes esquemas de perturbações: ponderação de casos, perturbação na resposta e perturbação em uma variável explicativa. Ao mesmo tempo, buscamos identificar se certas formas de perturbação são apropriadas para se perturbar o modelo de regressão EVBS (caso regular), segundo critérios estabelecidos na literatura estatística. No tocante ao modelo de regressão alvo do estudo, deduzimos algumas propriedades da função densidade de probabilidade da componente
    estocástica do modelo, abordarmos o problema de estimação por máxima verossimilhança e realizamos simulações de Monte Carlo com o propósito de verificar a existência de suporte empírico que corrobora com a hipótese de consistência assintótica do estimador de máxima verossimilhança (EMV) dos parâmetros.

7
  • MARCELO DOS SANTOS
  • Uma releitura inferencial e análise de diagnósticos em modelos geoestatísticos

  • Orientador : FERNANDA DE BASTIANI
  • MEMBROS DA BANCA :
  • FERNANDA DE BASTIANI
  • CRISTIANO FERRAZ
  • GETULIO JOSE AMORIM DO AMARAL
  • ORIETTA NICOLIS
  • MANUEL JESUS GALEA ROJAS
  • Data: 24/02/2022

  • Mostrar Resumo
  • O presente trabalho de tese, estuda situações em que os eventos de interesse apresentam dependência espacial entre as observações. Não obstante, estudos nesta área tenham tido notáveis avanços, técnicas relacionadas a eficiência da matriz de correlação espacial utilizada, bem como a escolha de tal, além de modelos de quasi-verossimilhança e distribuições para dados com excesso de zeros, ainda são pouco exploradas. Destarte, os modelos apresentados neste texto estão fundamentados em modelos geoestatísticos, que tem como objetivo estimar o valor de uma dada propriedade de interesse, para diferentes localizações referenciadas, condicionado a alguma função de correlação espacial entre os dados amostrados. Dito isto, desenvolvemos este trabalho em três etapas. Na primeira etapa, ancoramos na teoria das funções de base radial compactamente suportadas no intervalo [0, 1), com o objetivo de avaliar o desempenho de funções pertencentes a esta classe, quando aplicadas a modelos espaciais lineares. Para tanto, utilizamos a família de funções Wendland e a comparamos com a família Matérn, para vários valores de seus parâmetros de suavização. Paralelamente, desenvolvemos as relações entre o alcance prático e o parâmetro de suporte e, estabelecemos expressões para mensurar o índice de dependência espacial para ambas as famílias. Além disso, como técnica de diagnóstico, são desenvolvidas medidas de influência local sob diferentes esquemas de perturbação. Como critério de identificação de observações potencialmente influentes, propomos utilizar níveis de referência obtidos a partir de reamostragem Jackknife-after-Bootstrap. Na segunda etapa, propomos um novo critério para seleção da matriz de correlação espacial de trabalho, baseado no condicionamento da matriz de variância-covariância naive, a partir de modelos de quasi-verossimilhança e Equações de Estimação Generalizadas. Avaliamos a performance do método por um extenso estudo de simulações, utilizando as distribuições marginais da Normal, Poisson e Gama para dados espacialmente correlacionados. A especificação da estrutura de correlação é baseada em modelos de semivariogramas, utilizando as famílias Wendland, Matérn e modelo Esférico. Os resultados revelaram que o critério proposto resultou em um melhor desempenho em comparação com os concorrentes disponíveis na literatura, com relação às taxas de acerto da verdadeira estrutura de correlação espacial dos dados simulados. Na terceira etapa, temos como objetivo avaliar a distribuição espacial da quantidade ou ocorrência de chuva em uma dada região geográfica. Neste caso, a análise torna-se complicada devido a ocorrência de valor zero na amostra, isto é, localizações em que não ocorreu chuva no período em estudo. Assim, para acomodar o zero, propomos utilizar um modelo de mistura da distribuição degenerada em zero com a distribuição Gama, sob dados espacialmente referenciados gerando, assim, um modelo geoestatístico Gama aumentada com zero. Para acomodar a dependência espacial, incorporamos uma estrutura de quasi-verossimilhança e estimamos os parâmetros utilizando equações de estimação através do algoritmo Expectation-Solution. Além disso, sugerimos medidas para os resíduos e desenvolvemos medidas de influência local, sob os esquemas de perturbação de ponderação de casos, variável resposta e nas covariáveis. Por fim, acrescentamos que em todas as etapas um exemplo numérico foi analisado utilizando conjuntos de dados reais. Em tempo, destacamos que, embora cada etapa esteja relacionada pelo fato de estarem sob o enfoque da análise e inferência em modelos geoestatísticos, cada um dos capítulos poderá ser lido de forma independente.

  • Mostrar Abstract
  • Utilizando a teoria das funções de base radias compactamente suportadas, propomos inferir em modelos espacias empregando como matriz de correlação espacial membros da família Wendland. As funções pertencentes a esta família são definidas em um suporte compacto no intervalo $[0, 1)$, a qual sob condições adequadas produzem matrizes definidas positivas e esparsas  o que possibilita uma melhor eficiência computacional. Além disso, são caracterizadas por um raio de influência limitado, permitindo um decaimento para zero a  partir de um parâmetro pré-estabelecido. Ademais, com uma prescrição de suavidade à colocam como competidora natural da conhecida família Matérn. Apresentamos expressões para funções de covariância, semivariância e correlação pertencentes a esta família para diferentes valores do parâmetro de suavização, e desenvolvemos as relações entre o alcance prático e o suporte. Estabelecemos expressões para mensurar o índice de dependência espacial para as famílias Wendland e Matérn. O processo de estimação dos parâmetros são realizados em dois momentos. Primeiramente, realizamos um estudo sob a suposição dos dados pertencerem a processos Gaussianos, então, utilizamos o método de máxima verossimilhança. Posteriormente, estendemos esta suposição para além da distribuição normal, induzindo à distribuições marginais pertencentes a família exponencial de distribuições para dados espacialmente correlacionados simples e com medidas repetidas. Neste caso, utilizamos as equações de estimação generalizadas (EEG). A aplicação desta metodologia é realizada para as distribuições  Binomial, Poisson, Binomial negativa, Gama e Normal inversa. Além disso, como técnica de diagnostico, são desenvolvidas medidas de influência local sob diferentes esquemas de perturbação. Como critério de identificação de observações potencialmente influentes, propomos utilizar níveis de referência obtidos a partir de reamostragem  \textit{Jackknife-after-Bootstrap}. Para validar a metodologia sugerida, realizamos aplicações à conjuntos de dados reais. Executamos um pequeno estudo de simulação, o  qual mostrou que as medidas de influência tiveram um bom desempenho para identificar observações potencialmente influentes.  

2021
Dissertações
1
  • FILIPE ALMEIDA DE ANDRADE LIMA BRITO
  • PROCESSO ARMA LOMAX COM ESTRUTURA NA FUNÇÃO QUANTILICA


  • Orientador : MARIA DO CARMO SOARES DE LIMA
  • MEMBROS DA BANCA :
  • MARIA DO CARMO SOARES DE LIMA
  • GAUSS MOUTINHO CORDEIRO
  • RENATA ROJAS GUERRA
  • Data: 22/07/2021

  • Mostrar Resumo
  • Dada a ampla aplicabilidade de modelos de séries temporais, a proposta de abordagens que contemplem dados de diferentes suportes tem se tornado importante. A distribuição Lomax tem sido utilizada com sucesso para descrever fenômenos de diversas áreas de conhecimento, tais como análise de sobrevivência, confiabilidade e economia. Nesta dissertação, propõe-se um modelo de séries temporais pela abordagem de regressão com ligação na função quantílica tendo distribuição marginal Lomax para descrever tempo de reparo (TTR) de máquinas no contexto de confiabilidade. O novo modelo dinâmico é denominado como processo Autorregressivo e de Médias Móveis Lomax quantílico (ARMA-LQ). Inicialmente, propõe-se uma distribuição Lomax reparametrizada e algumas de suas propriedadas são revisitadas. Subsequentemente, o modelo ARMA-LQ é proposto e algumas de suas propriedades são estudadas, tais como funções escore e matriz de informação observada. É proposto um procedimento de estimaçãopor máxima verossimilhança condicional (EMVC) para os parâmetros do modelo ARMA-LQ. Através de experimentos Monte Carlo, o desempenho das estimativas de EMVC é quantificado para diferentes submodelos. Finalmente, o modelo ARMA-LQ é aplicado a dados reais a fim de descrever tempo de reparação de máquinas de construção civil, comparativamente ao modelo Gama-ARMA. Resultados sugerem que a proposta desta dissertação é um importante suposto probabilístico para lidar com dados tipo tempo de reparo.



  • Mostrar Abstract
  • Dada a ampla aplicabilidade de modelos de séries temporais, a proposta de abordagens que contemplem dados de diferentes suportes tem se tornado importante. A distribuição Lomax tem sido utilizada com sucesso para descrever fenômenos de diversas áreas de conhecimento, tais como análise de sobrevivência, confiabilidade e economia. Nesta dissertação, propõe-se um modelo de séries temporais pela abordagem de regressão com ligação na função quantílica tendo distribuição marginal Lomax para descrever tempo de reparo (TTR) de máquinas no contexto de confiabilidade. O novo modelo dinâmico é denominado como processo Autorregressivo e de Médias Móveis Lomax quantílico (ARMA-LQ). Inicialmente, propõe-se uma distribuição Lomax reparametrizada e algumas de suas propriedadas são revisitadas. Subsequentemente, o modelo ARMA-LQ é proposto e algumas de suas propriedades são estudadas, tais como funções escore e matriz de informação observada. É proposto um procedimento de estimaçãopor máxima verossimilhança condicional (EMVC) para os parâmetros do modelo ARMA-LQ. Através de experimentos Monte Carlo, o desempenho das estimativas de EMVC é quantificado para diferentes submodelos. Finalmente, o modelo ARMA-LQ é aplicado a dados reais a fim de descrever tempo de reparação de máquinas de construção civil, comparativamente ao modelo Gama-ARMA. Resultados sugerem que a proposta desta dissertação é um importante suposto probabilístico para lidar com dados tipo tempo de reparo.


2
  • ANDRÉ MEDEIROS CHAVES
  • Processo arma exponencial exponencializado reparametrizado e propriedades 


  • Orientador : ABRAAO DAVID COSTA DO NASCIMENTO
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • FERNANDO ARTURO PEÑA RAMÍREZ
  • GAUSS MOUTINHO CORDEIRO
  • Data: 23/07/2021

  • Mostrar Resumo
  • Vários fenômenos de natureza física, biológica, financeira, social e econômica demandam o uso de modelos de séries temporais. Muitos avanços têm sido feitos para séries normais, contudo outras distribuições marginais são requeridas frequentemente. Esta dissertação visa contribuir nos âmbitos de séries temporais com retornos positivos. Neste suporte, a distribuição exponencial exponencializada (EE) tem se mostrado uma boa alternativa a outras leis positivas, tais como Gama e Lognormal.
    Nesta dissertação, inicialmente desenvolvemos uma reparametrização da distribuição EE baseada na função quantílica e em seguida combinamos essa nova distribuição com uma estrutura autorregressiva e de médias móveis (ARMA) cuja finalidade é de introduzir o modelo Exponencial
    Exponencializado Reparametrizado Autorregressivo de Médias Móveis (EER-ARMA), como uma alternativa não normal para descrever séries temporais, além disso, várias de suas propriedades são derivadas, como as funções escore e a matriz de informação observada.
    Um procedimento para estimação por máxima verossimilhança dos parâmetros associados é desenvolvido.
    Por meio de experimentos de Monte Carlo, avalia-se numericamente o comportamento das estimativas pontuais sob diferentes cenários, considerando a variação de três funções de ligações distintas. Resultados evidenciam que o uso da função de ligação logarítmica $W$ de Lambert possui desempenho superior quando comparada com as funções de ligação logarítmica e raiz quadrada.
    Por fim, uma aplicação a dados reais é apresentada, em que o modelo EER-ARMA com estrutura na mediana é comparado ao Gama-ARMA com estrutura na média. Resultados indicam que o modelo proposto, isto é, o modelo EER-ARMA pode superar o modelo Gama-ARMA.


  • Mostrar Abstract
  • Vários fenômenos de natureza física, biológica, financeira, social e econômica demandam o uso de modelos de séries temporais. Muitos avanços têm sido feitos para séries normais, contudo outras distribuições marginais são requeridas frequentemente. Esta dissertação visa contribuir nos âmbitos de séries temporais com retornos positivos. Neste suporte, a distribuição exponencial exponencializada (EE) tem se mostrado uma boa alternativa a outras leis positivas, tais como Gama e Lognormal.
    Nesta dissertação, inicialmente desenvolvemos uma reparametrização da distribuição EE baseada na função quantílica e em seguida combinamos essa nova distribuição com uma estrutura autorregressiva e de médias móveis (ARMA) cuja finalidade é de introduzir o modelo Exponencial
    Exponencializado Reparametrizado Autorregressivo de Médias Móveis (EER-ARMA), como uma alternativa não normal para descrever séries temporais, além disso, várias de suas propriedades são derivadas, como as funções escore e a matriz de informação observada.
    Um procedimento para estimação por máxima verossimilhança dos parâmetros associados é desenvolvido.
    Por meio de experimentos de Monte Carlo, avalia-se numericamente o comportamento das estimativas pontuais sob diferentes cenários, considerando a variação de três funções de ligações distintas. Resultados evidenciam que o uso da função de ligação logarítmica $W$ de Lambert possui desempenho superior quando comparada com as funções de ligação logarítmica e raiz quadrada.
    Por fim, uma aplicação a dados reais é apresentada, em que o modelo EER-ARMA com estrutura na mediana é comparado ao Gama-ARMA com estrutura na média. Resultados indicam que o modelo proposto, isto é, o modelo EER-ARMA pode superar o modelo Gama-ARMA.

3
  • IVANGILLYS GOMES DE LIMA
  • Processo Gompertz-ARMA e Propriedades: Uma Aplicação a Precificação do Mercado Financeiro

  • Orientador : MARIA DO CARMO SOARES DE LIMA
  • MEMBROS DA BANCA :
  • MARIA DO CARMO SOARES DE LIMA
  • PEDRO MONTEIRO DE ALMEIDA JUNIOR
  • VINICIUS QUINTAS SOUTO MAIOR
  • Data: 26/07/2021

  • Mostrar Resumo
  • O presente trabalho propõe um novo modelo autorregressivo e de médias móveis (ARMA) para estudar séries com dependência temporal com suporte nos reais positivos. Para tanto, considera-se como distribuição marginal do modelo proposto a distribuição Gompertz, definindo, portanto, o novo modelo denominado de: Gompertz-ARMA. O referido modelo é construído com base na reparametrização em termos dos quantis da distribuição Gompertz.
    O objetivo da reparametrização é modelar diferentes quantis de uma dada série temporal e avaliar os ajustes ao variar a modelagem do parâmetro de localização da série. Realiza-se um estudo de simulação de Monte Carlo para diferentes cenários dos parâmetros da distribuição Gompertz, diferentes quantis e tamanhos amostrais. Como método de estimação dos parâmetros da série, utiliza-se o método de máxima verossimilhança condicional. Por fim, para mostrar a aplicabilidade do novo modelo a situações reais, realiza-se um estudo de aplicação a dados do IBOVESPA, buscando prever o comportamento da série temporal considerada.


  • Mostrar Abstract
  • O presente trabalho propõe um novo modelo autorregressivo e de médias móveis (ARMA) para estudar séries com dependência temporal com suporte nos reais positivos. Para tanto, considera-se como distribuição marginal do modelo proposto a distribuição Gompertz, definindo, portanto, o novo modelo denominado de: Gompertz-ARMA. O referido modelo é construído com base na reparametrização em termos dos quantis da distribuição Gompertz.
    O objetivo da reparametrização é modelar diferentes quantis de uma dada série temporal e avaliar os ajustes ao variar a modelagem do parâmetro de localização da série. Realiza-se um estudo de simulação de Monte Carlo para diferentes cenários dos parâmetros da distribuição Gompertz, diferentes quantis e tamanhos amostrais. Como método de estimação dos parâmetros da série, utiliza-se o método de máxima verossimilhança condicional. Por fim, para mostrar a aplicabilidade do novo modelo a situações reais, realiza-se um estudo de aplicação a dados do IBOVESPA, buscando prever o comportamento da série temporal considerada.

4
  • ALLAN DOS SANTOS
  • APROXIMAÇÕES DE BAIXA COMPLEXIDADE PARA A DCT FRACIONÁRIA


  • Orientador : RENATO JOSE DE SOBRAL CINTRA
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • BRUNA GREGORY PALM
  • RENATO JOSE DE SOBRAL CINTRA
  • Data: 27/08/2021

  • Mostrar Resumo
  • Entre as transformadas discretas mais relevantes, destaca-se a transformada discreta do cosseno (DCT), amplamente empregada em descorrelação de dados por sua proximidade numérica com a transformada de Karhunen-Loève. A DCT admite a inclusão de um parâmetro fracionário α, denominado de ordem, que assume valores no intervalo [0, 1]. Tem-se assim a transformada discreta do cosseno fracionária (FrDCT). Os valores intermediários de α levam a uma análise espectral mista com informações do domínio do tempo e do domínio da transformada. Para α intermediário, a FrDCT oferece uma complexidade de implementação maior do que a DCT, haja vista que as simetrias da DCT não são necessariamente transferidas para a FrDCT. Assim, a derivação de algoritmos rápidos para FrDCT é um tópico relevante, mas cujos desempenhos tendem a ser inferiores aos obtidos pelos algoritmos para a DCT usual. Para endereçar esse problema, propomos uma metodologia baseada em técnicas de aproximação matricial para a derivação de matrizes de baixa complexidade aritméticas capazes de avaliar numericamente a FrDCT. Tais aproximações redundam em algoritmos rápidos de baixa complexidade, sendo ausentes elementos multiplicadores. A ausência de multiplicadores facilita a eventual implementação física destes algoritmos, devido ao esperado baixo consumo energético e baixo consumo de elementos de hardware. Os métodos desenvolvidos têm aplicação em localização temporal de faltas e em análise de sinais não bem modelados por sistemas AR(1), como assumido na análise via DCT tradicional.



  • Mostrar Abstract
  • Entre as transformadas discretas mais relevantes, destaca-se a transformada discreta do cosseno (DCT), amplamente empregada em descorrelação de dados por sua proximidade numérica com a transformada de Karhunen-Loève. A DCT admite a inclusão de um parâmetro fracionário α, denominado de ordem, que assume valores no intervalo [0, 1]. Tem-se assim a transformada discreta do cosseno fracionária (FrDCT). Os valores intermediários de α levam a uma análise espectral mista com informações do domínio do tempo e do domínio da transformada. Para α intermediário, a FrDCT oferece uma complexidade de implementação maior do que a DCT, haja vista que as simetrias da DCT não são necessariamente transferidas para a FrDCT. Assim, a derivação de algoritmos rápidos para FrDCT é um tópico relevante, mas cujos desempenhos tendem a ser inferiores aos obtidos pelos algoritmos para a DCT usual. Para endereçar esse problema, propomos uma metodologia baseada em técnicas de aproximação matricial para a derivação de matrizes de baixa complexidade aritméticas capazes de avaliar numericamente a FrDCT. Tais aproximações redundam em algoritmos rápidos de baixa complexidade, sendo ausentes elementos multiplicadores. A ausência de multiplicadores facilita a eventual implementação física destes algoritmos, devido ao esperado baixo consumo energético e baixo consumo de elementos de hardware. Os métodos desenvolvidos têm aplicação em localização temporal de faltas e em análise de sinais não bem modelados por sistemas AR(1), como assumido na análise via DCT tradicional.


5
  • ISABEL SOARES DINIZ DE OLIVEIRA
  • Visual Tools to Identify Influential Observations in Spatial Data

  • Orientador : FERNANDA DE BASTIANI
  • MEMBROS DA BANCA :
  • FERNANDA DE BASTIANI
  • GETULIO JOSE AMORIM DO AMARAL
  • MANUEL JESUS GALEA ROJAS
  • Data: 28/10/2021

  • Mostrar Resumo
  • Adaptamos o hair-plot, proposto por Genton e Ruiz-Gazen (2010), para identificar e visualizar observações influentes em dados espaciais. Três ferramentas gráficas foram criadas: o bihair-plot, os principais componentes do hair-plot e o funcional hair-plot. A primeira ferramenta são as trajetórias dos valores de um estimador de semivariância espacial ao adicionar uma perturbação a cada observação de um vetor de dados espaciais observado considerando duas defasagens. O segundo descreve as trajetórias dos componentes principais de um estimador de semivariância espacial para todos os atrasos quando cada observação de dados é perturbada, tornando possível identificar observações influentes em dados espaciais contendo o máximo de informações possível do conjunto de dados. O terceiro é obtido a partir dos valores do estimador do semivariograma de rastreamento quando os dados recebem uma perturbação. Os estimadores considerados no estudo foram o semivariograma de amostra para caso univariado, semivariograma cruzado de amostra para caso bivariado e semivariograma de amostra de traço para dados funcionais. Outro método utilizado para obter o semivariograma cruzado foi o Elipsóide de Volume Mínimo, que é mais sensível a outliers. Por meio da análise de influência desse estimador, observamos que não é possível detectar observações influentes. Definimos a forma quadrática dos estimadores e a função de influência, a fim de compreender seu comportamento e propriedades. Por fim, fazemos uma aplicação com essas ferramentas nos dados de poluição para o caso univariado, complementando os resultados apresentados em Genton e Ruiz-Gazen (2010), os dados meuse do pacote sp para o caso bivariado, e os dados maritimes do pacote geofd em R.


  • Mostrar Abstract
  • We adapted the hair-plot, proposed by Genton e Ruiz-Gazen (2010), to identify and visualize influential observations in spatial data. Three graphic tools were created: the bihair-plot, the principal components hair-plot and functional hair-plot. The first tool is trajectories of the values of a spatial semivariance estimator when adding a perturbation to each observation of a vector of spatial data observed considering two lags. The second the second describes trajectories of the principal components of a spatial semivariance estimator values for all lags when each observation of data is perturbed, making it possible to identify influential observations in spatial data containing as much information as possible from the data set. The third is obtained from the values of the trace-semivariogram estimator when the data receive a disturbance. The estimators considered in the study were the sample semivariogram for univariate case, sample cross-semivariogram for bivariate case and sample trace-semivariogram for functional data. Another method used to obtain the cross-semivariogram was Minimum Volume Ellipsoid, which is more sensitive to outliers. Through the influence analysis of this estimator, we observed that it is not possible to detect influential observations. We defined the quadratic form of the estimators and the influence function, in order to understand their behavior and properties. Finally, we make an application with these tools in the pollution data for the univariate case, complementing the results shown in Genton e Ruiz-Gazen (2010), the meuse data from the sp package for the bivariate case, and the maritimes data from package geofd in R.

Teses
1
  • SAUL DE AZEVÊDO SOUZA
  • MÉTODOS ESTATÍSTICOS PARA DADOS EM ESPAÇOS NÃO EUCLIDIANOS

  • Orientador : ABRAAO DAVID COSTA DO NASCIMENTO
  • MEMBROS DA BANCA :
  • ABRAAO DAVID COSTA DO NASCIMENTO
  • MARIA DO CARMO SOARES DE LIMA
  • ALEX DIAS RAMOS
  • WENIA VALDEVINO FELIX
  • LUCIA PEREIRA BARROSO
  • Data: 01/07/2021

  • Mostrar Resumo
  • Esta Tese objetiva primeiramente estudar concentração em dados esféricos através deum novo paradigma, a saber reduzir o problema da esfera real para o intervalo [0, 1]. Os dados eféricos endereçados são em duas frentes: fenômenos direcionais e axiais. Para este fim,duas distribuições são propostas a partir de transformações beseadas em distâncias sobre as distribuições von Mises-Fisher (caso direcional) e Watson (caso axial) reais. As distribuições são denotadas como primeira transformação baseada em distância (TD1(𝜅)) e segunda transformação baseada em distância (TD2(𝜅)) para os casos direcional e axial, respectivamente, sendo 𝜅 um parâmetro que herda a relação com a concentração dos dados das distribuições esféricas. Adicionalmente, a discussão do novo paradigma para estudo de concentração é feita de sorte que se pode gerar outras distribuições a partir da propriedade de simetria rotacional na esfera real. Algumas propriedades matemáticas para as distribuições TD1 e TD2 são discutidas: função geradora de momentos, momentos, curtose, assimetria e matriz de informação de Fisher. Além disso, discussões sobre inferência (pontual e teste de hipótese) para os parâmetros dos novos modelos são realizadas. Uma vez estudadas e propostas as distribuições, elas são utilizadas como elementos centrais no desenvolvimento de estatísticas de testes para dados direcionais (a saber uma função de TD1) e axiais (uma função de TD2). Distribuições exatas para estas estatísticas são derivadas. Estudos numéricos, para as distribuições TD1 e TD2, apontam que as estimativas de máxima verossimilhança para 𝜅 apresentam bons desempenhos mesmo em pequenas amostras. Para o modelo 𝑇𝐷1, verificam-se que: (i) os testes de hipóteses clássicos (escore, Wald e razão de verossimilhanças) são em geral conservadores quanto ao nível pré-especificado em altas concentrações; (ii) o teste escore foi o mais conservador; (iii) o teste Wald foi o mais liberal para pequenos valores de 𝜅. Para o modelo 𝑇𝐷2, observam-se que: (i) o teste da razão de verossimilhanças tende a ser mais liberal para 𝜅 > 1; (ii) os testes Wald e escore são mais conservadores para 𝜅 > 0. Duas aplicações são feitas para ilustrar as propostas em dados esféricos. Resultados mostram que o uso dos paradigmas propostos conseguem detectar de modo simples (isto é, transferindo o problema de uma esfera Esta Tese objetiva primeiramente estudar concentração em dados esféricos através de um novo paradigma, a saber reduzir o problema da esfera real para o intervalo [0, 1]. Os dados eféricos endereçados são em duas frentes: fenômenos direcionais e axiais. Para este fim, duas distribuições são propostas a partir de transformações beseadas em distâncias sobre as distribuições von Mises-Fisher (caso direcional) e Watson (caso axial) reais. As distribuições são denotadas como primeira transformação baseada em distância (TD1(𝜅)) e segunda transformação baseada em distância (TD2(𝜅)) para os casos direcional e axial, respectivamente, sendo 𝜅 um parâmetro que herda a relação com a concentração dos dados das distribuições esféricas. Adicionalmente, a discussão do novo paradigma para estudo de concentração é feita de sorte que se pode gerar outras distribuições a partir da propriedade de simetria rotacional na esfera real. Algumas propriedades matemáticas para as distribuições TD1 e TD2 são discutidas: função geradora de momentos, momentos, curtose, assimetria e matriz de informação de Fisher. Além disso, discussões sobre inferência (pontual e teste de hipótese) para os parâmetros dos novos modelos são realizadas. Uma vez estudadas e propostas as distribuições, elas são utilizadas como elementos centrais no desenvolvimento de estatísticas de testes para dados direcionais (a saber uma função de TD1) e axiais (uma função de TD2). Distribuições exatas para estas estatísticas são derivadas. Estudos numéricos, para as distribuições TD1 e TD2, apontam que as estimativas de máxima verossimilhança para 𝜅 apresentam bons desempenhos mesmo em pequenas amostras. Para o modelo 𝑇𝐷1, verificam-se que: (i) os testes de hipóteses clássicos (escore, Wald e razão de verossimilhanças) são em geral conservadores quanto ao nível pré-especificado em altas concentrações; (ii) o teste escore foi o mais conservador; (iii) o teste Wald foi o mais liberal para pequenos valores de 𝜅. Para o modelo 𝑇𝐷2, observam-se que: (i) o teste da razão de verossimilhanças tende a ser mais liberal para 𝜅 > 1; (ii) os testes Wald e escore são mais conservadores para 𝜅 > 0. Duas aplicações são feitas para ilustrar as propostas em dados esféricos. Resultados mostram que o uso dos paradigmas propostos conseguem detectar de modo simples (isto é, transferindo o problema de uma esfera real para o intervalo [0, 1]) e eficiente alta concentração em amostras esféricas.

     

    É sabido que a média é uma medida de locação influenciada por valores destoantes do conjunto tanto no contexto uni quanto multivariado em espaços Euclidianos. Esse problema também se verifica para variedades estocásticas, como o espaço das pré-formas ou a hiperesfera complexa. A segunda parte desta tese se dedica a proposta de métodos baseados na mediana extrínseca como alternativa a média extrínseca de Fréchet, que tem fórmula analítica intratável. Fórmulas matemáticas para computar a mediana extrínseca projetada e procedimentos para detecção de outliers, baseados nessa medida, são apresentados. Estudos numéricos por simulação de Monte Carlo são realizados para quantificar a robustez da nova mediana em termos da distribuição Bingham complexa para o caso de formas planares (ou em duas
    dimensões). Os resultados mostraram que a mediana proposta é mais robusta que a forma média, principalmente para pequenos tamanhos de amostras. Uma aplicação aos dados de microfósseis ilustra o uso da mediana proposta.

     


  • Mostrar Abstract
  • Propomos uma distribuição de probabilidade baseada em distância no suporte [0,1] para descrever a dispersão de pontos na esfera unitária. Mostramos que se os dados esféricos seguem as leis de von Mises-Fisher ou Watson, então sua concentração pode ser modelada por nossa distribuição. Esta abordagem pode ser estendida a uma classe de distribuições esféricas com propriedade de simetria rotacional. Várias de suas propriedades são derivadas e discutidas: função geradora de momentos, curtose, assimetria e matriz de informação de Fisher. Além disso, procedimentos inferenciais baseados em probabilidade (para estimação pontual e teste de hipótese) envolvendo concentração são fornecidos. Estudos numéricos apontam que as estimativas de máxima verossimilhança apresentam um bom comportamento assintótico, mesmo em amostras de tamanhos pequenos. O teste da razão de verossimilhanças supera frequentemente os testes escore e Wald no cenário X~vMF(mu,kappa). Quando X~W(mu,kappa), os testes mencionados acima funcionam bem para a maioria dos cenários. Duas aplicações foram feitas para ilustrar nossa proposta. Primeiro, usamos estatísticas descritivas e análises gráficas para estudar a dispersão das medidas de distância. Em seguida, propomos um teste de hipótese para avaliar o grau de concentração de observações esféricas com base em dois resultados assintóticos para a von Mises-Fisher concentrada e Watson concentrada. Os resultados revelaram que as medidas de distância aplicadas aos cossenos direcionais são capazes de fornecer evidências sobre a dispersão de pontos na superfície da esfera unitária.

2
  • DANIEL MATOS DE CARVALHO
  • Spatial Scan Statistics Based on Empirical Likelihood and Robust Fitting for Generalized Additive Models for Location, Scale and Shape

  • Orientador : FERNANDA DE BASTIANI
  • MEMBROS DA BANCA :
  • ALEX DIAS RAMOS
  • FERNANDA DE BASTIANI
  • FRANCISCO CRIBARI NETO
  • GILBERTO ALVARENGA PAULA
  • MIGUEL ANGEL URIBE OPAZO
  • Data: 04/08/2021

  • Mostrar Resumo
  • Esta tese apresenta propostas para dois temas independentes e contribuição para três tópicos distintosAs ideias principais de cada tema são apresentados nos parágrafos seguintes.


    O primeiro tópico aceito para publicação apresenta um novo método para detecção de clusters espaciais, ou seja, um método para detecção de regiões com alta concentração de fenômenos espaciais, comparado com um número esperado, dada uma distribuição aleatória de eventos. A principal contribuição da proposta é apresentar um método não paramétrico, baseado nas funções de verossimilhança empírica, como alternativa para métodos tradicionais de varredura de clusters (scan) existentes na literatura. Desta forma, nenhuma família de distribuição é exigida para a variável de interesse. Para avaliação do método foram realizados estudos de simulação considerando o modelo Poisson inflacionado de zeros, comparando os resultados com o método scan proposto por Kuldorff. Os resultados mostram que o novo método reduz as probabilidades de erro do tipo I para observações inflacionadas de zero, com baixo poder para cluster com menos de 8 localizações. Um estudo de casos de sarampo na região de São Paulo, Brasil foi realizado. As observações apresentam uma alta ocorrência de zeros. Apenas o método scan de Kulldorff identificou a existência de um cluster, localizado e centrado na capital São Paulo. Entretanto, caso seja identificado um cluster pelo método Kulldorff na presença de observações inflacionadas e quando não confirmado pela abordagem não paramétrica, é recomendável que as interpretações sejam realizadas com cautela devido a alta probabilidade do erro do tipo I associado ao método Kulldorff quando o modelo não é bem especificado. 

    O segundo tema tem como objetivo apresentar foi tópicos com duas novas abordagens para modelagem robusta para os modelos aditivos generalizados de localização, escala e forma (GAMLSS). A principal motivação é a escassez de métodos robustos para modelos GAMLSS.  As duas propostas buscam transformações de modo a limitar a função de influência associada à distribuição de probabilidade de interessee focam em situações de  contaminação nas caudas das distribuições.  A primeira abordagem modifica a estrutura do logaritmo da função de verossimilhança, utilizando conceitos de censura. Apresenta estudos de simulação e aplicação. A segunda abordagem nete tema baseia-se em um truncamento adaptativo simples, onde observações identificadas como possíveis outliers são verificadas e, se necessário, removidas por truncamento da distribuição da variável de resposta. Além de propor novos métodos de modelagem robusta, eles foram comparados com alguns métodos já disponíveis na literatura. Os estudos de simulação utilizaram as distribuições gama e beta, considerando três modelos distintos: modelos paramétricos sem e com covariáveis e modelos não paramétricos.  Os resultados mostram que, em comparação com os métodos existentes na literatura, o método adaptativo truncado apresenta um melhor desempenho com menores valores no erro quadrático médio e menor variabilidade na maioria dos cenários simulados.  Os desempenhos gerais das propostas são ilustrados por meio de três aplicações: dados de ressonância de imagens cerebrais, usando splines de suavização bivariadas; dados de extrema pobreza infantil; e a dados de síndrome respiratória aguda grave - SRAG.

  • Mostrar Abstract
  • This thesis presents proposals for two independent themes and contributions to three different topics. The main ideas of each theme are presented in the next paragraphs.
    The first topic accepted for publication presents a new method for detecting spatial clusters, that is, a method for detecting regions with a high concentration of spatial phenomena, compared with an expected number, given a random distribution of events. The main contribution of the proposal is to present a non-parametric method, based on empirical likelihood functions, as an alternative to traditional methods of cluster scan existing in the literature. Thus, no distribution family is required for the variable of interest. To evaluate the method, simulation studies were carried out considering the Poisson model inflated with zeros, comparing the results with the scan method proposed by Kuldorff. The results show that the new method reduces the type I error probabilities for zero-inflated observations, with low power for clusters with less than 8 locations. A measles case study in the region of São Paulo, Brazil was carried out. Observations have a high occurrence of zeros. Only the Kulldorff scan method identified the existence of a cluster, located and centered in the capital São Paulo. However, if a cluster is identified by the Kulldorff method in the presence of inflated observations and when not confirmed by the non-parametric approach, it is recommended that the interpretations be performed with caution due to the high probability of type I error associated with the Kulldorff method when the model does not is well specified.
     
    The second theme aims to present topics with two new approaches to robust modeling for generalized additive models of location, scale and shape (GAMLSS). The main motivation is the scarcity of robust methods for GAMLSS models. Both proposals seek transformations in order to limit the influence function associated with the probability distribution of interest, and focus on situations of  contamination in the tails of the distributions. The first approach modifies the logarithm structure of the likelihood function, using concepts of censoring. Simulations studies were carried out to evaluate the methodology and applications are presented. The second approach in this theme is based on a simple adaptive truncation, where observations identified as possible outliers are verified and, if necessary, removed by truncation of the response variable distribution. In addition to proposing new robust modeling methods, they were compared with some methods already available in the literature. The simulation studies used the gamma and beta distributions, considering three distinct models: parametric models without and with covariates and non-parametric models. The results show that, compared to existing methods in the literature, the truncated adaptive method has a better performance with lower mean square error and lower variability in most simulated scenarios. The overall performances of the proposals are illustrated through three applications: brain image resonance data, using bivariate smoothing splines; extreme child poverty data; and data from severe acute respiratory syndrome - SRAG.

     

SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2024 - UFRN - sigaa01.ufpe.br.sigaa01