Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/51813
Arquivos associados a este item:
Arquivo TamanhoFormato 
JoaoVictorMonteirosDeAndrade_DISSERT.pdf5,89 MBAdobe PDFVisualizar/Abrir
Título: Family of multivariate distributions for modeling data with positive support : properties and applications
Outros títulos: Família de distribuições multivariadas para modelagem de dados com suporte positivo : propriedades e aplicações
Autor(es): Andrade, João Victor Monteiros de
Orientador(es): Gabriel, Roberto Vila
Coorientador(es): Santos, Helton Saulo Bezerra dos
Assunto: Distribuições elípticas multivariadas
Modelagem estatística
Caudas pesadas
Assimetria
Análise de dados
Data de publicação: 12-Mar-2025
Referência: ANDRADE, João Victor Monteiros de. Family of multivariate distributions for modeling data with positive support: Properties and applications. 2024. 127 f. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2024.
Resumo: Este trabalho tem como objetivo o desenvolvimento de uma nova família de distribuições elípticas multivariadas truncadas, ampliando as ferramentas de modelagem estatística para dados multivariados que exibem características como caudas pesadas e assimetria. As distribuições de Cauchy, t-Student e Normal servem de base para a construção dessas novas distribuições, oferecendo diferentes formas de captura de comportamentos e estruturas de dependência entre variáveis. A metodologia de construção envolve o uso de funções monotônicas crescentes, inversíveis e diferenciáveis, definidas no domínio dos números reais positivos, assegurando que as densidades resultantes tenham suporte nos reais positivos. Essa abordagem inovadora permite a preservação de propriedades fundamentais das distribuições elípticas, como a forma das caudas, ao mesmo tempo que incorpora distorções que ajustam a função densidade às características específicas dos dados analisados. A classe de distribuições proposta oferece maior flexibilidade na modelagem de comportamentos complexos de dados multivariados, sendo particularmente relevante em cenários onde as distribuições tradicionais não capturam adequadamente a dinâmica dos dados. Ao mesmo tempo, mantém a estrutura básica das distribuições elípticas, adaptando-se de maneira robusta às particularidades observadas em fenômenos empíricos. A aplicabilidade desta nova classe de distribuições é avaliada por meio de simulações de Monte Carlo e da aplicação a dados reais provenientes do Australian Institute of Sport (AIS) e de dados sobre os 50 estados dos Estados Unidos, como expectativa de vida e taxa de homicídios. Esses estudos fornecem uma avaliação prática da flexibilidade e desempenho das distribuições propostas. Na seção de revisão de literatura e conceitos fundamentais, descrevem-se os conceitos básicos necessários para o desenvolvimento do trabalho. Esses conceitos são essenciais para compreender os tópicos subsequentes, que envolvem modelagem estatística de distribuições multivariadas. A discussão desses fundamentos visa proporcionar ao leitor uma base sólida para o entendimento das propriedades estatísticas e dos métodos empregados na análise e modelagem dos dados. A seção de desenvolvimento do modelo destaca a criação de um novo modelo de distribuição assimétrica multivariada, baseado em distribuições elípticas e assimétricas. Esse modelo representa uma contribuição inédita no campo da estatística, integrando conceitos previamente explorados na literatura, mas com uma nova abordagem para lidar com a assimetria em distribuições multivariadas. A proposta amplia as possibilidades de análise e modelagem em contextos estatísticos diversos, sendo particularmente útil em aplicações onde as distribuições convencionais falham em capturar adequadamente os padrões dos dados. No estudo de simulação, conduzimos uma avaliação detalhada do desempenho dos estimadores de máxima verossimilhança (MLEs) no caso bivariado, aplicando diferentes funções de distorção, como Gi(x) = 1/α p x/β − p β/x , Gi(x) = log(x), Gi(x) = cosh−1 (x + 1), Gi(x) = log(log(x + 1)), e Gi(x) = x − 1/x. Essas funções permitem ajustar a distribuição para diferentes comportamentos dos dados, sendo analisadas com profundidade. Resultados específicos para a função logq (x) estão detalhados no Apêndice. Por fim, a aplicabilidade dos modelos propostos é avaliada em dados reais, utilizandose uma série de métricas para verificar a qualidade dos ajustes das distribuições aos dados. Para isso, são aplicados testes estatísticos bem estabelecidos, como os testes de KolmogorovSmirnov, Anderson-Darling e Cramér-von Mises, com o objetivo de identificar as distribuições que oferecem o melhor ajuste aos dados analisados. Esses resultados demonstram a robustez e a flexibilidade das novas distribuições, contribuindo para o avanço das técnicas de modelagem estatística multivariada. Este trabalho, ao propor uma nova família de distribuições elípticas multivariadas assimétricas, oferece novas perspectivas para a análise estatística de dados complexos, permitindo modelagens mais robustas e adequadas à realidade dos dados. A abordagem inovadora traz avanços significativos na modelagem de dados multivariados, com potencial para aplicações em diversas áreas da ciência e da indústria.
Abstract: This work proposes the development of a new family of multivariate truncated elliptical distributions, aiming to expand the possibilities of statistical modeling for multivariate data with specific characteristics, such as heavy tails and asymmetry. The distributions used as a basis for the construction of the new densities are Cauchy, t-Student and Normal, which allow capturing different behaviors and dependence structures between variables. The construction of these new distributions will be performed by applying monotonic increasing, invertible and differentiable functions, defined in the domain of positive real numbers. These characteristics ensure that the resulting density has support in positive real numbers. This new class of distributions offers greater flexibility to model complex behaviors of multivariate data, preserving fundamental characteristics of elliptical distributions, such as the shape of the tails, while incorporating distortions that adjust the density function to the particularities of the studied phenomenon. This development opens new perspectives for statistical analysis, providing more robust models that are appropriate to the reality of the data. A Monte Carlo simulation study will also be carried out and applied to real data from the AIS (Australian Institute of Sport) and information on the 50 states of the United States (life expectancy and homicide rate).
Unidade Acadêmica: Instituto de Ciências Exatas (IE)
Departamento de Estatística (IE EST)
Programa de pós-graduação: Programa de Pós-Graduação em Estatística
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.