Skip navigation
Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/51814
Files in This Item:
File SizeFormat 
LeonardoSantosDaCruz_DISSERT.pdf2,13 MBAdobe PDFView/Open
Title: Multivariate asymmetric distributions on the unit hypercube : properties and applications
Other Titles: Distribuições assimétricas multivariadas sobre o hipercubo unitário : propriedade e aplicações
Authors: Cruz, Leonardo Santos da
Orientador(es):: Gabriel, Roberto Vila
Coorientador(es):: Santos, Helton Saulo Bezerra dos
Assunto:: Distribuição Multivariada G-elíptica-assimétrica
Distribuição Multivariada G-elíptica-assimétrica normal
Distribuição Multivariada G-elíptica-assimétrica t-Student
Issue Date: 12-Mar-2025
Citation: CRUZ, LEONARDO SANTOS DA. Multivariate asymmetric distributions on the unit hypercube: Properties and applications. 2024. 97 f. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2024.
Abstract: A simetria é crucial na modelagem de dados, pois muitas técnicas estatísticas, como testes de hipóteses e intervalos de confiança, assumem a normalidade ou simetria dos dados. Distribuições simétricas simplificam a análise e a interpretação. Em contextos multivariados, a simetria é avaliada através de momentos de ordem superior, matrizes de covariância e funções de densidade de probabilidade, por exemplo. No contexto multivariado, onde a simetria está presente, algumas distribuições podem ser utilizadas para modelar os dados, como, por exemplo, distribuições esféricas e distribuições elípticas, ambas multivariadas. Porém, quando os dados apresentam algum grau de assimetria, que pode ser observado através de uma representação gráfica, por exemplo, funções classificadas de acordo com essas denominações podem não modelar de forma otimizada o conjunto de dados em estudo. Portanto, alguns erros podem ocorrer na análise decorrente do ajuste dessas distribuições. Em geral, a assimetria está frequentemente presente em contextos multivariados, mas modelar dados multivariados que apresentam assimetria não é uma tarefa trivial. Para lidar com essas características, métodos específicos foram desenvolvidos. Alguns destes métodos baseiam-se em abordagens originalmente criadas para dados simétricos, generalizando assim modelos propostos anteriormente. Esses modelos são conhecidos por incorporarem certo grau de assimetria em modelos simétricos, o que facilita a descrição e ajuste de dados que possuem essa característica. O primeiro capítulo do presente trabalho apresentará ferramentas básicas e consecutivamente mais sofisticadas relacionadas à modelagem de dados multivariados, com e sem simetria. Serão definidas distribuições mais complexas, como a distribuição elíptica, e serão apresentados exemplos e resultados importantes relacionados a essas distribuições. Por fim, são discutidas distribuições que generalizam distribuições elípticas, incorporando a propriedade de modelar dados assimétricos. Estas distribuições assimétricas serão definidas e alguns exemplos serão apresentados. No capítulo seguinte, uma nova família de distribuições assimétricas é apresentada. Inicialmente é apresentado o modelo do qual deriva esta família de distribuições. Este modelo consiste em uma relação condicional entre variáveis aleatórias, onde são incorporados parâmetros de locação, escala, assimetria e um parâmetro adicional que pode ser utilizado para refinar o ajuste do modelo ao conjunto de dados. Nessa fase do trabalho são discutidos aspectos importantes, como a definição da função densidade de probabilidade que pode ser derivada do modelo apresentado. Também são discutidas as possíveis configurações dessas funções, destacando como elas podem, dependendo dos intervalos, assumir a forma de uma função de densidade de probabilidade já conhecida, destacando o caráter generalista do modelo. Serão exploradas outras propriedades, incluindo os critérios de escolha das funções a utilizar no modelo, alguns casos especiais da função densidade de probabilidade, a sua representação gráfica, a não identificabilidade do modelo, em determinadas condições; os quantis marginais, entre outras características relevantes. Além disso, são apresentadas justificativas matemáticas para alguns fatos discutidos ao longo do texto. Por fim, é apresentada a função de máxima verossimilhança, com a caracterização explícita desta função e suas respectivas derivadas parciais, destacando a impossibilidade de descrever explicitamente os estimadores dos parâmetros em termos de expressões analíticas. Como consequência direta, as estimativas dos parâmetros precisarão ser obtidas utilizando métodos computacionais, que serão discutidos e detalhados no capítulo seguinte. Na parte final do presente trabalho, são empregados estudos de simulação, bem como a aplicação de duas famílias de distribuições apresentadas no capítulo 3 em dados reais. O estudo de simulação foi realizado com versões da função de densidade de probabilidade representando a distribuição dos dados do modelo. A estimativa de máxima verossimilhança foi utilizada em conjunto com o algoritmo de Monte Carlo. As análises utilizadas para avaliar as estimativas dos parâmetros foram o viés relativo e o erro quadrático médio. Para melhor ilustrar os resultados, são apresentados gráficos que mostram o comportamento dessas duas métricas para cada um dos parâmetros. Além disso, diversas funções foram empregadas para realizar o estudo de simulação. Uma pequena seleção representativa dessas funções é apresentada no corpo principal do texto, enquanto as demais podem ser encontradas no apêndice deste trabalho. A aplicação aos dados reais foi realizada com um conjunto de dados reais do software R. A estatística descritiva dos dados foi apresentada e comentada. Duas funções de densidade derivadas do modelo foram então ajustadas e o ajuste é avaliado usando algumas métricas, que são brevemente apresentadas e discutidas. Após a discussão dos dados, indica-se qual distribuição melhor se ajusta ao conjunto de dados com base nos critérios considerados e nas funções G escolhidas para o modelo. Por fim, são apresentadas conclusões quanto à aplicação dos dados e à estimação dos parâmetros dentro de uma perspectiva geral do trabalho desenvolvido.
Abstract: In this work, a family of multivariate asymmetric distributions over the unitary hypercube defined in terms of well-known symmetric elliptical distributions is proposed. Here we seek to study fundamental properties, such as the characterization of the density function for some types of distributions, as well as other properties, such as loss of identifiability, quantiles, conditional and marginal distributions, and moments. Furthermore, simulation studies were carried out to verify the asymptotic behavior of the estimated parameter values as the sample size increased. Finally, the developed model was used on real data where, using convenient metrics, the degree of quality of the model’s adjustment to real data was verified.
metadata.dc.description.unidade: Instituto de Ciências Exatas (IE)
Departamento de Estatística (IE EST)
metadata.dc.description.ppg: Programa de Pós-Graduação em Estatística
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Appears in Collections:Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/handle/10482/51814/statistics">



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.