Please use this identifier to cite or link to this item: http://repositorio.ufla.br/jspui/handle/1/13930
Title: Proposta de um teste de normalidade multivariada exato baseado em uma transformação t de Student
Other Titles: Proposal of a multivariate normality test based on an exact multivariate t student transformation
Authors: Melo, Janaína Marques e
Ferreira, Daniel Furtado
Keywords: Teste de normalidade multivariada
Gráfico quantil-quantil
Distribuição normal multivariada
Simulação Monte Carlo
Multivariate normality test
Q-Q plot
Student’s t-distribution
Monte Carlo simulation
Issue Date: 1-Aug-2017
Publisher: Universidade Federal de Lavras
Citation: MELO, J. M; FERREIRA, D. F. Proposta de um teste de normalidade multivariada exato baseado em uma transformação t de Student. Revista Brasileira de Biometria, Lavras, v. 35, n. 2, p. 242-265, jun. 2017.
Abstract: A distribuição normal é uma das mais importantes distribuições contínuas da Estatística. Além dessa distribuição descrever uma série de fenômenos, ela é de grande uso na estatística inferencial. Vale ressaltar que o teste de normalidade influencia diretamente na qualidade e confiabilidade das pesquisas científicas, uma vez que a distribuição normal faz parte da suposição de diversos procedimentos estatísticos, e a não checagem dessa pressuposição pode conduzir a resultados e conclusões incorretas. Na multivariada, isso não é diferente. Uma maneira simples, porém subjetiva,  de se verificar a normalidade de uma distribuição tanto univariada quanto multivariada é por meio de gráficos, como o gráfico quantil-quantil (Q-Q plot). Além disso, os Q-Q plots são ferramentas viáveis para a visualização de valores discrepantes. Uma desvantagem do Q-Q plot clássico é que os quantis observados não são independentes sendo apenas identicamente distribuídos, tornando-se independentes apenas assintoticamente. Isso compromete o Q-Q plot ou qualquer teste que tenha o mesmo princípio básico. O objetivo do presente trabalho é propor um teste exato baseado na distribuição t de Student, validar o seu desempenho por simulação Monte Carlo e desenvolver um Q-Q plot para fornecer provas suplementares para detectar uma possível normalidade multivariada na análise de dados em $p$ dimensões. Este Q-Q plot  provêm de uma caracterização da distribuição normal multivariada feita por Yang et al. (1996) baseada em uma das propriedades da distribuição esférica (FANG et al., 1990). Foi utilizado o programa R versão 3.1.0 de programação livre, e fonte aberta, para auxiliar na construção desse gráfico, bem como nas simulações de validação do teste. O  desempenho, validado por simulação Monte Carlo, mostrou que o teste proposto teve sucesso no controle das taxas de erro tipo I, sendo um teste exato, porém foi pouco poderoso.
ABSTRACT: The normal distribution is one of the most important continuous probability distribution. This distribution describe several phenomena and plays an important role in inferential statistics. It is well known that the normality directly infuences the quality and reliability of scientic research, since violations of normality assumption can lead to incorrect results and conclusions. The same is expected for multivariate normal distribution inferences. A simple manner, however subjective, to verify the univariate or multivariate normality is through quantile-quantile plots (Q-Q plots). Furthermore, the Q-Q plots are eficient tools for visualization of outliers. The drawback of the classical Q-Q plot is that the Mahalanobis distance quantiles are only asymptotically identical, but not independently, chi-squared distributed. This fact compromises the eficiency of the Q-Q plot or any test based on the use of the observed distance quantiles. The aim of this study is to propose an accurate test and validate its performance by Monte Carlo simulation and also provide a Q-Q plot to detect further evidence of violation of multivariate normality in p dimensions. This Q-Q plot originates from a characterization of the multivariate normal distribution made by Yang et al. (1996) based on the spherical distribution properties (Fang et al., 1990). The R program version 3:1:0 was used to implement this Q-Q plot normality test and to verify its performance by Monte Carlo simulations. The Monte Carlo simulation showed that the proposed test successful controls the type I error rates being accurate, but shows lower power than any other multivariate normality test.
URI: http://repositorio.ufla.br/jspui/handle/1/13930
Appears in Collections:DES - Artigos publicados em periódicos
Revista Brasileira de Biometria



This item is licensed under a Creative Commons License Creative Commons