Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatstica Multivariada
Lavras - MG
Ficha Catalogrca Preparada pela Diviso de Processos Tcnicos da Biblioteca Central da UFLA Ferreira, Daniel Furtado. Estatstica multivariada / Daniel Furtado Ferreira. 1. ed. Lavras : Ed. UFLA, 2008. 662 p. : il. Bibliograa. ISBN 978-85-87692-52-8 1. Estatstica. 2. Normal multivariada. 3. Distncia de Mahalanobis. 4. Mxima verossimilhana. 5. Anlise de varincia. 6. Covarincia. I. Ttulo. CDD - 519.535
Prefcio
A multivariada uma das reas da estatstica de maior importncia. Na investigao cientca os fenmenos so estudados e analisados buscando-se solues para problemas relevantes para a sociedade. As respostas desses fenmenos so mensuradas em mais de uma varivel e, em geral, as anlises so realizadas separadamente para cada uma delas. As tcnicas e mtodos cientcos da estatstica multivariada procuram contemplar todas essas variveis de uma forma integrada, onde as interrelaes so exploradas em sua mxima profundidade e as solues para os problemas so mais consistentes e teis. A possibilidade de aplicar tcnicas e mtodos multivariados aos problemas especcos de cada rea do conhecimento constantemente aventada e muitas vezes abandonada. As razes para isso so a falta de informao sobre os detalhes das tcnicas e, principalmente, a diculdade de interpretao dos resultados alcanados. Esta obra foi idealizada para suprir uma lacuna e, principalmente, para minorar a carncia de publicaes brasileiras na rea de estatstica multivariada. Os aspectos didticos no foram esquecidos. Este Livro poder ser recomendado para os cursos regulares de estatstica e para os cursos de ps-graduao em estatstica e em reas correlatas. Esse Livro difere dos seus pares pela forma com que as demonstraes dos teoremas e as derivaes das estatsticas dos testes so apresentados. A experincia que tenho no ensino e na pesquisa, na rea de multivariada, foi a grande motivao para a compilao da obra. Muitos de meus alunos colaboraram para o enriquecimento e melhoria da qualidade do manuscrito. A necessidade de um livro-texto para o ensino de estatstica multivariada foi um fator decisivo no desenvolvimento desse projeto. Tambm merece destaque o compromisso que tenho com o ensino pblico, de qualidade e gratuito. Adentrar no mundo da multivariada navegar pelo hiperespao da sabedoria e desvendar mistrios que parecem estar alm da nossa capacidade de compreenso. Todos os pesquisadores, alunos, professores e cientistas esto convidados a realizar essa viagem. Ao CNPq quero externar meus agradecimentos pelo suporte nanceiro e pela conana. Os recursos aportados minha pesquisa permitiram uma adequada infraestrutura para a construo desse Livro. Outras instituies de fomento tambm
merecem meu agradecimento, como a CAPES e a FAPEMIG. Universidade Federal de Lavras e ao Departamento de Cincias Exatas meu mais profundo agradecimento por propiciar um ambiente de trabalho que me deu condies amplas, em todos os sentidos dessa palavra, para a confeco desse Livro. Aos colegas de Departamento de Cincias Exatas da UFLA, que sempre me incentivaram e apoiaram, meu muito obrigado. Gostaria de aproveitar o ensejo e agradecer consultoria cientca. Aos consultores, registro meus sinceros agradecimentos pelas consideraes, elogios e crticas. A qualidade nal dessa obra, com toda certeza, co-responsabilidade desses consultores annimos. Espero que os ensinamentos desse Livro consigam atingir o propsito de dirimir dvidas e no de caus-las. A maior parte dos exemplos apresentados nesse Livro foram compilados utilizando dados oriundos do projeto BiosBrasil (CSM-BGBD-www.bisobrasil.ua.br), que tem inteno de mapear a biodiversidade dos solos da Amaznia. Assim, gostaria de agradecer a professora Ftima Maria de Souza Moreira, do Departamento de Cincias dos Solos da Universidade Federal de Lavras, pela cesso dos dados. Aos meus Alunos, co-responsveis por essa obra, meu muito obrigado. No h sentido em uma obra como essa sem que haja a gura dos alunos. Aos meus orientados registro aqui um especial agradecimento pelo convvio, incentivo e apoio. Gostaria de nalizar, direcionando meus agradecimentos quelas pessoas que me acompanham todos os dias e que se sacricaram para que meus ideais fossem alcanados. Aos meus familiares, me (Nadime), pai (Joo) (em memria), esposa (Lidiane) e lha (Aline) meu eterno amor, respeito e admirao. Daniel Furtado Ferreira Lavras, Minas Gerais
Sumrio
Lista de Tabelas Lista de Figuras 1 Introduo 1.1 1.2 1.3 1.4 1.5 1.6 Variveis Aleatrias Multidimensionais . . . . . . . . . . . . . . . . . Amostras Aleatrias . . . . . . . . . . . . . . . . . . . . . . . . . . . Estatsticas Descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . Distncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Varincias Generalizadas e Aspectos Geomtricos . . . . . . . . . . . Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 15 19 20 27 28 34 40 47 49 49 51 52 55 56 59 59 64 68 77 80 89 91
2 lgebra Vetorial e Matricial 2.1 lgebra Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 2.1.2 2.1.3 2.1.4 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7 Produto Interno . . . . . . . . . . . . . . . . . . . . . . . . . Comprimento, ngulo e Distncia . . . . . . . . . . . . . . . Ortogonalidade e Bases Ortonormais . . . . . . . . . . . . . . Ortonormalizao de Gram-Schmidt e Aplicaes . . . . . . . Operaes Matriciais Elementares . . . . . . . . . . . . . . .
lgebra Matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrizes Especiais . . . . . . . . . . . . . . . . . . . . . . . . Operaes Matriciais . . . . . . . . . . . . . . . . . . . . . . . Matrizes Particionadas . . . . . . . . . . . . . . . . . . . . . . Formas Quadrticas e Fator de Cholesky . . . . . . . . . . . . Maximizao de Razo de Formas Quadrticas . . . . . . . . Mtodos Numricos Para Determinao de Autovalores e Autovetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
96 97
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Distribuies Multivariadas . . . . . . . . . . . . . . . . . . . . . . . 107 Jacobiano da Transformao . . . . . . . . . . . . . . . . . . . . . . . 110 Distribuio Normal Multivariada . . . . . . . . . . . . . . . . . . . . 112 3.4.1 3.4.2 3.4.3 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Distribuio Normal Bivariada . . . . . . . . . . . . . . . . . 125 Elipsides de Concentrao . . . . . . . . . . . . . . . . . . . 127 Testes Univariados de Normalidade . . . . . . . . . . . . . . . 133 Testes Para Normalidade Multivariada . . . . . . . . . . . . . 154 Denies e Exemplos . . . . . . . . . . . . . . . . . . . . . . 163 Propriedades das Distribuies Elpticas e Esfricas . . . . . . 165
3.5
3.6
3.7 3.8
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Distribuies de Formas Quadrticas . . . . . . . . . . . . . . . . . . 173 Distribuio Wishart e Suas Propriedades . . . . . . . . . . . . . . . 175 Distribuio T 2 de Hotelling . . . . . . . . . . . . . . . . . . . . . . . 179 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 183
5 Inferncias Sobre Vetores de Mdias 5.1 5.2 5.3 5.4 5.5 5.6 5.7
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Estimadores de Mxima Verossimilhana da Mdia e Covarincia . . 183 Testes de Hipteses Sobre a Mdia de Uma Normal Multivariada . . 187 Regio de Conana do Vetor de Mdias . . . . . . . . . . . . . . . . 201 Intervalos de Conana Simultneos . . . . . . . . . . . . . . . . . . 205 Inferncias Sobre Propores Multinomiais . . . . . . . . . . . . . . . 211 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
227
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Testes Sobre Matrizes de Covarincias de Uma Populao . . . . . . 227 6.2.1 6.2.2 6.2.3 Teste Para Uma Covarincia Especca . . . . . . . . . . . . 228 Testes de Independncia e Esfericidade . . . . . . . . . . . . . 234 Teste Para Simetria Composta . . . . . . . . . . . . . . . . . 242 Teste Para Homogeneidade de Matrizes de Covarincias . . . 248 Teste de Independncia de Grupos de Variveis . . . . . . . . 257 Generalizao de Alguns Testes . . . . . . . . . . . . . . . . . 264
6.3
Testes Para Matrizes de Covarincias de Vrias Populaes . . . . . 248 6.3.1 6.3.2 6.3.3
6.4
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 Comparaes Emparelhadas . . . . . . . . . . . . . . . . . . . . . . . 268 7.2.1 7.2.2 7.2.3 Testes de Hipteses . . . . . . . . . . . . . . . . . . . . . . . . 269 Regies de Conana . . . . . . . . . . . . . . . . . . . . . . . 275 Intervalos de Conana Simultneos . . . . . . . . . . . . . . 277 Pressuposies Bsicas . . . . . . . . . . . . . . . . . . . . . . 280 Inferncias Quando as Covarincias So Homogneas . . . . . 281 Problema de Behrens-Fisher Multivariado e Suas Solues Aproximadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
7.3
7.4
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 Modelos Lineares e Anlise de Varincia Multivariados . . . . . . . . 318 Testes de Hipteses Multivariados e Aproximaes F . . . . . . . . . 331 Comparaes Mltiplas . . . . . . . . . . . . . . . . . . . . . . . . . 338 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 341
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 Medidas de Similaridade e Dissimilaridade . . . . . . . . . . . . . . . 343 9.2.1 9.2.2 Medidas de Dissimilaridades Para Dados Binrios . . . . . . . 348 Medidas de Similaridades . . . . . . . . . . . . . . . . . . . . 350
9.2.3 9.2.4 9.3 9.3.1 9.3.2 9.3.3 9.3.4 9.3.5 9.3.6 9.3.7 9.3.8 9.4 9.5 9.6 9.7
Medidas de Similaridades Para Dados Binrios . . . . . . . . 354 Agrupando Variveis . . . . . . . . . . . . . . . . . . . . . . . 355 Agrupamento Hierrquico do Vizinho Mais Prximo . . . . . 361 Agrupamento Hierrquico do Vizinho Mais Distante . . . . . 364 Agrupamento Hierrquico da Ligao Mdia . . . . . . . . . . 367 Agrupamento Hierrquico do Centride . . . . . . . . . . . . 370 Agrupamento Hierrquico da Mediana . . . . . . . . . . . . . 375 Agrupamento Hierrquico de Ward . . . . . . . . . . . . . . . 376 Agrupamento Hierrquico Baseado no Mtodo Flexvel Beta . 382 Propriedades dos Mtodos de Agrupamento Hierrquicos . . . 384
Agrupamentos No-Hierrquicos . . . . . . . . . . . . . . . . . . . . 385 Determinao do Nmero de Grupos . . . . . . . . . . . . . . . . . . 389 Validao do Agrupamento . . . . . . . . . . . . . . . . . . . . . . . 391 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 395
10 Componentes Principais
10.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395 10.2 Componentes Principais Populacionais . . . . . . . . . . . . . . . . . 396 10.3 Componentes Principais da Matriz de Correlao Populacional . . . 408 10.4 Matrizes de Covarincias ou de Correlaes Especiais . . . . . . . . . 415 10.5 Componentes Principais Parciais . . . . . . . . . . . . . . . . . . . . 419 10.6 Componentes Principais Amostrais . . . . . . . . . . . . . . . . . . . 425 10.7 Nmero de Componentes . . . . . . . . . . . . . . . . . . . . . . . . . 438 10.7.1 Porcentagem Cumulativa da Explicao da Varincia Total . 438 10.7.2 Mdia dos Autovalores . . . . . . . . . . . . . . . . . . . . . . 440 10.7.3 Grco dos Autovalores . . . . . . . . . . . . . . . . . . . . . 442 10.7.4 Teste de Hiptese de Igualdade dos ltimos Autovalores . . . 443 10.8 Seleo de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 444 10.9 Procedimentos Grcos . . . . . . . . . . . . . . . . . . . . . . . . . 447 10.10Inferncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451 10.10.1 Propriedades Assintticas dos Componentes Principais . . . . 452 10.10.2 Inferncias Sobre Autovalores . . . . . . . . . . . . . . . . . . 454 10.10.3 Inferncias Sobre Autovetores . . . . . . . . . . . . . . . . . . 463 10.10.4 Inferncias Sobre Componentes Principais da Matriz de Correlaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467
11.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473 11.2 Modelo Fatorial Ortogonal . . . . . . . . . . . . . . . . . . . . . . . . 474 11.3 Modelo Fatorial Oblquo . . . . . . . . . . . . . . . . . . . . . . . . . 480 11.4 Estimao dos Parmetros do Modelo Fatorial Ortogonal . . . . . . . 481 11.4.1 Mtodo dos Componentes Principais . . . . . . . . . . . . . . 482 11.4.2 Mtodo Fatores Principais . . . . . . . . . . . . . . . . . . . . 493 11.4.3 Mtodo Iterativo dos Fatores Principais . . . . . . . . . . . . 501 11.4.4 Mtodo da Mxima Verossimilhana . . . . . . . . . . . . . . 505 11.4.5 Mtodo dos Fatores Cannicos . . . . . . . . . . . . . . . . . 516 11.5 Rotao Fatorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519 11.6 Teste da Falta de Ajuste do Modelo Fatorial . . . . . . . . . . . . . . 523 11.7 Escores Fatoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 11.7.1 Preditores de Mnimos Quadrados Ponderado . . . . . . . . . 526 11.7.2 Preditor de Regresso . . . . . . . . . . . . . . . . . . . . . . 528 11.7.3 Comparao dos Preditores dos Escores Fatoriais . . . . . . . 529 11.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 530 12 Anlise de Correlao Cannica 531
12.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 531 12.2 Variveis Cannicas e Correlao Cannica Populacional . . . . . . . 532 12.3 Correlao Cannica Populacional de Variveis Padronizadas . . . . 541 12.4 Variveis Cannicas e Correlao Cannica Amostrais . . . . . . . . 546 12.5 Qualidade da Anlise de Variveis Cannicas . . . . . . . . . . . . . 556 12.6 Inferncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563 12.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 569 13 Anlise Discriminante 571
13.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571 13.2 Regras de Classicao . . . . . . . . . . . . . . . . . . . . . . . . . . 572 13.3 Classicao em Uma de Duas Populaes Normais . . . . . . . . . . 579 13.3.1 Classicao em Duas Populaes Normais Com Covarincias Heterogneas . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
13.3.2 Avaliao das Regras de Classicao Para Duas Populaes Normais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585 13.3.3 Funo Discriminante de Fisher Para Duas Populaes . . . . 602 13.4 Classicao em Mais de Duas Populaes Normais . . . . . . . . . . 608 13.4.1 Funo Discriminante de Fisher Considerando Duas ou Mais Populaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613 13.4.2 Avaliao das Regras de Classicao Para Mais de Duas Populaes Normais . . . . . . . . . . . . . . . . . . . . . . . . . 621 13.5 Anlise Discriminante e de Agrupamento . . . . . . . . . . . . . . . . 622 13.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623 Referncias Bibliogrcas Apndices: Tabelas Estatsticas ndice Remissivo 625 635 651