Você está na página 1de 12

Estatstica Multivariada

UNIVERSIDADE FEDERAL DE LAVRAS


REITOR: Antnio Nazareno Guimares Mendes VICE-REITOR: Elias Tadeu Fialho Diretoria Executiva Renato Paiva (Diretor) Elias Tadeu Fialho Conselho Editorial Renato Paiva (Presidente) Amauri Alves de Alvarenga Carlos Alberto Silva Elias Tadeu Fialho Luiz Carlos de Oliveira Lima

Daniel Furtado Ferreira

Estatstica Multivariada

Lavras - MG

c 2008 by Daniel Furtado Ferreira, 1a edio: 2008


Nenhuma parte desta publicao pode ser reproduzida, por qualquer meio ou forma, sem a autorizao escrita e prvia dos detentores do copyright.

Direitos de publicao reservados Editora UFLA. Impresso no Brasil - ISBN: 978-85-87692-52-8


Editora UFLA Campus Histrico - Caixa Postal 3037 37200-000 - Lavras - MG. Tel: (35) 3829-1115 - Fax: (35) 3829-1551 E-mail: vendas_editora@ua.br - editora@ua.br Homepage: www.editora.ua.br Projeto Grco: Daniel Furtado Ferreira Secretaria: Glenda Fernanda Morton Reviso de Texto: Jane Cherem Reviso de Referncias Bibliogrcas: Mrcio Barbosa de Assis Editorao Eletrnica: Daniel Furtado Ferreira, Christyane Aparecida Caetano, Luciana Carvalho Costa Marketing e Comercializao: Bruna de Carvalho Naves Capa: Daniel Furtado Ferreira, Helder Tobias

Ficha Catalogrca Preparada pela Diviso de Processos Tcnicos da Biblioteca Central da UFLA Ferreira, Daniel Furtado. Estatstica multivariada / Daniel Furtado Ferreira. 1. ed. Lavras : Ed. UFLA, 2008. 662 p. : il. Bibliograa. ISBN 978-85-87692-52-8 1. Estatstica. 2. Normal multivariada. 3. Distncia de Mahalanobis. 4. Mxima verossimilhana. 5. Anlise de varincia. 6. Covarincia. I. Ttulo. CDD - 519.535

Prefcio

A multivariada uma das reas da estatstica de maior importncia. Na investigao cientca os fenmenos so estudados e analisados buscando-se solues para problemas relevantes para a sociedade. As respostas desses fenmenos so mensuradas em mais de uma varivel e, em geral, as anlises so realizadas separadamente para cada uma delas. As tcnicas e mtodos cientcos da estatstica multivariada procuram contemplar todas essas variveis de uma forma integrada, onde as interrelaes so exploradas em sua mxima profundidade e as solues para os problemas so mais consistentes e teis. A possibilidade de aplicar tcnicas e mtodos multivariados aos problemas especcos de cada rea do conhecimento constantemente aventada e muitas vezes abandonada. As razes para isso so a falta de informao sobre os detalhes das tcnicas e, principalmente, a diculdade de interpretao dos resultados alcanados. Esta obra foi idealizada para suprir uma lacuna e, principalmente, para minorar a carncia de publicaes brasileiras na rea de estatstica multivariada. Os aspectos didticos no foram esquecidos. Este Livro poder ser recomendado para os cursos regulares de estatstica e para os cursos de ps-graduao em estatstica e em reas correlatas. Esse Livro difere dos seus pares pela forma com que as demonstraes dos teoremas e as derivaes das estatsticas dos testes so apresentados. A experincia que tenho no ensino e na pesquisa, na rea de multivariada, foi a grande motivao para a compilao da obra. Muitos de meus alunos colaboraram para o enriquecimento e melhoria da qualidade do manuscrito. A necessidade de um livro-texto para o ensino de estatstica multivariada foi um fator decisivo no desenvolvimento desse projeto. Tambm merece destaque o compromisso que tenho com o ensino pblico, de qualidade e gratuito. Adentrar no mundo da multivariada navegar pelo hiperespao da sabedoria e desvendar mistrios que parecem estar alm da nossa capacidade de compreenso. Todos os pesquisadores, alunos, professores e cientistas esto convidados a realizar essa viagem. Ao CNPq quero externar meus agradecimentos pelo suporte nanceiro e pela conana. Os recursos aportados minha pesquisa permitiram uma adequada infraestrutura para a construo desse Livro. Outras instituies de fomento tambm

merecem meu agradecimento, como a CAPES e a FAPEMIG. Universidade Federal de Lavras e ao Departamento de Cincias Exatas meu mais profundo agradecimento por propiciar um ambiente de trabalho que me deu condies amplas, em todos os sentidos dessa palavra, para a confeco desse Livro. Aos colegas de Departamento de Cincias Exatas da UFLA, que sempre me incentivaram e apoiaram, meu muito obrigado. Gostaria de aproveitar o ensejo e agradecer consultoria cientca. Aos consultores, registro meus sinceros agradecimentos pelas consideraes, elogios e crticas. A qualidade nal dessa obra, com toda certeza, co-responsabilidade desses consultores annimos. Espero que os ensinamentos desse Livro consigam atingir o propsito de dirimir dvidas e no de caus-las. A maior parte dos exemplos apresentados nesse Livro foram compilados utilizando dados oriundos do projeto BiosBrasil (CSM-BGBD-www.bisobrasil.ua.br), que tem inteno de mapear a biodiversidade dos solos da Amaznia. Assim, gostaria de agradecer a professora Ftima Maria de Souza Moreira, do Departamento de Cincias dos Solos da Universidade Federal de Lavras, pela cesso dos dados. Aos meus Alunos, co-responsveis por essa obra, meu muito obrigado. No h sentido em uma obra como essa sem que haja a gura dos alunos. Aos meus orientados registro aqui um especial agradecimento pelo convvio, incentivo e apoio. Gostaria de nalizar, direcionando meus agradecimentos quelas pessoas que me acompanham todos os dias e que se sacricaram para que meus ideais fossem alcanados. Aos meus familiares, me (Nadime), pai (Joo) (em memria), esposa (Lidiane) e lha (Aline) meu eterno amor, respeito e admirao. Daniel Furtado Ferreira Lavras, Minas Gerais

Sumrio
Lista de Tabelas Lista de Figuras 1 Introduo 1.1 1.2 1.3 1.4 1.5 1.6 Variveis Aleatrias Multidimensionais . . . . . . . . . . . . . . . . . Amostras Aleatrias . . . . . . . . . . . . . . . . . . . . . . . . . . . Estatsticas Descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . Distncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Varincias Generalizadas e Aspectos Geomtricos . . . . . . . . . . . Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 15 19 20 27 28 34 40 47 49 49 51 52 55 56 59 59 64 68 77 80 89 91

2 lgebra Vetorial e Matricial 2.1 lgebra Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 2.1.2 2.1.3 2.1.4 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7 Produto Interno . . . . . . . . . . . . . . . . . . . . . . . . . Comprimento, ngulo e Distncia . . . . . . . . . . . . . . . Ortogonalidade e Bases Ortonormais . . . . . . . . . . . . . . Ortonormalizao de Gram-Schmidt e Aplicaes . . . . . . . Operaes Matriciais Elementares . . . . . . . . . . . . . . .

lgebra Matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrizes Especiais . . . . . . . . . . . . . . . . . . . . . . . . Operaes Matriciais . . . . . . . . . . . . . . . . . . . . . . . Matrizes Particionadas . . . . . . . . . . . . . . . . . . . . . . Formas Quadrticas e Fator de Cholesky . . . . . . . . . . . . Maximizao de Razo de Formas Quadrticas . . . . . . . . Mtodos Numricos Para Determinao de Autovalores e Autovetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2.8 2.2.9 2.3

Teorema do Valor Singular

. . . . . . . . . . . . . . . . . . .

96 97

Potncias Fracionrias de Matrizes . . . . . . . . . . . . . . .

2.2.10 Derivadas Vetoriais e Matriciais . . . . . . . . . . . . . . . . . 100 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 107

3 Distribuies Multivariadas 3.1 3.2 3.3 3.4

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Distribuies Multivariadas . . . . . . . . . . . . . . . . . . . . . . . 107 Jacobiano da Transformao . . . . . . . . . . . . . . . . . . . . . . . 110 Distribuio Normal Multivariada . . . . . . . . . . . . . . . . . . . . 112 3.4.1 3.4.2 3.4.3 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Distribuio Normal Bivariada . . . . . . . . . . . . . . . . . 125 Elipsides de Concentrao . . . . . . . . . . . . . . . . . . . 127 Testes Univariados de Normalidade . . . . . . . . . . . . . . . 133 Testes Para Normalidade Multivariada . . . . . . . . . . . . . 154 Denies e Exemplos . . . . . . . . . . . . . . . . . . . . . . 163 Propriedades das Distribuies Elpticas e Esfricas . . . . . . 165

3.5

Vericao da Normalidade Multivariada . . . . . . . . . . . . . . . . 132 3.5.1 3.5.2

3.6

Distribuies Elpticas e Esfricas Simtricas . . . . . . . . . . . . . . 162 3.6.1 3.6.2

3.7 3.8

Simulao de Dados de Distribuies Multivariadas . . . . . . . . . . 165 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 173

4 Distribuies Amostrais Multivariadas 4.1 4.2 4.3 4.4 4.5

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Distribuies de Formas Quadrticas . . . . . . . . . . . . . . . . . . 173 Distribuio Wishart e Suas Propriedades . . . . . . . . . . . . . . . 175 Distribuio T 2 de Hotelling . . . . . . . . . . . . . . . . . . . . . . . 179 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 183

5 Inferncias Sobre Vetores de Mdias 5.1 5.2 5.3 5.4 5.5 5.6 5.7

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Estimadores de Mxima Verossimilhana da Mdia e Covarincia . . 183 Testes de Hipteses Sobre a Mdia de Uma Normal Multivariada . . 187 Regio de Conana do Vetor de Mdias . . . . . . . . . . . . . . . . 201 Intervalos de Conana Simultneos . . . . . . . . . . . . . . . . . . 205 Inferncias Sobre Propores Multinomiais . . . . . . . . . . . . . . . 211 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224

6 Testes de Hipteses Sobre Matrizes de Covarincias 6.1 6.2

227

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Testes Sobre Matrizes de Covarincias de Uma Populao . . . . . . 227 6.2.1 6.2.2 6.2.3 Teste Para Uma Covarincia Especca . . . . . . . . . . . . 228 Testes de Independncia e Esfericidade . . . . . . . . . . . . . 234 Teste Para Simetria Composta . . . . . . . . . . . . . . . . . 242 Teste Para Homogeneidade de Matrizes de Covarincias . . . 248 Teste de Independncia de Grupos de Variveis . . . . . . . . 257 Generalizao de Alguns Testes . . . . . . . . . . . . . . . . . 264

6.3

Testes Para Matrizes de Covarincias de Vrias Populaes . . . . . 248 6.3.1 6.3.2 6.3.3

6.4

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 267

7 Inferncias Sobre Vetores de Mdias de Duas Populaes 7.1 7.2

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 Comparaes Emparelhadas . . . . . . . . . . . . . . . . . . . . . . . 268 7.2.1 7.2.2 7.2.3 Testes de Hipteses . . . . . . . . . . . . . . . . . . . . . . . . 269 Regies de Conana . . . . . . . . . . . . . . . . . . . . . . . 275 Intervalos de Conana Simultneos . . . . . . . . . . . . . . 277 Pressuposies Bsicas . . . . . . . . . . . . . . . . . . . . . . 280 Inferncias Quando as Covarincias So Homogneas . . . . . 281 Problema de Behrens-Fisher Multivariado e Suas Solues Aproximadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293

7.3

Comparaes Independentes . . . . . . . . . . . . . . . . . . . . . . . 279 7.3.1 7.3.2 7.3.3

7.4

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 317

8 Anlise de Varincia Multivariada 8.1 8.2 8.3 8.4 8.5

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 Modelos Lineares e Anlise de Varincia Multivariados . . . . . . . . 318 Testes de Hipteses Multivariados e Aproximaes F . . . . . . . . . 331 Comparaes Mltiplas . . . . . . . . . . . . . . . . . . . . . . . . . 338 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 341

9 Anlise de Agrupamento 9.1 9.2

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 Medidas de Similaridade e Dissimilaridade . . . . . . . . . . . . . . . 343 9.2.1 9.2.2 Medidas de Dissimilaridades Para Dados Binrios . . . . . . . 348 Medidas de Similaridades . . . . . . . . . . . . . . . . . . . . 350

9.2.3 9.2.4 9.3 9.3.1 9.3.2 9.3.3 9.3.4 9.3.5 9.3.6 9.3.7 9.3.8 9.4 9.5 9.6 9.7

Medidas de Similaridades Para Dados Binrios . . . . . . . . 354 Agrupando Variveis . . . . . . . . . . . . . . . . . . . . . . . 355 Agrupamento Hierrquico do Vizinho Mais Prximo . . . . . 361 Agrupamento Hierrquico do Vizinho Mais Distante . . . . . 364 Agrupamento Hierrquico da Ligao Mdia . . . . . . . . . . 367 Agrupamento Hierrquico do Centride . . . . . . . . . . . . 370 Agrupamento Hierrquico da Mediana . . . . . . . . . . . . . 375 Agrupamento Hierrquico de Ward . . . . . . . . . . . . . . . 376 Agrupamento Hierrquico Baseado no Mtodo Flexvel Beta . 382 Propriedades dos Mtodos de Agrupamento Hierrquicos . . . 384

Agrupamentos Hierrquicos . . . . . . . . . . . . . . . . . . . . . . . 357

Agrupamentos No-Hierrquicos . . . . . . . . . . . . . . . . . . . . 385 Determinao do Nmero de Grupos . . . . . . . . . . . . . . . . . . 389 Validao do Agrupamento . . . . . . . . . . . . . . . . . . . . . . . 391 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 395

10 Componentes Principais

10.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395 10.2 Componentes Principais Populacionais . . . . . . . . . . . . . . . . . 396 10.3 Componentes Principais da Matriz de Correlao Populacional . . . 408 10.4 Matrizes de Covarincias ou de Correlaes Especiais . . . . . . . . . 415 10.5 Componentes Principais Parciais . . . . . . . . . . . . . . . . . . . . 419 10.6 Componentes Principais Amostrais . . . . . . . . . . . . . . . . . . . 425 10.7 Nmero de Componentes . . . . . . . . . . . . . . . . . . . . . . . . . 438 10.7.1 Porcentagem Cumulativa da Explicao da Varincia Total . 438 10.7.2 Mdia dos Autovalores . . . . . . . . . . . . . . . . . . . . . . 440 10.7.3 Grco dos Autovalores . . . . . . . . . . . . . . . . . . . . . 442 10.7.4 Teste de Hiptese de Igualdade dos ltimos Autovalores . . . 443 10.8 Seleo de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 444 10.9 Procedimentos Grcos . . . . . . . . . . . . . . . . . . . . . . . . . 447 10.10Inferncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451 10.10.1 Propriedades Assintticas dos Componentes Principais . . . . 452 10.10.2 Inferncias Sobre Autovalores . . . . . . . . . . . . . . . . . . 454 10.10.3 Inferncias Sobre Autovetores . . . . . . . . . . . . . . . . . . 463 10.10.4 Inferncias Sobre Componentes Principais da Matriz de Correlaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467

10.10.5 Deteco de Outliers . . . . . . . . . . . . . . . . . . . . . . . 468 10.11Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 11 Anlise Fatorial 473

11.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473 11.2 Modelo Fatorial Ortogonal . . . . . . . . . . . . . . . . . . . . . . . . 474 11.3 Modelo Fatorial Oblquo . . . . . . . . . . . . . . . . . . . . . . . . . 480 11.4 Estimao dos Parmetros do Modelo Fatorial Ortogonal . . . . . . . 481 11.4.1 Mtodo dos Componentes Principais . . . . . . . . . . . . . . 482 11.4.2 Mtodo Fatores Principais . . . . . . . . . . . . . . . . . . . . 493 11.4.3 Mtodo Iterativo dos Fatores Principais . . . . . . . . . . . . 501 11.4.4 Mtodo da Mxima Verossimilhana . . . . . . . . . . . . . . 505 11.4.5 Mtodo dos Fatores Cannicos . . . . . . . . . . . . . . . . . 516 11.5 Rotao Fatorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519 11.6 Teste da Falta de Ajuste do Modelo Fatorial . . . . . . . . . . . . . . 523 11.7 Escores Fatoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 11.7.1 Preditores de Mnimos Quadrados Ponderado . . . . . . . . . 526 11.7.2 Preditor de Regresso . . . . . . . . . . . . . . . . . . . . . . 528 11.7.3 Comparao dos Preditores dos Escores Fatoriais . . . . . . . 529 11.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 530 12 Anlise de Correlao Cannica 531

12.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 531 12.2 Variveis Cannicas e Correlao Cannica Populacional . . . . . . . 532 12.3 Correlao Cannica Populacional de Variveis Padronizadas . . . . 541 12.4 Variveis Cannicas e Correlao Cannica Amostrais . . . . . . . . 546 12.5 Qualidade da Anlise de Variveis Cannicas . . . . . . . . . . . . . 556 12.6 Inferncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563 12.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 569 13 Anlise Discriminante 571

13.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571 13.2 Regras de Classicao . . . . . . . . . . . . . . . . . . . . . . . . . . 572 13.3 Classicao em Uma de Duas Populaes Normais . . . . . . . . . . 579 13.3.1 Classicao em Duas Populaes Normais Com Covarincias Heterogneas . . . . . . . . . . . . . . . . . . . . . . . . . . . 584

13.3.2 Avaliao das Regras de Classicao Para Duas Populaes Normais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585 13.3.3 Funo Discriminante de Fisher Para Duas Populaes . . . . 602 13.4 Classicao em Mais de Duas Populaes Normais . . . . . . . . . . 608 13.4.1 Funo Discriminante de Fisher Considerando Duas ou Mais Populaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613 13.4.2 Avaliao das Regras de Classicao Para Mais de Duas Populaes Normais . . . . . . . . . . . . . . . . . . . . . . . . . 621 13.5 Anlise Discriminante e de Agrupamento . . . . . . . . . . . . . . . . 622 13.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623 Referncias Bibliogrcas Apndices: Tabelas Estatsticas ndice Remissivo 625 635 651

Você também pode gostar