Você está na página 1de 4

TRABALHO 3: ANOVA e REGRESSO: 30 (TRINTA) PONTOS: PARA 17/10/2011 CASOS COMPARANDO MDIAS DE TRS OU MAIS GRUPOS Estudo de Caso

1 WENTWORTH MEDICAL CENTER


Como parte de um estudo a longo prazo de indivduos de 65 anos ou mais, socilogos e mdicos do Wentworth Medical Center, no estado de Nova York, realizaram um estudo para investigar a relao entre depresso e a localizao geogrfica. Uma amostra de 60 indivduos, todos com sade razoavelmente boa, foi selecionada: 20 indivduos eram residentes na Flrida, 20 eram residentes em Nova York e 20 eram residentes na Carolina do Norte. Para cada um dos indivduos foi dado um teste padronizado para medir a depresso. Os dados obtidos so apresentados abaixo: pontuaes de teste maiores indicam maiores nveis de depresso. Esses dados esto disponveis no arquivo Medical1.MTW do Minitab. Uma segunda parte do estudo considerou a relao entre localizao geogrfica e a depresso para indivduos de 65 anos ou mais que tiveram alguma doena crnica como artrite, hipertenso e/ou problemas cardacos. Uma amostra de 60 indivduos em tais condies foi identificada. Novamente, 20 indivduos eram residentes na Flrida, 20 em Nova York e 20 na Carolina do Norte. Os nveis de depresso obtidos e armazenados para esse estudo esto no arquivo Medical2.MTW.
Dados do Medical 1 Nova York Carolina do Norte 8 10 11 7 9 3 7 5 8 11 7 8 8 4 4 3 13 7 10 8 6 8 8 7 12 3 8 9 6 8 8 12 5 6 7 3 7 8 8 11 Dados do Medical 2 Nova York Carolina do Norte 14 10 9 12 15 15 12 18 16 12 24 14 18 17 14 8 15 14 17 16 20 18 11 17 23 19 19 15 17 13 14 14 9 11 14 12 13 13 11 11

Flrida 3 7 7 3 8 8 8 5 5 2 6 2 6 6 9 7 5 4 7 3

Flrida 13 12 17 17 20 21 16 14 13 17 12 9 12 15 16 15 13 10 11 17

Relatrio gerencial 1. Use a estatstica descritiva para resumir os dados dos dois estudos 1. Quais so suas
observaes preliminares sobre os nveis de depresso?

2. Use anlise de varincia (ANOVA) em ambos os conjuntos de dados. Enuncie a hiptese que
est sendo testada em cada caso. Quais so as suas concluses? 3. Supondo que, apesar de pequenas, as amostras analisadas so representativas, que concluses podem ser tiradas sobre a relao entre depresso e localizao geogrfica? 4. Discuta extenses desse estudo e outras anlises que voc acredita que poderiam ser de grande auxlio.
1

No Minitab 14, estatsticas descritivas podem ser obtidas pelos comandos Display Descriptive Statistics e Graphical Summary do comando Basic Statistics do menu Stat.

Ajuda ANLISE DE VARINCIA (ANOVA) DE UM FATOR NO MINITAB 14 No Minitab 14, Anova de um fator pode ser feita com dados empilhados (numa nica coluna) ou no empilhados (unstacked), em colunas separadas. No caso de dados empilhados, o fator ou tratamento experimental indicado numa outra varivel, alm da coluna em que esto os dados da varivel-resposta, de modo que os dados das amostras ficam empilhados em duas colunas, uma com dados do fator e outra com dados correspondentes da varivelresposta. No caso de dados no empilhados, os dados da varivel-resposta correspondentes a cada fator (ou tratamento experimental) so apresentados em colunas separadas (por exemplo, veja os dados no empilhados das amostras do caso do Wentworth Medical Center). A propsito, se esses mesmos dados estivessem empilhados, teramos duas colunas uma com o cdigo da cidade e outra com o dado da medida de depresso de cada indivduo. Assim, no caso da amostra Medical 1, por exemplo, teramos duas colunas com 60 dados dos indivduos amostrados (cdigos das cidades e medidas de depresso correspondentes) em vez de trs colunas com 20 dados de medidas de depresso, correspondentes s trs cidades. Na Anova de um fator, apenas uma varivel ou condio experimental controlada, tal como no caso do Wentworth Medical Center em que o fator a localizao, para verificar seu efeito ou relao com a varivel-resposta de interesse (no exemplo citado, a depresso). No Minitab 14, ANOVA pode ser feita atravs de seqncia de comandos do menu ANOVA do menu Stat. Por exemplo, para fazer uma ANOVA de um fator com dados no empilhados: seqncia Stat > ANOVA > One-Way (Unstacked).... ANOVA DE UM FATOR Procedimento: 1) Entrada de dados: - Insira os dados da varivel-resposta em colunas correspondentes aos diversos tratamentos (unstacked) ou em duas colunas (cdigo do tratamento e varivelresposta) para cada indivduo observado. 2) Teste global de igualdade das mdias: 1. Selecione o menu Stat. 2. Selecione o menu ANOVA. 3. Selecione One-Way (se os dados estiverem empilhados) ou One-Way Unstacked. 4. Informe em quais colunas esto os dados: - No caso de dados empilhados: informe Response (coluna com a varivel-resposta) e Factor (coluna com fator de tratamento ou observao). - No caso de dados no empilhados, informe Response (in separate columns), ou seja, as colunas com os dados no empilhados. 4. Na caixa Confidence, indique o nvel de confiabilidade. 5. Clique Ok, Interpretao do resultado: se o valor-p da estatstica F calculada for menor do que a significncia adotada, rejeite Ho (rejeite a hiptese de que as mdias so todas iguais), em favor da hiptese alternativa. Caso contrrio, apie Ho.

3) (SE HO FOI REJEITADA NO TESTE GLOBAL) Comparao de mdias: 1. Repita o comando ANOVA anterior. 2. Antes de clicar Ok, aciona a caixa Comparisons. 3. Selecione a caixa correspondente ao teste post hoc escolhido, por exemplo, Fisher (LSD). Interpretao do resultado: So feitas comparaes de dois em dois grupos, adotando-se cada um como referncia. Quando um grupo usado como referncia, as mdias dos demais so subtradas dele. Deve-se ento verificar se o zero est includo no intervalo das diferenas. Se o zero no estiver includo, a diferena de mdias dos dois grupos comparados estatisticamente significativa. Exerccios para fazer com o Minitab 14 1) Para testar se o tempo mdio necessrio para misturar um lote de material o mesmo para mquinas produzidas por trs fabricantes distintos, a Jacobs Chemical Company obteve os dados a seguir sobre o tempo (em minutos) para misturar o material. Use esses dados para testar se os tempos mdios da populao para misturar um lote de material so diferentes para os trs fabricantes. Use = 0,05. Tempos para misturar um lote de material Fabricante 1 20 26 24 22 Fabricante 2 28 26 31 27 Fabricante 3 20 19 23 22

2) O gerente da empresa Zen quer determinar se um dos tipos de escala de trabalho para os empregados tem efeito sobre sua produtividade. Ele selecionou aleatoriamente 15 empregados da empresa e os atribuiu aleatoriamente a cada uma das 3 escalas de trabalho propostas. A tabela abaixo mostra a quantidade de unidades produzidas por empregado sob as escalas de trabalho. Quais so suas concluses? Escalas de trabalho (Tratamentos) Escala 1 50 60 70 40 45 Escala 2 60 65 66 54 57 Escala 3 70 75 55 40 55

Exerccio: Regresso linear Mltipla


1. Uma empresa que vende pela Internet componentes de computadores pessoais, software e hardware possui um depsito geral para a distribuio dos produtos. Atualmente, a administrao est examinando o processo de distribuio desse depsito e est interessada em estudar os fatores que afetam os custos de distribuio do depsito. Atualmente um pequeno encargo de manipulao se adiciona ao pedido, independentemente da quantidade pedida. Foram coletados dados correspondentes a 24 meses relativos aos custos de distribuio de depsito, vendas e nmero de pedidos. Esses dados so mostrados na tabela seguinte: Y: Custo de distribuio (em milhares de dlares); X1: Vendas (em milhares de dlares) e X2: Nmero de pedidos. Ms 1 2 3 4 5 6 7 8 9 10 11 12 Y 52,95 71,66 85,56 63,69 72,81 68,44 52,46 70,77 82,03 74,39 70,84 54,08 X1 386 446 512 401 457 458 301 484 517 503 535 553 X2 4015 3806 5309 4262 4296 4097 3213 4809 5237 4732 4413 2921 Ms 13 14 15 16 17 18 19 20 21 22 23 24 Y 62,98 72,30 58,99 79,38 94,44 59,74 90,50 93,24 69,33 53,71 98,18 66,80 X1 372 328 408 491 527 444 623 596 463 389 547 415 X2 3977 4428 3964 4582 5582 3450 5079 5735 4269 3708 5387 4161

a) Ajuste os dados a um modelo de regresso com duas variveis regressoras e interprete as


estimativas dos parmetros do modelo. b) Estime o custo de distribuio do depsito mensal da empresa quando as vendas so $ 400.000 dlares e o nmero de pedidos de 4.500. c) Calcule e interprete o coeficiente de determinao e o coeficiente de determinao ajustado. d) Verifique estatisticamente se existe uma relao significativa entre o custo de distribuio e as variveis regressoras ou explicativas (vendas e nmero de pedidos), ao nvel de significncia de 5%. e) Ache e interprete um intervalo de 95% de confiana para os parmetros do modelo de regresso. f) Determine se cada uma das variveis explicativas contribuiu significativamente no modelo de regresso. Use =0,05. Baseando-se nos resultados, indique o modelo de regresso que deveria ser utilizado no problema. g) Supondo que as duas variveis explicativas so significativas no modelo, qual delas mais importante? Justifique. h) Determine e interprete um intervalo de 99% para o custo mdio de distribuio mensal quando as vendas so de $410.000 dlares e os nmeros de pedidos so de 4.250. i) Pode-se concluir que o custo mdio de distribuio mensal diferente de $425.000 dlares, se nesse ms a venda foi de $420.000 dlares e o nmero de pedidos foi de 4.500? j) Determine e interprete um intervalo de 98% de confiana para a o desvio padro do custo de distribuio mensal da empresa quando as vendas so $ 400.000 dlares e o nmero de pedidos 4.500. k) Faa uma anlise residual e verifique se o modelo adequado.

Você também pode gostar