Escolar Documentos
Profissional Documentos
Cultura Documentos
Manual Msexcel 2007
Manual Msexcel 2007
Pg.
Sumrio
1 Introduo ............................................................................................................... 2 Instalao da ferramenta Anlise de Dados .......................................................... 3 Estatstica Descritiva .............................................................................................. 4 Teste t para amostras independentes .................................................................... 5 Teste t para amostras dependentes (pareadas) .................................................... 6 Anlise de Varincia (ANOVA) ............................................................................. 7 ANOVA Fator nico ............................................................................................ 8 Teste de Tukey ......................................................................................................... 9 Bibliografia .............................................................................................................. 03 04 05 09 12 14 15 17 00
Pg.
Figura 01 tela inicial do MS Excel 2007. Uma das funes mais importantes do MS Excel seu suplemento de anlise estatstica (Anlise de Dados). Ao se clicar no menu Dados aparecem novos botes e cones com suas respectivas funes (Veja Figura 02). Aparece tambm a opo Anlise de Dados. Ao se clicar sobre ela aparece um novo menu de funes. No entanto, esta opo no instalada automaticamente.
Pg.
(a) (b) Figura 3 Detalhes do cone correspondente ao antigo menu Arquivo das verses anteriores. 2 A janela Opes do Excel vai abrir (Veja Figura 04). Clique no item Suplementos. Na janela de suplementos que aparece selecione Ferramentas de Anlise-VBA. Em seguida clique no boto Ir... .
Pg.
3 Vai abrir a janela de Suplementos (Veja Figura 05). Selecione o item Ferramentas de Anlise. Clique no boto OK.
Figura 05 Lista de suplementos de anlise e assistentes. Ao clicar no menu Dados vai abrir um novo menu de opes conforme Figura 02. A partir deste momento podem-se digitar as tabelas de valores e executar as funes mais convenientes.
I ESTATSTICA DESCRITIVA
Vamos iniciar com a opo Estatstica Descritiva. Digite os dados que aparecem na Figura 06. Em seguida clique no boto Anlise de Dados, selecione Estatstica Descritiva. Clique em OK.
Pg.
O prximo passo selecionar o conjunto de dados sobre os quais sero calculadas as principais estatsticas. Existem duas formas de fazer esta seleo. 1) a) Clique no boto assinalado na figura 07.
Figura 07 Janela de seleo de dados, controles e opes de sada dos resultados. b) Selecione os dados (inclusive o rtulo, Albumina). Veja a Figura 08. Para voltar para a janela da Figura 07, clique no cone apontado pela flecha vermelha na Figura 08.
Pg.
c) Na janela Estatstica Descritiva selecione Rtulos na Primeira Linha, Nova Planilha e Resumo Estatstico. Clique OK.
Figura 09 - Janela de seleo de dados, controles e opes de sada dos resultados. d) Vai abrir uma nova planilha com as principais estatsticas. Veja Figura 10.
Pg.
A Figura 11 apresenta duas funes estatsticas do Excel. As estatsticas de Tendncia Central, o quartil e o percentil. Se voc quer calcular o quartil 1, por exemplo, voc digita o smbolo de igual (=), escreve a palavra QUARTIL, abre parnteses, seleciona a coluna de dados, digita o ponto e vrgula (;) e digita o nmero um (1), j que o quartil 1. Poderia ser tambm o 2 (correspondente mediana) e o 3. J a sintaxe do percentil praticamente a mesma, no entanto, para calcular o percentil 25 (correspondente ao quartil 1), voc deve escrever 0,25 e no 25. Veja os exemplos na Figura 11.
Pg.
Figura 12 Dados referentes a perda de peso de dois grupos submetidos dietas diferentes.
Fonte: VIEIRA, S. Introduo Bioestatstica. 3 Ed. Editora Campus. Rio de Janeiro: 1980.
A Figura 13 apresenta a seqncia de caminhos para escolher a ferramenta Teste-t: duas amostras (independentes) presumindo varincias equivalentes (isso inicialmente, pois pode ser necessrio escolher Teste-t: duas amostras (independentes) presumindo varincias diferentes. Veja o ltimo pargrafo desta sesso).
Pg.
10
Para selecionar os dados, clique no interior da caixa de dados, conforme indicao da Figura 14. Quando aparecer o cursor dentro da caixa, selecione na planilha os dados correspondentes a Dieta 1. Em seguida clique na caixa de dados da varivel 2 e repita a seleo com os dados da Dieta 2.
Figura 14 Janela de seleo de dados e opes para o teste-t para duas amostras presumindo varincias equivalentes. Aps a seleo dos dados determine para a hiptese da diferena de mdia o valor zero (0), uma vez que na verdade queremos saber se existe diferena, em mdia, entre as variveis (Ho:1=2 e H1:12). Assinale Rtulos se voc selecionou o cabealho dos dados. Defina o valor da alfa. Como default 0,05 (5%). Veja a Figura 15. Aps preencher todos os campos, clique em OK.
Figura 15 Janela de seleo de dados e opes para o teste-t para duas amostras presumindo varincias equivalentes totalmente preenchidas.
Pg.
11
A Figura 16 mostra a sada dos resultados do teste. Para saber se existe diferena estatisticamente significativa observe a clula com fundo amarelo, correspondente ao valor-p. Se o valor-p for menor que 0,05 (5%), conclui-se que existe diferena estatisticamente significativa. Portanto, observando os resultados, conclui-se que os resultados das dietas so diferentes ao nvel de significncia de 5%. Podese concluir que em mdia, a Dieta 2 mais eficaz que a Dieta 1.
Figura 16 Planilha com a sada dos dados do teste-t. Outra forma de concluir sobre o teste-t observar o valor do t crtico (tabelado), no caso 2,13145, correspondente ao valor bicaudal tabelado de 5% de significncia e 15 graus de liberdade (gl = n-2 = (10 + 7)-2). Se o valor calculado (Stat t) estiver na regio de rejeio, conclui-se que existe diferena estatisticamente significativa, em mdia, entre as variveis. A Figura 17 mostra o grfico da distribuio t com as regies de rejeio e aceitao. Para o caso do exemplo, o valor da estatstica t calculada est na regio de rejeio da hiptese nula (H0), que a hiptese da igualdade. Portanto, em mdia, os valores das dietas 1 e 2 so diferentes.
Figura 17 Grfico da distribuio t de probabilidade. As regies amarelas so consideradas regies de rejeio da igualdade, em mdia, dos valores de duas variveis estudadas. importante observar os valores das varincias. Se o quociente (resultado da diviso) da maior varincia pela menor varincia for igual ou maior que 4 voc deve optar, conforme descrito anteriormente pelo Teste-t: duas amostras (independentes) presumindo varincias diferentes. O restante do processo totalmente igual ao descrito nesta sesso II.
Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim
Pg.
12
Figura 18 Tabela de dados e seqncia de escolhas na planilha. Daqui para frente os procedimentos so totalmente iguais ao que foi descrito, na parte correspondente, na sesso II. Veja a seqncia de figuras de 19 e 20.
Pg.
13
Figura 19 Janela de seleo de dados e opes para o teste-t para duas amostras pareadas para mdias, totalmente preenchidas.
Figura 20 Planilha com a sada dos dados do teste-t pareado. Pode-se concluir que em mdia, no h diferena estatisticamente significativa no peso, ao nvel de significncia de 5%, antes e depois da dieta (p=0,08).
Pg.
14
IV ANLISE DE VARINCIA
Nas sesses II e III vimos como comparar mdias de duas populaes com base em amostras dessas populaes. Muitas vezes preciso comparar mdias de mais do que duas populaes. Por exemplo: comparar se pessoas de classes de renda diferentes (alta, mdia e baixa) tm, em mdia, o mesmo peso corporal, ou ainda testar 4 drogas diferentes em quatro grupos para saber qual ou quais delas atua mais rapidamente, entre outras. Se a varivel em estudo tem distribuio normal ou aproximadamente normal, utiliza-se o teste F para comparar mais de duas amostras. Quais so as causa da variao? Uma causa possvel est relacionada com ao fato das amostras virem de populaes diferentes e outra causa o acaso, porque mesmo dados provenientes de uma mesma populao tem variao. O teste F feito atravs de uma anlise de varincia, que separa a variabilidade devido aos tratamentos (amostras diferentes) da variabilidade residual (devido ao acaso) A Tabela 1 apresenta a notao para a anlise de varincia de fator nico. Tratamento 1 2 3 X11 X21 X31 X12 X22 X32 . . . . . . . . . X1r X2r X3r T1 T2 T3 r r r X1 X2 X3 ... k Xk1 Xk2 . . . Xkr Tk r Xk Total
T=X n=kr
A Tabela 2 apresenta a tabela de anlise de varincia. Tabela 2 Causas da Variao Tratamentos Resduo Total GL k1 n-k n-1 SQ QM p-value F
Para maiores esclarecimentos sobre o teste ANOVA consulte VIEIRA, 1980 e Callegari_Jacques, 2003. O MSExcel pode realizar testes ANOVA de trs tipos: ANOVA: fator nico; ANOVA: fator duplo com repetio e ANOVA: fator duplo sem repetio.
Pg.
15
Digite os dados conforme a Figura 21. Clique na aba Dados, na seqncia no boto Anlise de Dados. Na janela Anlise de Dados selecione ANOVA, fator nico e clique em OK.
Figura 21 A Figura 22 mostra a janela de seleo de dados e parmetro para o teste ANOVA. Observe os dados selecionados, o nvel de significncia de 5% (0,05). Clique em OK.
Pg.
16
Figura 22 A Figura 23 apresenta um resumo estatstico dos trs grupos e a Tabela ANOVA. Para verificar se os grupos em mdia so diferentes, podem ser observados dois fatos, na verdade um ou o outro, ou ambos: a) Observe o valor-p. Se ele for menor que o nvel de significncia, neste caso 0,05, conclui-se que existem diferenas estatisticamente significativas entre os grupos. Neste exemplo, como o valor-p = 0,02 e o nvel de significncia 0,05, conclui-se que existem diferenas entre os grupos; b) Observe os valores F e Fcrtico. Se F > Fcrtico, rejeita-se a hiptese da igualdade e conclui-se que existem diferenas, na mdia, entre os grupos.
Figura 23
Pg.
17
mdias dos grupos 1 (2,00) e 2 (1,67), possvel dizer que so diferentes? Olhando rapidamente para os dados (mdias) podemos concluir com bastante confiana que os grupos 1 e 2 e 2 e 3 so diferentes. No entanto, no podemos ter esta certeza em relao aos grupos 1 e 3. De qualquer forma, mesmo que nosso senso tenha praticamente certeza na existncia de diferenas, necessrio que se aplique um teste. S assim o trabalho estar amparado pelo rigor do mtodo estatstico (cientfico). Para descobrir quais pares so diferentes possvel aplicar o teste de Tukey. O MSExcel no faz o teste de Tukey. necessrio faz-lo manualmente. Para isso o livro VIEIRA, 1980 muito bom. Para isso, inicialmente necessrio estabelecer a diferena mnima significante, ou seja, a menor diferena de mdias de amostras que deve ser tomada como estatisticamente significante, em determinado nvel (VIEIRA, 1980). Essa diferena (d.m.s) dada por:
d .m.s. = q
QMR r
(01)
onde q um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de varincia (na Figura 23 corresponde ao 2,66667 coluna MQ linha Dentro dos grupos) e r o nmero de repeties de cada tratamento (desde que todos os tratamentos tenham o mesmo nmero de registros). Caso contrrio a frmula ser outra (Ver tambm VIEIRA, 1980). A tabela de q est em apndice (para nvel de significncia de 5%). Para entender o uso da tabela simples. Na primeira linha voc deve selecionar a coluna correspondente ao nmero de tratamentos (colunas de dados). Na primeira coluna ( N de graus de liberdade do resduo) voc deve selecionar a linha correspondente ao nmero de observaes (N de tratamentos X r) menos o N de tratamentos. Por exemplo: 4 tratamentos com 5 registros cada igual a 20. Menos o nmero de tratamentos igual a 16. Portanto, o nmero de graus de liberdade 16. Vejamos um exemplo:
As informaes contidas na Figura 25, relativas a ANOVA, fator nico, mostram que existe diferena estatisticamente significante entre as amostras, em mdia (p < 0,05). O prximo passo, para saber quais amostras so diferentes e quais no apresentam diferena calcular o DMS (Equao 01). O valor de q tabelado correspondente a 4 tratamentos e 16 graus de liberdade (clula vermelha da Figura 25) 4,05. QMR vale 4,25 (clula azul da Figura 25). O valor de r 5 (clula verde da Figura 25). d .m.s. = q QMR r 4,25 = 3,73 5
d .m.s. = 4,05
Pg.
18
De acordo com o teste de Tukey, duas mdias so estatisticamente diferentes toda vez que o valor absoluto da diferena entre elas for igual ou superior ao valor de d.m.s. Portanto, o prximo passo calcular as diferenas entre as mdias dos pares de amostras.
Como pode ser observado na Tabela 04, apenas as amostras A e D so estatisticamente diferentes, em mdia, pois o valor da diferena maior que o d.m.s.
Tabela 04 Valores absolutos das diferenas entre as mdias dos tratamentos A, B, C e D.
Pares de mdias AeB AeC AeD BeC BeD CeD Valor absoluto da diferena 8-5=3 8-5=3 8-2=6 5-5=0 5-2=3 5-2=3
BIBLIOGRAFIA
VIEIRA, S. Introduo Bioestatstica. 3 Ed. Editora Campus. Rio de Janeiro: 1980. CALLEGARI_JACQUES, S.M. Bioestatstica: Princpios e Aplicaes. Ed. Artmed, Porto Alegre: 2003.