Você está na página 1de 18

ANLISE DE DADOS ESTATSTICOS COM O MICROSOFT OFFICE EXCEL 2007

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

Professor Claodomir Antonio Martinazzo

Sumrio
1 Introduo ............................................................................................................... 2 Instalao da ferramenta Anlise de Dados .......................................................... 3 Estatstica Descritiva .............................................................................................. 4 Teste t para amostras independentes .................................................................... 5 Teste t para amostras dependentes (pareadas) .................................................... 6 Anlise de Varincia (ANOVA) ............................................................................. 7 ANOVA Fator nico ............................................................................................ 8 Teste de Tukey ......................................................................................................... 9 Bibliografia .............................................................................................................. 03 04 05 09 12 14 15 17 00

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

ANLISE DE DADOS ESTATSTICOS COM O MICROSOFT Excel 2007


O novo pacote Microsoft Office 2007 traz muitas novidades. A maioria das pessoas sente dificuldades em encontrar as funes e comandos antes mais intuitivos em todos os componentes. Mas tudo uma questo de acostumar-se. A Figura -01 mostra a nova tela do novo Microsoft Excel (MS Excel) 2007.

Figura 01 tela inicial do MS Excel 2007. Uma das funes mais importantes do MS Excel seu suplemento de anlise estatstica (Anlise de Dados). Ao se clicar no menu Dados aparecem novos botes e cones com suas respectivas funes (Veja Figura 02). Aparece tambm a opo Anlise de Dados. Ao se clicar sobre ela aparece um novo menu de funes. No entanto, esta opo no instalada automaticamente.

Figura 02 Opo de Anlise de Dados no Menu Dados.


Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

INSTALAO DA FERRAMENTA ANLISE DE DADOS


Para instalar esse suplemento siga os seguintes passos: 1 Clique no cone redondo no canto superior esquerdo (Figura 3.a) da tela do MS Excel. Vai abrir um novo menu de opes conforme Figura 3.b. Nessa janela, clique no boto Opes do Excel.

(a) (b) Figura 3 Detalhes do cone correspondente ao antigo menu Arquivo das verses anteriores. 2 A janela Opes do Excel vai abrir (Veja Figura 04). Clique no item Suplementos. Na janela de suplementos que aparece selecione Ferramentas de Anlise-VBA. Em seguida clique no boto Ir... .

Figura 04 Janela Opes do MS Excel 2007.


Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

3 Vai abrir a janela de Suplementos (Veja Figura 05). Selecione o item Ferramentas de Anlise. Clique no boto OK.

Figura 05 Lista de suplementos de anlise e assistentes. Ao clicar no menu Dados vai abrir um novo menu de opes conforme Figura 02. A partir deste momento podem-se digitar as tabelas de valores e executar as funes mais convenientes.

I ESTATSTICA DESCRITIVA
Vamos iniciar com a opo Estatstica Descritiva. Digite os dados que aparecem na Figura 06. Em seguida clique no boto Anlise de Dados, selecione Estatstica Descritiva. Clique em OK.

Figura 06 Janela de opes de Anlise de Dados.


Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

O prximo passo selecionar o conjunto de dados sobre os quais sero calculadas as principais estatsticas. Existem duas formas de fazer esta seleo. 1) a) Clique no boto assinalado na figura 07.

Figura 07 Janela de seleo de dados, controles e opes de sada dos resultados. b) Selecione os dados (inclusive o rtulo, Albumina). Veja a Figura 08. Para voltar para a janela da Figura 07, clique no cone apontado pela flecha vermelha na Figura 08.

Figura 08 Tela de seleo de dados.


Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

c) Na janela Estatstica Descritiva selecione Rtulos na Primeira Linha, Nova Planilha e Resumo Estatstico. Clique OK.

Figura 09 - Janela de seleo de dados, controles e opes de sada dos resultados. d) Vai abrir uma nova planilha com as principais estatsticas. Veja Figura 10.

Figura 10 Lista de estatsticas calculadas pela ferramenta Estatstica Descritiva.

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

A Figura 11 apresenta duas funes estatsticas do Excel. As estatsticas de Tendncia Central, o quartil e o percentil. Se voc quer calcular o quartil 1, por exemplo, voc digita o smbolo de igual (=), escreve a palavra QUARTIL, abre parnteses, seleciona a coluna de dados, digita o ponto e vrgula (;) e digita o nmero um (1), j que o quartil 1. Poderia ser tambm o 2 (correspondente mediana) e o 3. J a sintaxe do percentil praticamente a mesma, no entanto, para calcular o percentil 25 (correspondente ao quartil 1), voc deve escrever 0,25 e no 25. Veja os exemplos na Figura 11.

Figura 11 Comando para calcular o quartil e o percentil.


Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

II TESTE t PARA AMOSTRAS INDEPENDENTES


Este teste aplicado se a varivel em anlise tem distribuio normal ou aproximadamente normal. Com este teste deseja-se saber se as duas amostras, em mdia, tm a mesma mdia. Inicialmente necessrio estabelecer o nvel de significncia, que se indica pela letra grega alfa (). Normalmente utiliza-se 5% para o nvel de significncia. A Figura 12 apresenta um exemplo em que dois grupos de pessoas seguiram dietas especiais e diferentes para perder peso. Deseja-se saber se existe, em mdia, diferena estatisticamente significativa entre as duas dietas, a partir das perdas de peso dos dois grupos.

Figura 12 Dados referentes a perda de peso de dois grupos submetidos dietas diferentes.
Fonte: VIEIRA, S. Introduo Bioestatstica. 3 Ed. Editora Campus. Rio de Janeiro: 1980.

A Figura 13 apresenta a seqncia de caminhos para escolher a ferramenta Teste-t: duas amostras (independentes) presumindo varincias equivalentes (isso inicialmente, pois pode ser necessrio escolher Teste-t: duas amostras (independentes) presumindo varincias diferentes. Veja o ltimo pargrafo desta sesso).

Figura 13 Janela para escolha da ferramenta de teste.


Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

10

Para selecionar os dados, clique no interior da caixa de dados, conforme indicao da Figura 14. Quando aparecer o cursor dentro da caixa, selecione na planilha os dados correspondentes a Dieta 1. Em seguida clique na caixa de dados da varivel 2 e repita a seleo com os dados da Dieta 2.

Figura 14 Janela de seleo de dados e opes para o teste-t para duas amostras presumindo varincias equivalentes. Aps a seleo dos dados determine para a hiptese da diferena de mdia o valor zero (0), uma vez que na verdade queremos saber se existe diferena, em mdia, entre as variveis (Ho:1=2 e H1:12). Assinale Rtulos se voc selecionou o cabealho dos dados. Defina o valor da alfa. Como default 0,05 (5%). Veja a Figura 15. Aps preencher todos os campos, clique em OK.

Figura 15 Janela de seleo de dados e opes para o teste-t para duas amostras presumindo varincias equivalentes totalmente preenchidas.

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

11

A Figura 16 mostra a sada dos resultados do teste. Para saber se existe diferena estatisticamente significativa observe a clula com fundo amarelo, correspondente ao valor-p. Se o valor-p for menor que 0,05 (5%), conclui-se que existe diferena estatisticamente significativa. Portanto, observando os resultados, conclui-se que os resultados das dietas so diferentes ao nvel de significncia de 5%. Podese concluir que em mdia, a Dieta 2 mais eficaz que a Dieta 1.

Figura 16 Planilha com a sada dos dados do teste-t. Outra forma de concluir sobre o teste-t observar o valor do t crtico (tabelado), no caso 2,13145, correspondente ao valor bicaudal tabelado de 5% de significncia e 15 graus de liberdade (gl = n-2 = (10 + 7)-2). Se o valor calculado (Stat t) estiver na regio de rejeio, conclui-se que existe diferena estatisticamente significativa, em mdia, entre as variveis. A Figura 17 mostra o grfico da distribuio t com as regies de rejeio e aceitao. Para o caso do exemplo, o valor da estatstica t calculada est na regio de rejeio da hiptese nula (H0), que a hiptese da igualdade. Portanto, em mdia, os valores das dietas 1 e 2 so diferentes.

Figura 17 Grfico da distribuio t de probabilidade. As regies amarelas so consideradas regies de rejeio da igualdade, em mdia, dos valores de duas variveis estudadas. importante observar os valores das varincias. Se o quociente (resultado da diviso) da maior varincia pela menor varincia for igual ou maior que 4 voc deve optar, conforme descrito anteriormente pelo Teste-t: duas amostras (independentes) presumindo varincias diferentes. O restante do processo totalmente igual ao descrito nesta sesso II.
Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

12

III TESTE t PARA AMOSTRAS DEPENDENTES (PAREADAS)


Segundo Vieira, 1980, muitas vezes comparam-se pares de indivduos. Como pares de indivduos podem-se utilizar dois gmeos, sendo um controle e o outro que recebe um tratamento. Pode ser uma mesma pessoa em que metade dos seus dentes recebe um tratamento anti-crie e a outra metade no (controle) ou o que mais comum, em uma mesma pessoa fez-se uma determinada avaliao antes e outra depois de um determinado tratamento. Novamente necessrio determinar o nvel de significncia, normalmente 5%. A Figura 18 mostra a tabela de dados (Vieira, 2008) que sero analisados. Quer se saber se a Dieta aplicada a estas 9 pessoas, em mdia, surtiu efeito, ou seja, se o peso mdio Depois diferente do peso mdio Antes. Clique na aba Dados, no boto Anlise de Dados e selecione Teste T: duas amostras em par para mdias. Clique em OK.

Figura 18 Tabela de dados e seqncia de escolhas na planilha. Daqui para frente os procedimentos so totalmente iguais ao que foi descrito, na parte correspondente, na sesso II. Veja a seqncia de figuras de 19 e 20.

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

13

Figura 19 Janela de seleo de dados e opes para o teste-t para duas amostras pareadas para mdias, totalmente preenchidas.

Figura 20 Planilha com a sada dos dados do teste-t pareado. Pode-se concluir que em mdia, no h diferena estatisticamente significativa no peso, ao nvel de significncia de 5%, antes e depois da dieta (p=0,08).

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

14

IV ANLISE DE VARINCIA
Nas sesses II e III vimos como comparar mdias de duas populaes com base em amostras dessas populaes. Muitas vezes preciso comparar mdias de mais do que duas populaes. Por exemplo: comparar se pessoas de classes de renda diferentes (alta, mdia e baixa) tm, em mdia, o mesmo peso corporal, ou ainda testar 4 drogas diferentes em quatro grupos para saber qual ou quais delas atua mais rapidamente, entre outras. Se a varivel em estudo tem distribuio normal ou aproximadamente normal, utiliza-se o teste F para comparar mais de duas amostras. Quais so as causa da variao? Uma causa possvel est relacionada com ao fato das amostras virem de populaes diferentes e outra causa o acaso, porque mesmo dados provenientes de uma mesma populao tem variao. O teste F feito atravs de uma anlise de varincia, que separa a variabilidade devido aos tratamentos (amostras diferentes) da variabilidade residual (devido ao acaso) A Tabela 1 apresenta a notao para a anlise de varincia de fator nico. Tratamento 1 2 3 X11 X21 X31 X12 X22 X32 . . . . . . . . . X1r X2r X3r T1 T2 T3 r r r X1 X2 X3 ... k Xk1 Xk2 . . . Xkr Tk r Xk Total

Total Nmero de Repeties Mdia

T=X n=kr

A Tabela 2 apresenta a tabela de anlise de varincia. Tabela 2 Causas da Variao Tratamentos Resduo Total GL k1 n-k n-1 SQ QM p-value F

Para maiores esclarecimentos sobre o teste ANOVA consulte VIEIRA, 1980 e Callegari_Jacques, 2003. O MSExcel pode realizar testes ANOVA de trs tipos: ANOVA: fator nico; ANOVA: fator duplo com repetio e ANOVA: fator duplo sem repetio.

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

15

IV. A ANOVA: fator nico


Segundo Callegari-Jacques, 2003, um dos modelos mais simples de ANOVA o que analisa os dados de um delineamento completamente casualizado ou ANOVA a um critrio de classificao (One Way ANOVA). Neste modelo, a variao global divide-se em: Variao entre os tratamentos (entre grupos no Excel), quando se compara as mdias de cada grupo com a mdia geral de todos os indivduos e Variao dentro de cada grupo (Dentro dos grupos no Excel) onde so comparados os valores de cada indivduo do grupo com a mdia do grupo (Resduo). Portanto, a variao total deve-se a soma da variao entre tratamentos e a variao dentro dos tratamentos. Utilizaremos um exemplo de Callegari_Jacques, 2003, para exemplificar o teste. Deseja-se comparar trs drogas analgsicas para reduzir a dor ps-operatria em pacientes submetidos mesma interveno cirrgica. As drogas foram distribudas entre os pacientes por um processo aleatrio. Os ndices de dor ps-operatria obtidos nesse experimento (fictcios) esto apresentados na Tabela 03. Tabela 03 Analgsicos 1 2 3 Total 1 5 2 Grau da dor 3 7 0 8 3 Total 4 20 5 29 Nmero de Repeties 2 3 3 8 Mdia 2 6,7 1,7 Desvio padro 1,41 1,52 1,53
Fonte: Callegari-Jacques, 2003.

Digite os dados conforme a Figura 21. Clique na aba Dados, na seqncia no boto Anlise de Dados. Na janela Anlise de Dados selecione ANOVA, fator nico e clique em OK.

Figura 21 A Figura 22 mostra a janela de seleo de dados e parmetro para o teste ANOVA. Observe os dados selecionados, o nvel de significncia de 5% (0,05). Clique em OK.

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

16

Figura 22 A Figura 23 apresenta um resumo estatstico dos trs grupos e a Tabela ANOVA. Para verificar se os grupos em mdia so diferentes, podem ser observados dois fatos, na verdade um ou o outro, ou ambos: a) Observe o valor-p. Se ele for menor que o nvel de significncia, neste caso 0,05, conclui-se que existem diferenas estatisticamente significativas entre os grupos. Neste exemplo, como o valor-p = 0,02 e o nvel de significncia 0,05, conclui-se que existem diferenas entre os grupos; b) Observe os valores F e Fcrtico. Se F > Fcrtico, rejeita-se a hiptese da igualdade e conclui-se que existem diferenas, na mdia, entre os grupos.

Figura 23

IV. B ANOVA: fator nico Teste de Tukey


Na verdade o teste ANOVA mostra apenas que existem diferenas entre as mdias, mas no nos informa se todas as mdias so diferentes entre si, ou quais so diferentes. Por exemplo, se voc olhar as
Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

17

mdias dos grupos 1 (2,00) e 2 (1,67), possvel dizer que so diferentes? Olhando rapidamente para os dados (mdias) podemos concluir com bastante confiana que os grupos 1 e 2 e 2 e 3 so diferentes. No entanto, no podemos ter esta certeza em relao aos grupos 1 e 3. De qualquer forma, mesmo que nosso senso tenha praticamente certeza na existncia de diferenas, necessrio que se aplique um teste. S assim o trabalho estar amparado pelo rigor do mtodo estatstico (cientfico). Para descobrir quais pares so diferentes possvel aplicar o teste de Tukey. O MSExcel no faz o teste de Tukey. necessrio faz-lo manualmente. Para isso o livro VIEIRA, 1980 muito bom. Para isso, inicialmente necessrio estabelecer a diferena mnima significante, ou seja, a menor diferena de mdias de amostras que deve ser tomada como estatisticamente significante, em determinado nvel (VIEIRA, 1980). Essa diferena (d.m.s) dada por:

d .m.s. = q

QMR r

(01)

onde q um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de varincia (na Figura 23 corresponde ao 2,66667 coluna MQ linha Dentro dos grupos) e r o nmero de repeties de cada tratamento (desde que todos os tratamentos tenham o mesmo nmero de registros). Caso contrrio a frmula ser outra (Ver tambm VIEIRA, 1980). A tabela de q est em apndice (para nvel de significncia de 5%). Para entender o uso da tabela simples. Na primeira linha voc deve selecionar a coluna correspondente ao nmero de tratamentos (colunas de dados). Na primeira coluna ( N de graus de liberdade do resduo) voc deve selecionar a linha correspondente ao nmero de observaes (N de tratamentos X r) menos o N de tratamentos. Por exemplo: 4 tratamentos com 5 registros cada igual a 20. Menos o nmero de tratamentos igual a 16. Portanto, o nmero de graus de liberdade 16. Vejamos um exemplo:

Figura 24 Dados de 4 tratamentos (amostras).

As informaes contidas na Figura 25, relativas a ANOVA, fator nico, mostram que existe diferena estatisticamente significante entre as amostras, em mdia (p < 0,05). O prximo passo, para saber quais amostras so diferentes e quais no apresentam diferena calcular o DMS (Equao 01). O valor de q tabelado correspondente a 4 tratamentos e 16 graus de liberdade (clula vermelha da Figura 25) 4,05. QMR vale 4,25 (clula azul da Figura 25). O valor de r 5 (clula verde da Figura 25). d .m.s. = q QMR r 4,25 = 3,73 5

d .m.s. = 4,05

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Manual MSExcel 2007 Anlise de Dados Testes Paramtricos

Pg.

18

De acordo com o teste de Tukey, duas mdias so estatisticamente diferentes toda vez que o valor absoluto da diferena entre elas for igual ou superior ao valor de d.m.s. Portanto, o prximo passo calcular as diferenas entre as mdias dos pares de amostras.

Figura 25 ANOVA, fator nico para os dados da Figura 24.

Como pode ser observado na Tabela 04, apenas as amostras A e D so estatisticamente diferentes, em mdia, pois o valor da diferena maior que o d.m.s.
Tabela 04 Valores absolutos das diferenas entre as mdias dos tratamentos A, B, C e D.
Pares de mdias AeB AeC AeD BeC BeD CeD Valor absoluto da diferena 8-5=3 8-5=3 8-2=6 5-5=0 5-2=3 5-2=3

BIBLIOGRAFIA
VIEIRA, S. Introduo Bioestatstica. 3 Ed. Editora Campus. Rio de Janeiro: 1980. CALLEGARI_JACQUES, S.M. Bioestatstica: Princpios e Aplicaes. Ed. Artmed, Porto Alegre: 2003.

Prof. Claodomir Antonio Martinazzo URI-Campus de Erechim

Você também pode gostar