Você está na página 1de 36

ANLISE ESTATSTICA DE DADOS

ANLISE DOS DADOS


Prof. M.e Josney Freitas Silva
Sistemas de Informao - UEMG

Referncia
VIEIRA, S. Anlise de Varincia (ANOVA). So Paulo:
Atlas, 2006.

ANLISE DE DADOS
Toda anlise de dados quantitativos deve se
iniciar com o clculo de estatsticas descritivas
como mdias e desvios padres e com
desenho de grficos, que permitem ao
analista ter noo do que a anlise ir revelar.

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

ANLISE DE DADOS
Exemplo:
Para comparar dois mtodos de ensino em
informtica, A e B, um professor dividiu um
conjunto de alunos similares (em relao
capacidade de aprender) em dois grupos.
Depois, ensinou informtica aos alunos de um
grupo com o mtodo A e os do outro grupo com o
mtodo B.
Ao fim do treinamento, submeteu os dois grupos
mesma prova.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

ANLISE DE DADOS
Tabela 1.1 Notas dos alunos segundo o mtodo de ensino em informtica.
MTODO

04/08/2015 08:04

40

Prof. M.e Josney Freitas Silva

56

Estatstica Descritiva - Mdias


As mdias das notas da Tabela 1.1 esto apresentadas na Tabela 1.2 e no
Figura 1.1. fcil perceber que os alunos do mtodo b obtiveram mdias
melhores que os alunos do mtodo A.
Mdias das notas dos alunos segundo
mtodo de ensino

MTODO
A
B

MDIAS
5
7

MDIAS

Tabela 1.2 Mdia das notas dos


alunos segundo o mtodo de
ensino em informtica.

8
7
6
5
4
3
2
1
0
A

B
MTODOS

Figura 1.1 Mdia das notas dos alunos segundo o


mtodo de ensino em informtica.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

Estatstica Descritiva - Mdias


A apresentao das mdias - em tabelas e
grficos permite comparar os mtodos.
No entanto, a comparao fica, em geral, mais
clara, se a diferena for dada em percentual.
Para isso:
Calcule a diferena das mdias;
Divida a diferena das mdias pela mdia do
tratamento escolhido como base de comparao;
Multiplique por 100, para obter o resultado em
porcentagem.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

Estatstica Descritiva - Mdias


A base de comparao a mdia do grupo controle, se
houver, ou a mdia menor.
Por exemplo:
a)

b)

c)

Calcule a diferena das mdias:


7,0 5,0 = 2,0
Divida a diferena das mdias pela mdia do tratamento A
(menor mdia):
2,0
A interpretao direta:
= 0,40
a mdia das notas dos
5,0
alunos do mtodo B foi
Multiplique o resultado por 100:
2,0
40% maior que a mdia
100 = 40%
das notas dos alunos no
5,0
mtodo A.

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

Estatstica Descritiva Desvio Padro


Pode-se querer estudar a variabilidade das notas.
usual calcular ento a varincia e o desvio padro.
a) Varincia:
2

2 =
1
b) Desvio Padro:
=
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

Estatstica Descritiva Desvio Padro


Tabela 1.3 Clculos para
obteno das varincias dos
dados da Tabela 1.1.

MTODO
A
y1
6
5
7
3
5
2
4
8
40

B
y1 2
36
25
49
9
25
4
16
64
228

04/08/2015 08:04

y2
7
9
6
7
6
6
9
6
56

y2 2
49
81
36
49
36
36
81
36
404

a) Varincia do mtodo A:

40
228
8
12 =
7

= 4,00

b) Varincia do mtodo B:

56
404 8
22 =
7

= 1,7143

c) Desvio Padro do mtodo A:

1 =

4,00 = 2,00

d) Desvio Padro do mtodo B:

2 =

1,7143 = 1,31

Prof. M.e Josney Freitas Silva

10

Estatstica Descritiva Desvio Padro


8

Tabela 1.4 Mdias e desvios


padres das notas dos alunos
segundo o mtodo de ensino.

MDIAS

MTODO
A
B

5,00 2,00
7,00 1,31

5
4
3
2

usual apresentar a mdia e o desvio


padro com a indicao ).

0
A

B
MTODOS

A Figura 1.2 mostra os resultados da


Tabela 1.4 em grfico.
As barras representam as mdias. No alto
de cada barra est desenhado um
segmento que representa o desvio padro
(um desvio padro acima da barra e outro
dentro simbolizando ).
04/08/2015 08:04

Figura 1.2 Mdias e desvios padres das notas dos


alunos segundo o mtodo de ensino.

Observando-a Tabela 1.4 e Figura 1.2,


podemos concluir que as notas dos
alunos do mtodo A tem maior
variabilidade do que as notas dos alunos
do mtodo B.

Prof. M.e Josney Freitas Silva

11

Inferncia Estatstica
A mdia e o desvio padro descrevem a amostra. So,
portanto, estatsticas descritivas.
Mas, para quem busca conhecimento cientfico, pouco
importa a informao que alguns indivduos, submetidos
a determinado tratamento (no exemplo, o mtodo B de
ensino de informtica) obtiveram melhores resultados
que outros indivduos submetidos a outro tratamento
(mtodo A).
O que interessa saber se determinado tratamento d
resultado melhor.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

12

Inferncia Estatstica
fato dizer que os alunos submetidos ao mtodo B
obtiveram melhores resultados que os alunos
submetidos ao mtodo A.
O que verdade para uma amostra pode ser
estendido para todos que precisam do treinamento
em informtica?
Ou seja, o que vlido para uma amostra tambm
vlido para a populao?
Isto fazer inferncia!
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

13

Inferncia Estatstica
Inferncia Estatstica o processo que consiste
em utilizar as observaes de uma amostra para
estimar as propriedades da populao.
Para isso, necessrio que o pesquisador adote
um critrio, utilizando um teste estatstico.

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

14

Inferncia Estatstica
Voltando ao exemplo:
O professor ensinou informtica para um grupo de
alunos pelo o mtodo A e outro pelo mtodo B.
A diferena de mdias foi de 2,00 pontos em favor
do mtodo B.
O professor deve, ento, se perguntar: ser que a
diferena de mdias que ocorreu na amostra
suficientemente grande para inferir que, na
populao, as mdias so diferentes?
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

15

Inferncia Estatstica
As notas dos alunos submetidos ao mtodo A e
ao mtodo B variaram.
As causas da variao das notas dos alunos
submetidos ao mesmo mtodo no foram
controladas (ajuda familiar, sade, capacidade
individual de aprender, ansiedade, etc.).
As notas dos alunos submetidos ao mesmo teste
variaram, portanto, ao acaso.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

16

Inferncia Estatstica
Mas o que explica a diferena das mdias dos dois
grupos?
Ser que essa diferena ocorreu por acaso ou porqu o
mtodo B , mesmo, melhor do que o mtodo A?
Para responder a esta pergunta, o estatstico sugere
comparar a variao entre mtodos (comparar A e B) com
a variao dentro de mtodos (variao das notas no
grupo A somada variao das notas no grupo B) e
estabelecer se a variao entre mtodos a maior.
Em outras palavras, o estatstica sugere submeter os
dados a um teste.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

17

Inferncia Estatstica
Quando um pesquisador tem em mos dados
obtidos de um experimento, precisa de um teste
estatstico porque o teste associa inferncia
determinado nvel de significncia ou um pvalor.
Nvel de significncia de um teste a
probabilidade de erro em considerar uma
amostra que no corresponde populao.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

18

Inferncia Estatstica
Os testes estatsticos testam hipteses.
H0: as mdias so iguais (hiptese nula).
H1: as mdias so diferentes (hiptese alternativa).
O nvel de significncia do teste representado pela letra
grega (alfa) e corresponde a probabilidade de rejeitar
H0 quando H0 verdadeira.
A escolha do valor de arbitrria, mas tradicional
usar valores:
=0,05 (5%, resultado significante) ou
=0,01 (1%, resultado altamente significante).
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

19

Comparao de dois grupos


Em seus primrdios, as cincias experimentais
propunham comparar duas situaes.
- Resposta obtida depois de uma interveno
com a resposta obtida antes dessa interveno;
- Resposta do grupo tratado versus a resposta
do controle.

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

20

Comparao de dois grupos


Um teste estatstico proposto no incio do sculo
passado para a comparao de duas mdias o
teste t de Student muito conhecido e usado at
hoje em todas as cincias experimentais.
Este teste pode ser aplicado:
- Quando os grupos so independentes (ou seja,
quando foi feito um experimento inteiramente ao acaso);
- Quando os dados so pareados (ou seja, quando foi

feito um experimento em blocos, cada unidade tomada como


um bloco).

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

21

O teste t na comparao de dois


grupos independentes
Muitos ensaios comparam dois grupos, por
exemplo:
1 o novo tratamento contra o controle negativo;
2 o novo tratamento contra o controle positivo;
3 dois tratamentos conhecidos.
Se os dois tratamentos so sorteados s unidades
experimentais, os ensaios so randmicos, mas
tambm so referidos na literatura como estudos
comparativos de dois grupos independentes.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

22

O teste t na comparao de dois


grupos independentes
O teste t de Student indicado para testar a igualdade de duas mdias quando os
grupos so independentes.
Os passos para realizar o teste t de Student so:
a) Calcule a mdia de cada grupo;
b) Calcule a varincia de cada grupo;
c)
Calcule a varincia ponderada, dada pela frmula:
1 1 12 + 2 1 22
2
=
1 + 2 2
d) Calcule o valor de t, que est associado a 1 + 2 2 graus de liberdade, pela
frmula:
1 2
=
1
1 2
+

e)

Compare o valor calculado de t (em valor absoluto) com o valor crtico de t, ao


nvel de significncia e com os mesmos graus de liberdade.
Se o valor calculado de t (em valor absoluto) for igual ou maior que o valor da tabela, rejeite a
hiptese de que as mdias em comparao so iguais, ao nvel estabelecido de significncia.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

23

O teste t na comparao de dois


grupos independentes
Para realizar o teste t de Student com os dados do exemplo, temos:
a) A mdia de cada grupo: 1 = 5,00 e 2 = 7,00
b) A varincia de cada grupo: 12 = 4,00 e 22 = 1,7143
c) A varincia ponderada:
8 1 4,00 + 8 1 1,7143
2
=
= 2,857
8+82
d) O valor de t, com a 1 + 2 2 = 8 + 8 2 = 14 graus de liberdade :
5,00 7,00
=
= 2,366
1 1
+ 2,857
8 8
e) Para comparar o valor calculado de t (em valor absoluto) com o valor
crtico de t, ao nvel de significncia e com os mesmos graus de liberdade
preciso encontrar o valor crtico de t que tabelado.

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

24

O teste t na comparao de dois


grupos independentes
A tabela 1.5 reproduz parte da Tabela de t.
Tabela 1.5 Valores de t para o nvel de significncia de 0,l05 e para 14 graus de liberdade.

04/08/2015 08:04

Graus de
liberdade

Nvel de significncia
0,01

0,05

0,10

11

3,106

2,201

1,796

12

3,055

2,179

1,782

13

3,012

2,160

1,771

14

2,977

2,145

1,761

15

2,947

2,131

1,753

16

2,921

2,120

1,746

Prof. M.e Josney Freitas Silva

25

O teste t na comparao de dois


grupos independentes
Interpretando o teste t de Student:
- Como o valor calculado de t (em valor absoluto)
maior que o valor crtico de t (2,366>2,154) ao nvel de
5% de significncia, rejeita-se a hiptese de que as
mdias das notas dos alunos so iguais, nesse nvel de
significncia.
- Em termos prticos, o professor pode concluir que as
notas obtidas por alunos submetidos ao mtodo B so,
em mdia, significativamente maiores que as mdias
obtidas por alunos submetidos ao mtodo A (=0,05).
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

26

O teste t na comparao de dois


grupos independentes
Muitos programas de computador fornecem a
probabilidade de o valor de t ser, na
distribuio terica, maior que o valor obtido.
Essa probabilidade conhecida como p-valor
e no o nvel de significncia do teste.
Rejeita-se a hiptese de que as mdias so
iguais toda vez que o p-valor for menor do
que o nvel de significncia considerado.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

27

O teste t na comparao de dois


grupos independentes
No caso do exemplo dado, o p-valor, calculado em
computador, 0,0329.
Como esse valor menor que =0,05, rejeita-se a
hiptese de que as mdias so iguais, nesse nvel de
significncia.
Da mesma forma que anteriormente, o professor pode
concluir que, em mdia, as notas obtidas por alunos
submetidos ao mtodo b so significativamente
maiores que as mdias obtidas por alunos submetidos
ao mtodo A, ao nvel de 0,05.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

28

O teste t nos estudos com


dados pareados
Alguns ensaios utilizam as um unidades como blocos.
Se cada unidade for utilizada duas vezes, voc pode
dizer que foi feito um experimento em blocos, mas a
literatura, classicamente, se refere a este tipo de
delineamento como ensaio com dados pareados.
Por exemplo, um professor que saber se determinado
mtodo de ensino realmente eficaz.
Para isso, ensina esse grupo de alunos por esse
mtodo, mas submete seus alunos a uma prova, tanto
no incio como no final do curso.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

29

O teste t nos estudos com


dados pareados
So dois grupos de dados (antes e depois)
dependentes ou parados (porque cada par de
dados tomado do mesmo indivduo).
Trata-se, portanto, de uma comparao de dois
grupos dependentes.
No caso, o professor quer saber se as diferenas
de notas obtidas antes e depois do curso so, em
mdia, diferentes de zero.
Neste caso, pode-se aplicar o teste t.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

30

O teste t nos estudos com


dados pareados
O teste t nos estudos com dados parados deve seguir os seguintes passos:
a) Calcule as diferenas entre todas as observaes pareadas: = 1 2
b)
c)
d)

Calcule a mdia dessas diferenas: =

Calcule a varincia dessas diferenas: 2 =


1
Calcule o valor de t, que est associado a 1graus de liberdade, pela

frmula: = 2

e)

Compare o valor absoluto do t calculado com o valor crtico dado em


tabela, ao nvel de significncia e com os mesmos graus de liberdade.
Toda vez que o valor absoluto do t calculado for igual ou maior que o valor
crtico dado na tabela, rejeite a hiptese de que as mdias em comparao
so iguais ao nvel considerado de significncia.

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

31

O teste t nos estudos com


dados pareados
Voltando ao exemplo em que o
professor aplicou uma prova no
incio e no final de um curso.
As notas esto apresentadas na
Tabela 1.6.

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

Tabela 1.6 Notas no incio e no


final do curso.
Incio

Final

10

5
32

O teste t nos estudos com


dados pareados
Para fazer o teste:
a) Calcule as diferenas
entre antes de depois,
conforme est
apresentado na Tabela 1.7:

04/08/2015 08:04

Tabela 1.7 Notas no incio e no


final do curso e as diferenas.
Incio
Final
Diferena

Prof. M.e Josney Freitas Silva

d2

25

25

16

25

10

25

36

152
33

O teste t nos estudos com


dados pareados
b) Calcule a mdia das diferenas: = 4
c) Calcule a varincia das diferenas:
2
2

36
2
152

9 =1
2 =
=
1
91

d) Calcule o valor de t, dado pela frmula: = 2 =

4
1
9

= 12

com 1 = 9 1 = 8 graus de liberdade.


e) Compare o valor absoluto do t calculado com o valor crtico
dado em tabela, ao nvel estabelecido de significncia e com
os mesmos graus de liberdade.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

34

O teste t nos estudos com


dados pareados
Interpretando o teste t Student para dados pareados:
- ao nvel de significncia de 0,05 e com 8 graus de liberdade, o
valor de t, na tabela, de 2,306.
- Como o valor absoluto do t calculado 12, maior que o valor
crtico, rejeita-se a hiptese de que em mdia, as notas dos alunos
antes e depois do curso so iguais, nesse nvel de significncia.
- Em termos prticos, o professor pode concluir que, em mdia, as
notas obtidas por alunos depois do curso so significativamente
maiores que as mdias obtidas por alunos antes do curso (=0,05).
- Neste caso, o p-valor, calculado em computador, 0,0000. como
esse valor menor que =0,05, rejeita-se a hiptese de que as
mdias so iguais, nesse nvel de significncia.
04/08/2015 08:04

Prof. M.e Josney Freitas Silva

35

Exerccios

04/08/2015 08:04

Prof. M.e Josney Freitas Silva

36