Você está na página 1de 32

Comparao entre mdias

De pequenas amostras (supondo


Normalidade da Distribuio da Populao)

Usando testes no-paramtricos
Comparao entre mdias
De pequenas amostras (supondo
Normalidade da Distribuio da Populao)

A DISTRIBUIO t DE STUDENT
A distribuio t foi criada por William Sealy Gosset
(1876-1936).
Sabedor das dificuldades que a coleta de grandes
amostras impe ao pesquisador, Gosset criou uma
estatstica adequada a PEQUENAS AMOSTRAS (n<30): a
distribuio t:
t =
n
s
X
ATENO:
No existe uma distribuio t nica, mas sim uma
famlia. Para cada n (tamanho da amostra) existe uma
distribuio, e uma curva especfica, com (n-1) graus
de liberdade.
O uso da estatstica t pressupe que a varivel
estudada, de onde foi colhida a amostra, tem
distribuio normal.
medida que n cresce, a distribuio t se
aproxima da distribuio, e da curva, da distribuio
z.
t =
n
s
X

Se df,t=normal
Distribuio t
de Student
Wannacott & Wannacott, 1972
g.l. /2 0.250 0.100 0.050 0.025 0.010 0.005 0.001
1 1.000 3.078 6.314 12.706 31.821 63.656 318.289
2 0.816 1.886 2.920 4.303 6.965 9.925 22.328
3 0.765 1.638 2.353 3.182 4.541 5.841 10.214
4 0.741 1.533 2.132 2.776 3.747 4.604 7.173
5 0.727 1.476 2.015 2.571 3.365 4.032 5.894
6 0.718 1.440 1.943 2.447 3.143 3.707 5.208
7 0.711 1.415 1.895 2.365 2.998 3.499 4.785
8 0.706 1.397 1.860 2.306 2.896 3.355 4.501
9 0.703 1.383 1.833 2.262 2.821 3.250 4.297
10 0.700 1.372 1.812 2.228 2.764 3.169 4.144
15 0.691 1.341 1.753 2.131 2.602 2.947 3.733
20 0.687 1.325 1.725 2.086 2.528 2.845 3.552
25 0.684 1.316 1.708 2.060 2.485 2.787 3.450
30 0.683 1.310 1.697 2.042 2.457 2.750 3.385
40 0.681 1.303 1.684 2.021 2.423 2.704 3.307
60 0.679 1.296 1.671 2.000 2.390 2.660 3.232
120 0.677 1.289 1.658 1.980 2.358 2.617 3.160
0.674 1.282 1.645 1.96 2.326 2.576 3.09
Tabela t de Student:
g.l.= grau de liberdade= (n-1); /2=probabilidade bicaudal.
Ex: se gl = 4: p (t = +2,776) = p(t = -2,776) = 2,5%;
t=2,78
INTERVALO DE CONFIANA de 95% PARA A DIFERENA ENTRE
DUAS MDIAS
Para "n" grande, e o
1
=o
2
:
Para "n" grande, e o
1
=o
2
:
Como saber se
as varincias
so iguais ou
diferentes?
menor varincia
MAIOR VARINCIA
= F
A estatstica F tem sua prpria distribuio de
frequncias. Vamos executar um exemplo no Excel?
Turma B Turma A
54 64
54 66
70 89
62 77
F est errado!!! O usurio
tem que SABER A PRIORI,
qual das variveis tem
varincia maior, e cham-
la de VARIVEL 1 na janela
do Excel. A probabilidade
de F
calculado
tambm est
errada! Se F=0,44, com
g.l.=3, p(F)=0,70.
F est certo!! Para afirmar
que as varincias so dife-
rentes, se F=2,26, corro ris-
co de errar de 26%, portanto
no rejeito H
o
, no so dife-
rentes. Outra interpretao:
F
crtico
, com alfa=0,05 (que eu
especifiquei na janela do
Excel) tem valor 9,28, muito
maior que F=2,26 calculado no
teste.
Turma B Turma A
54 64
54 66
70 89
62 77
Teste-F: duas amostras para varincias
Turma B Turma A
Mdia 60 74
Varincia 59 133
Observaes 4 4
gl 3 3
F 0.442
P(F<=f) uni-caudal 0.260
F crtico uni-caudal 0.108
Teste-F: duas amostras para varincias
Turma A Turma B
Mdia 74 60
Varincia 133 59
Observaes 4 4
gl 3 3
F 2.261
P(F<=f) uni-caudal 0.260
F crtico uni-caudal 9.277
menor varincia
MAIOR VARINCIA
= F
INTERVALO DE CONFIANA de 95% PARA A DIFERENA ENTRE
DUAS MDIAS

(
1

2
) = ( ) z
0,025
o \ (1/n
1
) + (1/n
2
)

2 1
X X
Para "n" grande, e o
1
=o
2
:

(
1

2
) = ( ) z
0,025
\ (o
1
/n
1
) + (o
2
/n
2
)

Para "n" grande, e o
1
=o
2
:
2 1
X X
IC
95
DA MDIA ESTIMADA ATRAVS DA DISTRIBUIO DA
MDIA X DA AMOSTRA:
Para "n" grande:
Quando "n" pequeno e/ou o no conhecido:
( )
n
-
z onde ,
025 , 0
o

X
= - X =
n
s
z
( )
n
-
t onde ,
025 , 0
o

X
= - X =
n
s
t
DIFERENA ENTRE DUAS MDIAS DE AMOSTRAS
INDEPENDENTES

PREMISSA: o1=o2
Varincia conjunta:
(onde g.l.= n
1
+n
2
-2)

IC
95
DA DIFERENA ENTRE DUAS MDIAS DE AMOSTRAS
INDEPENDENTES
( )
( ) ( ) | |

+
+
=
2
2 2
2
1 1
2 1
2
*
2
1
X x X x
n n
i i
cjt o
( ) ( )
2 1
025 , 0 2 1 2 1
n n
t
cjt
+
- X X =
o

IC
95
DA DIFERENA ENTRE DUAS MDIAS DE AMOSTRAS
EMPARELHADAS
( )
n
s
t D
D
- =
025 , 0 2 1

. D mdia da padro desvio s
as; emparelhad amostras das valores os entre diferenas das mdia
:
D
=
= D
onde
Testes t no Excel:
Turma B Turma A
54 64
54 66
70 89
62 77
Testes t no Excel:
Turma B Turma A
54 64
54 66
70 89
62 77
Testes t no Excel:
Turma B Turma A
54 64
54 66
70 89
62 77
Duas amostras presumindo varincias diferentes
RESULTADO Turma A Turma B
74 60
Varincia 133 59
Observaes 4.00 4
Hiptese da diferena de mdia 0.00
gl 5.00
Stat t 2.02
P(T<=t) uni-caudal 0.05
t crtico uni-caudal 2.02
P(T<=t) bi-caudal 0.10
t crtico bi-caudal 2.57
Cuidado! g.l. est
ERRADO!
Stat t tambm!
Quando as varincias
so diferentes,
calcula-se a
VARINCIA CONJUNTA.
Testes t no Excel:
Turma B Turma A
54 64
54 66
70 89
62 77
Duas amostras INDEPENDENTES, presumindo
varincias diferentesVARINCIA CONJUNTA
Resultado Turma A Turma B
Mdia 74 60
Varincia 133 59
Observaes 4.00 4
Varincia agrupada 95.67
Hiptese da diferena de mdia 0.00
gl 6.00
Stat t calculado 2.02
P(T<=t) uni-caudal 0.0446
t crtico uni-caudal 1.94
P(T<=t) bi-caudal 0.0893
t crtico bi-caudal 2.45
Se o teste for
bicaudal, no posso
rejeitar, pois
t
calculado
=2,02
menor que t
tabelado
INTERPRETAO:
se o teste for
unicaudal, posso
rejeitar Ho.
MUDEI O TTULO:
Varincias so
diferentes e no
equivalentes
Testes t no Excel:
Condio B Condio A
54 64
54 66
70 89
62 77
Teste-t: entre mdias de duas amostras
EMPARELHADAS
INTERPRETAO:
Rejeito Ho, com
teste unicaudal, ou
teste bicaudal, pois
t
calculado
menor que
qualquer um dos dois
t
tabelados
.

CONCLUSO: TESTE
EMPARELHADO TEM MAIS
PODER!!!!
Resultado Turma A Turma B
Mdia 74 60
Varincia 133 59
Observaes 4 4
Correlao de Pearson 1.00
Hiptese da diferena de mdia 0.00
gl 3.00
Stat t calculado 7.15
P(T<=t) uni-caudal 0.00282
t crtico uni-caudal 2.35
P(T<=t) bi-caudal 0.0056
t crtico bi-caudal 3.18
DE NOVO MUDEI O
TTULO HORRVEL!

Mesma Turma
Teste t no Statistica
T-test for Independent Samples (Spreadsheet1)
Note: Variables were treated as independent samples
Group 1 vs. Group 2
Mean
Group 1
Mean
Group 2
t-value df p Valid N
Group 1
Valid N
Group 2
Std.Dev.
Group 1
Std.Dev.
Group 2
F-ratio
Variances
p
Variances
A vs. B 60 74 -2.02 6 0.089 4 4 7.7 11.5 2.26 0.520
Box & Whisker Plot
A vs. B
Mean
MeanSE
Mean1.96*SE
A B
50
55
60
65
70
75
80
85
90
1
A
2
B
1
2
3
4
54 64
54 66
70 89
62 77
Teste t no Statistica
T-test for Dependent Samples (Spreadsheet1)
Marked dif f erences are signif icant at p < .05000
Variable
Mean Std.Dv. N Diff . Std.Dv.
Diff .
t df p
A
B
60 7.7
74 11.5 4 -14 3.9 -7.2 3 0.006
Comparao entre mdias
Usando testes no-paramtricos
TESTE U - WILCOXON MANN-WHITNEY
PROPOSTA: Tirar amostras de tamanho 4, sorteadas de
um conjunto de 9 elementos.
PERGUNTA: Quantas amostras diferentes, de tamanho 4,
se pode obter de 9 elementos?

C
4
9
126 =
Qualquer amostra tem 1/126 chances de ser sorteada
Qual a distribuio de probabilidade da
SOMA DOS 4 TENS?
Soma POSSIBILIDADES P(S)
10 (1,2,3,4) 1/126
11 (1,2,3,5) 1/126
12 (1,2,3,6) (1,2,4,5) 2/126
13 (1,2,3,7) (1,2,4,6) (1,3,4,5) 3/126
.
.
17 (1,2,5,9) (1,2,6,8) (1,3,5,8) ()
.
.
28 (4,7,8,9) (5,6,8,9) 2/126
29 (5,7,8,9) 1/126
30 (6,7,8,9) 1/126
CONCLUSO: Amostras com grande mistura de nmeros so
mais provveis de ocorrer, do que amostras de valores
extremos.
SE AS AMOSTRAS PERTENCEM A DUAS POPULAES DIFERENTES,
PORQUE DIFEREM NA MDIA (SO DESLOCADAS),
ento a probabilidade P(S) de valores extremos,
grande.

1
>
2
ou
1

<
2


O TESTE U SEMPRE UNI-DIRECIONAL

)
1
1 1
2 1 1
2
1 (
S
n n
n n U
+
+ - =
( )
2
2 2
2 1 2
2
1
* S
n n
n n U
+
+ =
MAS
SE O TESTE UNILATERAL,
ento:
H
0
:
1
=
2
e
H
1
:
1
<
2
ou
H
2
:
1
>
2

Por conveno, (usualmente):
n
1
< n
2
; e


U
tab
o menor valor.
S
1
e S
2
= E dos postos das amostras 1 e 2. So ~ normais
U
1
e U
2
tambm so ~ normais, com
Varincia de U =
12
) 1 ( *
2 1 2 1
2
+ + -
=
n n n n
s
U
U
2
*
2 1
n n
U
mdio
=
Mas, se n
2
> 20, ento:
( )
U
medio
U
s
U U
Z

=
Exemplo 1:
Cinco ratos so educados para seguir seus lderes e assim
obter alimento. Mais tarde, a mesma conduta, levou-os a
evitar choques. Quer-se testar se O TREINAMENTO PRVIO
AJUDOU NA ESQUIVA AO CHOQUE, comparando os cinco ratos
com outros quatro ratos controle sem treinamento.
Critrio: nmero de tentativas necessrias para cada rato
evitar todos os choques.
H
0
: no h diferena entre ratos educados e outros ratos
H
1
: ratos educados so MAIS RPIDOS na esquiva ao choque.
Ratos
Educados
POSTOS Ratos
Controle
POSTOS
78 7 110 9
64 4 70 5
75 6 53 3
45 1 51 2
82 8
Soma
2
= 26 Soma
1
=

19

)
11 19
2
5 ( 4
5 4
1
= + - = U
)
9 26
2
6 ( 5
5 4
2
= + - = U
Por conveno:
n1 < n2; e
U
tabelado
o menor valor.

Tabua J: Probabilidades associadas a valores to pequenos de U quanto os valores observados de U na prova de
Mann-Whitney (Siegel, 1981; p. 302)
N
2
= 5
U
tabelado
N
1
=1 N
1
=2 N
1
=3 N
1
=4 N
1
=5
0 0,167 0,047 0,018 0,008 0,004
1 0,333 0,095 0,036 0,016 0008
2 0,500 0,190 0,071 0,032 0,016
3 0,667 0,286 0,125 0,056 0,028
4 0,429 0,196 0,095 0,048
5 0,571 0,286 0,143 0,075
6 0,393 0,206 0,111
7 0,500 0,278 0,155
8 0,607 0,365 0,210
9 0,452 0,274
10 0,548 0,345
11 0,421
Por conveno:
n1 < n2; e
U
tabelado
o menor valor.
Ratos
Educados
POSTOS Ratos
Controle
POSTOS
78 7 110 9
64 4 70 5
75 6 53 3
45 1 51 2
82 8
Soma
2
= 26 Soma
1
=

19

11 19
2
5 * 4
5 4
1
= + - = U
9 26
2
6 * 5
5 4
2
= + - = U
DA TABELA:
A probabilidade de um valor de U to pequeno quanto 9,
quando n
1
= 4 e n
2
= 5 :
o = 0,45 >> 0,05. Portanto No rejeito H
0
: ratos
educados no

evitam melhor os choques.
Teste Mann-Whitney no Statistica
1
codigo
2
Tentativas
1
2
3
4
5
6
7
8
9
e 78
e 64
e 75
e 45
e 82
c 110
c 70
c 53
c 51
Mann-Whitney U Test (Spreadsheet1 in Ratos.stw)
By variable codigo
Marked tests are signif icant at p <.05000
variable
Rank Sum
e
Rank Sum
c
U Z p-level Z
adjusted
p-level Valid N
e
Valid N
c
2*1sided
exact p
Tentativas 26 19 9.0 0.245 0.806 0.245 0.806 5 4 0.905
Este fcil e intuitivo, mas as amostras precisam ser
EMPARELHADAS.
Portanto: posso rejeitar H
0
, com chance de errar menor que () ??????.....
V. USA AT NO MOMENTO DA AMOSTRAGEM. Exemplo:
Um treinador de futebol anotou a pulsao de dez dos jogadores antes e depois de um
teste aerbico. Aps verificar que 8 dos 10 jogadores tiveram aumento da pulsao, ele
pode concluir que:
H
0
: o teste aerbico no teve efeito sobre os jogadores, no h diferena significativa;
H
a
: o teste aerbico mudou a pulsao do grupo, significativamente.
Primeiro: o que significativo? = 1%? = 5%?
Depois: qual a probabilidade de 8 sinais iguais em 10 contagens? Lembrar que, se no
houvesse diferena, a probabilidade da distribuio terica seria = 0,50.
Da tabela DE TESTE BINOMIAL: p(8/10) = 4,39%

Você também pode gostar