Você está na página 1de 133

AMOSTRAS E POPULAES

Andr Moreno Morcillo1

Nem sempre possvel incluir no estudo todos os elementos de uma populao, seja em
decorrncia dos altos custos implicados, por premncia de tempo, por questes
operacionais, etc. Nestes casos, a soluo estudar um grupo (amostra) desta
populao. Por mais adequado que seja o planejamento e a execuo do processo de
amostragem, os resultados obtidos a partir de amostras raramente so iguais aos da
populao. A mdia, o desvio padro e outros parmetros da amostra sero
provavelmente prximos aos da populao de origem, mas raramente iguais. Esta
diferena se deve ao acaso, fenmeno tambm chamado de erro amostral.
Considerando que o processo de seleo da amostra foi realizado de forma tcnica
correta, o tamanho da amostra (n) passa a ser o principal responsvel para diminuir a
importncia do erro amostral. Amostras com pequeno nmero de casos geram dados
mais imprecisos; quanto maior o n mais seus parmetros se aproximaro daqueles da
populao.
Da a importncia que no momento se d ao dimensionamento da amostra durante a
elaborao do projeto e da apresentao do chamado Intervalo de Confiana nos
resultados. Ambos tentam tornar claro ao leitor o grau de preciso dos nossos
resultados.
A relao existente entre os parmetros (mdia e varincia) da populao e das
amostras podem ser deduzidas a partir de um exemplo bastante simples.
Na tabela 1 e figura 1 so apresentadas as idades de uma populao de crianas com
uma doena muito rara.
Tabela 1 Idades (anos)

Caso

Idade (anos)

paciente 1
paciente 2
paciente 3
paciente 4

2
4
6
8

Professor Doutor do Departamento de Pediatria da FCM/Unicamp


1

2,0

Fre
q
n 1,0
cia

0,0
2

Idade (anos)

Figura 1 Distribuio das idades (anos)

Como estes quatro pacientes formam uma populao, seus parmetros so:
=

2 =

x2

x = 20 = 5
4

( x)

120
4

202
4 = 5,0

Se no pudssemos estudar todos as crianas, poderamos sortear amostras com um,


dois ou trs elementos. Sabemos que amostras com n=1 sero imprecisas, com n=3
muito melhor, mas vamos estudar o comportamento de amostras com n=2.
Considerando um processo de amostragem com reposio, teremos 16 possibilidades de
composio, cada uma com sua mdia e desvio padro. Como tomamos todas as
amostras possveis, neste caso temos uma "populao de amostras" e uma "populao
de mdias das amostras". As amostras e suas mdias so apresentadas na tabela 2 e
figura 2.
Tabela 2 -Distribuio das amostras de 2 elementos e suas mdias (anos)
Amostras
2
2
2
2
4
4
4
4
6
6
6
6
8
8
8
8

e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e

Mdia da amostra ( x )

2
4
6
8
2
4
6
8
2
4
6
8
2
4
6
8

2
3
4
5
3
4
5
6
4
5
6
7
5
6
7
8
2

Os parmetros desta populao de mdias amostrais so:

x = n

( x )

x
2

x =
2

80
=5
16
2

440 80
16 = 2,5
=
16

1. A mdia da populao de mdias das amostras ( ) igual mdia da


x

populao ()
2. A varincia das mdias amostrais ( 2 ) menor que a da populao inicial (2).
x
A razo entre a varincia da populao e a varincia das mdias amostrais :

= 5,0 = 2 = n
x 2,5
2

tamanho das amostras

3. A distribuio das mdias amostrais tem distribuio aproximadamente normal.


8
7
6

Fr

eq 4

i 3
2
1
0
0,0 - 2,0

2,0 - 4,0

4,0 - 6,0

6,0 - 8,0

8,0 - 10,0

Distribuio das mdias das amostras

Figura 2 Distribuio das mdias das amostras

Veja s: tnhamos a populao de origem com sua mdia e desvio padro; vrias
amostras cada qual com sua mdia e desvio padro e agora uma populao de mdias
amostrais com sua mdia e desvio padro. Para diminuir a confuso, o desvio padro da
populao de mdias amostrais por conveno recebe o nome de Erro Padro da Mdia
(EP) ou standard Standard Error of mean (SE).
Neste pequeno, prtico e no realista estudo partimos do conhecimento da populao;
conseguimos determinar a mdia de todas as possveis amostras e estudar a sua
3

distribuio. Na pesquisa o caminho diferente: s conhecemos alguns dados de uma


das possveis amostras e queremos concluir a respeito da populao. Como isto
possvel?
CONCEITOS FUNDAMENTAIS:
1. Sabe-se que a mdia de uma amostra obtida em condies tcnicas razoveis um
bom parmetro da mdia da populao que a originou.
2. A varincia de uma amostra quando calculada com n-1 casos um bom parmetro
da varincia da populao que a originou.
3. Quando a populao de estudo tem distribuio normal, as mdias amostrais tm
distribuio normal; nos casos em que a populao de estudo no tem distribuio
normal, a distribuio das mdias amostrais tem distribuio aproximadamente
normal se o tamanho das amostras for grande (n>30).
Transformando-se algebricamente a frmula anterior:
2
2

=n

EPx =

x =
2

=
n
n

(1)

Aplicando-se a frmula (1) com os parmetros obtidos de uma amostra qualquer


teremos:
EPx =

s
n

A partir da mdia da amostra e do Erro Padro podemos determinar o intervalo de


confiana da mdia da populao.
Por exemplo, de uma amostra de 40 crianas do sexo masculino aos quatro anos obtmse mdia de altura igual a 100,0 cm e desvio padro 5,0 cm. A probabilidade de se
obter uma amostra de 40 elementos com mdia menor que 98 cm calculada da
seguinte forma:
1. Inicialmente determinamos o Erro Padro da Mdia (EP) das amostras
compostas por 40 casos.
4

EP x =

s
n

5,0
= 0,790
40

2. Como n maior que 30 as mdias das amostras tem distribuio normal ou


aproximadamente normal. Assim, a seguir calculamos o valor de z equivalente a
98 cm considerando a mdia 100,0 cm e o erro padro igual a 0,790 cm.
z=

x
EPx

98 100
= 2,531
0,790

A probabilidade de uma amostra com 40 casos ter mdia menor que 98cm equivalente
probabilidade de z < -2,531 (probabilidade da curva normal reduzida), que igual a
0,005687 ou 0,56 % (figura 3).
Probability Density Function
y=normal(x;0;1)
0,60

0,45

0,30

0,15

0,00
-3,50

-1,75

0,00

1,75

3,50

Figura 3 Curva normal

INTERVALO DE CONFIANA DA MDIA POPULACIONAL


A primeira aplicao prtica destes conceitos a determinao do intervalo de
confiana da mdia populacional [IC] a partir das informaes obtidas de uma amostra
de tamanho n. No conhecemos a mdia () e o desvio padro da populao (), porm
dispomos de suas estimativas obtidas a partir da amostra ( x e s). Substitumos o valor de
na frmula do EP por s, portanto, EP passa a ser:
EP =

s
n

A amplitude do intervalo de confiana [IC] est relacionada com a preciso desejada.


Para um intervalo de confiana de 95% (IC95%), usamos z = 1,96; para IC99%
tomamos z = 2,58; para IC90% o valor de z ser 1,64.
O intervalo de confiana tem dois limites:
1. Limite inferior: que igual mdia + z.EP
2. Limite superior: que igual mdia - z.EP

x z / 2 .EP x + z / 2 .EP
Para o clculo do IC95% o clculo apresentado abaixo.

x 1,96.EP x + 1,96.EP
Por exemplo, um pesquisador ao estudar a altura de uma amostra da 120 crianas obteve
mdia 120 cm e desvio padro de 5,6 cm. O intervalo de confiana de 95% [IC95%] da
mdia populacional ser:
EP =

s
n

5,6
120

= 0,511

x 1,96.EP x + 1,96.EP
120 - 1,96.(0,51 1) | - - - | 120 + 1,96.(0,51 1)
IC95% = [108,08 - 131,95]

Estima-se com 95% de preciso que a mdia populacional esteja contida no intervalo
108,08 cm a 131,95 cm.
OS CASOS COM PEQUENAS AMOSTRAS
Quando as amostras so pequenas (n < 30) temos que fazer uma pequena modificao
no procedimento. Trocamos z pelo valor de t, estatstica que leva em considerao o
nmero de casos estudado.

x t / 2 .EP x + t / 2 .EP

DETERMINANDO O TAMANHO DA AMOSTRA


Para calcular o nmero de casos (n) que tero que ser includos na amostra
necessitaremos de informaes sobre a mdia e o desvio padro da varivel que vamos
estudar, que podem ser obtidas da literatura ou ento de estudos piloto. Empiricamente
estabelece-se a amplitude do intervalo de confiana desejado.
Sabendo-se que + 1,96.(EP) = - 1,96.(EP), chamaremos d = + 1,96.(EP).
Usaremos x no lugar de e s no lugar de .

EPx =

s
n

d = 1,96. EP X
s

d = 1,96.

n = 1,96.
n = 1,962 .

s
d
2

s
2
d

Exemplo: se um pesquisador planeja estudar a altura de crianas, inicialmente realiza


um estudo piloto a partir do qual obteve mdia = 120 cm e desvio padro = 5,6 cm.
Arbitrariamente define d = 1% da mdia da amostra (1,2 cm) e IC95%. O nmero
mnimo de casos a ser includo na amostra ser:
2
31,36
n =1,962. s 2 =3,8416.
= 21,77
d
1,44

Portanto, sero necessrios somente 22 casos para se obter a preciso desejada com
confiana de 95%.
2

Note que n diretamente proporcional a s e inversamente a d , portanto quanto maior a


disperso da varivel ou menor a preciso desejada, maior ser o tamanho da amostra.
BIBLIOGRAFIA
1.

ALTMAN DG Practical statistics for medical research. 1 ed. London: Chapman & Hall, 1991.

2.

ANDERSON DR, SWEENEY DJ, WILLIAMS TA Estatstica aplicada administrao e economia. 2


ed. So Paulo: Pioneira, 2002.

3.

BEIGUELMAN B Curso prtico de bioestatstica. 5 ed. Ribeiro Preto: Fundao de Pesquisas


Cientfica de Ribeiro Preto, 2002.

4.

BERQU ES, SOUZA JMP, GOTLIEB SLD Bioestatstica. 1 ed. So Paulo: EPU, 1981.

5.

BLAND M An introduction to medical statistics. 2 ed. New York: Oxford University Press, 1995.

6.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

7.

BUSSAB WO, MORETTIN PA Estatstica bsica. 5 ed. So Paulo: Saraiva, 2003.

8.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

9.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

10. GUIMARES RC, CABRAL JAS Estatstica. Lisboa: McGraw-Hill, 1997.


11. LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA Estatstica geral e aplicada. So Paulo: Atlas, 2001.
13. SPIEGEL MR Estatstica. 3 ed. So Paulo: Makron Books, 1993.
14. TRIOLA MF Introduo estatstica. 7 ed., Rio de Janeiro: LTC Livros Tcnicos e Cientficos
Editora Ltda, 1999.
15. VIEIRA S Introduo bioestatstica. 3 ed., Rio de Janeiro: Editora Campus, 1980.
16. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

COMPARAO DE TRS OU MAIS AMOSTRAS INDEPENDENTES


ANLISE DE VARINCIA

Andr M. Morcillo1

A comparao de trs ou mais amostras independentes, tomadas ao acaso, de uma populao com
distribuio normal, deve ser realizada pela Anlise de Varincia, que. tem sido considerada a mais
importante e poderosa prova paramtrica.
Apesar das hipteses de trabalho contemplarem a igualdade ou no das mdias, toda a anlise realizada
comparando a disperso dos dados das amostras.
Esta prova exige:
1.

a varivel estudada deve ser contnua e ter distribuio normal

2.

as amostras devem ser independentes e tomadas ao acaso

3.

as varincias das amostras devem ser homogneas (iguais).

Se forem tomadas duas amostras razoavelmente grandes, ao acaso, de uma determinada populao com
distribuio normal, observa-se que as mdias e respectivas varincias tm valores muito prximos, no
exatamente iguais. Esta diferena expressa o papel do acaso, o chamado erro amostral, que ocorreu na
seleo dos elementos.
Como as varincias so homogneas, as disperses das amostras so muito semelhantes. O mesmo ocorre
em relao s mdias. Um grfico de toda a populao e das amostras que se est estudando, mostrar que
as curvas praticamente se sobrepem.

Grupo 2

Grupo 1

media 1

media 2

media geral

Professor Assistente Doutor do Departamento de Pediatria da FCM/UNICAMP

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

Por outro lado, se no caso extremo, as amostras tivessem sido tomadas de duas populaes distintas, suas
mdias e varincias seriam diferentes. Teremos distribuies totalmente diferentes.

G ru p o 2

G ru p o 1

m edia 1
m e d i a ge r al m e d i a 2

O princpio da anlise de varincia comparar a disperso dos dados entre as amostras com a disperso
observada dentro das mesmas.

A disperso observada, considerando todos os N elementos que compem a populao, pode ser dividida
em:
1.

a disperso observada dentro dos grupos

2.

a disperso que h entre os grupos

Disperso total = disperso dentro dos grupos + disperso entre os grupos.

Se as amostras tm mdias e varincias iguais, a disperso dentro dos grupos deve ser muito semelhante
quela observada entre os grupos. A Anlise de Varincia compara a relao que h entre a disperso
existente entre os grupos com a observada dentro dos grupos.

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

Uma boa maneira de avaliar a disperso de um conjunto de dados estudar o desvio que cada elemento
tem em relao mdia, mais precisamente, o quadrado destes desvios. Considerando uma observao
qualquer xi e a mdia da amostra de x , o quadrado do seu desvio ser:

QD = x i x

)2

A soma dos quadrados dos desvios (SQD) de todos os n elementos da amostra ser:
n

SQD = x i x
i =1

)2

Calculando a SQD da populao ou SQD total (SQDT)


A partir do conceito acima, pode-se calcular a soma dos quadrados dos desvios, em relao mdia da
populao, para o conjunto das N observaes envolvidas no estudo:
N

X =

i =1

O clculo da soma dos quadrados dos desvios passa a ser:


N

SQDT = X X
i =1

Calculando a SQD dentro das amostras (SQDD)


Calcula-se a soma dos quadrados dos desvios de cada amostra. Tem-se uma SQD da primeira amostra,
outra para a segunda, etc., cuja soma recebe o nome de soma dos quadrados dos desvios dentro dos
grupos (SQDD). A SQDD expressa a variao ocorrida dentro dos grupos em decorrncia do acaso - o
chamado Erro Amostral.

SQDD = SQD1 + SQD2 + SQD3 + ... + SQDk


2
2
2
2
SQD D = (xi x1) + (xi x 2 ) + (xi x 3) + ... + (xi x k )
n

i =1

i =1

i =1

i =1

Calculando a SQD entre as amostras (SQDE)


A SQD entre as amostras (SQDE) ser obtida a partir de SQDT e SQDD.

SQD E = SQDT SQDD

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

A SQDE fundamental na Anlise de Varincia, pois expressa a variao ocorrida na formao dos
grupos. Se o fator que se estuda tem significativo impacto, haver grande diferena entre os grupos, que
resultar em importante desvio entre os grupos (SQDE).
Comparando as somas dos quadrados dos desvios
Como saber se uma determinada SQD=15 ou no maior do que outra SQD=13 ?

Esta comparao torna-se mais clara quando se leva em conta o tamanho das amostras envolvidas.
Calcula-se a mdia das somas dos quadrados dos desvios (QMD) de cada amostra:

QMD =

SQD
n

Uma amostra com 20 elementos e SQD = 15 tem QMD = 15/20 = 0,75 . Outra com 10 elementos com
SQD=13 ter QMD = 13/10 = 1,3
Portanto, compara-se as mdias das somas dos quadrados (QMD), porm, estas sero calculadas a partir
dos respectivos graus de liberdade, que o nmero de elementos de cada amostra menos um [gli= ni - 1].
Assim, os quadrados mdios sero calculados da seguinte forma:

QMD =

SQD
gl

Quadrado mdio dentro das amostras (QMDD)


O QMDD calculado a partir da SQDD e seus graus de liberdade (N-k) [gld = N - k]
.

QMDD =

SQD D
N k

gl = (ni 1) = N k
i =1

Quadrado mdio entre as amostras (QMDE)


O QMDE calculado a partir da SQDE e seus graus de liberdade. Como so k amostras, o nmero de gl
k-1 [gle = k - 1]
Assim, o quadrado mdio entre as amostras ser:

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

QMDE =

SQDE
k 1

Calculando a estatstica F
A estatstica F avalia a relao existente entre o QMDE e o QMDD. Quanto maior a diferena entre os
grupos, maior ser o valor de F.

F=

QMDE
QMDD

Teste de hiptese
A Anlise de Varincia avalia se as amostras, que tm varincias homogneas, tm mdias iguais ou
diferentes. A hiptese inicial prev a igualdade das mdias, enquanto que a hiptese alternativa afirma
que pelo menos uma das mdias diferente (o que significa dizer que pelo menos uma amostra no
procedente da mesma populao).
H0 : todas as mdias das amostras so iguais
H1 : pelo menos uma amostra tem mdia diferente

As hipteses tambm poderiam ser escritas da seguinte forma:

HO: x1= x 2 = x 3=...= x k

H1 : x1 x 2 x 3 ... x k
Uma vez estabelecido o nvel de significncia desejado () e calculada a estatstica F. Procura-se na
tabela de distribuio de F o valor de Fcrtico para k-1 graus de liberdade entre os grupos e N-k graus de
liberdade dentro dos grupos.

Se o valor de F obtido igual ou maior ao Fcrtico rejeita-se H0

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

Exemplo: desejando saber se havia diferena significativa entre as idades de crianas de trs classes da
quarta srie de uma escola do ensino fundamental, um pesquisador tomou uma amostra ao acaso (n=15)
de cada classe.
H0 : no h diferena entre as idades das crianas das trs classes
H1 : pelo menos uma classe tem crianas com idades diferentes

Nvel de significncia adotado: 0,05

Calculando a Soma dos Quadrados das Diferenas do Total (SQDT)


X = 450

1.

Calculando a soma das idades de todas as crianas:

2.

Calculando a mdia (geral) de todas as crianas: X =

3.

Calculando o quadrado da diferena de cada criana em relao media geral: X X

4.

Calculando a soma dos quadrados das diferenas de todas as crianas: SQDT = X X

450
= 10
45

i =1

Classe A

Classe B

= 46

Classe C

(X X )

(X X )

(X X )

8,00
8,00
11,00
11,00
11,00
10,00
9,00
12,00
10,00
10,00
11,00
10,00
10,00
11,00
9,00

4,00
4,00
1,00
1,00
1,00
0,00
1,00
4,00
0,00
0,00
1,00
0,00
0,00
1,00
1,00

10,00
11,00
9,00
10,00
9,00
10,00
9,00
11,00
11,00
9,00
10,00
10,00
10,00
10,00
10,00

0,00
1,00
1,00
0,00
1,00
0,00
1,00
1,00
1,00
1,00
0,00
0,00
0,00
0,00
0,00

10,00
11,00
10,00
10,00
10,00
9,00
7,00
11,00
11,00
11,00
10,00
9,00
10,00
12,00
9,00

0,00
1,00
0,00
0,00
0,00
1,00
9,00
1,00
1,00
1,00
0,00
1,00
0,00
4,00
1,00

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

Calculando a Soma dos Quadrados das Diferenas dentro dos grupos (SQDD)
n

x = i =1
n

1.

Calculando a mdia das idades das crianas dentro de cada classe:

2.

Calculando o quadrado da diferena de cada criana em relao media da respectiva classe:

3.

Calculando a soma dos quadrados das diferenas dentro cada classe:

(x x )2

SQD =

(x x )2

4. Calculando a soma dos quadrados das diferenas dentro das trs classes:
SQDD= SQDClasse A + SQDClasse B + SQDClasse C
SQDD= 18,9335 + 6,9335 + 20 = 45,867

Classe A

x
8,00
8,00
11,00
11,00
11,00
10,00
9,00
12,00
10,00
10,00
11,00
10,00
10,00
11,00
9,00

x =10,066667

Classe B

Classe C

(x x )2

(x x )2

(x x )2

4,2711

10,00

0,0044

10,00

0,0000

4,2711

11,00

1,1378

11,00

1,0000

0,8711

9,00

0,8711

10,00

0,0000

0,8711

10,00

0,0044

10,00

0,0000

0,8711

9,00

0,8711

10,00

0,0000

0,0044

10,00

0,0044

9,00

1,0000

1,1378

9,00

0,8711

7,00

9,0000

3,7378

11,00

1,1378

11,00

1,0000

0,0044

11,00

1,1378

11,00

1,0000

0,0044

9,00

0,8711

11,00

1,0000

0,8711

10,00

0,0044

10,00

0,0000

0,0044

10,00

0,0044

9,00

1,0000

0,0044

10,00

0,0044

10,00

0,0000

0,8711

10,00

0,0044

12,00

4,0000

1,1378

10,00

0,0044

9,00

1,0000

18,9331

x =9,933333

6,933

x =10

20

Calculando a Soma dos quadrados das diferenas entre as classes (SQDE)

SQDE = SQDT - SQDd


SQDE = 46 - 45,8661 = 0,1339

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

Construindo a tabela da Anlise de Varincia

Uma forma clssica de apresentao dos dados da anlise de varincia a da tabela abaixo:

SQD

Gl

QMD

Entre as amostras

0,1339

0,06695

0,061307

Dentro das amostras

45,8661

42

1,09205

Do total (as trs amostras juntas)

46

44

Comparando o F calculado e tomando deciso


F = QMDE / QMDD = 0,06695 / 1,09205 = 0,061307
O valor de F crtico para 2 gl entre as classe e 42 gl dentro das classes F=0,05;2;42 = 4,05
Como o F calculado menor que o Fcrtico no se pode rejeitar H0, concluindo que as trs classes tm
mdias de idade iguais.

xA= xB= xC

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

FORMA PRTICA PARA CALCULAR AS SOMAS DE QUADRADOS

H uma forma mais simples que permite que as somas dos quadrados sejam calculadas sem usar

)2

diretamente os desvios x x , diminuindo o nmero operaes efetuadas e, consequentemente, de erros


cometidos. Sero utilizados nos clculos somente os valores originais (x) e seus quadrados (x2).

Calculando a soma dos quadrados do conjunto das amostras (SQDT)

SQDT = X 2

( X )2
N

onde
X : soma de todos os elementos
X2 : soma dos quadrados de todos os elementos
n:
nmero de elementos da amostra i
N:
total de elementos de todas as amostras

Calculando a soma dos quadrados dos desvios dentro das amostras (SQDD)
K

SQD D = x2
I =1

( x)2

onde
x : soma de todos os elementos da amostra i
x2 : quadrado de qualquer elemento da amostra i
n:
nmero de elementos da amostra i

Calculando a soma dos quadrados dos desvios entre as amostras (SQDE)

SQD E = SQD T SQD D


Calculando os quadrados mdios das diferenas (QMD)
QMDE = SQDE / k-1
QMDD = SQDD / N k
Calculando F
F = QMDE / QMDD

Retomando o exemplo anterior, no qual todas as amostras tm n=15

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

Classe A

Classe B

Classe C

x2

x2

x2

8,00
8,00
11,00
11,00
11,00
10,00
9,00
12,00
10,00
10,00
11,00
10,00
10,00
11,00
9,00

64
64
121
121
121
100
81
144
100
100
121
100
100
121
81

10,00
11,00
9,00
10,00
9,00
10,00
9,00
11,00
11,00
9,00
10,00
10,00
10,00
10,00
10,00

100
121
81
100
81
100
81
121
121
81
100
100
100
100
100

10,00
11,00
10,00
10,00
10,00
9,00
7,00
11,00
11,00
11,00
10,00
9,00
10,00
12,00
9,00

100
121
100
100
100
81
49
121
121
121
100
81
100
144
81

151

1539

149

1487

150

1520

Soma de x

Soma de x2

Classe A

151

1539

15

Classe B

149

1487

15

Classe C

150

1520

15

Total

450

4546

45

SQDT = 4546 - (450)2 / 45 = 46


SQDD = 18,9333 + 6,9333 + 20 =45,867
SQDE = 46 45,867 = 0,133
QMDE = 0,133 / 2 = 0,0665
QMDD = 45,867 / (45-3) = 1,092071429
F = 0,0665 / 1,092071429= 0,06089

10

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

ESTUDANDO A HOMOGENEIDADE DAS VARINCIAS - O TESTE DE BARTLETT


Antes de iniciar a Anlise de Varincia importante demonstrar que as varincias das amostras so
homogneas ("iguais"). Para isto emprega-se o Teste de Bartlett, uma forma de 2 que indica se h ou no
diferenas significantes entre as varincias dos grupos estudados.
Teste de Bartlett para k amostras de mesmo tamanho n

(n1=n2=n3=...=nk=n)

2
2
= 2,3026 (n 1) k log s log s
i =1

onde n numero de casos das amostras (todas tm o mesmo nmero de casos) e

a mdia aritmtica das

varincias observadas nas k amostras, calculadas por:


k

s
2

Compara-se o calculado com o

crtico

i =1

com k-1 graus de liberdade. Quando o 2 calculado for 2crtico rejeita-se a

hiptese de que as amostras sejam homogneas.


Quando o 2 for estatisticamente significante, torna-se necessrio aplicar um fator de correo (C), tal como segue
abaixo.

C =1+

k 1
3 k (n 1)

2
=
corr
C

Se o 2corr for maior ou igual ao 2crtico com k-1 graus de liberdade rejeita-se a hiptese de que as amostras sejam
homogneas.

Teste de Bartlett para k amostras de tamanho diferentes


Neste caso os clculos so mais trabalhosos.
11

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

SQD D
2
s = QMD D = N k
onde SQDD a soma dos quadrados dos desvios dentro das amostras e N o nmero total de elementos encontrados
nas k amostras.

2
2
= 2,3026 log s ( N k ) (n 1) log s
i =1

Quando o 2 for maior que o 2crtico, dever ser corrigido da seguinte maneira:

C = 1+

k
1
1
1

3 (k 1) i =1 (ni 1) (N k )

2
=
corr
C

Se o 2corr for maior ou igual ao 2crtico com k-1 graus de liberdade rejeita-se a hiptese de que as amostras sejam
homogneas.

Retomando o exemplo anterior:

Classes

n-1

s2

Log s2

15

14

1,352

0,1309766

15

14

0,495

-0,3053948

15

14

1,429

0,15503222

Retomando o exemplo anterior, todas as amostras tm o mesmo tamanho.


Ento:

2
2
= 2,3026 (n 1) k log s log s

i =1

s2

= i =1
k

1,352 + 0,495 + 1,429


= 1,092
3

12

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

= 2,3026 (15 1) (3 log1,092 ( 0,019386))


2
= 2,3026 14 (3 (0,038223) + 0,019386)
2
= 32,2364 0,134054 = 4,321416
Considerando que so 2 graus de liberdade o valor do 20,05,2gl 5,991
Portanto,

2 < 20,05,2gl
Neste caso, por no haver significncia no h necessidade de aplicar o fator de correo.

No se pode rejeitar a hiptese de que a amostras tm varincias homogneas, concluindo-se que as varincias so
"iguais".

Observao: o teste de Bartlett poderoso quando a populao tem distribuio normal. No deve ser utilizado
quando esta condio no observada. Portanto, antes de aplicar o teste de Bartlett deve-se avaliar a condio de
normalidade da populao.

BIBLIOGRAFIA
1.

ALTMAN DG Practical statistics for medical research. 1 ed. London: Chapman & Hall, 1991.

2.

ANDERSON DR, SWEENEY DJ, WILLIAMS TA Estatstica aplicada administrao e economia.


2 ed. So Paulo: Pioneira, 2002.

3.

BEIGUELMAN B Curso prtico de bioestatstica. 5 ed. Ribeiro Preto: Fundao de Pesquisas


Cientfica de Ribeiro Preto, 2002.

4.

BERQU ES, SOUZA JMP, GOTLIEB SLD Bioestatstica. 1 ed. So Paulo: EPU, 1981.

5.

BLAND M An introduction to medical statistics. 2 ed. New York: Oxford University Press, 1995.

6.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

7.

BUSSAB WO, MORETTIN PA Estatstica bsica. 5 ed. So Paulo: Saraiva, 2003.

8.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

9.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

10. GUIMARES RC, CABRAL JAS Estatstica. Lisboa: McGraw-Hill, 1997.


11. LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA Estatstica geral e aplicada. So Paulo: Atlas, 2001.
13

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

13. SPIEGEL MR Estatstica. 3 ed. So Paulo: Makron Books, 1993.


14. TRIOLA MF Introduo estatstica. 7 ed., Rio de Janeiro: LTC Livros Tcnicos e Cientficos
Editora Ltda, 1999.
15. VIEIRA S Introduo bioestatstica. 3 ed., Rio de Janeiro: Editora Campus, 1980.
16. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

14

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

COMO PROCESSAR NO SPSS


A estrutura da planilha deve ter duas variveis: uma que receber o cdigo dos grupos e a outra para
os dados da varivel independente.

1
2
3
4
5
6
16
17
18
19
20
...
31
32
33
34
35
...

Classe

Idade

A
A
A
A
A
...
B
B
B
B
B
...
C
C
C
C
C
...

8
8
11
11
11
...
10
11
9
10
9
...
10
11
10
10
10
...

Var0003

Test of Homogeneity of Variances

IDADE

Levene
Statistic
1,223

df1

df2
2

42

Sig.
,305

ANOVA
Sum of
Squares
IDADE

Between
Groups
Within
Groups
Total

,133

Mean
Square

df

2 6,667E-02

45,867

42

46,000

44

F
,061

Sig.
,941

1,092

Observao: o SPSS utiliza o teste de Levine para estudar a homogeneidade das varincias. A
interpretao a mesma do teste de Bartlett.

15

Anlise de Varincia - Andr Moreno Morcillo


__________________________________________________________________________________________________

Valores crticos de F ao nvel de 5% (Bilateral) ou 2,5% (Unilateral)


gl Entre grupos

gl
Dentro

10

12

15

20

24

30

40

60

120

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

647,79
38,51
17,44
12,22
10,01
8,81
8,07
7,57
7,21
6,94
6,72
6,55
6,41
6,30
6,20
6,12
6,04
5,98
5,92
5,87
5,83
5,79
5,75
5,72
5,69
5,66
5,63
5,61
5,59
5,57
5,42
5,29
5,15
5,02

799,50
39,00
16,04
10,65
8,43
7,26
6,54
6,06
5,71
5,46
5,26
5,10
4,97
4,86
4,77
4,69
4,62
4,56
4,51
4,46
4,42
4,38
4,35
4,32
4,29
4,27
4,24
4,22
4,20
4,18
4,05
3,93
3,80
3,69

864,16
39,17
15,44
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,63
4,47
4,35
4,24
4,15
4,08
4,01
3,95
3,90
3,86
3,82
3,78
3,75
3,72
3,69
3,67
3,65
3,63
3,61
3,59
3,46
3,34
3,23
3,12

899,58
39,25
15,10
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,28
4,12
4,00
3,89
3,80
3,73
3,66
3,61
3,56
3,51
3,48
3,44
3,41
3,38
3,35
3,33
3,31
3,29
3,27
3,25
3,13
3,01
2,89
2,79

921,85
39,30
14,88
9,36
7,15
5,99
5,29
4,82
4,48
4,24
4,04
3,89
3,77
3,66
3,58
3,50
3,44
3,38
3,33
3,29
3,25
3,22
3,18
3,15
3,13
3,10
3,08
3,06
3,04
3,03
2,90
2,79
2,67
2,57

937,11
39,33
14,73
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,88
3,73
3,60
3,50
3,41
3,34
3,28
3,22
3,17
3,13
3,09
3,05
3,02
2,99
2,97
2,94
2,92
2,90
2,88
2,87
2,74
2,63
2,52
2,41

948,22
39,36
14,62
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,76
3,61
3,48
3,38
3,29
3,22
3,16
3,10
3,05
3,01
2,97
2,93
2,90
2,87
2,85
2,82
2,80
2,78
2,76
2,75
2,62
2,51
2,39
2,29

956,66
39,37
14,54
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,66
3,51
3,39
3,29
3,20
3,12
3,06
3,01
2,96
2,91
2,87
2,84
2,81
2,78
2,75
2,73
2,71
2,69
2,67
2,65
2,53
2,41
2,30
2,19

963,28
39,39
14,47
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,59
3,44
3,31
3,21
3,12
3,05
2,98
2,93
2,88
2,84
2,80
2,76
2,73
2,70
2,68
2,65
2,63
2,61
2,59
2,57
2,45
2,33
2,22
2,11

968,63
39,40
14,42
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,53
3,37
3,25
3,15
3,06
2,99
2,92
2,87
2,82
2,77
2,73
2,70
2,67
2,64
2,61
2,59
2,57
2,55
2,53
2,51
2,39
2,27
2,16
2,05

976,71
39,41
14,34
8,75
6,52
5,37
4,67
4,20
3,87
3,62
3,43
3,28
3,15
3,05
2,96
2,89
2,82
2,77
2,72
2,68
2,64
2,60
2,57
2,54
2,51
2,49
2,47
2,45
2,43
2,41
2,29
2,17
2,05
1,94

984,87
39,43
14,25
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,33
3,18
3,05
2,95
2,86
2,79
2,72
2,67
2,62
2,57
2,53
2,50
2,47
2,44
2,41
2,39
2,36
2,34
2,32
2,31
2,18
2,06
1,95
1,83

993,10
39,45
14,17
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,23
3,07
2,95
2,84
2,76
2,68
2,62
2,56
2,51
2,46
2,42
2,39
2,36
2,33
2,30
2,28
2,25
2,23
2,21
2,20
2,07
1,94
1,82
1,71

997,25
39,46
14,12
8,51
6,28
5,12
4,42
3,95
3,61
3,37
3,17
3,02
2,89
2,79
2,70
2,63
2,56
2,50
2,45
2,41
2,37
2,33
2,30
2,27
2,24
2,22
2,19
2,17
2,15
2,14
2,01
1,88
1,76
1,64

1001,41
39,47
14,08
8,46
6,23
5,07
4,36
3,89
3,56
3,31
3,12
2,96
2,84
2,73
2,64
2,57
2,50
2,45
2,39
2,35
2,31
2,27
2,24
2,21
2,18
2,16
2,13
2,11
2,09
2,07
1,94
1,82
1,69
1,57

1005,60
39,47
14,04
8,41
6,18
5,01
4,31
3,84
3,51
3,26
3,06
2,91
2,78
2,67
2,59
2,51
2,44
2,38
2,33
2,29
2,25
2,21
2,18
2,15
2,12
2,09
2,07
2,05
2,03
2,01
1,88
1,74
1,61
1,48

1009,80
39,48
13,99
8,36
6,12
4,96
4,25
3,78
3,45
3,20
3,00
2,85
2,72
2,61
2,52
2,45
2,38
2,32
2,27
2,22
2,18
2,15
2,11
2,08
2,05
2,03
2,00
1,98
1,96
1,94
1,80
1,67
1,53
1,39

1014,02
39,49
13,95
8,31
6,07
4,90
4,20
3,73
3,39
3,14
2,94
2,79
2,66
2,55
2,46
2,38
2,32
2,26
2,20
2,16
2,11
2,08
2,04
2,01
1,98
1,95
1,93
1,91
1,89
1,87
1,72
1,58
1,43
1,27

1018,26
39,50
13,90
8,26
6,02
4,85
4,14
3,67
3,33
3,08
2,88
2,73
2,60
2,49
2,40
2,32
2,25
2,19
2,13
2,09
2,04
2,00
1,97
1,94
1,91
1,88
1,85
1,83
1,81
1,79
1,64
1,48
1,31
1,00

16

A CURVA NORMAL
Andr Moreno Morcillo1

O conhecimento desta distribuio de probabilidades se deve a Abraham de Moivre


(1667-1754) que, em 1733, apresentou a funo que a representa. Tratava-se at ento
de um exerccio terico, sem aplicao prtica. J. Bernoulli (1654-1705) acreditava que
poderia haver aplicao na rea da economia, no entanto, o uso desses conhecimentos
na prtica se deve a Pierre-Simon Laplace (1749-1827) na Frana e a Johan K. F. Gauss
(1777-1855) na Alemanha. O nome Curva de Gauss se deve suposio que Gauss
tivesse sido a primeira pessoa a fazer uso de suas propriedades; no entanto, em 1924,
Karl Pearson reafirmou o papel fundamental de Abraham de Moivre.2
Esta distribuio de probabilidades definida pela funo:

(x )

y=

1
. 2.

.e

2.

Professor Doutor do Departamento de Peditria da Faculdade de Cincias Mdicas da Unicamp.

Walker HM, Lev J Elementary Statistical Methods. New York: Holt, Rinehart and Winston, 1958. p.

200-201.

Esta curva definida por dois parmetros: sua mdia () e sua varincia (2). Dessa
forma so possveis infinitas curvas normais, ora variando a mdia, ora a sua varincia.
Suas principais caractersticas so:
A varivel x pode assumir qualquer valor real (- a +)
Os valores de y so assintticos em relao ao eixo das abcissas, isto , nunca tocam o
eixo de x.
A curva simtrica e unimodal, apresentando um ponto de inflexo esquerda (x = -

1) e outro direita (x = +1).


Sua aplicao na anlise de dados na rea biomdica grande, pois muitas variveis
numricas contnuas que estudamos tm distribuio normal ou aproximadamente
normal. Em alguns casos possvel transform-las, tornando-as compatveis com a
normal. Como exemplo podemos citar a altura, o peso, o ndice de massa corporal, etc.
Alguns dos principais mtodos empregados na anlise estatstica (teste t de Student,
anlise de varincia, anlise de regresso, etc.) exigem que os dados tenham distribuio
normal.
Como se trata de distribuio de probabilidade contnua, a rea que fica entre a curva e
o eixo das abcissas representa a probabilidade. A probabilidade de ocorrer um evento
entre os pontos a e b calculada pela integral definida da funo entre os pontos a e b,
representada pela rea azul no grfico seguinte.

P (a , b ) =

.
a

-2-

(x )

1
2.

2.

A probabilidade de ocorrer um evento entre x=- e x=+ igual a 1 ou 100%,


representada pela rea azul no grfico seguinte.

A probabilidade de ocorrer um evento entre x=- e x= 0,5 ou 50%, representada pela


rea azul no grfico seguinte.

-3-

A probabilidade de ocorrer um evento entre x= e x=+ 0,5 ou 50%, representada


pela rea azul no grfico seguinte..

O clculo dessas reas usando as tcnicas de integrao sofisticado e complexo.

-4-

A CURVA NORMAL REDUZIDA


Curvas normais, com qualquer e , podem ser transformadas em uma normal muito
especial que tem mdia 0 ( = 0) e desvio padro 1 ( = 1). Esta curva normal com
mdia 0 e desvio padro 1 conhecida como curva normal reduzida. Suas
probabilidades j foram calculadas e so apresentadas em tabelas de fcil utilizao.
Como a normal simtrica, os livros apresentam somente as probabilidades da metade
direita da curva. A probabilidade de um intervalo qualquer da metade esquerda igual
probabilidade do intervalo equivalente na metade direita.
Na normal reduzida P(0,z) = p enquanto P(> z) = 0,5 p

P(-z,0) = P(0,+z)
P(<-z) = P(>+z)

-5-

COMO USAR A TABELA PARA OBTER AS REAS OU PROBABILIDADE


A tabela que apresentamos3 d a probabilidade de ocorrncia de um evento entre 0 e z.
Na margem esquerda temos o valor de z com uma decimal e, se necessitamos considerar
a segunda decimal, a procuramos na margem superior. No interior obtemos as
probabilidades.
Para calcular a probabilidade de z entre 0 e 1, procuramos na margem esquerda a linha
que tem z = 1,0 e a coluna 0,00 e encontramos o valor 0,3413. Isto significa que a
probabilidade de encontrar um valor de x entre a mdia zero e z=1,0 0,3413 ou
34,13%.
Por outro lado, para se obter a probabilidade de z maior que 1, calculamos a
probabilidade de z entre 0 e 1 que 0,3413 e a seguir fazemos 0,5-0,3413 = 0,1587 ou
15,87%.
Para se obter a probabilidade de z entre 0 e 1,87, procuramos a clula cuja linha 1,8 e
coluna 0,07 o que resulta o valor 0,4693 ou 46,93%.

Alguns livros apresentam a tabela de P(>z). Observe que neste caso a primeira clula da tabela igual a

0,5 , diminuindo a medida que z tende para o infinito. No nosso caso P(,z) a primeira clula da tabela
zero, aumentando a medida que z tende para o infinito.
-6-

Curva Normal (p = rea entre 0 e z)


segunda casa decimal
z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0

0.0000

0.0040

0.0080

0.0120

0.0160

0.0199

0.0239

0.0279

0.0319

0.0359

0.1

0.0398

0.0438

0.0478

0.0517

0.0557

0.0596

0.0636

0.0675

0.0714

0.0753

0.2

0.0793

0.0832

0.0871

0.0910

0.0948

0.0987

0.1026

0.1064

0.1103

0.1141

0.3

0.1179

0.1217

0.1255

0.1293

0.1331

0.1368

0.1406

0.1443

0.1480

0.1517

0.4

0.1554

0.1591

0.1628

0.1664

0.1700

0.1736

0.1772

0.1808

0.1844

0.1879

0.5

0.1915

0.1950

0.1985

0.2019

0.2054

0.2088

0.2123

0.2157

0.2190

0.2224

0.6

0.2257

0.2291

0.2324

0.2357

0.2389

0.2422

0.2454

0.2486

0.2517

0.2549

0.7

0.2580

0.2611

0.2642

0.2673

0.2704

0.2734

0.2764

0.2794

0.2823

0.2852

0.8

0.2881

0.2910

0.2939

0.2967

0.2995

0.3023

0.3051

0.3078

0.3106

0.3133

0.9

0.3159

0.3186

0.3212

0.3238

0.3264

0.3289

0.3315

0.3340

0.3365

0.3389

1.0

0.3413

0.3438

0.3461

0.3485

0.3508

0.3531

0.3554

0.3577

0.3599

0.3621

1.1

0.3643

0.3665

0.3686

0.3708

0.3729

0.3749

0.3770

0.3790

0.3810

0.3830

1.2

0.3849

0.3869

0.3888

0.3907

0.3925

0.3944

0.3962

0.3980

0.3997

0.4015

1.3

0.4032

0.4049

0.4066

0.4082

0.4099

0.4115

0.4131

0.4147

0.4162

0.4177

1.4

0.4192

0.4207

0.4222

0.4236

0.4251

0.4265

0.4279

0.4292

0.4306

0.4319

1.5

0.4332

0.4345

0.4357

0.4370

0.4382

0.4394

0.4406

0.4418

0.4429

0.4441

1.6

0.4452

0.4463

0.4474

0.4484

0.4495

0.4505

0.4515

0.4525

0.4535

0.4545

1.7

0.4554

0.4564

0.4573

0.4582

0.4591

0.4599

0.4608

0.4616

0.4625

0.4633

1.8

0.4641

0.4649

0.4656

0.4664

0.4671

0.4678

0.4686

0.4693

0.4699

0.4706

1.9

0.4713

0.4719

0.4726

0.4732

0.4738

0.4744

0.4750

0.4756

0.4761

0.4767

2.0

0.4772

0.4778

0.4783

0.4788

0.4793

0.4798

0.4803

0.4808

0.4812

0.4817

2.1

0.4821

0.4826

0.4830

0.4834

0.4838

0.4842

0.4846

0.4850

0.4854

0.4857

2.2

0.4861

0.4864

0.4868

0.4871

0.4875

0.4878

0.4881

0.4884

0.4887

0.4890

2.3

0.4893

0.4896

0.4898

0.4901

0.4904

0.4906

0.4909

0.4911

0.4913

0.4916

2.4

0.4918

0.4920

0.4922

0.4925

0.4927

0.4929

0.4931

0.4932

0.4934

0.4936

2.5

0.4938

0.4940

0.4941

0.4943

0.4945

0.4946

0.4948

0.4949

0.4951

0.4952

2.6

0.4953

0.4955

0.4956

0.4957

0.4959

0.4960

0.4961

0.4962

0.4963

0.4964

2.7

0.4965

0.4966

0.4967

0.4968

0.4969

0.4970

0.4971

0.4972

0.4973

0.4974

2.8

0.4974

0.4975

0.4976

0.4977

0.4977

0.4978

0.4979

0.4979

0.4980

0.4981

2.9

0.4981

0.4982

0.4982

0.4983

0.4984

0.4984

0.4985

0.4985

0.4986

0.4986

3.0

0.4987

0.4987

0.4987

0.4988

0.4988

0.4989

0.4989

0.4989

0.4990

0.4990

-7-

COMO TRANSFORMAR UMA NORMAL QUALQUER NA NORMAL REDUZIDA


Devemos calcular o z equivalente aos limites desejados utilizando a frmula:
x

z=

onde
x = ponto que se deseja converter em z
= mdia da normal original
= desvio padro da normal original
Dada uma distribuio normal com mdia 100 e desvio padro 5, calcule a
probabilidade x entre 100 e 107.
O procedimento simples. Precisamos saber qual o intervalo da normal reduzida que
equivalente ao intervalo 100 a 107 da normal com mdia 100 e desvio padro 5.
Aplicando a frmula acima, calcula-se o valor de z para x=100 e para x=107.
z=

z=

100 100
=0
5

107 100
= 1,4
5

O ponto 100 corresponde a z = 0 e o ponto 107 a z = 1,4. Assim, o intervalo 100-107


equivalente ao intervalo 0-1,4 da normal reduzida.
Como a probabilidade de z entre 0 e 1,4 0,4192 ou 41,92% podemos afirmar que a
probabilidade de z entre 100-107 igual a 0,4192 ou 41,92%
Por outro lado, a probabilidade de valores maiores que 107 igual probabilidade de z
maior que 1,4 que igual a 0,5 0,4192 = 0,0808 ou 8,08%.
A probabilidade de se ter valores menores que 100 0,50 ou 50%, pois 100 equivale a z
igual a 0 e a probabilidade de z < 0 0,50.
A probabilidade de valores menores que 100 ou maiores que 107 igual 0,50 + 0,0808
= 0,5808.
-8-

Alguns exemplos de aplicao na rea biomdica:


Sabendo-se que a altura de crianas dos sexo masculino aos 4 anos de idade tem
distribuio normal com mdia 100 cm e desvio padro 6,0 cm, pergunta-se:
1. Qual a probabilidade de uma criana ter altura menor que 110 cm?
z = (110 100)/6 = 1,67
A probabilidade de 0 < z < 1,67 = 0,4525 . A probabilidade de z < 0 0,5
Assim a probabilidade de uma criana ter altura menor que 110 cm 0,50 +
0,4525 = 0,9525 ou 95,25%
2. Qual a probabilidade de uma criana ter altura maior que 103 cm?
z = (103 100)/6 = 0,50
A probabilidade de 0 < z < 0,50 = 0,1915. A probabilidade de z > 0,50
0,50 0,1915 = 0,3085 ou 30,85%.
3. Qual a probabilidade de uma criana ter altura menor que 100 cm?
Assim a probabilidade de uma criana ter altura menor que 100 cm 0,50 +
0,1915 = 0,6915 ou 69,15%.
4. Qual a probabilidade de uma criana ter altura entre 103 cm e 110 cm?
Para 103 z = 0,50 sendo que a probabilidade de 0 < z < 0,50 0,1915
Para 110 z = 1,67 sendo que a probabilidade de 0 < z < 1,67 = 0,4525
A probabilidade de ser maior que 103 e menor que 107 igual a 0,4525
0,1915 = 0,2610 ou 26,10%.

BIBLIOGRAFIA
1.

ALTMAN DG Practical statistics for medical research. 1 ed. London: Chapman & Hall, 1991.

2.

ANDERSON DR, SWEENEY DJ, WILLIAMS TA Estatstica aplicada administrao e economia.


2 ed. So Paulo: Pioneira, 2002.

3.

BEIGUELMAN B Curso prtico de bioestatstica. 5 ed. Ribeiro Preto: Fundao de Pesquisas


Cientfica de Ribeiro Preto, 2002.
-9-

4.

BERQU ES, SOUZA JMP, GOTLIEB SLD Bioestatstica. 1 ed. So Paulo: EPU, 1981.

5.

Bland M An introduction to medical statistics. 2 ed. New York: Oxford University Press, 1995.

6.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

7.

BUSSAB WO, MORETTIN PA Estatstica bsica. 5 ed. So Paulo: Saraiva, 2003.

8.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

9.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

10. GUIMARES RC, CABRAL JAS Estatstica. Lisboa: McGraw-Hill, 1997.


11. LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA Estatstica geral e aplicada. So Paulo: Atlas, 2001.
13. SPIEGEL MR Estatstica. 3 ed. So Paulo: Makron Books, 1993.
14. TRIOLA MF Introduo estatstica. 7 ed., Rio de Janeiro: LTC Livros Tcnicos e Cientficos
Editora Ltda, 1999.
15. VIEIRA S Introduo bioestatstica. 3 ed., Rio de Janeiro: Editora Campus, 1980.
16. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

- 10 -

ESTATSTICA DESCRITIVA
Andr Moreno Morcillo1

A divulgao de dados de pesquisa requer o uso de tcnicas universalmente reconhecidas, de tal


forma, que os trabalhos e relatrios possam ser lidos e avaliados por pesquisadores em
diferentes cidades ou pases.
Esta parte da estatstica, cujo objetivo sintetizar e tornar clara a apresentao de dados,
chamada de estatstica descritiva. Entre outras tcnicas, utiliza as tabelas, os grficos, as
medidas de tendncia central, de disperso e de posio, etc.
TABELAS
a) DISTRIBUIO DE FREQNCIAS
Para obtermos uma distribuio de freqncia de dados categricos, basta contarmos quantos
casos ocorrem em cada categoria. Quanto aos dados numricos, inicialmente criamos os
intervalos de classe e, posteriormente, contamos quantos casos ocorrem em cada intervalo.
As freqncias das categorias ou intervalos de classe podem ser expressas por seu nmero
absoluto, pela proporo em relao ao total de casos ou pela porcentagem.
Avaliao nutricional pelo critrio de Gomez de 521 crianas de pr-escolas da cidade de
Paulnia So Paulo (Zanolli,1992)2.
Estado Nutricional

Freqncia absoluta
(N)

Porcentagem
(%)

Proporo

Eutrfico
Desnutridos de I
Desnutridos de II
Desnutridos de III

412
104
5
0

79,1
20,0
1,0
0

0,79
0,20
0,01
0

Total

521

100,0

1,0

Para o clculo da proporo basta dividir a freqncia observada na categoria pelo total de
casos.
proporo de eutrficos = 412 : 521 = 0,790

Professor Assistente Doutor do Departamento de Pediatria da FCM/UNICAMP. Professor da disciplina MP-639 Introduo Anlise Estatstica Biomdica, do curso de ps-graduao em Sade da Criana e do Adolescente
FCM/UNICAMP.
2
Zanolli ML Avaliao do estado nutricional de pr-escolares matriculados nas escolas municipais de educao
infantil de Paulnia SP. Campinas, 1992. Tese (Mestrado em Sade Coletiva), Faculdade de Cincias Mdicas,
UNICAMP.

Neste caso conveniente fazer a aproximao para trs casas decimais.


O calculo da porcentagem de uma determinada categoria muito simples: divide-se a
freqncia absoluta pelo total e multiplica-se por 100.
No exemplo anterior, para o grupo dos eutrficos seria:
% = 412 : 521 x 100 = 79,07869
Geralmente fazemos a aproximao para uma casa decimal que, no exemplo acima, resulta
79,1%.
A interpretao destes dados muito simples. Ao lermos a tabela verificamos que 412 crianas
entre as 512 eram nutridas, o que corresponde a 0,790 ou 79,1% do total.
Em algumas circunstncias pode interessar ao pesquisador apresentar tambm a freqncia
acumulada.
Avaliao nutricional pelo critrio de Gomez de 521 crianas de pr-escolas da cidade de
Paulnia So Paulo (Zanolli, 1992)3
Freqncia absoluta

Porcentagem

Porcentagem acumulada

Estado Nutricional

(N)

(%)

(%)

Eutrfico
Desnutridos de I
Desnutridos de II
Desnutridos de III

412
104
5
0

79,1
20,0
1,0
0

79,1
99,1
100,1
0

Total

521

100,1

100,1

Quando trabalhamos com variveis numricas contnuas torna-se necessrio agrupar os dados
para poder apresent-los na forma de distribuio de freqncias. Os dados so agrupados em
intervalos de classes, cujo nmero no deve ser pequeno ou muito grande, recomendando-se que
varie de 5 a 20. H algumas frmulas para determinar o nmero de classes, mas a lgica e o
bom senso parecem ser mais teis. necessrio ter em mente que os intervalos de classes
devem ser estabelecidos de tal forma que os dados sejam includos em uma nica classe.
Abaixo apresentada uma distribuio de freqncias de uma varivel numrica contnua
(idade em meses) agrupada em intervalos de classe.

Id.
- Estatstica descritiva -

Distribuio da idade(anos) de 521 crianas de pr-escolas da cidade de Paulnia

So Paulo (Zanolli, 1992)4.


Classes de Idade
(meses)
36,0
48,0
60,0
72,0
84,0

|
|
|
|
|

Freqncia absoluta
(N)

Porcentagem
(%)

35
70
168
204
44

6,7
13,4
32,2
39,2
8,4

521

99,9

48,0
60,0
72,0
83,9
96,0

Total

b) DISTRIBUIO DE FREQNCIA DE UMA AMOSTRA EM RELAO A DUAS VARIVEIS


QUALITATIVAS

TABELA DE CONTINGNCIA

Neste caso o objetivo contruir uma tabela contendo informaes sobre o comportamento de
uma populao ou amostra com relao a duas variveis.
Distribuio de 521 crianas de pr-escolas da cidade de Paulnia So Paulo em relao ao sexo e
idade (Zanolli,1992)5.
Sexo
Classes de Idade
(meses)
36,0
48,0
60,0
72,0
84,0

47,9
59,9
71,9
83,9
95,9

Total

Total

Feminino
N (%)

Masculino
N (%)

15
41
81
99
24

(42,9)
(58,6)
(48,2)
(48,5)
(54,5)

20 (57,1)
29 (41,4)
87 (51,8)
105 (51,5)
20 (45,5)

35 (100,0)
70 (100,0)
168 (100,0)
204 (100,0)
44 (100,0)

260 (49,9)

261 (50,1)

521 (100,0)

(%)

Ibid.

. Ibid.
- Estatstica descritiva -

Avaliao nutricional pelo critrio de Gomez em relao sexo de 567 crianas matriculadas nas 14
creches do municpio de Paulnia SP, 1995 (Antonio,1995)6.
Sexo

Eutrofia

D. Leve

D. Moderada

Total

Masculino
Feminino

221 (81,0)
227 (77,2)

49 (17,9)
66 (22,4)

3 (1,1)
1 (0,3)

273
294

Total

448 (79,0)

115 (20,3)

4 (0,7)

567

D. Leve desnutrio de I grau; D. Moderada Desnutrio de II; N (%)

GRFICOS
Os dados categricos podem ser apresentados em grficos do tipo setorial e de barras, enquanto
os numricos podem ser apresentados na forma de histograma, diagrama esquemtico (box-plot)
e de erro padro.
a) GRFICOS SETORIAIS
Os grficos setoriais (pie chart, pizza) so indicados para apresentar a distribuio de dados
qualitativos. A rea do crculo atribuda para cada categoria proporcional sua freqncia. A
maneira mais prtica para determin-la, sabendo-se que ao total (100%) corresponde um ngulo
de 360, :
ngulo desejado = (% x 360)/100
Por exemplo, para uma freqncia de 45% devemos tomar um ngulo de 162:
ngulo desejado = (45 x 360)/100 = 162
A seguir apresentamos um grfico setorial com os dados do exemplo anterior.

Antonio MARGM - Avaliao do estado nutricional e do perfil de crescimento de 568 crianas matriculadas nas 14
creches municipais de Paulnia SP. Campinas, 1995. Tese (Mestrado em Pediatria), Faculdade de Cincias
- Estatstica descritiva -

b) GRFICOS DE BARRA
Da mesma forma que o anterior, este tipo de grfico indicado para apresentar a freqncia de
dados qualitativos. Neste caso a freqncia est relacionada altura da barra, sendo que as
barras devem ter a mesma largura.
A seguir apresentamos um grfico de barras com os dados do exemplo anterior.
100

80

60

40

20

Eutroficos

Desnutridos I
Desnutridos II
Estado Nutricional

Desnutridos III

No figura seguinte apresentamos um grfico de barras expressando a freqncia em relao aos


grupos etrios e sexo de uma amostra.
70
60
50
40
30
20
10
0

36/48

48/60

60/72
Grupo Etario
Feminino

Mdicas, UNICAMP

72/84

84/96

Masculino

- Estatstica descritiva -

c) HISTOGRAMA
Este tipo de grfico utilizado para apresentar a distribuio de dados quantitativos agrupados
em intervalos de classe. As barras so justapostas.
No exemplo abaixo apresentamos um histograma com a distribuio de 5.000 nmeros
aleatrios, sorteados de uma populao com =0 e =1.
2000
1750
1500
1250

(N)

1000
750
500
250
0
-3,5 - -2,5

-2,5 - -1,5

-1,5 - -,5

-,5 - ,5

,5 - 1,5

1,5 - 2,5

2,5 - 3,5

z-score

d) DIAGRAMA ESQUEMTICO (BOX-PLOT)


Este tipo de grfico, extremamente importante na anlise exploratria de dados, foi idealizado
para apresentar a distribuio de dados quantitativos. construdo a partir de cinco pontos: o
menor valor (mnimo), o primeiro quartil, a mediana, o terceiro quartil e o maior valor
(mximo).
Desenha-se um retngulo que passa pelo primeiro e terceiro quartis; a seguir, no interior do
retngulo, assinala-se a mediana. Acrescenta-se dois segmentos de reta iguais, cujo
comprimento igual a 1,5 vezes a amplitude interquartil - um acima do bordo superior e o
outro abaixo do bordo inferior do retngulo. Assinala-se o mximo, o mnimo. Os valores que
no esto includos entre as extremidades dos segmentos de reta so chamados de pontos fora
da curva (ouliers).
No exemplo abaixo apresentamos um diagrama esquamtico com a distribuio de 5.000
nmeros aleatrios, sorteados de uma populao com =0 e =1.

- Estatstica descritiva -

5
4
3

1466

III Quartil

z-score

Mximo

2733
4447
1759
2411
2078
2658
4134
985
3010
4466
4464
467
3275
283
4866
537
3519
2390
3679
4578

Mediana

0
-1
-2
-3

I Quartil
2441
4902
1099
52
4596
4158
3267
824
4808
500
3533
4915
3484
2366
3294
1842
859
2270

-4

Mnimo

e) GRAFICO DE ERRO PADRO


Este grfico apresenta o intervalo de confiana da mdia populacional de dados quantitativos.
A partir de uma amostra, calculamos a mdia e o erro padro. Desenhamos um segmento de reta
com comprimento igual ao intervalo de confiana da mdia da populao e assinalamos a mdia
da amostra.

,06

,05

,04

95
%
CI

Mdia da
amostra

,03

,02

zsco

Intervalo de
confiana

,01

0,00

-,01
-,02

- Estatstica descritiva -

f) DIAGRAMA DE DISPERSO
O diagrama de disperso uma apresentao grfica da relao existente entre duas variveis
quantitativas. No exemplo abaixo o grfico expressa a distribuio da altura em relao idade,
podendo-se observar que como o aumento da idade ocorre um aumento na altura.

170
160
150

Altura (cm)

140
130
120
110
100
90
2

10

12

14

16

Idade (anos)

Alguns tipos de grficos no foram aqui apresentados (de linhas, de rea, etc.) mas que devem
ser considerados teis.
A recomendao final , se possvel, evitar os grficos em trs dimenses, cuja interpretao
pelo leitor fica comprometida. No exemplo abaixo apresentamos os mesmos dados apresentados
em grficos de duas e trs dimenses.
60
60
50
50
40
40
30
30
20

20

10

10

Masculino

Feminino

- Estatstica descritiva -

Masculino

Feminino

Para a apresentao de dados quantitativos, alm das tabelas e grficos, podemos utilizar
alguns mtodos numricos, cujo objetivo descrever o que ocorre no centro da distribuio e a
forma como os dados da amostra esto dispersos. Estes mtodos podem ser divididos em:

MEDIDAS DE TENDNCIA CENTRAL: mdia, moda e mediana

MEDIDAS DE DISPERSO: amplitude mxima, amplitude interquartil, varincia, desvio


padro e coeficiente de variao

MEDIDAS DE POSIO: quartis e z-score

MEDIDAS DE TENDNCIA CENTRAL


MDIA ARITMTICA
A mdia aritmtica a soma dos valores medidos, dividida pelo nmero de casos. Indicamos a
mdia de uma populao por e a da amostra por x .

X
N

X = soma dos valores da populao


N = nmero de casos da populao

x=

x
n

x = soma dos valores da amostra


n = nmero de elementos da amostra
Exemplo: dado um conjunto de nmeros [ 100; 101; 105,2; 99,2; 100,5] sua mdia ser:

x=

(100 + 101 + 105,2 + 99,2 + 100,5) = 101,18


5

Observao:
A mdia uma das medidas mais usadas, no entanto, apresenta uma grande desvantagem: sofre
grande influncia de valores extremos (muito grandes ou muito pequenos) em relao ao
conjunto dos dados da amostra.
No exemplo acima, se trocarmos o valor 100 por 60 a mdia passa a ser:
- Estatstica descritiva -

x=

(60 + 101 + 105,2 + 99,2 + 100,5) = 93,18


5

A troca de um nico elemento da amostra causou uma diminuio de 8 unidades na mdia.


A mdia aritmtica representa com certeza o centro da distribuio, quando as variveis tm
distribuio simtrica.

MEDIANA
Se ordenarmos a amostra (ordem crescente), a mediana (percentil 50 ou II quartil) o valor da
varivel do elemento que ocupa o centro da distribuio. A mediana divide a amostra em dois
grupos que tm o mesmo nmero de casos, sendo que metade destes tm valores menores que a
mediana e a outra metade, valores maiores.
Para a sua determinao, primeiramente a amostra deve ser ordenada (ordem crescente) e, a
seguir, identifica-se o elemento que ocupa a posio central. O valor da varivel deste elemento
ser a mediana.
No exemplo anterior - dado um conjunto de nmeros

[ 100; 101; 105,2; 99,2; 100,5] :

Inicialmente ordenamos os dados

[99,2; 100; 100,5; 101; 105,2]

Ordem

Valor

99,2

100

100,5

101

105,2

O centro da distribuio ocupado pelo 3 elemento cujo valor 100,5. A mediana desta
amostra 100,5
md = 100,5
A etapa fundamental na determinao da mediana a identificao do elemento que
ocupa o centro da distribuio ordenada. Neste aspecto temos que considerar duas situaes
diferentes:
a) O nmero de casos da amostra mpar
O centro da distribuio ser ocupado pelo elemento cuja ordem dada por:
n +1
2
n = nmero de casos da amostra.
Elemento Central =

- Estatstica descritiva -

10

b) O nmero de casos da amostra par


Nesta circunstncia dois elementos ocupam o centro da distribuio, cujas ordens podem ser
determinadas por:
n
2
n
Segundo Elemento = + 1
2
n = nmero de casos da amostra.
Primeiro Elemento =

A mediana ser estimada por interpolao, correspondendo mdia aritmtica dos valores
destes dois elementos.
Por exemplo, se tivermos uma amostra com 10 elementos:

Primeiro Elemento =

10
= 5
2

Segundo Elemento =

10
+ 1 = 6
2

10

Outro exemplo: em um conjunto de 6 elementos [100; 105; 101; 98; 99; 103]
1.

ordenamos a amostra: -

[98; 99; 100; 101; 103; 105]

2.

determinamos os elementos centrais:


Primeiro elemento = 6 / 2 = 3
Segundo elemento ser o 4

3.

98

99

100

101

103

105

calculamos a mediana:

md =

(100 + 101) = 100,5


2

Observao: a mediana no sofre a influncia de elementos extremos. No exemplo acima, se o


sexto elemento fosse 1050 a mediana da distribuio seria a mesma.

- Estatstica descritiva -

11

MODA
A moda expressa os valores que tm maior freqncia no grupo de estudo.
Uma vez realizada a distribuio de freqncias, fica fcil determinar a moda: basta identificar o
valor ou valores que apresentam maior freqncia.
Podemos ter distribuies de dados sem moda, com uma moda (unimodal), com duas (bimodal)
ou mais de duas modas (multimodal).
No exemplo acima todos os valores ocorrem uma nica vez, portanto esta distribuio no
apresenta moda.
Ao tomarmos uma amostra com 15 crianas de uma escola, poderamos obter as seguintes
idades (anos):
7; 6; 7; 7; 8; 5; 4; 7; 8; 9; 7; 7; 7; 7;7
A distribuio de freqncias ser:
Valor
4
5
6
7
8
9

Freqncia
1
1
1
9
2
1

A idade que apresentou a maior freqncia 7 anos; portanto, a moda desta distribuio 7
anos.
MEDIDAS DE DISPERSO
APLITUDE MXIMA [RANGE]
A amplitude mxima a diferena existente entre o maior (mximo) e o menor (mnimo) valor
observado. Por ser uma medida de disperso calculada a partir de dois elementos, expressa de
forma limitada a disperso do conjunto dos dados.
Exemplo: considerando as idades (anos) de uma amostra de 10 crianas:
7; 5; 6; 7; 8; 6; 6; 8; 5; 4
Menor valor observado = 4 anos
Maior valor observado = 8 anos
Amplitude Mxima = 8 4 = 4 anos

- Estatstica descritiva -

12

VARINCIA
Para determinar a varincia calculamos a diferena (desvio) de cada elemento da amostra em
relao mdia aritmtica. A seguir, estas diferenas (desvios) so elevadas ao quadrado e,
finalmente, calculamos a sua mdia.
Indicamos a varincia de uma populao por 2 e de uma amostra por s2

( X )
=

N
Quando trabalhamos com amostras, temos o interesse de que a varincia (s2) calculada seja

representativa da varincia da populao. Levando em conta este fato, a varincia da amostra


deve ser calculada pela frmula:

( x x)
=

n 1

Observe que a soma dos quadrados dos desvios foi dividida por (n-1).
Exemplo: considerando as idades (anos) de uma amostra de 10 crianas:
7; 5; 6; 7; 8; 6; 6; 8; 5; 4
1. calculamos a mdia

x=

(7 + 5 + 6 + 7 + 8 + 6 + 6 + 8 + 5 + 4) = 6,2
10

2. montamos uma tabela para facilitar os clculos.

(x x )

Idades

(x x )

desvio

desvio2

7
5
6
7
8
6
6
8
5
4

0,8
-1,2
-0,2
0,8
1,8
-0,2
-0,2
1,8
-1,2
-2,2

0,64
1,44
0,04
0,64
3,24
0,04
0,04
3,24
1,44
4,84

Total

0,0

15,6

( x x)
=
n 1

15 ,6
= 1,7333 anos2
9

- Estatstica descritiva -

13

Se tivermos um pouco de pacincia, por transformaes algbricas simples, podemos


desenvolver

( x x)

, chegando a uma expresso equivalente, que apresenta a vantagem de

no usar a mdia.

( x x )

( x)

Assim, passamos a contar com uma nova maneira de calcular a varincia:

( x)

n
n 1
Retomando o exemplo anterior e aplicando este novo mtodo temos:

Idades

x2

7
5
6
7
8
6
6
8
5
4

7
5
6
7
8
6
6
8
5
4

49
25
36
49
64
36
36
64
25
16

Total

62

400

s2 =

(
x2
n 1

x)
n

2
=

(62) 2
2
10 = 15 ,6 = 1,7333
anos
9
9

400

DESVIO PADRO
O desvio padro a raiz positiva da varincia. Indicamos o desvio padro de uma populao por
e de uma amostra por s.
= varincia = 2 ou s = varincia = s 2

No exemplo anterior ser:

s = s2 = 1,7333 = 1,3165 anos

- Estatstica descritiva -

14

Como o desvio padro a raiz quadrada da varincia, ele passa a receber a unidade original em
que os dados foram medidos. No exemplo anterior a unidade da varincia era anos2 e a do
desvio padro anos.
O desvio padro representa quanto, em mdia, cada observao est distante da mdia. Quanto
mais prximas da mdia, menor ser o desvio padro, quanto mais distantes maior ele ser.
Quando em uma amostra todas as observaes tm o mesmo valor, o desvio padro ser igual a
zero.

COEFICIENTE DE VARIAO
O coeficiente de variao a razo entre o desvio padro e a mdia da amostra, expressa em
porcentagem. O coeficiente de variao uma medida usada para comparar as disperses de
duas amostras.
CV =

s
x

.100

Por exemplo: deseja-se saber se a disperso das idades de alunos de duas classes so muito
diferentes:
Classe A x =10,2 e s = 2,4
Classe B x =8,9 e s = 3,2

2,4
s
.100 =
.100 = 23,5%
10,2
x
s
3,2
CV = .100 =
.100 = 35,9%
8,9
x

CV =

A disperso da classe B 1,52 vezes da classe A.

MEDIDAS DE POSIO
QUARTIS
Estando a amostra ordenada (crescente), os quartis so valores da varivel que dividem o
conjunto dos dados em quatro partes iguais, cada uma contendo 25% dos casos.
O I quartil corresponde ao percentil 25; o II quartil correponde ao percentil 50, sendo
tambm chamado de mediana; o III quartil corresponde ao percentil 75. Chamamos de
amplitude interquartil diferena entre o III e o I quartil.
Amplitude Interquartil = III Quartil I Quartil

- Estatstica descritiva -

15

P25

P50

P75

Mediana
I Quartil

II Quartil

IIIQuartil

25% dos casos

25% dos casos

25% dos casos

Amplitude Interquartil

25% dos casos

Inicialmente ordenamos a amostra (crescente) e, a seguir, identificamos os elementos que


dividem a populao em quatro grupos com igual nmero de casos.
Para determinar a ordem do elemento que corresponde ao percentil desejado, utiliza-se a
seguinte frmula:
J=

(n + 1) . P
100

onde n o tamanho da amostra e P o percentil desejado.


Abaixo apresentamos exemplos da forma de se determinar o elemento correspondente ao I
quartil, III quartil e mediana
Para o I Quartil:
Para o III Quartil:
Para a mediana:

J=

(n + 1) 25

100
(n + 1) 75
J=
100
J=

(n + 1) 50
100

A seguir, procuramos o valor de quartil desejado:


a) Se J um nmero inteiro, o valor da varivel do elemento de ordem J ser o quartil.
b) Se J no inteiro, temos que fazer uma interpolao entre o elemento de ordem J e seu
sucessor (J+1):
Considerando j a parte inteira e g a poro decimal de J aplicamos a seguinte frmula:

- Estatstica descritiva -

16

Quartil =

x J + g. x(J + 1) x(J )

Por exemplo, para calcular o I quartil quando n = 11, :

J=

(11 + 1) 25 = 12 25 = 3
100

100

Como J = 3 um nmero inteiro, o I quartil ser o valor da varivel do elemento de ordem


j=3
Por outro lado, para calcular o I quartil quando n = 10:
J=

como

(n + 1) 25 = 11 25 = 2,75
100

100

J = 2,75 no um nmero inteiro


j=2;

(j + 1) = 3;

temos:

g = 0,75

Aplicando a frmula para interpolao teremos:

Quartil = x 2 + 0,75. x 3 x 2

Basta verificar o valor X e X na srie ordenada e realizar o clculo para se obter a estimativa
2

do I quartil.
Z-SCORE
O z-score a posio relativa dos elementos da amostra em relao mdia aritmtica. O
objetivo expressar em unidades de desvio padro quanto um determinado caso est distante da
mdia.
Para o clculo do z-score necessrio conhecer a mdia e o desvio padro. A partir deste dados,
utilizamos a frmula:

z score =

(x x )
s

onde:
x : valor da varivel

x : mdia da amostra
s : desvio padro da amostra

Exemplo: dado o conjunto de nmeros [ 100; 101; 105,2; 99,2; 100,5]

- Estatstica descritiva -

17

Inicialmente calculamos e mdia e o desvio padro:

x =101,18 e

s = 2,34

O z-score de 105,2 :

z score =

( x x ) = 105,2 101,18 = 1,71


s

2,34

Este elemento est situado 1,71 unidades de desvio padro acima da mdia
O z-score de 100 :

z score =

( x x ) = 100,0 101,18 = 0,50


2,34

Este caso est situado 0,50 unidades de desvio padro abaixo da mdia
O z-score de 101,18 :
z score =

( x x ) = 101,18 101,18 = 0
s

2,34

Z-score = 0 significa que o caso tem valor igual mdia

ANLISE EXPLORATRIA DE DADOS


Antes de iniciar a descrio da amostra ou mesmo a aplicao de testes estatsticos necessrio
fazer uma anlise preliminar, cujo objetivo conhecer a intimidade dos dados e detectar
possveis erros que possam interferir com os resultados da pesquisa.
Os dados suspeitos so aqueles que esto muito distantes do centro da distribuio, que at
podem ocorrer, mas que, s vezes, resultam de erro de medida, de anotao ou de digitao.
Por exemplo, em um estudo sobre altura de crianas de idade escolar, encontramos casos com
valor 220cm e 240cm. O mais provvel que tenha ocorrido erro de anotao ou de digitao.
Se estes casos no forem retirados da amostra, haver sria distorso da mdia, do desvio
padro e comprometimento dos testes estatsticos.
Estes valores extremos so chamados de pontos fora da curva (outliers).
Considera-se pontos fora da curva aqueles que so maiores que Q3+1,5AIQ ou menores que
Q1-1,5AIQ, onde 1,5AIQ 1,5 vezes a amplitude interquartil.
Cinco pontos so fundamentais para a explorao inicial dos dados:
- Estatstica descritiva -

18

o mnimo, o I quartil, a mediana, o III quartil e o mximo. Com estes pontos calculamos a
amplitude interquartil (AIQ). A seguir construmos um grfico que recebe o nome de Diagrama
Esquemtico (Box-Plot).
Marcamos o mnimo e o mximo; desenhamos um retngulo que passa por Q1 e Q3; no interior
do retngulo assinalamos a mediana. Desenhamos dois segmentos de reta com comprimento
igual a 1,5 a AIQ. O primeiro, acima do bordo superior do retngulo e o outro, abaixo da bordo
inferior. Na figura abaixo apresentamos, com finalidade didtica, a estrutura do diagrama
esquemtico na posio horizontal.

mnimo

Q1

mediana

Q3

mximo

Os casos cujos valores no esto includos entre os dois extremos dos segmentos de reta devem
ser reavaliados antes de se prosseguir na anlise dos dados. Na figura abaixo apresentamos um
tpico grfico de box-plot.
80
6710

60

40

3076
6186
6482
327
8450
9314
2910
835
6649
4870
1387
4415
7614
6839
8221
9301
7570
4709
4332
4657
448
3609
8941
2219
5933
4263
2934
8461
9788
3778
8418
8723
2326
8893

valores absolutos

20

-20

-40

-60

9501
3027
4173
2005
2136
4747
9542
6795
4235
4424
1535
8950
9608
1517
8070
6166
3565
8082
285
3185
9916
3448
9414
7084
8122
5669
4282
1499
2051
21
4143
6691
8829
8144
7790
1151

-80

- Estatstica descritiva -

19

BIBLIOGRAFIA
1.

ALTMAN DG Practical statistics for medical research. 1 ed. London: Chapman & Hall, 1991.

2.

ANDERSON DR, SWEENEY DJ, WILLIAMS TA Estatstica aplicada administrao e economia.


2 ed. So Paulo: Pioneira, 2002.

3.

BEIGUELMAN B Curso prtico de bioestatstica. 5 ed. Ribeiro Preto: Fundao de Pesquisas


Cientfica de Ribeiro Preto, 2002.

4.

BERQU ES, SOUZA JMP, GOTLIEB SLD Bioestatstica. 1 ed. So Paulo: EPU, 1981.

5.

Bland M An introduction to medical statistics. 2 ed. New York: Oxford University Press, 1995.

6.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

7.

BUSSAB WO, MORETTIN PA Estatstica bsica. 5 ed. So Paulo: Saraiva, 2003.

8.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

9.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

10. GUIMARES RC, CABRAL JAS Estatstica. Lisboa: McGraw-Hill, 1997.


11. LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA Estatstica geral e aplicada. So Paulo: Atlas, 2001.
13. PIEDRABUENA AE Elementos de bioestatstica. Unicamp [apostila], 1995.
14. SPIEGEL MR Estatstica. 3 ed. So Paulo: Makron Books, 1993.
15. TRIOLA MF Introduo estatstica. 7 ed., Rio de Janeiro: LTC Livros Tcnicos e Cientficos
Editora Ltda, 1999.
16. VIEIRA S Introduo bioestatstica. 3 ed., Rio de Janeiro: Editora Campus, 1980.
17. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

- Estatstica descritiva -

20

TESTE DE HIPTESES
Andr M. Morcillo

O objetivo fundamental verificar se os dados amostrais (ou estimativas obtidas


a partir deles) so ou no compatveis com determinadas populaes (ou com
valores previamente fixados dos correspondentes parmetros populacionais.
Trata-se, na verdade, de uma forma lgica de organizao do pensamento, que nos ajudar a
decidir se os resultados obtidos na pesquisa confirmam ou contradizem os dados existentes at
ento na literatura.
Tomar decises parte do nosso cotidiano:
Decidir sobre o trajeto para ir cidade; qual roupa colocar para ir a uma festa; qual escola
colocar os filhos; quando realizar a compra de um automvel melhor e mais caro; comprar ou
no os livros de Bioestatstica; etc.
Em todos os casos pondera-se as vantagens e os riscos. Em condies normais, um adulto sadio,
sempre escolher a opo que lhe oferea mais vantagens e menor risco.
Este processo automtico no se escrevem as hipteses, no se aplica um mtodo tcnico,
no se calculam as probabilidades. Isto se deve ao fato de que ao longo dos anos fomos
treinados para realizar estas tarefas.
No entanto, quando o empreendimento muito importante comprar uma nova casa, viajar ao
exterior, etc. reunimos a famlia vrias vezes, com muito papel e lpis e, aps muitas horas e
muita ansiedade, decide-se sobre o assunto.
Importante: em todos os casos sabamos com clareza qual era o nosso problema,
conhecamos os riscos.

Decidir sobre o trajeto de uma viagem implica em ter conhecimento dos problemas de trnsito
local, da planta da cidade, etc. No h como decidir sobre o melhor trajeto a ser tomado em uma
cidade desconhecida, de um pas desconhecido.
Quanto a roupa, temos que saber como ser a festa: uma reunio de amigos, uma solenidade
formal com autoridades, etc.
No se pode decidir sobre a compra de uma nova casa se no se sabe como ela , em qual
bairro, rua ou cidade est localizada.
Sem ir at a escola, conhecer sua linha pedaggica, etc., fica muito difcil avaliar se vale a pena
colocar os filhos para estudar l.
Quanto aos livros de Bioestatstica o assunto mais delicado ...
Voltando para a Bioestatstica ...

Professor Assistente Doutor do Departamento de Pediatria FCM/Unicamp

O objetivo fundamental o de verificar se os dados amostrais (ou estimativas obtidas a


partir deles) so ou no compatveis com determinadas populaes (ou com valores
previamente fixados dos correspondentes parmetros populacionais.

... so ou no compatveis com determinadas populaes ... implica em conhecer profundamente a


situao atual do conhecimento cientfico naquela rea de pesquisa.
... o de verificar se os dados amostrais ... neste caso, a partir de uma dvida ou preocupao,

realiza-se um ensaio cientfico


A seguir ponderando os riscos, conclui-se a respeito da dvida em relao verdade
estabelecida.
Como no somos treinados ao longo da vida para este tipo de anlise e pesquisa, o mais
recomendvel que deixemos bem claro, no papel, ainda na fase do projeto de pesquisa, qual
a nossa dvida ou preocupao, etc., na forma de hipteses de trabalho.
... a literatura afirma que crianas asmticas no tm qualquer distrbio de crescimento,
porm, acredito que as crianas asmticas, de famlias mais pobres, sofram um maior
impacto da doena, o que determina estatura menor ...

Para este caso em particular, parece prudente estudar dois grupos de crianas com asma
brnquica: um constitudo por crianas de nvel social alto e o outro por crianas de nvel social
baixo. Avaliamos as suas alturas, comparamos as suas mdias, avaliamos os riscos, tomamos
uma deciso.
a) Olha! Eu no disse que elas eram menores! A diferena muito grande, escandalosa! Vamos
mudar este conceito!
b) Olha. A diferena entre as mdias muito pequena. difcil decidir. Acho que temos que discutir
melhor os dados e, provavelmente, realizar outro trabalho.

No primeiro caso rejeita-se os conhecimentos estabelecidos at ento; no segundo, isto no


feito.
A Hiptese Nula (H0)
Recomenda-se que a hiptese nula seja sempre estabelecida na forma de uma igualdade,
afirmando que os resultados que sero encontrados no experimento so iguais aos relatados na
literatura.
No caso das crianas asmticas.
H0: a mdia das alturas das crianas asmticas de nvel social menos favorecido (NSB) igual
mdia das crianas asmticas de nvel social superior (NSA).
Do ponto de vista da Bioestatstica escrevemos:
H0:

NSB = NSA
2

A Hiptese Alternativa (H1)


Ela expressar a hiptese de trabalho do pesquisador, recomendando-se que sempre seja
estabelecida na forma de diferenas do tipo maior que, menor que, diferente de.
Novamente, em relao s crianas asmticas.
H1: a mdia das alturas das crianas asmticas de nvel social menos favorecido menor que a
mdia das crianas asmticas de nvel social superior.
Do ponto de vista da Bioestatstica escrevemos:
H1:

NSB < NSA

Finalmente, temos:

H0:

NSB > NSA

H1:

NSB < NSA

Nvel de Significncia ()

um ponto de corte arbitrrio, adotado pelo pesquisador, para definir um risco mximo que se
pode corre ao rejeitar H0 em funo dos resultados obtidos.
Na verdade temos uma distribuio de probabilidades sob condio de H0. Se encontramos no
nosso experimento uma probabilidade de ocorrncia do evento sob H0 muito pequena, sabemos
que pequena () a probabilidade de rejeitarmos H0 sendo ela verdadeira.

Testes Unilaterais e Bilaterais

Os testes so unilaterais quando eles exprimem claramente qual o sentido da diferena que se
estuda (maior que ou menor que). Por outro lado, quando o pesquisador no sabe exatamente o
que busca, ele define H1 coma uma diferena (por ser maior que ou menor que)
Unilaterais:
H0:

NSB > NSA

H1:

NSB < NSA


ou

H0:

NSB < NSA

H1:

NSB > NSA

Bilaterais:

H0:

NSB = NSA

H1:

NSB NSA

Erros tipo I e tipo II

Em relao a H0 pode-se cometer dois tipos de erro:


a) ela rejeitada sendo verdadeira
Neste caso temos o erro tipo I que determinado pelo pesquisador ao definir o nvel de
significncia () = 1%, 5%, 10%, etc
b) ela no rejeitada sendo falsa
Neste caso temos o erro tipo II cuja probabilidade . mais difcil de ser controlado pelo
pesquisador e est relacionado ao e ao N.
Para um determinado N ao diminuirmos consequentemente elevamos .
Como o pesquisador define previamente e o mantm fixo durante a pesquisa, a nica maneira
de diminuir aumentar o tamanho da amostra (N).
Chama-se poder de um teste a probabilidade complementar de que igual a:
Poder = 1-
A condio ideal para o pesquisador aquela em que tanto quanto so pequenos.
Decises possveis em um teste de hipteses

H0 verdadeira

H0 falsa

Rejeita-se H0

Erro tipo I ()

deciso correta (1-)

Aceita-se H0

deciso correta (1-)

Erro tipo II ()

Teste Estatstico

Uma vez definido , e calculado o N passa-se a escolha do melhor teste para o tipo de anlise
que se deseja. Isto feito considerando-se o tipo de varivel e a sua distribuo (normal,
binomial, poisson, etc.)
Executa-se o teste, calcula-se a probabilidade de ocorrncia dos dados amostrais sob H0 e tomase a deciso de rejeitar ou no H0.
4

ETAPAS DE UM TESTE DE HIPTESES

Faz-se um questionamento

Reviso da literatura

Estabelece-se H0 e H1
Determina-se N, e

Levantamento dos dados

Seleciona-se e aplica-se um teste


estatstico

Tomada de deciso

Se p > no se
rejeita H0

Se p rejeitase H0

BIBLIOGRAFIA
1.

ALTMAN DG Practical statistics for medical research. 1 ed. London: Chapman & Hall, 1991.

2.

ANDERSON DR, SWEENEY DJ, WILLIAMS TA Estatstica aplicada administrao e economia.


2 ed. So Paulo: Pioneira, 2002.

3.

BLAND M An introduction to medical statistics. 2 ed. New York: Oxford University Press, 1995.

4.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

5.

BUSSAB WO, MORETTIN PA Estatstica bsica. 5 ed. So Paulo: Saraiva, 2003.

6.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

7.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

8.

SPIEGEL MR Estatstica. 3 ed. So Paulo: Makron Books, 1993.

9.

VIEIRA S Introduo bioestatstica. 3 ed., Rio de Janeiro: Editora Campus, 1980.

10. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

TESTE DE KOLMOGOROV-SMIRNOV
Andr M. Morcillo1

Esta prova avalia se duas amostras tm distribuies semelhantes ou, melhor dizendo, se foram
extradas de uma mesma populao. Se as diferenas observadas entre elas forem grandes
provvel que no se devam ao acaso. muito sensvel, detectando diferenas em relao
tendncia central, disperso e simetria. Pode ser utilizada para dados medidos nas escalas
ordinal, intervalar ou de razo, no havendo a exigncia que estes tenham distribuio normal.
O princpio bsico comparar as freqncias acumuladas das duas amostras.
PROCEDIMENTOS
1. Ordenamos as duas amostras
2. Construmos as distribuies de freqncias acumuladas nos intervalos de classe de cada
amostra
3. Calculamos as diferenas entre as freqncias acumuladas de cada amostra em cada um dos
intervalos de classe. Este captulo est estruturado sempre considerando as diferenas entre
a primeira e a segunda amostra (A-B)
4. Escolhemos a maior diferena [Dmax] que ser comparada com Dcrtico
Se D Dcrtico rejeitamos a hiptese de igualdade das amostras.

DETERMINANDO D
a) Quando n1 = n2 40
Neste caso o procedimento simples. Uma vez estabelecidos os intervalos de classe,
determinamos as freqncias acumuladas de cada amostra. A seguir, calculamos as diferenas
entre as freqncias acumuladas das amostras em cada um dos intervalos de classe. O valor de
Dmax ser escolhido em funo do teste de hipteses estabelecido:
A diferena com maior valor absoluto |D| para os testes bilaterais, ou o valor absoluto da
diferena com menor valor negativo ou com o maior valor positivo nos testes unilaterais.

Prof. Assistente Doutor do Departamento de Pediatria da FCM/Unicamp

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

b) Quando n1 ou n2 > 40 ou n1 n2
Neste caso, deve-se determinar a proporo que cada amostra apresenta nos intervalos de classe.
A seguir, calculamos as diferenas entre as propores de cada amostra nestes intervalos de
classe.
Lembre-se que a proporo de casos dentro de uma determinada classe igual freqncia
observada na classe dividida pelo nmero de casos da amostra. Seja fi a freqncia em uma
classe i e n o nmero de casos da amostra, a proporo pi na classe i ser:

f
pi = i
n
O valor de Dmax ser o valor absoluto de uma das diferenas e ser escolhido considerando o
teste de hipteses estabelecido:
A diferena com maior valor absoluto |D| para os testes bilaterais, ou o valor absoluto da
diferena com menor valor negativo ou com o maior valor positivo nos testes unilaterais.

TESTE DE HIPTESES
1. TESTES BILATERAIS
H0 : as amostras tm a mesma distribuio
H1 : as amostras tm distribuies diferentes

Nos teste bilaterais seleciona-se a diferena com maior valor absoluto, que ser chamada de
Dmax para comparao com Dcrtico .
Se |Dmax| Dcrtico, rejeitamos H0, concluindo que as populaes tm distribuies diferentes.

2. TESTES UNILATERAIS
a) A POPULAO A MAIOR QUE A B
H0 : a populao A tem valores iguais ou menores que a populao B
H1 : a populao A tem valores maiores que a populao B

Neste caso seleciona-se a diferena com o maior valor positivo, que simbolicamente ser
+

chamada de D .
2

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Se D Dcrtico, rejeitamos H0, concluindo que a populao A tem valores maiores que a
populao B.
b) A POPULAO A MENOR QUE A B
H0 : a populao A tem distribuio diferente sendo seus valores iguais ou maiores que a populao
B
H1 : a populao A tem distribuio diferente sendo seus valores menores que a populao B

Neste caso seleciona-se a diferena com o menor valor negativo, cujo valor absoluto ser
simbolicamente chamado de D .
-

Se D Dcrtico, rejeitamos H0, concluindo que a populao A tem valores menores que a
populao B.
O VALOR DE DCRITICO
A) QUANDO AS AMOSTRAS SO PEQUENAS E DE MESMO TAMANHO ( N1 = N2 40 )
Neste caso o valor de Dcrtico obtido na tabela de distribuio de D para pequenas amostras.
B) GRANDES AMOSTRAS EM TESTES BILATERAIS
Se n1 ou n2 so maiores que 40, seja n1 = n2 ou n1 n2, obtm-se o valor de Dcrtico atravs
das frmulas:
Para

Para

Para

=0,05

=0,025

=0,01

= 1,36

= 1,48

= 1,63

critico

critico

critico

n +n
n n
1

n +n
n n
1

n +n
n n
1

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

C) GRANDES AMOSTRAS EM TESTES UNILATERAIS


Se n1 ou n2 so maiores que 40, seja n1 = n2 ou n1 n2, utiliza-se um teste de

2 obtido a

partir da frmula abaixo, com dois graus de liberdade:

= 4 Dmax

n n
n +n
1

Se o 2 calculado for maior ou igual ao 2crtico pode-se rejeitar H0.


Os valores crticos de 2 com 2 graus de liberdade so:

Nvel de significncia

2crtico

0,05

5,99

0,01

9,21

0,001

13,82

Observao: Esta frmula pode ser usada na comparao de amostras pequenas que tenham
diferentes nmero de casos (n1 n2 < 40). Neste caso a prova muito segura. Se H0 rejeitada,
pode-se ficar estatisticamente tranqilos.
Exemplo para n1=n2<40 Foram sorteadas 10 meninos e 10 meninas de uma classe de terceira
srie do ensino fundamental. Deseja-se saber se h diferena entre as idades dos dois grupos. A
idade em anos de cada criana apresentada abaixo.
Meninos: 7,5; 8,1; 9,1; 9,0; 7,7; 7,9; 8,1; 7,3; 7,9; 8,7
Meninas: 8,5; 8,3; 7,1; 7,0; 8,7; 7,8; 7,1; 8,3; 7,7; 7,7
H0 : meninos e meninas tm a mesma distribuio de idade
H1 : a distribuio de idade de meninos e meninas diferente

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Como o nmero de meninos (n1) igual ao de meninas (n2) e menores que 40, o valor de Dcrtico
obtido na tabela de D.
Para um teste bilateral com N=10 e =0,05, temos Dcrtico = 7
a) ordenamos os valores das amostras
b) Usando intervalos de classe de 6 meses, montamos a tabela abaixo

Classe de

Meninos

Meninas

idade

facum

facum

Diferena

Meninos

Meninas

das facum

|D|

7,0 | 7,5

-2

7,5 | 8,0

8,0 | 8,5

-1

8,5 | 9,0

10

-2

9,0 | 9,5

10

10

Como o teste bilateral tomamos a diferena entre as freqncias acumuladas com maior valor
absoluto | D | = | -2 | = 2 , portanto, Dmax = 2.
Como o Dmax menor que o Dcrtico,

( 2 < 7 ) no podemos rejeitar H0, concluindo que os

dois grupos tm semelhantes distribuies de idade.

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Exemplo para n1n2>40 Sortearam-se ao acaso dois conjuntos com 45 elementos com a
expectativa que tivesssem mdia 100 e desvio padro 15. Como este sorteio foi realizado
utilizando um software, deseja-se verificar se h diferena entre as duas amostras.

Grupo 1

Grupo 2

92

110

103

113

95

83

106

100

81

77

105

81

125

113

92

98

121

73

101

123

106

104

79

89

111

96

97

106

121

92

80

75

104

121

118

102

84

91

108

83

65

111

85

112

64

108

76

116

97

93

96

103

106

93

104

77

95

101

107

83

81

93

122

123

109

111

129

104

102

98

89

114

121

85

104

93

97

78

89

116

92

78

108

110

81

97

106

105

131

98

Procedimentos:
a) Estabelecemos os intervalos de classe
b) Determinamos as freqncias dentro de cada intervalo de classe
c) Determinamos as freqncias acumuladas nos intervalos de classe
d) Calculamos as propores das freqncias acumuladas dentro de cada intervalo de classe
e) Calculamos as diferenas entre a proporo do grupo 1 do grupo 2 dentro de cada intervalo
de classe
f) Selecionamos D
g) Calculamos Dcrtico e tomamos a deciso

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Grupo 1

Grupo 2

p1-p2

facumulada

p1

facumulada

p2

60 --| 65

0,022

0,022

65 --| 70

0,022

0,022

70 --| 75

0,044

0,044

75 --| 80

0,089

0,156

-0,067

80 --| 85

0,200

11

0,244

-0,044

85 --| 90

11

0,244

13

0,289

-0,045

90 --| 95

18

0,400

17

0,378

0,022

95 --| 100

24

0,533

21

0,467

0,066

100 --| 105

31

0,689

27

0,600

0,089

105 --| 110

36

0,800

34

0,756

0,044

110 --| 115

39

0,867

38

0,844

0,023

115 --| 120

40

0,889

40

0,889

120 --| 125

44

0,978

44

0,978

125 --| 130

45

1,000

44

0,978

0,022

130 --| 135

45

1,000

45

1,000

Total

45

45

A diferena entre as propores das freqncias acumuladas com maior valor absoluto ocorreu
na classe [100 -- | 105], portanto, o nosso Dmax = | 0,089 | = + 0,089.
Considerando um teste bilateral com = 0,05 temos:

n1 + n2
45 + 45
= 1,36 .
= 1,36 . 0,210818 = 0,2867
n1 . n2
45 . 45

D crtico;0.05 = 1,36 .

Como o valor do Dmax calculado menor que o Dcrtico no podemos rejeitar H0.
Se, por outro lado, nosso teste de hipteses fosse unilateral, teramos que calcular o 2 e
compar-lo com o 2crtico.
H0 : grupo 1 = grupo 2
H1 : grupo 1 maior que o grupo 2

= 4 . Dmax .

n1 . n2
= 4 . 0,007921 . 22,5 = 0,7128
n1 + n2

Como o 2 calculado menor que o 2 crtico (2 0,05;2gl = 5,99) no podemos rejeitar H0.
7

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Tabela de Dcrtico do teste de Kolmogorov-Smirnov para duas amostras pequenas e


independentes (n1 = n2 40).

N
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40

Testes Unilaterais

Teste Bilaterais

=0,05

=0,01

=0,05

=0,01

3
4
4
5
5
5
6
6
6
6
7
7
7
7
8
8
8
8
8
9
9
9
9
9
9
10
10
10
11
11

5
6
6
6
7
7
8
8
8
8
9
9
9
10
10
10
10
11
11
11
11
11
12
12
12
12
13
14

4
5
5
6
6
6
7
7
7
7
8
8
8
8
9
9
9
9
9
10
10
10
10
10
11
11
11
12
13

5
6
6
7
7
8
8
8
9
9
9
10
10
10
10
11
11
11
11
12
12
12
12
13
13
13
-

Se D Dcrtico, rejeita-se H0

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

BIBLIOGRAFIA
1.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

2.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

3.

CAMPOS H Estatstica experimental no-paramtrica. 3 ed. Piracicaba. Departamento de


Matemtica e Estatstica da Escola Superior de Agricultura Luiz de Queiroz da Universiade de So
Paulo, 1979.

4.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

5.

LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.

6.

SIEGEL S Estatstica no-paramtrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7.

VIEIRA S Bioestatstica: tpicos avanados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984

TESTE DE KRUSKAL-WALLIS
Andr M. Morcillo1

Este teste foi proposto para avaliar se trs ou mais amostras so iguais (procedentes de uma mesma
populao) ou diferentes. o substituto da Anlise de Varincia quando esta no pode ser utilizada, j
que no exige a homogeneidade das varincias, que as amostras tenham sido tomadas ao acaso e que
tenham distribuio normal. As amostras devem ser independentes e medidas nas escalas ordinal,
intervalar ou de razo.
COMO FAZER
Dado um conjunto de N observaes pertencentes a k amostras independentes:
1.

Ordena-se em ordem crescente o conjunto das N observaes (todas as amostras)

2.

Atribui-se os postos ou ranks a cada observao. Quando houver empates cada elemento dever
receber a mdia aritmtica dos respectivos postos.

3.

Soma-se os postos de cada amostra (Rj)

4.

Calcula-se

5.

Calcula-se a estatstica H

6.

Toma-se a deciso quanto a rejeio de H0

(Rj)2/nj

TESTE DE HIPTESES
H0 : todas as amostras so iguais
H1 : pelo menos uma amostra diferente
CALCULANDO H
2

k Rj
12
3.(N + 1)
H=
.
N(N + 1) j=1 n j

onde
k = nmero de amostras
nj = nmero de elementos da amostra j
N = total de observaes do conjunto das k amostras
Rj = soma dos postos ou ranks da amostra j
Rj2 = quadrado da soma dos postos ou ranks da amostra j
Rj2/nj = quadrado da soma dos postos ou ranks da amostra j dividido pelo respectivo nmero de elementos

Professor Assistente Doutor do Departamento de Pediatria FCM/UNICAMP

CORREO EM DECORRNCIA DE EMPATES


Quando ocorrerem empates entre observaes, torna-se necessrio realizar uma correo no H calculado,
dividindo-se H por um fator de correo C.

C = 1

T
N .( N + 1)(
. N 1)
e

T = T i

= f 3i f
e

f i o nmero de valores em cada grupo de empate


aplicando-se a correo temos,

H=

H
C

Exemplo: em um determinado estudo referente a notas de 30 alunos do ensino fundamental, observou-se


que vrios alunos tiveram a mesma nota.
Paulo, Jos e Maria tiveram nota 7,5 ; Joana, Andr, Juca e Pedro tiveram nota 8,5 ; Lara e Romeu
tiveram nota 8,9.

portanto

fi=3

Ti = 33 - 3 = 24

Quatro alunos receberam a nota 8,5 portanto

fi=4

Ti = 43 - 4 = 60

Dois alunos receberam a nota 8,9

fi=2

Ti = 23 - 2 = 6

Trs alunos receberam a nota 7,5

portanto

T = Ti = 24 + 60 + 6 = 90
O fator de correo ser:

C =1

N .( N 1)(
. N + 1)

=1

90
= 0,996663
30.(30 1)(
. 30 + 1)

TOMADA DE DECISO
a) QUANDO SO TRS AMOSTRAS COM PEQUENO NMERO DE CASOS (k=3 e nj5)
Neste caso utiliza-se a tabela que fornece a probabilidade de H para trs amostras de diferentes tamanhos.

Se a probabilidade de H for menor que rejeita-se H0.

b) QUANDO SO MAIS QUE TRS AMOSTRAS OU ELAS TM GRANDE NMERO DE CASOS (k>3 ou nj>5)
Neste caso H tem distribuio de 2 com k-1 graus de liberdade. Uma vez estabelecido procura-se na
tabela de distribuio de 2 o valor crtico de 2 para e k-1 graus de liberdade.

Se H 2,k-1 rejeita-se H0.

Exemplo com k = 3 e n<6 Desejando saber se havia diferena entre as idades de crianas de trs classes
diferentes, foram selecionadas aleatoriamente trs grupos com cinco crianas
H0 : as trs classes tm idades iguais
H1 : pelo menos uma das classes tem idade diferente
Nvel de significncia = 5%

( = 0,05)

Classe A

Classe B

Classe C

8.5

8.1

9.1

8.9

8.2

8.6

7.3

8.4

9.3

6.9

8.3

10.0

7.7

9.0

9.2

Ordenando e atribuindo ranks


Idades
Ranks

6.9
1

7.3
2

7.7
3

8.1
4

8.2
5

8.3
6

8.4
7

8.5
8

8.6
9

8.9
10

9.0
11

9.1
12

9.2
13

9.3
14

10.0
15

Calculando Rj ; (Rj)2 e (Rj)2/nj de cada classe

Classe A

Classe B

Classe C

Idade

Ranks

Idade

Ranks

Idade

Ranks

8.5
8.9
7.3
6.9
7.7
Rj

8
10
2
1
3
24

8.1
8.2
8.4
8.3
9.0

4
5
7
6
11
33

9.1
8.6
9.3
10.0
9.2

12
9
14
15
13
63

(Rj)2

576

1089

3969

nj

115,2

217,8

793,8

(Rj) /nj
Calculando H

(Rj)2/nj = 115,2 + 217,8 + 793,8 = 1126,8

H=

12
.1126,8 - 3.(15 + 1) = 8,34
15.(15 + 1)

Decidindo sobre H0
Consultando na tabela o valor de H para trs amostras com 5 elementos, encontra-se que a probabilidade
fica entre 0,007 e 0,009. Desta forma H0 deve ser rejeitada concluindo-se que as classes no tm a
mesma idade.

Exemplo com k > 3 ou n > 6 Foram tomadas ao acaso as alturas de algumas crianas do sexo masculino
de quatro classes diferentes. Deseja-se saber se h diferena nas alturas dos quatro grupos.
H0 : as quatro amostras tm alturas iguais
H1 : pelo menos uma das quatro amostras tem alturas diferentes

Nvel de significncia: 5%

Guimarey

Zanolli

Marmo

Morcillo

118,4

130,6

123,8

117,1

101,5

118,3

113

127,5

116,6

114,7

104,7

120,3

107,2

125,8

115,4

116,5

118,9

117,9

120,8

119,2

115,4

117,3

122,4

120,5

108

116,2

115,5

111,1

118,9

125,1

117,5

120,2

114,3

120

121,5

122,3

116,8

124

115

120

Ordena-se e atribui-se os postos ou ranks s observaes


Calcula-se Rj (soma dos postos de cada amostras), (Rj)2 (o quadrado da soma dos postos de cada
amostra) e (Rj)2/nj (quadrado da soma dos postos de cada amostra dividido pelo respectivo nmero de
observaes)

Guimarey

Zanollli

Marmo

Morcillo

Altura

Rank

Altura

Rank

Altura

Rank

Altura

Rank

118,4

22

130,6

40

123,8

35

117,1

17

101,5

118,3

21

113,0

127,5

39

116,6

15

114,7

104,7

120,3

29

107,2

125,8

38

115,4

10,5

116,5

14

118,9

23,5

117,9

20

120,8

31

119,2

25

115,4

10,5

117,3

18

122,4

34

120,5

30

108,0

116,2

13

115,5

12

111,1

118,9

23,5

125,1

37

117,5

19

120,2

28

114,3

120,0

26,5

121,5

32

122,3

33

115,0

116,8

16

124,0

36

120,0

26,5

Rj

118,5

221,5

197,5

282,5

(Rj)2

14042,25

49062,25

39006,25

79806,25

nj

10

10

11

(Rj)2/nj

1404,225

5451,361

3900,625

7255,114

Calcula-se a soma de todos os (Rj)2/nj

n
4

j =1

2
j

= 18011,32475

Como ocorreram empates h a necessidade de se calcular o fator de correo C


Tratamento dos empates

Como 2 crianas tm altura 115,4


Como 2 crianas tm altura 118,9
Como 2 crianas tm altura 120,0

fi = 2
fi = 2
fi = 2

Ti = 2 2 = 8 2 = 6
3
Ti = 2 2 = 8 2 = 6
3
Ti = 2 2 = 8 2 = 6

T = Ti = 6 + 6 + 6 = 18

Calculando o fator de correo C

C = 1

T
18
= 1
= 0,999718
N .( N 1)(
. N + 1)
40.(40 1)(
. 40 + 1)

Calculando o valor de H

H=

12
18011,32475 3 41 = 8,79018
40 41

Calculando o H corrigido pelos empates

H=

8,79018
= 8,79266
0,999718

Verificando o 2 crtico

Como so quatro amostras, H deve ser comparado com o 2 , considerando =0,05 e 3 graus
de liberdade (nmero de amostras menos um). Neste caso 20,05;3 = 7,82

Tomada de deciso

Como H maior que 20,05;3 rejeita-se H0.

Limites de probabilidade da distribuio de H no teste de Kruskal-Wallis


(k=3), com n1 n2 n3 6. [ p a probabilidade de H h P0(H h) = p]
n1

n2

n3

n1

n2

n3

n1

n2

n3

1
1
1
1

1
1
2
2

4
5
2
3

.056
.044
.011
.008
.005
.227
.188
.105
.086
.053
.046
.011
.009
.005
.002
.200
.067
.219
.181
.105
.067
.048
.029
.210
.190
.100
.052
.024
.014
.206
.196
.122
.090
.056
.013
.008
.050
.038
.036
.021
.011
.008

4.860
4.986
6.840
6.954
7.364
2.946
3.236
4.036
4.109
4.909
5.127
6.836
7.309
7.746
8.182
3.714
4.571
3.750
3.929
4.464
4.500
4.714
5.357
3.458
3.667
4.458
5.125
5.500
6.000
3.333
3.360
4.293
4.373
5.040
6.133
6.533
5.018
5.345
5.527
5.745
6.545
6.654

.200
.143
.200
.200
.100
.190
.114
.057
.190
.095
.048
.036
.157
.095
.048
.036
.157
.100
.043
.200
.093
.050
.021
.190
.095
.052
.048
.012
.222
.178
.102
.054
.048
.010
.208
.194
.102
.098

3.571
3.857
3.600
3.524
4.286
3.161
4.018
4.821
3.333
4.200
5.000
5.250
3.286
4.200
5.000
5.250
3.286
4.571
5.143
3.208
4.056
5.208
5.833
3.218
4.018
4.871
4.960
6.400
3.000
3.267
4.067
4.867
4.967
6.667
3.000
3.087
3.960
3.987

3.778
4.556
5.139
5.556
6.250
3.311
3.444
4.444
4.511
5.400
5.444
6.300
6.444
7.000
3.386
3.414
4.494
4.651
5.106
5.251
6.822
6.909
6.949
7.182
5.227
5.348
6.061
6.136
6.727
6.970
3.354
3.464
4.446
4.554
5.236
5.454
6.546
6.873
7.036
7.854
3.364
4.518
4.541
5.268

.200
.100
.061
.025
.011
.203
.197
.102
.098
.051
.046
.011
.008
.005
.201
.193
.101
.091
.052
.049
.010
.009
.006
.004
.052
.046
.026
.023
.011
.009
.210
.192
.103
.098
.052
.046
.020
.011
.006
.002
.200
.101
.098
.051

Limites de probabilidade da distribuio de H no teste de Kruskal-Wallis


(k=3), com n1 n2 n3 6. [ p a probabilidade de H h P0(H h) = p]
n1

n2

n3

n1

n2

n3

n1

n2

n3

.010
.006
.004
.002
.001
.209
.196
.109
.097
.051
.049
.026
.020
.011
.009
.008
.005
.002
.001
.001
.051
.050
.025
.022
.010
.008
.201
.195
.150
.102
.099
.051
.049
.025
.020
.010
.004
.002
.001
.204
.199
.150
.103
.099
.075
.050
.025
.020
.010

6.746
7.000
7.318
7.436
8.018
3.394
3.442
4.412
4.533
5.515
5.648
6.303
6.376
6.982
7.079
7.467
7.515
8.048
8.242
8.727
5.551
5.615
6.385
6.436
7.192
7.410
3.394
3.417
3.848
4.477
4.546
5.576
5.598
6.394
6.659
7.144
7.636
8.227
8.909
3.312
3.318
3.831
4.523
4.549
4.939
5.631
6.410
6.676
7.445

.049
.020
.010
.007
.005
.001
.050
.049
.025
.024
.011
.010
.203
.198
.100
.051
.047
.025
.020
.010
.007
.005
.001
.050
.047
.026
.025
.010
.010
.051
.050
.026
.024
.010
.010
.196
.100
.050
.025
.011
.004
.196
.150
.101
.092
.050
.025

5.273
6.504
7.118
7.500
7.573
8.114
5.263
5.340
6.109
6.186
7.212
7.340
3.369
3.392
4.508
5.246
5.338
6.346
6.446
7.269
7.762
8.131
8.685
5.319
5.338
6.189
6.196
7.299
7.376
5.352
5.410
6.171
6.210
7.410
7.467
3.467
4.622
5.600
5.956
6.489
7.200
3.391
3.836
4.700
4.709
5.727
6.154

7.641
7.906
8.446
8.503
9.118
5.604
5.610
6.500
6.538
7.467
7.500
3.306
3.429
3.798
4.545
4.993
5.626
5.706
6.488
6.752
6.866
7.543
7.894
8.237
8.334
8.950
9.055
9.398
5.554
5.600
6.621
6.667
7.560
7.590
5.600
5.625
6.683
6.725
7.683
7.725
3.231
3.500
3.846
3.962
4.500
4.654

.007
.005
.002
.001
.001
.050
.049
.025
.025
.010
.010
.202
.195
.152
.100
.075
.051
.046
.025
.021
.019
.010
.007
.005
.005
.002
.001
.001
.052
.050
.026
.024
.010
.010
.052
.050
.025
.025
.010
.010
.212
.197
.151
.145
.104
.097

Limites de probabilidade da distribuio de H no teste de Kruskal-Wallis


(k=3), com n1 n2 n3 6. [ p a probabilidade de H h P0(H h) = p]
n1

n2

n3

n1

n2

n3

n1

n2

n3

.200
.151
.148
.101
.099
.075
.050
.025
.025
.020
.010
.010
.007
.005
.005
.002
.001
.001
.051
.050
.025
.025
.010
.010
.050
.050
.025
.024
.010
.010
.201
.190
.150
.100

3.311
3.846
3.883
4.520
4.523
5.023
5.643
6.671
6.760
6.943
7.766
7.860
8.226
8.371
8.543
9.163
9.323
9.926
5.656
5.661
6.736
6.750
7.896
7.936
5.721
5.724
6.783
6.812
7.989
8.000
3.380
3.420
3.860
4.560

.074
.055
.049
.026
.024
.021
.019
.011
.007
.005
.002
.001
.001
.200
.151
.100
.076
.074
.050
.026
.024
.020
.011
.009
.009
.005
.005
.002
.001
.001
.050
.049
.026
.025
.010
.010

5.115
5.654
5.692
6.577
6.615
6.731
6.962
7.538
7.731
8.000
8.346
8.654
9.269
3.330
3.828
4.619
5.014
5.024
5.618
6.597
6.676
6.943
7.744
7.760
7.810
8.140
8.189
8.782
8.997
9.590
5.667
5.681
6.595
6.667
7.724
7.795

5.040
5.660
5.780
6.740
7.020
7.980
8.000
8.060
8.420
8.720
8.820
9.420
9.620
9.680

5.698
5.729
6.781
6.788
8.012
8.028
5.752
5.765
6.838
6.848
8.119
8.124
5.719
5.801
6.877
6.889
8.187
8.222

.075
.051
.049
.025
.020
.011
.009
.009
.007
.005
.005
.002
.002
.001
.001
.050
.050
.025
.025
.010
.010
.050
.050
.025
.025
.010
.010
.050
.049
.026
.025
.010
.010

10.220

10

Teste de Kruskal-Wallis para trs amostras e n < 6

Verificar se as amostras so independentes


Verificar se as medidas foram medidas nas escalas
ordinal, intervalar ou de razo

Estabelecer as hipteses de trabalho e


o nvel de significncia

Reunir as N observaes em um nico grupo


e orden-las

Atribuir os ranks s observaes

Somar os ranks de cada amostras (Rj)


Elevar Rj ao quadrado (Rj)2
Dividir (Rj)2 pelo n de cada amostra

Calcular H
Se houver empates aplicar o fator de correo C

Encontrar a probabilidade de H na tabela


levando em cota n1, n2, n3
Se p <= 0,05

Se p > 0,05

Rejeita-se H0

No se rejeita H0

11

Teste de Kruskal-Wallis para trs ou mais amostras ou n > 6

Verificar se as amostras so independentes


Verificar se as medidas foram medidas nas escalas
ordinal, intervalar ou de razo

Estabelecer as hipteses de trabalho e


o nvel de significncia

Reunir as N observaes em um nico grupo


e orden-las

Atribuir os ranks s observaes

Somar os ranks de cada amostras (Rj)


Elevar Rj ao quadrado (Rj)2
Dividir (Rj)2 pelo n de cada amostra

Calcular H
Se houver empates aplicar o fator de correo C

Verificar o valor de Qui-quadrado para k-1 graus de liberdade


Se H >= qui-quadrado crtico

Se H < qui-quadrado crtico

Rejeita-se H0

No se rejeita H0

12

BIBLIOGRAFIA
1.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

2.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

3.

CAMPOS H Estatstica experimental no-paramtrica. 3 ed. Piracicaba. Departamento de


Matemtica e Estatstica da Escola Superior de Agricultura Luiz de Queiroz da Universiade de So
Paulo, 1979.

4.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

5.

LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.

6.

SIEGEL S Estatstica no-paramtrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7.

VIEIRA S Bioestatstica: tpicos avanados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

13

TESTE DE WILCOXON
Andr M. Morcillo1

O teste de Wilcoxon pode ser usado na comparao de dados pareados, medidos nas escalas
ordinal, intervalar ou de razo. No h a exigncia de que as amostras tenham distribuio
normal. Tem 95% do poder do teste t pareado e, sua indicao, restringe-se s situaes em que
este ltimo no pode ser utilizado.
O princpio do teste consiste em avaliar se ocorreram modificaes significativas nos dois
conjuntos de dados. Quando as modificaes ou diferenas so muito pequenas, elas podem ser
devidas ao acaso, porm, quando so expressivas, pouco provvel que se devam ao acaso,
sendo fruto de um fator causal.

COMO FAZER
1. Calcula-se para cada elemento do grupo de estudo a diferena (d) entre a suas duas medidas,
seja a primeira menos a segunda ou vice-versa. Neste captulo ser sempre considerada a
primeira menos a segunda (A-B).
2. Ordena-se e atribui-se ranks aos valores absolutos das diferenas que sejam diferentes de
zero ( d 0 )
3. Soma-se os ranks das diferenas positivas (T+)
4. Soma-se os ranks das diferenas negativas (T-)
5. Seleciona-se entre T+ e T- o de menor valor, que ser chamado de T
6. Verifica-se o valor de Tcrtico, na tabela
7. Compara-se T com Tcrtico e toma-se a deciso quanto a rejeio de H0

Observaes:
a) quando houver d = 0, eles no recebero ranks
b) quando houver d = 0, n ser igual ao total de elementos da amostra menos o nmero de
casos em que d = 0

Professor Assistente Doutor do Departamento de Pediatria da FCM/UNICAMP

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

TESTE DE HIPTESES
a) Bilateral
H0 : no h diferena entre as notas obtidas no incio e no final do curso
H1 : h diferena entre as notas obtidas no incio e no final do curso
b) Unilateral
H0 : As notas obtidas no incio so menores ou iguais s do final do curso
H1 : As notas obtidas no incio so maiores que as do final do curso

ou
H0 : As notas obtidas no incio so maiores ou iguais s do final do curso
H1 : As notas obtidas no incio so menores que as do final do curso
TOMADA DE DECISO
Teste bilateral
Seleciona-se entre T+ e T- aquele que tiver o menor valor, que passar a ser chamado de T e
que ser comparado com o Tcrtico (T,n).
Se T for menor ou igual ao Tcrtico, rejeita-se H0.

Teste unilateral
Considerando que no nosso caso d = primeira medida menos a segunda:
a) H1 : as segundas medidas so menores que as primeiras [ A > B ]
Se isto for verdadeiro T+ maior que T-, sendo que T- passa a ser o valor de T.
Se T T,n

rejeita-se H0

b) H1 : as segundas medidas so maiores que as primeiras

[A<B]

Se isto for verdadeiro T- maior que T+, sendo que T+ passa a ser o valor de T.
Se T T,n

rejeita-se H0

Observao: se d = B-A h a necessidade de rever com cuidado o raciocnio exposto


acima.

Se T menor ou igual ao Tcrtico, rejeita-se H0

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Exemplo - Um grupo de 10 alunos foi avaliado no incio e no final do curso. Na


tabela abaixo so apresentadas as notas obtidas nas provas.

Nomes

Prova inicial

Prova final

Andr

7,3

7,6

Paulo

7,9

7,5

Manoel

8,1

8,6

Joaquim

9,6

9,5

Pedro

8,0

8,5

Lus

8,5

8,3

Miguel

7,9

7,9

ngelo

6,9

6,9

Cludio

7,2

7,8

Aurlio

8,8

7,5

Calculando as diferenas (d = nota inicial nota final)

Prova inicial

Prova final

Diferena (Inicial-Final)

Andr

7,3

7,6

-0,3

Paulo

7,9

7,5

+0,4

Manoel

8,1

8,6

-0,5

Joaquim

9,6

9,5

+0,1

Pedro

8,0

8,5

-0,5

Lus

8,5

8,3

+0,2

Miguel

7,9

7,9

ngelo

6,9

6,9

Cludio

7,2

7,8

-0,6

Aurlio

8,8

7,5

+1,3

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Atribuindo ranks s diferenas


Ordena-se as diferenas (d) que so diferentes de zero, pois s interessa estudar os casos em que
houve modificao na nota, considerando o seu valor absoluto e atribui-se os postos ou ranks ao
valor absoluto das diferenas
|d|

0,1

0,2

0,3

0,4

0,5

0,5

0,6

1,3

Ranks

5,5

5,5

Nota inicial

Nota final

Diferena
d=(Inicial - final)

|d|

Ranks

Ranks -

Andr

7,3

7,6

-0,3

0,3

Paulo

7,9

7,5

+0,4

0,4

Manoel

8,1

8,6

-0,5

0,5

5,5

Joaquim

9,6

9,5

+0,1

0,1

Pedro

8,0

8,5

-0,5

0,5

5,5

Lus

8,5

8,3

+0,2

0,2

Miguel

7,9

7,9

ngelo

6,9

6,9

Cludio

7,2

7,8

-0,6

0,6

Aurlio

8,8

7,5

+1,3

1,3

8
Total

Ranks +

4
5,5
1
5,5
2

7
8
T- = 21

T+ = 15

Calculando T
1. Soma-se os ranks das diferenas negativas, que ser chamado de T-.
2. Soma-se os ranks dasdiferenas positivas, que ser chamado de T+.

T- = 3 + 5,5 + 5,5 + 7 = 21
T+ = 4 + 1 + 2 + 8 = 15
portanto
T = 15 (o menor dos dois valores)
Calcula-se n que igual ao nmero total de casos menos aqueles cuja diferena igual a
zero. No exemplo h dois casos em que d = 0, portanto:
4

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

n = 10 - 2 = 8
Observe que, se as modificaes observadas nas notas forem muito pequenas, os valores de T+ e T- sero
muito prximos. No caso de haver uma significativa modificao para melhor nas notas, a soma dos ranks
cujas diferenas so negativas (T-) dever ser bem maior que o das negativas (T+) [lembre-se que d =
nota inicial nota final]. Por outro lado, se houver uma significativa piora nas notas dos alunos, haver
mais diferenas positivas, com ranks altos, o que causar um valor de T+ bem maior que o de T-.

Tomando a deciso
Localizando na tabela de distribuio de T o valor de Tcrtico, encontra-se: T0.05(2),8 = 3
Como 15>3, T > Tcrtico (T> T0.05(2),8), o que significa que p>0,05 e, portanto, no se pode
rejeitar H0

OBTENDO O VALOR DE TCRTICO


PARA AMOSTRAS PEQUENAS ( N 25 )
Neste caso o Tcrtico ser obtido em uma tabela especfica de distribuio de T para o teste de
Wilcoxon, considerando e n (nmero de casos em que d0).

PARA AMOSTRAS GRANDES ( N > 25 )


Quando o nmero de casos grande, T tende para a distribuio normal.
Aps estimar a mdia e o desvio padro de T, calcula-se o valor de z do T. As probabilidades
de z so obtidas recorrendo-se tabela de z.
Especificamente ao nvel de 5% ( = 0,05), o valor crtico de z para os testes bilaterais 1,960
e, para os unilaterais, 1,644
Calculando a mdia de T

n (n + 1)
4

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Calculando o desvio padro de T

n(n + 1)(2n + 1)
24

Quando ocorrer empates entre diferenas diferentes de zero (d 0), ser necessrio fazer uma
correo no clculo de T.
Correo decorrente de empates
Esse fator de correo chamado de T ser calculado a partir do nmero observaes
empatadas.

n (n + 1)(2n + 1)

T
2

24
k

T = Ti
i =1

onde

3
i

onde fi o nmero de elementos que esto empatados dentro do grupo i


Exemplo de correo dos empates: imagine que em uma determinada amostra de alturas haja
quatro casos com valor 145, seis com valor 154, trs com altura 156 e dois casos com altura
185cm. H, portanto, quatro grupos com empates.
Primeiro grupo: 145 ; 145 ; 145 ; 145
Neste caso fi = 4 e Ti = 43 4 = 60
Segundo grupo: 154 ; 154 ; 154 ; 154 ; 154 ; 154
Neste caso fi = 6 e Ti = 63 6 = 210
Terceiro grupo: 156 ; 156 ; 156
Neste caso fi = 3 e Ti = 33 3 = 24
Quarto grupo: 185 ; 185
Neste caso fi = 2 e Ti = 23 2 = 6
Portanto T = Ti = 60 + 210 + 24 + 6 = 300

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Calculando o valor de z
z=

TOMADA DE DECISO
1. Teste bilateral
H0 : no h diferena entre as notas obtidas no incio e no final do curso
H1 : h diferena entre as notas obtidas no incio e no final do curso

Calcula-se z a partir do menor valor dos T (T+ e T-)


Estabelece-se e toma-se os dois valores de zcrtico,(2) (o da cauda inferior e o da cauda
superior)
Se o z calculado for igual ou maior que zcrtico, (2) da cauda superior ou menor ou igual ao
zcrtico, (2) da cauda inferior rejeita-se H0
Se o z calculado for menor que o zcrtico,,(2) da cauda superior e maior que o zcrtico,,(2) da
cauda inferior no se pode rejeitar H0
Observao: para testes bilaterais com = 0,05 os valores crticos de z so 1,960 e +1,960.

2. Teste unilateral do tipo: os valores iniciais so maiores que os finais (A>B)


H0 : As notas obtidas no incio so menores ou iguais s do final do curso
H1 : As notas obtidas no incio so maiores que a do final do curso

Calcula-se z a partir de T (o menor valor entre T+ e T-)


Estabelece-se e toma-se o valor de zcrtico,(1)
Se o z calculado for igual ou maior que zcrtico,(1) e T+ > T- rejeita-se H0 (lembre-se que
nosso d = inicial final)
Se o z calculado for menor que o zcrtico,(1) ou se T+ T- no se pode rejeitar H0

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

3. Teste unilateral do tipo: os valores iniciais so menores que os finais (B>A)


H0 : As notas obtidas no incio so maiores ou iguais s do final do curso
H1 : As notas obtidas no incio so menores que a do final do curso

Calcula-se z a partir de T (o menor valor entre T+ e T-)


Estabelece-se e toma-se o valor de zcrtico,(1)
Se o z calculado for igual ou menor que zcrtico,(1) e T- > T+ rejeita-se H0 (lembre-se que
nosso d = inicial final)
Se o z calculado for maior que o zcrtico,(1) ou se T- T+ no se pode rejeitar H0
Observao: se d = B - A h a necessidade de rever com cuidado o raciocnio exposto
acima.
Retomando o exemplo anterior:

1. T+ = 21 e T- = 15 , portanto T = 15

2. Calculando a mdia de T

3. Calculando o desvio padro de T

4. Calculando do valor de z

z=

8 (8 + 1)
= 18
4
8(8 + 1)(2 8 + 1)
= 7,14
24

15 18
= 0,42
7,14

Consultando a tabela de probabilidades de z, verifica-se que a probabilidade de z < -0,42


0,3372 (33,72%), portanto, no se pode rejeitar H0.

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

Distribuio dos valores crticos de T (o menor valor entre T+ e T-) do teste de Wilcoxon2

Teste Bilateral

0,10

0,05

0,02

0,01

Teste Unilateral

0,05

0,025

0,01

0,005

0
2

n
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

10

13

10

17

13

21

17

12

25

21

15

12

30

25

19

15

35

29

23

19

41

34

27

23

47

40

32

27

53

46

37

32

60

52

43

37

67

58

49

42

75

65

55

48

83

73

62

54

91

81

69

61

100

89

76

68

Se T Tcrtico, ento p . Rejeita-se H0

Tabela modificada de ZAR, HZ Biostatistical Analysis. 2 Ed. New Jersey, Prentice-Hall Inc., 1984.

P.563
9

Teste de Mann-Whitney
Andr M. Morcillo
___________________________________________________________________________________________________

BIBLIOGRAFIA
1.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

2.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

3.

CAMPOS H Estatstica experimental no-paramtrica. 3 ed. Piracicaba. Departamento de


Matemtica e Estatstica da Escola Superior de Agricultura Luiz de Queiroz da Universiade de So
Paulo, 1979.

4.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

5.

LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.

6.

SIEGEL S Estatstica no-paramtrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7.

VIEIRA S Bioestatstica: tpicos avanados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

10

Teste de Wilcoxon para pequenas amostras (n<25)


Estabelecer
H0, H1
Nvel de Significncia

Calcular a diferena (d) para


todos os casos

Ordenar as diferenas
sem considerar seu sinal
Excluem-se os casos com d = 0

Atribuir ranks s diferenas

Atribuir o sinal da diferena aos ranks

Somar os ranks com sinal +


Somar os ranks com sinal -

Atribuir a menor das duas somas a T

Comparar T com Tcritico

Se T>Tcrtico

Se T<= Tcrtico

No rejeitar H0

Rejeitar H0

Teste de Wilcoxon para grandes amostras (n>25)


Estabelecer
H0, H1
Nvel de Significncia

Calcular a diferena (d) para


todos os casos

Ordenar as diferenas
sem considerar seu sinal
Excluem-se os casos com d = 0

Atribuir ranks s diferenas

Atribuir o sinal da diferena aos ranks

Somar os ranks com sinal +


Somar os ranks com sinal -

Atribuir a menor das duas somas a T

Calcular a mdia e o desvio padro de T

Calcular o valor de z

Se p<=0,05

Se p>0,05

Rejeitar H0

No rejeitar H0

12

TESTE NO-PARAMTRICOS
Andr M. Morcillo1

Os testes no-paramtricos (TNPs) so menos poderosos que seus equivalentes paramtricos (TPs).
Devem ser utilizados nas situaes em que os TPs no podem ser usados.
Enquanto nos TPs so comparados os parmetros da populao (mdia e varincia), nos

TNPs

comparam-se os postos ou ranks que cada observao recebe aps sua ordenao.
O primeiro passo para realizar um TNP atribuir postos ou ranks aos valores obtidos nas amostras.

ATRIBUINDO POSTOS
1.

Inicialmente ordena-se os dados preferencialmente em ordem crescente

2.

Atribui-se os postos (ranks ou notas) aos valores ordenados, o que significa que os valores medidos
so classificados de acordo com uma nova escala.

Exemplo 1 - Dada a distribuio de notas de 10 alunos de uma classe de 8 srie:


Joo:
Pedro:
Paulo:
Manoel:
Marcos:
Joaquim:

8,0
7,5
8,2
8,8
7,9
7,7

Maria:
Marta:
Larissa:
Rita:

8,1
8,5
8,7
7,8

Os passos a seguir so:


1.

Ordenar todas as notas (em ordem crescente): 7,5; 7,7; 7,8; 7,9; 8,0; 8,1; 8,2; 8,5; 8,7; 8,8

2.

Atribuir os postos:

Atribuir ao primeiro elemento (o de valor mais baixo) o rank [1], ao segundo o posto [2], ao terceiro o
posto [3] e assim, sucessivamente, at o ltimo.
Como pode ser observado no exemplo acima o menor valor observado (7,5) recebeu o posto [1]; o
segundo (7,7) o posto [2] e a maior nota (8,8) o posto [10].

Ordem

10

Notas

7,5

7,7

7,8

7,9

8,0

8,1

8,2

8,5

8,7

8,8

Rank

10

Professor Assistente Doutor do Departamento de Pediatria da FCM/Unicamp

3. Reorganiza-se os dados, apresentando as notas, os nomes dos alunos e os postos.


Ordem do elemento na lista

Notas

Nomes

Postos ou Rank

1
2
3
4
5
6
7
8
9
10

7,5
7,7
7,8
7,9
8,0
8,1
8,2
8,5
8,7
8,8

Pedro
Joaquim
Rita
Marcos
Joo
Maria
Paulo
Marta
Larissa
Manoel

10

Total

29

1
2
3
4
5
6
7
8
9
26

Soma dos postos das mulheres: 3 + 6 + 8 + 9 = 26


Soma dos postos do homens :

1 +2 + 4 + 5 + 7 + 10 = 29

Mdia dos postos das mulheres:

26 / 4 = 6,5

Mdia dos postos dos homens:

29 / 6 = 4,8

ATRIBUINDO POSTOS QUANDO H VRIAS OBSERVAES COM O MESMO VALOR


Um situao especial ocorre quando h observaes com valores repetidos. Fazendo-se uma pequena
modificao no exemplo anterior, atribui-se ao Pedro, ao Joaquim e Rita a mesma nota 7,5. Os novos
dados j ordenados so apresentados abaixo:

7,5; 7,5; 7,5; 7,9; 8,0; 8,1; 8,2; 8,5; 8,7; 8,8
Neste caso os trs primeiros postos so ocupados por notas iguais (7,5). No se sabe de quem a
primeira, a segunda e a terceira nota. Qual dos trs alunos deve receber o posto [1] que o mais baixo? O
mais justo seria que todos recebessem o mesmo rank. Para isso calcula-se a mdia dos trs postos:
[1 + 2 + 3]/3 = 6/3 = 2.

A nova distribuio dos postos considerando os empates passa a ser:


2

Ordem

10

Notas

7,5

7,5

7,5

7,9

8,0

8,1

8,2

8,5

8,7

8,8

Rank

10

Observe que os trs alunos que tinham as notas mais baixas receberam o mesmo posto.
Um outro exemplo: num conjunto de 4.500 observaes de alturas temos empatados os elementos 278,
279, 280 e 281 com o valor 145cm; os elementos 376, 377, 378 com 147,5cm.
Os ranks das altura iguais a 145cm seria: (278+279+280+281)/4=279,5
Os ranks das altura iguais a 147,5cm seria: (376+377+378)/3=377

Ordem

...

278

279

280

281

...

376

377

378

...

Valor

...

145,0

145,0

145,0

145,0

...

147,5

147,5

147,5

...

Rank

...

279,5

279,5

279,5

279,5

...

377

377

377

...

COMPARAO DE DUAS AMOSTRAS INDEPENDENTES


TESTE DE MANN-WHITNEY
Esta prova requer que as duas amostras sejam independentes, que os dados sejam contnuos e mensurados
nas escalas ordinal, intervalar ou de razo. No deve ser aplicada quando os dados foram medidos na
escala nominal.
Para a realizao do teste as observaes originais das duas amostras so reunidas em um nico grupo,
sendo o conjunto ordenado e transformado em ranks, que sero utilizados para calcular a estatstica U.
Considerando:

n1 = nmero de casos da menor amostra


n2 = nmero de casos da maior amostra
N = total de casos das duas amostras
R1 = soma dos ranks da amostra de tamanho n1
R2 = soma dos ranks da amostra de tamanho n2
Calcula-se U e U a partir de R1 e de R2 pelas frmulas abaixo e toma-se o menor deles:

n .(n + 1)
U = n1. n 2 + 1 1
R1
2
n .(n + 1)
U' = n1. n 2 + 2 2
R2
2
TESTE DE HIPTESES

a)

bilateral
H0 : as duas amostras apresentam a mesma distribuio
H1 : as duas amostras apresentam distribuies diferentes
= nvel de significncia

n1= tamanho da menor amostra

n2= tamanho da maior amostra

Uma vez selecionado o menor dos dois valores de U calculados, recorre-se tabela bilateral de U para
previamente determinado, procurando localizar o valor crtico de U(2),n2,n1 .
4

Se U > U(2),n2,n1 no se rejeita H0


Se U U(2),n2,n1 rejeita-se H0
b) Teste unilateral
H0 : as duas amostras apresentam a mesma distribuio
H1 : as duas amostras tm distribuies diferentes, sendo que a amostra 1 tem valores maiores que a
amostra 2
ou
H1 : as duas amostras tm distribuies diferentes, sendo que a amostra 1 tem valores menores que a
amostra 2
Uma vez selecionado o menor dos dois valores de U calculados, recorre-se tabela unilateral de U para
previamente selecionado, procurando localizar o valor crtico de U(1),n2,n1 .

Se U > U(1),n2,n1 no rejeitamos H0


Se U U(1),n2,n1 rejeitamos H0
Retomando o exemplo anterior, deseja-se saber se as notas dos alunos do sexo masculino so diferentes
das notas do feminino.
Exemplo 1 - Dada a distribuio de notas de 10 alunos de uma classe de 8 srie:

Ordem do elemento na lista

Notas

Nomes

1
2
3
4
5
6
7
8
9
10

7,5
7,7
7,8
7,9
8,0
8,1
8,2
8,5
8,7
8,8

Pedro
Joaquim
Rita
Marcos
Joo
Maria
Paulo
Marta
Larissa
Manoel

10

Total

29

n1 = 4
a)

R1 = 26

n2 = 6

Postos ou Ranks
1
2
3
4
5
6
7
8
9
26

R2 = 29

CALCULANDO U A PARTIR DE R1
5

U = 4 x 6 + [(4 x 5)/2] - 26 = 8
b) CALCULANDO U A PARTIR DE R2
U = 4 x 6 + [(6 x 7)/2] - 29 = 16

Toma-se o valor de U = 8 para = 0,05 e n1=4 e n2 = 6. Nestas circunstncias o valor de U0,05(2);4; 6 = 2.

Como U > U0,05(2);4; 6 no se pode rejeitar H0

UMA SITUAO ESPECIAL


A tabela de U abrange at n1=20 e n2=40. Quando as amostras so maiores, U tem distribuio que
tende para curva normal, sendo que neste caso, U deve ser transformado em z e sua probabilidade de
ocorrncia verificada na tabela de z.
Determinando a significncia de U quando n1>20 ou n2>40
Quando n1>20 ou n2>40 no mais possvel a utilizao da tabela de U, porm sabe-se que U tende a ter
distribuio normal. A partir do valor da mdia de U e de seu desvio padro, calcula-se o valor de z e, a
partir da tabela de distribuio de z, a sua probabilidade. Do ponto de vista prtico, rejeita-se H0 para
=0,05, se z 1,960 nos testes bilaterais ou se z 1,645 no unilaterais.

zU =

U U
U

1) Obtendo a mdia de U (U)

n n
U = 1 2
2
2) Obtendo o desvio padro de U (U)

U =

. N + 1) - T
n1 n 2 N.(N - 1)(

N.(N - 1) )
12

onde T uma correo decorrente de postos empatados

T=Ti

T i = f 3i f i
6

N = n 1 + n2
K o nmero de grupos onde ocorreram empates
fi o nmero de elementos empatados dentro de um grupo.
Exemplo: se dentro de um conjunto de dados houvesse empates como apresentado a seguir:
... 100, 100, 100, ... , 120, 120, ... , 150, 150, 150, 150, 150, ...
O primeiro grupo com empates tem trs elementos [100, 100, 100] portanto fi=3
Ti = 33 - 3 = 27 - 3 = 24
O segundo grupo com empates tem dois elementos [120,120] portanto fi=2
Ti = 23 - 2 = 8 - 2 = 6
O terceiro grupo com empates tem cinco elementos [150,150,150,150,150] portanto fi=5
Ti = 53 - 5 = 125 - 5 = 120
Somando-se os valores de Ti:

T = Ti = 24 + 6 + 120 = 150
Exemplo 2 - Comparando-se dados de altura de duas amostras em relao ao sexo encontramos empates
que proporcionam T = Ti = 150
Considerando n1=120 o nmero de meninos e n2=150 o nmero de meninas, U = 9538 e = 0,05 tem-se:
n1 = 120

n2 = 150

N = 270

U = 9538

U = (120 . 150)/2 = 9000

U =

120 150 270.269.271 - 150

= 637,57
270.269
12

como

z = (U - U) / U
Z= (9538 - 9000) / 637,57 = 0,84
A probabilidade de ocorrer um z 0,84 0,2005 muito maior que = 0,05
Com esse valor de U, H0 no poderia ser rejeitado, seja em um teste bilateral ou unilateral.

BIBLIOGRAFIA
1.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

2.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

3.

CAMPOS H Estatstica experimental no-paramtrica. 3 ed. Piracicaba. Departamento de


Matemtica e Estatstica da Escola Superior de Agricultura Luiz de Queiroz da Universiade de So
Paulo, 1979.

4.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

5.

LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.

6.

SIEGEL S Estatstica no-paramtrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7.

VIEIRA S Bioestatstica: tpicos avanados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

Distribuio de U do teste de Mann-Whitney (Unilateral ao nvel de 2,5% ; Bilateral ao nvel de 5%)


N2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

N1
1
0
0

2
0
0
0
0
1
1
1
1
1
2
2
2
2
3
3
3
3
3
4
4
4
4
5
5
5
5
5
6
6
6
6
7
7

10

11

12

13

14

15

16

17

18

19

20

0
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
9
9
10
10
11
11
12
13
13
14
14
15
15
16
16
17
17
18
18

0
1
2
3
4
4
5
6
7
8
9
10
11
11
12
13
14
15
16
17
17
18
19
20
21
22
23
24
24
25
26
27
28
29
30
31
31

2
3
5
6
7
8
9
11
12
13
14
15
17
18
19
20
22
23
24
25
27
28
29
30
32
33
34
35
37
38
39
40
41
43
44
45

5
6
8
10
11
13
14
16
17
19
21
22
24
25
27
29
30
32
33
35
37
38
40
42
43
45
46
48
50
51
53
55
56
58
59

8
10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
52
54
56
58
60
62
64
66
68
70
72
74

13
15
17
19
22
24
26
29
31
34
36
38
41
43
45
48
50
53
55
57
60
62
65
67
69
72
74
77
79
81
84
86
89

17
20
23
26
28
31
34
37
39
42
45
48
50
53
56
59
62
64
67
70
73
76
78
81
84
87
89
92
95
98
101
103

23
26
29
33
36
39
42
45
48
52
55
58
61
64
67
71
74
77
80
83
87
90
93
96
99
103
106
109
112
115
119

30
33
37
40
44
47
51
55
58
62
65
69
73
76
80
83
87
90
94
98
101
105
108
112
116
119
123
127
130
134

37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97
101
105
109
113
117
121
125
129
133
137
141
145
149

45
50
54
59
63
67
72
76
80
85
89
94
98
102
107
111
116
120
125
129
133
138
142
147
151
156
160
165

55
59
64
69
74
78
83
88
93
98
102
107
112
117
122
127
131
136
141
146
151
156
161
165
170
175
180

64
70
75
80
85
90
96
101
106
111
117
122
127
132
138
143
148
153
159
164
169
174
180
185
190
196

75
81
86
92
98
103
109
115
120
126
132
137
143
149
154
160
166
171
177
183
188
194
200
206
211

87
93
99
105
111
117
123
129
135
141
147
154
160
166
172
178
184
190
196
202
209
215
321
227

99
106
112
119
125
132
138
145
151
158
164
171
177
184
190
197
203
210
216
223
230
236
243

113
119
126
133
140
147
154
161
168
175
182
189
196
203
210
217
224
231
238
245
252
258

127
134
141
149
156
163
171
178
186
193
200
208
215
222
230
237
245
252
259
267
274

Teste de Mann-Whitney para n1 at 20 e n2 at 40

Verificar se as amostras so independentes


Verificar se foram medidas nas escalas ordinal,
intervalar ou de razo

Estabelecer as hipteses de trabalho


e o nvel de significncia alfa

Reunir as observaes das duas amostras


em um nico grupo e orden-las

Atribuir ranks s observaes

Somar os ranks de cada amostra

Calcular os dois valores de U

Assumir o U de menor valor como a estatstica U

Encontrar o valor crtico de U na tabela


levando em conta n1, n2 e alfa

U calculado menor ou
igual ao U da tabela

U calculado maior que


o U da tabela

Rejeitamos H0

No podemos rejeitar H0

10

Teste de Mann-Whitney para n1 maior que 20 e n2 maior que 40

Verificar se as amostras so independentes


Verificar se foram medidas nas escalas ordinal,
intervalar ou de razo

Estabelecer as hipteses de trabalho


e o nvel de significncia alfa

Reunir as observaes das duas amostras


em um nico grupo e orden-las

Atribuir ranks s observaes

Somar os ranks de cada amostra

Calcular os dois valores de U

Assumir o U de menor valor como a estatstica U

Calcular a mdia de U
Calcular o desvio padro de U
Calcular o z de U

Se a probabilidade de se ter
um valor de z maior ou igual ao
calculado for menor ou igual a 5%

Se a probabilidade de se ter
um valor de z maior ou igual ao
calculado for maior que 5%

Rejeitamos H0

No podemos rejeitar H0

11

TESTE DO QUI-QUADRADO (2)


Andr Moreno Morcillo1

O teste do 2 muito eficiente para avaliar a associao existente entre variveis qualitativas
(dados do tipo categrico). O princpio bsico deste mtodo no paramtrico comparar as
divergncias entre as freqncias observadas e as esperadas.
De uma maneira geral, pode-se dizer que dois grupos se comportam de forma semelhante se as
diferenas entre as freqncias observadas e as esperadas em cada categoria forem muito
pequenas, prximas a zero.
O 2 calculado pela frmula:

2 =

(O E )2
E

(1)

onde:
O = freqncia observada
E = freqncia esperada
Observe que ( O-E ) a diferena entre a freqncia observada e a esperada, que dever ser
calculada para cada clula da tabela. Quando as freqncias observadas so muito prximas s
esperadas, o valor ( O-E ) pequeno; no entanto, quando as discrepncias so grandes, ( O-E )
passa a ser grande e, consequentemente, o 2 assume valores altos.
O pesquisador estar sempre trabalhando com duas hipteses:
H0:
H1:

no h associao entre os grupos


h associao entre os grupos

As freqncias observadas so obtidas diretamente dos dados das amostras, enquanto que as
freqncias esperadas so calculadas a partir destas.

Prof. Assist. Doutor do Departamento de Pediatria da Faculdade de Cincias Mdicas da UNICAMP

Na prtica, a freqncia esperada em uma determinada clula calculada pela multiplicao do


total de sua coluna (Tc), pelo total de sua linha (Tl), dividindo-se o produto pelo total geral da
tabela (N).
E = ( Tc x Tl ) / N
Tc : total da coluna
Tl : total da linha

Uma vez calculado o 2, procura-se na tabela de distribuio de 2 o valor do 2 crtico


considerando o nvel de significncia adotado e os graus de liberdade.
Os graus de liberdade da tabela so obtidos por:
gl = (nmero de linhas 1 x nmero de colunas 1)
Se o 2 obtido for igual ou maior que o 2 crtico, H0 dever ser rejeitada.

Exemplo: Um pesquisador deseja verificar se h associao entre trs cursos de


uma universidade e dependncia de drogas. Entrevistou 120 alunos, sendo 25 da
Medicina, 35 de Farmcia e 60 de Biologia, perguntando sobre o uso de drogas,
admitindo somente duas respostas: sim ou no. Aps o processamento dos dados
ficou com a seguinte tabela de distribuio de freqncias:

Medicina

Farmcia

Biologia

Total

Usa droga

10

20

30

60

No usa droga

15

15

30

60

Total

25

35

60

120

Como pode ser observado, entre os 120 alunos includos no estudo, h um nmero igual de
usurios e no usurios de drogas, entretanto, a distribuio dentro dos vrios cursos no ocorre
da mesma forma.
Veja as dificuldades na interpretao dos dados. H um nmero diferente de alunos
entrevistados, assim como h uma proporo diferente de usurios e no usurios de drogas em
cada curso.
Os dados so do tipo categrico pois, cada aluno entrevistado simplesmente foi classificado em
uma nica categoria. Neste caso, pode-se usar o teste do 2, com duas hipteses de trabalho:
H0: no h associao entre o tipo de curso e dependncia de drogas
H1: h associao entre o tipo de curso e dependncia de drogas
Se o 2 obtido for maior ou igual ao 2 crtico, H0 dever ser rejeitada.
Para o clculo do 2 recomenda-se os seguintes passos:

1. Calcular as freqncias esperadas


A freqncia esperada de cada clula calculada por (Tc x Tl) / N. Na clula que representa
MEDICINA X USURIO (25 x 60) / 120 = 12.5. A freqncia esperada na clula que representa
BIOLOGIA X NO USURIO (60 x 60) / 120 = 30. E assim com todas as clulas da tabela.
E = ( Tc x Tl ) / N
2. As freqncias esperadas devero ser anotadas nas correspondentes clulas.

Medicina

Farmcia

Biologia

Total

10

20

30

60

12,5

17,5

30,0

No usa

15

15

30

Droga

12,5

17,5

30,0

25

35

60

Usa droga

Total

60

120

3. A seguir aplica-se a frmula [1].

2 = [10 - 12,5]2 / 12,5 + [20 - 17,5] 2 /17,5 + [30 30] 2 / 30 +[15 12,5] 2 / 12,5 +
[15 17,5] 2 / 17,5 + [30 30] 2 /30 = 1,7
2 = 1,7

4. Determina-se os graus de liberdade (gl) da tabela:


Os graus de liberdade da tabela so calculados multiplicando-se o nmero de linhas da tabela
menos um pelo nmero colunas da tabela menos um.
gl = (nmero de linhas 1) x (nmero de colunas 1)
No exemplo:
gl = (3 1) x (2 1) = 2

5. Por ltimo, compara-se o valor do 2 obtido com o 2 crtico considerando os graus de


liberdade (gl) da tabela e o nvel de significncia .

O 2 = 1.7 menor que o 2gl;=0.05 que 5.99. Assim sendo, a hiptese H0 no pode ser
rejeitada, concluindo-se que no grupo estudado, no h associao entre as variveis. A
proporo de usurios e no usurios de drogas entre os alunos dos cursos de Medicina,
Biologia e Farmcia igual.
Observao: caso 20% ou mais das clulas tenham freqncias esperadas menores
que 5, ou haja uma ou mais freqncias esperadas com valores menores ou igual a 1,
no se deve usar o teste do 2. Uma boa alternativa para estes casos o
agrupamento de linhas e colunas, desde que tenha algum sentido lgico.

Como pode ser observado, o teste facilmente realizado porm, com grande trabalho manual.
Este trabalho manual pode ser minimizado em algumas situaes especiais: as tabelas 2 x 2, n x
2 e m x n.

1)

TABELAS 2 x 2

Quando os dados esto tabulados em tabelas de duas linhas por duas colunas podem ser
utilizar frmulas que necessitam somente das freqncias observadas, no requerendo o clculo
das freqncias esperadas.
1. Quando o nmero de casos maior que 40 (N > 40) deve-se empregar a frmula:

2 =

(a.d b.c )2 .N
T1.T2.T3.T 4

(2)

2) Quando o nmero de casos estudados maior ou igual a 20 e menor ou igual a 40 (20 N


40) deve-se empregar a frmula:

a.d b.c N .N

2
2
=

T1.T2.T3.T 4

(3)

onde:

GRUPO A

GRUPO B

Total

GRUPO C

T1

GRUPO D

T2

Total

T3

T4

Exemplo: um pesquisador quer saber se a proporo de crianas acometidas por


uma determinada doena a mesma entre dois grupos de estudo (A e B). Estudou
uma amostra com 28 casos, obtendo a seguinte distribuio de freqncias:
H0: A proporo de crianas acometidas entre os dois grupos igual.
H1: A proporo de crianas acometidas entre os dois grupos diferente.

GRUPO A

GRUPO B

Total

SADIOS

13

ACOMETIDOS

15

Total

12

16

28

a=6

b=7

c=6

d=9

T1 = 13

T2 = 15

T3 = 12

T4 = 16

N = 28

Como N = 28 deve-se usar a frmula [3]:

6.9 6.7 28 .28

2
= 0,003
2 =
13.15.12.16

Observe que nas tabelas 2x2 h somente 1 grau de liberdade, pois ( 2 - 1 ) x ( 2 1 )=1
Para 1 g.l. e =0,05 o 2 crtico 3,84.
Como o 2 = 0,003 menor que 3,84, no se pode rejeitar H0, podendo-se afirmar que na
amostra estudada a proporo de crianas acometidas igual nos grupos A e B.

OBSERVAO IMPORTANTE: nas tabelas 2x2, quando N menor que 20, as


frmulas [2] e [3] no podem ser usadas devendo-se, neste caso, empregar o Teste
Exato de Fisher.

2) TABELAS DE m LINHAS POR DUAS COLUNAS (mx2)


Quando as tabelas tm m linhas por duas colunas, pode-se utilizar a frmula [4] que requer as
freqncias observadas de uma das colunas, cuja escolha fica a critrio do pesquisador. A
frmula [4] est escrita para uso da coluna 1.

2 O
1
O1i

N
i =1
2
ni
= p . q
j

(4)

onde:
O1i = freqncia observada na coluna 1 da linha i
ni = total da linha i
01= total da coluna 1

p = Oi

q = 1 p
Observe que se trabalha com as freqncias observadas de uma nica coluna, o que facilita os
clculos.
Neste caso os graus de liberdade (g.l.) so determinados por: nmero de linhas 1.
Exemplo:
Um pesquisador investigando o uso de drogas entre universitrios desejava saber se havia
diferena quando se considerava diferentes cursos. Aplicou um questionrio entre alunos de
diferentes cursos, obtendo os resultados apresentados na tabela abaixo:

CURSO

USA DROGA

NO USA DROGA

TOTAL

Medicina

40

60

100

Fsica

50

70

120

Qumica

80

50

130

Farmcia

100

120

220

TOTAL

270

300

570

As hipteses de trabalho so:


HO: os grupos se comportam como se fossem de uma mesma populao e, portanto, as freqncias de
usurios de drogas so iguais entre os cursos.
H1: os grupos se comportam como se fossem de populaes diferentes e, portanto, as freqncias de
usurios de drogas so diferentes entre os cursos.

Como se trata de uma varivel que pode assumir somente duas situaes (usa droga ou no usa
droga), pode-se construir uma tabela tipo m linhas x 2 colunas e, consequentemente, aplicar o
teste do 2 usando-se a frmula [4].
Para maior clareza e facilidade nos clculos, deve-se refazer a tabela contendo somente uma das
duas colunas ( a critrio do pesquisador) e os totais. Neste exemplo foi escolhida a coluna 1 (usa
drogas). Observe que foram acrescentadas mais duas colunas na tabela para permitir a anotao
dos clculos intermedirios:

CURSO

USA DROGA
(O1i)

TOTAL
(ni)

(O1i)2 / ni

Medicina

40

100

40 / 100

Fsica

50

120

50 / 120

Qumica

80

130

80 / 130

Farmcia

100

220

100 / 220

TOTAL

(O1) = 270

N = 570

270 / 570

2
2
2

(O1i)2 / ni = 131,519

(Oi)2 / N = 127,895

O prximo passo ser o clculo das probabilidades p e q:


p = 270 / 570 = 0,4737
q = 1 0,4737 = 0,5263
A seguir, aplicando-se a frmula [4] tem-se:

(131,519 127 ,895)


(0,4737 . 0,5263)
2= 14,5362
7

Como a tabela tem 4 linhas so 3 graus de liberdade.


Considerando-se = 0,05 e 3 graus de liberdade, o 2 crtico igual a 7,81.
Como o 2 (14,5362) maior que o 2 crtico (7,81), rejeita-se H0 e aceita-se H1, concluindo-se
que, a partir dos dados observados, o hbito de usar drogas diferente entre os alunos dos
quatro cursos includos na amostra.
3) CLCULO DO 2 EM TABELAS DE GRANDES DIMENSES (mxn)
H uma forma de se obter o 2 em tabelas de grandes dimenses sem haver a necessidade do
conhecimento das freqncias esperadas. Esta tcnica foi desenvolvida pelo Professor Aquiles
E. Piedrabuena utilizando sua frmula para propores, considerando os totais das colunas
(comunicao pessoal).

Calcula-se individualmente o valor do 2 de cada linha da tabela, usando-se a frmula [5] e,


posteriormente, soma-se os valores obtidos em cada linha conforme a frmula [6], que ser o
valor do 2.
Considerando-se uma linha i qualquer de uma tabela:

2
2
2
2
N
i2 = Oi1 + Oi 2 + Oi3 + ... + Oir . T li (5)
T cr T li
T c1 T c 2 T c3

2 = 12 + 22 + 32 + ... + 2r

(6)

onde:

TOTAL
COLUNA 1

COLUNA 2

COLUNA 3

...

COLUNA r

(LINHAS)

LINHA 1

Tl1

LINHA 2

Tl2

LINHA 3

Tl3

...

...

LINHA i

Oi1

Oi2

Oi3

...

Oir

Tli

...

...

LINHA n

Tln

TOTAL
(COLUNAS)

Tc1

Tc2

Tc3

...

Tcr

Oi1: freqncia observada na coluna 1 linha i


Oi2: freqncia observada na coluna 2 linha i
Oi3: freqncia observada na coluna 3 linhai
Oir: freqncia observada na coluna r linha i
Tli: total da lina i
Tc1: total da coluna 1
Tc2: total da coluna 2
Tc3: total da coluna 3
Tcr: total da coluna r
N: total de casos na tabela

Retornando ao primeiro exemplo:

Medicina

Farmcia

Biologia

Total

Usa droga

10

20

30

60

No usa
droga

15

15

30

60

Total

25

35

60

120

Primeiro ser calculado o valor do 2 da linha 1 (grupo que usa drogas):


2

linha 1

=[ ( 102 )/ 25 + ( 202 )/ 35 + ( 302 )/ 60 ] x ( 120/ 60 ) 60 = 0,8571

Passa-se agora a trabalhar com a linha 2 (grupo que no usa drogas)


2

linha 2

=[ ( 152 )/ 25 + ( 152 )/ 35 + ( 302 )/ 60 ] x ( 120/ 60 ) 60 = 0,8571

Finalmente,

2 = 2

linha 1

+ 2

linha 2

2 = 0,8571 + 0,8571 = 1,714 com 2 g.l.

Considerando-se que o 2 crtico para 2 graus de liberdade e =0,05 5,99 , H0 no pode ser
rejeitada.

BIBLIOGRAFIA
1. ALTMAN DG Practical statistics for medical research. 1 ed. London: Chapman & Hall,
1991.
2. BEIGUELMAN B Curso prtico de bioestatstica. 5 ed. Ribeiro Preto: Fundao de
Pesquisas Cientfica de Ribeiro Preto, 2002.
3. BERQU ES, SOUZA JMP, GOTLIEB SLD Bioestatstica. 1 ed. So Paulo: EPU, 1981.
4. BLAND M An introduction to medical statistics. 2 ed. New York: Oxford University
Press, 1995.
5. BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.
6. BUSSAB WO, MORETTIN PA Estatstica bsica. 5 ed. So Paulo: Saraiva, 2003.
7. CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre:
Artmed, 2003.
8. DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed.,
New York: John Wiley & Sons, Inc., 1995.
9. GUIMARES RC, CABRAL JAS Estatstica. Lisboa: McGraw-Hill, 1997.
10. LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil,
1987.
11. MARTINS GA Estatstica geral e aplicada. So Paulo: Atlas, 2001.
12. SPIEGEL MR Estatstica. 3 ed. So Paulo: Makron Books, 1993.
13. TRIOLA MF Introduo estatstica. 7 ed., Rio de Janeiro: LTC Livros Tcnicos e
Cientficos Editora Ltda, 1999.
14. VIEIRA S Introduo bioestatstica. 3 ed., Rio de Janeiro: Editora Campus, 1980.
ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

10

Distribuio de valores de 2 para de 5%, 1% e 0,1%

GL

= 5%

= 1%

= 0,1%

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

3,84
5,99
7,82
9,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,88
40,11
41,34
42,56
43,77

6,64
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,72
26,22
27,69
29,14
30,58
32,00
33,41
34,80
36,19
37,57
38,93
40,29
41,64
42,98
44,34
45,64
46,96
48,28
49,59
50,89

10,83
13,82
16,27
18,46
20,52
22,46
24,32
26,12
27,88
29,59
31,26
32,91
34,53
36,12
37,70
39,29
40,75
42,31
43,82
45,32
46,80
48,27
49,73
51,18
52,52
54,05
55,48
56,89
58,30
59,70

11

Comparao de duas populaes -

Andr Moreno Morcillo

COMPARAO DE DUAS POPULAES INDEPENDENTES


Andr M. Morcillo

COMPARAO

DE VARIVEIS NUMRICAS CONTNUAS MEDIDAS

NA ESCALA INTERVALAR OU DE

RAZO

Considera-se que duas amostras ou populaes so independentes quando elas no tm elementos


comuns.
Os dois principais parmetros (do ponto de vista estatstico) de um populao so a mdia e a varincia.
Desta forma, quando desejamos saber se duas amostras so iguais ou diferentes, temos que comparar as
suas mdias e disperses. Do ponto de vista prtico, comparamos as mdias e as varincias.
Duas populaes podem ser consideradas semelhantes quando tm mdias e varincias iguais.
recomendvel que inicialmente comparemos as varincias e, posteriormente, as mdias das duas
amostras.

COMPARAO DAS VARINCIAS RAZO DAS VARINCIAS

A comparao de varincias de duas amostras tomadas ao acaso de uma populao com distribuio
normal realizada pela frmula:

F=s
s

1
2
2

No numerador colocamos a maior e no denominador a menor das varincias encontradas nas amostras.
O valor de F calculado ser comparado ao valor de Fcrtico obtido em uma tabela de distribuio de F,
considerando o nvel de significncia adotado, os graus de liberdade do numerador (n1-1) e o graus de
liberdade do denominador (n2-1).
O teste de comparao de varincias apresentado acima ser muito comprometido se as condies
tericas exigidas distribuio normal e amostras tomadas ao acaso - no forem cumpridas.

Prof. Assistente Doutor do Departamento de Pediatria da FCM/Unicamp

Comparao de duas populaes -

Andr Moreno Morcillo

Construindo o teste de hipteses


A hiptese nula afirma que as varincias das amostras so iguais; enquanto a hiptese alternativa, que elas
so diferentes. Assim:

H0 :
H1:

s =s
s s

Calculamos o valor de F e procuramos o valor crtico de F na sua tabela. Se o valor de F menor que o
encontrado na tabela, no podemos rejeitar a hiptese H0 (significa que a probabilidade de F maior que
o nvel de significncia adotado), concluindo que as amostras tm varincias iguais. Quando o valor de F
for maior ou igual ao valor da sua tabela rejeitamos H0, concluindo que as varincias comparadas so
diferentes.
Exemplo I.1 - Um grupo de crianas com idades entre 7 e 7,5 anos foi submetido a um exame antropomtrico e o
resultados encontrados so apresentados abaixo:

Mdia

Varincia

Sexo masculino

174

123,9

34,81

Sexo feminino

239

123,3

31,36

Desejando saber se a diferena observada entre as varincias das amostras significativa e considerando
o nvel de significncia de 5% (=0,05), calculamos o valor de F:
F = 34,81 / 31,36 = 1,11
A seguir calculamos os graus de liberdade do numerador e do denominador:
Graus de liberdade do numerador = 174 1 = 173
Graus de liberdade do denominador = 239 1 = 238
Procuramos na tabela de F referente a =0,05 o valor crtico de F para 173 e 238 graus de liberdade.
F(0,05,173,238) = 1,00

Como o F calculado maior que F(0,05,173,238) concluimos que a probabilidade encontrada menor que 5%,
o que nos autoriza a rejeitar H0 e aceitar H1, concluindo que as duas amostras estudadas tm varincias
diferentes.
Observao: necessrio que as amostras tenham sido tomadas ao acaso e provenientes de uma
populao com distribuio normal.
2

Comparao de duas populaes -

Andr Moreno Morcillo

COMPARAO DAS MDIAS TESTE T DE STUDENT


Quando temos duas amostras com varincias iguais e que foram tomadas ao acaso de um populao com
distribuio normal, a comparao de suas mdias pode ser realizada usando o Teste t de Student.

t=

x x
EP(
1

x1 x 2 )

Onde o numerador a diferena entre as mdias das duas amostras e

EP(x

x2)

o Erro Padro ou

Erro Standard da diferena entre as mdias.


Uma maneira bastante adequada para calcular o Erro Padro das Diferenas entre as mdias :

EP

(x1 x 2

=
)

Sp2 Sp2
+
n1 n 2

s
Considera-se

2
p

2
p

(n1 1).s12 + (n 2 1).s22


n1 + n 2 2

a melhor estimativa da varincia da populao (2).

O valor de t obtido deve ser comparado ao valor de tcrtico obtido na tabela de distribuio de t de Student,
considerando (n1+n2-2) graus de liberdade e o tipo de teste de hiptese (unilateral ou bilateral).
Construindo o teste de hipteses
A hiptese nula inclui a igualdade das mdias das amostras, enquanto a hiptese alternativa, que elas
sejam diferentes, ou ainda que m1>m2 ou m1<m2.
Assim:
H0 : m1 = m2
H1 : m1 # m2

ou

H0 : m1 < m2
H1 : m1 > m2

ou

H0 : m1 > m2
H1 : m1 < m2

Calculamos o valor de t e procuramos o valor crtico de t na tabela.

Nos testes bilaterais trabalhamos com as duas caudas da distribuio de t, sendo que a rea de no
rejeio de H0 corresponde aos valores de t < tcrtico e t > -tcrtico.
As reas de rejeio de H0 correspondem aos valores de t > tcrtico ou t < -tcrtico (Figura 1).
3

Comparao de duas populaes -

Andr Moreno Morcillo

Nos testes unilaterais do tipo m1>m2, se o valor de t menor que o encontrado na tabela, no rejeitamos
a hiptese H0 (significa que a probabilidade de t maior que o nvel de significncia adotado). Quando t
for maior ou igual ao valor da tabela rejeitamos H0 (Figura 2).
Nos testes unilaterais do tipo m1<m2, se o valor de t maior que o encontrado na tabela, no rejeitamos a
hiptese H0 (significa que a probabilidade de t maior que o nvel de significncia adotado). Quando t
for menor ou igual ao valor da tabela rejeitamos H0 (Figura 3).

rea de rejeio de H0

-t

+t

rea de no rejeio de H0
Figura 1 reas de rejeio de H0 no teste t de Student bilateral. H1: m1#m2

rea de rejeio de H0

- t
Figura 3 rea de rejeio de H0 no teste t de Student unilateral. H1: m1<m2

Comparao de duas populaes -

Andr Moreno Morcillo

rea de rejeio de H0

+ t
Figura 2 rea de rejeio de H0 no teste t de Student unilateral. H1: m1>m2

Exemplo I.2 - Um grupo de crianas com idades entre 8 e 8,5 anos foi submetido a um exame
antropomtrico e os resultados encontrados so apresentados abaixo. O pesquisador deseja saber se as
diferenas observadas entre as mdias das amostras so estatisticamente significantes.

Mdia

Varincias

Sexo masculino

111

126,0

33,64

Sexo feminino

137

125,2

32,49

Desejando saber se a diferena observada entre as varincias das amostras significativa, considerando o
nvel de significncia de 5% (=0,05), calculamos o valor de F:
F = 33,64 / 32,49 = 1,035
A seguir calculamos os graus de liberdade do numerador e do denominador:
Graus de liberdade do numerador = 111 1 = 110
Graus de liberdade do denominador = 137 1 = 136
Procuramos na tabela de F referente a = 0,05 o valor crtico de F para 109 e 137 graus de liberdade.

F(0,05;109;137) = 1,27
Como o F calculado menor que F(0,05,173,238), concluimos que a probabilidade encontrada maior que
5%, o que nos autoriza a no rejeitar H0.
5

Comparao de duas populaes -

Andr Moreno Morcillo

A seguir, considerando que as amostras foram tomadas ao acaso de uma populao com distribuio
normal e que tm varincias iguais, aplicamos o Teste t de Student.

(n 1). s + (n 1). s = (111 1).33,64 + (137 1).32,49 = 33,004


s =
111 + 137 2
n +n 2
2

a) calculando o

b) calculando o

c) calculando o

EP x
t=

x2

s +s
n n

33,004 33,004
= 0,7336
+
111
137

x x = 126 125,2 = 1,090


EP(x x ) 0,7336
1

d) calculando os graus de liberdade = 111 + 137 2 = 246


f) analisando as hipteses. Como o teste de hipteses bilateral temos:
H0 : m1 = m2
H1 : m1 m2
Procuramos o valor crtico de t para testes bilaterais t0,05,246 = 1,960. Comparamos o t calculado com os
tcrticos +1,960 e 1,960. Como o valor do t calculado cai na rea de no rejeio de H0 conclumos que m1
= m2 ou que as amostras so procedentes de uma mesma populao.
Por outro lado, se H1= m1>m2 (teste unilateral) o t0,05,246 = 1,644; o t calculado tambm cairia na rea de
no rejeio de H0 e, portanto, rejeitaramos H1.

Teste t de Student quando as varincias so diferentes

Um situao especial aquela em que temos duas amostras com varincias diferentes tomadas ao acaso
de uma populao com distribuio normal. Esta situao conhecida como problema de Behrens-Fisher
e vrias solues tm sido propostas para resolv-la. Uma alternativa boa foi proposta por Smith (1936),
que tambm conhecida por Aproximao de t de Welch, em que calcula-se o valor de t por:

t=

x1 x 2
2

S1 + S 2
n1 n2

Os graus de liberdade devero ser calculados pela frmula:


6

Comparao de duas populaes -

Andr Moreno Morcillo


2

S S
+
n n
gl =
s s

n + n
2
1

2
2

1
1

n1 1

n2 1

Tomamos sempre o menor inteiro obtido pela frmula acima.


Exemplo I.3: realizar o teste t comparando as mdias de duas amostras A e B com as seguintes
caractersticas:
Amostra A:

n=10

mdia= 10

varincia= 2,0

Amostra B:

n=10

mdia= 12

varincia= 2,0

Desejamos saber se a mdia de A estatisticamente menor que a de B, portanto, temos um teste unilateral
com:
H0: m1 > m2
H1: m1 < m2
a)

calculamos o erro padro da diferena: 0,6324

b) calculamos o valor de t = (10-12) / 0, 6324= -3,162


c)

verificamos que o t crtico para = 0,05; 18 graus de liberdade e teste unilateral 1,734

d) atribuimos o sinal negativo ao t crtico = -1,734


Como o t calculado menor que o tcrtico rejeitamos H0 e aceitamos H1.
Uma maneira matematicamente mais elegante de calcular o t nestes casos seria trabalharmos com o
mdulo da diferena entre m1 e m2 e compararmos o valor do t obtido diretamente com o t da tabela.

t=

x x
EP(x x )
1

Observaes
a) quando h um importante desvio das condies de normalidade e/ou de igualdade das varincias
recomenda-se utilizar um mtodo no-paramtrico para a comparao dos dois grupos.

Comparao de duas populaes -

Andr Moreno Morcillo

b) quando a hiptese alternativa m1<m2 o valor de t negativo (menor que 0). Como pode ser
observado, os valores na tabela de distribuio de t so todos maiores que 0. Na verdade os valores
negativos no foram colocados na tabela para economizar espao. Como a distribuio de t simtrica,
basta achar o valor positivo de t considerando o nvel de significncia desejado e os graus de liberdade e
atribuir-lhe o sinal negativo.
Quando o t calculado menor que o valor de tcrtico, rejeitamos H0 e aceitamos H1.
VIOLAO DAS CONDIES IDEAIS PARA APLICAO DO TESTE T DE STUDENT
Do ponto de vista terico necessrio que as duas amostras que esto sendo comparadas tenham sido
tiradas ao acaso de uma populao que tenha distribuio normal e que as duas amostras tenham
varincias iguais. Estas condies dificilmente so conseguidas em pesquisas na rea da Biologia.
Vrios estudos tm demonstrado que o Teste t pouco alterado quando as condies acima descritas no
so obtidas, especialmente quando as amostras tm o mesmo tamanho ou so aproximadamente iguais em
testes bilaterais; por outro lado, o Teste t torna-se mais resistente quanto maior for o tamanho das
amostras, especialmente quando elas tm o mesmo tamanho (n1 = n2). Deveremos ser muitos prudentes
em teste unilaterais quando h assimetria evidente.
Pode-se dizer que o Teste t bilateral muito pouco afetado pela assimetria em amostras que foram
tomadas ao acaso, porm o mesmo no ocorre se usarmos o teste unilateral.
Com relao curtose, o poder do teste menor nas distribuies platicrticas e maior na leptocrticas,
especialmente quando as amostras so pequenas.

Comparao de duas populaes -

Andr Moreno Morcillo

COMPARAO DE DUAS POPULAES CORRELATAS


TESTE T DE STUDENT PAREADO
Considera-se duas amostras correlatas quando os elementos do grupo de estudo so comuns a ambas.
Na prtica esta situao ocorre quando um conjunto de pacientes submetido a um procedimento em dois
momentos diferentes, como por exemplo, quando um grupo de pacientes com diabetes recebe uma
determinada modificao na dieta e o mdico deseja avaliar o seu efeito sobre o estado nutricional.
Assim, realiza-se um exame antropomtrico inicial que repetido aps trs meses. Em outro caso, um
grupo de crianas com asma atpica avaliada ao chegar ao servio, passando a usar corticoesterides
conforme um protocolo pr-estabelecido que prev uma avaliao da estatura no incio e aps seis meses
de tratamento.
Nestes dois casos h somente um grupo de estudo, porm cada elemento tem duas medidas, ou seja cada
criana foi avaliada duas vezes, portanto, h dois conjuntos de medidas.
O teste t de Student para grupos independentes compara as mdias das duas amostras. Se tratarmos cada
conjunto de informaes (a inicial e a final) como amostras diferentes e realizarmos o teste t para
amostras no pareadas, perderamos a oportunidade de estudar uma informao muito importante: a
variao ou modificao observada em cada indivduo que pertence ao estudo.
O objetivo fundamental no teste t para amostras pareadas avaliar o comportamento das diferenas
observadas em cada elemento.
Neste caso a nica exigncia que a varivel tenha distribuio normal e que cada elemento tenha sido
avaliado no incio e no final do estudo.
A hiptese inicial ou de trabalho em geral afirma que no ocorreu diferena entre a primeira e a segunda
avaliao. A hiptese alternativa contesta a inicial: ocorreu diferena estatisticamente significante.
O principio bsico do teste calcular a diferena observada entre as medidas de cada elemento do estudo
(D = Medidafinal Medidainicial). A seguir, calcular a mdia ( D ) e o erro padro da mdia das diferenas
( EP D ).
Aplicando a frmula abaixo calcula-se o valor de t.

t=

D
EP D

sendo que

EP D =

s
n

com [n-1] graus de liberdade

D a mdia das diferenas e s o seu desvio padro


9

Comparao de duas populaes -

Andr Moreno Morcillo

CONSTRUINDO O TESTE DE HIPTESES

Quando no h diferena importante entre as medidas inicial e final de cada elemento a mdia das
diferenas e o valor de t tendem a zero. Nos casos em que o procedimento aplicado tem forte impacto as
diferenas individuais passam a ser mais expressivas, com mdia e valor de t se afastando de zero.
H trs possibilidades para H1:
a) s interessa ao pesquisador saber se h diferena entre o incio e o final do estudo

H0 : D = 0
H1 :

D0

Trata-se de um teste bilateral com dois valores crticos de t ( -t e +t ) que so obtidos na tabela de t de
Student considerando-se o nvel de significncia adotado () e o nmero de graus de liberdade (n-1).
Se o valor de t < -t ou t > +t, t est na zona de rejeio de H0 , portanto, aceita-se H1. Quando o t <
+t e t > -t , est na zona de no rejeio de H0 (Figura 1).
b) Se interessa ao pesquisador saber se os valores no final do estudo so maiores que no incio.
Calculando D = Medidafinal Medidainicial:

H0 : D 0
H1 :

D>0

Trata-se de um teste unilateral, sendo que o valor crtico de t ( +t ) obtido na tabela de t de Student
considerando o nvel de significncia adotado () e o nmero de graus de liberdade. Se o t < t crtico no
se rejeita H0, caso contrrio rejeita-se H0 (Figura 2).
c) Se interessa ao pesquisador saber se os valores no final do estudo so menores que no incio.
Calculando D = Medidafinal Medidainicial:

H0 : D 0
H1 :

D<0

Trata-se de um teste unilateral, sendo que o valor crtico de t ( -t ) obtido na tabela de t de Student
considerando o nvel de significncia adotado () e o nmero de graus de liberdade. Se o t > t crtico no
se rejeita H0, caso contrrio rejeita-se H0 (Figura 3).

10

Comparao de duas populaes -

Andr Moreno Morcillo

Exemplo I.4 - Um grupo de 10 crianas com asma grave, do sexo masculino e 4 anos de idade, que receberam
tratamento com prednisona durante 6 meses. Com o objetivo de avaliar o impacto do tratamento no escore z da altura,
os pacientes foram medidos no incio e no final do perodo de estudo.

escore z da altura
Criana

Diferenas

Inicial

Final

Final - Inicial

n. 1

-0,807

-0,799

0,008

n. 2

0,302

0,305

0,003

n. 3

0,001

-0,023

-0,024

n. 4

1,234

1,089

-0,145

n. 5

-1,111

-1,099

0,012

n. 6

2,010

2,005

-0,005

n. 7

0,222

0,219

-0,003

n. 8

0,123

0,144

0,021

n. 9

-0,199

-0,05

0,149

n. 10

-0,155

-0,087

0,068

Mdia das diferenas


Desvio padro das diferenas

0,008
0,073343

As 10 crianas apresentaram diferenas cuja mdia igual a 0,008 e desvio padro 0,073343. A seguir
calcula-se o Erro Padro da Mdia.

EP D =

0,073343
= 0,023
10

A partir da mdia e de seu erro padro calcula-se o valor de t


t = 0,008 / 0,023 = 0,3478
Graus de liberdade = 10 - 1 = 9
Na tabela de t de Student, considerando um teste bilateral com 9 graus de liberdade e nvel de
significncia de 5%, obtm-se um valor de t crtico igual a 2,26216, sendo que a rea de no rejeio de
H0 est entre -2,26216 e +2,26216. Como o valor de t est na rea de no rejeio de H0, podemos
concluir que no houve mudana no escore z da altura durante o perodo de tratamento com prednisona.
11

Comparao de duas populaes -

Andr Moreno Morcillo

12

Comparao de duas populaes -

Andr Moreno Morcillo

BIBLIOGRAFIA
1.

ALTMAN DG Practical statistics for medical research. 1 ed. London: Chapman & Hall, 1991.

2.

ANDERSON DR, SWEENEY DJ, WILLIAMS TA Estatstica aplicada administrao e economia.


2 ed. So Paulo: Pioneira, 2002.

3.

BEIGUELMAN B Curso prtico de bioestatstica. 5 ed. Ribeiro Preto: Fundao de Pesquisas


Cientfica de Ribeiro Preto, 2002.

4.

BERQU ES, SOUZA JMP, GOTLIEB SLD Bioestatstica. 1 ed. So Paulo: EPU, 1981.

5.

BLAND M An introduction to medical statistics. 2 ed. New York: Oxford University Press, 1995.

6.

BUNCHAFT G Estatstica sem mistrios. 4 ed. Petrpolis, RJ: Vozes, 1997.

7.

BUSSAB WO, MORETTIN PA Estatstica bsica. 5 ed. So Paulo: Saraiva, 2003.

8.

CALLEGARI-JACQUES SM Bioestatstica: princpios e aplicaes. 1 ed. Porto Alegre: Artmed,


2003.

9.

DANIEL WW Biostatistics A foundation for analysis in the health sciences. 6 ed., New York:
John Wiley & Sons, Inc., 1995.

10. GUIMARES RC, CABRAL JAS Estatstica. Lisboa: McGraw-Hill, 1997.


11. LEVIN J Estatstica aplicada s Cincias Humanas. So Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA Estatstica geral e aplicada. So Paulo: Atlas, 2001.
13. SPIEGEL MR Estatstica. 3 ed. So Paulo: Makron Books, 1993.
14. TRIOLA MF Introduo estatstica. 7 ed., Rio de Janeiro: LTC Livros Tcnicos e Cientficos
Editora Ltda, 1999.
15. VIEIRA S Introduo bioestatstica. 3 ed., Rio de Janeiro: Editora Campus, 1980.
ZAR J Biostatistical analysis. 2 ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

13

Comparao de duas populaes -

Andr Moreno Morcillo

Tabela de distribuio de t
Unilateral

40%

25%

10%

5%

2,5%

1%

0,5%

0.05%

Bilateral

80%

50%

20%

10%

5%

2%

1%

0,1%

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0.324920
0.288675
0.276671
0.270722
0.267181
0.264835
0.263167
0.261921
0.260955
0.260185
0.259556
0.259033
0.258591
0.258213
0.257885
0.257599
0.257347
0.257123
0.256923
0.256743
0.256580
0.256432
0.256297
0.256173
0.256060
0.255955
0.255858
0.255768
0.255684
0.255605

1.000000
0.816497
0.764892
0.740697
0.726687
0.717558
0.711142
0.706387
0.702722
0.699812
0.697445
0.695483
0.693829
0.692417
0.691197
0.690132
0.689195
0.688364
0.687621
0.686954
0.686352
0.685805
0.685306
0.684850
0.684430
0.684043
0.683685
0.683353
0.683044
0.682756

3.077684
1.885618
1.637744
1.533206
1.475884
1.439756
1.414924
1.396815
1.383029
1.372184
1.363430
1.356217
1.350171
1.345030
1.340606
1.336757
1.333379
1.330391
1.327728
1.325341
1.323188
1.321237
1.319460
1.317836
1.316345
1.314972
1.313703
1.312527
1.311434
1.310415

6.313752
2.919986
2.353363
2.131847
2.015048
1.943180
1.894579
1.859548
1.833113
1.812461
1.795885
1.782288
1.770933
1.761310
1.753050
1.745884
1.739607
1.734064
1.729133
1.724718
1.720743
1.717144
1.713872
1.710882
1.708141
1.705618
1.703288
1.701131
1.699127
1.697261

12.70620
4.30265
3.18245
2.77645
2.57058
2.44691
2.36462
2.30600
2.26216
2.22814
2.20099
2.17881
2.16037
2.14479
2.13145
2.11991
2.10982
2.10092
2.09302
2.08596
2.07961
2.07387
2.06866
2.06390
2.05954
2.05553
2.05183
2.04841
2.04523
2.04227

31.82052
6.96456
4.54070
3.74695
3.36493
3.14267
2.99795
2.89646
2.82144
2.76377
2.71808
2.68100
2.65031
2.62449
2.60248
2.58349
2.56693
2.55238
2.53948
2.52798
2.51765
2.50832
2.49987
2.49216
2.48511
2.47863
2.47266
2.46714
2.46202
2.45726

63.65674
9.92484
5.84091
4.60409
4.03214
3.70743
3.49948
3.35539
3.24984
3.16927
3.10581
3.05454
3.01228
2.97684
2.94671
2.92078
2.89823
2.87844
2.86093
2.84534
2.83136
2.81876
2.80734
2.79694
2.78744
2.77871
2.77068
2.76326
2.75639
2.75000

636.6192
31.5991
12.9240
8.6103
6.8688
5.9588
5.4079
5.0413
4.7809
4.5869
4.4370
4.3178
4.2208
4.1405
4.0728
4.0150
3.9651
3.9216
3.8834
3.8495
3.8193
3.7921
3.7676
3.7454
3.7251
3.7066
3.6896
3.6739
3.6594
3.6460

0.253347

0.674490

1.281552

1.644854

1.95996

2.32635

2.57583

3.2905

14

Comparao de duas populaes -

Andr Moreno Morcillo

Valores crticos de F ao nvel de 5% (Bilateral) ou 2,5% (Unilateral)


S21

S22

(numerador)

denominador

10

12

15

20

24

30

40

60

120

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

647,79
38,51
17,44
12,22
10,01
8,81
8,07
7,57
7,21
6,94
6,72
6,55
6,41
6,30
6,20
6,12
6,04
5,98
5,92
5,87
5,83
5,79
5,75
5,72
5,69
5,66
5,63
5,61
5,59
5,57
5,42
5,29
5,15
5,02

799,50
39,00
16,04
10,65
8,43
7,26
6,54
6,06
5,71
5,46
5,26
5,10
4,97
4,86
4,77
4,69
4,62
4,56
4,51
4,46
4,42
4,38
4,35
4,32
4,29
4,27
4,24
4,22
4,20
4,18
4,05
3,93
3,80
3,69

864,16
39,17
15,44
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,63
4,47
4,35
4,24
4,15
4,08
4,01
3,95
3,90
3,86
3,82
3,78
3,75
3,72
3,69
3,67
3,65
3,63
3,61
3,59
3,46
3,34
3,23
3,12

899,58
39,25
15,10
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,28
4,12
4,00
3,89
3,80
3,73
3,66
3,61
3,56
3,51
3,48
3,44
3,41
3,38
3,35
3,33
3,31
3,29
3,27
3,25
3,13
3,01
2,89
2,79

921,85
39,30
14,88
9,36
7,15
5,99
5,29
4,82
4,48
4,24
4,04
3,89
3,77
3,66
3,58
3,50
3,44
3,38
3,33
3,29
3,25
3,22
3,18
3,15
3,13
3,10
3,08
3,06
3,04
3,03
2,90
2,79
2,67
2,57

937,11
39,33
14,73
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,88
3,73
3,60
3,50
3,41
3,34
3,28
3,22
3,17
3,13
3,09
3,05
3,02
2,99
2,97
2,94
2,92
2,90
2,88
2,87
2,74
2,63
2,52
2,41

948,22
39,36
14,62
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,76
3,61
3,48
3,38
3,29
3,22
3,16
3,10
3,05
3,01
2,97
2,93
2,90
2,87
2,85
2,82
2,80
2,78
2,76
2,75
2,62
2,51
2,39
2,29

956,66
39,37
14,54
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,66
3,51
3,39
3,29
3,20
3,12
3,06
3,01
2,96
2,91
2,87
2,84
2,81
2,78
2,75
2,73
2,71
2,69
2,67
2,65
2,53
2,41
2,30
2,19

963,28
39,39
14,47
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,59
3,44
3,31
3,21
3,12
3,05
2,98
2,93
2,88
2,84
2,80
2,76
2,73
2,70
2,68
2,65
2,63
2,61
2,59
2,57
2,45
2,33
2,22
2,11

968,63
39,40
14,42
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,53
3,37
3,25
3,15
3,06
2,99
2,92
2,87
2,82
2,77
2,73
2,70
2,67
2,64
2,61
2,59
2,57
2,55
2,53
2,51
2,39
2,27
2,16
2,05

976,71
39,41
14,34
8,75
6,52
5,37
4,67
4,20
3,87
3,62
3,43
3,28
3,15
3,05
2,96
2,89
2,82
2,77
2,72
2,68
2,64
2,60
2,57
2,54
2,51
2,49
2,47
2,45
2,43
2,41
2,29
2,17
2,05
1,94

984,87
39,43
14,25
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,33
3,18
3,05
2,95
2,86
2,79
2,72
2,67
2,62
2,57
2,53
2,50
2,47
2,44
2,41
2,39
2,36
2,34
2,32
2,31
2,18
2,06
1,95
1,83

993,10
39,45
14,17
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,23
3,07
2,95
2,84
2,76
2,68
2,62
2,56
2,51
2,46
2,42
2,39
2,36
2,33
2,30
2,28
2,25
2,23
2,21
2,20
2,07
1,94
1,82
1,71

997,25
39,46
14,12
8,51
6,28
5,12
4,42
3,95
3,61
3,37
3,17
3,02
2,89
2,79
2,70
2,63
2,56
2,50
2,45
2,41
2,37
2,33
2,30
2,27
2,24
2,22
2,19
2,17
2,15
2,14
2,01
1,88
1,76
1,64

1001,41
39,47
14,08
8,46
6,23
5,07
4,36
3,89
3,56
3,31
3,12
2,96
2,84
2,73
2,64
2,57
2,50
2,45
2,39
2,35
2,31
2,27
2,24
2,21
2,18
2,16
2,13
2,11
2,09
2,07
1,94
1,82
1,69
1,57

1005,60
39,47
14,04
8,41
6,18
5,01
4,31
3,84
3,51
3,26
3,06
2,91
2,78
2,67
2,59
2,51
2,44
2,38
2,33
2,29
2,25
2,21
2,18
2,15
2,12
2,09
2,07
2,05
2,03
2,01
1,88
1,74
1,61
1,48

1009,80
39,48
13,99
8,36
6,12
4,96
4,25
3,78
3,45
3,20
3,00
2,85
2,72
2,61
2,52
2,45
2,38
2,32
2,27
2,22
2,18
2,15
2,11
2,08
2,05
2,03
2,00
1,98
1,96
1,94
1,80
1,67
1,53
1,39

1014,02
39,49
13,95
8,31
6,07
4,90
4,20
3,73
3,39
3,14
2,94
2,79
2,66
2,55
2,46
2,38
2,32
2,26
2,20
2,16
2,11
2,08
2,04
2,01
1,98
1,95
1,93
1,91
1,89
1,87
1,72
1,58
1,43
1,27

1018,26
39,50
13,90
8,26
6,02
4,85
4,14
3,67
3,33
3,08
2,88
2,73
2,60
2,49
2,40
2,32
2,25
2,19
2,13
2,09
2,04
2,00
1,97
1,94
1,91
1,88
1,85
1,83
1,81
1,79
1,64
1,48
1,31
1,00

15