Você está na página 1de 70

Inferncia Estatstica

Profa Alcione Miranda dos Santos


Departamento de Sade Pblica UFMA
Ncleo de Estatstica e Informtica HUUFMA
email: alcione.miranda@terra.com.br

Inferncia Estatstica
Inferncias

a respeito de uma populao so feitas,


baseadas em uma amostra.

Inferncias

a respeito de uma parmetro (por ex. a


mdia populacional) so feitas, examinando
estatsticas amostrais (por ex. , a mdia amostral) .

Inferncia Estatstica

Dois princpios Bsicos:

Testes de Hipteses

Estimao
Estimao Pontual
A mdia amostral uma estimativa pontual da mdia
populacional
Estimao por Intervalos
Intervalos de Confiana

Teoria da Estimao

Em estatstica, muitas vezes desejamos estimar


a proporo com que determinado evento
ocorre. Por exemplo:
Prevalncia

de diabticos no muncipio de So Lus-

MA
Prevalncia de fumo entre os estudantes de Medicina
da UFMA.

Se desejarmos saber tais prevalncias, sem


erro aleatrio, teremos que estudar toda a
populao dos estudantes.

Teoria da Estimao

Atravs da teoria de estimao podemos tomar


uma amostra aleatria da populao de
interesse e estimarmos, com uma probabilidade
de erro conhecida, a verdadeira prevalncia
nesta populao.
Estimao o processo pelo qual, usando-se
um valor amostral (estatstica) inferimos o valor
populacional (parmetro).

Teoria da Estimao

Estimador- uma estatstica destinada a


estimar um parmetro.

Existem dois tipos de estimao:


Estimao

Pontual
Estimao por Intervalo

Estimativa Pontual

Quando a partir de uma amostra representativa da


populao, o pesquisador procura obter um nico valor
para o parmetro.
Exemplo: Prevalncia de fumo entre os estudantes de
Medicina da UFMA.

f
p =
n
onde f a freqncia do evento na amostra e n o
tamanho da amostra

Estimativa por Intervalo

Neste caso, calculamos a margem de erro aleatrio de


uma estimativa e construmos um intervalo.

O intervalo contm o parmetro com uma probabilidade


pr
- definida.

Um intervalo de confiana est associado a um grau de


confiana que a uma medida da nossa certeza que o
intervalo contm o parmetro.

Esta maneira de estimar o parmetro mais


interessante, pois fornece elementos para se discutir a
preciso da estimativa.

Estimativa por Intervalo

O grau de confiana a probabilidade


(1-)
do intervalo de confiana conter o verdadeiro
valor do parmetro.

Geralmente, adota-se = 1%, 5% ou 10%.

chamado de nvel de significncia.


A escolha do nvel de confiana depende da
preciso que desejamos estimar o parmetro.

Intervalo de Confiana para a


Proporo Populacional
O IC para a proporo populacional dado por

IC[ ; (1 )%] = p z / 2

p .(1 p )
n

Nota: O intervalo s poder ser construdo quando f 5


en f+5

EXEMPLO: Uma droga foi testada em 25 pacientes e apresentou


efeitos colaterais em 8 casos. Qual a proporo de ocorrncia de
efeitos colaterais?

Estimativa pontual: 8/25 = 0,32 ou 32%.

Estimativa por intervalo: Adotando-se um nvel


de significncia de 5%, tem-se:

(0,32)(0,68)
= [0,15;0,53]
IC[ ;95%] = 0,32 1,96
25

COMANDO STATA
O comando usado para construir IC para proporo

cii n f
com
n = tamanho da amostra
f = freqncia do evento na amostra
Para o exemplo anterior, temos:
cii 25 8
-- Binomial Exact -Variable |
Obs
Mean
Std. Err.
[95% Conf. Interval]
-------------+--------------------------------------------------------------|
25
.32
.0932952
.1494954
.5350007

IC

Intervalo de Confiana para a Mdia


Populacional

Caso 1: Grandes Amostras (n 30)

IC[ ; (1 )%] = x z / 2

s
n

Caso 2: Pequenas Amostras (n < 30)

IC[ ; (1 )%] = x t( n 1; / 2 )

s
n

Distribuio t Student

A distribuio de t student tem um tem um


formato semelhante ao da distribuio normal,
mas a curva mais larga.

Uma caracterstica importante da distribuio t


student o nmero de graus de liberdade.

Tabela t Student
Se uma distribuio t student
tem 11 graus de liberdade,
encontre o valor de t que faz
o a rea sombreada ser de
0,025

EXEMPLO: Com o intuito de estudar o contedo de cido lctico no


sangue de indivduos com demncia precoce, uma amostra de
pacientes foi tomada e os resultados foram os seguintes: mdia =
mg/100 ml e desvio padro = 4,6 mg/100 ml. Estime atravs
intervalo de confiana a mdia do teor de cido lctico no sangue
indivduos com demncia precoce.

4,6
IC[ ;95%] = 13 t(15;0,025)
16
IC[ ;95%] = 13 2,1315.1,15 = [10,55;15,45]

16
13
de
de

COMANDO STATA
O comando usado para construir IC para mdia populacional

cii n me sd
com
n = tamanho da amostra
me = mdia amostral
sd = desvio padro
Para o exemplo anterior temos:
. cii 16 13 4.6
Variable |
Obs
Mean
Std. Err.
[95% Conf. Interval]
-------------+--------------------------------------------------------------|
16
13
1.15
10.54883
15.45117

S
n

IC

Testes de Hipteses
Profa Alcione Miranda dos Santos
Departamento de Sade Pblica UFMA
Ncleo de Estatstica e Informtica HUUFMA
email: alcione.miranda@terra.com.br

Testes de Hipteses

Algumas vezes existe um particular interesse


em decidir sobre a verdade ou no de uma
hiptese especfica.
Por exemplo: Se dois grupos tm a mesma mdia ou
se o parmetro
populacional tem um valor em
particular.

Teste de hipteses fornece-nos a estrutura para


que faamos isto.

Quando falamos em hipteses estamos nos referindo


perguntas sobre a relao entre variveis, por exemplo:

A varivel "doena" est associada varivel "fator de risco"?

Repare que as hipteses so apenas fundamentais em


estudos analticos ou experimentais.

Estudos descritivos no necessitam de hipteses, basta


descrever as caractersticas da amostra em estudo.

Testes de Hipteses

Hiptese cientfica: existe um efeito E.


Hipteses estatsticas: diferenas, associao,
estimao pontual
Hiptese nula (H0): ausncia de diferena
Hiptese alternativa (HA): contrria H0

Testes de hipteses: fornecem subsdios para


se rejeitar ou no uma hiptese estatstica.

Tipos de Erros

Ao tomar uma deciso a favor ou contra uma


hiptese, existem dois tipos de erros que
podemos cometer: Erro Tipo I e Erro Tipo II

Erro Tipo I: Rejeitar a hiptese nula quando de


fato ela verdadeira.
Erro Tipo II: Aceitar a hiptese nula quando de
fato ela falsa.

Tipos de Erros
Deciso

Hoverdadeira

Ho falsa

Aceitar a
hiptese

Deciso correta
(1- )

Erro de tipo II

Rejeitar a
hiptese

Erro de tipo I

Deciso correta
(1-)

nvel de significncia

Poder do teste

Testes Bilaterais e Unilaterais

Teste bilateral: h interesse em identificar diferena


para qualquer direo.
Exemplo: droga altera a PAS

Teste unilateral: apenas tem sentido diferena em


uma direo.
Exemplo: dieta para reduo do nvel srico de
colesterol.

Testes de Hipteses

Todos os
suposies;

testes

de

hipteses

tm

As suposies devem ser verificadas;


Se alguma suposio violada, ento os
testes estatsticos podem ser invlidos.

Testes de Hipteses

Paramtricos:

No-paramtricos: no fazem suposies

so
baseados
nas
caractersticas das distribuies tericas que a
distribuio dos dados segue.

sobre a distribuio dos dados. Tm menos


poder.

Passos para realizar um Teste de Hipteses

Passo 1 : Definio da Hiptese


O primeiro passo o estabelecimento das hipteses:

Hiptese Nula (H0): um valor suposto para um


parmetro.Se os resultados da amostra no forem muito
diferentes de H0, ela no poder ser rejeitada.

Hiptese Alternativa (HA): uma hiptese que contraria


a hiptese nula, complementar de Ho, Essa hiptese
somente ser aceita se os resultados forem muito
diferentes de Ho.

Passos para realizar um Teste de Hipteses


Passo

2: Calcular a estatstica do Teste

o valor calculado a partir da amostra, que ser usado na tomada


de deciso. Uma maneira de tomar-se uma deciso comparar o
valor tabelado com a estatstica do teste.

Para o caso de testes de mdias, a estatstica do teste a varivel


padronizada Z:

Zcal =
Estatstica
do teste

(X )
(

n)

Variabilidade
das mdias

Passos para realizar um Teste de Hipteses


Passo 3: Regio Crtica

A regio crtica a regio onde Ho rejeitada. A rea


da regio crtica igual ao nvel de significncia (), que
estabelece a probabilidade de rejeitar Ho quando ela
verdadeira.

Por exemplo, se utilizarmos o nvel de significncia de


5%, a probabilidade de rejeitar Ho quando ela
verdadeira igual a 5%. Na prtica, os valores usuais
so: = 0,01 ou 0,05 ou 0,10.

Passos para realizar um Teste de Hipteses

Unilateral esquerda:
Ho: = 50
HA: > 50

Unilateral direita:
Ho: = 50
HA: <50

Bilateral:
Ho: = 50
HA: 50

Passos para realizar um Teste de Hipteses


Passo 4. Regra de Deciso:

Se o valor da estatstica do teste cair na regio crtica, rejeita-se Ho.


Ao rejeitar a hiptese nula existe uma forte evidncia de sua falsidade.
Ao contrrio, quando aceitamos, dizemos que no houve evidncia
amostral significativa no sentido de permitir a rejeio de Ho.

p-valor

Definio: probabilidade de obter o resultado que


obtivemos ou mais estremo, sendo a hiptese nula
verdadeira.

O p
- valor comparado ao nvel de significncia prdeterminado.

Se o p
- valor for menor ou igual ao nvel de significncia,
rejeitamos H0.

Note as seguintes interpretaes de p-valores:

p > 0,10
p < 0,10
p < 0,05
p < 0,01

No existe evidncia contra H0


Fraca evidncia contra H0
Evidncia significativa contra H0
Evidncia altamente significativa contra H0

Testes de Hipteses

Estudaremos
considerando:

testes

de

hipteses

(a) Uma nica amostra


(b) Comparao de duas ou mais amostras

Primeiramente, vamos estudar


hiptese para uma amostra.

teste

de

Uma amostra - Varivel quantitativa

Com uma amostra de indivduos


queremos saber se a mdia da
respectiva
populao

um
determinado valor.

Teste de Hiptese para Mdia Populacional

PASSO 1: H0: M=128

PASSO 2: Nvel de significncia: 5%

PASSO 3: Estatstica do teste:


Z cal =

x 0

versus

HA: M128

135 128
7
=
=
= 2 ,28 .
24
3,1
60

PASSO

4: Construir a Regio de Rejeio (RR)

TESTE BILATERAL

RA
RR

RR

Portanto, a amostra aleatria


medicamento M aumenta a PAS.

Agora, vamos calcular o p


- valor para o teste de
hiptese em questo:

Temos que calcular a probabilidade de observarmos


um valor igual ou superior a 2,28, isto ,
p-valor:

sugere

que

P(Z>2,28) =0,013 (distribuio normal)

Como o teste bilateral, temos que multiplicar por dois


esta probabilidade. Assim, 0,013 x 2 = 0,026

Desde que o p
- valor menor que o nvel de
significncia do teste ( = 5%), rejeita
- se a hiptese
nula.

Quando o
desvio padro populacional
desconhecido, porm
n30, podemos usar a
distribuio Normal, mas voc deve substituir o desvio
padro populacional pelo desvio padro amostral.

Quando o n<30 e o desvio padro populacional


desconhecido, temos que aplicar o teste t de Student
com a frmula abaixo:

x 0
tcal =
~ t( n1)
s n
Suposio do teste: A varivel quantitativa normalmente distribuda
na populao.

Exemplo: Teste t
A altura mdia dos estudantes da UFMA de 1,70 m. Em
uma amostra casual de tamanho 25 foi estimada a mdia
de 1,72 m e desvio padro da amostra de 0,08 m. Pode
se considerar que a mdia amostral no difere da mdia
da populao?

Soluo:

a ) H 0 : = 1,70m

H A : 1,70m

b ) = 0,05; t crit ; 0 , 025 ; 24 g .l . = 2,064

x 1, 72 1, 70
c) t =
= 1, 25
=
s
0 , 08
n
25
d) Deciso: No h evidncia para rejeitar H0.

Soluo no STATA:

contm 1,70m

ttesti 25 1.72 0.08 1.70


One-sample t test
-----------------------------------------------------------------------------|
Obs
Mean
Std. Err.
Std. Dev.
[95% Conf. Interval]
---------+-------------------------------------------------------------------x |
25
1.72
.016
.08
1.686978
1.753022
-----------------------------------------------------------------------------mean = mean(x)
t =
1.2500
Ho: mean = 1.70
degrees of freedom =
24
Ha: mean < 1.70
Pr(T < t) = 0.8883

Ha: mean != 1.70


Pr(|T| > |t|) = 0.2234

H 0 : 0 = 1,70m

Ha: mean > 1.70


Pr(T > t) = 0.1117

tcal = 1,25
p valor> 0,05

Teste de Hiptese para Proporo Populacional

Vejamos agora teste de hiptese para variveis


qualitativas.
Por exemplo: prevalncia de uma doena.

Para construo de um teste de hipteses, para esta


situao, devemos seguir o mesmo raciocnio
anteriormente aplicado para variveis quantitativas.

Teste de Hiptese para Proporo Populacional

Estabelea a hiptese nula e a hiptese alternativa


Exemplo: H0: = 0 versus HA: 0

Calcule a proporo amostral

Calcule a estatstica do teste

zcal =

p 0

0 (1 0 )
n

Teste de Hiptese para Proporo Populacional

Utilizar a tabela da Distribuio Normal para


determinar o p-valor.

Comparar o p-valor do teste com o nvel de


significncia do teste.

Nota: Uma regra geral que o teste anterior


vlido quando temos ambos np e n(1 p )
maiores do que 10.

Exemplo: Teste de Hiptese para Proporo


Populacional
Em um regio afetada por um surto epidmico,
observou
- se uma amostra de 2500 indivduos, tendo
se encontrado 625 contaminados. Teste, ao nvel de
significncia 5%, se a proporo de indivduos
contaminados significativamente superior a 20%.

Soluo:

a) H 0 : = 0,20

H A : > 0,20

b ) = 0,05; z 0 , 05 = 1,65
c ) Z cal =

p
0

(1 0 )
n

0 , 25 0 , 2
= 6 , 25
0 , 25 (1 0 , 75 )
2500

d) Regio crtica:

d) Deciso: H evidncia para rejeitar H0.

Soluo no STATA:
No contm 0,2

prtesti 2500 0.25 0.2v


One-sample test of proportion
x: Number of obs =
2500
-----------------------------------------------------------------------------Variable |
Mean
Std. Err.
[95% Conf. Interval]
-------------+---------------------------------------------------------------x |
.25
.0086603
.2330262
.2669738
-----------------------------------------------------------------------------p = proportion(x)
z =
6.2500
Ho: p = 0.2
Ha: p < 0.2
Pr(Z < z) = 1.0000

Ha: p != 0.2
Pr(|Z| > |z|) = 0.0000

Ha: p > 0.2


Pr(Z > z) = 0.0000

zcal = 6,25
H 0: = 0 ,2

p-valor <0,05

Comparao de Dois grupos

Na pesquisa mdica, muito freqente


necessitarmos comparar mdias ou propores
de amostras diferentes (por ex. caso x
controle).

Se estamos estudando duas amostras, ento


amostras pareadas ou independentes?

Amostras Independentes

Neste tipo de estudo, temos duas amostras, mas cada


indivduo participa apenas de uma das amostras.

Amostras Pareadas

Num estudo pareado, novamente se tem duas


amostras, mas cada observao da primeira amostra
pareada com uma observao da segunda amostra.

Dois grupos independentes (uma observao em cada


unidade amostral).

Exemplos
1. Dois produtos
2. Duas drogas teraputicas
3. Duas marcas comerciais
4. Dois procedimentos cirrgicos
5. Dois gneros

Dois grupos pareados (duas observaes em cada unidade


amostral).

Exemplos
1. Antes e depois de uma interveno cirrgica
2. Lados direito e esquerdo
3. Dois perodos diferentes

Teste t para duas amostras independentes

A varivel de interesse uma varivel


quantitativa e normalmente distribuda.

Exemplo: Comparar produtos alimentcios


(um novo, outro tradicional) no ganho de peso
de ratos de laboratrio.

Voc que saber se na populao:

As mdias so diferentes?
A mdia do novo produto maior?

Voc tambm precisa saber se, na populao:

A variabilidade a mesma nos dois grupos?


A variabilidade diferente?

Para verificar se a variabilidade a mesma


nos dois grupos, utiliza-se o Teste F.
H 0 : 1 = 2
2

versus

H A : 1 2
2

1o Caso: Considere a situao em que as duas varincias


populacionais so desconhecidas, mas razovel assumir
que elas sejam iguais.

Neste caso, utiliza


- se o teste -t S
tudent para amostras
independentes.
Estatstica do teste:

tcal =

x1 x2
~ t( n1 + n2 2 )
1
1
+

n n
1

com

2
2
n
s
n
s
(

1
)
+
(

1
)
1
2
2
s 2p = 1
n1 + n2 2

Exemplo: Duas amostras independentes


com varincias iguais

Um pesquisador gostaria de testar a hiptese que os


homens so mais pesados que as mulheres idade
adulta. Tomou ao acaso uma amostra de 35 alunos,
sendo 17 do sexo feminino e 18 do masculino.

Masculino
Feminino

Mdia
76,8
72,9

n
18
17

Varincia
334,18
303,11

Soluo:

a) H0 : M = F
b) H 1 : M > F

c ) = 0 , 05 ; t 0 , 05 ; 33 g . l = 1, 69
d ) t cal =

x1 x 2
3,9
3,9
76 ,8 72 ,9
=
=
=
= 0,645
1
1
17 ,86 0,338 6,04
1
1
+
+
17 ,86
18 17
n1 n 2

e) Deciso: No h evidncia para rejeitar H0.

Soluo no STATA:
Teste F
Comando: stesti n1 . sd1. n2. sd2
Para o exemplo anterior, temos:
sdtesti 18 . 18.28 17 . 17.41
Variance ratio test
-----------------------------------------------------------------------------|
Obs
Mean
Std. Err.
Std. Dev.
[95% Conf. Interval]
---------+-------------------------------------------------------------------x |
18
.
4.308637
18.28
.
.
y |
17
.
4.222545
17.41
.
.
---------+-------------------------------------------------------------------combined |
35
.
.
.
.
.
-----------------------------------------------------------------------------ratio = sd(x) / sd(y)
f =
1.1024
Ho: ratio = 1
degrees of freedom =
17, 16
Ha: ratio < 1
Pr(F < f) = 0.5753

Ha: ratio != 1
2*Pr(F > f) = 0.8494

Ha: ratio > 1


Pr(F > f) = 0.4247

Podemos concluir que as varincias populacionais so iguais (p-valor=0,8494)

Soluo no STATA:
Teste t-student para varincias iguais
Comando: ttesti n1 me1 sd1 n2 me2 sd2
ttesti 18 76.8 18.28 17 72.9 17.41
Two-sample t test with equal variances
-----------------------------------------------------------------------------|
Obs
Mean
Std. Err.
Std. Dev.
[95% Conf. Interval]
---------+-------------------------------------------------------------------x |
18
76.8
4.308637
18.28
67.70957
85.89043
y |
17
72.9
4.222545
17.41
63.9486
81.8514
---------+-------------------------------------------------------------------combined |
35
74.90571
2.993466
17.70959
68.82226
80.98917
---------+-------------------------------------------------------------------diff |
3.9
6.041423
-8.391367
16.19137
-----------------------------------------------------------------------------diff = mean(x) - mean(y)
t =
0.6455
Ho: diff = 0
degrees of freedom =
33
Ha: diff < 0
Pr(T < t) = 0.7385

Ha: diff != 0
Pr(|T| > |t|) = 0.5230

Ha: diff > 0


Pr(T > t) = 0.2615

Podemos concluir que as mdias populacionais so iguais (p-valor=0,5230)

2o Caso: Agora, considere a situao em que as duas


varincias
desiguais.

populacionais

so

desconhecidas

Neste caso, deve


- se utilizar o teste t student com
varincias desiguais.

A estatstica do teste dada por

tcal =

x1 x2
s
s
+
n1 n2
2
1

2
2

~ tv

com

S12 S 22
n + n
= 12 2 2 2
S12 S 22

n1 + n2
n1 + 1
n2 + 1

Comando no STATA: ttesti n1 me1 sd1 n2 me2 sd2, unequal

Teste de Hipteses para Duas Mdias Populacionais

Agora, vamos considerar amostras pareadas.

A varivel de interesse quantitativa e normalmente


distribuda.

Novamente, o interesse testar a hiptese nula de que


as duas mdias das populaes so iguais.

As hipteses a serem testadas so


H0: 1 = 2 versus HA: 1 2

Em vez de considerarmos os dois conjuntos de


observaes como amostras distintas, focalizamos a
diferena de medies dentro de cada par.
Amostra 1
x11
x21
x31
x41

Amostra 2
x12
x22
x32
x42

xn1

xn2

Usamos esses dados para criar novo conjunto de


observaes que representam as diferenas dentro de
cada par:

d1=x11-x12
d2=x21-x22
d3=x31-x32
dn=xn1-xn2

A partir dessas diferenas calculamos a mdia


n

d=

i =1

n
n

e o desvio padro
sd =

Estatstica do teste:

(d
i =1

d)

n 1

tcal

d
=
~ t( n 1)
sd
n

Teste de Hipteses para Duas Propores


Populacionais

Primeiramente, vamos considerar amostras independentes.

O interesse comparar dois grupos atravs do resultado


observado em uma varivel dicotmica.

O problema de comparao das propores populacionais


nos dois grupos formulado atravs das hipteses:
H0: 1 = 2 versus HA: 1 2

Teste Qui Quadrado

um teste muito usado na rea mdica que se


destina a comparar propores.

Utiliza-se o teste qui-quadrado quando deseja-se


verificar se a freqncia com que um determinado
acontecimento observado em uma amostra se
desvia significativamente ou no da freqncia
com que ele esperado.

Teste Qui Quadrado


Grupo

Ocorrncia do Evento
SIM
NO

Total

a + b = n1

II

c + d = n2

Total

a + c = m1

b + d = m2 n1+ n2 = n

Exemplo

Os dados a seguir so referentes ao sexo e condio


de sobrevivncia de uma amostra de recm
- nascidos
com sndrome de desconforto idioptico grave.
Sexo
Feminino
Masculino
Total

sobrevivente

No
sobrevivente

10
17
27

7
16
23

Total
17
33
50

Voc diria que meninos sobrevivem mais do que meninas?

Exemplo
Clculos necessrios para a construo do teste qui-quadrado:
i

Oi

Ei

Oi- Ei

(Oi- Ei)2

(Oi- Ei)2
Ei

1
2
3
4
Total

10
17
7
16
50

9,18
17,82
7,82
15,18
50

0,82
-0,82
-0,82
0,82
0

0,6724
0,6724
0,6724
0,6724
2,6896

0,07
0,04
0,08
0,04
0,23

O valor da estatstica do teste 0,23. Como este valor maior do que 3,84,
valor obtido da distribuio qui-quadrado, para um nvel de de significncia
de 5%, no rejeitamos a hiptese nula, ou seja, os meninos no sobrevivem
mais do que as meninas.

Restries ao Uso do Teste Qui-Quadrado

Quando 20 n 40, utilizar o teste qui-quadrado se nenhuma


freqncia esperada seja inferior a 5. Em caso contrrio, utilizar
o Teste Exato de Fisher.

Quando n < 20, utilizar o Teste Exato de Fisher.

Quando n > 40, utilizar o teste qui-quadrado.

Quando o nmero de categorias for maior do que 2, no mais


que 20% das categorias devem ter freqncias menores que 5
e nenhuma categoria deve ter freqncia menor que 1.

Você também pode gostar