Você está na página 1de 38

BIOESTATÍSTICA

M.I. Eng. Biomédica


Aula Teórica 10
ANOVA
• Exemplo:
▫ White e Froeb estudaram a influência do “fumo passivo” na
função respiratória. Constituíram 6 grupos:
1. Não fumadores (NS)
2. Fumadores passivos (PS)
3. Fumadores não inaladores (NI)
4. Fumadores leves (LS)– menos de 10 cigarros/dia
5. Fumadores moderados (MS) – entre 11 a 39 cigarros/dia
6. Fumadores crónicos (HS) – mais de 40 cigarros/dia
ANOVA

FEF – forced mid-expiratory flow

in Fundamentals of Biostatistics, B. Rossner, pp 517


ANOVA
• Suponhamos que existem k grupos. O grupo i apresenta ni observações. A
observação j do grupo i, denotada por yij, pode ser escrita segundo o
modelo:
yi j  m  a i  ei j

em que m é uma constante, ai é uma constante especifica do grupo i e eij é um


termo de erro associado a cada observação que segue uma distribuição normal
de média 0 e variância s2.

• Não é possível estimar a partir das observações todos os parâmetros, assim


é usual recorrer-se a restrições. Uma das restrições é considerar a soma dos
ai igual a zero.
ANOVA
• A equação anterior traduz a análise de variância de uma só
entrada ou o modelo ANOVA unifactorial (one way ANOVA).

• Com este modelo a média de um número arbitrário de grupos,


os quais seguem uma distribuição normal, pode ser
comparada.

• A variabilidade nos dados é verificada quanto à sua origem:


variabilidade dentro dos grupos ou variabilidade entre os
grupos.
ANOVA
• O valor m representa a média geral de todos os
grupos em conjunto

• O valor ai representa a diferença entre a média do


grupo i para a média geral

• O valor eij representa o erro aleatório relativamente


m+ai para uma observação individual do grupo i
ANOVA
• Teste de hipótese para a análise de variância

• A hipótese nula, H0, neste caso é as médias de todos os grupos


serem iguais. É equivalente a ter ai = 0 para qualquer i.

• A hipótese alternativa é, então, que pelo dois grupos apresentam


médias diferentes. É equivalente a ter ai ≠ 0 para pelo menos um i.
ANOVA
• O desvio de uma observação relativamente à media geral pode
ser representada por:


yi j  y   yi j  yi   yi  y 
• em que y representa a média geral e yi a média do grupo i.

• O primeiro termo do lado direito da equação é a variabilidade


dentro do grupo e o segundo termo a variabilidade entre
grupos.
ANOVA

in Fundamentals of Biostatistics, B. Rossner, pp 519


ANOVA
• Se a variabilidade entre grupos é grande e a variabilidade dentro do
grupo é pequena então H0 é rejeitada.
• Se a variabilidade entre grupos é pequena e a variabilidade dentro
do grupos é grande então H0 é aceite.
• Elevando ao quadrado a equação anterior e somando para todas as
observações, tem-se:

    
ni ni ni
   yi j  yi    yi  y
k 2 k k 2
2
yi j  y
i 1 j 1 i 1 j 1 i 1 j 1

SST SSD SSG


ANOVA
• Seja
SSG
MSG 
k 1
• E
SS D
MS D 
nk

• O teste efectua-se com base no quociente entre MSG e MSD. Se este


quociente é muito grande rejeita-se a hipótese nula, caso contrário
aceita-se.

• Sob a hipótese nula o quociente MSG/MSD segue uma distribuição


Fk-1,n-k.
ANOVA
• Os passos que envolvem o teste que admite:
H 0 : ai  0 H1 : a i  0

• são:
• 1) determinar MSG e MSD;
• 2) calcular o teste-estatístico F= MSG/MSD
• 3) se F > Fk-1,n-k,1-a, então rejeita-se H0
• se F ≤ Fk-1,n-k,1-a, então aceita-se H0
ANOVA

in Fundamentals of Biostatistics, B. Rossner, pp 521


ANOVA
• Comparação de grupos específicos

• Suponhamos que desejamos comparar dois grupos cujas médias diferem


entre si. Temos então:
Y1 ~ N  m  a1 ,s 2 n1 
Y2 ~ N  m  a 2 ,s 2 n2 

• Pelo que:
 2 1 1 
Y1  Y2 ~ N a1  a 2 ,s    
  n1 n2  
• E sob H0
  1 1 
Y1  Y2 ~ N 0,s 2    
  n1 n2  
ANOVA
• A variância s2 pode ser estimada a partir das variâncias amostrais
dos grupos. Assim:
k k

  n  1 s
i
2
i   n  1 s
i
2
i
s2  i 1
 i 1
 MS D
k
nk
  n  1
i 1
i

• A comparação entre grupos é então efectuada com recurso ao teste t.

y1  y2
t ~ tn  k
1 1
s2   
 n1 n2 
Teste bionomial para 1 amostra
• Exemplo:
▫ Numa amostra de 10000 mulheres americanas, com
idades compreendidas entre os 50 e os 54 anos, 400
delas cujas mães tinham tido cancro da mama
apresentavam elas próprias cancro da mama.
▫ Sabendo que a prevalência de cancro da mama é de 2%
qual a relevância da prevalência de cancro da mama
quando existem casos familiares prévios?
Teste bionomial para 1 amostra
• Exemplo:
▫ Outra forma de colocar a questão é sob a forma de
hipóteses:
H0 : p  0,02  p0

 H1 : p  0.02
Teste bionomial para 1 amostra
• O teste é então efectuado à proporção.
▫ Assumindo uma aproximação à distribuição
normal (o que é razoável, dado que np0q0≥5)

 pq 
pˆ ~ N  p, 0 0 
 n 

▫ Mas, sob H0
pˆ  p0
z ~ N  0,1
p0 q0 n
Teste bionomial para 1 amostra
• O teste é então:
▫ Determinar z;
▫ Se z < za/2 ou z > z1-a/2 rejeita-se H0;
▫ Se za/2 ≤ z ≤ z1-a/2 não se rejeita H0;

 Nota: o teste é válido se np0q0 ≥ 5


• Graficamente:

in Fundamentals of Biostatistics, B. Rossner, pp 245


Teste bionomial para 1 amostra
Teste bionomial para 1 amostra
• Método exacto:
▫ Seja X uma variável aleatória que segue uma
distribuição binomial de parâmetros n e p0;
▫ Seja 𝑝Ƹ = 𝑥/𝑛, em que 𝑥 é o número de eventos
observados;
Teste bionomial para 1 amostra
• Método exacto
▫ Se 𝑝Ƹ ≤ p0:

p 2  P   x sucessos em n tentativas| H 0 
x
n k
    p0 1  p0 
nk

k 0  k 
Teste bionomial para 1 amostra
• Método exacto
▫ Se 𝑝Ƹ > p0:

p 2  P   x sucessos em n tentativas| H 0 
n
n k
    p0 1  p0 
nk

k x  k 
Teste bionomial para 1 amostra
• Exemplo de aplicação:

in Fundamentals of Biostatistics, B. Rossner, pp 248


Teste bionomial para 1 amostra
• Exemplo de aplicação:
n p0 q0  13  0, 2  0,8  2,1  5
5
pˆ   0,38  0, 20
13
13
13  k 13k    k 13k 
4 13
p  2    0, 2 0,8  2 1     0, 2 0,8   0,198
k 5  k   k 0  k  

 Logo, a proporção de mortes por cancro não é


significativamente diferente à obtida para outros
trabalhadores da mesma idade;
Teste binomial para 2 amostras
• Exemplo:
▫ Para testar a hipótese de que o risco de sofrer de
cancro da mama pode estar relacionado com o
intervalo de tempo entre a menarca e o 1º filho,
foram constituídos dois grupos de mulheres com e
sem cancro da mama. Em ambos os grupos foi
determinada a proporção de mulheres que deu à
luz o 1º filho depois dos 30 anos de idade.
Teste binomial para 2 amostras
• Exemplo:
▫ Pretende-se saber se as proporções são diferentes
nos dois grupos.

H0 : p1  p2  p H0 : p1  p2  0
 ou 
 H1 : p1  p2  H1 : p1  p2  0
Teste binomial para 2 amostras
• Sob H0:

pˆ1 ~ N  p, p q n1 

pˆ 2 ~ N  p, p q n 2 

  1 1 
pˆ1  pˆ 2 ~ N  0, p q    
  n1 n2  
Teste binomial para 2 amostras
• Sob H0:
pˆ1  pˆ 2
z ~ N (0,1)
p q 1 n1  1 n2 

 como p é desconhecido, o melhor estimador é

n1 pˆ1  n2 pˆ 2 x1  x2
pˆ  
n1  n2 n1  n2
Teste binomial para 2 amostras
▫ Para melhor aproximação da distribuição normal
à distribuição binomial usa-se uma correcção de
continuidade
1 1 1 
ˆp1  pˆ 2    
2  n1 n2 
z
p q 1 n1  1 n2 
Teste binomial para 2 amostras
• O teste é então:
▫ Determinar z;
▫ Se z > z1-a/2 rejeita-se H0;
▫ Se z ≤ z1-a/2 não se rejeita H0;

 Nota: o teste é válido se 𝑛1 𝑝Ƹ 𝑞≥


ො 5 e 𝑛2 𝑝Ƹ 𝑞≥
ො 5
• Graficamente:
Teste binomial para 2 amostras

in Fundamentals of Biostatistics, B. Rossner, pp 355


Tabela de contigência

in Fundamentals of Biostatistics, B. Rossner, pp 357


Tabela de contigência
• A significância estatística resulta da comparação
entre os valores observados e valores esperados;
• A tabela de valores esperados é calculada a partir
dos valores marginais;
▫ O valor esperado na célula, Ei,j, é obtido pelo
produto da margem da linha i pela margem da
coluna j, dividido pelo total;
Teste de qui-quadrado
• Resumindo:
▫ Determinar
 
2
2 2 Oi j  Ei j  0,5 Li  C j
X  
2
~ 
2
1
Ei j 
i 1 j 1 Ei j N

▫ Se X 2  1,2 1a rejeita-se H0

 Pode ser aplicado se nenhum Eij < 5


Teste Exacto de Fisher
• Fixando os valores marginais pode determinar-
se a probabilidade exacta de observar uma
determinada tabela com determinadas margens;
Teste Exacto de Fisher
• Dada a tabela:

Variável Amostras ou grupos Linhas

1 2
1 a b a+b
2 c d c+d
Colunas a+c b+d N
Teste Exacto de Fisher
• A probabilidade de observar a tabela é:

 a  b ! c  d ! a  c ! b  d !


P  a , b, c , d  
n!a !b!c !d !

Você também pode gostar