Você está na página 1de 31

Testes “t” e ANOVA one way

Airton J Rombaldi
Marlos R Domingues
Passos de uma análise estatística
1. Análises descritivas
 Variáveis categóricas: n absoluto e relativo; IC95%
 Variáveis numéricas: n absoluto; média e DP (mediana e
IIQ)

2. Análises bivariadas
 Teste de hipótese

3. Análise multivariável
Análise bivariada
 Primeiro passo
 Estudar detalhadamente a variável dependente (desfecho)
 Estudar as variáveis independentes (exposições)

***** A partir da análise descritiva o pesquisador toma decisões sobre


os testes que serão utilizados

 Alguns fatores a serem observados:


 Número de observações
 Distribuição dos dados
 Homogeneidade das variâncias
 Valores ignorados (missings) -
 Necessidade de imputação de escore ausentes?
 Outros
Variáveis desfecho e exposição desta aula

 Desfecho numérico (contínuo ou discreto)


 teste t pareado (pré-teste x pós-teste)

 Variável exposição categórica:


 1. dicotômica – teste t (não pareado)

 2. dicotômica – teste t (não pareado) variâncias desiguais

 3. politômica – análise de variância “one way” (uma via, um


fator, uma variável independente)
Vamos a prática:
 Exercício 1 – desfecho numérico

 Objetivo do estudo:Verificar se existe diferença na média de


peso entre homens e mulheres.
 Qual é o desfecho ou variável dependente?
 Como é sua distribuição?
 As variâncias são homogêneas?
 Qual seu n?

 Qual é a exposição?
 Como é sua distribuição?
 Qual seu n?
Distribuição normal pela inspeção visual
 hist peso, norm
.03
.02
Density

.01
0

0 50 100 150 200


peso
Variâncias homogêneas para a exposição
sexo
 . robvar peso, by(sexo)

 sexo 0= | Summary of massa corporal


 masc 1=fem | Mean Std. Dev. Freq.
 ------------+------------------------------------
 masc | 76.628692 13.499569 1,307
 fem | 64.192619 12.281312 1,680
 ------------+------------------------------------
 Total | 69.634181 14.233442 2,987

 W0 = 3.5216392 df(1, 2985) Pr > F = 0.06066999

 W50 = 3.4816338 df(1, 2985) Pr > F = 0.06215145

 W10 = 3.7541530 df(1, 2985) Pr > F = 0.05277069


Teste “t”
 Utilizado para:
 Desfecho numérico com distribuição normal
 Exposição dicotômica (Exemplo: sexo = masc/fem)
 Variâncias homogêneas

 Comando
 ttest variável-numérica, by(variável-dicotômica)
 Exemplo: ttest peso, by(sexo)

 ATENÇÃO: Quando o N é MUITO GRANDE, de


modo geral, pode-se utilizar teste “t” mesmo que a
distribuição do desfecho seja não paramétrica.
Exercício 1

 Objetivo da análise: verificar se existem diferenças entre


as médias de peso de acordo com o sexo.

 Desfecho = peso
 Variável numérica contínua

 Exposição = sexo
 Variável categórica dicotômica
(0) Homens
(1) Mulheres
CONCLUSÃO?
ttest peso, by (sexo)

Two-sample t test with equal variances


------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
masc (0)| 1307 76.62869 .3734067 13.49957 75.89615 77.36123
fem (1)| 1680 64.19262 .2996333 12.28131 63.60492 64.78031
---------+--------------------------------------------------------------------
combined | 2987 69.63418 .2604308 14.23344 69.12354 70.14482
---------+--------------------------------------------------------------------
diff | 12.43607 .4731549 11.50833 13.36382
------------------------------------------------------------------------------
diff = mean(0) - mean(1) t = 26.2833
Ho: diff = 0 degrees of freedom = 2985

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000

Probabilidade rejeitar Probabilidade rejeitar


H1 Bicaudal H1 Unicaudal

Qual valor “p” deve ser considerado correto?


Qual valor de “p” deve ser aceito como o
valor correto?
 No slide anterior, a média de peso dos homens (categoria
0) é maior que a média de peso das mulheres (categoria
1);
 Logo a diferença das médias é positiva (> 0);
 Assim, os valores de “p” que precisamos verificar são para
“p diferentes de zero (!=0)” ou “p maior do que zero
(>0)”;
 No caso do slide anterior, os valores “p” do centro ou da
direita, respectivamente.

 Resposta à pergunta no título deste slide: depende do


objetivo do estudo.
CONCLUSÃO?
 ttest peso, by (sexo)

 Two-sample t test with equal variances


 ------------------------------------------------------------------------------
 Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
 ---------+--------------------------------------------------------------------
 fem (0)| 1,680 64.19262 .2996333 12.28131 63.60492 64.78031
 masc (1)| 1,307 76.62869 .3734067 13.49957 75.89615 77.36123
 ---------+--------------------------------------------------------------------
 combined | 2,987 69.63418 .2604308 14.23344 69.12354 70.14482
 ---------+--------------------------------------------------------------------
 diff | -12.43607 .4731549 -13.36382 -11.50833
 ------------------------------------------------------------------------------
 diff = mean(fem) - mean(masc) t = -26.2833
 Ho: diff = 0 degrees of freedom = 2985

 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000

Probabilidade rejeitar Probabilidade rejeitar


H1 Unicaudal H1 Bicaudal
Qual valor de “p” deve ser aceito como o
valor correto?
 No slide anterior, a média de peso das mulheres
(categoria 0) é menor que a média de peso dos homens
(categoria 1);
 Logo a diferença das médias é negativa (< 0);
 Assim, os valores de “p” que precisamos verificar são para
“p menor do que zero (<0)” ou “p diferentes de zero
(!=0)”;
 No caso do slide anterior, os valores “p” da esquerda ou
do centro, respectivamente.

 Resposta à pergunta no título deste slide: depende do


objetivo do estudo.
Quando aceitar o “p” bicaudal ou unicaudal?
Bicaudal => H1 afirma que as
Unicaudal => H1 afirma que uma médias são estatisticamente
das médias é estatisticamente maior diferentes (sem afirmar qual é a
(ou menor) do que a outra. maior ou a menor).
Reduz a chance de rejeitar H0 Aumenta a chance de rejeitar H0

ATENÇÃO: Decisão tomada antes de coletar os dados, na fase de projeto !!!!


CONCLUSÃO
ttest peso, by (sexo)

Two-sample t test with equal variances


------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
masc (0)| 1307 76.62869 .3734067 13.49957 75.89615 77.36123
fem (1)| 1680 64.19262 .2996333 12.28131 63.60492 64.78031
---------+--------------------------------------------------------------------
combined | 2987 69.63418 .2604308 14.23344 69.12354 70.14482
---------+--------------------------------------------------------------------
diff | 12.43607 .4731549 11.50833 13.36382
------------------------------------------------------------------------------
diff = mean(0) - mean(1) t = 26.2833
Ho: diff = 0 degrees of freedom = 2985

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000

Valor “p”
BICAUDAL
Análise de variância (ANOVA)
 Teste utilizado para:
 Desfecho numérico com distribuição normal
Subcomando da
 Exposição politômica (3 ou mais categorias) Anova “one way”
para gerar tabela
 Variâncias homogêneas
Comando da
Anova “one way”
 Comando
 oneway <variável-numérica> <variável-politômica>, ta

 ATENÇÃO: Quando o N é MUITO GRANDE, de modo


geral, pode-se utilizar ANOVA mesmo que a distribuição
do desfecho seja assimétrica.
Anova com variável de exposição dicotômica
 oneway peso sexo, ta
 | Summary of peso
 sexo | Mean Std. Dev. Freq.
 ------------+------------------------------------
 masc | 76.628692 13.499569 1307
 fem | 64.192619 12.281312 1680
 ------------+------------------------------------
 Total | 69.634181 14.233442 2987
Teste F

 Analysis of Variance
 Source SS df MS F Prob > F
 ------------------------------------------------------------------------
 Between groups 113688.398 1 113688.398 690.81 0.0000
 Within groups 491247.922 2985 164.572168 Variâncias
 ------------------------------------------------------------------------ heterogêneas
 Total 604936.32 2986 202.590864

 Bartlett's test for equal variances: chi2(1) = 13.2222 Prob>chi2 = 0.000

Conclusão: com exposição dicotômica, os resultados do teste T e da Anova são


Iguais!!!
Exercício 2
 Objetivo da análise: verificar se existem diferenças entre as
médias de peso de acordo com a situação conjugal.

 Desfecho = variável numérica contínua (peso)


 Exposição = variável categórica politômica nominal (situação
conjugal)

 Investigar variável “compan”


Pergunta do questionário: Qual a sua situação conjugal atual?
(1) Casado(a) ou com companheiro(a)
(2) Solteiro(a) ou sem companheiro(a)
(3) Separado(a)
(4) Viúvo(a)

 O que mudou em relação a exposição sexo?


Homogeneidade das variâncias?
 robvar peso, by (compan)

 situacao | Summary of massa corporal


 conjugal | Mean Std. Dev. Freq.
 ------------+------------------------------------
 casado(a) | 71.380725 14.479488 1,904
 solteiro(a) | 66.09222 13.41913 617
 separado(a) | 65.631818 12.018809 220 Variâncias
 viúvo(a) | 68.579268 13.710616 246 heterogêneas!
 ------------+------------------------------------
 Total | 69.634181 14.233442 2,987

 W0 = 3.0860239 df(3, 2983) Pr > F = 0.02620137

 W50 = 2.7408174 df(3, 2983) Pr > F = 0.04181786

 W10 = 2.9144663 df(3, 2983) Pr > F = 0.0330736


Teste “F”
Conclusão? significativo.
oneway peso compan, ta
Conclusão?

| Summary of peso
compan | Mean Std. Dev. Freq.
--------------+------------------------------------
1. casado(a) | 71.380725 14.479488 1904
2.solteiro(a) | 66.09222 13.41913 617
3.separado(a) | 65.631818 12.018809 220
4. viúvo(a) | 68.579268 13.710616 246
--------------+------------------------------------
Total | 69.634181 14.233442 2987
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 17346.4733 3 5782.15775 29.35 0.0000
Within groups 587589.847 2983 196.9795
------------------------------------------------------------------------
Total 604936.32 2986 202.590864
Bartlett's test for equal variances: chi2(3) = 15.9558 Prob>chi2 = 0.001

Teste de Bartlet significativo!


Conclusão
 Existe diferença entre pelo menos um par de médias. O peso
corporal varia de acordo com a situação conjugal das pessoas.

 Mas entre quais categorias estão as diferenças?

 A resposta para a pergunta acima é dada por um teste


chamado de “Post-hoc” (posterior)

 Um dos testes mais utilizados é o Bonferroni (teste de


exigência elevada)

 Basta acrescentar “, b” ao comando oneway


 oneway peso compan, ta b
Conclusão, após teste post-hoc
oneway peso compan, ta b

Comparison of peso by compan


(Bonferroni)
Row Mean-|
Col Mean | 1 2 3
---------+---------------------------------
2 | -5.2885 Situação conjugal:
| 0.000 1 casado(a)/com companheiro(a)
2 solteiro(a)
| 3 separado(a)
3 | -5.74891 -.460402 4 viúvo(a)
| 0.000 1.000
|
4 | -2.80146 2.48705 2.94745
| 0.019 0.113 0.142
Exercício 3
 Primeiro objetivo da análise: verificar se existe diferenças entre
as médias de peso de acordo com o nível econômico

 Segundo objetivo da análise: verificar se existe diferenças entre


as médias de peso de acordo com a mudança de nível
econômico

 Desfecho = peso
 Exposição = anep5cl (nível econômico em 5 grupos)

 Vamos investigar variável nível econômico:


 O que mudou em relação a exposição situação conjugal?
Teste de tendência linear
 Utilizado para:
 Desfecho numérico - INDEPENDENTE da distribuição
 Exposição politômica (3 ou mais categorias com ordem)
 Variâncias NÃO PRECISAM ser homogêneas

 Comando:
 nptrend <desfecho>, by(exposição)
 Exemplo: nptrend peso, by(anep5cl)

 DICA: rodar o commando “oneway, ta” para obter os escores de


“N”, “médias” e “DP”
 oneway <desfecho> <exposição politômica>, ta
1º passo: rodar comando “oneway”
oneway peso anep5cl, ta

pontos da | Summary of massa corporal


ANEP 5 cat | Mean Std. Dev. Freq.
------------+------------------------------------
A | 71.037671 16.512855 146
B | 71.672168 14.513623 618
C | 70.008451 14.573493 994
D | 68.432146 13.329105 1,039
E | 65.917143 12.617737 175
------------+------------------------------------ Teste F
Total | 69.612988 14.204304 2,972 significativo

Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 6911.39057 4 1727.84764 8.65 0.0000
Within groups 592524.268 2967 199.704843
------------------------------------------------------------------------
Total 599435.659 2971 201.762255

Bartlett's test for equal variances: chi2(4) = 21.5866 Prob>chi2 = 0.000


2º passo: rodar comando “nptrend”
 nptrend peso, by( anep5cl )

 anep5cl score obs sum of ranks


 A 1 146 220651
 B 2 618 1000275
 C 3 994 1496941
 D 4 1039 1480103.5
 E 5 175 219907.5

 z = 5.09 Valor “p” do teste


 Prob > |z| = 0.000 de Tendência é
significativo.

CONCLUSÃO: À medida que diminui o nível econômico,


diminui a média do peso corporal.
Outros testes “t”
 Teste “t” para variâncias desiguais
 Normalmente com N<40 e variâncias desiguais
 ttest desfecho, by(exposição dicotômica) une
 Exemplo: ttest peso, by(sexo) une

 Teste “t” pareado


 Estudo de intervenção, tipo “antes e depois”
 Comparar duas médias de uma mesma amostra na unidade de tempo
 Não é possível rodar este comando com o banco de dados da
aula inicial, pelo delineamento do estudo
 ttest variável A = variável B
 Exemplo: ttest peso_pré = peso_pós
Teste “t” para variâncias desiguais
 1º passo:
 Verificar se o desfecho numérico apresenta variância
homogênea

 Utilizar uma dos três comandos sugeridos:


 “robvar” – robvar imc, by(sexo)
 “sdtest” - sdtest imc, by(sexo)
 “oneway (Bartlet)” – oneway imc sexo
1º passo: verificar a variância...
 . robvar percgord, by(sexo)

 | Summary of pergord
 sexo | Mean Std. Dev. Freq.
 ------------+------------------------------------
 masc | 13.82875 4.1412225 24
 fem | 23.78 2.9167211 30
 ------------+------------------------------------
 Total | 19.357222 6.0835678 54

 W0 = 5.7190900 df(1, 52) Pr > F = 0.02043395

 W50 = 5.5789156 df(1, 52) Pr > F = 0.02195704

 W10 = 5.7111366 df(1, 52) Pr > F = 0.02051728


2º passo: Teste “t” para variâncias desiguais

 . ttest imc, by (sexo) une

 Two-sample t test with unequal variances


 ------------------------------------------------------------------------------
 Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
 ---------+--------------------------------------------------------------------
 masc | 121 25.59216 .3778918 4.15681 24.84396 26.34036
 fem | 149 27.34241 .7077867 8.017671 24.53658 29.14825
 ---------+--------------------------------------------------------------------
 combined | 270 25.45434 .2812386 6.621221 24.30063 29.22804
 ---------+--------------------------------------------------------------------
 diff | .2497439 .5559606 .3073080 -2.807890
 ------------------------------------------------------------------------------
 diff = mean(masc) - mean(fem) t = 0.4492
 Ho: diff = 0 Satterthwaite's degrees of freedom = 267.78

 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


 Pr(T < t) = 0.6732 Pr(|T| > |t|) = 0.6536 Pr(T > t) = 0.3268
Teste “t” pareado (amostras dependentes)
 . ttest insulinapre = insulinapos

 Paired t test
 ------------------------------------------------------------------------------
 Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
 ---------+--------------------------------------------------------------------
insulpre 0| 35 15.10286 1.720209 10.17689 11.60697 18.59874
insulpos 1| 35 115.1029 1.720209 10.17689 111.607 118.5987
 ---------+--------------------------------------------------------------------
 diff | 35 -100 1.92e-07 1.14e-06 -100 -100
 ------------------------------------------------------------------------------
 mean(diff) = mean(insulina - insulinapos) t = -5.2e+08
 Ho: mean(diff) = 0 degrees of freedom = 34

 Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0


 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000

Unicaudal ou Bicaudal?

Você também pode gostar