Vamos supor que nas três situações a seguir, foram observados dois
Nos estudos analíticos, além da descrição estatística, às grupos de pacientes que se submeteram a dois tipos de tratamento
vezes é necessário tomar uma decisão. para controlar os níveis de colesterol total.
O teste de hipóteses é um procedimento estatístico que tem Na situação 1 haveria diferença entre os níveis de colesterol dos
por objetivo ajudar o pesquisador, a tomar uma decisão em pacientes com tratamento 1 em relação aos níveis de colesterol dos
relação a uma população através da observação de uma pacientes com tratamento2, porem não seriam observadas diferenças
amostra desta população. nas respostas dos pacientes dentro de cada grupo
x1 = 200 e s1 = 0 x2 = 230 e s2 = 0
230
T 1 S1 T 2S 1
Tratamento1 Tratamento 2
200 201 198 200 228 230 232 231
Perante este resultado podemos pensar que os indivíduos que foram tratados com o 195 204 200 199 233 227 233 230
200 201 197 200 230 226 230 230
tratamento 1 tem níveis de colesterol mais baixos do que os indivíduos que foram 202 200 203 205 228 232 230 234
tratados com o tratamento 2. 199 200 200 196 226 230 235 225
A diferença das médias amostrais é igual 30 (230 – 200),
x1 = 200 e s1 = 2,43 x2 = 230 e s2 = 2,73
os desvios padrão: s1 = s2 = 0, indica que realmente não há diferenças nas
respostas dos pacientes dentro de cada grupo,
os tratamentos tem efeito diferenciado no controle dos níveis de colesterol
Níveis de Colesterol Total – Situação 2
Se agora fossem observadas as amostras da situação 3, o que
240
poderia ser levantado neste ultimo caso em relação aos efeitos dos
230
tratamentos?
220
210
200
Níveis de Colesterol Total – Situação 3
Tratamento1 Tratamento 2
190
T 1 S2 T 2S 2
150 250 280 120 196 320 198 330
200 204 196 110 204 180 280 260
Observa-se agora uma pequena variabilidade dos níveis de 290 230 170 320 176 150 230 230
colesterol em cada grupo, 195 180 206 176 245 226 219 250
160 190 198 176 231 229 236 210
A diferença (230 – 200 = 30) entre os níveis médios de colesterol
dos grupos permanecem x1 = 200 e s1 = 53,09 x2 = 230 e s2 = 44,35
hipóteses.
100
T1 S3 T 2S 3
Na segunda situação: variâncias iguais porem desconhecidas. A estatística do teste será definida como a diferença amostral
padronizada, que tem uma distribuição T de Student com
Variável: Nível de Colesterol (Col)
(n1 + n2 – 2) graus de liberdade:
Grupos: I - Nível de Colesterol após o tratamento I
II - Nível de Colesterol apos o tratamento II x1− x
t = 2
µ1 : Média do Colesterol no tratamento I Estatística do Teste:
2 1 1
s p
+
n1 n 2
µ2 : Média do Colesterol no tratamento II
Onde:
n1 – tamanho de amostra do grupo I e ( n1 − 1) s 1 + ( n 2 − 1) s 2
2 2
=
2
s
Hipótese Estatísticas n2 – tamanho de amostra do grupo II
x1 – média amostral do grupo I
p
n +n
1 2
−2
x 2 – média amostral do grupo II
H0: µtrat1 = µtrat2 vs H1: µtrat1 ≠ µtrat2
Distribuição T de Student
Seja Z uma variável aleatória com distribuição Normal com
A distribuição t de Student, desenvolvida por William Sealy média 0 e variância 1 e V uma variável aleatória com
Gosset, é uma distribuição de probabilidade teórica. distribuição Chi-quadrado com v graus de liberdade. Z e V
É simétrica, semelhante à curva normal padrão, porém com caudas são variáveis independentes. Logo a razão t definida a
mais largas, ou seja, uma simulação da t de Student pode gerar seguir tem distribuição t de Student com v graus de
valores mais extremos que uma simulação da normal. liberdade.
O único parâmetro v que a define e caracteriza a sua forma é o
Z
número de graus de liberdade.
t =
Quanto maior for esse parâmetro, mais próxima da normal ela será. V
v
Stata: use
“C:\data\sist_independente.dta.dta"
Two-sample t test with equal variances Classical test of hypotheses Group mean comparison test
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] H0: µtrat1 = µtrat2 vs H1: µtrat1 ≠ µtrat2
---------+--------------------------------------------------------------------
Trat1 | 20 200 .5428967 2.427908 198.8637 201.1363 e σtrat1 = σtrat2i
Trat2 | 20 230 .6112972 2.733804 228.7205 231.2795 . ttest situacao3, by(tratamento)
---------+--------------------------------------------------------------------
combined | 40 215 2.43558 15.40396 210.0736 219.9264 Two-sample t test with equal variances
------------------------------------------------------------------------------
---------+-------------------------------------------------------------------- Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
diff | -30 .8175702 -31.65508 -28.34492 ---------+--------------------------------------------------------------------
------------------------------------------------------------------------------ Trat1 | 20 200 11.87213 53.09376 175.1514 224.8486
Trat2 | 20 230 9.917024 44.35028 209.2434 250.7566
diff = mean(Trat1) - mean(Trat2) t = -36.6941 ---------+--------------------------------------------------------------------
Ho: diff = 0 degrees of freedom = 38 combined | 40 215 8.003685 50.61975 198.811 231.189
---------+--------------------------------------------------------------------
diff | -30 15.46915 -61.31567 1.315666
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
------------------------------------------------------------------------------
Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000 diff = mean(Trat1) - mean(Trat2) t = -1.9393
Ho: diff = 0 degrees of freedom = 38
H1: µtrat1 < µtrat2 H1: µtrat1 ≠ µtrat2 H1: µtrat1 > µtrat2 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 0.0300 Pr(|T| > |t|) = 0.0599 Pr(T > t) = 0.9700
Distribuição F A Figura 01 dá curvas aproximadas das funções de distribuição
acumulada e de densidade de probabilidades para α = 5 e β = 2
Var(X) =
α (β −2) (β − 4)
2
Define-se uma nova variável aleatória X tal que
X = (U / α) / (V / β)
Então X é dita ter distribuição F com α e β graus de liberdade
ou X ~F(α, β).
Fonte:http://www.mspc.eng.br/matm/prob_est358.shtml
01) Se X tem distribuição t-student com ν graus de liberdade, então Statistics Summaries, Tables & Test
S = m i− 1
2
S =
2
1 2
n −1
H0: σtrat1 = σtrat2 vs H1: σtrat1 ≠ σtrat2 Statistics Summaries, Tables & Test
Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1
Pr(F < f) = 0.3051 2*Pr(F < f) = 0.6101 Pr(F > f) = 0.6949 Pr(F < f) = 0.7800 2*Pr(F > f) = 0.4401 Pr(F > f) = 0.2200
Algumas pesquisas nas quais se deseja investigar a eficácia de um Compara 2 grupos de medidas de uma resposta contínua
tratamento ou de um procedimento experimental, fazem uso de Duas medidas das mesmas entidades, separadas no tempo (tipo
observações relacionadas obtidas a partir de amostras dependentes. antes e depois), ou de entidades relacionadas (Pareadas).
A finalidade seria a de eliminar fontes externas de variação, de modo Exemplo:
que os elementos relacionados sejam semelhantes em relação a Pressão sistólica em mmHg em 10 mulheres que não usavam
diversas características, e que as diferenças observadas na variável de Contraceptivo Oral (OC) no início da pesquisa e quando usavam
interesse sejam devido exclusivamente a diferenças nos tratamentos OC (seguimento).
** t(n-1 , é o percentil de orden 1-α/2 da distribuição T de Se ∆ < 0 OC está associado com decréscimo da PAS.
1-α/2)
Student com n-1 graus de liberdade A hipótese que está sendo testada é:
H0: ∆ = 0 (H0: µantes = µdepois) contra H1: ∆ ≠ 0 (H1: µantes ≠ µdepois )
Exemplo: Pressão sistólica em mmHg em 10 mulheres que não Stata: use “C:\data\sist_pareado.dta"
usavam OC (início) e quando usavam OC (seguimento). Statistics Summaries, Tables & Test
Paired t test
signtest: Usa o teste do sinal para dados pareados neste caso
------------------------------------------------------------------------------ calcula as diferenças entre var1 e var2 e H0: mediana das
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+-------------------------------------------------------------------- diferenças é zero ou se a proporção de valores negativos é
antes | 10 115.6 3.259857 10.30857 108.2257 122.9743 igual a proporção de valores positivos
depois | 10 120.4 4.182503 13.22624 110.9385 129.8615
---------+--------------------------------------------------------------------
diff | 10 -4.8 1.443761 4.565572 -8.066013 -1.533987
------------------------------------------------------------------------------
ranksum Usa o teste de Wilcoxon soma dos postos e neste caso
mean(diff) = mean(antes - depois) t = -3.3247 H0: as duas amostras independentes são de populações com a
Ho: mean(diff) = 0 degrees of freedom = 9
mesma distribuição - este teste é equivalente ao teste de
Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0 Mann-Whitney
Pr(T < t) = 0.0044 Pr(|T| > |t|) = 0.0089 Pr(T > t) = 0.9956
Aná
Análise de Variâ
Variância de um Fator:
Statistics ANOVA & MANOVA One-way analysys of
Stata: opção “ONE-WAY analysis of variaance” variance
Esta opção do Stata permite obter:
a tabela contendo as médias, os desvios
padrões e o número de observações de cada
grupo
a tabela de análise de variância
o teste de Bartlett para testar a igualdade
das variâncias dos grupos
o teste de Bonferroni para comparar as medias
dos grupos
. oneway aac pm, tabulate bonf Comparison of aac by pm
(Bonferroni)
| Summary of aac Row Mean-|
pm | Mean Std. Dev. Freq. Col Mean | 1 2
------------+------------------------------------ ---------|----------------------
1 | 17.151429 2.1307777 7 2 | 2.16
2 | 19.311428 .91815799 7 | 0.098
3 | 23.53 1.9436904 7 |
------------+------------------------------------ 3 | 6.37857 4.21857
Total | 19.997619 3.1805078 21 | 0.000 0.001
Analysis of Variance ***gráfico das médias dos grupos e seus intervalos de confiança – é possível
Source SS df MS F Prob > F elaborar este gráfico executando o comando:
------------------------------------------------------------------------
Between groups 147.345632 2 73.6728162 24.13 0.0000 . civplot aac, by( pm)
Within groups 54.9669604 18 3.05372002
25
------------------------------------------------------------------------
Total 202.312593 20 10.1156296
20
15
1 1.5 2 2.5 3
pm
Ensaio Clínico
Variável categórica com amostras independentes
Forma grupos de Tratamento e compara a ocorrência do
desfecho
Presente Futuro Objetivo: Comparar eficácia de dois Tratamentos preventivos
contra náusea.
Desenho: Ensaio clínico
Amostra: 400 marinheiros, dividida aleatoriamente em dois grupos
Tratamento A de 200 marinheiros cada.
P = Prop. Enjôo = ? Grupo I: recebeu a pílula A, destes 48 enjoaram.
Grupo II: recebeu a pílula B, destes 68 enjoaram.
Tratamento B
H0 : pA = pB
HA : pA ≠ pB
Grupos Proporção de Enjôo
Exemplo 6.6: Comparação de Drogas contra náusea
48
A pˆ = = 0 , 24
A
200
Há indicaçõ
indicações
es de que a eficá
eficácia das pí
pílulas A e B é a mesma?
Sejam: pA = Proporção de marinheiros que recebeu a pílula A 68
B pˆ = = 0 , 34
B
200
e que enjoaram
pB = Proporção de marinheiros que recebeu a pílula B 48 + 68
Amostra toda pˆ = = 0 , 29
e que enjoaram C
400
Hipóteses Estatísticas:
H0 : pA = pB vs. HA : pA ≠ pB
. use c:\data\enjoo.dta
. tab tratamento enjoo, row chi
| Enjoo?
Grupos | Nao Sim | Total
-----------+----------------------+----------
A | 152 48 | 200
| 76.00 24.00 | 100.00
-----------+----------------------+----------
B | 132 68 | 200
| 66.00 34.00 | 100.00
-----------+----------------------+----------
Total | 284 116 | 400
| 71.00 29.00 | 100.00