Você está na página 1de 11

Teste de Hipóteses Teste de Hipóteses

Vamos supor que nas três situações a seguir, foram observados dois
Nos estudos analíticos, além da descrição estatística, às grupos de pacientes que se submeteram a dois tipos de tratamento
vezes é necessário tomar uma decisão. para controlar os níveis de colesterol total.

O teste de hipóteses é um procedimento estatístico que tem Na situação 1 haveria diferença entre os níveis de colesterol dos
por objetivo ajudar o pesquisador, a tomar uma decisão em pacientes com tratamento 1 em relação aos níveis de colesterol dos
relação a uma população através da observação de uma pacientes com tratamento2, porem não seriam observadas diferenças
amostra desta população. nas respostas dos pacientes dentro de cada grupo

Por exemplo: Níveis de Colesterol Total – Situação 1


Ao comparar os níveis de colesterol de pacientes tratados com duas Tratamento1 Tratamento 2
drogas, é preciso descobrir qual dos dois fármacos é melhor no 200 200 200 200 230 230 230 230
controle dos níveis de colesterol total. 200 200 200 200 230 230 230 230
200 200 200 200 230 230 230 230
200 200 200 200 230 230 230 230
200 200 200 200 230 230 230 230

x1 = 200 e s1 = 0 x2 = 230 e s2 = 0
230

Se no lugar das amostras da situação 1, fossem observadas as


amostras da situação 2, o que poderia ser levantado em relação
aos efeitos dos tratamentos?
220
210

Níveis de Colesterol Total – Situação 2


200

T 1 S1 T 2S 1
Tratamento1 Tratamento 2
200 201 198 200 228 230 232 231
Perante este resultado podemos pensar que os indivíduos que foram tratados com o 195 204 200 199 233 227 233 230
200 201 197 200 230 226 230 230
tratamento 1 tem níveis de colesterol mais baixos do que os indivíduos que foram 202 200 203 205 228 232 230 234
tratados com o tratamento 2. 199 200 200 196 226 230 235 225
A diferença das médias amostrais é igual 30 (230 – 200),
x1 = 200 e s1 = 2,43 x2 = 230 e s2 = 2,73
os desvios padrão: s1 = s2 = 0, indica que realmente não há diferenças nas
respostas dos pacientes dentro de cada grupo,
 os tratamentos tem efeito diferenciado no controle dos níveis de colesterol
Níveis de Colesterol Total – Situação 2
Se agora fossem observadas as amostras da situação 3, o que

240
poderia ser levantado neste ultimo caso em relação aos efeitos dos

230
tratamentos?

220
210
200
Níveis de Colesterol Total – Situação 3

Tratamento1 Tratamento 2
190

T 1 S2 T 2S 2
150 250 280 120 196 320 198 330
200 204 196 110 204 180 280 260
Observa-se agora uma pequena variabilidade dos níveis de 290 230 170 320 176 150 230 230
colesterol em cada grupo, 195 180 206 176 245 226 219 250
160 190 198 176 231 229 236 210
A diferença (230 – 200 = 30) entre os níveis médios de colesterol
dos grupos permanecem x1 = 200 e s1 = 53,09 x2 = 230 e s2 = 44,35

Não se observam valores comuns as distribuições,


será que agora é possível pensar que a diferença observada é devida
 neste caso também podemos pensar que há diferença entre os a erros aleatórios do processo da amostragem ou devida a um efeito
níveis de colesterol total dos tratamentos 1 e 2. diferenciado dos tratamentos?

Níveis de Colesterol Total – Situação 3


O pesquisador depara-se muitas vezes com situações como
350

essa, nas quais as perguntas são formuladas como


300

hipóteses : será que o efeito dos tratamentos é diferente?,


250

os estudos são desenhados e conduzidos para gerar


200

informações que permitam validar ou rejeitar estas


150

hipóteses.
100

T1 S3 T 2S 3

O teste é aplicado para decidir se uma afirmação feita sobre


A pesar de continuar uma diferença de 30mmHg entre os níveis um parâmetro da população pode ser aceita ou não, isto é,
médios do colesterol total, deseja-se saber se os dados observados suportam essa
hipótese ou não.
resulta difícil agora, afirmar que os níveis de colesterol total
apresentam distribuições diferentes para cada um dos tratamentos,
pois elas podem assumir valores semelhantes.
Comparando dois Grupos Comparando dois Grupos
Uma questão importante no trabalho de pesquisa na área A comparação entre dois tratamentos é realizada
de saúde é a comparação de tratamentos (drogas, tipos de observando-se duas amostras, uma das quais recebe o
cirurgias, dietas, procedimentos laboratoriais, etc). tratamento padrão e o outro o novo tratamento.
Deseja-se comparar se um tratamento novo em relação a Neste tipo de comparação recomenda-se que os elementos
um tratamento padrão ou em relação a um placebo é que fazem parte da pesquisa sejam tão homogêneos
superior ou se eles são equivalentes. quanto possível de modo que se for observada alguma
diferença entre as médias das respostas, esta será devido a
Os critérios para avaliar a superioridade ou maior eficiência
diferenças entre os tratamentos e não a diferenças entre os
ou a equivalência dos tratamentos deveram estar de acordo
indivíduos as amostras.
com os objetivos da pesquisa, por exemplo um tratamento
pode ser considerado mais eficiente se o percentual de
pacientes curados é maior ou se o tempo até a cura é
menor, etc.

Resposta Contínua amostras independentes: Resposta Contínua amostras independentes:

Quando o objetivo de uma pesquisa é testar a hipótese de igualdade


Exemplo:
de médias populacionais, a estatística do teste é a diferença das
médias amostrais. Variável: Nível de Colesterol
Sob o pressuposto de normalidade existem três situações para a Grupos: I - Tratamento I
distribuição da diferença entre médias amostrais. II - Tratamento I I

• A primeira pressupõe que as variâncias são conhecidas, Pressuposto:


• a segunda que as variâncias são iguais mais desconhecidas e Para utilizar este teste é necessário fazer as seguintes pressupostos:
• a terceira situação é quando as variâncias são diferentes e
 na população, a variável é normalmente distribuída
desconhecidas.
 na população as variância dos dois grupos são semelhantes.
 as amostras são independentes.
Resposta Contínua amostras independentes: Resposta Contínua amostras independentes:

Na segunda situação: variâncias iguais porem desconhecidas. A estatística do teste será definida como a diferença amostral
padronizada, que tem uma distribuição T de Student com
Variável: Nível de Colesterol (Col)
(n1 + n2 – 2) graus de liberdade:
Grupos: I - Nível de Colesterol após o tratamento I
II - Nível de Colesterol apos o tratamento II x1− x
t = 2
µ1 : Média do Colesterol no tratamento I Estatística do Teste:
2  1 1 

s p 
+

 n1 n 2 
µ2 : Média do Colesterol no tratamento II
Onde:
n1 – tamanho de amostra do grupo I e ( n1 − 1) s 1 + ( n 2 − 1) s 2
2 2

=
2
s
Hipótese Estatísticas n2 – tamanho de amostra do grupo II
x1 – média amostral do grupo I
p
n +n
1 2
−2
x 2 – média amostral do grupo II
H0: µtrat1 = µtrat2 vs H1: µtrat1 ≠ µtrat2

e σtrat1 = σtrat2 = ? Rejeita-se H0 :


α
se | t | > t n1+ n2−2 ; 1−
2

Distribuição T de Student
Seja Z uma variável aleatória com distribuição Normal com
A distribuição t de Student, desenvolvida por William Sealy média 0 e variância 1 e V uma variável aleatória com
Gosset, é uma distribuição de probabilidade teórica. distribuição Chi-quadrado com v graus de liberdade. Z e V
É simétrica, semelhante à curva normal padrão, porém com caudas são variáveis independentes. Logo a razão t definida a
mais largas, ou seja, uma simulação da t de Student pode gerar seguir tem distribuição t de Student com v graus de
valores mais extremos que uma simulação da normal. liberdade.
O único parâmetro v que a define e caracteriza a sua forma é o
Z
número de graus de liberdade.
t =
Quanto maior for esse parâmetro, mais próxima da normal ela será. V
v
Stata: use
“C:\data\sist_independente.dta.dta"

H0: µtrat1 = µtrat2 vs H1: µtrat1 ≠ µtrat2


e σtrat1 = σtrat2i
Statistics Summaries, Tables & Test

Classical test of hypotheses Group mean comparison test

Stata: Stata: use


“C:\data\sist_independente.dta.dta"

. ttest situacao2, by(tratamento) Statistics Summaries, Tables & Test

Two-sample t test with equal variances Classical test of hypotheses Group mean comparison test
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] H0: µtrat1 = µtrat2 vs H1: µtrat1 ≠ µtrat2
---------+--------------------------------------------------------------------
Trat1 | 20 200 .5428967 2.427908 198.8637 201.1363 e σtrat1 = σtrat2i
Trat2 | 20 230 .6112972 2.733804 228.7205 231.2795 . ttest situacao3, by(tratamento)
---------+--------------------------------------------------------------------
combined | 40 215 2.43558 15.40396 210.0736 219.9264 Two-sample t test with equal variances
------------------------------------------------------------------------------
---------+-------------------------------------------------------------------- Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
diff | -30 .8175702 -31.65508 -28.34492 ---------+--------------------------------------------------------------------
------------------------------------------------------------------------------ Trat1 | 20 200 11.87213 53.09376 175.1514 224.8486
Trat2 | 20 230 9.917024 44.35028 209.2434 250.7566
diff = mean(Trat1) - mean(Trat2) t = -36.6941 ---------+--------------------------------------------------------------------
Ho: diff = 0 degrees of freedom = 38 combined | 40 215 8.003685 50.61975 198.811 231.189
---------+--------------------------------------------------------------------
diff | -30 15.46915 -61.31567 1.315666
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
------------------------------------------------------------------------------
Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000 diff = mean(Trat1) - mean(Trat2) t = -1.9393
Ho: diff = 0 degrees of freedom = 38
H1: µtrat1 < µtrat2 H1: µtrat1 ≠ µtrat2 H1: µtrat1 > µtrat2 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 0.0300 Pr(|T| > |t|) = 0.0599 Pr(T > t) = 0.9700
Distribuição F A Figura 01 dá curvas aproximadas das funções de distribuição
acumulada e de densidade de probabilidades para α = 5 e β = 2

Também denominada distribuição F de Snedecor ou distribuição


Fisher-Snedecor, encontra aplicações em alguns testes estatísticos. Média da distribuição F:
Consideram-se as variáveis aleatórias U e V tais que E(X) = β se β > 2
β −2
• U e V são independentes.
Variância da distribuição F:
• U tem distribuição χ2 com α graus de liberdade.
• V tem distribuição χ2 com β graus de liberdade.
2 β (α + β − 2)
2

Var(X) =
α (β −2) (β − 4)
2
Define-se uma nova variável aleatória X tal que
X = (U / α) / (V / β)
Então X é dita ter distribuição F com α e β graus de liberdade
ou X ~F(α, β).

Fonte:http://www.mspc.eng.br/matm/prob_est358.shtml

Algumas propriedades Stata: use


“C:\data\sist_independente.dta.dta"

01) Se X tem distribuição t-student com ν graus de liberdade, então Statistics Summaries, Tables & Test

Classical test of hypotheses Group variance comparison test


X2 ~F(1, ν).
03) Sejam as seguintes amostras:
X1, X2, ... , Xm de uma população com distribuição normal de

média µ1 e variância σ12.


Y1, Y2, ... , Yn de uma população com distribuição normal de

média µ2 e variância σ22.


As variâncias das amostras são:
∑ (x − x ) ∑ (y i − y )
2 2

S = m i− 1
2
S =
2
1 2
n −1

Então a variável definida por Z = s1 / s22 tem distribuição F com


2

m e n graus de liberdade. Esta propriedade pode ser usada para


testar a igualdade de variância entre as duas populações.
Stata: Stata: use
“C:\data\sist_independente.dta.dta"

H0: σtrat1 = σtrat2 vs H1: σtrat1 ≠ σtrat2 Statistics Summaries, Tables & Test

Classical test of hypotheses Group variance comparison test

. sdtest situacao2, by(tratamento) . sdtest situacao3, by(tratamento)

Variance ratio test Variance ratio test


------------------------------------------------------------------------------ ------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+-------------------------------------------------------------------- ---------+--------------------------------------------------------------------
Trat1 | 20 200 .5428967 2.427908 198.8637 201.1363 Trat1 | 20 200 11.87213 53.09376 175.1514 224.8486
Trat2 | 20 230 .6112972 2.733804 228.7205 231.2795 Trat2 | 20 230 9.917024 44.35028 209.2434 250.7566
---------+-------------------------------------------------------------------- ---------+--------------------------------------------------------------------
combined | 40 215 2.43558 15.40396 210.0736 219.9264 combined | 40 215 8.003685 50.61975 198.811 231.189
------------------------------------------------------------------------------ ------------------------------------------------------------------------------
ratio = sd(Trat1) / sd(Trat2) f = 0.7887 ratio = sd(Trat1) / sd(Trat2) f = 1.4332
Ho: ratio = 1 degrees of freedom = 19, 19 Ho: ratio = 1 degrees of freedom = 19, 19

Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1
Pr(F < f) = 0.3051 2*Pr(F < f) = 0.6101 Pr(F > f) = 0.6949 Pr(F < f) = 0.7800 2*Pr(F > f) = 0.4401 Pr(F > f) = 0.2200

Resposta Contínua amostras pareadas: Resposta Contínua amostras pareadas:

Algumas pesquisas nas quais se deseja investigar a eficácia de um Compara 2 grupos de medidas de uma resposta contínua
tratamento ou de um procedimento experimental, fazem uso de Duas medidas das mesmas entidades, separadas no tempo (tipo
observações relacionadas obtidas a partir de amostras dependentes. antes e depois), ou de entidades relacionadas (Pareadas).
A finalidade seria a de eliminar fontes externas de variação, de modo Exemplo:
que os elementos relacionados sejam semelhantes em relação a Pressão sistólica em mmHg em 10 mulheres que não usavam
diversas características, e que as diferenças observadas na variável de Contraceptivo Oral (OC) no início da pesquisa e quando usavam
interesse sejam devido exclusivamente a diferenças nos tratamentos OC (seguimento).

aplicados e não a fatores externos. Variáveis: Pressão Arterial Sistólica


As observações relacionadas podem ser: medidas das mesmas Grupos: I - PAS antes do tratamento
entidades separadas no tempo (tipo antes e depois), ou de entidades II - PAS apos o tratamento com lisinopril
relacionadas (Pareadas segundo algumas características tipo: sexo, µ1 : Média da PAS no grupo I
idade, condição socioeconômica, etc.). µ2 : Média da PAS no grupo II
6.6 Resposta Contínua amostras pareadas:
Exemplo: Pressão sistólica em mmHg em 10 mulheres que não
usavam OC (início) e quando usavam OC (seguimento).
Hipótese Estatísticas
H0: µ1 = µ2 vs HA: µ1 ≠ µ2 Pressupostos: assume-se que a distribuição da PAS (pressão
arterial sistólica) da i-ésima mulher possui distribuição normal
ou H0: ∆ = 0 vs HA: ∆ ≠ 0, onde ∆ = µ1 - µ2
com média µi e variância σ2 e a média da PAS no seguimento é
d −0 d µi + ∆ e variância σ2.
Estatística do Teste: Tp= s =
sd
d Assume-se que a diferença média na PAS entre o seguimento
n n e o início é ∆ = µantes - µdepois .

Distribuição da estatistica Tp: Tp ~ t(n-1) Se ∆= 0  não há diferença

Rejeita-se H0 : se | Tp | ≥ t(n-1 , 1-α/2)


Se ∆ > 0  OC esta'associado com aumento da PAS

** t(n-1 , é o percentil de orden 1-α/2 da distribuição T de Se ∆ < 0  OC está associado com decréscimo da PAS.
1-α/2)

Student com n-1 graus de liberdade A hipótese que está sendo testada é:
H0: ∆ = 0 (H0: µantes = µdepois) contra H1: ∆ ≠ 0 (H1: µantes ≠ µdepois )

Exemplo: Pressão sistólica em mmHg em 10 mulheres que não Stata: use “C:\data\sist_pareado.dta"

usavam OC (início) e quando usavam OC (seguimento). Statistics Summaries, Tables & Test

pac Antes Depois di (di-d)2 Mean comparisson tests –


1 115 128 13 67.24
Classical test of hypotheses
paired data
2 112 115 3 3.24 Media dos desvios = 48/10 = 4,8
3 107 106 -1 33.64
4 119 128 9 17.64
5 115 122 7 4.84
6 138 145 7 4.84
Desvio Padrão:
7 126 132 6 1.44
8 105 109 4 0.64 187,6
9 104 102 -2 46.24 sd = = 20.8444 = 4,566
10 115 117 2 7.84 9
Total 1156 1204 48 187.6

Valor de referencia para a dist. T, com 9 (10-1) graus de liberdade


t(9) = 2,262
4,80 − 0
T p = 4,566 = 3,32
T p > t (9) = 2,262
10
Stata: Statistics Summaries, Tables & Test

Mean comparisson tests – Testes Não Paramétricos:


Classical test of hypotheses
paired data Obs:
signrank: Usa o teste de Wilcoxon para dados pareados neste
caso H0: as distribuições são as mesmas
. ttest antes == depois

Paired t test
signtest: Usa o teste do sinal para dados pareados neste caso
------------------------------------------------------------------------------ calcula as diferenças entre var1 e var2 e H0: mediana das
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+-------------------------------------------------------------------- diferenças é zero ou se a proporção de valores negativos é
antes | 10 115.6 3.259857 10.30857 108.2257 122.9743 igual a proporção de valores positivos
depois | 10 120.4 4.182503 13.22624 110.9385 129.8615
---------+--------------------------------------------------------------------
diff | 10 -4.8 1.443761 4.565572 -8.066013 -1.533987
------------------------------------------------------------------------------
ranksum Usa o teste de Wilcoxon soma dos postos e neste caso
mean(diff) = mean(antes - depois) t = -3.3247 H0: as duas amostras independentes são de populações com a
Ho: mean(diff) = 0 degrees of freedom = 9
mesma distribuição - este teste é equivalente ao teste de
Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0 Mann-Whitney
Pr(T < t) = 0.0044 Pr(|T| > |t|) = 0.0089 Pr(T > t) = 0.9956

Stata: use “C:\data\ascorvic.dta"

Aná
Análise de Variâ
Variância de um Fator:
Statistics ANOVA & MANOVA One-way analysys of
Stata: opção “ONE-WAY analysis of variaance” variance
Esta opção do Stata permite obter:
 a tabela contendo as médias, os desvios
padrões e o número de observações de cada
grupo
 a tabela de análise de variância
 o teste de Bartlett para testar a igualdade
das variâncias dos grupos
 o teste de Bonferroni para comparar as medias
dos grupos
. oneway aac pm, tabulate bonf Comparison of aac by pm
(Bonferroni)
| Summary of aac Row Mean-|
pm | Mean Std. Dev. Freq. Col Mean | 1 2
------------+------------------------------------ ---------|----------------------
1 | 17.151429 2.1307777 7 2 | 2.16
2 | 19.311428 .91815799 7 | 0.098
3 | 23.53 1.9436904 7 |
------------+------------------------------------ 3 | 6.37857 4.21857
Total | 19.997619 3.1805078 21 | 0.000 0.001

Analysis of Variance ***gráfico das médias dos grupos e seus intervalos de confiança – é possível
Source SS df MS F Prob > F elaborar este gráfico executando o comando:
------------------------------------------------------------------------
Between groups 147.345632 2 73.6728162 24.13 0.0000 . civplot aac, by( pm)
Within groups 54.9669604 18 3.05372002
25
------------------------------------------------------------------------
Total 202.312593 20 10.1156296

Mean aac by pm level


Bartlett's test for equal variances: chi2(2) = 3.7858 Prob>chi2 = 0.151

20

15
1 1.5 2 2.5 3
pm

Ensaio Clínico
Variável categórica com amostras independentes
Forma grupos de Tratamento e compara a ocorrência do
desfecho
Presente Futuro Objetivo: Comparar eficácia de dois Tratamentos preventivos
contra náusea.
Desenho: Ensaio clínico
Amostra: 400 marinheiros, dividida aleatoriamente em dois grupos
Tratamento A de 200 marinheiros cada.
P = Prop. Enjôo = ? Grupo I: recebeu a pílula A, destes 48 enjoaram.
Grupo II: recebeu a pílula B, destes 68 enjoaram.

Tratamento B
H0 : pA = pB
HA : pA ≠ pB
Grupos Proporção de Enjôo
Exemplo 6.6: Comparação de Drogas contra náusea
48
A pˆ = = 0 , 24
A
200
Há indicaçõ
indicações
es de que a eficá
eficácia das pí
pílulas A e B é a mesma?
Sejam: pA = Proporção de marinheiros que recebeu a pílula A 68
B pˆ = = 0 , 34
B
200
e que enjoaram
pB = Proporção de marinheiros que recebeu a pílula B 48 + 68
Amostra toda pˆ = = 0 , 29
e que enjoaram C
400

Hipóteses Estatísticas:
H0 : pA = pB vs. HA : pA ≠ pB

Stata: Statistics Summaries, Tables & Test

Tables Two-ways tables with measures


of association

. use c:\data\enjoo.dta
. tab tratamento enjoo, row chi

| Enjoo?
Grupos | Nao Sim | Total
-----------+----------------------+----------
A | 152 48 | 200
| 76.00 24.00 | 100.00
-----------+----------------------+----------
B | 132 68 | 200
| 66.00 34.00 | 100.00
-----------+----------------------+----------
Total | 284 116 | 400
| 71.00 29.00 | 100.00

Pearson chi2(1) = 4.8567 Pr = 0.028

Há indicações de que a pílula A oferece maior proteção contra


náusea comparada com a pílula B

Você também pode gostar