Escolar Documentos
Profissional Documentos
Cultura Documentos
A Escolha Do Método Estatístico PDF
A Escolha Do Método Estatístico PDF
A escolha do método
estatístico
litenuta@fop.unicamp.br
A escolha do método
estatístico
- Probabilidades, hipóteses e
delineamentos -
1
“A notícia boa é que a estatística
está se tornando mais fácil e
acessível.
A notícia ruim é que a estatística
está se tornando mais fácil e
acessível.”
Hofacker, 1983
2
Figueira CV, 2006
Para outros...
Mills, 1993,
Susin & Rösing, 1999
3
Jim Borgman, New York Times, 27 April 1997
4
Testes estatísticos mais comuns
Número e tipo de grupos Paramétrico Não paramétrico
Independentes Teste t para Teste de Mann-
(não pareados) amostras Whitney
independentes
2 grupos
Dependentes Teste t para Teste de Wilcoxon
(pareados) amostras
dependentes
Regressão logística
Independentes Regressão linear dicotômica, multinomial e
ordenada
Regressão linear com erro
padrão ajustado para o Regressão logística
Dependentes
agrupamento das condicional e extensões
observações
5
Estudo cruzado duplo-cego
• Controle negativo: H2O
• Controle positivo: 1.5% Sacarose • Controle negativo: sem dentifrício
• Controle ativo: 1.5% Lactose • Controle ativo: MFP/SiO2
• Experimental: Zero CalR • Experimental: MFP/CaCO3
Pesquisa científica
6
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A: Tratamento B:
21,5% 18,9%
23,6% 24,4%
39,7% 26,7%
29,5% 19,4%
32,7% 17,8%
Média 29,4% Média 21,4%
Estatística experimental
7
Estatística experimental
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A: Tratamento B:
21,5% 18,9%
23,6% 24,4%
39,7% 26,7%
29,5% 19,4%
32,7% 17,8%
Média 29,4% Média 21,4%
DP 7,3% DP 3,9%
8
Variação do acaso: toda variação devido a fatores
não controláveis. Pode ser medida através do
desvio em relação a média
ANOVA
Análise da variância
Quanto da variabilidade observada
é devido ao acaso ou a um real
efeito do tratamento
9
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média, n=56)
Dentifrício A Dentifrício B
5,5 11,4
Dentifrício A Dentifrício B
5,5 ± 4,5 11,4 ± 21,0
10
Concentração de F no fluido do
biofilme dental exposto a 2 dentifrícios
11
Eliminando o outlier…
12
Transformação sugerida pelo pacote
estatístico: inversa
13
Delineamento inteiramente aleatorizado
Modelo matemático:
Yij = µ + ti + eij
Onde:
14
Controle 70 ppm F
280 ppm F
140 ppm F
Estatística experimental
15
Delineamento inteiramente aleatorizado
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0
Estatística experimental
16
“In relation to any experiment we may speak of…
the “null hypothesis,” and it should be noted that
the null hypothesis is never proved or established,
but is possibly disproved, in the course of
experimentation. Every experiment may be said to
exist only in order to give the facts a chance of
disproving the null hypothesis.”
Fisher RA
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A: Tratamento B:
21,5% 18,9%
Diferem ao
23,6% 24,4%
39,7% 26,7% nível de
29,5% 19,4% significância
32,7% 17,8% de 5%
Média 29,4% Média 21,4%
17
Trabalhando com probabilidades...
Nível de significância de 5% significa que
aceitamos errar em 1 a cada 20 casos
É função do:
a) número de repetições
18
Repetição
Repetição
n=3
Tratamento A: Tratamento B:
20 17
24 22
25 24
Média 23 Média 21
19
Repetição
n=30
Tratamento A: Tratamento B:
20, 24, 25, 21, 23, 15, 22, 26, 16, 23,
25, 20, 23, 26, 20, 24, 15, 24, 24, 17,
24, 25, 20, 24, 25, 22, 24, 17, 22, 24,
22, 24, 23, 21, 23, 17, 16, 22, 24, 23,
26, 19, 24, 25, 20, 24, 17, 22, 24, 17,
24, 25, 19, 25, 25 22, 24, 14, 24, 25
Média 23 Média 21
Repetição
n=3
Tratamento A: Tratamento B:
20 10
24 13
25 16
Média 23 Média 13
Diferença entre A e B = 10
20
Repetição
n=3
Tratamento A: Tratamento B:
20 10
24 13
25 16
Média 23 Média 13
DP 2,6 DP 3,0
Repetição
n=3
Tratamento A: Tratamento B:
13 5
21 10
35 24
Média 23 Média 13
DP 11,1 DP 9,9
21
Poder estatístico
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
Poder = 1 – β = 90%
22
Delineamento inteiramente aleatorizado
Poder estatístico
Reviewer: What were criteria for sample size selection? Was
it to reach estimated power (80%)?
The sample size selection was based on a pilot study, made with 3 volunteers,
who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after
lunch, and we used the AUC of salivary F concentration as the response
variable. In fact, we intended to determine the number of volunteers necessary
to detect differences between the gastric content situations using the low F
dentifrice, with 80% power. From this pilot study, a low standard deviation was
observed between volunteers for each gastric content condition. Using the
SAS System 8.01, considering the differences obtained from the mean of these
treatments, we could reach 80% power if we used nine volunteers. For 11
volunteers, the power would increase to 90%. Considering that volunteers
could be lost during the 9-phase study, we opted to select 11 volunteers.
Actually, we could significantly reject H0 in the experiment, and therefore we
haven’t worried in mention this in the text, but we added the power
information in the text.
23
Princípios básicos da
experimentação
1. Repetição
2. Aleatorização
3. Cegamento
Aleatorização
24
Aleatorização = sorteio!
Aleatorização no Excel
Exemplo:
25
Classificar pela coluna
“Aleatório”
26
Ao classificar por um
número aleatório,
automaticamente o
tratamento ficará
aleatorizado!
Portanto, os espécimes
1, 6, 7 e 8 devem receber
o tratamento 1, e assim
sucessivamente...
27
Aleatorização com restrição
28
Realizando-se a
Realizando-
aleatorização sem restrição,
as diferenças entre durezas
dos espécimes distribuídos
aos 4 níveis de tratamento
são mais evidentes.
Cegamento
29
Vieira, S. Estatística experimental. 2.ed. 1999
Cegamento
30
Delineamento aleatorizado em
blocos
Modelo matemático:
Yij = µ + ti + bj + eijk
Onde:
31
Delineamento aleatorizado em blocos
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0
32
Delineamento aleatorizado em blocos
33
Delineamento cruzado
Voluntários
grupo 1
Voluntários
grupo 2
Voluntários
grupo 3
Delineamentos de tratamentos
1. Fatorial
2. Parcelas subdivididas
34
Experimentos fatoriais
Experimentos fatoriais
Fatorial 2 x 4
35
Experimentos fatoriais
A combinação de tratamentos resultantes é o resultado
da interação dos fatores a serem testados. No exemplo,
há 8 combinações possíveis de tratamentos:
500 ppm F, exposição ao açúcar 2x/dia
500 ppm F, exposição ao açúcar 4x/dia
500 ppm F, exposição ao açúcar 6x/dia
500 ppm F, exposição ao açúcar 8x/dia
1100 ppm F, exposição ao açúcar 2x/dia
1100 ppm F, exposição ao açúcar 4x/dia
1100 ppm F, exposição ao açúcar 6x/dia
1100 ppm F, exposição ao açúcar 8x/dia
Delineamento fatorial
Modelo matemático:
Yij = µ + Ai + Bj + Ai*Bj + eijk
Onde:
36
Delineamento fatorial
Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
Delineamento fatorial
Esquema da análise de variância:
Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade
37
Variável resposta
Não há efeito significativo
B1
de A (A1 = A2)
B2 Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
A1 A2
Variável resposta
Há efeito significativo de A
(A2 > A1)
B1 Não há efeito significativo
B2 de B (B1 = B2)
Não há efeito da interação
A1 A2
Variável resposta
B1 Há efeito significativo de A
(A2 > A1)
Há efeito significativo de B
B2 (B1 > B2)
Não há efeito da interação
A1 A2
38
Variável resposta
B1 Interação devido a
diferença na grandeza da
B2 resposta
A1 A2
Variável resposta
B1 Interação devido a
B2
diferença na direção da
resposta
A1 A2
39
Efeito de 2 dentifrícios na concentração de F no
fluido do biofilme em função da freqüência de
exposição a sacarose
(µM F, média ± DP, n=14)
Frequência
exposição do Dentifrício A Dentifrício B
biofilme à sacarose
2x 5,6 ± 4,7 7,2 ± 4,8
4x 4,4 ± 1,3 10,1 ± 12,8
6x 5,1 ± 2,3 8,2 ± 6,2
8x 6,8 ± 7,2 8,0 ± 6,4
Houve efeito significativo do fator dentifrício na concentração de F no
fluido do biofilme dental (p<0,05)
Experimentos em parcelas
subdivididas
40
Experimentos em parcelas
subdivididas
41
Delineamento em parcelas subdivididas
Modelo matemático:
Yij = µ + Ai + bj + Bk + Ai*Bk + eijkl
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A, j-
ésimo bloco e k-ésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
bj = efeito do j-ésimo bloco estatístico
Bj = efeito do k-ésimo nível do fator B
Ai*Bk = efeito da interação A e B
eij = erro aleatório
Delineamento fatorial
Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
42
Delineamento fatorial
Esquema da análise de variância:
Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade
Delineamento fatorial
Esquema da análise de variância:
Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade
43
44
45
“We have discussed the practice of using different data
transformations within a 2-way ANOVA with our statistical adviser and
he stated that this is not valid, since the comparisons are not then
between data of the same type. Transformation is performed to deal
with 1 or more of 3 problems: non-normality, non-homogeneity of
variance and non-additivity. To my understanding, in a 2-way analysis,
'individualized' transformations, while solving the first two problems,
would work against the third requirement of ANOVA, that treatment
effects are additive. For instance, data in which treatment effect was
multiplicative rather than additive are appropriately transformed to
logs, since the treatment effects then become additive. But these
could not then be compared with data that had not been transformed
because they already fulfilled the ANOVA requirements. You would be
comparing oranges and bananas.”
46
Obrigada
pela atenção!!!
litenuta@fop.unicamp.br
47