A Escolha Do Método Estatístico PDF

Universidade Estadual de Campinas
Faculdade de Odontologia de Piracicaba
A escolha do método
estatístico
Profa. Dra. Livia M. A. Tenuta
litenuta@fop.unicamp.br
Universidade Estadual de Campinas

Faculdade de Odontologia de Piracicaba
A escolha do método
estatístico
- Probabilidades, hipóteses e
delineamentos -
1
“A notícia boa é que a estatística
está se tornando mais fácil e
acessível.
A notícia ruim é que a estatística
está se tornando mais fácil e
acessível.”
Hofacker, 1983
Para muitos, estatística é...
2
Figueira CV, 2006
Para outros...
“Estatística é a arte de torturar

os dados até que eles digam o
que se quer ouvir”
Mills, 1993,
Susin & Rösing, 1999
3
Jim Borgman, New York Times, 27 April 1997
4
Testes estatísticos mais comuns
Número e tipo de grupos Paramétrico Não paramétrico
Independentes Teste t para Teste de Mann-
(não pareados) amostras Whitney
independentes
2 grupos
Dependentes Teste t para Teste de Wilcoxon
(pareados) amostras
dependentes
Independentes ANOVA Teste de Kruskal-

(não pareados) Wallis
3 ou mais grupos
Dependentes ANOVA medidas Teste de Friedman
(pareados) repetidas
Susin C. Basic statistical analysis for dental research.

In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009
Métodos de regressão mais comuns
Tipo de observações Dados contínuos Dados categóricos
Regressão logística
Independentes Regressão linear dicotômica, multinomial e
ordenada
Regressão linear com erro
padrão ajustado para o Regressão logística
Dependentes
agrupamento das condicional e extensões
observações
Susin C. Basic statistical analysis for dental research.

In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009
5
Estudo cruzado duplo-cego
• Controle negativo: H2O
• Controle positivo: 1.5% Sacarose • Controle negativo: sem dentifrício
• Controle ativo: 1.5% Lactose • Controle ativo: MFP/SiO2
• Experimental: Zero CalR • Experimental: MFP/CaCO3
Pesquisa científica
Pergunta (???) – curiosidade científica!
Delineamento experimental adequado

para testar a pergunta
Variáveis resposta que ajudem a

explicar o fenômeno
6
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A: Tratamento B:
21,5% 18,9%
23,6% 24,4%
39,7% 26,7%
29,5% 19,4%
32,7% 17,8%
Média 29,4% Média 21,4%
Diferença estimada entre A e B: 8%
Existe uma real diferença entre os

tratamentos A e B?
Para descobrir, o experimento deveria

ser repetido infinitas vezes!
7
Inferência estatística: determina a

probabilidade de estimar se uma real
diferença entre tratamentos existe
Nível de significância (p): probabilidade

de erro ao afirmar que há diferença entre
os tratamentos
21,5% 18,9%
23,6% 24,4%
39,7% 26,7%
29,5% 19,4%
32,7% 17,8%
DP 7,3% DP 3,9%
8
Variação do acaso: toda variação devido a fatores
não controláveis. Pode ser medida através do
desvio em relação a média
ANOVA
Análise da variância
Quanto da variabilidade observada
é devido ao acaso ou a um real
efeito do tratamento
9
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média, n=56)
Dentifrício A Dentifrício B
5,5 11,4
Efeito de 2 dentifrícios na concentração de

F no fluido do biofilme
(µM F, média ± DP, n=56)
Dentifrício A Dentifrício B
5,5 ± 4,5 11,4 ± 21,0
10
Concentração de F no fluido do
biofilme dental exposto a 2 dentifrícios
11
Eliminando o outlier…
12
Transformação sugerida pelo pacote
estatístico: inversa
13
Delineamento inteiramente aleatorizado
Esquema da análise de variância:

Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade
Variabilidade devido SQ tratamento QM tratamento

Tratamento I–1
ao tratamento GL trat. QM resíduo
SQ resíduo
Resíduo I (J – 1) Por diferença -
GL resíduo
Total IJ – 1 Variabilidade total - -
I = número de níveis do tratamento

J = número de repetições
Modelo matemático:
Yij = µ + ti + eij
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento
µ = média geral do experimento para a variável
ti = efeito do i-ésimo nível de tratamento
eij = erro aleatório
14
Controle 70 ppm F
280 ppm F
140 ppm F
Teste de hipóteses: regra de decisão para

rejeitar ou não uma hipótese estatística
com base nos elementos amostrais
H0 (hipótese nula): hipótese que será testada

estatisticamente
Ha (hipótese alternativa): suposição que o

pesquisador quer estudar
15
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0
Ao rejeitar H0, com nível de significância

de 5%, por exemplo, o pesquisador
automaticamente aceita sua hipótese
alternativa
16
“In relation to any experiment we may speak of…
the “null hypothesis,” and it should be noted that
the null hypothesis is never proved or established,
but is possibly disproved, in the course of
experimentation. Every experiment may be said to
exist only in order to give the facts a chance of
disproving the null hypothesis.”
Fisher RA
21,5% 18,9%
Diferem ao
23,6% 24,4%
39,7% 26,7% nível de
29,5% 19,4% significância
32,7% 17,8% de 5%
Erro tipo I (α): probabilidade de erro ao se rejeitar a

hipótese de nulidade quando ela é verdadeira, ou
seja, probabilidade de apontar um falso positivo
17
Trabalhando com probabilidades...
Nível de significância de 5% significa que
aceitamos errar em 1 a cada 20 casos
Correlação entre variáveis: se eu tiver 10 variáveis

e for estudar a correlação entre elas, tenho 45
comparações (10*(10-1)/2 = 45)
Em 5% delas, posso ver uma correlação

significativa por mero acaso! 0,05* 45 = 2,25!
Hofacker CS, 1983
Erro tipo II (β): probabilidade de erro ao não

rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
É função do:
a) número de repetições
b) variabilidade dos dados
c) real diferença entre os grupos
18
Repetição
Proporciona uma estimativa do erro

experimental (variabilidade), permitindo a
estimativa do efeito dos tratamentos.
Repetição
n=3
20 17
24 22
25 24
Média 23 Média 21
Teste t comparando A e B: p=0,48
19
Repetição
n=30
20, 24, 25, 21, 23, 15, 22, 26, 16, 23,
25, 20, 23, 26, 20, 24, 15, 24, 24, 17,
24, 25, 20, 24, 25, 22, 24, 17, 22, 24,
22, 24, 23, 21, 23, 17, 16, 22, 24, 23,
26, 19, 24, 25, 20, 24, 17, 22, 24, 17,
24, 25, 19, 25, 25 22, 24, 14, 24, 25
Média 23 Média 21
Repetição
n=3
20 10
24 13
25 16
Média 23 Média 13
Diferença entre A e B = 10
20
Repetição
n=3
20 10
24 13
25 16
Média 23 Média 13
DP 2,6 DP 3,0
Repetição
n=3
13 5
21 10
35 24
Média 23 Média 13
DP 11,1 DP 9,9
21
Poder estatístico
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
Poder do teste estatístico: Capacidade do teste em

apontar diferenças quando elas realmente existem
Erro tipo II (β) = 10%
Poder = 1 – β = 90%
22

Fonte de Graus de

Tratamento I–1
SQ resíduo
Resíduo I (J – 1) Por diferença -
GL resíduo

J = número de repetições
Poder estatístico
Reviewer: What were criteria for sample size selection? Was
it to reach estimated power (80%)?
The sample size selection was based on a pilot study, made with 3 volunteers,
who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after
lunch, and we used the AUC of salivary F concentration as the response
variable. In fact, we intended to determine the number of volunteers necessary
to detect differences between the gastric content situations using the low F
dentifrice, with 80% power. From this pilot study, a low standard deviation was
observed between volunteers for each gastric content condition. Using the
SAS System 8.01, considering the differences obtained from the mean of these
treatments, we could reach 80% power if we used nine volunteers. For 11
volunteers, the power would increase to 90%. Considering that volunteers
could be lost during the 9-phase study, we opted to select 11 volunteers.
Actually, we could significantly reject H0 in the experiment, and therefore we
haven’t worried in mention this in the text, but we added the power
information in the text.
23
Princípios básicos da
experimentação
1. Repetição
2. Aleatorização
3. Cegamento
4. Controle local (blocos estatísticos)
Aleatorização
Proporciona a todos os tratamentos a

mesma probabilidade de serem
designados a qualquer das unidades
experimentais
24
Aleatorização = sorteio!
Aleatorização no Excel
Exemplo:
Dividir 16 espécimes em 4 tratamentos

(cada um com 4 espécimes)
25
Classificar pela coluna
“Aleatório”
ATENÇÃO: Para que o sorteio seja

feito corretamente, apenas as
colunas “Tratamento” e
“Aleatório” devem ser
selecionadas!
26
Ao classificar por um
número aleatório,
automaticamente o
tratamento ficará
aleatorizado!
Portanto, os espécimes
1, 6, 7 e 8 devem receber
o tratamento 1, e assim
sucessivamente...
27
Aleatorização com restrição
A distribuição dos espécimes entre os

tratamentos é feita de modo restrito, para
evitar que algum tratamento seja
favorecido pela aleatorização.
Exemplo: quando se conhece a dureza inicial de blocos
dentais, é possível sorteá-los aos tratamentos de acordo
com sua dureza
E a média de dureza entre

os grupos apresenta-
apresenta-se
homogênea.
28
Realizando-se a
Realizando-
aleatorização sem restrição,
as diferenças entre durezas
dos espécimes distribuídos
aos 4 níveis de tratamento
são mais evidentes.
Cegamento
Estudo cego: o pesquisador não tem acesso

à identificação de qual nível de tratamento se
trata.
29
Vieira, S. Estatística experimental. 2.ed. 1999
Cegamento
Estudo cego: o pesquisador não tem acesso

à identificação de qual nível de tratamento se
trata.
Quando voluntários estão envolvidos, estes

também não devem saber de qual tratamento
estão participando – estudo duplo cego
30
Delineamento aleatorizado em
blocos
Utiliza os princípios da repetição,

aleatorização e controle local
Exemplo: avaliar o efeito do dentifrício fluoretado,

em 2 níveis, na concentração de F na saliva,
utilizando 14 voluntários como blocos estatísticos
Delineamento aleatorizado em blocos
Modelo matemático:
Yij = µ + ti + bj + eijk
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento e

no j-ésimo bloco
ti = efeito do i-ésimo nível de tratamento
bj = efeito do j-ésimo nível de voluntário
31
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0

Fonte de Graus de

Tratamento I–1
Variabilidade devido SQ blocos QM blocos
Blocos J–1
aos blocos GL blocos QM resíduo
SQ resíduo
Resíduo (I – 1)(J – 1) Por diferença -
GL resíduo

J = número de blocos
32
A variabilidade devido aos blocos

(voluntários, p.ex.) pode ser estimada,
diminuindo a variabilidade devido ao
acaso (erro experimental)
33
Delineamento cruzado
Fase 1 Fase 2 Fase 3
Voluntários
grupo 1
Voluntários
grupo 2
Voluntários
grupo 3
Tratamento A Tratamento B Tratamento C
Delineamentos de tratamentos
1. Fatorial
2. Parcelas subdivididas
34
Experimentos fatoriais
Derivam do interesse em testar o efeito de

dois ou mais tipos de tratamentos no
mesmo experimento. Cada tipo de
tratamento é referido como um fator.
Exemplo: avaliar o efeito do dentifrício

fluoretado, em 2 níveis, e da freqüência de
exposição do biofilme dental a sacarose,
em 4 níveis, na desmineralização dental.
Fatorial 2 x 4
35
A combinação de tratamentos resultantes é o resultado
da interação dos fatores a serem testados. No exemplo,
há 8 combinações possíveis de tratamentos:
500 ppm F, exposição ao açúcar 2x/dia
Delineamento fatorial
Modelo matemático:
Yij = µ + Ai + Bj + Ai*Bj + eijk
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A e j-

ésimo nível do fator B
Ai = efeito do i-ésimo nível do fator A
Bj = efeito do j-ésimo nível do fator B
Ai*Bj = efeito da interação A e B
36
Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
Fonte de Graus de
Variabilidade devido SQ trat. A QM trat. A

A I–1
ao fator A GL trat. A QM resíduo
Variabilidade devido SQ trat. B QM trat. B
B J–1
ao fator B GL trat. B QM resíduo
Variabilidade devido SQ (A*B) QM trat. A*B
A*B (I – 1)(J – 1)
a interação A*B GL (A*B) QM resíduo
SQ resíduo
Resíduo IJ (K– 1) Por diferença -
GL resíduo
I = número de níveis do fator A

J = número de níveis do fator B
K = número de repetições
37
Variável resposta
Não há efeito significativo
B1
de A (A1 = A2)
B2 Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
A1 A2
Variável resposta
Há efeito significativo de A
(A2 > A1)
B1 Não há efeito significativo
B2 de B (B1 = B2)
A1 A2
Variável resposta
Não há efeito significativo

B1
de A (A1 = A2)
Há efeito significativo de B
B2
(B1 > B2)
A1 A2
Variável resposta
B1 Há efeito significativo de A
(A2 > A1)
Há efeito significativo de B
B2 (B1 > B2)
A1 A2
38
Variável resposta
B1 Interação devido a
diferença na grandeza da
B2 resposta
A1 A2
Variável resposta
B1 Interação devido a
B2
diferença na direção da
resposta
A1 A2
39
Efeito de 2 dentifrícios na concentração de F no
fluido do biofilme em função da freqüência de
exposição a sacarose
(µM F, média ± DP, n=14)
Frequência
exposição do Dentifrício A Dentifrício B
biofilme à sacarose
2x 5,6 ± 4,7 7,2 ± 4,8
4x 4,4 ± 1,3 10,1 ± 12,8
6x 5,1 ± 2,3 8,2 ± 6,2
8x 6,8 ± 7,2 8,0 ± 6,4
Houve efeito significativo do fator dentifrício na concentração de F no
fluido do biofilme dental (p<0,05)
Experimentos em parcelas
subdivididas
Vieira, S. Estatística experimental. 2.ed. 1999
40
Experimentos em parcelas
subdivididas
Ocorrem quando os tratamentos não são distribuídos

nas unidades experimentais da mesma forma,
caracterizando tratamentos primários (parcelas) e
secundários (subparcelas).
Após o sorteio do tratamento principal às unidades

experimentais de forma usual, o tratamento secundário
é sorteado dentro de cada tratamento primário.
Baseline surface microhardness
41
Delineamento em parcelas subdivididas
Modelo matemático:
Yij = µ + Ai + bj + Bk + Ai*Bk + eijkl
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A, j-
ésimo bloco e k-ésimo nível do fator B
Ai = efeito do i-ésimo nível do fator A
bj = efeito do j-ésimo bloco estatístico
Bj = efeito do k-ésimo nível do fator B
Ai*Bk = efeito da interação A e B
Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
42
Fonte de Graus de

A I–1
ao fator A GL trat. A QM resíduo a
Blocos J–1
aos blocos GL blocos QM resíduo a
Resíduo a Variabilidade da SQ resíduo a
(I – 1)(J – 1)
(A*bloco) parcela GL resíduo a
Fonte de Graus de

A I–1
ao fator A GL trat. A QM resíduo a
Blocos J–1
aos blocos GL blocos QM resíduo a
Resíduo a Variabilidade da SQ resíduo a
(I – 1)(J – 1)
(A*bloco) parcela GL resíduo a
Variabilidade devido SQ trat. B QM trat. B
B K–1
ao fator B GL trat. B QM resíduo b
Variabilidade devido SQ (A*B) QM trat. A*B
A*B (I – 1)(K – 1)
a interação A*B GL (A*B) QM resíduo b
SQ resíduo b
Resíduo b I(J – 1)(K– 1) Por diferença -
GL resíduo b
Total IJK – 1 Variabilidade total - -
43
44
45
“We have discussed the practice of using different data
transformations within a 2-way ANOVA with our statistical adviser and
he stated that this is not valid, since the comparisons are not then
between data of the same type. Transformation is performed to deal
with 1 or more of 3 problems: non-normality, non-homogeneity of
variance and non-additivity. To my understanding, in a 2-way analysis,
'individualized' transformations, while solving the first two problems,
would work against the third requirement of ANOVA, that treatment
effects are additive. For instance, data in which treatment effect was
multiplicative rather than additive are appropriately transformed to
logs, since the treatment effects then become additive. But these
could not then be compared with data that had not been transformed
because they already fulfilled the ANOVA requirements. You would be
comparing oranges and bananas.”
“Sorry about the confusion induced by my last set of comments on

the statistics. I think there might be still some sort of problem there, in
that your comparison of the 30-min plaque solid data is on a
somewhat different basis from the other comparisons. But I will
discuss it when I next see our statistical advisor. I suspect that I put
the question to him in a misleading way, combined with a mis-
interpretation of your analysis.”
46
Obrigada
pela atenção!!!
litenuta@fop.unicamp.br
47

A Escolha Do Método Estatístico PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

A Escolha Do Método Estatístico PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade Estadual de Campinas

Faculdade de Odontologia de Piracicaba

Profa. Dra. Livia M. A. Tenuta

Universidade Estadual de Campinas

Para muitos, estatística é...

“Estatística é a arte de torturar

Independentes ANOVA Teste de Kruskal-

Susin C. Basic statistical analysis for dental research.

Métodos de regressão mais comuns

Tipo de observações Dados contínuos Dados categóricos

Susin C. Basic statistical analysis for dental research.

Pergunta (???) – curiosidade científica!

Delineamento experimental adequado

Variáveis resposta que ajudem a

Diferença estimada entre A e B: 8%

Existe uma real diferença entre os

Para descobrir, o experimento deveria

Inferência estatística: determina a

Nível de significância (p): probabilidade

Efeito de 2 dentifrícios na concentração de

Esquema da análise de variância:

Variabilidade devido SQ tratamento QM tratamento

I = número de níveis do tratamento

Delineamento inteiramente aleatorizado

Yij = valor da variável testada sob o i-ésimo nível de tratamento

µ = média geral do experimento para a variável

ti = efeito do i-ésimo nível de tratamento

eij = erro aleatório

Teste de hipóteses: regra de decisão para

H0 (hipótese nula): hipótese que será testada

Ha (hipótese alternativa): suposição que o

Ao rejeitar H0, com nível de significância

Erro tipo I (α): probabilidade de erro ao se rejeitar a

Correlação entre variáveis: se eu tiver 10 variáveis

Em 5% delas, posso ver uma correlação

Erro tipo II (β): probabilidade de erro ao não

b) variabilidade dos dados

c) real diferença entre os grupos

Proporciona uma estimativa do erro

Teste t comparando A e B: p=0,48

Teste t comparando A e B: p=0,0137

Teste t comparando A e B: p=0,0123

Teste t comparando A e B: p=0,31

Poder do teste estatístico: Capacidade do teste em

Erro tipo II (β) = 10%

Esquema da análise de variância:

Variabilidade devido SQ tratamento QM tratamento

I = número de níveis do tratamento

4. Controle local (blocos estatísticos)

Proporciona a todos os tratamentos a

Dividir 16 espécimes em 4 tratamentos

ATENÇÃO: Para que o sorteio seja

A distribuição dos espécimes entre os

E a média de dureza entre

Estudo cego: o pesquisador não tem acesso

Estudo cego: o pesquisador não tem acesso

Quando voluntários estão envolvidos, estes

Utiliza os princípios da repetição,

Exemplo: avaliar o efeito do dentifrício fluoretado,

Delineamento aleatorizado em blocos

Yij = valor da variável testada sob o i-ésimo nível de tratamento e

µ = média geral do experimento para a variável

ti = efeito do i-ésimo nível de tratamento