Você está na página 1de 47

Universidade Estadual de Campinas

Faculdade de Odontologia de Piracicaba

A escolha do método
estatístico

Profa. Dra. Livia M. A. Tenuta

litenuta@fop.unicamp.br

Universidade Estadual de Campinas


Faculdade de Odontologia de Piracicaba

A escolha do método
estatístico
- Probabilidades, hipóteses e
delineamentos -

1
“A notícia boa é que a estatística
está se tornando mais fácil e
acessível.
A notícia ruim é que a estatística
está se tornando mais fácil e
acessível.”
Hofacker, 1983

Para muitos, estatística é...

2
Figueira CV, 2006

Para outros...

“Estatística é a arte de torturar


os dados até que eles digam o
que se quer ouvir”

Mills, 1993,
Susin & Rösing, 1999

3
Jim Borgman, New York Times, 27 April 1997

4
Testes estatísticos mais comuns
Número e tipo de grupos Paramétrico Não paramétrico
Independentes Teste t para Teste de Mann-
(não pareados) amostras Whitney
independentes
2 grupos
Dependentes Teste t para Teste de Wilcoxon
(pareados) amostras
dependentes

Independentes ANOVA Teste de Kruskal-


(não pareados) Wallis
3 ou mais grupos
Dependentes ANOVA medidas Teste de Friedman
(pareados) repetidas

Susin C. Basic statistical analysis for dental research.


In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009

Métodos de regressão mais comuns

Tipo de observações Dados contínuos Dados categóricos

Regressão logística
Independentes Regressão linear dicotômica, multinomial e
ordenada
Regressão linear com erro
padrão ajustado para o Regressão logística
Dependentes
agrupamento das condicional e extensões
observações

Susin C. Basic statistical analysis for dental research.


In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009

5
Estudo cruzado duplo-cego
• Controle negativo: H2O
• Controle positivo: 1.5% Sacarose • Controle negativo: sem dentifrício
• Controle ativo: 1.5% Lactose • Controle ativo: MFP/SiO2
• Experimental: Zero CalR • Experimental: MFP/CaCO3

Pesquisa científica

Pergunta (???) – curiosidade científica!

Delineamento experimental adequado


para testar a pergunta

Variáveis resposta que ajudem a


explicar o fenômeno

6
Estatística experimental
Desmineralização dental (% perda de dureza)

Tratamento A: Tratamento B:
21,5% 18,9%
23,6% 24,4%
39,7% 26,7%
29,5% 19,4%
32,7% 17,8%
Média 29,4% Média 21,4%

Diferença estimada entre A e B: 8%

Estatística experimental

Existe uma real diferença entre os


tratamentos A e B?

Para descobrir, o experimento deveria


ser repetido infinitas vezes!

7
Estatística experimental

Inferência estatística: determina a


probabilidade de estimar se uma real
diferença entre tratamentos existe

Nível de significância (p): probabilidade


de erro ao afirmar que há diferença entre
os tratamentos

Estatística experimental
Desmineralização dental (% perda de dureza)

Tratamento A: Tratamento B:
21,5% 18,9%
23,6% 24,4%
39,7% 26,7%
29,5% 19,4%
32,7% 17,8%
Média 29,4% Média 21,4%
DP 7,3% DP 3,9%

8
Variação do acaso: toda variação devido a fatores
não controláveis. Pode ser medida através do
desvio em relação a média

ANOVA
Análise da variância
Quanto da variabilidade observada
é devido ao acaso ou a um real
efeito do tratamento

9
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média, n=56)

Dentifrício A Dentifrício B
5,5 11,4

Efeito de 2 dentifrícios na concentração de


F no fluido do biofilme
(µM F, média ± DP, n=56)

Dentifrício A Dentifrício B
5,5 ± 4,5 11,4 ± 21,0

10
Concentração de F no fluido do
biofilme dental exposto a 2 dentifrícios

11
Eliminando o outlier…

12
Transformação sugerida pelo pacote
estatístico: inversa

13
Delineamento inteiramente aleatorizado

Esquema da análise de variância:


Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade

Variabilidade devido SQ tratamento QM tratamento


Tratamento I–1
ao tratamento GL trat. QM resíduo
SQ resíduo
Resíduo I (J – 1) Por diferença -
GL resíduo
Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento


J = número de repetições

Delineamento inteiramente aleatorizado

Modelo matemático:
Yij = µ + ti + eij

Onde:

Yij = valor da variável testada sob o i-ésimo nível de tratamento

µ = média geral do experimento para a variável

ti = efeito do i-ésimo nível de tratamento

eij = erro aleatório

14
Controle 70 ppm F

280 ppm F
140 ppm F

Estatística experimental

Teste de hipóteses: regra de decisão para


rejeitar ou não uma hipótese estatística
com base nos elementos amostrais

H0 (hipótese nula): hipótese que será testada


estatisticamente

Ha (hipótese alternativa): suposição que o


pesquisador quer estudar

15
Delineamento inteiramente aleatorizado

Hipóteses:
H0 = t1 = t2 = ... = tI = 0

Ha = ti ≠ 0

Estatística experimental

Ao rejeitar H0, com nível de significância


de 5%, por exemplo, o pesquisador
automaticamente aceita sua hipótese
alternativa

16
“In relation to any experiment we may speak of…
the “null hypothesis,” and it should be noted that
the null hypothesis is never proved or established,
but is possibly disproved, in the course of
experimentation. Every experiment may be said to
exist only in order to give the facts a chance of
disproving the null hypothesis.”

Fisher RA

Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A: Tratamento B:
21,5% 18,9%
Diferem ao
23,6% 24,4%
39,7% 26,7% nível de
29,5% 19,4% significância
32,7% 17,8% de 5%
Média 29,4% Média 21,4%

Erro tipo I (α): probabilidade de erro ao se rejeitar a


hipótese de nulidade quando ela é verdadeira, ou
seja, probabilidade de apontar um falso positivo

17
Trabalhando com probabilidades...
Nível de significância de 5% significa que
aceitamos errar em 1 a cada 20 casos

Correlação entre variáveis: se eu tiver 10 variáveis


e for estudar a correlação entre elas, tenho 45
comparações (10*(10-1)/2 = 45)

Em 5% delas, posso ver uma correlação


significativa por mero acaso! 0,05* 45 = 2,25!
Hofacker CS, 1983

Erro tipo II (β): probabilidade de erro ao não


rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo

É função do:

a) número de repetições

b) variabilidade dos dados

c) real diferença entre os grupos

18
Repetição

Proporciona uma estimativa do erro


experimental (variabilidade), permitindo a
estimativa do efeito dos tratamentos.

Repetição
n=3
Tratamento A: Tratamento B:
20 17
24 22
25 24
Média 23 Média 21

Teste t comparando A e B: p=0,48

19
Repetição
n=30
Tratamento A: Tratamento B:
20, 24, 25, 21, 23, 15, 22, 26, 16, 23,
25, 20, 23, 26, 20, 24, 15, 24, 24, 17,
24, 25, 20, 24, 25, 22, 24, 17, 22, 24,
22, 24, 23, 21, 23, 17, 16, 22, 24, 23,
26, 19, 24, 25, 20, 24, 17, 22, 24, 17,
24, 25, 19, 25, 25 22, 24, 14, 24, 25
Média 23 Média 21

Teste t comparando A e B: p=0,0137

Repetição
n=3
Tratamento A: Tratamento B:
20 10
24 13
25 16
Média 23 Média 13

Diferença entre A e B = 10

Teste t comparando A e B: p=0,0123

20
Repetição
n=3
Tratamento A: Tratamento B:
20 10
24 13
25 16
Média 23 Média 13
DP 2,6 DP 3,0

Repetição
n=3
Tratamento A: Tratamento B:
13 5
21 10
35 24
Média 23 Média 13
DP 11,1 DP 9,9

Teste t comparando A e B: p=0,31

21
Poder estatístico
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo

Poder do teste estatístico: Capacidade do teste em


apontar diferenças quando elas realmente existem

Erro tipo II (β) = 10%

Poder = 1 – β = 90%

22
Delineamento inteiramente aleatorizado

Esquema da análise de variância:


Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade

Variabilidade devido SQ tratamento QM tratamento


Tratamento I–1
ao tratamento GL trat. QM resíduo
SQ resíduo
Resíduo I (J – 1) Por diferença -
GL resíduo
Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento


J = número de repetições

Poder estatístico
Reviewer: What were criteria for sample size selection? Was
it to reach estimated power (80%)?
The sample size selection was based on a pilot study, made with 3 volunteers,
who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after
lunch, and we used the AUC of salivary F concentration as the response
variable. In fact, we intended to determine the number of volunteers necessary
to detect differences between the gastric content situations using the low F
dentifrice, with 80% power. From this pilot study, a low standard deviation was
observed between volunteers for each gastric content condition. Using the
SAS System 8.01, considering the differences obtained from the mean of these
treatments, we could reach 80% power if we used nine volunteers. For 11
volunteers, the power would increase to 90%. Considering that volunteers
could be lost during the 9-phase study, we opted to select 11 volunteers.
Actually, we could significantly reject H0 in the experiment, and therefore we
haven’t worried in mention this in the text, but we added the power
information in the text.

23
Princípios básicos da
experimentação

1. Repetição 

2. Aleatorização

3. Cegamento

4. Controle local (blocos estatísticos)

Aleatorização

Proporciona a todos os tratamentos a


mesma probabilidade de serem
designados a qualquer das unidades
experimentais

24
Aleatorização = sorteio!

Aleatorização no Excel

Exemplo:

Dividir 16 espécimes em 4 tratamentos


(cada um com 4 espécimes)

25
Classificar pela coluna
“Aleatório”

ATENÇÃO: Para que o sorteio seja


feito corretamente, apenas as
colunas “Tratamento” e
“Aleatório” devem ser
selecionadas!

26
Ao classificar por um
número aleatório,
automaticamente o
tratamento ficará
aleatorizado!

Portanto, os espécimes
1, 6, 7 e 8 devem receber
o tratamento 1, e assim
sucessivamente...

27
Aleatorização com restrição

A distribuição dos espécimes entre os


tratamentos é feita de modo restrito, para
evitar que algum tratamento seja
favorecido pela aleatorização.
Exemplo: quando se conhece a dureza inicial de blocos
dentais, é possível sorteá-los aos tratamentos de acordo
com sua dureza

E a média de dureza entre


os grupos apresenta-
apresenta-se
homogênea.

28
Realizando-se a
Realizando-
aleatorização sem restrição,
as diferenças entre durezas
dos espécimes distribuídos
aos 4 níveis de tratamento
são mais evidentes.

Cegamento

Estudo cego: o pesquisador não tem acesso


à identificação de qual nível de tratamento se
trata.

29
Vieira, S. Estatística experimental. 2.ed. 1999

Cegamento

Estudo cego: o pesquisador não tem acesso


à identificação de qual nível de tratamento se
trata.

Quando voluntários estão envolvidos, estes


também não devem saber de qual tratamento
estão participando – estudo duplo cego

30
Delineamento aleatorizado em
blocos

Utiliza os princípios da repetição,


aleatorização e controle local

Exemplo: avaliar o efeito do dentifrício fluoretado,


em 2 níveis, na concentração de F na saliva,
utilizando 14 voluntários como blocos estatísticos

Delineamento aleatorizado em blocos

Modelo matemático:
Yij = µ + ti + bj + eijk
Onde:

Yij = valor da variável testada sob o i-ésimo nível de tratamento e


no j-ésimo bloco

µ = média geral do experimento para a variável

ti = efeito do i-ésimo nível de tratamento

bj = efeito do j-ésimo nível de voluntário

eij = erro aleatório

31
Delineamento aleatorizado em blocos

Hipóteses:
H0 = t1 = t2 = ... = tI = 0

Ha = ti ≠ 0

Delineamento aleatorizado em blocos

Esquema da análise de variância:


Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade

Variabilidade devido SQ tratamento QM tratamento


Tratamento I–1
ao tratamento GL trat. QM resíduo
Variabilidade devido SQ blocos QM blocos
Blocos J–1
aos blocos GL blocos QM resíduo
SQ resíduo
Resíduo (I – 1)(J – 1) Por diferença -
GL resíduo
Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento


J = número de blocos

32
Delineamento aleatorizado em blocos

A variabilidade devido aos blocos


(voluntários, p.ex.) pode ser estimada,
diminuindo a variabilidade devido ao
acaso (erro experimental)

33
Delineamento cruzado

Fase 1 Fase 2 Fase 3

Voluntários
grupo 1

Voluntários
grupo 2

Voluntários
grupo 3

Tratamento A Tratamento B Tratamento C

Delineamentos de tratamentos

1. Fatorial

2. Parcelas subdivididas

34
Experimentos fatoriais

Derivam do interesse em testar o efeito de


dois ou mais tipos de tratamentos no
mesmo experimento. Cada tipo de
tratamento é referido como um fator.

Experimentos fatoriais

Exemplo: avaliar o efeito do dentifrício


fluoretado, em 2 níveis, e da freqüência de
exposição do biofilme dental a sacarose,
em 4 níveis, na desmineralização dental.

Fatorial 2 x 4

35
Experimentos fatoriais
A combinação de tratamentos resultantes é o resultado
da interação dos fatores a serem testados. No exemplo,
há 8 combinações possíveis de tratamentos:
500 ppm F, exposição ao açúcar 2x/dia
500 ppm F, exposição ao açúcar 4x/dia
500 ppm F, exposição ao açúcar 6x/dia
500 ppm F, exposição ao açúcar 8x/dia
1100 ppm F, exposição ao açúcar 2x/dia
1100 ppm F, exposição ao açúcar 4x/dia
1100 ppm F, exposição ao açúcar 6x/dia
1100 ppm F, exposição ao açúcar 8x/dia

Delineamento fatorial
Modelo matemático:
Yij = µ + Ai + Bj + Ai*Bj + eijk
Onde:

Yij = valor da variável testada sob o i-ésimo nível do fator A e j-


ésimo nível do fator B

µ = média geral do experimento para a variável

Ai = efeito do i-ésimo nível do fator A

Bj = efeito do j-ésimo nível do fator B

Ai*Bj = efeito da interação A e B

eij = erro aleatório

36
Delineamento fatorial
Hipóteses:

(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0

(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0

(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0

Delineamento fatorial
Esquema da análise de variância:
Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade

Variabilidade devido SQ trat. A QM trat. A


A I–1
ao fator A GL trat. A QM resíduo
Variabilidade devido SQ trat. B QM trat. B
B J–1
ao fator B GL trat. B QM resíduo
Variabilidade devido SQ (A*B) QM trat. A*B
A*B (I – 1)(J – 1)
a interação A*B GL (A*B) QM resíduo
SQ resíduo
Resíduo IJ (K– 1) Por diferença -
GL resíduo
Total IJ – 1 Variabilidade total - -

I = número de níveis do fator A


J = número de níveis do fator B
K = número de repetições

37
Variável resposta
Não há efeito significativo
B1
de A (A1 = A2)
B2 Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
A1 A2
Variável resposta

Há efeito significativo de A
(A2 > A1)
B1 Não há efeito significativo
B2 de B (B1 = B2)
Não há efeito da interação
A1 A2
Variável resposta

Não há efeito significativo


B1
de A (A1 = A2)
Há efeito significativo de B
B2
(B1 > B2)
Não há efeito da interação
A1 A2
Variável resposta

B1 Há efeito significativo de A
(A2 > A1)
Há efeito significativo de B
B2 (B1 > B2)
Não há efeito da interação

A1 A2

38
Variável resposta
B1 Interação devido a
diferença na grandeza da
B2 resposta

A1 A2
Variável resposta

B1 Interação devido a
B2
diferença na direção da
resposta

A1 A2

39
Efeito de 2 dentifrícios na concentração de F no
fluido do biofilme em função da freqüência de
exposição a sacarose
(µM F, média ± DP, n=14)

Frequência
exposição do Dentifrício A Dentifrício B
biofilme à sacarose
2x 5,6 ± 4,7 7,2 ± 4,8
4x 4,4 ± 1,3 10,1 ± 12,8
6x 5,1 ± 2,3 8,2 ± 6,2
8x 6,8 ± 7,2 8,0 ± 6,4
Houve efeito significativo do fator dentifrício na concentração de F no
fluido do biofilme dental (p<0,05)

Experimentos em parcelas
subdivididas

Vieira, S. Estatística experimental. 2.ed. 1999

40
Experimentos em parcelas
subdivididas

Ocorrem quando os tratamentos não são distribuídos


nas unidades experimentais da mesma forma,
caracterizando tratamentos primários (parcelas) e
secundários (subparcelas).

Após o sorteio do tratamento principal às unidades


experimentais de forma usual, o tratamento secundário
é sorteado dentro de cada tratamento primário.

Baseline surface microhardness

41
Delineamento em parcelas subdivididas
Modelo matemático:
Yij = µ + Ai + bj + Bk + Ai*Bk + eijkl
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A, j-
ésimo bloco e k-ésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
bj = efeito do j-ésimo bloco estatístico
Bj = efeito do k-ésimo nível do fator B
Ai*Bk = efeito da interação A e B
eij = erro aleatório

Delineamento fatorial
Hipóteses:

(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0

(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0

(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0

42
Delineamento fatorial
Esquema da análise de variância:
Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade

Variabilidade devido SQ trat. A QM trat. A


A I–1
ao fator A GL trat. A QM resíduo a
Variabilidade devido SQ blocos QM blocos
Blocos J–1
aos blocos GL blocos QM resíduo a
Resíduo a Variabilidade da SQ resíduo a
(I – 1)(J – 1)
(A*bloco) parcela GL resíduo a

Delineamento fatorial
Esquema da análise de variância:
Fonte de Graus de
Soma de Quadrados Quadrado médio F
variação liberdade

Variabilidade devido SQ trat. A QM trat. A


A I–1
ao fator A GL trat. A QM resíduo a
Variabilidade devido SQ blocos QM blocos
Blocos J–1
aos blocos GL blocos QM resíduo a
Resíduo a Variabilidade da SQ resíduo a
(I – 1)(J – 1)
(A*bloco) parcela GL resíduo a
Variabilidade devido SQ trat. B QM trat. B
B K–1
ao fator B GL trat. B QM resíduo b
Variabilidade devido SQ (A*B) QM trat. A*B
A*B (I – 1)(K – 1)
a interação A*B GL (A*B) QM resíduo b
SQ resíduo b
Resíduo b I(J – 1)(K– 1) Por diferença -
GL resíduo b
Total IJK – 1 Variabilidade total - -

43
44
45
“We have discussed the practice of using different data
transformations within a 2-way ANOVA with our statistical adviser and
he stated that this is not valid, since the comparisons are not then
between data of the same type. Transformation is performed to deal
with 1 or more of 3 problems: non-normality, non-homogeneity of
variance and non-additivity. To my understanding, in a 2-way analysis,
'individualized' transformations, while solving the first two problems,
would work against the third requirement of ANOVA, that treatment
effects are additive. For instance, data in which treatment effect was
multiplicative rather than additive are appropriately transformed to
logs, since the treatment effects then become additive. But these
could not then be compared with data that had not been transformed
because they already fulfilled the ANOVA requirements. You would be
comparing oranges and bananas.”

“Sorry about the confusion induced by my last set of comments on


the statistics. I think there might be still some sort of problem there, in
that your comparison of the 30-min plaque solid data is on a
somewhat different basis from the other comparisons. But I will
discuss it when I next see our statistical advisor. I suspect that I put
the question to him in a misleading way, combined with a mis-
interpretation of your analysis.”

46
Obrigada
pela atenção!!!

litenuta@fop.unicamp.br

47

Você também pode gostar