Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 2 - Bioestatística - Normalidade e Testes de Hipóteses
Aula 2 - Bioestatística - Normalidade e Testes de Hipóteses
NORMALIDADE E TESTES
DE HIPÓTESES
Prof. Dr. Roberto Jerônimo
rjeronimoss@ufs.br
ANTES DE COMEÇAR...
1
07/04/2020
O que é normal?
3
Mas o que é
normal?
Então,
vamos lá..
2
07/04/2020
Normalidade em estatística
O Normalidade representa uma distribuição empírica
que descreve o comportamento de uma variável
quantitativa em um eixo horizontal;
O Na área sob a curva de normalidade estão 100%
dos dados simetricamente distribuídos em relação à
média.
Se ligue!
3
07/04/2020
Normalidade em estatística
Duas estratégias complementares para verificar a
normalidade de uma distribuição:
O Assimetria (skewness): proporcionalidade entre os
extremos;
O Curtose (kurtosis): achatamento da curva
Embora não seja foco da disciplina, vale saber que o cálculo da assimetria e da curtose
são estratégias para verificar a suposta normalidade da distribuição observada!
8
Se os valores padronizados de assimetria e curtose ficarem entre + 2Z (assimetria/erro
padrão da assimetria) aceita-se a hipótese de normalidade entre os dados
4
07/04/2020
Normalidade em estatística
Testes para verificar a normalidade de uma distribuição:
O Shapiro-Wilk (SW): utilizado quando o conjunto de
observações é pequeno (até 50 observações);
O Kolmogorov-Smirnov (KS): teste utilizado para um
conjunto maior que 50 observações.
NÃO ESQUEÇAM!!!!
Nos testes que verificam a
normalidade, a hipótese nula é de
que há normalidade entre os
dados.
10
10
5
07/04/2020
Normalidade em estatística
Testes para verificar a normalidade de uma
distribuição:
O Gráfico Normal Q-Q Plot: a normalidade é
expressa na disposição dos pontos sobre a reta;
O Detrend Normal Q-Q Plot: a normalidade é
verificada pela dispersão dos dados apresentados
11
11
12
6
07/04/2020
13
Lembrem-se: na figura dos desvios, a normalidade
é representada na dispersão dos pontos
observados na figura
13
E se a distribuição não
atender aos requisitos de
normalidade, o que devo
fazer?
14
14
7
07/04/2020
15
15
Normalização de variáveis
Caso a variável dependente não respeite aos parâmetros
da normalidade, pode-se utilizar um dos seguintes
procedimentos matemáticos para sua possível
normalização:
O Quadrado da variável: variável2 Como estamos online,
O Cubo da variável: variável3 façam um print desta
tela, pois, vamos utilizar
O Raiz quadrada da variável: variável
na parte prática
O Log da variável: Log(variável)
O Razão inversa da variável: 1/variável
O Razão inversa da raiz da variável: 1/(variável)
O Razão inversa do quadrado da variável: 1/(variável2)
O Razão inversa do cubo da variável: 1/(variável3)
16
16
8
07/04/2020
17
17
Testes de Hipóteses
Um dos propósitos da estatística é realizar comparações entre grupos, formulando
hipóteses sobre a distribuição das informações observadas em relação ao
comportamento de toda a população.
18
9
07/04/2020
Testes de Hipóteses
O Os testes de hipóteses tem a intenção de verificar o
quanto as premissas que fundamentam a realização
do estudo podem ou não atestar os resultados
esperados.
19
19
Testes de Hipóteses
A verificação da hipótese estatística é realizada através dos
seguintes procedimentos:
O Definição das hipóteses nula (H0) e alternativa; (H1);
O Coleta dos dados em uma amostra;
O Cálculo do teste estatístico específico para H0;
O Comparação do valor verificado no teste com valores de
uma distribuição de probabilidade conhecida;
O Interpretação do valor da significância (p) e discussão
dos resultados.
20
20
10
07/04/2020
Testes de Hipóteses
Testes uni-caudais vs Testes bi-caudais
Os testes unicaudais Pois é, devemos estar atentos
aumentam a região de para esta possibilidade, pois
rejeição, rejeitando com testes unicaudais são mais
maior facilidade a H0! robustos que testes bi caudais!!
21
22
22
11
07/04/2020
Algumas vezes as
conclusões tiradas Erro tipo II, que
a partir de H0 acontece quando não
também podem rejeitamos H0, mas ela
levar a erros... é falsa!
23
23
ERROS TESTANDO
HIPÓTESES
H0 Decisão em relação a H0
Rejeitar Aceitar
Verdadeira Erro tipo I ou erro α Sem erro
Falsa Sem erro Erro tipo II ou erro β
24
24
12
07/04/2020
ERROS TESTANDO
HIPÓTESES
O Erro tipo I: A hipótese nula é rejeitada quando é
verdadeira (este erro está associado ao nível de
significância).
O Este tipo de erro também está diretamente relacionado
a quantidade de testes realizados em uma
determinada amostra. Ex: em uma observação de
aptidão física em relação ao tempo, aplicam-se dois
testes: teste “t” independente e análise de variância
“One Way”.
25
25
ERROS TESTANDO
HIPÓTESES
Se ligue: Para evitar o erro tipo I, deve-se evitar
aplicação de múltiplos testes ou seja, deve-se aplicar
o teste que melhor se adeque à situação observada.
26
26
13
07/04/2020
ERROS TESTANDO
HIPÓTESES
O Erro tipo II: A hipótese nula não é rejeitada, sendo
falsa.
O Este erro está associado ao “power” ou “poder”
estatístico (poder do teste), ou seja, reflete a
probabilidade de rejeitar a hipótese nula, quando ela é
falsa (expresso em percentagem);
O Na prática, é o poder do teste quem determina a
probabilidade de “sucesso” em encontrar diferenças
se elas existirem.
27
27
ERROS TESTANDO
HIPÓTESES
O Erro tipo II:
O Um teste é considerado adequado quando apresenta
80% a 90% de poder;
O Para minimizar este erro recomenda-se verificar o
Tamanho do efeito de uma análise
O Deve-se reconhecer que sempre há a possibilidade
deste erro acontecer.
28
28
14
07/04/2020
ERROS TESTANDO
HIPÓTESES
O Erro tipo II: Principais fatores que tem influência
sobre o poder do teste:
O Tamanho da amostra: o poder do teste aumenta na
proporção do tamanho da amostra. Maiores amostras,
maiores as chances de verificar o efeito de um teste.
29
29
ERROS TESTANDO
HIPÓTESES
O Erro tipo II: Principais fatores que tem influência
sobre o poder do teste:
O Variabilidade das observações: o poder do teste
aumenta à medida que a variabilidade das
observações diminui (verificado com o desvio padrão).
30
30
15
07/04/2020
ERROS TESTANDO
HIPÓTESES: Poder estatístico
O O poder (power) estatístico é determinado por três
fatores:
1. Tamanho do Efeito;
2. Alfa;
3. Tamanho da amostra
31
31
ERROS TESTANDO
HIPÓTESES: Poder estatístico
1. Tamanho do Efeito: refere-se a probabilidade aceita e
ajustada para identificar a verdadeira magnitude do
efeito de interesse;
2. Alfa: Quanto menor a significância, menor o poder.
Para minimizar, por convenção, aceita-se nível de
significância como 0,05 ou 0,01;
3. Tamanho da amostra: Amostras maiores produzem
maior poder estatístico. Deve-se ter cuidado com o
“poder excessivo”, que ocorre quando o pesquisador
aumenta excessivamente a amostra, favorecendo o
aumento das significâncias.
32
32
16
07/04/2020
ERROS TESTANDO
HIPÓTESES: Poder estatístico
O O estudo deve ser planejado para conseguir um
poder de 0.80 no nível de significância desejado;
O Níveis de significância mais estritos (ex. p < 0,01)
requerem amostras maiores para atingir o poder
desejado;
O O poder pode ser aumentado escolhendo-se um
nível de significância mais restrito (ex. p < 0,10);
O Tamanhos do efeito menores sempre demandam
maiores amostras para atingir o poder desejado;
O Qualquer aumento em poder é facilmente
conseguido com o aumento do tamanho amostral.33
33
ERROS TESTANDO
HIPÓTESES: Poder estatístico
Se ligue: O tamanho da amostra poderá
impactar o teste estatístico, tornando-o
insensível (com amostras pequenas) ou
exageradamente sensível (com amostras
muito grandes)
34
34
17
07/04/2020
NÍVEL DE SIGNIFICÂNCIA
Mas o que é mesmo este nível de
significância que todo mundo
tanto fala?? Que “p” é esse??
35
35
NÍVEL DE SIGNIFICÂNCIA
Sabem o que significa isso? Onde está
o “p” nesta imagem?
36
36
18
07/04/2020
NÍVEL DE SIGNIFICÂNCIA
O O nível de significância é expresso pela letra
“p” e segundo Barbetta (2001) e Barros e
Reis (2003) este refere-se a probabilidade de
aceitar a hipótese nula como verdadeira;
O Sua definição/escolha pelo pesquisador
refere-se ao ponto de corte aceitável para a
afirmação/negação de H0.
O Atualmente, na área de saúde, praticamente
se convencionou aceitar 5% como valor de
referência.
37
37
NÍVEL DE SIGNIFICÂNCIA
O Quanto menor o valor de “p”, maior a evidência
contra a hipótese nula;
O O nível de significância estima a probabilidade
do erro tipo I acontecer
O Usualmente, um valor de “p” inferior a 0,05 é
suficiente para rejeitar a hipótese nula, diz-se
que os resultados foram estatisticamente
significantes ao nível de 5%.
O Atentar que é um valor estimado e consensual.
38
38
19
07/04/2020
NÍVEL DE SIGNIFICÂNCIA
O Quando o valor de “p” é maior que 0,05,
ocorre o oposto, considera-se que não há
evidência suficiente para rejeitar a hipótese
nula;
O Estudos que requerem evidências mais
fortes ou maior precisão de resultados
podem considerar um valor de “p” mais
rígido como 1% (0,01) ou mesmo 0,1%
(0,001)
39
39
NÍVEL DE SIGNIFICÂNCIA
E agora? Se ligaram?
40
40
20
07/04/2020
41
TESTES EM BIOESTATÍSTICA
Não poderíamos terminar o assunto sobre
testes de hipóteses, sem saber exatamente
“em que mar desagua este rio”!!
42
21
07/04/2020
TESTES EM BIOESTATÍSTICA
43
43
TESTES EM BIOESTATÍSTICA
POR TIPO DE ANÁLISE
44
44
22
07/04/2020
Testes em bioestatística:
Quanto ao tipo de análise
Tipo de Análise Tipos de dados
Numérico Categórico
Descrever um grupo ou Distribuição de frequências, Tabela resumida, gráfico de
vários grupos histogramas barras
Inferências sobre um Intervalo de confiança para Intervalo de confiança para
grupo média proporções
Teste t para média aritmética Teste Z para proporções
Qui-quadrado par avariância
Comparando dois grupos Testes de comparações para Teste Z para diferença entre
grupos independentes duas proporções
Teste de Wilcoxon Qui-quadrado para
Teste t pareado proporções
Teste F para diferença entre Teste McNemar para45 duas
45
Testes em bioestatística:
Quanto ao tipo de análise
Tipo de Análise Tipos de dados
Numérico Categórico
Comparar mais de dois ANOVA one way Qui-quadrado para mais de
grupos Teste de Kruskal-Wallis duas proporções
ANOVA two way
Analisar a relação entre Gráfico de dispersão Teste de contingência
duas variáveis Correlação, covariância Gráfico de barras paralelas
Regressão linear simples Qui-Quadrado para
independência
Relação entre duas ou Regressão múltipla
mais variáveis
46
46
23
07/04/2020
TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS
47
47
TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS
48
48
24
07/04/2020
AMOSTRAS INDEPENDENTES
Escalas Nominal Ordinal Intervalar/razão
Testes em bioestatística: Quanto a
Nominal Qui-quadrado Iguais aos da 2ª linha Eta
Fisher relaçãoe 1ª
entre
coluna variáveis Testes t
Odds Ratio ANOVA
Anacor ANACOR
Homals MANOVA ou MANCOVA
Análise de Clusters
Análise dicriminante
Ordinal Qui-quadrado Kappa de Cohen Eta
Kolmogorov- Princals ANOVA
Smirnov R Spearman ANACOR
Mann-Whitney MANOVA ou MANCOVA
Kruskal-Wallis Análise de Clusters
Princals Análise dicriminante
Intervalar/ Iguais aos da 1ª Iguais aos da 2ª linha R Pearson, R spearman,
Razão linha e 3ª coluna e 3ª coluna correlações parciais
Análise Fatorial
Regressão 49
Análise de Path
49
TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS
50
50
25
07/04/2020
51
51
TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS
52
52
26
07/04/2020
Variável Teste
Nominal Aderência do Qui-quadrado
Binomial
Ordinal Aderência do Kolmogorov Smirnov
53
53
54
54
27