Aula 2 - Bioestatística - Normalidade e Testes de Hipóteses

07/04/2020
NORMALIDADE E TESTES
DE HIPÓTESES
Prof. Dr. Roberto Jerônimo
rjeronimoss@ufs.br
ANTES DE COMEÇAR...
1
07/04/2020
Antes de qualquer coisa, não é

demais relembrar: Bioestatística
não é um fantasma, é apenas
lógica que vem junto com as
quatro operações básicas, um
pouquinho de bom senso e muita
vontade de compreender...
Mas toda essa vontade,

se inicia com uma
grande dúvida...
O que é normal?
3
Se conceituar normalidade Mas compreender essa

já é um pouco complicado, normalidade vai nos ajudar
falando em estatística, muito a escolher o tipo de
então... teste estatístico a ser
utilizado...
Mas o que é
normal?
Então,
vamos lá..
2
07/04/2020
Normalidade em estatística
O Normalidade representa uma distribuição empírica
que descreve o comportamento de uma variável
quantitativa em um eixo horizontal;
O Na área sob a curva de normalidade estão 100%
dos dados simetricamente distribuídos em relação à
média.
Se ligue!
Esta é a representação da curva padrão de normalidade em que

todos os pressupostos são atendidos!
É abaixo dela que estarão todos os dados coletados 6
3
07/04/2020
Duas estratégias complementares para verificar a
normalidade de uma distribuição:
O Assimetria (skewness): proporcionalidade entre os
extremos;
O Curtose (kurtosis): achatamento da curva
Embora não seja foco da disciplina, vale saber que o cálculo da assimetria e da curtose
são estratégias para verificar a suposta normalidade da distribuição observada!
Mesmo assim, fica a

pergunta: Existem testes
que estimem a normalidade
de uma distribuição?
8
Se os valores padronizados de assimetria e curtose ficarem entre + 2Z (assimetria/erro
padrão da assimetria) aceita-se a hipótese de normalidade entre os dados
4
07/04/2020
Testes para verificar a normalidade de uma distribuição:
O Shapiro-Wilk (SW): utilizado quando o conjunto de
observações é pequeno (até 50 observações);
O Kolmogorov-Smirnov (KS): teste utilizado para um
conjunto maior que 50 observações.
NÃO ESQUEÇAM!!!!
Nos testes que verificam a
normalidade, a hipótese nula é de
que há normalidade entre os
dados.
Para facilitar a compreensão,

quando o nível de significância for
inferior a 0,05 rejeita-se a
normalidade dos dados.
10
10
5
07/04/2020
Testes para verificar a normalidade de uma
distribuição:
O Gráfico Normal Q-Q Plot: a normalidade é
expressa na disposição dos pontos sobre a reta;
O Detrend Normal Q-Q Plot: a normalidade é
verificada pela dispersão dos dados apresentados
11
11
Lembrem-se: no Q-Q Plot, a normalidade é12

representada através da disposição dos pontos
sobre a reta
12
6
07/04/2020
13
Lembrem-se: na figura dos desvios, a normalidade
é representada na dispersão dos pontos
observados na figura
13
Agora que entendi um

pouco de normalidade,
fico aqui me
perguntando...
E se a distribuição não
atender aos requisitos de
normalidade, o que devo
fazer?
14
14
7
07/04/2020
Fácil demais, são duas

possibilidades...
1. Utilizar testes não paramétricos

(que vamos ver como funcionam
mais à frente...)
2. Também podemos “normalizar”

ou “parametrizar” a distribuição
através de alguns procedimentos
matemáticos...
15
15
Normalização de variáveis
Caso a variável dependente não respeite aos parâmetros
da normalidade, pode-se utilizar um dos seguintes
procedimentos matemáticos para sua possível
normalização:
O Quadrado da variável: variável2 Como estamos online,
O Cubo da variável: variável3 façam um print desta
tela, pois, vamos utilizar
O Raiz quadrada da variável: variável
na parte prática
O Log da variável: Log(variável)
O Razão inversa da variável: 1/variável
O Razão inversa da raiz da variável: 1/(variável)
O Razão inversa do quadrado da variável: 1/(variável2)
O Razão inversa do cubo da variável: 1/(variável3)
16
16
8
07/04/2020
MAS NÃO ESQUEÇA!!
Qualquer destes procedimentos

devem ser feitos a partir da
criação de uma nova variável...
No SPSS, caso haja a necessidade

de parametrizar alguma variável, é
necessário a criação de novas
variáveis, o que faremos na etapa
prática... Já já
17
17
Testes de Hipóteses
Um dos propósitos da estatística é realizar comparações entre grupos, formulando
hipóteses sobre a distribuição das informações observadas em relação ao
comportamento de toda a população.
Mas não podemos

esquecer que a
observação e os testes
Uma situação típica de
são procedimentos que,
hipótese é aquela em que se
a partir de determinados
supõe o resultado que pode
parâmetros de precisão,
ser verificado como efeito de
permitem verificar
18 se as
um experimento. Isso parte da
hipóteses estatísticas
observação!
são ou não verdadeiras!
18
9
07/04/2020
O Os testes de hipóteses tem a intenção de verificar o
quanto as premissas que fundamentam a realização
do estudo podem ou não atestar os resultados
esperados.
19
19
A verificação da hipótese estatística é realizada através dos
seguintes procedimentos:
O Definição das hipóteses nula (H0) e alternativa; (H1);
O Coleta dos dados em uma amostra;
O Cálculo do teste estatístico específico para H0;
O Comparação do valor verificado no teste com valores de
uma distribuição de probabilidade conhecida;
O Interpretação do valor da significância (p) e discussão
dos resultados.
20
20
10
07/04/2020
Testes uni-caudais vs Testes bi-caudais
Os testes unicaudais Pois é, devemos estar atentos
aumentam a região de para esta possibilidade, pois
rejeição, rejeitando com testes unicaudais são mais
maior facilidade a H0! robustos que testes bi caudais!!
Como vamos trabalhar Esta direção também é

com softwares, chamada de unicaudal
devemos estar atentos ou bi caudal...
para a direção dos 21
testes em relação a
curva de normalidade!
21
Hipótese Nula e Hipótese

Alternativa
O Hipótese Nula (H0): refere-se a uma afirmação
conservadora, o “óbvio” (diferente do que se quer
“provar”) sobre uma situação de pesquisa;
O Hipótese Alternativa (H1): esta hipótese é
formulada como alternativa à hipótese nula.
22
22
11
07/04/2020
Para não cair nesta armadilha, vale saber

quais são os erros associados às hipóteses
Não
Estatísticas
esqueçam...
Erro tipo I, que

acontece quando
rejeitamos H0 e ela é
verdadeira!
Algumas vezes as
conclusões tiradas Erro tipo II, que
a partir de H0 acontece quando não
também podem rejeitamos H0, mas ela
levar a erros... é falsa!
23
23
ERROS TESTANDO
HIPÓTESES
H0 Decisão em relação a H0
Rejeitar Aceitar
Verdadeira Erro tipo I ou erro α Sem erro
Falsa Sem erro Erro tipo II ou erro β
24
24
12
07/04/2020
ERROS TESTANDO
HIPÓTESES
O Erro tipo I: A hipótese nula é rejeitada quando é
verdadeira (este erro está associado ao nível de
significância).
O Este tipo de erro também está diretamente relacionado
a quantidade de testes realizados em uma
determinada amostra. Ex: em uma observação de
aptidão física em relação ao tempo, aplicam-se dois
testes: teste “t” independente e análise de variância
“One Way”.
25
25
ERROS TESTANDO
HIPÓTESES
Se ligue: Para evitar o erro tipo I, deve-se evitar
aplicação de múltiplos testes ou seja, deve-se aplicar
o teste que melhor se adeque à situação observada.
26
26
13
07/04/2020
ERROS TESTANDO
HIPÓTESES
O Erro tipo II: A hipótese nula não é rejeitada, sendo
falsa.
O Este erro está associado ao “power” ou “poder”
estatístico (poder do teste), ou seja, reflete a
probabilidade de rejeitar a hipótese nula, quando ela é
falsa (expresso em percentagem);
O Na prática, é o poder do teste quem determina a
probabilidade de “sucesso” em encontrar diferenças
se elas existirem.
27
27
ERROS TESTANDO
HIPÓTESES
O Erro tipo II:
O Um teste é considerado adequado quando apresenta
80% a 90% de poder;
O Para minimizar este erro recomenda-se verificar o
Tamanho do efeito de uma análise
O Deve-se reconhecer que sempre há a possibilidade
deste erro acontecer.
28
28
14
07/04/2020
ERROS TESTANDO
HIPÓTESES
O Erro tipo II: Principais fatores que tem influência
sobre o poder do teste:
O Tamanho da amostra: o poder do teste aumenta na
proporção do tamanho da amostra. Maiores amostras,
maiores as chances de verificar o efeito de um teste.
29
29
ERROS TESTANDO
HIPÓTESES
O Erro tipo II: Principais fatores que tem influência
sobre o poder do teste:
O Variabilidade das observações: o poder do teste
aumenta à medida que a variabilidade das
observações diminui (verificado com o desvio padrão).
30
30
15
07/04/2020
ERROS TESTANDO
HIPÓTESES: Poder estatístico
O O poder (power) estatístico é determinado por três
fatores:
1. Tamanho do Efeito;
2. Alfa;
3. Tamanho da amostra
31
31
ERROS TESTANDO
1. Tamanho do Efeito: refere-se a probabilidade aceita e
ajustada para identificar a verdadeira magnitude do
efeito de interesse;
2. Alfa: Quanto menor a significância, menor o poder.
Para minimizar, por convenção, aceita-se nível de
significância como 0,05 ou 0,01;
3. Tamanho da amostra: Amostras maiores produzem
maior poder estatístico. Deve-se ter cuidado com o
“poder excessivo”, que ocorre quando o pesquisador
aumenta excessivamente a amostra, favorecendo o
aumento das significâncias.
32
32
16
07/04/2020
ERROS TESTANDO
O O estudo deve ser planejado para conseguir um
poder de 0.80 no nível de significância desejado;
O Níveis de significância mais estritos (ex. p < 0,01)
requerem amostras maiores para atingir o poder
desejado;
O O poder pode ser aumentado escolhendo-se um
nível de significância mais restrito (ex. p < 0,10);
O Tamanhos do efeito menores sempre demandam
maiores amostras para atingir o poder desejado;
O Qualquer aumento em poder é facilmente
conseguido com o aumento do tamanho amostral.33
33
ERROS TESTANDO
Se ligue: O tamanho da amostra poderá
impactar o teste estatístico, tornando-o
insensível (com amostras pequenas) ou
exageradamente sensível (com amostras
muito grandes)
34
34
17
07/04/2020
NÍVEL DE SIGNIFICÂNCIA
Mas o que é mesmo este nível de
significância que todo mundo
tanto fala?? Que “p” é esse??
35
35
Sabem o que significa isso? Onde está
o “p” nesta imagem?
Nas saídas do SPSS, observem as

colunas “sig.”
36
36
18
07/04/2020
O O nível de significância é expresso pela letra
“p” e segundo Barbetta (2001) e Barros e
Reis (2003) este refere-se a probabilidade de
aceitar a hipótese nula como verdadeira;
O Sua definição/escolha pelo pesquisador
refere-se ao ponto de corte aceitável para a
afirmação/negação de H0.
O Atualmente, na área de saúde, praticamente
se convencionou aceitar 5% como valor de
referência.
37
37
O Quanto menor o valor de “p”, maior a evidência
contra a hipótese nula;
O O nível de significância estima a probabilidade
do erro tipo I acontecer
O Usualmente, um valor de “p” inferior a 0,05 é
suficiente para rejeitar a hipótese nula, diz-se
que os resultados foram estatisticamente
significantes ao nível de 5%.
O Atentar que é um valor estimado e consensual.
38
38
19
07/04/2020
O Quando o valor de “p” é maior que 0,05,
ocorre o oposto, considera-se que não há
evidência suficiente para rejeitar a hipótese
nula;
O Estudos que requerem evidências mais
fortes ou maior precisão de resultados
podem considerar um valor de “p” mais
rígido como 1% (0,01) ou mesmo 0,1%
(0,001)
39
39
E agora? Se ligaram?
40
40
20
07/04/2020
Tem mais uma discussão que é

fundamental para chegarmos na
compreensão total da aplicabilidade do “p”:
NÍVEL DE SIGNIFICÂNCIA efetividade x eficácia
A compreensão sobre esta

diferenciação, influencia diretamente
nas conclusões do estudo!
Ou seja, nem todas as respostas “não

significativas” de um estudo, são ruins!!
41
41
TESTES EM BIOESTATÍSTICA
Não poderíamos terminar o assunto sobre
testes de hipóteses, sem saber exatamente
“em que mar desagua este rio”!!
Uma das ideias que defendem a utilização dos

testes de hipóteses e da curva de normalidade, é
justamente para facilitar uma das grandes
dúvidas da humanidade: Que teste devo utilizar
nesta determinada situação??
E foi pensando nisso que vamos

apresentar as tabelas a seguir...
42
42
21
07/04/2020
O Para a compreensão dos testes, podemos

organizá-los em dois caminhos:
1. Tipo de análise
2. Relação entre variáveis
43
43
POR TIPO DE ANÁLISE
44
44
22
07/04/2020
Testes em bioestatística:
Quanto ao tipo de análise
Tipo de Análise Tipos de dados
Numérico Categórico
Descrever um grupo ou Distribuição de frequências, Tabela resumida, gráfico de
vários grupos histogramas barras
Inferências sobre um Intervalo de confiança para Intervalo de confiança para
grupo média proporções
Teste t para média aritmética Teste Z para proporções
Qui-quadrado par avariância
Comparando dois grupos Testes de comparações para Teste Z para diferença entre
grupos independentes duas proporções
Teste de Wilcoxon Qui-quadrado para
Teste t pareado proporções
Teste F para diferença entre Teste McNemar para45 duas
variâncias amostras relacionadas
45
Testes em bioestatística:
Quanto ao tipo de análise
Tipo de Análise Tipos de dados
Numérico Categórico
Comparar mais de dois ANOVA one way Qui-quadrado para mais de
grupos Teste de Kruskal-Wallis duas proporções
ANOVA two way
Analisar a relação entre Gráfico de dispersão Teste de contingência
duas variáveis Correlação, covariância Gráfico de barras paralelas
Regressão linear simples Qui-Quadrado para
independência
Relação entre duas ou Regressão múltipla
mais variáveis
46
46
23
07/04/2020
PELA RELAÇÃO ENTRE VARIÁVEIS
47
47
Amostras independentes: as comparações entre

dois ou mais grupos de sujeitos (between
subjects), cujas observações são independentes
entre si.
48
48
24
07/04/2020
AMOSTRAS INDEPENDENTES
Escalas Nominal Ordinal Intervalar/razão
Testes em bioestatística: Quanto a
Nominal Qui-quadrado Iguais aos da 2ª linha Eta
Fisher relaçãoe 1ª
entre
coluna variáveis Testes t
Odds Ratio ANOVA
Anacor ANACOR
Homals MANOVA ou MANCOVA
Análise de Clusters
Análise dicriminante
Ordinal Qui-quadrado Kappa de Cohen Eta
Kolmogorov- Princals ANOVA
Smirnov R Spearman ANACOR
Mann-Whitney MANOVA ou MANCOVA
Kruskal-Wallis Análise de Clusters
Princals Análise dicriminante
Intervalar/ Iguais aos da 1ª Iguais aos da 2ª linha R Pearson, R spearman,
Razão linha e 3ª coluna e 3ª coluna correlações parciais
Análise Fatorial
Regressão 49
Análise de Path
49
Amostras pareadas: os testes para amostras

pareadas ou medidas repetidas (within subjects)
comparam o mesmo grupo em diferentes
condições ou tratamentos.
50
50
25
07/04/2020

relação entre variáveis
AMOSTRAS PAREADAS
Escalas Uma variável independente Duas ou mais variáveis
independentes
Duas condições Três ou mais
condições
Nominal McNemar Q de Cochran Duas ou mais condições
Ordinal Sinal Friedman

Intervalar/ Wilconxon GLM repeated measures
Razão Teste t MANOVA – fator entre sujeitos
51
51
Uma variável – amostras independentes
52
52
26
07/04/2020

relação entre variáveis
Variável Teste
Nominal Aderência do Qui-quadrado
Binomial
Ordinal Aderência do Kolmogorov Smirnov
53
53
Depois de tanta informação, acho

melhor irmos pegar o
computador e fazer umas
coisinhas...
54
54
27

Aula 2 - Bioestatística - Normalidade e Testes de Hipóteses

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula 2 - Bioestatística - Normalidade e Testes de Hipóteses

Enviado por

Direitos autorais:

Formatos disponíveis

07/04/2020

Antes de qualquer coisa, não é

Mas toda essa vontade,

Se conceituar normalidade Mas compreender essa

Esta é a representação da curva padrão de normalidade em que

Mesmo assim, fica a

Para facilitar a compreensão,

Lembrem-se: no Q-Q Plot, a normalidade é12

Agora que entendi um

Fácil demais, são duas

1. Utilizar testes não paramétricos

2. Também podemos “normalizar”

MAS NÃO ESQUEÇA!!

Qualquer destes procedimentos

No SPSS, caso haja a necessidade

Mas não podemos

Como vamos trabalhar Esta direção também é

Hipótese Nula e Hipótese

Para não cair nesta armadilha, vale saber

Erro tipo I, que

Nas saídas do SPSS, observem as

Tem mais uma discussão que é

A compreensão sobre esta

Ou seja, nem todas as respostas “não

Uma das ideias que defendem a utilização dos

E foi pensando nisso que vamos

O Para a compreensão dos testes, podemos

variâncias amostras relacionadas

Amostras independentes: as comparações entre

Amostras pareadas: os testes para amostras

Testes em bioestatística: Quanto a

Ordinal Sinal Friedman

Uma variável – amostras independentes

Testes em bioestatística: Quanto a

Depois de tanta informação, acho

Você também pode gostar