Você está na página 1de 27

07/04/2020

NORMALIDADE E TESTES
DE HIPÓTESES
Prof. Dr. Roberto Jerônimo
rjeronimoss@ufs.br

ANTES DE COMEÇAR...

1
07/04/2020

Antes de qualquer coisa, não é


demais relembrar: Bioestatística
não é um fantasma, é apenas
lógica que vem junto com as
quatro operações básicas, um
pouquinho de bom senso e muita
vontade de compreender...

Mas toda essa vontade,


se inicia com uma
grande dúvida...

O que é normal?
3

Se conceituar normalidade Mas compreender essa


já é um pouco complicado, normalidade vai nos ajudar
falando em estatística, muito a escolher o tipo de
então... teste estatístico a ser
utilizado...

Mas o que é
normal?
Então,
vamos lá..

2
07/04/2020

Normalidade em estatística
O Normalidade representa uma distribuição empírica
que descreve o comportamento de uma variável
quantitativa em um eixo horizontal;
O Na área sob a curva de normalidade estão 100%
dos dados simetricamente distribuídos em relação à
média.

Se ligue!

Esta é a representação da curva padrão de normalidade em que


todos os pressupostos são atendidos!
É abaixo dela que estarão todos os dados coletados 6

3
07/04/2020

Normalidade em estatística
Duas estratégias complementares para verificar a
normalidade de uma distribuição:
O Assimetria (skewness): proporcionalidade entre os
extremos;
O Curtose (kurtosis): achatamento da curva

Embora não seja foco da disciplina, vale saber que o cálculo da assimetria e da curtose
são estratégias para verificar a suposta normalidade da distribuição observada!

Mesmo assim, fica a


pergunta: Existem testes
que estimem a normalidade
de uma distribuição?

8
Se os valores padronizados de assimetria e curtose ficarem entre + 2Z (assimetria/erro
padrão da assimetria) aceita-se a hipótese de normalidade entre os dados

4
07/04/2020

Normalidade em estatística
Testes para verificar a normalidade de uma distribuição:
O Shapiro-Wilk (SW): utilizado quando o conjunto de
observações é pequeno (até 50 observações);
O Kolmogorov-Smirnov (KS): teste utilizado para um
conjunto maior que 50 observações.

NÃO ESQUEÇAM!!!!
Nos testes que verificam a
normalidade, a hipótese nula é de
que há normalidade entre os
dados.

Para facilitar a compreensão,


quando o nível de significância for
inferior a 0,05 rejeita-se a
normalidade dos dados.

10

10

5
07/04/2020

Normalidade em estatística
Testes para verificar a normalidade de uma
distribuição:
O Gráfico Normal Q-Q Plot: a normalidade é
expressa na disposição dos pontos sobre a reta;
O Detrend Normal Q-Q Plot: a normalidade é
verificada pela dispersão dos dados apresentados

11

11

Lembrem-se: no Q-Q Plot, a normalidade é12


representada através da disposição dos pontos
sobre a reta

12

6
07/04/2020

13
Lembrem-se: na figura dos desvios, a normalidade
é representada na dispersão dos pontos
observados na figura

13

Agora que entendi um


pouco de normalidade,
fico aqui me
perguntando...

E se a distribuição não
atender aos requisitos de
normalidade, o que devo
fazer?

14

14

7
07/04/2020

Fácil demais, são duas


possibilidades...

1. Utilizar testes não paramétricos


(que vamos ver como funcionam
mais à frente...)

2. Também podemos “normalizar”


ou “parametrizar” a distribuição
através de alguns procedimentos
matemáticos...

15

15

Normalização de variáveis
Caso a variável dependente não respeite aos parâmetros
da normalidade, pode-se utilizar um dos seguintes
procedimentos matemáticos para sua possível
normalização:
O Quadrado da variável: variável2 Como estamos online,
O Cubo da variável: variável3 façam um print desta
tela, pois, vamos utilizar
O Raiz quadrada da variável: variável
na parte prática
O Log da variável: Log(variável)
O Razão inversa da variável: 1/variável
O Razão inversa da raiz da variável: 1/(variável)
O Razão inversa do quadrado da variável: 1/(variável2)
O Razão inversa do cubo da variável: 1/(variável3)
16

16

8
07/04/2020

MAS NÃO ESQUEÇA!!

Qualquer destes procedimentos


devem ser feitos a partir da
criação de uma nova variável...

No SPSS, caso haja a necessidade


de parametrizar alguma variável, é
necessário a criação de novas
variáveis, o que faremos na etapa
prática... Já já

17

17

Testes de Hipóteses
Um dos propósitos da estatística é realizar comparações entre grupos, formulando
hipóteses sobre a distribuição das informações observadas em relação ao
comportamento de toda a população.

Mas não podemos


esquecer que a
observação e os testes
Uma situação típica de
são procedimentos que,
hipótese é aquela em que se
a partir de determinados
supõe o resultado que pode
parâmetros de precisão,
ser verificado como efeito de
permitem verificar
18 se as
um experimento. Isso parte da
hipóteses estatísticas
observação!
são ou não verdadeiras!

18

9
07/04/2020

Testes de Hipóteses
O Os testes de hipóteses tem a intenção de verificar o
quanto as premissas que fundamentam a realização
do estudo podem ou não atestar os resultados
esperados.

19

19

Testes de Hipóteses
A verificação da hipótese estatística é realizada através dos
seguintes procedimentos:
O Definição das hipóteses nula (H0) e alternativa; (H1);
O Coleta dos dados em uma amostra;
O Cálculo do teste estatístico específico para H0;
O Comparação do valor verificado no teste com valores de
uma distribuição de probabilidade conhecida;
O Interpretação do valor da significância (p) e discussão
dos resultados.

20

20

10
07/04/2020

Testes de Hipóteses
Testes uni-caudais vs Testes bi-caudais
Os testes unicaudais Pois é, devemos estar atentos
aumentam a região de para esta possibilidade, pois
rejeição, rejeitando com testes unicaudais são mais
maior facilidade a H0! robustos que testes bi caudais!!

Como vamos trabalhar Esta direção também é


com softwares, chamada de unicaudal
devemos estar atentos ou bi caudal...
para a direção dos 21
testes em relação a
curva de normalidade!

21

Hipótese Nula e Hipótese


Alternativa
O Hipótese Nula (H0): refere-se a uma afirmação
conservadora, o “óbvio” (diferente do que se quer
“provar”) sobre uma situação de pesquisa;
O Hipótese Alternativa (H1): esta hipótese é
formulada como alternativa à hipótese nula.

22

22

11
07/04/2020

Para não cair nesta armadilha, vale saber


quais são os erros associados às hipóteses
Não
Estatísticas
esqueçam...

Erro tipo I, que


acontece quando
rejeitamos H0 e ela é
verdadeira!

Algumas vezes as
conclusões tiradas Erro tipo II, que
a partir de H0 acontece quando não
também podem rejeitamos H0, mas ela
levar a erros... é falsa!

23

23

ERROS TESTANDO
HIPÓTESES

H0 Decisão em relação a H0
Rejeitar Aceitar
Verdadeira Erro tipo I ou erro α Sem erro
Falsa Sem erro Erro tipo II ou erro β

24

24

12
07/04/2020

ERROS TESTANDO
HIPÓTESES
O Erro tipo I: A hipótese nula é rejeitada quando é
verdadeira (este erro está associado ao nível de
significância).
O Este tipo de erro também está diretamente relacionado
a quantidade de testes realizados em uma
determinada amostra. Ex: em uma observação de
aptidão física em relação ao tempo, aplicam-se dois
testes: teste “t” independente e análise de variância
“One Way”.

25

25

ERROS TESTANDO
HIPÓTESES
Se ligue: Para evitar o erro tipo I, deve-se evitar
aplicação de múltiplos testes ou seja, deve-se aplicar
o teste que melhor se adeque à situação observada.

26

26

13
07/04/2020

ERROS TESTANDO
HIPÓTESES
O Erro tipo II: A hipótese nula não é rejeitada, sendo
falsa.
O Este erro está associado ao “power” ou “poder”
estatístico (poder do teste), ou seja, reflete a
probabilidade de rejeitar a hipótese nula, quando ela é
falsa (expresso em percentagem);
O Na prática, é o poder do teste quem determina a
probabilidade de “sucesso” em encontrar diferenças
se elas existirem.

27

27

ERROS TESTANDO
HIPÓTESES
O Erro tipo II:
O Um teste é considerado adequado quando apresenta
80% a 90% de poder;
O Para minimizar este erro recomenda-se verificar o
Tamanho do efeito de uma análise
O Deve-se reconhecer que sempre há a possibilidade
deste erro acontecer.

28

28

14
07/04/2020

ERROS TESTANDO
HIPÓTESES
O Erro tipo II: Principais fatores que tem influência
sobre o poder do teste:
O Tamanho da amostra: o poder do teste aumenta na
proporção do tamanho da amostra. Maiores amostras,
maiores as chances de verificar o efeito de um teste.

29

29

ERROS TESTANDO
HIPÓTESES
O Erro tipo II: Principais fatores que tem influência
sobre o poder do teste:
O Variabilidade das observações: o poder do teste
aumenta à medida que a variabilidade das
observações diminui (verificado com o desvio padrão).

30

30

15
07/04/2020

ERROS TESTANDO
HIPÓTESES: Poder estatístico
O O poder (power) estatístico é determinado por três
fatores:
1. Tamanho do Efeito;
2. Alfa;
3. Tamanho da amostra

31

31

ERROS TESTANDO
HIPÓTESES: Poder estatístico
1. Tamanho do Efeito: refere-se a probabilidade aceita e
ajustada para identificar a verdadeira magnitude do
efeito de interesse;
2. Alfa: Quanto menor a significância, menor o poder.
Para minimizar, por convenção, aceita-se nível de
significância como 0,05 ou 0,01;
3. Tamanho da amostra: Amostras maiores produzem
maior poder estatístico. Deve-se ter cuidado com o
“poder excessivo”, que ocorre quando o pesquisador
aumenta excessivamente a amostra, favorecendo o
aumento das significâncias.
32

32

16
07/04/2020

ERROS TESTANDO
HIPÓTESES: Poder estatístico
O O estudo deve ser planejado para conseguir um
poder de 0.80 no nível de significância desejado;
O Níveis de significância mais estritos (ex. p < 0,01)
requerem amostras maiores para atingir o poder
desejado;
O O poder pode ser aumentado escolhendo-se um
nível de significância mais restrito (ex. p < 0,10);
O Tamanhos do efeito menores sempre demandam
maiores amostras para atingir o poder desejado;
O Qualquer aumento em poder é facilmente
conseguido com o aumento do tamanho amostral.33

33

ERROS TESTANDO
HIPÓTESES: Poder estatístico
Se ligue: O tamanho da amostra poderá
impactar o teste estatístico, tornando-o
insensível (com amostras pequenas) ou
exageradamente sensível (com amostras
muito grandes)

34

34

17
07/04/2020

NÍVEL DE SIGNIFICÂNCIA
Mas o que é mesmo este nível de
significância que todo mundo
tanto fala?? Que “p” é esse??

35

35

NÍVEL DE SIGNIFICÂNCIA
Sabem o que significa isso? Onde está
o “p” nesta imagem?

Nas saídas do SPSS, observem as


colunas “sig.”

36

36

18
07/04/2020

NÍVEL DE SIGNIFICÂNCIA
O O nível de significância é expresso pela letra
“p” e segundo Barbetta (2001) e Barros e
Reis (2003) este refere-se a probabilidade de
aceitar a hipótese nula como verdadeira;
O Sua definição/escolha pelo pesquisador
refere-se ao ponto de corte aceitável para a
afirmação/negação de H0.
O Atualmente, na área de saúde, praticamente
se convencionou aceitar 5% como valor de
referência.
37

37

NÍVEL DE SIGNIFICÂNCIA
O Quanto menor o valor de “p”, maior a evidência
contra a hipótese nula;
O O nível de significância estima a probabilidade
do erro tipo I acontecer
O Usualmente, um valor de “p” inferior a 0,05 é
suficiente para rejeitar a hipótese nula, diz-se
que os resultados foram estatisticamente
significantes ao nível de 5%.
O Atentar que é um valor estimado e consensual.

38

38

19
07/04/2020

NÍVEL DE SIGNIFICÂNCIA
O Quando o valor de “p” é maior que 0,05,
ocorre o oposto, considera-se que não há
evidência suficiente para rejeitar a hipótese
nula;
O Estudos que requerem evidências mais
fortes ou maior precisão de resultados
podem considerar um valor de “p” mais
rígido como 1% (0,01) ou mesmo 0,1%
(0,001)

39

39

NÍVEL DE SIGNIFICÂNCIA
E agora? Se ligaram?

40

40

20
07/04/2020

Tem mais uma discussão que é


fundamental para chegarmos na
compreensão total da aplicabilidade do “p”:
NÍVEL DE SIGNIFICÂNCIA efetividade x eficácia

A compreensão sobre esta


diferenciação, influencia diretamente
nas conclusões do estudo!

Ou seja, nem todas as respostas “não


significativas” de um estudo, são ruins!!
41

41

TESTES EM BIOESTATÍSTICA
Não poderíamos terminar o assunto sobre
testes de hipóteses, sem saber exatamente
“em que mar desagua este rio”!!

Uma das ideias que defendem a utilização dos


testes de hipóteses e da curva de normalidade, é
justamente para facilitar uma das grandes
dúvidas da humanidade: Que teste devo utilizar
nesta determinada situação??

E foi pensando nisso que vamos


apresentar as tabelas a seguir...
42

42

21
07/04/2020

TESTES EM BIOESTATÍSTICA

O Para a compreensão dos testes, podemos


organizá-los em dois caminhos:
1. Tipo de análise
2. Relação entre variáveis

43

43

TESTES EM BIOESTATÍSTICA
POR TIPO DE ANÁLISE

44

44

22
07/04/2020

Testes em bioestatística:
Quanto ao tipo de análise
Tipo de Análise Tipos de dados
Numérico Categórico
Descrever um grupo ou Distribuição de frequências, Tabela resumida, gráfico de
vários grupos histogramas barras
Inferências sobre um Intervalo de confiança para Intervalo de confiança para
grupo média proporções
Teste t para média aritmética Teste Z para proporções
Qui-quadrado par avariância
Comparando dois grupos Testes de comparações para Teste Z para diferença entre
grupos independentes duas proporções
Teste de Wilcoxon Qui-quadrado para
Teste t pareado proporções
Teste F para diferença entre Teste McNemar para45 duas

variâncias amostras relacionadas

45

Testes em bioestatística:
Quanto ao tipo de análise
Tipo de Análise Tipos de dados
Numérico Categórico
Comparar mais de dois ANOVA one way Qui-quadrado para mais de
grupos Teste de Kruskal-Wallis duas proporções
ANOVA two way
Analisar a relação entre Gráfico de dispersão Teste de contingência
duas variáveis Correlação, covariância Gráfico de barras paralelas
Regressão linear simples Qui-Quadrado para
independência
Relação entre duas ou Regressão múltipla
mais variáveis

46

46

23
07/04/2020

TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS

47

47

TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS

Amostras independentes: as comparações entre


dois ou mais grupos de sujeitos (between
subjects), cujas observações são independentes
entre si.

48

48

24
07/04/2020

AMOSTRAS INDEPENDENTES
Escalas Nominal Ordinal Intervalar/razão
Testes em bioestatística: Quanto a
Nominal Qui-quadrado Iguais aos da 2ª linha Eta
Fisher relaçãoe 1ª
entre
coluna variáveis Testes t
Odds Ratio ANOVA
Anacor ANACOR
Homals MANOVA ou MANCOVA
Análise de Clusters
Análise dicriminante
Ordinal Qui-quadrado Kappa de Cohen Eta
Kolmogorov- Princals ANOVA
Smirnov R Spearman ANACOR
Mann-Whitney MANOVA ou MANCOVA
Kruskal-Wallis Análise de Clusters
Princals Análise dicriminante
Intervalar/ Iguais aos da 1ª Iguais aos da 2ª linha R Pearson, R spearman,
Razão linha e 3ª coluna e 3ª coluna correlações parciais
Análise Fatorial
Regressão 49
Análise de Path

49

TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS

Amostras pareadas: os testes para amostras


pareadas ou medidas repetidas (within subjects)
comparam o mesmo grupo em diferentes
condições ou tratamentos.

50

50

25
07/04/2020

Testes em bioestatística: Quanto a


relação entre variáveis
AMOSTRAS PAREADAS
Escalas Uma variável independente Duas ou mais variáveis
independentes
Duas condições Três ou mais
condições
Nominal McNemar Q de Cochran Duas ou mais condições

Ordinal Sinal Friedman


Intervalar/ Wilconxon GLM repeated measures
Razão Teste t MANOVA – fator entre sujeitos

51

51

TESTES EM BIOESTATÍSTICA
PELA RELAÇÃO ENTRE VARIÁVEIS

Uma variável – amostras independentes

52

52

26
07/04/2020

Testes em bioestatística: Quanto a


relação entre variáveis

Variável Teste
Nominal Aderência do Qui-quadrado
Binomial
Ordinal Aderência do Kolmogorov Smirnov

53

53

Depois de tanta informação, acho


melhor irmos pegar o
computador e fazer umas
coisinhas...

54

54

27

Você também pode gostar