Você está na página 1de 58

BIOESTATÍSTICA

• A Bioestatística estuda métodos para a


obtenção, organização e análise de dados e os
métodos de tirar conclusão e fazer predições
com base nesses dados.

• É uma matéria fundamental para a realização de


pesquisas com coleta de dados

• Os procedimentos estudados na Bioestatística


serão utilizados na realização do TCC
• Estatística Descritiva: consistem em
resumir as principais características de
um conjunto de dados através de tabelas,
gráficos e medidas descritivas em forma
de resumos numéricos;

• Inferência Estatística: consiste em


generalizar os resultados de uma amostra
para todos os elementos da população,
isto é realizado basicamente na forma de
Estimação Intervalar e de Testes de
Hipóteses.
CONCEITOS BÁSICOS
• População: Conjunto
de TODAS as unidades
que se deseja estudar
• Amostra: Subconjunto
da população, são as
unidades que iremos
observar
CONCEITOS BÁSICOS
• INDIVÍDUO: cada elemento afetado por
uma medida ou enumerado por um índice.

• VARIÁVEL: determinada característica


que, por algum motivo, nos interessa
estudar. A escolha da variável de
interesse dependerá, em cada caso, dos
objetivos do estudo estatístico em
questão, É O QUE MEDIREMOS!!
FASES DE UM TRABALHO
ESTATÍSTICO
1ª DEFINIÇÃO DO PROBLEMA.
2ª PLANEJAMENTO
3ª COLETA DE DADOS
4ª APURAÇÃO DOS DADOS
5ª APRESENTAÇÃO DOS DADOS
6ª ANÁLISE E INTERPRETAÇÃO DOS
DADOS
Planejamento
• O QUE MEDIR – quais variáveis
utilizar

• COMO MEDIR – como medir estas


variáveis

• DE QUEM MEDIR – qual será a


amostra
Exemplo 1: Realizar uma pesquisa
de opinião com os alunos da
Faculdade
• Como medir estar variáveis??
Questionário. Como aplicar,...

• Quais variáveis utilizar??


Quais questões, opções de resposta,...

• Como será a amostra??


Quantas pessoas, como selecionar,...
Exemplo 2: Verificar a eficiência de um
treinamento em jogadores de Basquete
12 a 14 anos jogos colegiais
• Quais variáveis utilizar??
Velocidade, Impulsão,...

• Como medir estar variáveis??.


Quais Protocolos utilizar.

• Como será a amostra??


Quantas pessoas, como selecionar,...
VARIÁVEIS
• QUALITATIVAS (CATEGÓRICAS)
– NOMINAIS (NÃO TEM ORDEM)
– ORDINAIS (TEM ORDEM)

• QUANTITATIVAS
– DISCRETAS (CONTAGEM)
– CONTÍNUAS (MENSURAÇÃO)
AMOSTRAGEM
Amostra é parte desta população, é a
parte que será realmente estudada,
portanto pode-se compreender que ela
deva apresentar o melhor possível, a
população da qual veio.
• Razões para o Uso de Amostra:
De ordem prática
População hipotética
TIPOS DE AMOSTRAS MAIS USADAS

- Aleatória simples: Sortear indivíduos do


total da população (LISTA)

- Aleatória sistemática: Selecionar


indivíduos de “k em k” quando não é
possível sortear

- Estratificada proporcional: Dividir a


população em estratos (grupos) e
selecionar a amostra proporcionalmente
dentro de cada estrato
• Exemplo:
Uma população é dividida em 3 grupos da
seguinte forma
• Estrato A (jovens) _____> 120 elementos
• Estrato B (adultos) _____> 72 elementos
• Estrato C (3ª idade) _____> 48 elementos

Retirar uma amostra de 50 indivíduos dessa


população
AMOSTRA POR CONVENIÊNCIA
Quando não é possível utilizar nenhum
dos planos amostrais anteriores e a única
possibilidade é utilizar alguns indivíduos
que temos a disposição

Obs: Caracterizar bem a amostra para


deixar claro qual população ela
representa (descrição das características
dos indivíduos como: sexo, escolaridade
classe social, etc.)
TABELAS
GRÁFICOS
• Barras ou Colunas:
- Comparar as quantidades
- Escala Iniciar do ZERO!!

• Pizza ou Setores:
- Comparar as partes de um todo
- Apenas Categorias NOMINAIS
- No Máximo 5 ou 6 Categorias

• Linhas:
- Verificar comportamento AO LONGO DO TEMPO
CORRELAÇÃO
Verificar como 2 variáveis quantitativas se relacionam
- Diagrama de Dispersão
- Coeficiente de Correlação de Pearson
DISTRIBUIÇÃO DE FREQUÊNCIA
Tabela para variáveis quantitativas
Histograma
20

15

10

0
60 |- 80 80 |- 100 100 |- 120 120 |- 140 140 |- 160
MEDIDAS DE TENDÊNCIA
CENTRAL
• Média. É o valor em torno do qual os
dados se concentram.
n

∑X i
X = i =1

n
• Exemplo: Amostra de 5 valores de
colesterol: 200 - 250 - 280 - 310 - 320

200 + 250 + 280 + 310 + 320


X = = 272mb / dL
5
• Mediana. É o valor que divide um
conjunto de observações ao meio

Ex 1) Amostra de 5 valores de colesterol:


200 - 250 - 280 - 310 - 320
(n.º de observações ímpares)
Md = 280 (mg/dL)

Interpretação : 50% dos indivíduos tem


colesterol igual ou menor que 280 e os outros
50% tem 280 ou mais.
Ex 2) Amostra de salários de 6
profissionais:
200 – 220 – 250 – 280 – 310 – 320
(n.º de observações par)
Md= 250 + 280
2
Md= 265,00 reais

Interpretação : metade dos profissionais


tem salário igual ou menor que 265,00
reais e os demais tem salário igual ou
maior de 265,00 reais.
• Moda. É o valor que ocorre com maior
freqüência dentro do conjunto de
observação.
Ex) Idade de alunos (em anos):
18 - 19 - 19 - 19 - 20 - 21 - 22
Mo = 19 anos
Interpretação: a idade que mais aparece é 19
anos.
1 moda = unimodal
2 modas = bimodal
+ de 2 modas = multimodal
não possui moda = amodal
• Separatrizes. São valores que dividem um
conjunto de observações em partes iguais:

• Mediana -- Divide em 2 partes iguais (Md)


• Quartil----- Divide em 4 partes iguais (Q)
• Decil -------Divide em 10 partes iguais (D)
• Percentil ------Divide em 100 partes iguais (P)

Ex) P45 = 23,8 anos


Interpretação: 45% das pessoas tem menos
de 23,8 anos e 55% tem mais de 23,8 anos
MEDIDAS DE VARIABILIDADE
• AMPLITUDE (H) É a diferença entre o valor
máximo e o valor mínimo de conjunto de dados

H=M–m

• VARIÂNCIA (S2) É a “média” entre os


quadrados das diferenças entre cada elemento
do conjunto de dados e sua média.

S 2
=
∑ (X i − X) 2

n −1
• DESVIO PADRÃO (s) É a raiz quadrada
positiva da variância. Ele mede a dispersão
de um conjunto de dados em relação à
média.

s=
∑( X i − X) 2

n −1

Notas de 4 bimestres na disciplina de


Bioestatística de 2 alunos:
• A) 4 - 6 - 4 - 6
• B) 0 - 4 - 6 - 10
1º Passo: cálculo da média
2º Passo: cálculo dos desvios
3º Passo: cálculo dos desvios ao quadrado
4º Passo: Cálculo da somatória dos desvios ao
quadrado
5º Passo: aplicação da fórmula
• COEFICIENTE DE VARIAÇÃO (CV) É a
medida de dispersão relativa porque
estabelece uma relação entre o desvio padrão
e a média.
Utilizada para comparar a variabilidade
relativa ou grau de homogeneidade de
diferentes grupos
s
CV = .100 %
X
Considera-se um grupo homogêneo
quando CV ≤ 30%. Com um CV > 30% o
grupo vai perdendo a homogeneidade
Exemplo: Indique qual grupo é mais
homogêneo em relação ao salário:

Grupo A : Média R$600 desvio padrão R$50


Grupo B : Média R$1.000 desvio padrão R$70

CV A = 50/600 = 8,33%
CV B = 70/1.000 = 7%

Grupo B mais homogêneo (CV menor)


Cálculos no Excel:
- Contar Valores: =CONT.SE(A1:A20;”C”)
Obs. No lugar de C colocar o valor que será contado
entre aspas
- Média: =MÉDIA(A1:A20)
- Mediana: =MED(A1:A20)
- Percentil: =PERCENTIL(A1:A20;0,p)
Obs. No lugar de p colocar o pecentil desejado
- Maior Valor: =MÁXIMO(A1:A20)
- Menor Valor: =MÍNIMO(A1:A20)
- Variância: =VAR(A1:A20)
- Desvio Padrão: =DESVPAD(A1:A20)
- Coeficiente de Correlação de Pearson:
=CORREL(A1:A20;B1:B20)
INFERÊNCIA ESTATÍSTICA
Generalizar os resultados
da Amostra para a
População

- Parâmetro = Verdadeiro
valor populacional –
Desconhecido (impossível
calcular com dados
amostrais)
- Estimativa = Valor
amostral – Conhecido
(possível calcular com
dados amostrais
Estimação Intervalar
Com base no valor amostral calcular a margem
de erro para estimar o valor populacional

- Ex.:Pesquisa Eleitoral:
Candidato A: 30%
Candidato B: 27%
Margem de erro de 2 pontos percentuais para
mais a para menos
Candidato A : 28% a 32%
Candidato B: 25% a 29%
• CONFIABILIDADE
- Probabilidade do Intervalo conter o
verdadeiro valor populacional (estar certo)
90% 95% 99%

• SIGNIFICÂNCIA
- Probabilidade do Intervalo não conter o
verdadeiro valor populacional (estar
errado)
10% 5% 1%
Cálculo da Margem de Erro:

p (1 − p )
ε =Z
n

• Z = valor da tabela Z com a confiabilidade


definida (para 95% = 1,96)
• P= proporção estimada (usualmente 0,5)
• n = tamanho da amostra

Ex. Com 95% de confiabilidade e amostra de 600


indivíduos margem de erro = 4%
CÁLCULO TAMANHO DA
AMOSTRA

Z p (1 − p )
2 n.N
n= nC =
ε 2 n+N

Ex.: Para uma população de 3.000 pessoas,


com 95% de confiabilidade e 5% de erro
admissível (margem de erro)
n = 384 nc = 340
Amostra de 340 indivíduos
TESTES DE HIPÓTESES
• COMPARAÇÃO
2 Grupos Diferentes ou Mesmos Indivíduos em
2 Momentos Diferentes

• OBJETIVO: VERIFICAR SE AS
DIFERENÇAS SÃO SIGNIFICATIVAS
Será que a diferença entre as médias das
amostras é significativa quando generalizamos
os resultados para a população?
Hipóteses Estatísticas
• Ho => Hipótese Nula => Indica Igualdade
=> É a Hipóteses que Será Testada

• H1 => Hipóteses Alternativa => Indica


Diferença

O resultado de um teste é uma das seguintes


afirmações:
REJEITO Ho
NÃO REJEITO Ho
• Ho: =
• H1: ≠
• Se o teste indica que REJEITO Ho
isto significa que EXISTE DIFERENÇA
SIGNIFICATIVA

• Se o teste indica que NÃO REJEITO Ho


isto indica que NÃO EXISTE DIFERENÇA
SIGNIFICATIVA
Para a realização de um teste deve-se
calcular a Estatística de Teste ou Valor
Calculado, definir as Regiões Críticas
(com base nas tabelas), e fazer a
conclusão com base no esquema abaixo:
Procedimentos para realização de
um teste de hipóteses
com Valor Calculado:

• Formular as hipóteses ( H0 e H1)


• Calcular a Estatística de Teste ou Valor
Calculado
• Determinar as Regiões Críticas
• Decidir pela rejeição, ou não rejeição, da
hipótese nula
• Interpretar o resultado.
TESTE F PARA COMPARAR
VARIÂNCIAS
Ho: VAR A = VAR B • Estatística de Teste:
2
H1: VAR A ≠ VAR B S
Fc = maior
2
S menor

Distribuição F com n NUM − 1; n DEN − 1 gl


TESTE t PARA COMPARAR MÉDIAS
Ho: MÉDIA A = MÉDIA B
H1: MÉDIA A ≠ MÉDIA B

• OBSERVAÇÕES INDEPENDENTES COM


VARIÂNCIAS SUPOSTAMENTE IGUAIS

• OBSERVAÇÕES INDEPENDENTES COM


VARIÂNCIAS SUPOSTAMENTE
DIFERENTES

• OBSERVAÇÕES DEPENDENTES
• OBSERVAÇÕES INDEPENDENTES:
2 GRUPOS COM INDIVÍDUOS DIFERENTES

• OBSERVAÇÕES DEPENDENTES:
OS MESMOS INDIVÍDUOS EM 2 MOMENTOS
DIFERENTES (ANTES E DEPOIS OU PRÉ
E PÓS TESTES)
OBSERVAÇÕES INDEPENDENTES
COM VARIÂNCIAS SUPOSTAMENTE
IGUAIS
Estatística de Teste:
X1 − X 2 (n1 − 1) S12 + (n2 − 1) S 22
tc = , onde S =2
p .
1 1 n1 + n2 − 2
S  + 
2
p
 n1 n2 

Distribuição t com n1+n2–2 gl


OBSERVAÇÕES INDEPENDENTES
COM VARIÂNCIAS SUPOSTAMENTE
DIFERENTES
X1 − X 2
Estatística de Teste: t c =
 S12 S 22 
 + 
 n1 n2 

( w1 + w2 ) 2
v=
Distribuição t com w12 w22 gl
+
n1 − 1 n2 − 1
2
S
wi = i
Onde ni
OBSERVAÇÕES DEPENDENTES

d
Estatística de Teste: t c = S
d
n

Onde d é a média da diferenças e Sd é o


desvio padrão das diferenças

Distribuição t com n – 1 gl
TESTES DE HIPÓTESES COM
VALOR P (P-VALOR)
• P-VALOR é a probabilidade de errar
quando Ho é rejeitado, desta forma:

se p-valor for grande :


NÃO REJEITO Ho
se p-valor for pequeno:
REJEITO Ho
TESTES DE HIPÓTESES COM
VALOR P (P-VALOR)
• Desta forma utilizamos o seguinte critério para
a realização de um teste com p-valor:

se p-valor for MAIOR que a significância (5% ou


0,05) :
NÃO REJEITO Ho

se p-valor for MENOR que a significância (5% ou


0,05) :
REJEITO Ho
Procedimentos para realização de
um teste de hipóteses
com p-valor

• Formular as hipóteses ( H0 e H1)

• Decidir pela rejeição, ou não rejeição, da


hipótese nula (com base no p-valor)

• Interpretar o resultado.
TESTE QUI QUADRADO (χ2)
PARA INDEPENDÊNCIA
Utilizado quando a variável medida é
QUALITATIVA e deseja-se comparar 2 ou
mais grupos
Consiste em comparar os valores
OBSERVADOS com os valores
ESPERADOS, se não houvesse diferença
nenhuma entre os grupos
TESTE QUI QUADRADO (χ2)

Estatística de teste: r s (O − Eij )


2

χ = ∑∑
2 ij

i =1 j =1 Eij

Distribuição χ2 com (s-1)x(r-1) gl


Cálculos no Excel:
- Teste F: =TESTEF(A1:A20;B1:B20)
- Teste t de student: =TESTET(A1:A20;A1:B20;1;tipo)
Obs. No lugar de tipo colocar:
1 se forem observações dependentes
2 se forram observações independentes
variâncias iguais
3 se forram observações independentes
variâncias diferentes
- Teste qui-quadrado: =TESTE.QUI(A1:B2;A4:B5)
Obs. Primeiro Intervalo: Valores Observados
Segundo Intervalo: Valores Esperados
TESTES NÃO PARAMÉTRICOS
2 grupos Mais de 2 grupos

Nível de
Mensuração Dependente Independente Dependente Independente

Nominal McNemar Fisher ou χ2 Q Cochran χ2

Ordinal Wilcoxon U Mann- Friedman Kruskal-Wallis


Whitney
ANOVA
Análise de Variância

É utilizada quando a variável é


QUANTITATIVA e deseja-se comparar
MAIS DE 2 GRUPOS, é uma alternativa
ao teste t com observações
independentes
ANÁLISE ESTATÍSTICA

Quando o objetivo do trabalho é


apenas fazer uma descrição e não se
pretende fazer uma comparação:

• Cálculo de medidas descritivas:


• Média e desvio padrão para variáveis
quantitativas
• Porcentagem para variáveis qualitativas
ANÁLISE ESTATÍSTICA
Quando o objetivo do trabalho é fazer uma comparação entre
grupos ou entre o pré teste e o pós teste. Para verificar se
existe diferença significativa deve ser utilizado algum dos
seguintes testes estatísticos:

Variável quantitativa com pelo menos 15 indivíduos por grupo:

• Comparar pré e pós teste: teste t de student para observações


dependentes (pareado)
• Comparar 2 grupos: teste t de student para observações
independentes
• Comparar mais de 2 grupos: ANOVA
• Comparar 2 grupos ou mais em períodos de tempo diferentes:
ANOVA de medidas repetidas
ANÁLISE ESTATÍSTICA
Variável quantitativa com menos de 15 indivíduos por grupo ou
variável qualitativa ordinal:

• Comparar pré e pós teste: teste Wilcoxon


• Comparar 2 grupos: teste U de Mann-Whitney
• Comparar mais de 2 grupos: teste Kruskal-Wallis
• Comparar mais de 2 períodos de tempo diferentes: Friedman

Variável qualitativa nominal:

• Comparar pré e pós teste: teste McNemar


• Comparar 2 grupos: teste qui-quadrado (amostras grandes) ou
teste de Fisher (apenas 2 possíveis respostas)
• Comparar mais de 2 grupos: teste qui-quadrado (amostras grandes)
Tamanho da amostra
Para justificar amostras de até 100 indivíduos,
com 95% de confiabilidade, para a comparação
de grupos pode-se utilizar a seguinte tabela,
segundo Altman (1991)

Referência:

ALTMAN D. G. Pratical Statistics for Medical


Research. Chapman and Hall, London, 1991
Tabela com tamanho da amostra
para uma confiabilidade de 95%:
Tamanho da Poder de teste Diferença
amostra padronizada
15 60% 1,2
20 65% 1
25 70% 1
30 80% 1
35 85% 1
40 85% 0,95
50 85% 0,85
60 85% 0,75
70 85% 0,70
80 85% 0,65
90 85% 0,60
100 85% 0,55

Você também pode gostar