Escolar Documentos
Profissional Documentos
Cultura Documentos
Fundamentos de Bioestatística
Ministrante
Daniela Benzano
Assistente de Consultorias
Serviço de Epidemiologia e Bioestatística/HCPA
Porto Alegre, RS
Conceitos Básicos em
Bioestatística
Objetivos
• Entender os princípios fundamentais da Bioestatística
freqüentemente utilizados na área das ciências biológicas
e da saúde.
1
Livro texto:
Callegari-Jacques, SM.
Bioestatística. Princípios e
aplicações. ArtMed, 2003.
Bioestatística
O papel da Bioestatística
2
Para entender adequadamente artigos
científicos desta área o leitor deve
estar familiarizado com os princípios
fundamentais da Epidemiologia e da
Bioestatística.
• Treinamento sugerido
3
Bioestatística:
Princípios Fundamentais
Abordagem EPR em
Bioestatística
• Entidades
• Propriedades
• Relações
4
Propriedades (Variáveis)
São as características apresentadas pelas
entidades (objetos: coisas/indivíduos).
Estas características podem variar entre as
entidades (e em uma mesma entidade de
um momento para o outro). Por este motivo
são também conhecidas como variáveis.
Entidades e Propriedades
Paciente peso? 75 kg
Dia condição do tempo? ensolarado
Palestra como foi? chata
Relações
5
Conceitos básicos
Variáveis e seus
níveis de medida
Tipo de Características
Exemplos
Variável(1) da variável
Nominal(2) Categorias não ordenadas sexo, grupo sangüíneo
Ordinal Categorias ordenadas grau de dor, escores em geral
Vantagens
da variável quantitativa
• Nível de informação é superior
6
População e Amostra
População: Refere-se ao grupo total, ou
seja, todos os indivíduos com uma
mesma condição, sem “fronteiras”. Um
conceito teórico, estatístico e abstrato,
diferente do conceito geográfico de
população.
População e Amostra
n1 n2
n4
n3
7
Duas variáveis importantes
Nas investigações das relações entre as variáveis
podemos identificar pelo menos duas variáveis nos
estudos epidemiológicos
Medidas Descritivas
• Distribuição de freqüências
• Medidas de dispersão
amplitude, variância/desvio padrão
• Medidas de freqüência
prevalência e incidência
Distribuição de freqüências
• Toda variável (seja ela qualitativa ou
quantitativa) quando avaliada em um grupo de
indivíduos apresenta uma distribuição de
freqüências.
8
Distribuição de freqüências:
Histograma
300
200
100
0
10 30 50 70 90
Distribuição de freqüências:
Histograma
300
200
100
0
10 30 50 70 90
Características da distribuição
de freqüências
• Geralmente a distribuição de freqüências possui
tendência central
dispersão (variação)
9
Medidas de Tendência Central
• Média: Indicação de uso em distribuições simétricas.
Possui o maior poder matemático e é a medida
descritiva mais utilizada (e preferida). No entanto, é
afetada por valores extremos e em distribuições
assimétricas pode apresentar
uma informação distorcida. dispersão de pontos
com n=200
x=
∑x indivíduos
DP
n
nº de
média
• Mediana: Medida de
posicionamento repre-
sentando o valor que
ocupa o meio da série,
ou seja, em tese 50% dos
quartil inferior
valores estão abaixo e (Percentil 25)
50% acima da mediana.
indivíduos
mediana
(Percentil 50)
nº de
10
Medidas de Dispersão
• Amplitude (a)
• Variância (s2)
• Desvio padrão (s; DP)
• Amplitude interquartil
Medidas de Dispersão
Σ ( x − x )2
DP = s =
n −1
11
Representação gráfica do desvio padrão:
1. na nuvem de dispersão de valores de x;
2. em uma distribuição de freqüências gaussiana
(média ± DP reúne ~2/3 dos valores centrais)
dispersão de pontos
com n=200
DP
indivíduos
nº de
média
altura
mediana
(Percentil 50)
indivíduos
nº de
quartil superior
(Percentil 75)
prega tricipital
Distribuição Simétrica
moda moda
mediana
mediana
média média
12
Escolhendo a medida descritiva
Tipo de variável
• Nominal: usar freqüências e proporções (P/I).
Apresentação de resultados
• Tabela descritiva
• Gráficos para var. quantitativas:
- Histograma
- Gráfico de média e barra de erro
- Box plot
- Gráficos de linha
- Gráfico dispersão de pontos
• Gráficos para var. categóricas :
- Gráfico de setores
- Gráfico de colunas
Tabela descritiva
Características dos grupos em estudo
Variável Grupo Exposto Grupo Não-Exposto
n = 97 n = 152
Idade, anos 35,2±7,2 30,2±12,0
Sexo feminino, nº (%) 12 (12,4) 81 (53,3)
Escolaridade
Primário incompleto 5 (5,2) 15 (9,9)
Primário completo 67 (69,1) 29 (19,1)
Secundário 20 (20,6) 77 (50,7)
Superior 5 (5,2) 31 (20,4)
Tabagismo, nº (%) 50 (51,5) 51 (33,6)
BDI 10,2±3,3 11,9±5,2
GAIL 23,3 (1,0 a 67,0) 16,0 (2,0 a 98,0)
Os dados são apresentados como nº (percentual), média±dp e
mediana (amplitude interquartil: P25 a P75). BDI=Escore de
Depressão Beck Depresssion Inventory ; GAIL=Escala Great
Achievements in your Life
13
Var. Quantitativas: gráfico de média e barra de erro
HDL HDL
150
Variável 100
50
0
1 2 3
tempo tempo
14
Var. quantitativas: gráfico de dispersão de pontos
1.2
1.0
Variável Y 0.8
0.6
0.4
0.2
0.0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Variável X
Variáveis qualitativas
Gráfico de setores Gráfico de colunas
(pizza ou torta)
%
A B C
• Usados para dados categóricos.
• Evitar uso em variáveis dicotômicas.
• Gráfico de pizza: raro em publicações científicas.
• Gráfico de colunas: não é histograma.
Resumo
• Epidemiologia e Bioestatística auxiliam a
compreender a literatura científica nas áreas
das ciências biológicas e da saúde.
15
• Partindo dos conceitos de entidade(objeto) e
propriedade(variável) a Epidemiologia e a
Bioestatística passam pela descrição dos
dados para chegar à relação entre as variáveis
e a conseqüente estimativa da magnitude
destas relações.
16
Cuidados para implementação do estudo
Banco de dados
– Numerar as fichas/questionários
• Identificador
• Uma info por
coluna
• Dados de mesmo
tipo por coluna
• Nome curto de
variável
• Sem comentário
ou texto
Tamanho da amostra
• Nem sempre é tão preciso quanto se imagina
• Depende das informações dadas pelo pesquisador
• Um tamanho de amostra adequado ou suficiente
não garante a aleatoriedade (representatividade)
• Muitas vezes revela que um estudo não é factível
ou que seria necessário modificar os fatores
preditores ou desfechos
17
Tamanho da amostra
Por isso, o tamanho da amostra deve ser
calculado ainda no projeto, quando
maiores mudanças ainda são possíveis
Tamanho da amostra
• Em estudos comparativos, a hipótese é
fundamental para o cálculo do n
• Esta deve ser baseada na questão de
pesquisa, ser simples, específica e pré-
estabelecida
18
Tamanho da amostra: Hipótese
• Simples vs complexa:
– Simples: contém uma variável preditora e um
desfecho
• Um estilo de vida sedentário está associado a um
aumento no risco de proteinúria em pacientes com
diabetes
– Complexa: contém mais de uma preditora ou mais
de um desfecho
• Um estilo de vida sedentário e o consumo de álcool
estão associados com um aumento no risco de
proteinúria em pacientes com diabetes
• O consumo de álcool está associado a um aumento no
risco de proteinúria e neuropatia em pacientes com
diabetes
Verdade na População
Resultados na
Amostra do Ausência de
Associação
Estudo Associação entre o
entre o Preditor
Preditor e o
e o Desfecho
Desfecho
Rejeitam a
Correta Erro tipo I
hipótese nula
Não rejeitam a
Erro tipo II Correta
hipótese nula
Hulley et all, 2003
19
Tamanho da amostra
• Magnitudes de efeito
(informação dada pelo pesquisador: “diferença
clinicamente relevante”)
– Tamanho de efeito padronizado (effect size)
– Razão de chances (Odds ratio)
– Risco relativo
– Coeficiente de correlação
Variável Desfecho
preditora Dicotômico Contínuo
- Razão de chances Tamanho de efeito
Dicotômica (Odds ratio) padronizado
- Risco relativo (effect size)
Tamanho de efeito
Contínua padronizado Coeficiente de correlação
(effect size)
Magnitude de efeito:
• A probabilidade de um estudo poder
detectar uma associação entre a variável
preditora e o desfecho depende da
magnitude real da associação na população-
alvo.
20
Magnitude de efeito:
• Se a associação for forte, será facilmente
detectada na amostra
– Ex: os níveis de glicemia de jejum em mulheres
que praticam exercício físico são, em média,
20mg/dL mais baixos do que as que não praticam
(tamanho da amostra necessário será pequeno)
• Se a associação for fraca, será difícil
detectá-la
– Ex: diferença de 2 mg/dL (tamanho da amostra
necessário será grande)
Magnitude de efeito:
• Em geral, se obtém da literatura, de estudos
anteriores.
• Na ausência, pode-se estipular uma
diferença mínima que poderia ser
considerada clinicamente significativa.
• Se mesmo assim for impossível a sua
estimativa, se faz um pequeno estudo piloto
ou uma análise interina.
Tamanho de amostra:
comparação de proporções
• Exemplo:
– Um estudo experimental em ratos será realizado
para comparar 2 diferentes drogas cancerígenas
(A e B) quanto à presença de carcinoma.
• Deseja-se estimar um tamanho da amostra que
detecte uma diferença absoluta de 40%, sendo
que a droga de menor efeito provoca carcinoma
em 40%.
21
Tamanho de amostra: comparação
de proporções
RESULTS:
REQUIRED SAMPLE: Total 60 (30 in A, 30 in B)
Continuity-corrected: Total 70 (35 in A, 35 in B)
EXPECTED PRECISION:
Approx. 95% CI for difference between proportions (D) =
D - 0.238 to D + 0.238
Tamanho de amostra:
comparação de proporções
• Exemplo:
– No mesmo estudo, também se deseja dosar os
níveis de uma enzima ZYX.
• Deseja-se estimar um tamanho da amostra que
detecte uma diferença de 20 unidades, sendo
que os desvios-padrão são em torno de 17 e 18.
22
Tamanho de amostra: comparação
de médias
RESULTS:
REQUIRED SAMPLE: Total 36 (18 in A, 18 in B)
EXPECTED PRECISION:
Approx. 95% CI for difference between means (D) =
D - 12.172 to D + 12.172
Variável Desfecho
preditora Dicotômico Contínuo
Teste de qui-
Dicotômica Teste t
quadrado
Coeficiente de
Contínua Teste t
correlação
23
Plano de análise estatística
• Análise multivariável (caso seja necessário
controlar para possíveis variáveis confundidoras ou de
interação):
– Regressão linear
– Regressão logística;
– Regressão de Poisson;
– Regressão de Cox.
24