Escolar Documentos
Profissional Documentos
Cultura Documentos
Anormal = incomum
algo que acontece com pouca frequência
Metáfora do “alvo”
Anormal – tratável
se o tratamento naquele nível leva a um
desfecho melhor
1
Dilemas!
“ A validade das
inferências dos
resultados de qualquer
estudo epidemiológico
depende da acurácia
dos métodos e
procedimentos
empregados”
Dilemas
A forma como coletamos
dados em saúde
Qual ou quais são os critérios usados para selecionar
influenciam diretamente
na qualidade dos dados e um instrumento para sua pesquisa?
nas inferências feitas
posteriormente
Quais são as facilidades e dificuldades em desenvolver
A validade dos resultados um novo questionário?
depende da qualidade
dos instrumentos Que tipos de problemas uma equipe mal treinada pode
utilizados causar no estudo?
2
A pesquisa não contribuirá para a prática clinica
ou o conhecimento se os achados não tiverem Todo processo de medição
acurácia, foram enviesados ou falharem na (processo mediante o qual se
representação adequada da experiência do quantifica uma magnitude) está
grupo investigado. sujeito a diversas fontes de
erros, derivadas de:
Alguns critérios são necessários para avaliar a
limitações do instrumento de
qualidade de um estudo (mérito científico) medida
3
OBSERVAÇÃO DE Fenômeno 1
OBSERVAÇÃO ESTATÍSTICA Fenômeno 2
FENÔMENOS DOS FENÔMENOS
BIOLÓGICOS BIOLÓGICOS
OBJETIVÁVEIS OBJETIVÁVEIS
A complexidade das
A complexidade das
escalas objetiváveis
escalas objetiváveis
se concentra na
se concentra na
dificuldade de
dificuldade de
vincular valores
vincular valores
numéricos a
numéricos a
fenômenos
fenômenos
Validade
Metáfora do “alvo”
Grau em que os dados medem o que deveriam
medir
Assim
Não Preciso
Os resultados de uma aferição Preciso Não Preciso Preciso
Não Válido Válido Válido Não Válido
correspondem ao estado verdadeiro
do fenômeno aferido
4
Validade versus confiabilidade Validade – aferições – padrões imperfeitos
Resultado dos testes
Válido e preciso
Angina, síndrome de intestino irritável,
Valor verdadeiro autismo
Validação de medidas e
validade interna dos estudos
5
Validade, Acurácia (validity, accuracy)
Dimensões da validade Validade de conteúdo (ou conceitual)
Três “C”: Grau em que uma medida cobre o escopo do
fenômeno em estudo.
Conteúdo Baseada em revisão da literatura / consenso de
especialistas sobre forma de medir atributo de
Critério interesse
Custo, complexidade de realização, complicações Resultados por métodos laboratoriais Padrões: Espécimes com resultados
conhecidos por métodos
(procedimentos invasivos) dos critérios de referencia estabelecidos
(“padrão-ouro”) costumam tornar vantajoso o uso de
teste de menor validade. Escala de depressão Diagnóstico após avaliação clínica
detalhada
6
Validade, Acurácia (validity, accuracy). Dimensões: Validade de constructo: exemplos
Para atributos baseados em conceitos teóricos abstratos, os
(1) correlação da auto-estima avaliada pela escala de
critérios de referencia (com maior validade aparente) podem não Rosemberg, com participação em atividades escolares
estar disponíveis (ex., auto-estima) ou não serem facilmente corrobora o constructo de auto-estima e seu processo de
mensuração (Carmines & Zeller, 1979);
acessiveis (ex., classe social).
7
As aparências para a mente são de quatro tipos
“Posicionar-se corretamente
frente a todos esses casos é a
tarefa do homem sábio.”
Validade de critério é geralmente quantificada por meio de dois Resultado do teste vs padrão de
componentes indissociáveis: sensibilidade e especificidade referência (padrão ouro)
DOENÇA
Padrão Ouro
Doentes * Sadios Presente Ausente Total
*aplicável a outros atributos ** aplicável a outras abordagens Total a+c b+d a+b+c+d
8
Resultados do estudo de validação do exame
Quão bom é um teste para identificar radiológico contra o padrão de referência (padrão ouro)
pessoas com a doença?
Resultado do Padrão-ouro
Quão bom é um teste para excluir Doença Doença Total
corretamente pessoas que não têm a Positivo Positivo
doença? n=64 n= 38
Teste Teste n= 102
Diagnóstico Positivo verdadeiro falso
Se o teste de uma pessoa é positivo, qual positivo positivo
Sensibilidade e Especificidade
Sensibilidade e Especificidade Sensibilidade (S): é a proporção de verdadeiros positivos
DOENÇA entre todos os doentes.
Expressa a probabilidade de um teste dar positivo na presença
Presente Ausente Total
da doença, isto é, avalia a capacidade do teste detectar a
a b doença quando ela está presente
Positivo verdadeiro falso a+b
TESTE positivo positivo
c d
Negativo falso verdadeiro c+d Especificidade (E): é proporção de verdadeiros negativos entre
negativo negativo todos os sadios.
Total a+c b+d a+b+c+d Expressa a probabilidade de um teste dar negativo na ausência da
doença, isto é, avalia a capacidade do teste afastar a doença
quando ela está ausente.
Sensibilidade = a / (a + c)
Especificidade = d / (b + d)
9
Sensibilidade e especificidade da Uso dos testes
mamografia
Sensíveis Específicos
Câncer de mama
Necessário para o Particularmente necessário
Teste de Câncer Câncer não Total diagnóstico de doença
confirmado quando um resultado falso
Rastreamento confirmado
potencialmente grave positivo pode ser muito
Positivo 132 983 1155
lesivo
Afastar doenças em fase
Negativo 45 63.650 63.695 inicial do diagnóstico Confirmar um diagnóstico
Total 177 64.633 64.820 sugerido por outros dados
O resultado negativo é
mais útil: melhor VPN O resultado positivo é
mais útil: melhor VPP
Sensibilidade = Especificidade = Obs: os testes sensíveis também são úteis no rastreamento (screening) de
doenças em grupos populacionais
132 / 177 = 74.6% 63650 / 64633 = 98.5%
Valor Preditivo
DOENÇA
Presente Ausente Total
DOENÇA
a b
Presente Ausente Positivo a+b
verdadeiro falso
a+b TESTE positivo positivo
(todas as pessoas com testes c d
TESTE + positivos) Negativo falso verdadeiro c+d
c+d negativo negativo
(todas as pessoas com testes Total a+c b+d a+b+c+d
- negativos)
VPP = a / (a + b)
VPN = d / (c + d)
10
Valor Preditivo DETERMINANTES DO VALOR PREDITIVO
Valor preditivo positivo (VPP): é a proporção de verdadeiros
positivos entre todos os indivíduos com teste positivo. Expressa a sensibilidade
probabilidade de um paciente com o teste positivo ter a doença.
especificidade
100%
90%
Valor Preditivo
80%
60%
50%
40%
30%
20%
10%
0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Prevalência
11
Prevalência sobre o valor preditivo positivo
VALOR PREDITIVO
sensibilidade e especificidade constante
12
VALOR PREDITIVO VALOR PREDITIVO
Variação dos valores preditivos de um teste com sensibilidade e
Varia com a prevalência (probabilidade pré- especificidade de 90%, segundo a prevalência da doença
teste) da doença
Para um mesmo teste, quanto maior a Prevalência Valor Preditivo
prevalência maior o VPP e menor o VPN % Positivo Negativo
1,0 8,3 99,9
Faixa ideal de uso do teste: prevalência 10,0 50,0 98,8
intermediária (entre 25% e 65%) 50,0 90,0 90,0
70,0 95,5 80,0
Quanto mais sensível, melhor o VPN
90,0 98,8 50,0
13
RAZÕES DE PROBABILIDADES Razão de Verossimilhança
(Razão de Verossimilhança) DOENÇA
A razões de probabilidade são Presente Ausente Total
um método alternativo para se avaliar a performance de um
a b
Teste Diagnóstico dicotômico, Positivo verdadeiro falso a+b
e também parte de duas medidas: a razão de probabilidade de TESTE
um teste positivo e a razão de probabilidade de um teste positivo positivo
negativo. c d
Negativo falso verdadeiro c+d
razão de probabilidades negativo negativo
probabilidade do resultado de um dado teste entre pessoas com Total a+c b+d a+b+c+d
uma doença dividida pela probabilidade daquele teste em
pessoas sem a doença
Razão de Verossimilhança positiva = a / a + c
b/b+d
14
Efeito da definição de diferentes níveis de glicemia
Distribuição dos valores sangüíneos de glicose nos resultados falso positivo e falso negativo
em uma população normal e diabética
15
Não Doentes
Doentes
180 220
mg/dl mg/dl
16
Sensibilidade, especificidade e valores
preditivo positivo e negativo dos testes A, Testes em paralelo
B e da combinação em paralelo de A e B
Esta estratégia significa que dois ou mais
Teste S (%) E (%) VPP (%) VPN (%)
testes são realizados, e que qualquer
resultado positivo identifica um caso.
A 80 70 22,86 96,92
Os testes em paralelo têm por objetivo
aumentar a sensibilidade de um programa
B 90 90 50 98,78
de triagem.
( ↑sensibilidade e o valor preditivo
Ae B 98 63 22,74 99,6
negativo)
O que isso significa? A possibilidade da
doença ser omitida é menor, mas os casos de
falso-positivos aumentam.)
17
Validade
Estabilidade, Concordância.
Confiabilidade vs Validade
18
Avaliar de diferentes maneiras: Confiabilidade - Conceito
1. Para o mesmo aferidor em diferentes ocasiões Para avaliar a Confiabilidade é preciso
(confiabilidade intra-aferidor), considerar todas as fontes de variabilidade.
Paciente A -
Fontes de variabilidade das medidas Média da sistólica
Confiabilidade vs erro de medida 154 mm Hg
19
• Se aferimos nosso peso numa balança de um
banheiro, acreditamos que é possível que
exista uma variação de ±1kg;
• Essas fontes de variabilidade (erros da • Quando conferimos a velocidade de nosso
medida) introduzem “ruído”, isto é, carro, imaginamos que uma variação de
prejudicam a detecção da diferença que ±5km/h possa existir nesta medida;
existe entre os indivíduos (participantes do
estudo). Porque aceita-se erros nessa proporção?
20
Quando desconhecemos a validade, confiablidade
de um instrumento, teste ou medida Quando desconhecemos a validade, confiablidade
de um instrumento, teste ou medida
O desenvolvimento de escalas - 2 caminhos: base teorica ou Teorica = seleciona questoes que sao sabidamente ou reconhecidamente
base empirica; relevantes do ponto de vista de uma teoria me particular, como McGill Pain
Questionnaire.
21
Ferramenta Gráfica interessante:
gráfico de Bland & Altman
Coeficiente de Correlação IntraClasse: é
uma estimativa da fração da variabilidade
É um gráfico de dispersão, no qual as diferenças
total que é gerada pela variação entre os
entre os pares (eixo das ordenadas) são plotados
indivíduos (isso é o que queremos!).
contra suas médias (nas abscissas)
22
2. Medidas com respostas categóricas:
Concordância observada ou Percentual de
concordância.
Teste + Teste -
Teste + a b
Teste - c d
23
Concordância observada ou Percentual de Exemplo
concordância.
Concordância observada = (a+d) Teste re-teste Monitoramento fatores de Risco à Sáude de
(a + b + c + d) Adolescentes – Rio de Janeiro, 2007.
Pode ser calculada para medidas com mais de duas
categorias. Pode ser utilizada em estudos de A sua mãe (ou seu responsável) costuma comer alguma
dessas refeições com você?
validade.
É afetada pela prevalência - tende a ser maior (a) Não
quando a prevalência é muito alta (resultando numa (b) Sim, todos os dias
(c) Sim, 5 a 6 vezes por semana
alta proporção de positivos/positivos, especialmente (d) Sim, 3 a 4 vezes por semana
quando a sensibilidade é alta. (e) Sim, 1 a 2 vezes por semana
Não leva em conta que a concordância pode ter (f) Sim, mas apenas raramente
sido ao acaso.
Questionário 2
Kappa (Cohen, 1960)
Total
Fração da concordância observada que não é
Questionário 1 Sim (alguma frequência) Não (raramente)
devida ao acaso (chance) em relação a
concordância máxima que não é devido ao acaso.
Sim (alguma 129 4 133
freqüência) k= Po – Pe
Não
(raramente)
11 58 69 1 - Pe
Po é a proporção da concordância
140 62 202 observada;
Pe é a concordância devida ao
acaso;
1 – Pe é a máxima concordância
Concordância observada: 129 + 58 / 202 = 0,92 que não é devida ao acaso
24
Questionário 2
Total
Questionário 1 Sim (alguma Não Kappa
frequência) (raramente)
Validade de constructo
Técnicas de análise multivariada:
Análise factorial O que fazer para manter a
Hipótese - medidas de associação confiabilidade e validade das
Consistência interna – alfa de Cronbrach medidas no estudo
25
No planejamento do estudo
“Se você consegue medir o que está
No planejamento do estudo, o que falando e pode expressar isso em
podemos fazer para melhorar a números, você sabe algo de seu
qualidade das medidas? assunto, mas se você não pode medir
isso, seu conhecimento é pobre e
Durante o andamento do estudo? insatisfatório.”
Leitura Recomendada
Szklo & Nieto (2006) Cap 8, Garantia e Controle de Qualidade;
26