Manual de Apoio Ao Curso

Manual – Métodos de Avaliação de Efetividade em Intervenção Psicológica
MÉTODOS DE AVALIAÇÃO DE
EFETIVIDADE EM
INTERVENÇÃO PSICOLÓGICA
MANUAL DA FORMAÇÃO
Página 0 / 163
ÍNDICE
CAPÍTULO I - Quando e o que avaliar? ....................................................................................................... 7

I.1 Por que razão importa avaliar a efetividade? ................................................................................... 7
I.2 Em que contextos importa avaliar a efetividade? ............................................................................ 9
I.3 Avaliação de efetividade: definição de pergunta, objetivos e hipóteses de investigação ............. 11
I.3.1 Pergunta de investigação ......................................................................................................... 11
I.3.2 Objetivos de investigação ........................................................................................................ 16
I.3.3 Hipóteses de investigação........................................................................................................ 18
I.3.4 Outcomes: indicadores para a avaliação.................................................................................. 19
I.4 Avaliação de efetividade: aspetos éticos a ter em conta ............................................................... 21
I.4.1 Princípios éticos ....................................................................................................................... 22
I.4.2 O que são dados pessoais? ...................................................................................................... 23
CAPÍTULO II - Escrita de métodos para avaliação de efetividade ............................................................ 26
II.1 Por que razão importa escrever o protocolo? ............................................................................... 26
II.2 Escrita de protocolos de investigação ........................................................................................... 27
II.2.1 Título ....................................................................................................................................... 30
II.2.2 Autores .................................................................................................................................... 31
II.2.3 Resumo ................................................................................................................................... 33
II.2.4 Introdução (enquadramento teórico) ..................................................................................... 34
II.2.5 Métodos .................................................................................................................................. 36
II.2.6 Resultados esperados ............................................................................................................. 42
II.2.7 Aspetos éticos e deontológicos .............................................................................................. 42
II.2.8 Contexto de execução do projeto (instituição, supervisão, etc.) ........................................... 43
II.2.9 Equipa de investigação ........................................................................................................... 43
II.2.10 Orçamento ............................................................................................................................ 44
II.2.11 Cronograma .......................................................................................................................... 44
CAPÍTULO III - Revisão de literatura: para que serve? ............................................................................. 46
Página 2 / 163
III.1 Revisão da evidência para apoio à decisão ................................................................................... 46

III.1.1 Níveis de evidência em ciência .............................................................................................. 48
III.1.2 Níveis de evidência para apoio à decisão… E publicável ....................................................... 51
III.1.3 Revisões sistemáticas da literatura ........................................................................................ 53
CAPÍTULO IV - Validade interna e externa na avaliação de efetividade e custo-efetividade .................. 64
IV.1 O conceito de validade ................................................................................................................. 65
IV.1.1 O que é a validade? ............................................................................................................... 66
IV.1.2 Validade de um projeto de investigação ............................................................................... 67
IV.1.3 O que se entende por “viés”? ................................................................................................ 70
IV.1.4 Efeito placebo ........................................................................................................................ 83
IV.1.5 O que é a validade externa? .................................................................................................. 85
IV.1.6 Relação entre validade interna e validade externa ............................................................... 88
CAPÍTULO V - Medidas e indicadores de efetividade .............................................................................. 89
V.1 Quantificação de patologia/morte (indicadores de saúde pública) .............................................. 90
V.1.1 Indicadores de saúde populacional ........................................................................................ 91
V.1.2 Exemplos de indicadores de saúde que implicam recolha de dados a nível individual ......... 94
V.2 Construção e avaliação das propriedades de instrumentos de medição ...................................... 99
V.2.1 De A a Z: roteiro abreviado para a construção de um questionário ...................................... 99
V.2.2 Propriedades psicométricas dos questionários: breve glossário ......................................... 106
CAPÍTULO VI - Tipos de Estudos de efetividade..................................................................................... 110
VI.1 Avaliação de efetividade: o conceito de causalidade ................................................................. 110
VI.1.1 Causalidade .......................................................................................................................... 111
VI.2 Desenhos de investigação .......................................................................................................... 112
VI.2.1 Desenhos experimentais ..................................................................................................... 112
VI.2.2 Desenhos observacionais .................................................................................................... 114
VI.3 Principais problemas e limitações dos estudos .......................................................................... 124
VI.3.1 Critérios de qualidade: Estudos de coorte & Estudos caso-controlo .................................. 125
VI.4 Avaliação de eficiência da intervenção ...................................................................................... 126
CAPÍTULO VII – Análise estatística ......................................................................................................... 131
VII.1 Do questionário para a construção de uma base de dados: codificação de dados .................. 131
VII.1 Como dar nomes às variáveis e passar do questionário para a base de dados .................... 131
Página 3 / 163
VII.2 Duas estratégias de análise em avaliação de efetividade e custo-efetividade ..................... 132

VII.3 Diferença entre população e amostra ................................................................................... 133
VII.4 Classificação dos dados.......................................................................................................... 133
VII.5 Características amostrais ....................................................................................................... 134
VII.6 Inferência estatística: Conceitos base ................................................................................... 136
CAPÍTULO VIII – Escrita e disseminação dos resultados ........................................................................ 143
VIII.1 Comunicação de resultados...................................................................................................... 143
VIII.1.1 A escrita dos resultados científicos ................................................................................... 143
VIII.1.2 Resultados: Estrutura ........................................................................................................ 146
VIII.2 Disseminação dos resultados de investigação ......................................................................... 147
VIII.2.1 O que é a disseminação dos resultados?........................................................................... 148
VIII.2.2 Como desenvolver uma estratégia de disseminação? ...................................................... 156
BIBLIOGRAFIA ACONSELHADA ............................................................................................................... 158
Sobre métodos epidemiológicos (conceitos, desenhos de investigação) ......................................... 158
Sobre avaliação custo-efetividade ..................................................................................................... 158
Sobre princípios, métodos e técnicas estatísticas aplicadas à investigação em saúde ..................... 158
Sobre indicadores e construção de escalas/questionários................................................................ 158
ANEXOS .................................................................................................................................................. 159
Anexo I – Consentimento informado ................................................................................................. 159
Anexo II – Protocolo de investigação ................................................................................................. 162
Anexo III – Revisão sistemática de literatura ..................................................................................... 163
Página 4 / 163
PREÂMBULO
Investigar faz parte da natureza humana. É um reflexo da curiosidade e da

necessidade em conhecermos melhor o que nos rodeia. Em última instância,
corresponde ao imperativo de percebermos como prever eventos e como controlar os
fenómenos de que depende o nosso bem-estar e a nossa qualidade de vida.
A informação que nos chega é construída e disseminada a um ritmo demasiado rápido

para poder ser absorvida e bem interpretada por quem tem de tomar decisões. E a
linguagem científica, reconhecida como a mais adequada para o apoio à tomada de
decisão (fala-se cada vez mais em decisão baseada na evidência em diversas áreas,
como psicologia, economia, medicina, política, etc.), é paradoxalmente complexa e de
difícil interpretação e utilização.
O rigor de um pensamento analítico e sistemático, próprio da ciência, implica a

compreensão e o domínio de um conjunto de regras e procedimentos que têm vindo a
tornar-se cada vez mais numerosos e sofisticados. Esta constatação afasta muitas
vezes quem tem de tomar decisões, e ainda mais quem tem de produzir evidências
quanto à melhor forma de intervir para resolver problemas. Isto é válido em qualquer
área de intervenção e, muito em particular, nas matérias em que os psicólogos
trabalham no seu dia-a-dia.
É fundamental que o trabalho realizado pelos psicólogos ganhe a credibilidade e

reconhecimento que merece e, para o efeito, é determinante que saibamos interpretar
os resultados de milhares de estudos que são feitos sobre uma multiplicidade de
intervenções psicológicas. E é fundamental que os psicólogos compreendam os
princípios básicos que lhes permitam pensar em formas de demonstrar a qualidade
dos resultados das suas intervenções. Num mundo ideal, seria impensável intervir
sem demonstrar, de acordo com os melhores princípios científicos, o grau de sucesso
atribuível à intervenção em causa.
O material produzido para este curso, promovido pela Ordem dos Psicólogos
Portugueses, teve por objetivo principal simplificar o que muitas vezes é apresentado
de forma demasiado complexa (e aborrecida), promovendo o desânimo de quem
começa a aventurar-se na linguagem e forma de pensar científicas.
Página 5 / 163
Este manual expressa um modo pessoal de ver a produção científica no contexto da

avaliação de efetividade. Existem muitas alternativas de pensamento sobre vários dos
conceitos aqui apresentados. Diferentes escolas de pensamento científico valorizam
diferentes aspetos; e chegam a utilizar palavras iguais para valores semânticos
diferentes.
Nesse sentido, é possível dizer que este manual corresponde a uma espécie de
manual ou sebenta cunhada pelo seu autor. E, também por isso, importa explicitar que
a minha formação de base é em psicologia clínica e da saúde, com formação em
psicoterapias cognitivo-comportamentais integradas com modelos experienciais e
existenciais. O facto de muito do meu trabalho científico ter sido dedicado ao estudo
de comportamentos alimentares e de atividade física, em particular em contexto de
obesidade severa e de outras doenças crónicas relacionadas, como diabetes, doença
cardiovascular, etc., incentivou-me a fazer investigação clínica e epidemiológica em
múltiplas áreas da psicologia da saúde e da psicologia clínica da saúde. Por esse
motivo, o texto aqui produzido pode ser visto a forma como um psicólogo habituado
também à linguagem epidemiológica entende o modo como os estudos de avaliação
de efetividade e de custo-efetividade devem ser feitos.
Espero que este texto atinja o seu objetivo principal: motivar à aprendizagem de
formas adequadas de fazer ciência e de demonstrar a mais-valia do trabalho do
psicólogo.
Lisboa, dezembro de 2017
Página 6 / 163
CAPÍTULO I - Quando e o que avaliar?
I.1 Por que razão importa avaliar a efetividade?
Para compreendermos a importância em avaliar efetividade, importa antes de mais

compreender o que significa o termo e distinguir o que entendemos por outros
conceitos associados. As definições seguintes não são universais: em função das
escolas de pensamento (e áreas de conhecimento) há interpretações distintas.
Para efeitos deste manual, vamos assumir os seguintes significados, geralmente tidos
como consensuais em diferentes áreas da investigação em saúde.
Eficácia Efetividade Eficiência
Eficácia: Até que ponto uma intervenção, uma medida política, um procedimento, um
regime terapêutico ou um serviço produz um efeito benéfico (desejado), em condições
de implementação ideais. É assim uma medida de benefício ou utilidade para os
indivíduos-alvo. Os desenhos de estudo mais apropriados para estudar a eficácia são
os ensaios clínicos controlados.
Efetividade: Até que ponto uma intervenção, uma medida política, um procedimento,
um regime terapêutico ou um serviço prestado em contexto de vida e prática reais
resulta no que é suposto resultar, numa população específica (“em vida real”). Os
desenhos de estudo mais apropriados para estudar a efetividade são ensaios
randomizados pragmáticos ou estudos de vida real.
Eficiência: Trata-se de um indicador económico, expressando a relação entre os

efeitos e resultados obtidos, em função do esforço/custo investido (dinheiro, tempo, ou
outros recursos). Ou seja, até que ponto os recursos utilizados numa determinada
intervenção, procedimento, serviço ou política (de saúde, educacional, ou outra), já
conhecidos como sendo eficazes e efetivos, são minimizados.
Página 7 / 163
Os três conceitos – eficácia, efetividade e eficiência – expressam graus diferentes de

maturidade do conhecimento entre causa e efeito (mais concretamente, entre as
ações em estudo e os efeitos que resultam das mesmas). Esta maturidade pode ser
expressa da seguinte forma:
Eficácia  Efetividade  Eficiência
Só faz sentido avaliar a efetividade quando a eficácia está assegurada. E só faz

sentido avaliar eficiência quando a eficácia e a efetividade de uma determinada ação
estão asseguradas e são bem conhecidas.
Por exemplo:
 Sabe-se que a dessensibilização sistemática é uma intervenção eficaz para o
tratamento de fobias simples. Em condições ideais, resulta na maior parte dos casos.
Resulta em pacientes que sejam recetivos à intervenção, sem comorbilidades e sem
patologias do eixo II (distúrbios da personalidade), com um terapeuta experiente a
executar a técnica. Isto foi já confirmado em diversos estudos, nomeadamente com
ensaios clínicos controlados randomizados.
 Assim, importa saber como é que a técnica funciona no “mundo real”. Ou seja, até
que ponto é efetiva: até que ponto a técnica de dessensibilização sistemática resulta
na prática clínica do dia-a-dia (e em função de contextos diferentes – caraterísticas e
estilos de intervenção dos psicoterapeutas, caraterísticas clínicas e pessoais dos
doentes, caraterísticas dos consultórios particulares, organização dos centros de
saúde, hospitais)?
O sucesso da técnica na vida real depende de vários fatores: o desempenho
competente por parte do psicoterapeuta, a adesão dos pacientes à intervenção até
que o efeito da mesma seja maximizado, a severidade da fobia, características da
personalidade do paciente, elementos stressores, apoio por parte de familiares, etc.
 Se a efetividade está garantida (i.e., com elevados níveis de sucesso em “consulta

real” e com satisfação por parte dos pacientes), importa medir o custo associado, ou
seja a eficiência: quantas consultas são necessárias, em média? Quanto tempo até o
nível de perturbação psicológica ser substancialmente reduzido e até que o paciente
se sinta mais funcional? Até que ponto esta intervenção é económica quando
comparada com outra abordagem terapêutica também reconhecidamente efetiva
Página 8 / 163
(terapias dinâmicas, terapia familiar, etc.).
O estudo destes conceitos, eficácia, efetividade e eficiência, implica obviamente a

definição prévia de indicadores de sucesso. Vamos abordar este assunto mais à
frente.
I.2 Em que contextos importa avaliar a efetividade?
Faz sentido avaliar efetividade quando existe conhecimento suficiente para se

considerar que, em contexto de vida real, uma determinada intervenção tem um efeito
potencial.
No dia-a-dia dos psicólogos, em contextos clínicos, educacionais, organizacionais,
forenses, desportivos (só para nomear alguns), raramente se aplicam “técnicas puras”
(cuja eficácia já tenha sido demonstrada por estudos experimentais, como por
exemplo, ensaios controlados randomizados). Nestes casos, importa demonstrar a
efetividade do trabalho realizado e, eventualmente, a sua eficiência (custo-benefício).
Exemplo prático
Qual a efetividade de intervenções de promoção de saúde mental em contexto

laboral?
Indicadores de efetividade podem ser: baixas médicas, absentismo, presenteismo,
produtividade laboral, prevalência de depressão entre funcionários.
Exemplo prático
Qual a efetividade de um determinado sistema de reforço em contexto laboral?

Indicadores de efetividade podem ser: produtividade laboral, criatividade dos
funcionários, satisfação profissional, burnout.
Página 9 / 163
Exemplo prático
Qual a efetividade de intervenções psicoterapêuticas em casos de ansiedade ou

depressão?
Indicadores de efetividade podem ser: consumo de benzodiazepinas e/ou
antidepressivos, prevalência de suicídios
Exemplo prático
Qual a efetividade de intervenções psicoeducativas em contexto de gestão de

doença? Indicadores de efetividade podem ser: Adesão a comportamentos associados
a controlo da doença (atividade física, dieta saudável, adesão aos fármacos, …),
variáveis fisiológicas (nível glicémico, tensão arterial, …).
Exemplo prático
Qual a efetividade de uma medida de saúde pública, na área da saúde mental?

Indicadores possíveis são: adesão a comportamentos salutogénicos (atividade física,
dieta saudável, adesão aos fármacos, …), acessibilidade a cuidados de saúde na área
da saúde mental, prevalência de comportamentos desviantes ou de problemas de
saúde mental.
Página 10 / 163
I.3 Avaliação de efetividade: definição de pergunta, objetivos e hipóteses de

investigação
I.3.1 Pergunta de investigação

É comum haver alguma dificuldade em perceber a utilidade e as diferenças entre
perguntas, objetivos e hipóteses de investigação. Nesta secção explicam-se as
diferenças entre estes termos (e a sua utilidade).
De uma forma geral, à medida que avançamos entre os termos (da pergunta para os
objetivos e dos objetivos para as hipóteses), estamos a operacionalizar cada vez mais
(ou seja, a tornar cada vez mais claro) a forma como se prevê que as variáveis em
estudo se associem umas com as outras.
Como definir uma pergunta de investigação?

O primeiro passo para se fazer um estudo de natureza científica é definir a pergunta
de investigação.
“ Durante anos perguntei “Qual é a resposta certa?”. Agora procuro saber

“Qual é a pergunta certa?”
- Katherine Thanas, 2005 -
Uma pergunta de investigação representa uma incerteza relativamente:
 à população em estudo
 ao fenómeno em estudo:
 descrição de um conceito, como por exemplo depressão, ansiedade,
satisfação profissional, etc. relação entre variáveis)
 relação entre duas ou mais variáveis
 efeito de uma intervenção
Página 11 / 163
Uma pergunta de investigação pressupõe também que a sua resposta seja passível
de ser dada através de métodos sistemáticos que sejam reconhecidos pela
comunidade científica como adequados. Ou seja, métodos que sejam:
 objetivos (ou seja, isentos da interpretação não sustentada em observação de

dados);
 válidos (ou seja, baseados em procedimentos e instrumentos de medição

reconhecidos como adequados pela comunidade científica); e
 replicáveis (outros investigadores utilizando os mesmos métodos com populações

equivalentes encontram os mesmos resultados) ou passíveis de refutação (outros
investigadores, utilizando métodos e procedimentos científicos similares ou mais
adequados podem encontram resultados distintos, demonstrando que o
conhecimento anterior era incompleto ou não totalmente correto).
Critérios de uma boa pergunta de investigação
CRITÉRIOS FINER
A pergunta deve ser passível de ser respondida através de métodos

científicos e com os recursos disponíveis em termos de:
 acesso aos dados necessários para o estudo
Exequível (Feasible)  custo financeiro
 tempo disponível
 recursos humanos
A pergunta deve ter interesse científico, não apenas para o próprio

investigador mas também para outros interlocutores (comunidade
Interessante
científica, empresários, investidores, políticos, etc.).
A pergunta deve apresentar algum elemento de novidade.
Nova
O que tem de novo?
Página 12 / 163
 Um conceito novo?
 Recorre a uma nova técnica de avaliação?
 Implica o estudo de uma população ainda não estudada

relativamente ao fenómeno em questão?
 Estuda a associação entre variáveis ainda não relacionadas?
Os métodos para estudar a pergunta devem garantir os princípios da

ética em investigação, com animais ou humanos. Mais à frente, neste
capítulo, são discutidos alguns aspetos éticos relevantes para os estudos
de avaliação de efetividade. Para já, importa destacar que a pergunta de
investigação deve garantir os seguintes princípios:
Ética  Princípio da não-maleficência
 Princípio da beneficência
 Princípio da justiça
 Princípio da autonomia
Para além de ser interessante e nova, a pergunta deve ser relevante. Ou

seja, os resultados expectáveis devem ter algum tipo de utilidade:
 Permite avançar o conhecimento científico?
Relevante
 Permite melhorar intervenções (clínicas, educacionais,
organizacionais)?
 Permite definir políticas mais adequadas ou justas?
CRITÉRIOS PICOT
Para além dos critérios FINER, que se referem a aspetos da qualidade da pergunta de
investigação, há aspetos mais operacionais que devem ser tidos em conta para a
formulação de boas perguntas de investigação na área da avaliação de efetividade.
A sigla PICOT resume aspetos que são muito relevantes e que ajudam a formular uma
boa pergunta de investigação. Estes aspetos (ou dimensões) devem ser adaptados a
Página 13 / 163
cada pergunta, pelo que é raro uma pergunta reunir todos os aspetos PICOT.
A pergunta deve identificar a população em estudo. Qual a população de

interesse? Por exemplo:
 Crianças
 Adultos
 Idosos
População  Mulheres
 Homens
 Pessoas com depressão major
 Estudantes universitários
 Empregados de balcão
A pergunta deve incluir informação sobre aspetos relacionados com a

ação, intervenção, medida política ou serviço em estudo. Por exemplo:
 Treino de competência interpessoais
Intervenção (ou  Treino de assertividade

ação, ou
 Intervenção psicanalítica
medida, ou
serviço)
 Avaliação neuropsicológica
 Treino imagético
 Mindfulness
Se se tratar de um estudo controlado (que inclui um grupo para

comparação dos resultados), o ideal será que a pergunta indique a
principal característica desse grupo (o que a distingue do grupo de
Grupo de intervenção):
Controlo
 Sem treino de competência interpessoais
 Sem treino de assertividade
Página 14 / 163
 Com intervenção cognitivo-comportamental (por oposição a

intervenção psicanalítica)
 Sem treino imagético
 Sem treino de mindfulness
Qual o indicador utilizado para medir sucesso ou grau de efeito da

intervenção? Por exemplo:
 Resultados escolares (matemática, português, ...)
Outcome  Assiduidade
(indicador de
resultado)  Absentismo
 Controlo glicémico
 Prevalência de suicídio
Durante quanto tempo é que os indivíduos estudados devem ser

observados, para se poder concluir quanto ao sucesso ou grau de efeito
Tempo
da intervenção?
Exemplos de (boas) perguntas de avaliação de efetividade

Qual o efeito da prática de um (determinado) videojogo no atraso de declínio cognitivo
e na promoção de autonomia em doentes com défice cognitivo ligeiro?
Quais as características e funcionalidades de hortas comunitárias com maior potencial

de promoção de comportamentos salutogénicos, na população idosa da cidade de
Lisboa?
Qual o efeito de intervenções promotoras de autocontrolo cognitivo em crianças com 7

anos nos resultados escolares?
Qual o efeito de treino de relaxamento muscular progressivo em mulheres que sofrem

de ansiedade social?
Página 15 / 163
Fontes de boas perguntas de investigação

Experiência, conhecimento, necessidade. Como é óbvio, quanto mais conhecemos um
assunto, mais fácil é formular perguntas interessantes e relevantes.
Vivemos um contexto de conhecimento e práticas baseadas na evidência (evidence-
based psychology, evidence-based medicine, evidence-based politics, etc.). É
importante desenvolver a cultura de demonstração de evidência quanto ao efeito do
trabalho dos psicólogos. Nesse sentido, é natural e relativamente fácil definir
perguntas que apontem para a avaliação de práticas na área da psicologia.
Para quem começa…
 Editoriais de revistas científicas. São geralmente artigos de opinião, escritos

por investigadores experientes e com uma perspetiva alargada sobre uma
determinada área de conhecimento
 Revisões de literatura (revisões narrativas, revisões sistemáticas, meta-

análises [ver capítulo 3]
 Normas orientadoras da prática (clínica, educacional, …)
 Congressos, seminários, ...
 Supervisões, intervisões
 Pontes entre áreas ou disciplinas diferentes: muitas perguntas com novidade e

interesse resultam da integração de áreas diferentes do conhecimento: psicologia
clínica com economia, psicologia com antropologia ou sociologia, práticas
educativas com neurociência, psicologia cognitiva com inteligência artificial, etc.
I.3.2 Objetivos de investigação

Os objetivos de um estudo científico devem/permitem:
 Operacionalizar a pergunta de investigação. Ou seja, os objetivos devem

identificar de forma mais evidente as variáveis em estudo. Uma pergunta de
investigação deve ser desdobrada em tantos objetivos quanto necessário, de
forma a garantir que são estudados todos os aspetos relevantes, para se dar
resposta à pergunta
Página 16 / 163
 Definir a relação entre variáveis. Por exemplo, os objetivos definem se uma

variável deve ser considerada como preditora de outra ou se deve ser considerada
como variável dependente (ou efeito) de outra, se uma variável é uma variável
moderadora ou mediadora de outras, etc. Mais à frente, no Capítulo 6, vamos ver
com mais detalhe o que entendemos por estas tipologias de variáveis
 Apoiar a decisão estatística: a definição de objetivos permite antever o tipo de

análise estatística (quando se trata de dados numéricos) ou de análise de
conteúdo (no caso de dados verbais, qualitativos) que se prevê realizar.
Objetivos e finalidades
Os objetivos de um estudo referem-se àquilo que vai ser possível estudar, visando
uma conclusão sobre o que vai ser observado e à maneira como as variáveis em
estudo se relacionam.
Exemplo de definição de objetivo de um estudo:

Avaliar o efeito promotor de saúde mental de uma intervenção comunitária
psicoeducativa sobre saúde mental em indivíduos desempregados.
A finalidade de um estudo refere-se à utilidade do estudo numa perspetiva mais

abrangente. No final de tudo, qual o contributo que o estudo representa em termos
clínicos, educacionais, políticos, societais, éticos, etc.?
Exemplo de definição de finalidade de um estudo:

O estudo visa contribuir para a identificação de intervenções curtas e sustentáveis, em
contexto comunitário, de promoção de saúde mental em contexto de desemprego.
Os objetivos podem ser definidos em termos de objetivos gerais e específicos.

Utiliza-se esta dicotomia quando é possível ter um objetivo científico amplo, que se
pode depois desdobrar em partes ou em detalhes. Por exemplo, o objetivo geral pode
ser definido para a população em geral e os objetivos específicos podem ser definidos
para grupos específicos (por sexo, por grupos etários, etc.).
Além desta distinção, podemos ainda definir os objetivos em termos de objetivos
principais e secundários. Utiliza-se esta dicotomia quando existem objetivos
Página 17 / 163
prioritários (a investigação tem mesmo de dar resposta a este objetivo) e quando

existem objetivos secundários (um “já agora” mas que seja também ele relevante).
Exemplos de objetivos
Objetivo geral
Avaliar o impacto do treino de competências interpessoais na comunicação de más
notícias, em contexto hospitalar, em termos de burnout profissional.
Objetivos específicos
Avaliar a adesão a treino de competências interpessoais por profissionais de saúde a
trabalhar em contexto hospitalar.
Avaliar o impacto do treino de competência interpessoais na comunicação de más
notícias em termos de burnout profissional, por especialidade dos profissionais de
saúde.
Exemplos de objetivos
Objetivos principais
Estimar a prevalência de ansiedade social em adultos (18+ anos) residentes em
Portugal continental.
Objetivos secundários
Caracterizar estratégias individuais de coping com sintomatologia ansiosa.
Identificar determinantes ambientais da ansiedade, em contexto urbano.
Caracterizar perfis de pacientes com ansiedade.
I.3.3 Hipóteses de investigação

As hipóteses de investigação servem para concretizar os objetivos, em termos mais
“matemáticos”. Ou seja, através da formulação das hipóteses, deve ser possível
antever o tipo de relação que é esperado entre as variáveis em estudo.
Página 18 / 163
Enquanto os objetivos indicam o que se vai fazer e sugerem de imediato os métodos

que vão ser utilizados (para recolha e análise dos dados), as hipóteses permitem
antever o tipo de relação esperada entre as variáveis (igualdades, desigualdades, …).
As hipóteses devem ser elaboradas tendo em conta alguns princípios:
Clareza conceptual: as hipóteses devem ser formuladas através de afirmações
declarativas e no tempo presente.
Objetividade: as hipóteses devem operacionalizar de forma clara as variáveis (por
exemplo, com indicação do instrumento de medição utilizado, unidades de medida,
etc.).
Especificidade (explicitação da relação previsível entre variáveis): As hipóteses
permitem antever a equação entre as variáveis (igualdade, diferença, ser maior ou
menor, etc.).
Exemplos de hipóteses
H0: Não existe diferença significativa no peso corporal entre homens e mulheres.
H1: O peso corporal dos homens é significativamente mais elevado do que o peso
corporal das mulheres.
Exemplos de hipóteses
H0: A altura corporal das mulheres adultas (18+ anos) portuguesas não é inferior à
altura corporal dos homens adultos (18+ anos) portugueses.
H1: A altura corporal dos homens é significativamente mais elevada do que a altura
corporal das mulheres.
I.3.4 Outcomes: indicadores para a avaliação

O que entendemos por outcomes? Para monitorizarmos ou avaliarmos o efeito de uma
ação qualquer (uma intervenção clínica, educacional, organizacional, um programa ou
plano de saúde, um serviço) temos de ter critérios objetivos e, de preferência, valores
Página 19 / 163
de referência que nos permitam definir se o sucesso foi ou não atingido.

Entende-se por outcome ou indicador um sinal de que alguma coisa aconteceu ou é
verdade. Os indicadores são usados para demonstrar a presença ou ausência de uma
determinada situação ou condição (por exemplo, melhoria da situação de saúde,
sucesso da intervenção, etc.). No contexto de monitorização ou avaliação de uma
ação, um indicador consiste numa métrica quantitativa que fornece informação
relativamente ao desempenho de uma determinada ação, sendo assim possível obter
dados sobre a qualidade dessa ação, projeto ou programa.
Um bom indicador deve ser:
 Simples de interpretar. Deve focar apenas um aspeto de qualidade e a sua

interpretação deve ser simples de fazer
 Relevante. Deve dar informação sobre um aspeto de qualidade que seja

importante ou estratégico (permitindo uma tomada de decisão sobre se houve ou
não efeito, melhoria, ou agravamento da situação)
 Exequível. Um bom indicador deve ser mensurável com a regularidade

adequada. Por exemplo, recorrer a exames imagiológicos para avaliar um efeito
pode ser relevante mas nem sempre é exequível (nomeadamente se for
necessário avaliar o efeito da intervenção através de um grande número de
pessoas e várias vezes ao longo do tempo).
Um bom indicador deve ter as seguintes características (pelo menos):
 Válido: deve medir aquilo que pretende medir
 Fidedigno/confiável. Os resultados devem ser os mesmos em medições

repetidas, pressupondo que não é provável que tenha havido alteração real (por
exemplo, utilizando uma balança que mede o peso corporal de um indivíduo, com
um intervalo de 10 minutos)
 Sensível à mudança.
Tipos de indicadores
Os indicadores podem ser classificados em diferentes tipos, também dependendo dos
modelos teóricos ou de referência que são utilizados. Para simplificar, podem ser
Página 20 / 163
considerados três tipos principais:
 Indicadores de processo: métricas sobre a execução do que estava planeado

(número de reuniões, número de consultas, número de visitas a um site, etc.)
 Indicadores de resultado (outcome): métricas sobre efeito atingido, o que foi

alcançado com a intervenção (valor da redução de custos em cuidados de saúde,
taxas de mortalidade, valor obtido numa escala de avaliação psicológica, número
de dias sem fumar, nível glicémico, dias de absentismo, resultados escolares, etc.)
 Indicadores de estrutura: existência de recursos humanos, existência de

espaços adequados para atendimento psicológico, etc.
I.4 Avaliação de efetividade: aspetos éticos a ter em conta
Já nos referimos brevemente a alguns aspetos éticos importantes, ao definirmos uma

pergunta de investigação. Vamos agora detalhar um pouco melhor esses aspetos.
Página 21 / 163
I.4.1 Princípios éticos
Princípios da não-maleficência e da beneficência

Refere-se à maximização dos benefícios em relação aos riscos da investigação. A
segurança dos participantes é prioritária (de acordo com o princípio geral de “first, do
no harm”).
Princípio da justiça
Os critérios de inclusão do estudo devem garantir o mais possível a equidade no
acesso à participação no estudo (de acordo com os critérios de inclusão e aspetos de
amostragem que se definam). Além disso, devem determinar, de forma transparente,
as características dos indivíduos que podem beneficiar com a intervenção.
Princípio da autonomia
Respeito pela autonomia individual e necessidade de obtenção de consentimento livre,
esclarecido e informado. Ou seja, os participantes devem ter liberdade total para
decidir quanto a participar ou não participar no estudo, sem quaisquer consequências
(por exemplo, o curso natural de terapia não deve ser alterado em caso de recusa).
A execução de qualquer projeto de investigação, com animais ou humanos, implica

uma apreciação dos aspetos éticos já referidos. De facto, mesmo perguntas
aparentemente não invasivas podem implicar algum efeito (cognitivo, emocional,
comportamental) nos participantes. Dito de outra forma, não existem estudos que não
tenham impacto na vida das pessoas que são convidadas para participar nos estudos.
Estudos de avaliação de eficácia ou efetividade são ainda mais delicados porque o
que se está a verificar é o efeito de uma intervenção, sempre com potencial de
agravamento da condição inicial (não há intervenções totalmente isentas de efeitos
adversos).
De forma a garantir neutralidade e intersubjetividade (ou seja, uma objetividade
partilhada de forma consensual por um grupo de peritos), os aspetos éticos devem ser
apreciados por grupos de especialistas, comissões éticas, formalmente constituídos
para o efeito.
Em contexto académico, os protocolos de investigação devem ser submetidos a
Página 22 / 163
apreciação pela Comissão de Ética da instituição promotora do estudo. Existem ainda

organizações não académicas que também têm comissões de ética, como por
exemplo, instituições militares, instituições empresariais, instituições de saúde,
instituições de ensino não universitário, etc. Qualquer estudo feito nesses contextos
deverá também ser submetido às respetivas comissões de ética.
Por exemplo, um estudo de efetividade clínica com recolha de dados em contexto
hospitalar (com doentes ou ex-doentes) implica não apenas a apreciação de uma
eventual Comissão de Ética académica (por exemplo, de uma faculdade) mas também
o parecer da Comissão de Ética do hospital em causa.
Se se tratar de recolher dados de utentes de cuidados de saúde primários, são as
Comissões de Ética das Administrações Regionais de Saúde que devem ser
consultadas.
I.4.2 O que são dados pessoais?

Entende-se por “dados pessoais” informação de qualquer natureza e
independentemente do respetivo suporte, incluindo som e imagem, relativa a uma
pessoa singular identificada ou identificável («titular dos dados»). É considerada
identificável a pessoa que possa ser reconhecida de forma direta ou indireta,
designadamente por referência a um número de identificação ou a um ou mais
elementos específicos da sua identidade física, fisiológica, psíquica, económica,
cultural ou social;
Art. 3º - Lei n.º 67/98 de 26 de Outubro – Lei da Proteção de Dados Pessoais
E o que são dados pessoais sensíveis? Trata-se aqui de convicções filosóficas ou

políticas, filiação partidária ou sindical, fé religiosa, vida privada e origem racial ou
étnica, saúde e vida sexual, ou dados genéticos.
Existem, contudo, algumas situações de exceção (de acordo com disposição legal ou
autorização da Comissão Nacional de Proteção de Dados), que dispensam a
apreciação prévia (à recolha de dados) de Comissões Éticas Legais e/ou que
promovem o parecer positivo por parte destas entidades:
 quando o interesse público é manifestamente importante
 em caso de interesses vitais dos titulares
Página 23 / 163
 em contexto de processo judicial
 havendo consentimento do titular
Assim, a recolha e o tratamento dos dados referentes à saúde e à vida sexual,

incluindo os dados genéticos, é permitido quando for necessário para efeitos de
medicina preventiva, de diagnóstico médico, de prestação de cuidados ou tratamentos
médicos ou de gestão de serviços de saúde, desde que o tratamento desses dados
seja efetuado por um profissional de saúde obrigado a sigilo ou por outra pessoa
sujeita igualmente a segredo profissional, seja notificado à CNPD, (…), e sejam
garantidas medidas adequadas de conservação/segurança da informação.
Art. 7º - Lei n.º 67/98 de 26 de Outubro – Lei da Proteção de Dados Pessoais
Para além da apreciação ética, qualquer estudo feito em Portugal que implique recolha
de dados com humanos deve ser autorizado pela Comissão Nacional de Proteção de
Dados (https://www.cnpd.pt/).
A direção das instituições onde os dados são recolhidos (por exemplo, direção clínica
de uma unidade de saúde familiar, direção de uma escola do ensino básico ou
secundário) deve também autorizar formalmente a execução do estudo.
Por fim, os próprios participantes (ou representantes legais, no caso de menores ou de
pessoas com incapacidade de decisão) devem demonstrar também formalmente que
estão de acordo com a participação. Para o efeito, deverão ler e assinar um
documento de consentimento informado e esclarecido (pelos investigadores), onde
são explicados de forma simples os objetivos e procedimentos do projeto de
investigação, garantindo-se também o caráter voluntário da participação.
No Anexo I é apresentado o exemplo de um consentimento informado de um estudo

sobre a efetividade de um programa de promoção da saúde mental em situações
laborais precárias ou de desemprego.
Mais informação sobre aspetos éticos:

Convenção dos Direitos Humanos (Conselho Europa, 1997) – Declaração de
Página 24 / 163
Helsínquia (Associação Médica Mundial):

https://www.wma.net/policies-post/wma-declaration-of-helsinki-ethical-principles-for-
medical-research-involving-human-subjects/
International Ethical Guidelines for Biomedical Research Involving Human Subjects
(CIOMS, 2002)
International Ethical Guidelines for Epidemiological Studies (CIOMS, 2008-2009):
http://www.ieaweb.org/index.php?option=com_phocadownload&view=category&id=3
&Itemid=34
Good Epidemiological Practice (GEP) Proper Conduct in Epidemiological Research.
(International Epidemiological Association, 2007):
http://www.ieaweb.org/index.php?option=com_content&view=article&id=15&Itemid= 43
Página 25 / 163
CAPÍTULO II - Escrita de métodos para avaliação de efetividade
Um bom projeto de investigação, em qualquer que seja a área, começa pela escrita de
um protocolo.
O protocolo tem múltiplas funções e objetivos. E deve, acima de tudo, cumprir a
função de organizar as ideias dos próprios investigadores, garantindo que o plano de
ação que está a ser traçado faz sentido do ponto de vista científico, é original,
interessante e ético.
Assim sendo, um protocolo deve cumprir a função principal de partilhar uma ideia
congruente e exequível com revisores científicos que não só dominam as ferramentas
científicas como também são peritos nas áreas de conhecimento que estão a ser
tratadas nesse documento.
No Anexo II é apresentado um exemplo de protocolo de investigação, publicado em

revista científica.
II.1 Por que razão importa escrever o protocolo?

São vários os contextos e objetivos específicos da escrita de um protocolo de
investigação:
 Como documento estruturante da investigação (roadmap do estudo), tratando-

se neste caso de um plano de ação e recordatória dos passos a seguir, para os
próprios investigadores
 Para obter feedback de pares (outros investigadores, académicos, professores,

colegas). Neste contexto, é frequente apresentar-se o protocolo em congressos
científicos, para recolher opiniões relevantes antes de iniciar o estudo
 Para candidatura a cursos académicos (mestrados, doutoramentos, pós-
Página 26 / 163
doutoramentos)
 Para convidar outros investigadores, parceiros de investigação (outras

faculdades, empresas, etc.) ou supervisores de investigação (orientadores de
mestrado)
 Para obter financiamento (por exemplo, através da Fundação para a Ciência e

a Tecnologia/FCT, através de fundos europeus, através de uma bolsa de
investigação atribuída por uma empresa privada, etc.)
 Para submeter a comissões éticas ou legais (incluindo plataformas de registo

de estudos)
 Para concorrer a prémios científicos.
II.2 Escrita de protocolos de investigação

Os protocolos de investigação são documentos que devem ser partilhados, de forma a
obter crítica, preferencialmente através da publicação em revistas científicas.
Projetos que implicam avaliação de efeito de uma intervenção (ensaios clínicos,
projetos de intervenção com ou para avaliação de efetividade) e projetos de revisão de
literatura devem ser registados em plataformas públicas (de âmbito internacional) que
existem para o efeito. É cada vez mais um critério exigido pela comunidade científica.
Muitas revistas científicas recusam-se a publicar artigos que descrevam o protocolo de

um estudo de avaliação de efetividade sem que o estudo tenha sido registado (antes
de ser iniciado) numa dessas plataformas.
Exemplo de plataformas de registo de protocolos de investigação (na área da saúde):
 Em Portugal: http://www.rnec.pt/pt_PT
 Na União Europeia: https://www.clinicaltrialsregister.eu/
 No Brasil: http://www.ensaiosclinicos.gov.br/
 Nos EUA: https://register.clinicaltrials.gov/
 International Clinical Trials Registry Platform (ICTRP), da OMS:

http://www.who.int/ictrp/en/
Página 27 / 163
Mas o que é que os revisores valorizam, num protocolo? Existem vários aspetos que
devem ser tidos em conta:
 Qual é o tema do estudo? Que variáveis estão em estudo? Há novidade?

Responde a uma necessidade de conhecimento atual?
 Quem lidera e quem está envolvido no projeto (autores, instituição, parceiros)?
 Quais os métodos utilizados?
 O estudo é exequível, em termos de tempo, equipamentos necessários,

financeiros, de recursos humanos (as competências necessárias estão
garantidas)?
 Os aspetos éticos estão salvaguardados?
 E, aspeto fundamental!, há consistência entre a pergunta de investigação, os

objetivos de investigação, os métodos utilizados e a estratégia prevista de
divulgação dos resultados?
 O estudo segue a estrutura (e regras) definidas, no contexto do concurso para

financiamento, candidatura académica, etc.
Habitualmente, um protocolo de investigação segue a seguinte estrutura:
Título
Autores (com indicação de afiliação – a que instituição ‘pertencem’?)
Resumo (de preferência, com indicação, no final, de palavras-chave)
Introdução (ou enquadramento) teórica
Objetivos e hipóteses do estudo
Métodos
Resultados esperados
Aspetos éticos e deontológicos
Cronograma
Página 28 / 163
Contexto de execução do projeto (instituição, supervisão, etc.)
Equipa de investigação (com evidenciação das especialidades/competências
científicas envolvidas)
Orçamento, com indicação de eventuais fontes (adicionais/parciais) de
financiamento
Referências bibliográficas
Anexos:
 Mapa conceptual (espelhando a relação entre as variáveis)
 Sinopse de revisão de literatura já feita, etc.
 Esquema de procedimentos para recrutamento de participantes e/ou recolha de
dados
 Instrumentos de medição/avaliação
 Autorizações legais e/ou pareceres éticos (se já existirem)
 Documentos de consentimento informado
 Curriculum Vitae do investigador principal e/ou da equipa de investigação
A escrita de um protocolo científico deve seguir o estilo habitual de redação em

ciência, comum à escrita de artigos ou de outros documentos científicos.
O estilo pode variar em função da abordagem de investigação, e muito em particular
em função de se tratar de uma abordagem qualitativa ou quantitativa. Só para ilustrar
uma diferença habitual: enquanto em contexto de investigação qualitativa é frequente
utilizar-se a primeira pessoa do singular (o “Eu”) ou do plural (o “Nós”), em
investigação quantitativa é mais adequado utilizar-se formas que tornam o discurso
mais impessoal (por exemplo, “fez-se”, “os dados foram recrutados por…”).
Os princípios gerais da escrita de um protocolo são:
 Neutralidade
 Objetividade (ou melhor dito, a intersubjetividade)
 Rigor, no sentido de não ambiguidade do discurso
Página 29 / 163
 Descrição dos métodos suficientemente detalhada para garantir que outros

investigadores possam reproduzir o estudo
 Respeitar as normas adotadas pelo contexto-alvo do protocolo: manuais de

estilo da APA, Vancouver, etc.
A estes princípios deve juntar-se um aspeto fundamental da boa escrita: o texto deve
estar pensado para que o leitor compreenda de forma fácil e adequada as ideias
centrais que se pretende partilhar. Isto implica haver boa ligação entre as ideias,
nomeadamente através do uso de frases de ligação (dar ao leitor um fio condutor
permanente).
Uma dica é seguir o estilo KISS: Keep It Simple and Short, com parágrafos curtos
(idealmente, com um máximo de 125 palavras), começar-se do geral para o particular,
ter um parágrafo por tópico/ideia, com frases (idealmente, até 15 palavras) e palavras
curtas (por exemplo, “usar” vs. “utilizar”). O uso de abreviaturas só faz sentido se
forem utilizadas muitas vezes, ao longo do texto (pelo menos cinco vezes, num texto
com duas páginas). As abreviaturas, mesmo que muito conhecidas (como USA, OMS,
DSM-5, IMC) não devem ser usadas sem serem apresentadas por extenso, da
primeira vez que são utilizadas (por exemplo, “um estudo feito nos Estados Unidos da
América (USA) mostrou que...”).
II.2.1 Título
O título do protocolo é um elemento central do mesmo. É obviamente o elemento do
protocolo que vai ser lido por mais pessoas e é fundamental para os motores de
pesquisa eletrónicos. Portanto, é determinante para a promoção da visibilidade do
documento.
Deve, de forma sucinta (idealmente, no máximo, 12 palavras, 100 carateres, sem
abreviaturas, sem palavras “vazias”, como por exemplo, “Estudo sobre”):
 Descrever o problema
 Ser simples de ler
 Ser conciso, específico, focado
 Ser apelativo (capaz de chamar a atenção), podendo ser provocador mas não
Página 30 / 163
sensacionalista
II.2.2 Autores
A autoria de protocolos (o mesmo se aplica, obviamente, à autoria de qualquer
documento) deve ser acordada o mais cedo possível (muito antes de escrever o
documento). Os critérios de autoria a utilizar em protocolos devem ser os mesmos que
são habitualmente considerados como adequados (e éticos) para a escrita de artigos
científicos. É importante ter em conta que um protocolo é um plano de ação, um
compromisso, com o que vai ser feito. Portanto, as questões de autoria são
fundamentais pois comprometem os autores quanto ao que irá ser feito (com
eventuais aspetos legais implícitos).
Critérios de autoria
 Teve responsabilidade intelectual pelo artigo
 Gerou conteúdo intelectual (design, execução, análise dos dados)
 Escreveu ou fez revisão crítica do artigo
 Pode/consegue defender o conteúdo do artigo
 Está disponível para assumir erros / responsabilidades
Quem teve (ou terá) apenas uma contribuição técnica (apoio à pesquisa de literatura,
recolha de dados, inserção de dados, transcrição de entrevistas, etc.) não deverá ser
autor do protocolo. Na maior parte dos contextos em que se apresentam protocolos de
investigação, é necessário identificar o investigador principal. No caso de contextos
académicos (por exemplo, para efeito de candidatura a cursos de mestrado ou
doutoramento), o investigador principal é o aluno candidato, devendo ser identificados
o ou os docentes que vão orientar o processo de investigação, bem como outros
elementos envolvidos na equipa. No caso de candidaturas para financiamento (por
exemplo, para a Fundação para a Ciência e a Tecnologia / FCT), é habitual ser
obrigatório identificar o investigador principal, os restantes elementos da equipa e, se
existirem, os consultores do estudo.
Página 31 / 163
Para outros efeitos (por exemplo, um protocolo para ser apresentado a uma empresa
privada como potencial financiadora ou empregadora, ...), a ordem dos autores do
protocolo pode ser baseada noutros critérios, também usados na escrita de artigos
científicos – nomeadamente, em artigos científicos sobre os próprios protocolos:
 Ordem alfabética (pouco frequente)
 Importância ou reconhecimento em termos de trabalho desenvolvido (ou seja,

importância percecionada ou negociada pelos membros da equipa)
 O investigador principal como primeiro autor, quem escreve a primeira versão

do protocolo e quem se responsabiliza em primeiro lugar pela versão final do
mesmo
 O investigador responsável pelo departamento ou da unidade de investigação

na última posição (critério de ordem muito frequente no caso de escrita de artigos
científicos). Ou seja, o responsável pela linha de investigação, o “chefe de
orquestra”, aparece no final do elenco dos autores.
Os protocolos devem ainda incluir o autor para efeitos de correspondência

(geralmente o primeiro ou último autor apresentado na lista de autores do protocolo).
Para cada autor, deve ser indicada a afiliação. Ou seja, indicar a que instituição
‘pertence’ cada autor. No caso de o autor ter várias afiliações, deverá indicar a que faz
mais sentido, atendendo ao contexto do projeto de investigação.
Como já referido, quem não tem um contributo relevante para o projeto (definição dos
conceitos em estudo, definição dos métodos, etc.) não cumpre os critérios de autoria
do protocolo.
No entanto, deve constar na secção de agradecimentos, seja por ter dado contributos
intelectuais (por exemplo, revisão do protocolo), por ter feito contributos técnicos
(definição de algum aspeto de avaliação clínica a utilizar, participação na recolha de
dados incluindo avaliação psicológica, implementação da intervenção em estudo, etc.)
ou se o enquadramento institucional ou contributos financeiros assim o justificarem
(também importante para garantir que os eventuais conflitos de interesse seja
declarados de forma explícita).
É obviamente boa prática informar previamente e pedir autorização às pessoas a
quem se quer agradecer. Em alguns contextos, recomenda-se até que esta
autorização para “ser alvo de agradecimento” seja feita por escrito.
Página 32 / 163
II.2.3 Resumo
O resumo de um protocolo (assim como o resumo de um artigo científico) é, a seguir
ao título, a secção que é lida por mais pessoas. Muitas vezes, é a única parte
disponível para o público em geral (sendo o resto do protocolo confidencial ou apenas
disponível apenas mediante a subscrição da revista em que o artigo, com o protocolo,
tenha sido publicado).
Esta secção deve, com poucas palavras (que podem variar entre 250 a 1000, em
função do contexto de submissão), explicar os aspetos centrais do protocolo. Importa
por, isso:
 ser inteligível sem depender do protocolo
 transmitir as principais mensagens do protocolo
 transmitir a importância do protocolo
 ser informativo, não descritivo
Não deve (salvo raras exceções):
 ter abreviaturas
 incluir referências bibliográficas
 incluir ilustrações e equações
 conter (muitos) números
O resumo é relativamente fácil de fazer se for a última parte do protocolo a ser feita.
Aliás, uma sugestão simples é deixar para o final a escrita do resumo, juntamente com
a escrita do título do protocolo.
Na prática, o resumo consiste em uma a três frases de enquadramento/contexto
teórico, uma frase com o(s) objetivo(s) e/ou hipótese(s) do estudo, uma breve
descrição dos métodos (tratando-se de um protocolo, esta deve ser a parte mais
desenvolvida do resumo; se fosse um artigo, a secção dos resultados deveria também
ser uma componente “nobre” do resumo), com uma frase com os principais aspetos
éticos, os resultados expectáveis (focando-se mais na finalidade do estudo, ou seja,
no contributo que o estudo trará em termos científicos, sociais, clínicos, ...) e as
Página 33 / 163
palavras-chave.
No que se refere às palavras-chave, o número máximo pode estar definido à partida
pelo contexto em que será submetido o protocolo. Não sendo o caso, o mais frequente
é serem de três a cinco palavras. Por palavra-chave entende-se aqui um constructo
(conceito teórico). Isto significa que não tem necessariamente de ser apenas uma
palavra. Por exemplo, “Binge-Eating Disorder” é uma palavra-chave única, apesar de
ser composta por três palavras (isto porque a expressão completa designa uma
entidade nosológica bem definida).
Existe uma base de dados de palavras-chave muito conhecida em ciências
biomédicas e que é utilizada por um dos principais motores de pesquisa de artigos: a
PubMed. Trata-se da base de dados MeSH, abreviatura de Medical Subject Headings
e que se encontra em: http://www.ncbi.nlm.nih.gov/sites/entrez?db=mesh.
Uma boa forma de selecionar palavras-chave para o resumo de um protocolo (ou
artigo) é verificar se a palavra-chave em que estamos a pensar pertence a essa base
de dados. Desta forma, garantimos a utilização de um termo reconhecido pela
comunidade científica (e otimizamos as probabilidades de que o protocolo seja
encontrado por quem fizer uma pesquisa através desse termo).
II.2.4 Introdução (enquadramento teórico)

É no enquadramento teórico do protocolo que se explicita a pergunta de investigação,
terminando-se com a afirmação da finalidade do estudo (para que serve, numa
perspetiva mais abrangente da produção do conhecimento?)
O enquadramento teórico descreve avanços/estudos na área, discute
conceitos/modelos teóricos, situa o momento histórico do estudo, justifica o mesmo e
funciona como suporte para a secção seguinte do protocolo, de apresentação dos
objetivos e hipóteses do estudo.
Por essa razão, deve ter a capacidade de prender e esclarecer o leitor. Para o efeito,
deve conseguir salientar o que se sabe mas focando o que falta conhecer, quais as
controvérsias relativamente ao fenómeno em estudo. No fundo, salientar a mais-valia
do estudo e a sua finalidade. O ideal será que o último parágrafo do enquadramento
teórico foque exatamente a finalidade, fazendo a ponte para os objetivos e hipóteses
do estudo (que, no fundo, operacionalizam a finalidade).
Página 34 / 163
A introdução deve ser sustentada na melhor (e, de preferência, mais recente)

evidência científica. Isto significa que as ideias expostas ao longo do enquadramento
teórico devem ser acompanhadas da referenciação aos autores e obras consultados.
Não o fazer constitui uma violação da boa prática, podendo incorrer em situações de
plágio intelectual.
Algumas sugestões práticas:
 As ideias devem ser apresentadas do geral para o particular. Por exemplo, se

queremos fazer um protocolo sobre depressão em contexto de desemprego, uma
possibilidade narrativa será:
 Começar por descrever, de forma abreviada, aspetos gerais sobre o
desemprego em Portugal (taxa de desemprego, evolução ao longo da recente
crise económica, que grupos sociais foram mais afetados, etc.)
 De seguida, fazer a ponte para saúde mental, salientando literatura que
mostre que o desemprego parece estar associado a maior perturbação
psicológica, salientando aspetos como: ansiedade, depressão, suicídio
 Depois, focar em depressão: qual o modelo conceptual que se está a utilizar para
refletir sobre o conceito de depressão (perspetiva cognitivo-comportamental, como
por exemplo a Tríade Cognitiva de Beck, perspetiva de diagnóstico DSM-5, etc.)
 Afunilar o discurso para a relação entre desemprego e depressão: o que se sabe
exatamente? O que falta saber? O que se pretende saber com este estudo?
 Devem evitar-se palavras “fracas”, como: “Neste estudo, vamos tentar

demonstrar” ou “Se nós conseguirmos…”
 Evitar descontinuidades no discurso. As frases de ligação entre ideias são

muito importantes, de forma evitar que o leitor seja forçado a fazer um salto no seu
raciocínio, enquanto lê. É importante garantir que o protocolo seja de leitura mais
simples possível.
 Evitar frases longas e complexas e/ou de sintaxe elaborada. O número de

vírgulas numa frase é indicador da sua complexidade.
 Evitar ser demasiado longo. Tratando-se de um protocolo, o habitual é que a

introdução tenha entre 5 a 10 parágrafos.
 Garantir que o conhecimento relevante (principais autores estudos na área,

principais modelos teóricos, ...) foi todo referido, ao longo do enquadramento
Página 35 / 163
teórico.
Para quem tem mais dificuldade em escrever, uma estratégia possível é a seguinte:
 Identificar os tópicos que importa abordar (uma pequena lista). No fundo, trata-se de
começar a pensar a estrutura interna do texto
 De seguida, ordenar essa lista, do geral para o particular, garantindo também que a
sequência entre ideias faça sentido lógico
 Cada tópico constituirá um parágrafo. Assim sendo, a escrita de cada parágrafo pode
ser feita de forma individual
 Se, ao escrever o parágrafo, surgirem novas ideias associadas, é porque esse

parágrafo pode, provavelmente, ser desdobrado em mais do que um
 Bastará depois fazer frases de ligação entre os parágrafos, para que a leitura seja
fluída.
A referenciação (autores/artigos ou outras fontes citados) pode (ou deve) ser feita de
forma automática. Por exemplo, através de softwares como o EndNote ou o Mendeley
(este último, de acesso gratuito), dos quais vamos falar mais à frente.
II.2.5 Métodos
A palavra “método” significa caminho. Refere-se assim ao caminho que deve ser
percorrido para se conhecer mais sobre o fenómeno em estudo.
Em ciência, a descrição desta secção é determinante para a definição da qualidade do
estudo, devendo cumprir a missão fundamental de explicitar ao leitor sobre como é
que ele (o leitor) deverá fazer se quiser reproduzir o estudo.
A secção dos métodos não deve:
 Apresentar uma descrição e explicação exaustiva de cada método ou técnica

que vai ser utilizada. Ou seja, se dizemos que vamos utilizar uma amostra
aleatória, não faz sentido explicar de forma detalhada em que é que consiste uma
amostra aleatória. Só faz sentido explicar com maior detalhe um determinado
método ou técnica de investigação se esse método é pouco conhecido e/ou se o
seu uso naquele contexto não é muito frequente (ou seja, é pouco ortodoxo)
Página 36 / 163
 Trata-se da secção dos ”Métodos”, e não de um tratado de “Metodologia”. Daí

que seja menos correto usar o termo “Metodologia” (que significa
estudo/conhecimento sobre métodos), como é frequente ver, para esta secção do
protocolo. O título correto para esta secção é, de facto, “Métodos”, no sentido de
“caminhos previstos” (ou ”caminhos feitos”, quando se trata de um artigo)
 Repetir informação teórica (isto deverá ser abordado antes, na secção do

enquadramento teórico)
 Discutir limitações do estudo (isto será abordado na secção de “resultados

expectáveis”)
 Apresentar resultados. Apesar de ser frequente ver-se na secção dos métodos,

em artigos submetidos para publicação (ou seja, já com o estudo feito e havendo
resultados para partilhar), dados sobre a caracterização da amostra, isto não é
correto. Do ponto de vista da estrutura de escrita científica: a caracterização da
amostra (por exemplo, quantas pessoas participaram, quantos homens e quantas
mulheres, entre que idades, etc.) já é um resultado do estudo e, assim sendo, é
informação que deve constar da secção dos resultados (em vez de da secção dos
métodos).
O capítulo dos métodos desdobra-se em diferentes subsecções. Esta estrutura interna

dependerá em muito da área de investigação (nomeadamente, se estamos em
contexto de investigação experimental, em contexto de investigação clínica, ou de
investigação epidemiológica). Vamos aqui referirmo-nos à estrutura habitual em
contexto de estudos de avaliação de efetividade.
Desenho de investigação
A descrição do desenho do estudo é geralmente acompanhada pela descrição do
método de recolha de dados. Por exemplo, se se trata de recolha de dados através de
entrevista face-a-face ou através de questionário autoadministrado.
No Capítulo 6 vamos abordar os desenhos de estudo com maior detalhe. Para já, e
para compreender o que deve ser escrito nesta subsecção de desenho de
investigação (dentro da secção dos métodos), importa apenas perceber qual o
posicionamento do investigado quanto ao objeto/fenómeno em estudo. De forma
Página 37 / 163
simplificada, a principal diferença é se existe uma intervenção direta por parte do

investigador. Ou seja:
• se há controlo/manipulação de um conjunto de variáveis - abordagem
experimental
• se não há controlo/manipulação de um conjunto de variáveis e o investigador se
limita a observar o fenómeno em estudo - abordagem observacional
Além disso, importa saber quantas vezes é que cada indivíduo em estudo é observado
(ou seja, os dados recolhidos sobre cada indivíduo são apenas relativos a um
momento de recolha de dados ou a mais do que um momento):
• se só há um conjunto de dados para cada indivíduo - estudo transversal
• se há mais do que um conjunto de dados para cada indivíduo - estudo
longitudinal
Finalmente, importa ainda definir que tipo de análise estatística vai ser feita:
• se apenas descritiva - estudo descritivo
• se implica análise inferencial (voltaremos a isto no Capítulo 7) - estudo analítico
Resumindo, a descrição do desenho de investigação é feita geralmente com uma

tríade de informação, como por exemplo:
 Estudo observacional transversal e descritivo
 Estudo observacional transversal e analítico
 Estudo observacional longitudinal analítico

Mas há exceções. Os estudos experimentais são, por norma, longitudinais e
analíticos, pelo que é desnecessário (a menos que seja uma exceção) indicar esses
aspetos. Da mesma forma, há desenhos que são sobejamente conhecidos e que, ao
indicar o nome desses desenhos de investigação já o estamos a caracterizar em
termos da tríade de características indicadas. Por exemplo, quando se refere “Ensaio
clínico controlo randomizado” é óbvio que se trata de um estudo experimental
longitudinal e analítico.
População, População-Alvo, Amostra

O termo “População” significa o mesmo que “Universo” e refere-se ao grupo de
indivíduos para quem os resultados do estudo serão generalizáveis. Por exemplo, ao
Página 38 / 163
dizer que a população (ou universo) é constituída por “Crianças com défice de atenção
e hiperatividade”, isto significa que os resultado do estudo deverão ser generalizáveis
a estas crianças (ou seja, haverá uma certa probabilidade de se encontrar
determinado fenómeno (ou associação entre fenómenos), verificado no estudo, em
crianças com as mesmas características clínicas e que não participaram no estudo.
Por vezes, é importante indicar também qual é a “População-Alvo”. Isto é relevante
quando o grupo de pessoas que estamos a estudar é um subgrupo da população ou
universo propriamente dito. Por exemplo, se estamos a estudar as crianças com défice
de atenção e hiperatividade que recorrem a um hospital específico, temos uma
população-alvo (as crianças que recorrem àquele hospital) que pode ter algumas
diferenças ou particularidades relativamente à população (por exemplo, Portuguesa)
de crianças com défice de atenção e hiperatividade.
A amostra refere-se ao grupo de indivíduos que será observado na prática. Ou seja, o
grupo de indivíduos sobre os quais vamos recolher informação. A descrição da
amostra deve incluir as suas características (por exemplo, “Crianças com défice de
atenção e hiperatividade, de ambos os sexos e entre os 7 e os 9 anos, que recorrem à
Consulta de Desenvolvimento Infanto-Juvenil do Hospital X”). Repare-se que, neste
caso, a generalização dos resultados encontrados será em primeira mão para a
População-Alvo (as crianças com aquelas características, daquele hospital) e, em
segunda mão, para a População (as crianças com aquelas características, de
Portugal).
Amostragem e recrutamento
Por amostragem entende-se “o método de constituição da amostra”. Vamos voltar a
este assunto mais tarde. Para já, importa só saber que a descrição da amostragem
implica detalhar aspetos relativos a:
 Processo de escolha dos indivíduos

• Censos (são selecionados todos os indivíduos existentes disponíveis)
• Amostra aleatória (são selecionados apenas alguns indivíduos, de entre os
disponíveis, “à sorte”; existem vários métodos de garantir a aleatorização)
• Amostra não aleatória intencional (são selecionados apenas alguns
indivíduos, de entre os disponíveis, com base em critérios pré-definidos mas
que impedem a escolha aleatória dos indivíduos)
Página 39 / 163
• Amostra de conveniência (são selecionados apenas alguns indivíduos, de

entre os disponíveis, em função de um critério que seja conveniente para o
investigador – por exemplo, pelo facto de o investigador só poder recolher
dados numa determinada altura)
 Critérios de inclusão e exclusão dos participantes no estudo

 Critérios de aleatorização entre grupos de estudo (como vão ser distribuídos os
indivíduos escolhidos para o estudo para cada braço ou grupo do estudo, como
por exemplo, grupo de intervenção versus grupo de controlo).
 Tamanho amostral: quantas pessoas estamos a planear contactar? E, como é

provável que algumas recusem participar, quantas é que precisamos de recrutar,
para o estudo? Se houver mais do que um grupo/braço de estudo, temos de
indicar o tamanho amostral para cada grupo (pode não ser, necessariamente, o
mesmo número). O cálculo do tamanho amostral tem de ser explicitado. Este
aspeto será mais detalhado nos Capítulos 5 e 7
 A forma como vamos abordar as pessoas, de forma a convidá-las para o estudo: o

convite é feito através dos psicólogos clínicos que acompanham essas pessoas? É
feito através de telefone? Quem fornece os números de telefone?
Outcomes, instrumentos e procedimentos de recolha de dados
No Capítulo 1 já abordámos o que significa o conceito de Outcomes. Recordemos que
faz sentido referirmo-nos a outcomes em contexto de estudos de avaliação de
eficácia, efetividade ou eficiência (ver também no Capítulo 1 a diferença entre estes
conceitos).
Na prática, referimo-nos às variáveis que ilustram o possível efeito que estamos a
observar, em função da intervenção em estudo. Por exemplo, podemos usar como
outcome principal a variável “Qualidade de vida relacionada com a saúde, avaliada
através do SF-36” ou “Sintomatologia de depressão, avaliada por GDS-15”.
Nesta secção do protocolo, importa indicar os outcomes em estudo, distinguindo:
• Outcomes principais: são também conhecidos, em estudos de natureza
clínica, como endpoints. São aqueles que têm maior probabilidade de variar
(geralmente, no sentido da melhoria) em função da intervenção ou aqueles
que são mais importantes para o contexto de investigação. Se existe uma
cascata causal de variáveis, todas elas potencialmente dependentes de uma
intervenção, o outcome principal poderá ser a variável mais ‘próxima’, em
Página 40 / 163
termos de efeito previsível, da intervenção. Por exemplo, numa intervenção

de educação para a saúde, podemos prever a seguinte cascata de
causalidade: intervenção  aumento de literacia em saúde  motivação para
comportamentos mais saudáveis  adoção de comportamentos mais
saudáveis  melhor indicador fisiológico (por exemplo, nível de açúcar no
sangue). Neste exemplo, o outcome principal poderia ser identificado como
sendo “aumento de literacia em saúde, avaliado através da escala X”.
• Outcomes secundários. No exemplo dado, qualquer das variáveis seguintes
(na cascata causal) pode ser elencada como outcome secundário.
Quanto aos instrumentos, importa elencar todos os instrumentos que vão ser
utilizados no estudo (questionários, aparelhos técnicos como microscópios,
ressonância magnética, ...), com caracterização dos objetivos e formato de pergunta e
resposta, bem como indicação abreviada das propriedades psicométricas (validade,
fidelidade, etc.) dos mesmos, referenciando os estudos originais bem como os estudos
que mostram que os instrumentos em causa podem ser utilizados para a população
em estudo (por exemplo, referenciando artigos das versões portuguesas de um
questionário desenvolvido originalmente para os Estados Unidos da América). Em
anexo, dever-se-á depois incluir a versão do questionário que vai ser utilizada no
estudo. No Capítulo 6 iremos abordar os aspetos psicométricos que importa ter em
conta para fazer esta descrição.
Os instrumentos a utilizar representam formas de medir variáveis. O conjunto de
variáveis em estudo pode ser caracterizado numa tabela sinóptica, a incluir em anexo,
em que se indicam:
 Nome da variável (por exemplo, “Depressão”)
 Como será designada na base de dados (por exemplo, “depressão”)
 Escala de medida (nominal, ordinal, intervalar, de razão – veremos estas

diferenças mais tarde, no Capítulo 7)
 Escala de resposta (por exemplo, de “1=Discordo totalmente” a “7=Concordo

totalmente”)
 Cut-offs (ou seja, pontos de corte indicativos de diferença clínica, patologia,

etc.)
Página 41 / 163
Análise de dados
Nesta secção devem ser descritos, de forma abreviada:
 O software utilizado para registo e para análise dos dados (por exemplo, IBM-
SPPS versão 25.0, MAXQDA12, etc.)
 O nível de significância que será utilizado para efeitos de decisão estatística
 Tipo de indicadores estatísticos utilizados para fazer descrição univariada,

análise bivariada e/ou análise multivariada.
 A forma como iremos codificar (ou recodificar) as variáveis, para efeito de

análise estatística.
No Capítulo 7 abordaremos outros aspetos que podem ser descritos nesta secção.
II.2.6 Resultados esperados

Tratando-se de um protocolo, não existem, obviamente, resultados (embora possam
existir resultados de algum estudo piloto, em que se testou com poucos indivíduos se
os métodos utilizados são adequados e permitem responder aos objetivos de
investigação.
Nesta secção importa indicar que tipo de resultados é expectável (estimação de
parâmetros, outcomes ou descrição do fenómeno em estudo, em função de outras
variáveis). Por exemplo, ”Este projeto permitirá estimar a prevalência de bullying e os
custos psicossociais associados, por região NUTS II de Portugal”.
Pode também ser aqui referida a importância, em termos científicos, sociais, clínicos,
educacionais ou organizacionais, do tipo de resultado que é expectável. Por fim, nesta
secção podem ser elencados os produtos expectáveis: relatórios, número de artigos
científicos, website, Apps, etc.
II.2.7 Aspetos éticos e deontológicos

Importa aqui indicar quais são as entidades que serão envolvidas em termos de:
 Pedidos de autorização (direções escolares, direções clínicas, Comissão

Nacional de Proteção de Dados, etc.)
Página 42 / 163
 Pedidos de pareceres éticos (comissões académicas, de saúde, etc.)
 Pedidos de consentimento informado (aos próprios participantes e/ou aos seus

representantes legais – por exemplo, no caso de crianças ou idosos com
demência)
Os documentos de consentimento informado e respetiva declaração devem constar
em anexo ao protocolo.
No anexo 1 é dado um exemplo do documento de consentimento informado.
II.2.8 Contexto de execução do projeto (instituição, supervisão, etc.)

Esta secção é de especial importância por evidenciar a exequibilidade do projeto.
Devem ser indicados elementos como:
 Instituição promotora (que acolhe) o projeto, em termos logísticos e/ou

financeiros (com indicação dos aspetos que são patrocinados – aparelhos de
medição, verbas para recolha de dados, etc.)
 Consultores que participam no projeto (com indicação das competências

destes consultores, que fazem com que sejam uma mais valia para o estudo). O
Curriculum Vitae dos consultores deve constar em anexo.
 Supervisores, orientadores, comissões científicas. Este aspeto é especialmente

importante no âmbito de projetos académicos (mestrados, doutoramentos, ...), com
indicação da regularidade de contacto com os mesmos.
II.2.9 Equipa de investigação (com evidenciação das especialidades/ competências

científicas envolvidas)
Esta secção complementa (em alguns casos até se pode fundir com) a anterior. Deve
incluir não apenas uma breve nota curricular de cada elemento da equipa, mas
também o papel que cada um vai desempenhar no estudo (qual a mais valia e
complementaridade de cada elemento). Em anexo devem ser incluídos os Curriculum
Vitae dos elementos da equipa.
Pode ainda ser descrita a organização de ‘governação’ do projeto: quem é o
Página 43 / 163
investigador principal, quem gere o trabalho de campo, se existe um steering

committee (responsável pela execução), como se compõe e com que frequência
reúne, e se existe um scientific committee (grupo consultor externo), como se compõe
e com que frequência reúne.
II.2.10 Orçamento (com indicação de eventuais fontes, adicionais ou parciais, de

financiamento)
Esta secção nem sempre é necessária ou relevante. Dependerá do contexto de
utilização do protocolo. Por exemplo, se for para uma candidatura, é fundamental.
Há muito a dizer sobre como fazer uma boa orçamentação, mas neste manual não
vamos abordar estes aspetos com muito detalhe. Importa, no entanto, destacar os
seguintes aspetos que devem ser explicitados:
 Fontes de financiamento (e se essas fontes implicam conflitos de interesse)
 Associação do orçamento ao cronograma do projeto, não apenas por uma

questão óbvia de gestão interna do projeto, mas também porque as formas de
financiamento podem implicar que o pagamento seja feito por ‘tranches’ (ou seja,
aos poucos), e é fundamental assegurar que as verbas estejam disponíveis nos
momentos certos.
 Orçamento feito por rúbricas, não esquecendo aspetos fundamentais para a

execução dos projetos, como: parceiros institucionais (quando mais do que um),
recursos humanos, equipamentos, viagens (recolha de dados, apresentação do
projeto e dos seus produtos – por exemplo, em congressos), outsourcing,
consumíveis, etc.
Quando os projetos são realizados no âmbito de instituições (académicas, de saúde,
...) é frequente existir uma verba que deve ser atribuída à instituição, os chamados
“overheads”. É fundamental contar-se com estes valores logo desde o início, para a
contabilidade orçamental.
II.2.11 Cronograma
O cronograma permite definir as atividades a serem desenvolvidas durante a
Página 44 / 163
execução do estudo e o tempo de cada uma delas (data de início e fim) através de
uma representação gráfica. É uma ferramenta que deverá ser consultada (e
atualizada) regulamente, para acompanhar a evolução da implementação das
atividades propostas e eventuais desvios às mesmas.
Existem vários modelos de cronograma que podem ser seguidos, que poderão
funcionar como checklist para verificação das tarefas em curso e concluídas. A
estrutura mais habitual deve incluir a seguinte informação:
 Tabela com listagem das atividades a serem desenvolvidas
 Identificação dos meses/semanas do período de execução do projeto
 Esquema de cores para distinguir, em função do mês/semana, atividades já

executadas, atividades a serem executadas, eventuais atrasos, etc.
 Responsável pela atividade (pode ser o elemento da equipa de investigação ou

instituição participante)
 Principais milestones
 Períodos de reporte das atividades desenvolvidas (geralmente, correspondem

à entrega de relatórios que são solicitados regularmente pela entidade
financiadora)
O cronograma pode ser feito usando simplesmente uma tabela do Word ou em Excel.
Encontram-se ainda disponíveis na internet diversas ferramentas gratuitas que podem
ser utilizadas para representação de um cronograma de projeto: https://time.graphics/
ou https://www.teamgantt.com/.
Página 45 / 163
CAPÍTULO III - Revisão de literatura: para que serve?
Existem duas formas diferentes de revisão de literatura:
 Revisões narrativas
 Revisões sistemáticas (com ou sem meta-análise)
Neste capítulo, vamos começar pela discussão de revisão de literatura para apoio à
decisão que temos de fazer relativamente ao nosso próprio estudo (paradigmas a
utilizar, opções metodológicas, como apresentar dados etc.) e depois abordamos o
conceito de revisões de literatura como método de análise documental. Ou seja, como
método de investigação original.
III.1 Revisão da evidência para apoio à decisão
Já foi referido, no Capítulo 1, que a formulação de uma boa pergunta de investigação,

bem como a definição de objetivos e hipóteses adequados devem estar baseados em
leituras prévias de estudos e linhas de investigação. Assim sendo, a revisão de
literatura começa ainda antes do qualquer projeto de investigação começar! No
entanto, a partir do momento em que a pergunta de investigação é definida, importa
fazer uma revisão de literatura mais estruturada.
Existem dois aspetos centrais da revisão de literatura que deve ser feita para apoiar a
consistência do estudo que irá ser feito, dos pontos de vista conceptual e
metodológico:
 A revisão de literatura deve ser feita para garantir a originalidade e inovação do

estudo (geralmente, não faz sentido repetir, de forma ipsis verbis, estudos já feitos)
 A revisão de literatura deve recorrer a várias fontes (várias bases de dados de

referências a artigos científicos, consulta das referências/citações de outros
artigos, teses de mestrado ou doutoramento, relatórios, etc.).
Página 46 / 163
Os investigadores menos experientes utilizam a revisão de literatura numa perspetiva

apenas (ou tendencialmente) conceptual. Ou seja, dão muita importância às seções
de introdução, resultados, discussão e conclusões, de artigos científicos com dados
originais. Tendem a descurar a secção dos métodos. Ora, como vimos no Capítulo 2,
a secção dos métodos implica decisões e a definição detalhada de vários aspetos,
nomeadamente: desenho, amostragem, escolha de instrumentos de recolha de dados,
análise estatística.
Para garantir que estamos a utilizar os melhores “caminhos” (i.e., métodos) de
investigação, é muito importante e educativo que se leia com muita atenção a secção
dos métodos dos estudos já feitos na área de investigação em causa. Fazendo uma
análise cuidadosa dos métodos utilizados por outros investigadores (e o que resultou
do uso desses métodos) permitirá fazer escolhas bem sustentadas para o projeto que
se está a planear.
A revisão de literatura permite ainda:
 Justificar aspetos éticos. Um bom exemplo é a recolha de dados sobre aspetos

étnicos. As comissões de ética são muito criteriosas na aprovação de projetos que
recolham informação sobre etnia (por exemplo, se os respondentes são etnia
caucasina, de etnia negra, asiática, etc.) por ser informação potencialmente
discriminatória. Mas esta informação é obviamente muito importante quando os
culturais desempenham um papel central no fenómeno em estudo. Ou até mesmo
quando existem aspetos fisiológicos relevantes (por exemplo, tempos de
cicatrização de feridas, aspetos cardiovasculares, etc.). Assim, os resultados de
estudos já feitos (mapeados através de uma boa revisão de literatura) permitem
justificar precedentes
 Encontrar parcerias. Ao fazer revisão de literatura, vamos mapeando potenciais

interlocutores e parceiros de investigação: quem tem feito trabalho relevante e
quem tem interesse na linha de investigação que queremos abraçar?
 Identificar potenciais financiadores. Muitos projetos de investigação já

publicados foram financiados por alguma entidade. Importa dar atenção a esse
aspeto, quando fazemos a revisão de literatura.
 Escolher revistas científicas onde iremos publicar os nossos dados. Há revistas

que acolhem bem determinados temas. A revisão de literatura permite identificá-
las.
Página 47 / 163
Aspetos a ter em conta, para uma boa revisão de literatura (de apoio à decisão ao
nosso estudo):
 Acessibilidade (a que artigos temos acesso). É importante percebermos os

limites em termos de acessibilidade. Um bom exemplo, é as línguas que utilizamos
para a nossa pesquisa. A maior parte da investigação científica publicada está
escrita em inglês. Acima de tudo, a ciência mais recente está maioritariamente
escrita em inglês. Assim sendo, uma boa revisão de literatura tem
necessariamente de incluir a consulta de documentos nesta língua. Mas, havendo
essa competência, é útil e relevante consultar obras escritas noutras línguas (pelo
menos, na língua do país onde o estudo será feito)
 Fiabilidade ou qualidade da informação. Nem tudo o que está publicado tem

boa qualidade metodológica (ou mesmo conceptual). Por outro lado, os estudos
publicados podem ter ótima qualidade metodológica mas oferecer graus de
evidência maiores ou menores.
De seguida, são hierarquizados tipos de estudos em função do grau de evidência que

oferecem. As classificações podem diferir em função das organizações que as fazem.
Mas esta ordem é relativamente consensual.
III.1.1 Níveis de evidência em ciência

Existem diferentes níveis de evidência em ciência, que passamos a apresentar de
seguida por ordem decrescente de valor.
Página 48 / 163
TABELA 1. Nível de evidência e grau de recomendação em quatro hierarquias de evidência
Fonte: Upshur R. Are all evidence-based practices alike? Problems in the

ranking of evidence. Canadian Medical Association. 2003
Existem outros aspetos a ter em conta para uma boa revisão de literatura (de apoio à
decisão ao nosso estudo):
 Pesquisa abrangente. Uma boa revisão deve incluir mais do que uma base de
dados de referências/artigos, e deve usar um método iterativo de pesquisa (a
leitura de um artigo suscita novos interesses de pesquisa), embora mantendo o
Página 49 / 163
foco nos aspetos centrais do fenómeno em estudo. Um critério possível para

compreendermos (de forma subjetiva) se a revisão é suficientemente abrangente é
quando se encontram referências já abordadas e de forma repetida no material
consultado.
 A abrangência da revisão de literatura está, obviamente, circunscrita ao tempo

disponível para o fazer. Quando é tempo é limitado, uma boa forma de começar a
pesquisa passa pela leitura inicial de artigos de revisão já existentes (mas não a
limitando a isto).
 Atualidade da informação. Produz-se ciência todos os dias, pelo que existe,

para a grande maioria dos objetos de estudo que se possam imaginar, imensa
investigação. Como regra de polegar, quanto mais informação existe, mais seletiva
pode ser a nossa revisão de literatura em termos de datas de publicação
(privilegiando, obviamente, as obras mais recentes). Sem descurar, claro, obras
que sejam fundamentais para compreendermos a evolução histórica do objeto de
investigação.
 A leitura dos artigos deve ser sempre feita de forma crítica. Nem sempre
artigos publicados em boas revistas seguem as melhores práticas metodológicas.
Por outro lado, a interpretação dos resultados obtidos em estudos científicos deve
ser sempre contextualizada aos aspetos conceptuais e metodológicos que os
suportam. Daí, repetimos, a importância de ler com atenção a introdução dos
artigos (permitem compreender os paradigmas de referência dos autores) e os
métodos (permitem apreciar a validade interna e externa dos estudos, como
veremos mais em detalhe no Capítulo 4).
 Ler e sintetizar. Existem ferramentas de organização da revisão de literatura

que podem ser muito úteis, não apenas para catalogar os artigos em temas e
subtemas, mas também para integrar notas/apontamentos ou mesmo para facilitar
a referenciação dos materiais consultados, aquando da escrita dos nossos
produtos científicos. Alguns exemplos:
• Docear: é uma ferramenta (acesso gratuito) muito interessante, que permite
organizar os artigos através de mapas conceptuais (’árvores’ conceptuais,
com ramificações que permitem compreender a relação entre as variáveis em
estudo), apoiando também a escrita dos artigos – pode ser usada para escrita
estruturada de artigos ou relatórios científicos. Ver mais informação em:
Página 50 / 163
http://www.docear.org/
• Mendeley: é uma ferramenta muito simples e extremamente útil de apoio à
referenciação automática (funciona bem com os processadores de texto mais
habituais). Poupa horas de trabalho. Ver mais informação em:
https://www.mendeley.com/
 Comparar entre artigos. Para o efeito, importa compreender a perspetiva

(paradigmas) dos investigadores, os métodos estudados e/a a forma de
apresentação dos resultados.
Para terminar, algumas recomendações a quem se lança na aventura exploratória de

uma revisão de literatura para apoio à decisão, no processo de planeamento e escrita
do projeto de investigação:
 Não esquecer que as questões de investigação pensadas no início já podem

ter sido alvo de estudo (pouco inovadoras)
 É sempre importante partilhar as ideias com terceiros de forma aberta: não

recear a influência de outras formas de pensar
 A revisão de literatura não é uma mera lista de publicações consultadas; a

leitura crítica e interpretativa é fundamental
 Antes de partir para a pesquisa, importa selecionar bem as palavras-chave
 Vamos ver de seguida os cuidados a ter (e estratégias úteis)
 É fundamental escrever resumos ou fichas de apoio dos textos consultados.

Não só permite a síntese e reflexão crítica, como também evita o risco de
duplicação, confusão e citações ou referências bibliográficas incorretas. Quanto
mais lemos, mais provável é que nos esqueçamos de onde lemos uma
determinada ideia que queremos relatar, quando passamos para a escrita.
III.1.2 Níveis de evidência para apoio à decisão… E publicável

Uma boa revisão de literatura pode dar origem a um bom artigo, publicável numa boa
revista científica. Para o efeito, importa garantir que a revisão de literatura foi bem
organizada. Trata-se assim de um artigo de reflexão, por parte dos autores, sobre o
Página 51 / 163
material consultado, lido e organizado.

A este tipo de revisão de literatura, que representa uma síntese da perspetiva teórica
(ou teórico-prática - pode ser uma revisão de literatura sobre intervenção terapêutica,
por exemplo) que os autores do artigo têm sobre um determinado fenómeno, chama-
se revisão narrativa. Os artigos de revisão narrativa de literatura não incluem na sua
estrutura as secções de métodos e resultados. Incluem todas as restantes
componentes habituais de um artigo científico:
Título
Autores (com indicação de afiliação – a que instituição ‘pertencem’?)
Resumo (de preferência, com indicação, no final, de palavras-chave)
Introdução (ou enquadramento) teórica
Objetivos e hipóteses do estudo
Desenvolvimento teórico (podendo incluir vários tópicos, dentro do mesmo tema)
Discussão e conclusões
Agradecimentos
Declaração de eventuais conflitos de interesse
Referências bibliográficas
No Anexo III é apresentado um exemplo de revisão de literatura, publicado numa das

principais revistas de medicina publicadas em Portugal. Importa ver a estrutura e
organização da escrita desse exemplo.
Podemos concluir que este conceito, de revisão narrativa da literatura, é dado aos
casos em que os autores da revisão de literatura não descrevem de forma detalhada a
forma como fizeram a revisão de literatura: não indicam a forma como fizeram a
pesquisa de artigos, quais os critérios de seleção utilizados, a forma como fizeram a
síntese e organização da informação lida, etc.
As revisões narrativas de literatura não são consideradas, por estes motivos, revisões
sistemáticas de literatura. Repare-se que não implica necessariamente que os autores
Página 52 / 163
não tenham sido muito organizados ou que não tenham feito um trabalho de revisão
bastante bem sistematizado. Apenas não descreveram o método e resultados dessa
revisão como se tratasse de um projeto de investigação com recolha de dados
empíricos. E, para o leitor, a revisão consiste assim num resumo do conhecimento
(necessariamente subjetivo) do autor.
III.1.3 Revisões sistemáticas da literatura

Quando a revisão de literatura é acompanhada de uma explicitação bem detalhada
dos métodos de pesquisa, seleção, organização e síntese dos documentos científicos
analisados, podemos dizer que estamos perante uma revisão sistemática da literatura.
Trata-se assim de um método específico de análise documental (um desenho de
investigação típico das abordagens qualitativas).
Vimos antes, neste mesmo capítulo, que as revisões de literatura correspondem
(juntamente com as meta-análises) ao que é hoje em dia considerado como sendo o
nível mais elevado da evidência científica.
FIGURA 1. Tipos de revisões da literatura
Nunca se fez tanta investigação como a que se produz hoje em dia. Todos os dias são
publicados milhares de artigos científicos, que correspondem a pequenas peças de um
enorme puzzle de conhecimento, sobre qualquer que seja a área de estudo. Por
exemplo, se se fizer uma pesquisa na PubMed (https://www.ncbi.nlm.nih.gov/pubmed/),
uma base de dados de referências e resumos de artigos científicos) sobre o termo
“Treatment Depression” obtêm-se 196 057 artigos. Como é óbvio, muitos destes
artigos descrevem os efeitos clínicos associados a diferentes métodos de intervenção.
Página 53 / 163
E muito provavelmente, alguns artigos revelam que uma determinada intervenção é

efetiva para o tratamento da depressão, enquanto outros mostram que essa mesma
intervenção não é (ou é menos) efetiva. Métodos diferentes de investigação ou
diferenças nas características dos indivíduos observados em cada estudo podem
explicar as diferenças nos resultados observados. Importará assim sistematizar o
conhecimento de alguma forma.
Hoje em dia fala-se muito de conhecimento baseado na evidência. Termos como
“Evidence-based practice in psychology”, “Evidence-based medicine”, ”Evidence-
based policymaking”, são cada vez mais utilizados como forma de salientar a
importância de agir em função do que parece ser mais efetivo, o que parece resultar
melhor. Como o conhecimento sobre o que resulta (o que é efetivo) ou sobre o que
resulta com menos custo (o que é custo-efetivo) depende, na maioria das vezes, de
múltiplas evidências, recolhidas através de múltiplos estudos, importa ter métodos que
permitam integrar esses contributos de conhecimento. A revisão sistemática de
literatura (RSL), com ou sem meta-análise (já veremos a diferença) consiste num
método, com regras próprias, para fazer essa integração de conhecimento de forma
sistemática.
Uma revisão sistemática de literatura é uma revisão que procura identificar, avaliar, e
sintetizar toda a evidência empírica, com base em critérios pré-definidos de
elegibilidade (das evidências consideradas), de forma a responder a uma determinada
pergunta.
Revisões sistemáticas da literatura: principais características
 Tema e objetivo bem definido
 Unidade amostral: estudos científicos (por exemplo, artigos científicos, teses,

etc.)
 Estratégia clara de pesquisa dos estudos (incluindo os não publicados, como

teses)
 Critérios de inclusão e de exclusão dos artigos bem definidos
Página 54 / 163
 Análise da qualidade metodológica de cada estudo
 Lista/número de estudos excluídos (com justificação)
 Síntese narrativa (abordagem qualitativa/interpretativa)
 Meta-análise: síntese quantitativa (se possível e adequado)
 Relatório/artigo com descrição exaustiva dos objetivos, métodos e resultados
Como vimos antes, a produção científica tem aumentado de forma exponencial nas
últimas décadas. No entanto, e como descrito na Lei de Bradford, à medida que uma
área científica cresce, a literatura (sobre essa área científica) torna-se
progressivamente mais dispersa entre revistas e, portanto, mais difícil de organizar).
Por exemplo, se pensarmos em artigos sobre bullying:
Existem cerca de 22 000 revistas científicas em áreas biomédicas. Só a

MEDLINE/PubMed inclui aproximadamente 3700 revistas.
Perante esta quantidade de publicações, o primeiro passo a seguir antes de começar
uma RSL deve ser o de verificar se existe alguma revisão sistemática já feita- Para
isso, existem várias bases de dados:
 RSL de intervenções: Cochrane Library (UK Cochrane Centre, fundado em

1992)
 Centre for Reviews and Dissemination (Univ. York, UK) (desde 1993):
http://www.crd.york.ac.uk/CRDWeb/ - Database of Abstracts and Reviews (DARE)
• Effective Health Care (https://www.york.ac.uk/crd/publications/archive)
• Effectiveness Matters
(https://www.york.ac.uk/crd/publications/effectiveness-matters)
Página 55 / 163
Mas uma revisão sistemática de literatura é um processo demorado. Em média,

demora cerca de 938 horas. Destas, e de acordo com o resultado de uma análise da
duração de 37 meta-análises1, 588 horas são habitualmente dedicadas ao
desenvolvimento protocolo, pesquisa e acesso a artigo, 144 horas à análise estatística
e 206 horas à escrita/relato
Em que consiste uma boa pergunta para uma revisão sistemática da literatura
Uma pergunta típica deve incluir as componentes PICO (DTC):
População em estudo (e.g., grupo de doentes)
Intervenção em estudo (e.g., tratamento, teste ou exposição)
Comparador em causa (e.g., intervenção “x” é melhor que não intervenção)
Outcome (e.g., remissão de sintomas, sobrevivência, etc.)
Desenho do estudo (e.g., experimental, observacional, qualitativo)
Tempo (duração da intervenção)
Contexto (e.g., laboratorial, de âmbito nacional, regional)
Exemplo de uma pergunta típica para um RSL
Será a terapia interpessoal mais efetiva para depressão pós-parto que a terapia
cognitivo-comportamental?
População em estudo: mães em período peri-natal (até um ano após o parto)
Intervenção em estudo: terapia interpessoal
Comparador em causa: terapia cognitivo-comportamental (poder-se-ia também incluir
um comparator ‘inerte’, por exemplo, não tratamento)
Outcome (remissão de sintomas de depessão, com avaliação através de entrevista
clínica estruturada)
Desenho do estudo (poder-se-ia definir que se iria incluir apenas ensaios clínicos
controlados)
Tempo (até ano e meio após o parto)
Contexto (poder-se-iam considerar todos os estudos publicados sobre o tema ou, se
forem muitos, limitar a estudos publicados em país onde a prática de terapia
1Allen IE, Olkin I, Estimating time to conduct a meta-analysis from number of citations retrieved. JAMA. 1999 Aug
18;282(7):634-5.
Página 56 / 163
interpessoal seja mais comum)
Outros exemplos de perguntas adequadas para RSL
Sobre prevalência ou incidência de condição ou doença: “Qual a prevalência de baixa

literacia de saúde em adultos com mais de 64 anos?”
Sobre fiabilidade do diagnóstico: “Quão fiável é o Índice de Massa Corporal na
identificação da desnutrição nos adultos com mais de 64 anos?”
Sobre etiologia e fatores de risco: “Existem fatores conhecidos que aumentam o risco
de suicídio em adultos com mais de 64 anos?”
Sobre predição e prognóstico: “Podemos prever o risco de demência em adultos com
mais de 64 anos?”
No entanto, muitas vezes é necessário começar com uma ou mais perguntas abertas:
“Como definir depressão? ”
“Que modelos de prevenção do suicídio existem? E como os implementar?
“Que inquéritos sobre estilos parentais existem na Europa? Como foram conduzidos?
A este tipo de revisão sistemática de literatura, que não responde a uma pergunta
fechada (de resposta potencialmente mais quantificável), mas sim a uma resposta
aberta, dá-se o nome de Scoping Review.
Como se faz uma revisão sistemática da literatura?

As principais etapas de uma revisão sistemática de literatura são:
Página 57 / 163
As RSL são hoje em dia feitas através de motores de pesquisa de documentos

científicos. Na maior parte das vezes, trata-se de artigos científicos, publicados em
revistas reconhecidas pela comunidade científica. Mas muitas RSL incluem (e é boa
prática fazê-lo) a chamada “literatura cinzenta” – documentos científicos não
publicados em revistas científicas (por exemplo, dissertações de mestrado, teses de
doutoramento, relatórios científicos, etc.).
Existem várias bases de dados de referências, resumos e/ou artigos científicos. Na
Wikipedia (https://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines),
pode encontrar uma lista bastante compreensiva destas bases de dados (e respetivos
motores de pesquisa), com um breve resumo de cada uma.
Na área da saúde, destacam-se, por exemplo, a PubMed, a Scielo, a PsycINFO, a
PsycARTICLES e a Cochrane Library. A nível nacional, é de realçar o RCAAP
(repositório digital, que inclui dissertações de mestrado e teses de doutoramento). O
Google SCHOLAR é cada vez mais reconhecido também como um bom motor de
pesquisa (embora deva ser usado com bastante cuidado devido à quantidade de
Página 58 / 163
“ruído”, ou seja, de material irrelevante para a pesquisa).
Escolha das palavras-chave

Um dos aspetos centrais das RSL é a definição das palavras-chave. Apesar de ser
uma das decisões mais determinantes, no processo de investigação, não existem
(tanto quanto sei) estratégias consensuais sobre a forma de selecionar as palavras-
chave.
O processo deve, obviamente, iniciar-se pela leitura de um conjunto inicial de artigos
alinhados com o que se pretende encontrar depois, na revisão sistemática de
literatura. Esses artigos iniciais podem ser encontrados através de uma pesquisa ad
hoc (não sistemática). A leitura inicial desses artigos-tipo permite muitas vezes
identificar um conjunto de palavras que poderão depois ser usadas na RSL. É
importante olhar com atenção para os títulos dos artigos e para as palavras-chave que
aparecem geralmente associadas ao resumo dos artigos científicos.
O uso de palavras-chave isoladas resulta geralmente numa quantidade enorme de
artigos para incluir na RSL. Por esse motivo (e porque as perguntas de investigação
associam geralmente duas ou mais variáveis – logo, palavras), é habitual utilizarem-se
expressões booleanas (como AND, OR, NOT, etc.) para fazer combinação de
palavras.
A palavra-chave pode ser, ela própria, uma combinação de palavras (ou seja, um
termo composto por mais do que uma palavra), como por exemplo “Health literacy”.
Nestes casos, utilizam-se geralmente aspas (como no exemplo indicado) para garantir
que a pesquisa é exclusiva ao termo composto e não a cada uma das palavras
constituintes.
Em alguns motores de pesquisa (por exemplo, na PubMed) existe o que se chama de
termos MeSH (de Medical Subject Headings). Trata-se de termos reconhecidos pelo
sistema como “constructos”, que são usados para indexar os artigos aí existentes. Ao
usar esses termos, garantimos que a pesquisa devolve artigos relacionados com o
termo, mesmo que não o utilize de forma explícita. Por exemplo, se usarmos o termo
MeSH “Compliance”, podemos encontrar artigos que utilizam este termo mas também
termos relacionados, como “Adherence”. Repare-se que para que o sistema
reconheça o termo como sendo MeSH, não se podem usar aspas (fazendo-o, passa a
ser só um conjunto de caracteres e não um constructo indexador).
Um método que costumo utilizar para testar a relevância do uso das palavras-chave
Página 59 / 163
inicialmente selecionadas é o seguinte:
 Pesquiso em uma ou duas bases de dados de referências (por exemplo,

PubMed e PsycINFO) as palavras-chave (que podem ser combinadas com
operadores booleanos,
 Resumo, numa folha excel, o número de artigos encontrados em cada base de

dados, para cada combinação de palavras-chave
 Se o número de entradas para uma determinada combinação de palavras-

chave for demasiado elevado para os recursos existentes (número de
investigadores envolvidos, tempo disponível para a execução do projeto, etc.),
assumo que essa combinação de palavras-chave não é suficientemente focada.
Se for uma palavra-chave muito relevante, uma alternativa é limitar a referência
temporal da pesquisa (por exemplo, só aceitando artigos publicados nos últimos
cinco anos). Se o número de artigos identificados for demasiado reduzido, pode
significar que a palavra-chave não é muito eficaz (mais uma vez, dependerá da
relevância aparente da palavra; se for óbvio que a palavra faz sentido, pode ser
incluída na pesquisa)
Critérios de inclusão e exclusão

Cada artigo que será selecionado para análise, no âmbito da RSL, comporta-se como
se fossem pessoas, participantes em estudos que seguem desenhos de investigação
como veremos no Capítulo 6 (ensaios clínicos, inquéritos, estudos de caso-controlo,
coortes, etc.). Ou seja, cada artigo selecionado é um elemento da amostra da RSL (tal
como seria cada pessoa
selecionada/recrutada). E o conjunto de artigos selecionados consiste na amostra do
estudo (tal como seria uma amostra de pessoas com agorafobia, num estudo de
avaliação de custo-efetividade de um determinado tratamento, por exemplo).
Para além da definição de palavras-chave, importa assim definir outros critérios de
inclusão e de exclusão dos artigos.
Página 60 / 163
Exemplos de critérios de inclusão
 Bases de dados de consulta: por exemplo, só se incluem artigos constantes na

PubMed, PsycINFO e Cochrane Library (por norma, aconselha-se o uso de três
bases de dados)
 Janela/referência temporal: por exemplo, são incluídos apenas os artigos

publicados nos últimos 5 anos.
 Língua da publicação: por exemplo, só se incluem artigos com texto integral em

inglês e português
 Desenho de investigação: só se incluem artigos que descrevem ensaios

clínicos randomizados controlados
Exemplos de critérios de exclusão
 Variáveis de confundimento: são excluídos artigos que incluem adolescentes

na amostra
 Desenho de investigação: são excluídos artigos de revisão sistemática de

revisão ou artigos de meta-análise
Síntese da evidência encontrada

Uma vez selecionados os artigos que serão alvo de análise, importa sintetizar a
evidência que cada um desses artigos ilustra. Para o efeito, o mais adequado será
construir uma tabela sinóptica (em word ou excel, por exemplo), com categorias pré-
definidas.
As categorias da tabela sinóptica para extração dos dados dirão respeito aos aspetos
que a pergunta de investigação. Cada coluna da tabela consistirá assim numa
‘variável’, que pode ser numérica (por exemplo, “tamanho amostral do estudo”) ou não
numérica (por exemplo, “objetivos do estudo”). Nas primeiras colunas devem ser
indicados os elementos de identificação do artigo:
Página 61 / 163
(a) título do artigo, (b) nomes dos autores, (c) data de publicação.
A tabela deve também incluir informação sobre quem fez a extração dos dados (do
artigo).
Por norma, as RSL fazem-se sempre (em todas as fases do processo) com pelo
menos dois investigadores, que fazem a análise de forma separada ou de forma
controlada (um dos investigadores verifica a qualidade da extração dos dados do
outro, por exemplo). Convém existir um terceiro elemento (geralmente mais experiente
na área de investigação), para resolver os casos de divergência de opiniões.
As tabelas sinópticas representam assim um resumo de cada artigo selecionado.
Por norma, deve incluir três blocos de variáveis (“colunas”):
 Dados sobre o tema de investigação (exemplo, categorias nosológicas em

estudo, critérios de inclusão do estudo, objetivos do estudo, principais conclusões,
etc.)
 Dados sobre os resultados (médias, prevalências, p-values, etc.)
 Dados sobre os métodos (desenho do estudo, tamanho amostral, processo de

recrutamento, representatividade da amostra, testes estatísticos utilizados, etc.)
O passo seguinte inclui:

a) Síntese narrativa
 Apreciação da qualidade metodológica, com base em critérios pré-

estabelecidos. Existem normas/guidelines para apreciação da qualidade
metodológica, em função do desenho de investigação em causa, que podem ser
usadas para fazer esta apreciação metodológica. Por exemplo: CONSORT (para
ensaios clínicos randomizados controlados), SPIRIT (para protocolos de
investigação), PRISMA (para revisões de literatura - é possível fazer revisões de
literatura de revisões de literatura!) (PRISMA-P), STROBE (para estudos
observacionais, como por exemplo inquéritos) COREQ (para estudos qualitativos,
entre outros
 Resumo descritivo da evidência. Trata-se aqui de resumir a abordagem

seguida pelos autores dos estudos analisados, bem como os resultados e
conclusões encontradas.
 Construção de modelo teórico. Por vezes, é possível e faz sentido construir um
Página 62 / 163
mapa conceptual, indicando as relações encontradas entre as variáveis em estudo
b) Síntese quantitativa (meta-análise)

Quando a pergunta de investigação é suficientemente “fechada”, ou seja, quando é
passível de ser respondida de forma numérica, a revisão sistemática de literatura pode
ser complementada com uma meta-análise.
Por exemplo, se a pergunta de investigação para a RSL for: “Qual o efeito de uma
intervenção de educação para a saúde X?”, é possível estimar o efeito (com base em
indicadores como odds ratio ou cohen’s d – apresentados mais tarde, no Capítulo 7)
com base em vários estudos com pequenas amostras, através de métodos
matemáticos.
No âmbito deste curso não vamos entrar em detalhes sobre os modelos
matemáticos/estatísticos para se fazerem meta-análises. Na bibliografia do curso
encontra referências onde pode aprofundar os aspetos relacionados com as revisões
sistemáticas de literatura e meta-análises.
Página 63 / 163
CAPÍTULO IV - Validade interna e externa na avaliação de efetividade e custo-

efetividade
Investigar implica um esforço constante no sentido de maximizar dois aspetos

centrais, sendo virtualmente impossível garantir que os dois sejam atingidos em
simultâneo:
 Evitar fatores de confundimento e viéses (veremos de seguida o que

entendemos por estes termos); trata-se aqui de maximizar a validade interna dos
projetos.
 Maximizar a capacidade de generalização dos resultados (para uma

determinada população e/ou relativamente ao fenómeno em questão: trata-se aqui
de maximizar a validade externa dos projetos.
Neste capítulo, iremos abordar estes dois aspetos: validade interna e validade externa.
Vamos explorar a importância destes dois conceitos, bem como formas de otimizar
estas duas caraterísticas de investigação, nomeadamente em estudos sobre avaliação
de efetividade e custo-efetividade. Para isso, começaremos por definir o conceito de
validade no contexto da investigação e por abordar a diferença em relação ao conceito
de fiabilidade.
“ “Men judge things according to the disposition of their minds, and had rather
imagine things than understand them.”
- Baruch Spinoza, 1632-1677 -
Página 64 / 163
IV.1 O conceito de validade

O conceito de validade tem uma longa história no contexto da investigação científica.
É geralmente usado para se referir à credibilidade e intersubjetividade dos estudos
(intersubjectividade como a concordância entre várias pessoas quanto à interpretação
dada aos dados recolhidos e respetivas conclusões).
Nas abordagens qualitativas, a designação mais usual para o conceito de validade
interna é exatamente “credibilidade”, sendo o conceito de validade externa
normalmente referido como “transferibilidade”.
A validade de um estudo é muitas vezes definida como uma resposta à pergunta: ”Até
que ponto as conclusões do estudo fornecem a resposta correta?". O conceito de
validade espelha a qualidade das opções feitas ao longo de um determinado estudo,
nomeadamente no que se refere a aspetos como:
 Tipo de amostra e tipo de amostragem (enquanto processo para constituir a

amostra)
 Tipo de instrumentos utilizados para a recolha de dados e para a

operacionalização de uma determinada variável (por exemplo, o Beck Depression
Inventory ou uma entrevista estruturada de acordo com o DSM, para avaliar
depressão)
 Tipo de estratégia de análise estatística (por exemplo, para o caso dos estudos
de avaliação de efetividade ou custo-efetividade, optar por uma análise per
protocol ou intention-to-treat, como veremos no Capítulo 7)
 Tipo de testes estatísticos utilizados
 Discussão e conclusões feitas com base nos métodos e resultados
No que se refere à validade de instrumentos de recolha de dados (e/ou avaliação de

alguma característica psicossocial, como por exemplo, atitudes relativamente à escola,
estilos parentais, representações sociais, etc.) o termo “validade” foi cunhado por
Kelley em 1927, que observou que "o problema da validade é o de saber se um teste
realmente mede o que se pretende medir".
Página 65 / 163
IV.1.1 O que é a validade?

Vamos de seguida abordar o conceito de validade em dois contextos:
Estudo científico (na sua Medida (teste,

globalidade)
questionário, …)
Estima o quão bem o

Inclui a validade interna e instrumento mede o que é
externa suposto medir
Muitas vezes ouvimos e/ou usamos as palavras “fidelidade” (ou “fiabilidade”, mais
frequente em ciências biomédicas) e "validade”, tanto em situações do dia-a-dia como
no contexto de investigação. Em muitos casos, as pessoas utilizam os termos de
forma intermutável. Mas qual é a verdadeira diferença entre eles? Em situações
quotidianas, usamos habitualmente a palavra "fiabilidade" para nos referirmos a uma
máquina ("Eu tenho um carro de confiança") ou a uma fonte de notícias ("Eu usei uma
fonte de informação de confiança"). Em ambos os casos, queremos descrever algo
que é de boa qualidade e altamente desejável.
De forma semelhante, no contexto de investigação, a fidelidade/fiabilidade é definida
de acordo com a qualidade da medida que é utilizada para se caracterizar ou avaliar
um fenómeno em estudo. É uma maneira de avaliar a qualidade do procedimento de
medida que é usado para recolher dados. Por outras palavras, a fiabilidade é
considerada a "consistência" ou a "repetibilidade" dos resultados.
Já a validade refere-se à "credibilidade" dos resultados. Até que ponto o estudo, na
sua totalidade, mediu de forma correta o conceito em questão? E até que ponto
podemos acreditar que os dados recolhidos estão próximos do que se poderia
idealizar como a resposta correta (e universal) para o problema de investigação em
causa.
Página 66 / 163
Por exemplo, se se diz que, com base num inquérito feito a uma amostra da
população portuguesa, a prevalência de perturbações psicológicas na população
Portuguesa é de cerca de 22%, até que ponto posso acreditar nesse valor? Este
“acreditar” implica, obviamente, que as escolhas metodológicas tenham sido bem
feitas. Se o estudo fosse repetido, seguindo à letra a descrição dos métodos,
deveríamos ter um valor muito próximo (repetição de resultados = resultados fiáveis).
E o que se observou para o grupo de pessoas que foram entrevistadas para se obter
esse valor de prevalência é generalizável à população portuguesa? Isso implica que a
amostra utilizada é representativa da população portuguesa. E que os instrumentos de
recolha de dados que foram utilizados sejam os mais adequados para avaliar a
presença ou ausência de perturbação mental. Neste caso, já estamos a falar de
“validade”.
O que é a validade interna?

A origem do conceito de validade interna é muitas vezes atribuída a John Stuart Mill,
no seu trabalho "Cannons of Induction" de 1862. A validade interna refere-se a até que
ponto os resultados de um estudo estão corretos para um grupo específico de
indivíduos: os elementos amostrais observados. Tem assim a ver com os fatores que
afetam a relação entre as variáveis do estudo.
Quando um estudo é construído para analisar as relações de causa e efeito, por
exemplo, para avaliação do efeito de uma determinada intervenção clínica,
organizacional ou educacional, a principal questão que se coloca é se podemos
concluir que as mudanças observadas na variável dependente (por exemplo, bem-
estar psicológico, desempenho laboral ou escolar) são de facto o resultado das
mudanças na variável dependente. Neste caso, uma validade interna elevada refere-
se a uma forte evidência de causalidade. Por outro lado, uma validade interna baixa
revela uma fraca evidência de causalidade. A validade interna diz respeito ao rigor do
desenho do estudo. Mais: o nível de validade interna é determinado pelo grau de
controlo exercido sobre as variáveis em estudo e sobre potenciais variáveis estranhas.
IV.1.2 Validade de um projeto de investigação

Voltemos então ao conceito de validade científica. Como se deduz do que foi
anteriormente referido, o objetivo principal de um projeto de investigação é o de
Página 67 / 163
estabelecer uma relação entre as variáveis independentes e dependentes com um

elevado grau de certeza. A validade do estudo refere-se assim ao potencial do projeto
de investigação para atingir esse objetivo. Refere-se ao grau ou extensão em que a
inferência decorrente de um estudo é aceitável se se tomarem em linha de conta os
métodos de estudo, a representatividade da amostra e a natureza da população da
qual esta provém.
Como já referido, existem dois tipos de validade:
 Validade interna (expressa o grau de controlo dos viéses do estudo)
 Validade externa (expressa a capacidade de generalização para a população-

alvo)
Ora, a qualidade do estudo (a sua validade, no sentido mais geral do termo), depende
da luta contra o risco de:
 Os resultados obtidos serem fruto do acaso
 Os resultados obtidos terem na sua base viéses
 Haver variáveis de confundimento, que fazem com que os resultados obtidos

estejam de alguma forma “mascarados”, ou alterados, devido a variáveis
“escondidas” (não tidas em conta para a correta interpretação do que foi
observado).
E o que se entende por “confundimento”? Podemos dizer que temos confundimento

quando interpretamos os dados obtidos sem considerar variáveis não compreendidas
(“ocultas”, para o investigador) no modelo explicativo.
Há muitas formas de optimizar os estudos científicos, reduzindo o grau de
confundimento. Em função do desenho de estudo (que discutiremos no Capítulo 6),
existem estratégias consideradas pela comunidade científica como mais adequadas
para a redução de confundimento.
Alguns exemplos de estratégias relevantes para reduzir confundimento são:
1. Aleatorização dos elementos amostrais. Trata-se de garantir que as pessoas,
animais ou outro tipo de participante no estudo sejam de facto representativas, no seu
conjunto, da população para onde queremos inferir (generalizar) os resultados obtidos.
No caso de estudos de avaliação de efetividade ou de avaliação de custo-efetividade,
a aleatorização também garante que os grupos que estão a ser comparados (por
Página 68 / 163
exemplo, grupo exposto a uma intervenção psicoterapêutica versus grupo não exposto
a essa intervenção) sejam semelhantes relativamente a uma série de variáveis
consideradas como relevantes (por exemplo, mesma percentagem de mulheres em
ambos os grupos, mesma percentagem de pessoas da mesma faixa etária, níveis
semelhantes da severidade de sintomas, etc.).
2. Critérios de inclusão/exclusão (restrição amostral). Trata-se de definir, de forma

muito clara/operacional, as caraterísticas dos participantes (sexo, idade, patologias,
etc.) e que tipo de participantes não pode participar de todo. Importa dizer que os
critérios de exclusão não são apenas os opostos dos critérios de exclusão. Ou seja, se
por exemplo o estudo for sobre o impacto da autoperceção do estado geral de saúde
no controlo da diabetes em mulheres, é óbvio que um dos critérios de inclusão será o
de os elementos amostrais serem mulheres e, por oposição, os homens estarão
excluídos do estudo. Mas há critérios de exclusão que importa definir por si só. Por
exemplo, poderá ser relevante indicar que não participam no estudo pessoas que
tenham ido a uma urgência hospitalar nos últimos 2 meses. Ou que não participam no
estudo pessoas que não tenham concordado em assinar o documento de
consentimento informado (aspeto ético, fundamental para qualquer estudo com
humanos).
3. Estratificação (na análise estatística). Outra forma de controlar confundimento é o

de repetir a análise estatística para grupos diferentes (e ver se existe diferença
estatística entre esses grupos). Continuando com o exemplo do estudo sobre
autoperceção do estado geral de saúde, imagine-se que não foi definido como critério
de exclusão ser do sexo masculino. A amostra terá, então, pessoas de ambos os
sexos. Ora, sabe-se de diversos estudos, que a autoperceção do estado geral de
saúde difere entre homens e mulheres. Assim sendo, seria importante estratificar a
análise estatística que procura descrever a relação entre autoperceção do estado
geral de saúde e o controlo da diabetes por sexo (ou seja, vendo como funciona essa
associação para homens e para mulheres).
4. Ajustamento através de modelos estatísticos (na análise estatística). Outra forma

estatística de controlar ou reduzir confundimento consiste em utilizar modelos
matemáticos/estatísticos que incluem as variáveis que podem ter um papel importante
Página 69 / 163
na associação que se pretende estudar (autoperceção do estado geral de saúde e

controlo da diabetes, em mulheres, no exemplo considerado) e que, desta forma,
ajustam o efeito observado em função dessas variáveis. Por exemplo, através de
modelos de regressão é possível estudar o impacto da autoperceção do estado geral
de saúde no controlo da diabetes, ’eliminando’ (melhor dito, ajustando) o efeito
moderador que variáveis como nível educacional, literacia em saúde, etc., possam ter.
IV.1.3 O que se entende por “viés”?

Um viés é qualquer erro sistemático no desenho do estudo, na condução do estudo ou
na análise dos dados que resulta em estimativas incorretas sobre o fenómeno em
estudo.
Podemos considerar vários tipos de viéses (erros sistemáticos), com destaque para:
Viéses históricos
Este tipo de viés refere-se a qualquer tipo de evento não foi manipulado/controlado
pelo investigador e que, à altura da recolha de dados, tem influência nas variáveis
dependentes (se se tratar de um projeto de avaliação de efetividade ou custo-
efetividade, nos indicadores/outcomes em estudo).
Exemplo
Página 70 / 163
Imagine-se um projeto com o objetivo de estudar o impacto de um programa de

intervenção para sensibilizar médicos a negociar mais o uso de medicação com os
seus doentes hipertensos. A intervenção (ação de educação médica) tinha a duração
de dois meses e os efeitos eram observados antes da intervenção, no final da
intervenção e dois meses depois do último dia de intervenção. Um grupo de médicos
era alvo da educação médica (grupo de intervenção) e outro grupo não era alvo da
intervenção (grupo de controlo). Estamos perante um cenário clássico de estudo de
avaliação de efetividade, randomizado (porque, imagine-se, todos os médicos de uma
unidade de saúde eram alocados ao grupo de controlo ou ao grupo de controlo de
forma aleatória) e controlado (os médicos alocados ao grupo de controlo não diferiam
dos médicos alocados ao grupo experimental em aspetos considerados como
relevantes, como sexo, tempo de experiência clínica, especialidades, etc., para evitar
efeitos de confundimento).
Exemplo
Imagine-se que, entretanto, vários médicos (ou mesmo todos os médicos) dessa
unidade de saúde eram convidado para participar num programa de treino de
entrevista motivacional, promovido por uma empresa da indústria farmacêutica. O
treino de entrevista motivacional (que inclui aspetos como treino de empatia seletiva,
não confronto com resistência e negociação de opções terapêuticas com os doentes)
era feito entre o final da intervenção do estudo e o momento de avaliação em follow-up
(dois meses após o último dia de intervenção).
Neste caso, seria difícil concluir quanto a possíveis diferenças (ou não diferenças)
estatisticamente significativas entre grupo de controlo e grupo de intervenção, devido
a um fator externo ao estudo (a ação de formação em entrevista motivacional), que
cria um viés (erro sistemático, por afetar todos os médicos em estudo).
O QUE FAZER PARA MINIMIZAR A AMEAÇA?
 Devemos concentrar-nos na identificação de possíveis eventos externos que

possam alterar o impacto do estudo
 Ao limitar o tempo de acompanhamento, existe a possibilidade de reduzir as
Página 71 / 163
ameaças de viéses históricos
 Emparelhamento entre grupos: as diferenças de seleção de participantes entre

o grupo de intervenção e o grupo de controlo podem promover diferenças no
impacto de eventos históricos (um dos grupos pode estar exposto ao viés histórico
enquanto que o outro grupo pode não o estar). Assim sendo, é preferível que os
critérios de seleção sejam, o mais possível, idênticos, variando apenas o critério de
estar ou não exposto à intervenção.
Viés de maturação
Este tipo de viés refere-se a uma mudança na variável dependente em resultado da
passagem do tempo. Ocorre sobretudo em resultado das mudanças associadas ao
normal desenvolvimento, biológico, psicológicas, social, linguístico, moral, etc., que
ocorre no indivíduo, acabando tais mudanças por representar, em parte ou no todo, os
efeitos observados no estudo. É um tipo de viés especialmente relevante quando o
efeito observado (outcome do estudo) tem elevada probabilidade de ser alterado em
função da fase de vida dos indivíduos participantes.
Exemplo
Imagine-se que se pretende estudar o efeito de uma intervenção que dura seis meses
para aumentar a capacidade de atenção de crianças entre os 2 e os 5 anos. Sabe-se
que a capacidade de atenção depende em muito da maturação do sistema nervoso
(mais propriamente, da mielinização dos neurónios de algumas zonas do cérebro),
que ocorre de forma acelerada nesta fase da vida.
Assim sendo, se o estudo dos efeitos ao nível da atenção implicarem um tempo
relevante entre a primeira e última observações/avaliações de capacidade de atenção,
é provável que as diferenças encontradas tenham mais a ver com a maturação
estrutural, do sistema nervoso das crianças, do que com a intervenção em estudo.
 Tal como em relação ao viés histórico, é importante reduzir o tempo de
Página 72 / 163
intervenção, de forma a minimizar o impacto potencial da maturação nos

resultados do estudo. Minimizar o tempo entre o pré- e o pós-teste pode contribuir
para a redução da ameaça de viés de maturação
 Ter um bom grupo de controlo é fundamental para controlar o efeito de

maturação: se os grupos forem comparáveis no que se refere a variáveis de
confundimento e à própria variável de outcome (aquando da primeira observação
(baseline), e se os momentos de recolha de dados forem exatamente iguais, é
possível comparar a evolução da variável de outcome entre grupos e concluir
sobre o efeito da intervenção, ajustando para o efeito de maturação.
Efeito de teste
Este tipo de viés pode ocorrer quando o próprio método de medição do resultado afeta
o que é observado. Este tipo de efeito é muito frequente em estudos nas área das
ciências sociais e da psicologia cognitiva.
Existem muitas variantes deste tipo de efeito:
1. Efeito aprendizagem: as mudanças nos resultados dos testes podem ser não o
resultado da intervenção (por exemplo, de um treino cognitivo para melhorar a
memória), mas simplesmente o resultado da aplicação frequente de testes (ou
repetida com pouco tempo de intervalo). É o caso quando testes pré- e pós-
intervenção idênticos são administrados aos mesmos indivíduos.
2. Efeito Hawthorne: o psicólogo Elton Mayo descreveu este efeito a propósito de um
estudo feito em 1927, numa fábrica situada no bairro de Hawthorne da cidade de
Chicago (EUA), sobre o impacto do tipo de iluminação na produtividade laboral.
Verificou que o simples facto de observar os trabalhadores e de estes saberem que
estavam a ser observados, fazia com que os trabalhadores aumentassem a
produtividade laboral, independentemente das condições de iluminação (grupo de
trabalhadores expostos a luz variável versus grupo de trabalhadores expostos a luz de
intensidade constante). Mesmo reduzindo a iluminação, verificou-se que a
produtividade aumentava. A conclusão foi que o facto de os trabalhadores se sentirem
observados promovia o aumento da produtividade e que esse facto (sentirem-se
observados) tinha mais efeito do que a variável independente (tipo de iluminação).
3. Efeito de desiderabilidade (ou desejabilidade): refere-se à tendência de o
participante responder em função do que entende serem as normas sociais adotadas
Página 73 / 163
pelo investigador que está a recolher os dados. Por exemplo, administrar uma escala
que carateriza ou avalia de consumo de álcool num contexto clínico (por exemplo,
num centro de saúde) pode resultar em subestimação de abuso ou dependência de
álcool porque os participantes podem sentir que estão a ser avaliados no que se refere
ao seu comportamento relacionado com álcool e que isso pode ter efeito na forma
como poderão vir a ser tratados como doentes, no futuro. Outro exemplo será o de
fazer perguntas sobre comportamento sexual através de entrevista face-a-face. Será
mais difícil (devido à desiderabilidade social) relatar alguns tipos de comportamento
sexual (por exemplo, sexo oral, sexo anal) ou algumas disfunções sexuais (disfunção
erétil, por exemplo) através de entrevista face-a-face do que através de preenchimento
de questionário anónimo.
4. Efeito halo (efeito descrito por Thorndike): refere-se à possibilidade de que a próprio
exercício de avaliação ou observação possa interferir no julgamento sobre outros
fatores, contaminando o resultado geral. Por exemplo, nos processos de avaliação de
desempenho, o efeito halo tem a ver com a simpatia que o avaliador tem pela pessoa
que está a ser avaliada. Portanto, neste caso o viés tem a ver com a subjetividade do
investigador no processo de recolha de dados (em contexto de recolha de dados
através de métodos de observação ou de entrevista).

Nos casos de estudos de avaliação do impacto de uma intervenção sem grupo de
controlo (com testes antes e depois da intervenção) deve ser dada especial atenção
ao potencial efeito do teste. Os investigadores devem evitar o uso repetido de testes
idênticos em estudos a longo prazo, uma vez que a melhoria observada no pós-teste
pode dever-se ao pré-teste. Uma boa opção pode ser o desenvolvimento de "formas
paralelas" de testes – ou seja, testes com conjunto diferentes de itens ma com
dificuldade ou significados semânticos equivalentes.
Em estudos de avaliação do impacto de uma intervenção, aleatorizados e com grupos
de controlo, é importante garantir que o estudo seja “cego”. Nestes casos, o
participante não sabe se pertence ao grupo de intervenção ou ao grupo de controlo.
Para reduzir o efeito de desejabilidade social, podem ser usados instrumentos com
menor ‘valor facial’ (testes que ‘disfarçam os seus objetivos de avaliação). Por
exemplo, um teste sobre consumo de álcool pode ser apresentado como um teste de
estilos de vida se apresentado no contexto de um conjunto mais abrangente de
Página 74 / 163
perguntas, sobre atividade física, tabagismo, consumo alimentar, etc. Outra forma de
minimizar este efeito é garantir o anonimato ou confidencialidade das respostas aos
participantes.
Viéses de instrumentação
A instrumentação pode tornar-se uma ameaça à validade interna nos casos em que os
resultados do estudo são devidos às mudanças na calibração do instrumento, no
procedimento de medição ou do/no observador.
Por outras palavras, as mudanças observadas entre os pontos de observação podem
ser devidas às mudanças do procedimento de recolha de dados e não ao efeito de
uma intervenção ou à mudança desenvolvimental dos indivíduos observados.
Exemplo
Se o teste administrado após a intervenção for mais fácil de responder do que teste
administrado antes da intervenção, os sujeitos evidenciarão uma melhoria ao longo do
tempo, sendo essa melhoria (mal) interpretada como sendo um efeito da intervenção.
Exemplo
Imagine-se um estudo em que se mede a pressão arterial como outcome terapêutico.

Se a medição original for feita com recurso a um esfigmomanómetro aneróide e as
medições posteriores forem conduzidas com um dispositivo automatizado, é difícil (ou
mesmo impossível) determinar se as mudanças na pressão sanguínea são devidas às
diferenças entre dispositivos ou ao resultado da intervenção.

A ameaça do viés de instrumentação pode ser reduzida se o investigador optar pela
consistência de métodos de recolha de dados. Isso inclui:
 A padronização de um instrumento (eventualmente, com recurso a “testes

paralelos” ou equivalentes)
Página 75 / 163
 Os investigadores responsáveis pela recolha de dados devem ser treinados de

forma idêntica
 Avaliar a fiabilidade (consistência de avaliação) inter-rater, para determinar o

grau de consistência entre os indivíduos que recolhem os dados
 Calibrar com regularidade os instrumentos de medição (por exemplo, balanças,

esfigmomanómetros, etc.)
 Utilizar um método de administração de escalas que seja consistente ao longo

do estudo. Por exemplo, recolher os dados sempre no mesmo tipo de ambiente
(por exemplo, em casa dos entrevistados) e sempre da mesma forma (por
exemplo, sempre através de entrevista face-a-face)
Viés de regressão em relação à média (regressão estatística)

A ameaça de regressão refere-se à tendência de pontuações extremas obtidas no pré-
teste para serem mais aproximadas à média da população, no pós-teste. Isso pode
acontecer quando o assunto foi selecionado com base em pontuações extremas de
pré-teste (percentis baixos ou elevados, relativamente à distribuição encontrada na
população), uma vez que os resultados extremos numa distribuição tendem a
aproximar-se da média em testes repetidos, mesmo sem nenhum
tratamento/intervenção.
Exemplo
Imagine-se um estudo com doentes com depressão, em que se selecionam os

participantes com base numa escala de autoestima e que apenas são recrutados
indivíduos com valores muito baixo nessa escala. A intervenção consiste em terapia
cognitivo-comportamental e não é incluído um grupo de controlo. Após três meses de
intervenção, repete-se a administração da escala de autoestima e verificam-se
melhorias substanciais.
Essas melhorias podem ser devidas ao efeito de regressão para a média e não ao
efeito da intervenção. O facto de o estudo não incluir um grupo de controlo impede
uma interpretação adequada dos resultados.
Página 76 / 163

Os investigadores podem minimizar esta ameaça evitando a seleção de participantes
com base em resultados extremos. O recurso a grupos de controlo é também
fundamental para avaliar o potencial efeito de regressão à média.
Podem ainda avaliar os indivíduos mais do que uma vez, na fase pré-teste e usar a
média das pontuações como valor de baseline. Isto é especialmente importante
quando existe um efeito bastante provável de desejabilidade social ou de Hawthorne.
Um exemplo clássico deste procedimento é o da repetição da avaliação da tensão
arterial por profissionais de saúde, em contexto de centro de saúde ou hospital, de
forma a evitar o “efeito da bata branca” (para muitas pessoas, a tensão arterial sobe
quando estão a ser observadas por um médico – trata-se do que pode ser entendido
como um caso especial de efeito Hawthorne).
Viés de seleção
O viés de seleção diferencial pode ocorrer quando, em estudos de avaliação de
efetividade ou custo-efetividade, os indivíduos não podem por algum motivo ser
atribuídos aleatoriamente aos grupos de intervenção e de controlo, fazendo com que
(por algum motivo) os grupos não sejam iguais em algumas variáveis ou
características relevantes, logo desde o início da intervenção. Esta não aleatorização
entre grupos pode fazer com que as diferenças encontradas nos resultados pós-
intervenção sejam devidas a diferenças pré-existentes entre os grupos e não ao
impacto real da intervenção.
Outra forma de encontrar viés de seleção é quando queremos estudar, de forma
retrospetiva, determinantes de uma determinada doença. Para isso, podemos utilizar
um desenho de investigação denominado “Estudos de caso-controlo” (no Capítulo 6
veremos mais detalhes sobre este tipo de desenho de investigação).
Nestes casos, pode acontecer que as pessoas com a doença em estudo e que
recrutamos para o estudo sejam apenas as que sobreviveram ao final de, por
exemplo, 10 anos. E pode acontecer que essas pessoas sejam, por algum motivo,
diferentes de todas as outras que não sobreviveram (e, assim sendo, podemos estar a
introduzir um viés importante aquando da seleção das pessoas).
Ainda outra forma de viés de seleção diferencial é a que se encontra frequentemente
em estudos através de inquérito com resposta obtida por questionários
Página 77 / 163
autoadministrados (preenchidos pelos próprios participantes, por exemplo, em

questionários enviados por correio).
Os participantes nestes estudos podem ter características muito diferentes das
pessoas que também receberam o convite mas que decidiram não participar. As
diferenças podem ser ao nível sociodemográfico (por exemplo, quem responde pode
ter mais instrução formal) ou ao nível da própria relação com o objeto de investigação
(por exemplo, num estudo sobre perceções sobre adoção de crianças, é razoável
pensarmos que é mais provável que quem tenha passado pelo processo ou quem tem
intenção de passar pelo processo tenha mais interesse em passar do que quem não
passou pelo processo. Da mesma forma, em estudos de satisfação com cuidados de
saúde, pode haver um viés de seleção no sentido de haver mais pessoas na amostra
que estão muito satisfeitas ou que estão muito insatisfeitas do que pessoas mais ou
menos satisfeitas.
Exemplo
Imagine-se que os doentes de uma clínica são alvo de uma intervenção educacional
(uma ação de sensibilização com a duração de 4 horas, por exemplo, dada pelo
psicólogo da clínica) sobre o uso responsável de medicamentos. E que os doentes de
outra clínica não são alvo desta intervenção de educação para a saúde, recebendo
apenas um folheto sobre uso responsável da medicação por correio. Ambos os
métodos são usados para promover a adesão à toma de antihipertensores.
Quando o resultado para os dois grupos é medido no final do estudo, pode ser
confundido com o facto de os grupos não serem iguais em relação a variáveis
relevantes (por exemplo, percentagem de homens e mulheres na amostra de cada
grupo, idade, gravidade de hipertensão, índice de massa corporal), logo à partida (no
início do estudo.

No caso de estudos de avaliação de efetividade, é fundamental que a alocação dos
participantes a cada grupo em estudo (grupo ou grupos de controlo versus grupo ou
grupos de intervenção) seja feita de forma a garantir que caraterísticas (variáveis) que
podem ter efeito nos outcomes em estudo sejam equivalentes. Para o efeito, é
Página 78 / 163
frequente utilizarem-se sistemas de aleatorização

(uma espécie de moeda ao ar, para saber onde fica cada participante) por
emparelhamento: por exemplo, para cada mulher entre os 25 e os 35 anos que é
escolhida para o grupo de controlo, escolhe-se do grupo total de indivíduos que
aceitaram participar no estudo outra mulher entre os 25 e os 35 anos para o grupo de
intervenção.
No caso de estudos por inquérito é importante encontrar formas de garantir taxas
elevadas de participação. Uma taxa baixa de participação pode significar que quem
responde tem características muito diferentes de quem não responde. O critério sobre
o que é uma taxa aceitável de participação não é consensual. Podemos no entanto
considerar que uma taxa de participação acima dos 75% é ‘representativa’ da
população. Para o confirmar, importa tentar caraterizar os não-participantes nos
aspetos possíveis (por exemplo, sexo, idade, patologias, etc.) e ver se o grupo de
participantes difere do grupo de participantes relativamente a essas caraterísticas. É
também importante comparar as caraterísticas da amostra de participantes com as
caraterísticas da população, para perceber se existem desvios muito grandes (por
exemplo, percentagem de mulheres que respondeu ao questionário versus
percentagem de mulheres na população ou população-alvo em estudo.
Viés de mortalidade experimental

Este tipo de viés ocorre quando há uma perda de indivíduos participantes, ao longo do
estudo, que não é devida ao acaso. Acontece por exemplo, quando no final de um
estudo de avaliação de efetividade ou de custo-efetividade, a percentagem de perdas
dos indivíduos que foram alocados a cada grupo do estudo (pessoas que deixaram de
participar/responder) difere muito entre os grupos.
O viés de mortalidade experimental é especialmente importante também no caso de
estudos de coorte (veremos as caraterísticas deste tipo de estudo no Capítulo 6).
Nestes casos, se não se compreenderem os motivos de perda de participantes
(muitas vezes referidos como dropouts) podemos estar a perder informação relevante
para compreender adequadamente a relação entre a exposição a um determinado
fator (estilo parental, por exemplo) e o outcome (por exemplo, sucesso escolar).
Página 79 / 163
Qualquer que seja o desenho de investigação, os aspetos relativos à continuidade de

participação dos elementos amostrais são determinantes para a qualidade do estudo.
Também temos mortalidade experimental quando, por exemplo, a bateria de testes ou
a extensão de um questionário é tão ‘pesada’ que vários participantes desistem a meio
de os fazer ou preencher. Assim, ter em atenção o “burden”/peso dos questionário ou
processos de avaliação é fundamental para evitar mortalidade experimental.
Em estudos longitudinais (por exemplo, estudos de avaliação de efetividade ou de
custo-efetividade ou estudos de coorte) é importante manter uma relação próxima com
os participantes (por exemplo, através de enviar de lembretes regulares, dando
feedback de alguns resultados, dando informação clínica relevante para os
participantes se isso não interferir com as variáveis em estudo, etc.). Outros aspetos
importantes são: recorrer a incentivos (dar algum tipo de gratificação pode ser
adequado), facilitar ao máximo a colaboração (por exemplo, pagando deslocações ou
indo ter com o convidado em vez de o fazer deslocar-se), selecionar uma amostra com
uma baixa probabilidade de desistência.
Contaminação entre grupos do estudo

Um dos fatores de contaminação é quando elementos pertencentes ao grupo de
intervenção e ao grupo de controlo se conhecem ou quando um desses grupos tem
um motivo (menos óbvio) para que o estudo seja bem sucedido ou para que falhe.
Exemplo
Imagine-se um estudo de avaliação de efetividade de uma ação de educação para a

saúde, promovendo literacia sobre obesidade em adolescentes, em que se pretende
avaliar o efeito da intervenção em termos de processos de autorregulação e de
qualidade da motivação para o controlo do peso corporal. Imagine-se que os
investigadores decidiram fazer o estudo numa escola secundária, sendo que algumas
turmas beneficiaram da intervenção e outras não beneficiaram (controlando os viéses
de seleção, atrás referidos).
É muito provável que os adolescentes que participaram na ação de literacia em saúde
falem com os adolescentes que não participaram e, assim sendo
Página 80 / 163
“contaminam” o grupo de controlo em termos de conhecimento. Neste caso, os grupos

podem deixar de ser diferentes no que se refere a intervenção/não-intervenção e,
portanto, o efeito em estudo não pode ser feito de forma adequada.
Efeito do investigador/inquiridor
O viés do investigador é bastante semelhante ao efeito de reatividade explicado
anteriormente. Refere-se a qualquer comportamento do investigador que impeça uma
observação dos dados a recolher ou teste imparcial da hipótese em estudo. A
ocorrência deste viés pode comprometer a qualidade de estudo, uma vez que os
resultados obtidos podem ser influenciados pelas expectativas do investigador.
Exemplo
Durante uma entrevista. o investigador pode reagir de forma mais positiva (sorriso,
aceno de concordância) perante determinada resposta do participante, levando-o a
reagir de uma forma específica, no sentido do confirmar as hipóteses ou pressupostos
iniciais do investigador.
Exemplo
Outro exemplo, clássico: em estudos de avaliação de efetividade ou custo-efetividade

de uma intervenção, os profissionais que administram a intervenção (ou seja, em
contato direto com os participantes) podem ter expectativas positivas quanto à eficácia
ou efetividade dessa intervenção e, por esse motivo, podem ser especialmente
empáticos e empenhados na promoção de adesão ao processo de mudança no grupo
de participantes que estão a ser alvo da intervenção; e, por outro lado, podem tratar,
de forma não intencional/consciente, os participantes do grupo de controlo de forma
menos empenhada. Assim, os resultados mais positivos que se encontrem no grupo
de intervenção podem estar enviesados pelo facto de o comportamento dos
profissionais de saúde ser diferente entre grupos (e não apenas devido ao efeito real
da intervenção – por exemplo, um medicamento ou uma ação de educação para a
saúde – em si mesmo).
Página 81 / 163

A forma mais habitual de anular este efeito é o de utilizar desenhos de investigação
“cegos” ou “duplamente cegos”. Diz-se que um estudo é “cego” quando o participante
não sabe se pertence ao grupo de controlo ou ao grupo de intervenção. Em estudos
de avaliação do efeito de medicamentos, por exemplo, não sabe se está a tomar o
novo medicamento (em estudo – grupo de intervenção) ou se está a tomar um
medicamento já existente ou um placebo (grupos de controlos). Para o efeito, é
garantido que os medicamentos administrados sejam exatamente iguais em termos de
cor, tamanho, etc. Desta forma, reduz-se o efeito de reatividade por parte dos
participantes.
Diz-se que o estudo é duplamente cego quando, para além do participante, também
quem administra o tratamento ou intervenção não sabe se está a administrar o
fármaco em estudo (intervenção) ou se está a administrar o fármaco já existente ou o
placebo (controlos).
Por fim, o estudo pode ser triplamente cego, se quem avalia estatisticamente os
outcomes da intervenção não sabe os códigos, nas bases de dados estatísticas,
associados ao grupo de intervenção ou de controlo. Desta forma, as decisões
estatísticas são tomadas sem influência (mesmo que não consciente – não se trata
aqui de comportamento pouco ético por parte do investigador) do conhecimento sobre
qual é o grupo de intervenção e o ou os grupos de controlo.
Outras ameaças à validade externa

Efeito de interação do teste: quando um pré-teste aumenta ou diminui a
sensibilidade dos indivíduos para a variável em estudo (outcome).
Interferência de múltiplos tratamentos: quando são aplicados múltiplos tratamentos
aos mesmos indivíduos, dificultando a determinação da causa dos resultados
observados.
Efeito de medição: alterações nos resultados do estudo em consequência de
métodos diferentes de/na recolha de dados.
Efeito de novidade: quando os participantes são sensíveis (favoráveis) ao uso de
novas tecnologias e experienciam aumento no interesse e motivação.
Página 82 / 163
Efeito placebo: quando os participantes experienciam melhoras no seu estado de

saúde como resultado da fé no tratamento, programa ou provedor. O placebo pode ser
assim considerado como um factor de confundimento.
IV.1.4 Efeito placebo

A palavra placebo é Latina e significa “devo agradar” ou “agradarei”. Um placebo é
uma substância ou condição inativa com a aparência de um tratamento ativo. O termo
começou a ser usado pela comunidade médica em meados do século XVIII, sendo a
sua definição original atribuída a Alexander Sutherland (embora para muitos
historiadores da ciência o termo tenha sido introduzido por William Cullen).
Os primeiros estudos relevantes sobre o efeito placebo foram conduzidos por Henry
Beecher2 que, em 1955, descreveu os efeitos do uma substância inerte (sem princípio
ativo) mas administrado como se tivesse princípio ativo, numa variedade de
condições, desde dores de cabeça a simples constipações. Beecher relata que
aproximadamente 35% dos pacientes que receberam placebo apresentaram
melhorias. Resultados de muitos estudos posteriores confirmaram esta descoberta.
Quando o tratamento com uma substância inerte (sem princípio ativo) produz efeitos
adversos, o termo utilizado deixa de ser placebo para ser nocebo.
Explicações da sua efetividade

Considera-se que a efetividade do placebo representa uma interação de vários
fatores, entre os quais:
 Atenção, interesse e preocupação dos médicos com a saúde dos pacientes
 Tipo de tratamento. Foi observado, por exemplo, que cápsulas grandes e

coloridas administradas em duas ou mais doses geram uma resposta placebo mais
forte do que cápsulas pequenas e brancas, administradas numa única dose. Além
disso, injeções são mais poderosas do que comprimidos, enquanto a cirurgia
produz a resposta placebo mais forte. Ou seja, métodos mais invasivos têm mais
efeito placebo que métodos menos invasivos.
2 Beecher,HK. The powerful placebo. Journal of the American Medical Association. 1955; 159 (17): 1602–
06.
Página 83 / 163
 Expectativa: as pessoas agem da forma que julgam que deveriam. Por outras
palavras, pessoas que são tratadas sem que o saibam não experienciam diferença
em comparação com pessoas que sabem que estão a ser tratadas.
 Adesão a comportamentos saudáveis (que resultam em confundimento do

efeito terapêutico do placebo)
 Diferenças individuais: inteligência, personalidade, locus de controlo,

consciência autonómica, dependência física e/ou emocional, impulsividade, etc.
Placebo em investigação médica

Já referimos que o placebo (ou nocebo) pode ser considerado como um fator de
confundimento. De facto, ao estudar o efeito de uma intervenção, a crença do
participante de que está a fazer algo positivo para si próprio (nomeadamente, em
termos de saúde) representa uma variável que deve ser controlada.
Assim sendo, o placebo desempenha um papel importante em investigação clínica.
Como o efeito placebo existe, potencialmente, em qualquer intervenção clínica, o
estudo de avaliação da efetividade de uma intervenção deve, sempre que possível,
incluir um grupo de controlo em que o que é dado ao participante é uma intervenção
placebo (ou seja, sem efeito clínico expectável, por não ter substâncias ativas). E,
como já referido, a alocação dos participantes aos grupos (de intervenção e placebo)
deve ser cega. De preferência, triplamente cega.
Placebo em investigação psicoterapêutica

O uso de placebos é relativamente simples quando a intervenção é de natureza
farmacológica: basta que o produto ou serviço administrado tenha a mesma aparência
(por exemplo, medicamentos iguais, em cor, tamanho, etc.). O uso de placebos torna-
se mais difícil, embora possível, quando a intervenção é de natureza psicológica. Em
psicoterapia, por exemplo, o recurso a placebo consiste na consulta de um terapeuta
pelo mesmo número e duração de sessões que no grupo de intervenção. A diferença
reside no facto de que nos grupos de controlo os terapeutas abstêm-se de usar
qualquer "ingrediente terapêutico ativo". Realizam apenas uma intervenção mínima,
considerada como tendo um efeito mínimo (utilizando apenas os chamados fatores
comuns, que passam por técnicas fenomenológicas como: escuta ativa, reflexão
Página 84 / 163
empática, etc.).
É ético utilizar placebo com propósito terapêutico?

No contexto clássico de estudos de avaliação de efetividade clínica, o uso de placebo
não passa, de forma alguma, por enganar o doente: é um pré-requisito ético que os
doentes sejam informados de que têm uma determinada percentagem de hipóteses de
serem alocados ao grupo de controlo (50%, se forem apenas dois grupos).
IV.1.5 O que é a validade externa?

Como já vimos, enquanto que a validade interna se refere ao estabelecimento da
relação entre duas variáveis (tais como tratamento e resultado), a validade externa
refere-se à generalização de resultados para além da amostra. Portanto, a validade
externa foca-se na generalização do estudo para outras populações, grupos, estudos
ou modelos teóricos.
Ameaças à validade externa

Validade populacional - Refere-se à generalização para pessoas não incluídas no
estudo. Até que ponto é que os resultados encontrados com uma determinada
amostra são representativos da população em estudo?
Validade ecológica - Refere-se a configurações não amostrais. Um estudo tem

elevada validade ecológica se generalizado para além do ambiente laboratorial, para
contextos de investigação mais realistas.
Como é óbvio, não existe validade externa se a validade interna não estiver garantida.
Assim, entre os principais fatores que podem ameaçar a validade externa estão os
que foram referidos para a validade interna, e muito em particular:
1. Os viéses de seleção (caraterísticas da amostra)
2. O efeito de teste e, em particular, os efeitos de desiderabilidade social e de
reatividade (efeito Hawtorne)
3. Os viéses de instrumentação
4. Efeito do investigador
Página 85 / 163
5. Interferência de múltiplos tratamentos
Viés de seleção: não representatividade

Os viéses de seleção comprometem obviamente a generalização dos resultados para
a população em estudo. Se as caraterísticas dos participantes escolhidos não
corresponderem ou se se desviarem muito das caraterísticas dos elementos que
constituem a população a generalização dos resultados não é possível.
Já vimos alguns exemplos de viés de seleção, aquando da reflexão sobre validade
interna. Outro exemplo possível é o de um estudo em que sejam selecionados de
jovens adultos para integrar um grupo de tratamento de ansiedade, provenientes de
uma clínica de saúde, enquanto que os participantes dos grupos de controlo são
selecionados de uma população de alunos universitários, do curso de psicologia.
Temos aqui um caso em que os grupos de tratamento e controlo são constituídos por
diferentes populações de jovens adultos, com caraterísticas diferentes e que podem
ter influência na comparação dos resultados finais.
A melhor forma de proteger a investigação de ameaças relacionadas com a seleção
dos participantes é garantir que a constituição das amostras segue processos de
escolha aleatória com base no conjunto total da população (ou universo – são termos
equivalentes). E, havendo vários grupos em estudo (por exemplo, de intervenção e
controlo), garantindo que alocação a cada um dos grupos é também aleatória.
Tamanho da amostra
Mas para garantir que a seleção dos participantes no estudo torna a amostra
“equivalente” à população em termos das caraterísticas consideradas como mais
importantes para estudar adequadamente o fenómeno em questão, não basta
assegurar bons procedimentos de recrutamento (onde e como se convidam as
pessoas a participar) e de aleatorização.
Outro aspeto decisivo é o tamanho amostral. A quantidade de pessoas a incluir na
amostra deve ser capaz de assegurar dois aspetos fundamentais:
 que um número mínimo de indivíduos com caraterísticas mais raras esteja

representado na amostra (por exemplo, garantir que pessoas com obesidade
severa estejam presentes na amostra, se isso for uma variável importante para o
estudo); e
Página 86 / 163
 que o tamanho dos grupos permita uma comparação estatística robusta e

fiável, entre eles. Trata-se aqui de garantir que a dimensão da amostra não seja
tão pequena que possa limitar o poder do teste estatístico e, com isso, ocultar
efeitos significativos do ponto de vista estatístico. que poderiam ser revelados com
uma amostra de maior dimensão.
Existem várias formas de definir o tamanho amostral de um estudo, dependendo de

diversos fatores, como:
 Prevalência do fenómeno em estudo, na população (e dos diferentes níveis ou

facetas do fenómeno, como por exemplo, níveis de severidade de depressão).
Quanto menos prevalente, maior o tamanho amostral.
 Quantidade e tipo de variáveis em estudo (e respetivas escalas de valores).

Quantas mais variáveis, maior o tamanho amostral.
 Número de grupos ou braços do estudo. Mais grupos implica maior tamanho

amostral.
 Níveis de estratificação dos resultados (por sexo, por idade, etc.). Mais níveis
implica maior tamanho amostral.
 Tipo de análise estatística (comparação de médias, comparação de

proporções, testes multivariados ou multifatoriais, etc.) e complexidade em termos
de ajustamento de variáveis com potencial de confundimento.
 Diferença clínica mínima, para o efeito da intervenção ser considerado como

relevante. Os testes estatísticos até podem mostrar haver diferença entre, por
exemplo, o grupo de intervenção e o grupo de controlo (quando se compara o
outcome principal do estudo). Mas é importante garantir que o tamanho amostral
permite verificar uma diferença média suficientemente relevante entre os grupos,
do ponto de vista clínico. Por exemplo, verificar-se uma diferença de qualidade de
vida relacionada com a saúde (outcome) entre o antes e o depois da uma
intervenção na ordem dos 3 pontos (numa escala de 0 a 100 pontos) pode não
representar uma diferença relevante do ponto de vista clínico. Se o tamanho
amostral for suficientemente grande, a diferença entre os grupos pode ser
verificada como sendo superior (por exemplo, de 5 pontos, e ser, então,
Página 87 / 163
clinicamente relevante).
A definição do tamanho amostral implica a realização de uma boa revisão de literatura,

nomeadamente para aprender sobre como é que outros estudos similares lidaram com
esta decisão. Existem obviamente várias fórmulas estatísticas para definir o tamanho
amostral. Não vamos abordar este aspeto no presente curso. Diremos apenas que
existem várias ferramentas disponíveis na Internet para o cálculo do tamanho
amostral, com destaque para o website do EpiInfo, que apresenta diferentes
alternativas de cálculo, em função do desenho de investigação e objetivo do teste
estatístico que se pretende fazer: http://www.openepi.com/SampleSize/SSCohort.htm
IV.1.6 Relação entre validade interna e validade externa

Validade interna e validade externa não são independentes uma da outra. Obviamente
que se um determinado estudo sofrer de viéses sérios, a validade interna pode estar
comprometida a um nível tal que não permite sequer pensar em validade externa.
O problema é mais relativo em termos de confundimentos: a este nível, validade
interna e validade externa tendem a estar inversamente relacionadas. Isto significa
que estudos com elevada validade interna (com muito controlo entre variáveis,
reduzindo a probabilidade de confundimento) tendem a ter baixa validade externa e
vice-versa.
Estudos realizados em ambientes altamente controlados (por exemplo, estudos
experimentais) podem ter elevada validade interna, mas distanciam-se da realidade do
quotidiano, resultando em baixa validade externa. Por outro lado, estudos com maior
validade ecológica, feitos em contexto mais ‘real’, como por exemplo, estudos de
avaliação de impacto de ações de promoção de literacia dirigidas à comunidade em
geral, apresentam maior validade externa do que estudos laboratoriais controlados
randomizados para avaliação de efetividade de uma intervenção, num grupo limitado
de indivíduos (acompanhados de forma mais regular, quer em termos de intervenção
quer de avaliação de outcomes). Mas, nestes casos, o grau de controlo de variáveis
de confundimento é muito limitado, havendo variadíssimos fatores que podem interferir
na relação entre as variáveis dependentes e independentes. E, assim sendo, a
validade interna destes projetos é limitada.
Página 88 / 163
CAPÍTULO V - Medidas e indicadores de efetividade
No Capítulo 1 explicámos o que se entende por outcomes (nomeadamente primários e

secundários). Explicou-se então que, em termos práticos, consistem nas variáveis que
podem ser utilizadas para avaliar o efeito de uma determinada intervenção. Trata-se
assim de termos variáveis que, quando observadas antes, durante e/ou depois das
intervenções em estudo, permitem inferir a evolução de um determinado fenómeno (de
saúde, educacional, organizacional, etc.), ao longo do tempo que se assume
(teoricamente) poderem estar associadas à intervenção em causa.
Por exemplo, se estamos a estudar o efeito de uma determinada estratégia clínica
para depressão, podemos usar uma escala que avalia depressão. Nesse caso,
podemos pedir aos pacientes para responder à escala antes da primeira consulta, de
quatro em quatro consultas e, por exemplo, três e seis meses após a última consulta.
Repare-se que se assume, teoricamente, que a pontuação da escala se relaciona de
alguma forma com a patologia em estudo, bem como com a intervenção
psicoterapêutica em causa.
Observação 0 Observação 1 Observação 2 Observação n Observação n+1 Observação n+y

(Baseline: antes da (durante a (follow-up) (follow-up)
intervenção começar) intervenção)
Tempo de estudo/intervenção antes, durante e após a intervenção (follow-

up): medições repetidas
Quando o estudo segue um desenho experimental, como por exemplo, um ensaio

clínico, os outcomes são indicadores de efetividade que se caracterizam por variáveis
de estado. Por exemplo, no caso de se tratar de um ensaio clínico, podemos então
considerar indicadores como: componentes (e respetivos níveis) de depressão, de
ansiedade, de agitação psicomotora, avaliados através de escalas de autorrelato ou
por observação clínica, indicadores fisiológicos (resposta galvânica da pele, registos
eletroencefalográficos, níveis de glicemia, níveis de cortisol, etc.), indicadores
antropométricos (índice de massa corporal, perímetro da cintura, etc.), entre muitas
outras possibilidades.
Página 89 / 163
Estes exemplos são apenas ilustrativos. Existem escalas e medidas para uma
extensíssima gama de fenómenos psicológicos (cognitivos, emocionais,
comportamentais, sociais, etc.), e as pontuações dessas escalas e medidas podem
ser usadas como indicadores de efetividade das intervenções.
Nem sempre é necessário ou possível recolhermos dados a nível individual. Por
exemplo, no caso de estudarmos efeitos comunitários de uma intervenção
desenvolvida para promoção de saúde, para prevenção de doença, ou para promoção
de sucesso educacional ou adoção de determinados hábitos de trabalho, é possível
recorrer a indicadores que são recolhidos de forma regular por entidades estatais ou
por organizações que se dedicam a este tipo de análise (ao nível do sistema de
saúde, sistema de educação, etc.).
Só a título de exemplo de instituições produtoras de indicadores comunitários que
podem ter relevância para estudar o efeito de intervenções comunitárias (a nível
nacional, regional ou mesmo de freguesia, por exemplo) destacam-se:
 Instituto Nacional de Estatística
 Direção-Geral da Saúde
 Direção-Geral da Educação
 Eurostat
 Organização Mundial da Saúde
Cada vez mais é mais fácil aceder a dados existentes para uma multiplicidade de
variáveis, através destas fontes de dados. Além disso, a política de acesso a dados
recolhidos por grupos de investigação afiliados a entidades académicas
(universidades, por exemplo) em contexto de estudos apoiados por programas de
financiamento público reforça cada vez mais o princípio da partilha dos dados para
efeitos de investigação.
V.1 Quantificação de patologia/morte (indicadores de saúde pública)
Estatísticas vitais
Nascimentos
Página 90 / 163
Óbitos
Casamentos
Divórcios
Estatísticas de morbilidade
Declarações obrigatórias de doença

Nacionais (e.g., tuberculose, VIH/SIDA, …)
Internacionais (peste, cólera, febre amarela, febre da carraça, febre recorrente,
poliomielite recorrente, gripe)
Dados laboratoriais
Dados hospitalares
Grupos de Diagnóstico Homogéneos (GDH, reveladores de morbilidade em
contexto hospitalar)
Anomalias congénitas
Infeções nosocomiais (transmitidas em contexto de contacto com hospitais)
Tópicos especiais (e.g., registos oncológicos, farmacovigilância, …)

Inquéritos nacionais de saúde
V.1.1 Indicadores de saúde populacional

A medição de indicadores a nível populacional para efeitos de quantificação de um
fenómeno pode ser feita através de números absolutos (quantas pessoas são
afetadas ou caraterizadas pelo fenómeno em causa, numa determinada unidade
geográfica e temporal) ou, mais frequentemente, por taxas.
Entende-se por taxas o número de casos a dividir pelo tamanho da população em
risco, multiplicando por 10 elevado a um valor n, para facilitar a compreensão da
dimensão de fenómenos raros. Por exemplo, é preferível (mais “inteligível”) dizer-se
que um fenómeno tem uma prevalência de 20 por cada 100 000 habitantes (20*105),
do que se dizer que o fenómeno ocorre em 0.0002% da população.
Página 91 / 163
Taxas de morbilidade3
Taxa de incidência
Nº de casos novos de patologia/efeito num determinado período de tempo
População em risco no ponto médio do período temporal em causa
Taxa de incidência pessoa-tempo (útil quando o tempo de exposição varia entre

pessoas!)
Somatório dos períodos de tempo durante os quais cada pessoa da população está em risco
Taxa de incidência cumulativa (probabilidade de incidência)

Número de pessoas em risco na população, no início desse período temporal
Taxa de prevalência
Nº de casos correntes de patologia/efeito num determinado período de tempo
População no ponto médio do período temporal em causa
Prevalência= taxa incidência * duração média da doença
Prevalência da doença
3
Por serem taxas populacionais, estas razões são habitualmente expressas em 10n habitantes
Página 92 / 163
Taxas de mortalidade4
Taxa de mortalidade bruta

Nº de mortes num determinado período de tempo
População no ponto médio do período temporal em causa
Taxa de mortalidade específica por idade / sexo / causa de morte

Nº de mortes num determinado grupo etário (ou de um determinado sexo ou por uma
determinada causa de morte) num determinado período de tempo
População nas condições específicas, no ponto médio do período temporal em causa
Taxa de mortalidade materna

Nº de mortes atribuídas à gravidez num período determinado de tempo
Número de nados vivos no período temporal em causa
Taxa de mortalidade infantil

Nº de mortes até ao primeiro ano de vida, num determinado período de tempo
Número de nados vivos nesse período temporal
Taxa de mortalidade neonatal

Nº de nados vivos falecidos até aos 28 dias de vida, num determinado período de tempo
Número de nados vivos nesse período temporal
4
Por serem taxas populacionais, estas razões são habitualmente expressas em 10n habitantes
Página 93 / 163
Taxa de mortalidade perinatal

Nº de mortes fetais com mais de 28 semanas de gestação + Nº de mortes de nados vivos até
aos 7 dias, num período determinado de tempo
Nº de nados vivos + Nº de mortes fetais no período temporal em causa
Taxa de letalidade (%)

Nº de mortes por doença específica, num determinado período de tempo
Número de casos dessa doença diagnosticados nesse período temporal
De seguida, são apresentados a título de exemplo e apenas para a área da saúde,
alguns indicadores muito utilizados. São apenas alguns exemplos, de entre um grupo
vastíssimo, mesmo apenas no âmbito da avaliação da saúde. Existem obviamente
muitos outros instrumentos, nas áreas do ensino (sucesso escolar, indicadores de
disciplina, indicadores de autocontrolo cognitivo, regulação emocional, etc.), nas áreas
organizacionais e laborais (indicadores de absentismos, presenteismo, burnout,
produtividade, liderança, etc.), nas áreas da psicologia do desporto, da psicologia
ambiental, da psicologia forense, do consumo de fármacos, etc. Seria impossível ser
exaustivo. Procuramos apenas dar alguns exemplos ilustrativos de indicadores
frequentemente encontrados em relatórios nacionais e internacionais do estado de
saúde das populações.
V.1.2 Exemplos de indicadores de saúde que implicam recolha de dados a nível

individual
Página 94 / 163
Página 95 / 163
Página 96 / 163
Exemplos de indicadores de estado de saúde da população
Exemplos de indicadores sociais e laborais
Página 97 / 163
Exemplos de indicadores de acesso à saúde e qualidade assistencial
Página 98 / 163
V.2 Construção e avaliação das propriedades de instrumentos de medição

Nem sempre existem instrumentos adequados para avaliar os fenómenos em estudo.
Pode ser porque se trata de um novo fenómeno (por exemplo, quando o conceito de
bullying começou a ser estudado, não existiam instrumentos de avaliação de bullying,
que permitissem fazer inquéritos para estimar a prevalência do fenómeno). Pode
também ser porque existem instrumentos que já foram utilizados em determinados
contextos ou com determinadas populações mas que nunca foram utilizados em
populações de interesse (por exemplo, um instrumento que tenha sido estudado para
avaliar depressão em contexto hospitalar mas que nunca tenha sido utilizado para
estudar depressão em contexto populacional, não clínico).
Nestes casos, é necessário desenvolver, por vezes de raiz, o instrumento. E importa
estudar se o instrumento tem propriedades adequadas. Ou seja, (a) se avalia
adequadamente o constructo que se propõe avaliar, (b) se avalia de forma consistente
no tempo e/ou espaço, (c) se consegue discriminar adequadamente entre indivíduos
com níveis reais diferentes do fenómeno. Este último aspeto é fundamental para se
poder utilizar os instrumentos em estudos de avaliação de efetividade ou custo-
efetividade associados a uma intervenção. De facto, o instrumento tem de ser capaz
de detetar diferenças entre o antes da intervenção e o depois, no caso de essa
diferença existir.
Por fim, o instrumento também pode ter ambições de constituir-se como critério de
diagnóstico e, assim sendo, importa saber qual o nível ou pontuação do instrumento
que separa de forma mais adequada indivíduos com diagnóstico positivo de indivíduos
com diagnóstico negativo.
V.2.1 De A a Z: roteiro abreviado para a construção de um questionário

Podemos considerar duas situações muito distintas, aquando da construção de um
instrumento de medição de indicadores relevantes para a avaliação de efetividade ou
custo-efetividade:
 Instrumentos que medem variáveis simples. Por variáveis simples, entendemos

variáveis que medem, de forma direta, fenómenos reais e observáveis. A título de
exemplos, temos:
Página 99 / 163
• Número de refeições por dia

• Horas de sono por dia (ou horário do deitar e levantar da cama) - Número de
horas de estudo por semana
• Resultados académicos (notas a português, matemática, etc.)
• Número de batidas cardíacas por minuto
• Nível de glicose em jejum
• Temperamento corporal
• Etc.
O que há de comum nestes exemplos é que o valor expresso nos mesmos vale por si
só. Não é necessário combinar entre eles para construir um indicador global ou mais
complexo. São indicadores “simples”.
Isso é diferente de, por exemplo, avaliarmos a presença ou ausência de gripe ou...
para usarmos exemplos na área da psicologia, literacia em saúde ou depressão. No
caso da gripe, teríamos de utilizar, de forma combinada, vários indicadores simples,
como por exemplo: temperatura corporal + dores de garganta + dores musculares+
arrepios + ... De forma similar, no caso da depressão, poderíamos combinar
indicadores ‘simples’ como: baixa autoestima + pessimismo relativamente ao futuro +
baixas expectativas relativamente ao apoio potencial de outros significativos + perda
de apetite + insónia + ...
Quando o valor de uma variável implica a combinação de várias variáveis, como no
caso da literacia em saúde ou da depressão, podemos considerar que a variável
composta consiste numa “variável latente”, que expressa um constructo com algum
grau de complexidade. Claro que a forma como consideramos cada variável
dependerá sempre da linha conceptual associada. Por exemplo, a variável depressão
pode ser avaliada como sintoma simples, através de uma única pergunta (por
exemplo, ”Nos últimos 7 dias até que ponto se tem sentido deprimido?”, com resposta
através de escala tipo Likert de ”1=Nada deprimido” a 5=Muito deprimido”), ou pode
ser avaliada de forma complexa (como variável latente), como vimos atrás.
No caso de termos um questionário que apenas mede variáveis ‘simples’ (conjunto de
itens sem relação conceptual que contribua para um valor global de uma variável
latente), o estudo de adequação do questionário “resume-se” à:
 Compreensibilidade do instrumento de avaliação (para simplificar,

consideremos a partir de agora que se trata de um questionário) pelos
Página 100 / 163

respondentes
 Dificuldade/aceitabilidade de preenchimento do questionário (o ‘peso’ do

questionário), devido ao tempo necessário para o efeito, à dificuldade de
interpretação das perguntas e/ou à natureza das mesmas (mais ou menos fáceis
de responder em termos de desejabilidade social – até que ponto são
percecionadas como “invasivas” ou desconfortáveis, por potencial de ferir
sensibilidades)
 Utilidade como critério avaliativo (se tiver ambições de diagnóstico, por

exemplo)
Repare-se que estes aspetos devem ser também estudados em

instrumentos/questionários que medem variáveis latentes. Mas, nesses casos, há
muitos outros aspetos a estudar, como veremos de seguida.
Voltando aos aspetos da compreensibilidade do questionário, o “peso” do
questionário, incluindo a desejabilidade social (tendência do participante para
responder a perguntas de forma expectável pelos outros – mesmo assumindo que a
resposta é anónima). Para avaliar estes aspetos, é necessário realizar um pré-teste
(com um número limitado de participantes – por exemplo, entre 5 a 10), em que se
avalia o tempo médio necessário para preencher o questionário bem como dúvidas de
interpretação e aspetos a melhorar no questionário.
Uma ferramenta muito útil para compreender a forma como as pessoas reagem ao
questionário é a entrevista cognitiva. A ideia central deste tipo de entrevista é
compreender a forma como a pessoa pensa para decidir a resposta à/s perguntas. A
método passa pelo Thinking Out Aloud, ou seja, pedir ao respondente para explicar,
em voz alta, a forma como leu, interpretou, recorreu à memória e decidiu a resposta. O
princípio que está subjacente à técnica é o de que, por muito simples que seja a
resposta a uma pergunta, esta implica sempre um processo cognitivo complexo, que
passa pelas fases indicadas
no diagrama seguinte.
Resposta a perguntas:
tarefas cognitivas
associadas
Página 101 / 163

Adaptado de: Alice Bell, Families and Children Group National Centre for Social Research (NatCen), 2006
Para avaliar a forma de pensar as respostas a questionários online é cada vez mais
habitual recorrer-se ao método de eye tracking. Através deste método, é possível
perceber-se em que partes do ecrã é que o respondente dedicou mais atenção
(demorou o olhar mais tempo). Combinando esta técnica com entrevista sobre o
motivo do tempo de olhar diferencial em partes específicas do ecrã, é possível
compreender melhor as reações dos respondentes aos desafios cognitivos levantados
por diferentes perguntas.
Mas voltemos atrás... Como se constrói um questionário, de raiz?

Para se garantir que um questionário cobre todas as dimensões ou áreas relevantes
de um determinado fenómeno, é necessário recorrer a métodos qualitativos, incluindo:
 Análise documental (como por exemplo, revisão de literatura – ver Capítulo 3),
para compreender adequadamente o fenómeno em estudo e para fazer um
levantamento de instrumentos de avaliação já existentes sobre o fenómeno
 Entrevistas (individuais, em grupo ou através de focus groups) a peritos
 Entrevistas (individuais, em grupo ou através de focus groups) a participantes

‘típicos’ da população visada pelo questionário (“peritos informais”).
Com base nestes levantamentos exploratórios de informação sobre o fenómeno em

estudo, reúne-se o conjunto inicial de perguntas e/ou itens a incluir no questionário. É
nesta fase do processo que também se define a “arquitetura” inicial do questionário:
ordem das perguntas, formatos das perguntas e de respostas (por exemplo, perguntas
de resposta fechada versus resposta aberta, perguntas de resposta única versus
perguntas de resposta múltipla, etc.), layout do questionário.
Com o levantamento qualitativo das perguntas e itens a incluir no questionário, é
normal haver conteúdos redundantes e, portanto, desnecessários. O desbaste,
eliminação, dessas componentes do questionário pode ser feito através de:
 Nova consulta a peritos, através de entrevista, agora no sentido de eliminar
Página 102 / 163

itens pouco relevantes ou redundantes
 Criação de consenso sobre o que é realmente essencial manter numa primeira

versão do questionário (por exemplo, através de técnicas que não serão
abordadas neste curso mas que são cada vez mais utilizadas para a construção de
consenso entre peritos, em matérias com pouca evidência: painéis Delphi, grupos
nominais, conferências de consenso, etc.)
 Análise fatorial, para redução do número de itens do questionário

(administrando o questionário com o total de itens iniciais a um número
relativamente alargado de participantes – mínimo 100, com pelo menos 15
indivíduos por cada item/pergunta do questionário)
Quando o questionário parece estar relativamente estável, com um tamanho aceitável

e com os conteúdos necessários e suficientes para avaliar o constructo em causa, na
perspetiva dos peritos, considera-se adequado do ponto de vista da validade de
conteúdo. A validade de conteúdo refere-se à perceção, por parte de peritos e
investigadores, de que o questionário inclui todos os aspetos relevantes para o estudo
do fenómeno em causa e de que não inclui itens ou perguntas desnecessárias ou
redundantes.
Existe um tipo específico de validade de conteúdo, a validade facial, que se refere à
adequação aparente dos conteúdos para quem responde ao questionário. Ou seja: um
questionário sobre depressão deverá obviamente incluir aspetos relacionados com
tristeza, melancolia, autoestima, sofrimento psicológico relacionado com os outros ou
com o futuro. Para quem responde, já poderá ter menos validade facial o facto de
incluir itens sobre perda de apetite ou de sono. Se o questionário for demasiado
extenso sobre perguntas sobre apetite, terá menos validade facial para quem o
responde, partindo do princípio de que foi convidado para responder a um questionário
sobre depressão.
Há, no entanto, questionários cuja validade facial pode ser reduzida por motivos
intencionais. É o caso de questionários que abordam temas sensíveis do ponto de
vista emocional, comportamental ou social. Por exemplo, é frequente encontrar
questionários sobre adições (ao álcool, a estupefacientes, ao jogo, ...) que ‘mascaram’
o objetivo principal do questionário com perguntas sobre estilos de vida mais
genéricos. Esta prática levanta, contudo, aspetos éticos: não é revelado ao
Página 103 / 163

respondente o verdadeiro motivo do convite para participar no estudo. Assim sendo, a

redução da validade facial deve ser bem ponderada.
Em que situações importa avaliar outras as propriedades psicométricas de
questionários?
Se mede variável/variáveis latente/s
Se não existe questionário para avaliar o constructo
Se existe mas não para a população em estudo
Se existe mas não tem demonstrado propriedades psicométricas adequadas
Vejamos de seguida o que se deverá avaliar, em termos de propriedades

psicométricas, em função do tipo de instrumento a trabalhar.
1. Se o questionário já existe (para a mesmo tipo de população mas noutra língua ou

para outra cultura)
 Adaptação linguística e cultural
 Estudo de propriedades psicométricas: validade de constructo, validade de

critério (se possível) e estudo da fiabilidade (consistência interna e fiabilidade
temporal)
Tradução e adaptação linguística

É recomendável que a tradução de um questionário de outra língua para a língua
portuguesa seja feita de acordo com algumas regras que são internacionalmente
aceites como as mais adequadas. Estas regras podem ser consultadas na referência
seguinte, da Scientific Advisory Committee of the Medical Outcomes Trust (2002):
CMOT. Assessing health status and quality-of-life instruments: Attributes and review
criteria. Qual Life Res. 2002;11(3):193–205.
De uma forma resumida, o processo decorre da seguinte forma:
 A versão original é traduzida, de forma independente, por dois tradutores

bilingues, tendo por língua dominante o português (e a outra língua, do
questionário original, como segunda língua bilingue)
 As duas versões independentes são analisadas pela equipa de investigação e

é criada uma versão portuguesa de consenso
Página 104 / 163

 A versão portuguesa de consenso é retrovertida para a língua do questionário

original por dois tradutores independentes bilingues, desta feita com a língua do
questionário original como língua dominante e o Português como segunda língua,
bilingue
 As duas versões independentes são analisadas pela equipa de investigação e

é criada uma versão de consenso
 Essa versão de consenso, na língua original do questionário, é comparada com

a versão original. Caso existam discrepâncias, são analisadas e é decidido o que
fazer (se repetir o processo, se manter as diferenças, justificando-as).
A adaptação linguística implica, para além da tradução (de acordo com o processo
descrito), uma análise dos conteúdos do questionário, no sentido de averiguar se:
 Os termos têm o mesmo valor semântico, quando traduzidos de forma literal

para o português
 Existem aspetos relevantes para a população/realidade portuguesa que não

estejam a ser considerados na versão original (por exemplo, uma escala de
depressão não deveria incluir perguntas sobre “saudade”?)
 Existem itens redundantes ou pouco relevantes para a população/realidade

portuguesa e que devam ser eliminados.
Como se poderá compreender, a apreciação de itens relevantes para a população
portuguesa mas omissos na versão original e/ou de itens redundantes ou pouco
relevantes implica uma apreciação da validade de conteúdo. Assim sendo, esta fase
do processo de adaptação cultural de um questionário já existente noutra língua (ou
para outra cultura) implica a consulta de peritos, como já referido para processos de
validação de conteúdo.
2. Se o questionário já existe para outras populações, na mesma língua
 Adaptação semântica, para verificar se a nova população-alvo compreende os

conceitos da mesma forma. Por exemplo, caminhar 500 metros é um conceito
completamente distinto para pessoas com obesidade mórbida, quando
comparadas com pessoas sem excesso de peso
 Estudo de validade de conteúdo
Página 105 / 163


temporal).
3. Se o questionário não existe de todo (processo completo)
 Geração de itens
 Validade de conteúdo

temporal).
V.2.2 Propriedades psicométricas dos questionários: breve glossário

A explicação detalhada das diferentes propriedades psicométricas de um questionário
seria matéria para um curso específico sobre o assunto, dada a complexidade da
matéria. Vamos apenas resumir alguns aspetos, de forma a sensibilizar para a
importância do estudo de cada uma delas.
Importa dizer, desde já, que as definições de cada um dos termos (bem como a
própria designação de alguns deles) varia muito em função da escola de pensamento
(ciências sociais versus ciências naturais, psicologia versus medicina, etc.).
Validade de constructo
Responde à pergunta geral: “Até que ponto o questionário mede aquilo que é suposto
medir?”.
A avaliação desta propriedade psicométrica implica necessariamente ter em conta os
aspetos teóricos associados ao fenómeno em estudo. Ou seja e a título de exemplo,
se a escala é construída para “medir” depressão à luz do modelo de Aaron Beck,
deverá incluir itens sobre a tríade cognitiva da depressão; se for construída à luz do
modelo interpessoal, deverá incluir outro tipo de itens. Nesse sentido, podemos
considerar que a validade de conteúdos já é uma componente da validade de
constructo.
Mas a validade de constructo também se pode avaliar através de fenómenos que
Página 106 / 163

estejam relacionados com o objeto de conhecimento “medido” pelo questionário. Por

exemplo, é razoável, do ponto de vista conceptual, que o constructo “depressão”
esteja associada (de forma inversa) ao constructo “felicidade”. E que esteja associado
(de forma direta) ao constructo “ansiedade”.
Assim sendo, podemos estudar a validade de constructo através de:
a) Validade convergente – comparando com instrumentos que avaliem constructos
diretamente relacionados (estudando a correlação, que deverá revelar um coeficiente
positivo entre as pontuações das duas escalas)
b) Validade divergente – comparando com instrumentos que avaliem constructos
inversamente relacionados (estudando a correlação, que deverá revelar um
coeficiente negativo entre as pontuações das duas escalas).
Será ainda possível estudar a validade discriminante, como componente de validade
de constructo. Para o efeito, compara-se a pontuação da escala/questionário em
estudo obtida para amostras que diferem, em termos teóricos, relativamente ao “nível
do fenómeno” em causa. Por exemplo, se se trata de uma escala de depressão, é
expectável que a pontuação média de uma escala de depressão seja maior numa
amostra de pessoas com diagnóstico de depressão major, do que numa amostra de
pessoas com diagnóstico de distimia, por sua vez maior do que numa amostra sem
qualquer diagnóstico.
Por fim, é possível estudar a validade de constructo através do estudo da
dimensionalidade interna do questionário. Ou seja, verificar se (continuando com o
exemplo de um instrumento que avalia depressão de acordo com o modelo de Aaron
Beck) a escala inclui de facto as três dimensões da tríade cognitiva da depressão.
Existem modelos matemáticos para o fazer (por exemplo, análise fatorial
confirmatória).
Validade de critério
A validade de critério pode ser entendida como um caso especial da validade de
constructo. Só é possível quando existe uma referência entendida pela comunidade
científica como sendo o “gold standard” para avaliar o fenómeno em questão.
Imagine-se que se pretende estudar a validade de critério de um questionário que
mede a perceção do estado febril em crianças. Poder-se-ia, nesse caso, utilizar a
temperatura corporal, medida através de termómetro analógico, como critério externo
e de referência (o gold standard, no caso). Para muitos fenómenos/constructos, na
Página 107 / 163

área da psicologia, não existe um gold standard, pelo que não é possível estudar a
validade de critério. Nesse caso, a validade de constructo limita-se ao estudo de
validades convergente, divergente e discriminante.
Fiabilidade
O estudo da fiabilidade (ou fidelidade) consiste em averiguar até que ponto um
determinado instrumento mede o constructo de forma consistente. Quer no que se
refere aos seus diferentes itens (consistência interna) quer em pontos temporais
distintos (fiabilidade temporal).
Consistência interna
A consistência interna consiste numa medida do contributo de cada item para uma
pontuação global da escala. Se a escala for multidimensional, o mais adequado será
estudar a consistência interna para cada uma das dimensões.
Uma das formas mais habituais de avaliar a consistência interna é através do
coeficiente alfa (geralmente denominado de alfa de Cronbach, apesar de haver aqui
alguma injustiça histórica por se omitir o nome de um dos seus principais inventores:
Gutman). Como regra de polegar, os instrumentos com um coeficiente alfa a variar
entre 0.7 e 0.9 são considerados como tendo uma consistência interna ótima (sólida).
Contudo, escalas com poucos itens tendem a ter coeficientes mais pequenos sem que
isso se traduza necessariamente em má fiabilidade.
Fiabilidade temporal
A fiabilidade temporal consiste na consistência da pontuação de uma
escala/questionário entre dois momentos de utilização desse instrumento, sem que
seja expectável (do ponto de vista teórico) que tenha ocorrida alguma diferença
assinalável, relativamente ao constructo em causa. Ou seja, se se administrar uma
escala de depressão em determinado dia e se se repetir a administração, em
condições idênticas, uma semana depois, é expectável que o resultado (pontuação)
da escala seja similar. O teste estatístico que deve ser utilizado para avaliar a
fiabilidade temporal é a correlação intraclasse (e não a correlação simples).
Algumas escalas são construídas para terem valor ou ambição de diagnóstico. Para o
efeito, é definido um valor ou ponto de corte, que permite classificar os respondentes
em duas ou mais categorias: ter mais ou menos pontos (acima ou abaixo do ponto de
Página 108 / 163

corte) traduz-se em ter características distintas. Por exemplo, ter mais ou menos do
que o valor de 50 traduz-se em ter patologia ou não ter patologia.
Nesses casos, é possível estudar as propriedades de sensibilidade, especificidade,
valor preditivo positivo e valor preditivo negativo, do instrumento de avaliação.
Sensibilidade
A sensibilidade de um instrumento diz respeito à sua capacidade de não falhar na
deteção de casos positivos (“com diagnóstico”), embora muitos dos casos detetados
como positivos não o sejam de facto.
Por exemplo, ainda no caso de uma escala de depressão, se é muito sensível,
significa que serão muitos os casos identificados como tendo depressão. Dito ainda de
outra forma, quando a escala dá negativo, é porque é (quase certamente) um caso
sem patologia.
Especificidade
A especificidade de um instrumento diz respeito à sua capacidade para detetar casos
positivos (“com diagnóstico”). Uma escala muito específica é uma escala que falha
muito no que se refere à identificação de casos verdadeiramente positivos.
Por exemplo, no exemplo de uma escala de depressão, se é muito específica, significa
que serão muito poucos os casos de falsos positivos. Quando a escala dá positivo, é
porque é (quase certamente) um caso com patologia.
Peso (burden)
Já abordámos o conceito de peso (burden) do questionário. Vimos que tem a ver com
o desconforto associado à interação com o instrumento de medição. Poderá ser pelo
tempo necessário para responder, pela dificuldade de interpretação ou pelo
desconforto emocional associado (nomeadamente por efeito de desejabilidade social).
Importa só explicitar que existe também o peso (burden) para quem insere os dados
para análise e o peso para quem analisa os dados. Muitas vezes, para diminuir o peso
para o respondente, aumenta-se o peso para o investigador (e vice-versa). É
importante ter em consideração os dois lados desta moeda, aquando da construção
de um bom questionário.
Página 109 / 163

CAPÍTULO VI - Tipos de Estudos de efetividade
VI.1 Avaliação de efetividade: o conceito de causalidade

A avaliação da efetividade de uma intervenção pressupõe sempre um nexo de
causalidade entre a intervenção e a evolução dos indicadores escolhidos como
relevante. Ou seja, para sabermos se uma intervenção foi efetiva, temos de conseguir
demonstrar a existência de uma relação causa-efeito.
Assim sendo, não se trata apenas de estudar a associação entre dois fenómenos.
Importa também garantir que a associação não resulta de um artefacto (ter acontecido
por mero acaso, por exemplo). Para se poder afirmar que existe um nexo de
causalidade entre dois fenómenos, importa pensar a vários níveis (ou seja, ter em
atenção vários critérios), incluindo:
1. Relação temporal: o fenómeno “causa” antecede o fenómeno ”efeito” e não o
contrário.
2. Força da associação: é preciso que se demonstre até que ponto a associação é
forte (o fenómeno “causa” é suficiente para determinar a evolução do fenómeno
“efeito”? Há indicadores para avaliar isto, como odds ratio ou risco relativo, como
veremos mais à frente).
3. Efeito dose-resposta: havendo causalidade, é possível que quanto mais presente
esteja o fenómeno “causa” (em termos de quantidade, tempo de exposição, etc.),
mais se evidencie o fenómeno “efeito”.
4. Consistência: a presença do fenómeno “causa” deve permitir prever de alguma
forma o surgimento ou alteração do fenómeno efeito.
5. Plausibilidade: para haver causalidade deverá existir um mecanismo de ação, um
racional teórico e/ou prático que explique por que razão os dois fenómenos estão
associados desta forma: quando um está presente o outro também surge ou se altera
de alguma forma.
6. Coerência: todas as evidências estão de acordo com o modelo causal
estabelecido.
7. Demonstração experimental: a melhor forma de estabelecer ou provar uma
relação de causalidade entre dois fenómenos é através de desenhos experimentais.
Página 110 / 163

Como se pode concluir deste conjunto de condições necessárias para a demonstração

de causalidade, a avaliação ou demonstração de efetividade não se esgota num único
estudo. Na verdade, a demonstração de eficácia ou efetividade é um exercício que
tende a nunca estar concluído e que implica estudos com diversas abordagens
(experimentais, observacionais, quantitativos, qualitativos, etc.) e realizados em
diferentes ambientes. Por exemplo, uma determinada intervenção clínica será efetiva
para uma determinada patologia mas pode não o ser para outra, mesmo que similar
em termos de sintomas, ou pode não o ser para indivíduos com outras características.
Pode ainda ser efetiva para o contexto de hospitalização mas não o ser para o
contexto de consulta externa. Ou seja, a causalidade que pode ser percecionada num
determinado estudo não é um fenómeno absoluto (existe ou não existe), dependendo
de muitas outras variáveis.
Isto não se aplica apenas a fenómenos da psicologia ou outras ciências sociais ou
humanas. Por exemplo, se se aquecer água a 100 graus Celsius, a água começará a
entrar em ebulição (passando do estado líquido a gasoso). Mas esta “causalidade”
(100 graus Celsius implica evaporação da água) não se observa se se elevar a
pressão do ar por cima da água. Nesse caso, a água não passa a estado gasoso aos
100 graus, sendo necessário aumentar a temperatura da água para que isso
aconteça. Podemos assim dizer que a causalidade entre dois fenómenos dependerá
muitas vezes do contexto em que são estudados e da presença ou ausência de
variáveis, que podem ter um papel mediador ou moderador.
VI.1.1 Causalidade
Variáveis mediadoras: Variáveis que explicam/possibilitam a relação entre uma
variável independente/preditiva/causal e uma variável dependente (efeito). É condição
sine qua non.
Variáveis moderadoras: Variáveis que afectam a direção ou a força da relação entre
uma variável independente (ou preditiva ou causal) e uma variável dependente
(efeito).5
5
Baron & Kenny (1986). The moderator-mediator variable distinction in social psychological research: conceptual, strategic, and
statistical considerations. Journal of Personality and Social Psychology, 51, 1173-1182.
Página 111 / 163

VI.2 Desenhos de investigação

Vamos de seguida ver diferentes tipos de desenhos de estudo que, em conjunto,
podem ser relevantes para a compreensão da associação e da causalidade
(nomeadamente, em termos de efetividade) entre dois fenómenos.
Tendo por base comum a pergunta básica “Será que a exposição a X causa Y?”,
sendo que X designa uma intervenção que queremos estudar e Y um efeito a observar
e que inferimos ser dependente de X (existe essa plausibilidade teórica, pelo menos),
podemos procurar a resposta a esta pergunta através de diferentes tipos, ou
desenhos, de investigação.
VI.2.1 Desenhos experimentais
Página 112 / 163

Como vimos no Capítulo 2, podemos dividir os desenhos de investigação em dois

grandes tipos, em função do posicionamento do investigador quanto ao
objeto/fenómeno em estudo (ou seja, se existe ou não uma intervenção direta por
parte do investigador, no sentido de controlar/manipular um conjunto de variáveis). Se
houver controlo das variáveis, estamos perante um estudo experimental.
As diferentes áreas da psicologia têm desenvolvidos imensos paradigmas
experimentais para estudar a associação ou causalidade entre fenómenos. Em muitas
dessas áreas, a investigação experimental é de natureza laboratorial (como por
exemplo, em psicologia cognitiva, em psicologia motivacional, em psicolinguística,
etc.). Nesses casos estamos referimo-nos a ciência básica: investigação experimental
para a compreensão de mecanismos basilares do funcionamento humano. Quando o
foco da investigação é sobre efetividade de intervenções, a designação habitual para
este tipo de investigação, experimental, é “ensaio”.
Em investigação experimental clínica, o investigador controla as variáveis susceptíveis
de influenciar a resposta e compara a incidência do efeito em estudo no grupo alvo da
intervenção com a observada num grupo de controlo.
Quando o investigador controla as condições de exposição e alocar aleatoriamente os
participantes nos diversos grupos em estudo (expostos versus não expostos)6, o
estudo é verdadeiramente experimental.
Quando o investigador controla as condições de exposição mas não é possível alocar
aleatoriamente os participantes nos diversos grupos em estudo, o estudo designa-se
quase experimental. É o caso de estudos em que houve uma catástrofe ambiental: as
pessoas expostas à catástrofe correspondem ao grupo exposto e as pessoas não
expostas correspondem ao grupo de controlo. Repare-se que, nestes casos, o
investigador não distribuiu as pessoas de forma aleatória pelos grupos em estudo,
mas pode avaliar (por uma separação das pessoas por motivos “naturais”, sem
manipulação experimental) o efeito da exposição, comparando com um grupo de
controlo.
Podemos ainda distinguir entre ensaios clínicos e ensaios comunitários. A diferença
entre os dois é que nos ensaios clínicos as pessoas em estudo têm algum tipo de
6
Nestes casos, diz-se estar perante um estudo ou ensaio aleatorizado controlado (em inglês: randomized controlled trial). Repare-
se que o “aleatorizado” (“randomized”, em inglês”), designa o facto de ser possível distribuir (alocar) os participantes de forma
aleatória em cada braço do estudo (grupo de intervenção versus grupo de controlo, por exemplo). Não tem a ver com a
aleatorização (randomization) das amostras relativamente à população ou universo (termo muito utilizado em estudo
observacionais transversais, como inquéritos, descritos mais à frente).
Página 113 / 163

patologia ou condição clínica e são seguidos em algum contexto clínico (consulta de

psicologia, internamento, etc.), enquanto que nos ensaios comunitários os critérios de
inclusão não incluem necessariamente patologia e o recrutamento das pessoas é feito
com base populacional (num contexto comunitário qualquer – por exemplo, escolas,
empresas, etc.).
VI.2.2 Desenhos observacionais

Se não houver controlo das variáveis, estamos perante um estudo observacional.
Existem diversos tipos de estudos observacionais:
Estudos de caso
Entende-se por caso qualquer indivíduo ou grupo de indivíduos que, por algum motivo,
tenha relevância estudar. Poderá ser um caso “típico”, escolhido por ser representativo
de uma determinada população. Ou pode, pelo contrário, ser um caso excecional cujo
estudo seja, por algum motivo, particularmente relevante (por exemplo, o famoso caso
HM com amnésia anterógrada). Importa dizer que o caso pode ser não o indivíduo
mas, por exemplo, uma empresa ou uma escola ou mesmo um país numa
determinada época.
Nota: para ver mais informação sobre o caso HM:
https://en.wikipedia.org/wiki/Henry_Molaison
Estudos transversais (inquéritos)

Este tipo de estudo é, provavelmente, o mais frequentemente publicado. A recolha de
dados é feita apenas uma vez por cada inquirido. O mais frequente é que a recolha de
dados seja feita através de questionário estruturado (ou seja, sempre o mesmo
questionário, com perguntas de resposta fechada), mas pode também ser feita através
de entrevistas ou outros métodos qualitativos de recolha de dados. Permite a
estimativa de frequências ou prevalências. Apesar de apenas permitirem associações,
os estudos transversais podem dar muita informação sobre a relação entre variáveis,
ajudando a compreender os fenómenos em estudo. Por isso, são muitas vezes
estudos precursores muito relevantes para a compreensão de associações de
natureza causal. Por vezes, este tipo de estudo repete-se na mesma população, em
momentos diferentes. Como as pessoas que respondem em cada momento do estudo
Página 114 / 163

são diferentes, não se trata nesse caso de um estudo longitudinal, recebendo a

designação de estudo transversal seriado (ou seja, trata-se de uma série de estudos
transversais idênticos).
Estudos de caso-controlo
A principal caraterística deste desenho de investigação é ser um estudo retrospetivo.
O recrutamento dos participantes (elementos amostrais) é definido com base em
critérios de inclusão que definem de forma muito clara em que consiste a condição
“caso”.
Por exemplo, um caso pode ser definido como uma pessoa entre os 20 e os 40 anos,
homem ou mulher, utilizador dos serviços de um centro de saúde X sem doença
crónica diagnosticada e que tem uma pontuação no Beck Depression Inventory (BDI)
igual ou superior a 26 (como indicador de depressão severa).
Nestas condições, um controlo adequado poderá ser uma pessoa em tudo similar
(entre os 20 e os 40 anos, homem ou mulher, utilizador dos serviços de mesmo centro
de saúde X, sem doença crónica diagnosticada) mas cuja pontuação no BDI seja
inferior a 26.
Os critérios de inclusão dos casos e dos controlos permitem assim garantir que os
casos diferem dos controlos quanto à condição em estudo e que não diferem entre si
relativamente a outras variáveis consideradas como relevantes (idade, morbilidades,
etc.) e que importe controlar. Nestas condições, existem dois grupos (casos versus
controlos) que podem ser comparados quanto a diferentes aspetos que possam ter
contribuído, ao longo de um determinado período temporal (por exemplo, últimos 12
meses ou últimos 5 anos), para que alguns dos participantes estejam (à altura da
recolha de dados) com uma pontuação que expressa depressão e outros não o
estejam.
A recolha dos dados é feita em apenas um momento (no presente), mas refere-se ao
passado e pode até “partir” o passado em diferentes períodos. Por exemplo,
perguntando por eventos negativos de vida ocorridos na infância (até aos 10 anos), na
pré-adolescência (11 e 12 anos), adolescência (dos 13 aos 17 anos), dos 18 aos 15,
etc. Pode, obviamente, ser recolhida informação sobre a situação atual (situação
familiar, situação financeira, situação profissional, rede social de apoio, etc.). Mas o
foco mais habitual neste tipo de estudo são as variáveis à condição do passado, mais
ou menos distante. Esse aspeto é importante para garantir o critério de temporalidade,
Página 115 / 163

na construção de um modelo causal: perceber o que aconteceu antes que possa estar
relacionado com a atual depressão, no nosso exemplo.
Podem ser utilizadas diferentes ferramentas e modelos estatísticos para identificar
variáveis, do passado, que estão associadas aos casos do presente e que, por
oposição, não estão associadas aos controlos (os “não-casos”). A ferramenta
estatística mais frequentemente utilizada é a regressão logística, que permite
estabelecer o tamanho da associação entre as variáveis*: permite a estimativa dos
odds ratio (ou razão das probabilidades complementares).
Para compreendermos, de uma forma simples, em que consiste o odds ratio,
considere-se a figura seguinte, em que são apresentados casos (chapéus castanhos)
e controlos (chapéus azuis). Através de um questionário, foi possível ver quantos
casos (pessoas com obesidade, por exemplo) afirmaram estar expostos a (ter
consumido) fast food, álcool e doces de forma regular nos últimos, digamos, 12
meses, e quantos casos não estiveram expostos a estes alimentos potencialmente
menos saudáveis. Fez-se o mesmo para os controlos (pessoas sem obesidade):
quantos consumiram de forma regular alimentos “nocivos” e quantos não os
consumiram de forma regular.
* Repare-se que, como se trata de um estudo observacional transversal, apenas
podemos falar de associação, não de causalidade
O odds ratio, enquanto medida de associação entre as variáveis de um estudo caso
Página 116 / 163

controlo é definido como:
Rácio exposição prévia nos casos: Nº casos com exposição / Nº de casos sem exposição
Rácio exposição prévia nos controlos: Nº controlos com exposição / Nº controlos sem exposição
De seguida, podemos ver como é que esta fórmula se aplica ao exemplo do estudo de
caso-controlo sobre consumo alimentar e obesidade.
Estudos caso-controlo: Pros & Contras

Vantagens
• Permitem estudo de patologias/eventos raros
• Permitem estudos de patologias/eventos com período de latência longo
• Exequíveis em curto intervalo temporal & com baixo custo financeiro
• Permitem estudar várias causas potenciais de patologias/eventos
Página 117 / 163

Desvantagens/dificuldades
• Não apropriados quando o tipo de exposição em estudo é raro
• A escolha dos controlos é difícil (nem sempre fácil definir adequadamente
quem devem ser)
• Informação sobre exposição é sujeita a viéses (de memória, de registo, etc.) e
difícil de validar
• Por definição, estuda apenas uma patologia/evento
• Não permite informação sobre incidência da patologia/evento
Estudos de coorte
A principal caraterística deste desenho de investigação é ser um estudo longitudinal.
Ou seja, os participantes são observados em mais do que um momento no tempo. Ou
seja, a recolha de dados é repetida, em diferentes momentos, para as mesmas
pessoas e da mesma forma – idealmente com os mesmos procedimentos de recolha
de dados e os mesmos instrumentos de medição.
Repare-se que utilizando este critério como única característica, qualquer investigação
experimental (incluindo os ensaios clínicos ou comunitários) pode ser considerada
como sendo um coorte. Vamos aqui considerar apenas os desenhos que têm uma
natureza observacional. Ou seja, em que não é o investigador quem decide quem esta
numa ou noutra situação, nem que tipo de tarefa ou exposição cada participante deve
fazer, nem em que momento é que faz essa tarefa ou se expõe a determinada
situação. O investigador limita-se assim a observar.
Nas coortes, o recrutamento dos participantes (elementos amostrais) é, tal como nos
estudos de caso-controlo, definido com base em critérios de inclusão. Porém, se nos
estudos caso-controlo estes critérios permitiam indicar quem pertencia ao grupo “caso”
e quem pertencia ao grupo “controlo”, nos estudos de coorte os critérios de inclusão
são focados no conceito de exposição. Ou seja, quem está ”exposto” a uma
determinada situação, que pode designar características muito distintas, desde o local
de residência, até uma característica morfológica ou mesmo genética.
Alguns exemplos do que se entende aqui por “exposição”:
 Expostos a estilos parentais autoritários
 Expostos a uma determinada condição clínica (depressão, ansiedade, ...)
Página 118 / 163

 Expostos a antidepressivos
 Expostos a um contexto laboral específico (trabalhar em supermercados, por

exemplo)
 Expostos a uma determinada escola (alunos da Escola X, ano letivo

2017/2018)
 Expostos a uma determinada comunidade (idosos residentes em lares

Portugueses da Região Centro)
 Etc.
Um coorte é assim um conjunto de indivíduos que partilham alguma condição ou

característica similar e sobre quem será feito um estudo longitudinal (serão
observados em diferentes momentos) de forma a compreender o efeito, ao longo do
tempo, da exposição a determinada agente (luz solar, tabaco, consumo de álcool,
consumo de fast food, intervenção clínica, método educacional, regime laboral como
por exemplo turnos noturnos, etc.).
Apesar de se tratar sempre de um estudo longitudinal, nem todos os coortes são
prospetivos. Ou seja, nem todos iniciam o seguimento do coorte (grupo de pessoas)
do momento 0 para a frente (durante dois dias, duas semanas, dois meses, dois anos,
vinte anos, etc.). De facto, existem coortes históricos. Nestes casos, o “seguimento”
dos casos é retrospetivo. Acontece quando é possível “rastrear” os fenómenos em
estudo (aspetos aos quais os indivíduos estiveram expostos) ao longo do tempo,
graças a registos ou algum tipo de documentação.
Repare-se que um coorte retrospetivo é um tipo de estudo diferente do estudo de
caso-controlo a vários níveis.
 os critérios de inclusão não pretendem separar casos de controlos. O que se

pretende é ver quem é que, no grupo de indivíduos recrutado aquando do início do
estudo, esteve exposto e quem é que não esteve exposto, no passado a
determinado fenómeno. Continua a ser a exposição o critério de separação dos
indivíduos em dois (ou mais grupos)
 a recolha de dados é feita com base em documentação, relativa aos mesmos

momentos para todos os participantes. Isto é possível quando todos os
Página 119 / 163

participantes tiveram de indicar dados para uma plataforma de informação de

forma regular. Por exemplo, é possível fazer coortes históricos de ex-alunos
universitários 10 anos após a conclusão dos seus estudos, se houver dados
suficientes e adequados para o fenómeno de exposição em estudo (um
determinado método de ensino ou método avaliativo, por exemplo).
Por exemplo, a exposição pode ser definida como “beber pelo menos 20 ml de
refrigerantes, pelo menos duas vezes por”. Ou “fumar pelo menos 5 cigarros por dia”.
Nestas condições, os grupos não expostos poderiam ser “respetivamente”: “não beber
refrigerantes” e “não fumar”.
De forma a permitir a comparação ao longo do tempo7 e a tirar ilações quanto à
associação8 entre a exposição e os efeitos observados (com base nos outcomes
considerados – doença, perceção de vitalidade, etc.) importa que os grupos (exposto
versus não expostos) sejam similares (por exemplo, indivíduos que no ano da
composição do coorte fazem 18 anos, homem ou mulher, alunos de uma determinada
universidade, sem doença crónica diagnosticada).
Os critérios de inclusão dos casos e dos controlos permitem assim garantir que os
participantes do grupo exposto não diferem dos participantes do grupo de controlo
relativamente a variáveis consideradas como relevantes (idade, morbilidades, etc.) e
que importa controlar. Por outro lado, importa ter muita atenção aos critérios de
exclusão no estudo. Isto porque é importante garantir que não existem variáveis que
possam ser fatores óbvios de confundimento ou viés. Por exemplo, pode ser relevante
não incluir jovens com história familiar de cancro pulmonar se um dos objetivos do
coorte for estudar o efeito da exposição (versus não exposição) ao tabaco durante 5
anos.
Ainda sobre critérios de inclusão! Como os coortes dependem da ocorrência de novos
casos ao longo do tempo para determinar a associação entre a exposição (ou não
exposição) e o outcome em estudo, é fundamental que os participantes não sejam já
casos em que o outcome já exista.
Por exemplo, se o objetivo é saber se um determinado método escolar é melhor ou
pior que outro para se aprender um determinado procedimento matemático, pode
7
É necessário definir a periodicidade dos momentos de recolha de dados bem como a duração total do acompanhamento do
coorte.
8
Repare-se que, como se trata de um estudo observacional, apenas podemos falar de associação, não de causalidade – apesar de
ser um desenho que permite inferir mais causalidade do que o dos estudos caso-controlo.
Página 120 / 163

construir-se um coorte em que alguns alunos (pertencentes a uma determinada

escola) são expostos a esse método de ensino e outros alunos (pertencentes
eventualmente a outra escola) não são expostos a esse método de ensino. Poder-se-á
ver quantos alunos conseguem resolver o desafio matemático em causa ao final de
dois meses, cinco meses, um ano, etc. Mas, para o efeito, é fundamental que na
baseline, ou seja, aquando da entrada no estudo (início do coorte), nenhum dos
alunos convidados para participar no estudo saiba já como resolver o problema
matemático em causa.
À semelhança dos estudos caso-controlo, podem ser utilizadas diferentes ferramentas
e modelos estatísticos para identificar variáveis (de exposição) que estejam
eventualmente associadas ao surgimento de novos casos, por comparação ao grupo
de não-expostos. As ferramentas estatísticas mais frequentemente utilizadas em
coortes são a regressão logística, que permite estabelecer o tamanho da associação
entre as variáveis, e a análise de sobrevivência.
No caso dos coortes, o indicador mais utilizado para avaliação da associação entre
exposição/não exposição e ocorrência de casos com o outcome em estudo é o risco
relativo (RR). Outro indicador de associação, muito frequente em estudos com
coortes, é o Risco Atribuível, que pode ser relativo à população exposta ou relativo à
população total.
Para compreendermos, de uma forma simples, em que consiste o RR e o Risco
Relativo, considerem-se os esquemas seguintes, em que são apresentados indivíduos
expostos (chapéus castanhos) e indivíduos não expostos (chapéus azuis). Suponha-
se que foi possível seguir estes casos ao longo do tempo (por exemplo, um ano),
registando mês a mês a exposição a fast food, álcool e doces. O agrupamento dos
indivíduos poderá ser sido feito logo à partida (se era possível prever de alguma forma
que seria essa a exposição) ou, talvez o mais provável, agruparam-se os indivíduos a
posteriori, em função de terem estado ou não expostos, de forma regular, ao estilo
alimentar potencialmente nocivo para a saúde (e que representam a condição de
exposição versus não exposição). Foi assim possível esperar para ver o efeito deste
tipo de alimentação em termos de alguma variável de outcome (por exemplo,
obesidade)
Página 121 / 163

O risco relativo, enquanto medida de associação entre as variáveis de um estudo de

coorte é definido como:
Risco nos expostos: Nº novos casos nos expostos / Total de expostos
Risco nos não-expostos: Nº novos casos nos não-expostos / Total de não-expostos
No esquema seguinte podemos ver como é que esta fórmula se aplica ao exemplo do
estudo sobre estilo alimentar e obesidade.
Página 122 / 163

Estudos de coorte: Pros & Contras

Vantagens
• Fornecem informação completa sobre a exposição
• Fornecem uma sequência temporal clara entre exposição e patologia/evento
• Permitem o estudo de outcomes múltiplos (associados a uma exposição)
• Permitem o cálculo de taxas absolutas de incidência e de riscos relativos
Página 123 / 163

Desvantagens
• Não apropriado para estudo de patologias/eventos raros (porque isso requer
elevado número de participantes)
• Não apropriado quando o período de latência é grande (nestes casos, é
preferível recorrer a coortes históricos)
• Padrões de exposição podem mudar durante o curso do estudo (variáveis de
confundimento)
• Elevada “mortalidade experimental”
• Caros e difíceis de operacionalizar
• Os dados de baseline podem ser escassos (muitos participantes entrevistas
curtas)
Interpretação do valor obtido para Risco Relativo / Odds Ratio:
VI.3 Principais problemas e limitações dos estudos

Os estudos transversais:
• Não permitem avaliar variações ao longo do tempo
Os estudos caso-controlo:
• A seleção de casos e de controlos
Página 124 / 163

• O viés de reconstituição dos factos

• O viés de sobrevivência (por exemplo, casos mais graves morrem e não
contribuem para a compreensão de variáveis do passado potencialmente
associadas)
Os estudos de coorte:
• Perda do seguimento dos indivíduos
• Múltiplas exposições (difícil de controlar, mesmo estatisticamente)
O ensaio clínico:
• Contaminação entre grupos,
• Perda do seguimento dos indivíduos
• Capacidade de ocultação (simples, dupla, tripla)
VI.3.1 Critérios de qualidade: Estudos de coorte & Estudos caso-controlo

• Justificação o tamanho amostral inicial
• Número de participantes que aceitaram participar
• Razões para a não participação
• Comparação dos participantes que consentiram com os que não consentiram
• Número de participantes com critérios de elegibilidade
• Razões para não preencher critérios de elegibilidade
• Estudos caso-controlo
• Explicar possibilidade de viés de seleção
• Validade & fiabilidade dos métodos de medição
• Informação sobre ausência de dados (missing data) em cada fase do estudo
• Número de participantes em cada fase do estudo
• Razões para a perda de seguimento em cada fase do estudo
• Estudos caso-controlo
• Descrição detalhada do processo de ocultação
• Ocultação envolve o analista de dados / estatista E/OU o prestador de
cuidados E/OU o participante E/OU quem avalia os acontecimentos (outcomes)
• Uso de placebo
Página 125 / 163

• Descrição da implementação do ensaio clínico

• Descrição do processo de aleatorização
• Justificação do tamanho amostral
• Análise por intenção de tratar (intention to treat) OU análise por protocolo (per
protocol)
VI.4 Avaliação de eficiência da intervenção

Como já referido, só faz sentido pensarmos em avaliação de eficiência de uma
intervenção se a mesma já se provou como eficaz e/ou efetiva. De facto, avaliação de
eficiência é uma “avaliação económica”: consiste em estudar a relação entre o custo e
o ganho da intervenção, de forma a perceber se os ganhos compensam os custos.
A avaliação da eficiência das intervenções faz sentido porque os recursos são sempre
escassos. Assim sendo, importa fazer escolhas que otimizem ganhos (maior
benefício) e minimizem custos.
Importa esclarecer que os custos podem ser de natureza diferentes:
• Custos diretos: diretamente associados à condição a alterar (patologia,
condição clínica, condição laboral/organizacional, etc.) e à implementação da
intervenção, ou custos diretos para o indivíduo que beneficia da intervenção)
• Custos indiretos: não diretamente associados mas que são relevantes (por
exemplo, custos associados à produtividade, custos associados à formação
profissional de base, ou custos com perdas de dias de trabalho, por parte do
indivíduo que beneficia da intervenção, aquando da exposição à mesma)
• Custos intangíveis: custos associados ao sofrimento ou a algum tipo de
desconforto físico, psicológico, social ou espiritual
É ainda necessário definir a perspetiva da avaliação económica em termos do “locus”

dos custos e ganhos: se para o sistema que promove a intervenção (um hospital, uma
escola, uma empresa), se para o beneficiário (indivíduo).
Por fim, a escolha dos indicadores (de custos e de ganhos) deverá ter em conta a
dimensão temporal: custos e ganhos a curto prazo, a médio prazo ou a longo prazo.
Página 126 / 163

VI.4.1 Cálculo do custo
Existem diferentes
métodos de avaliação da eficiência das intervenções:
Análise de minimização de custos

Este tipo de análise não é um verdadeiro método de avaliação de eficiência das
intervenções, apesar de ser uma forma de avaliação económica das intervenções, por
ter em conta apenas os custos associados a uma determinada intervenção. É uma
análise muito limitada do ponto de vista económico por não considerar o valor, a mais
valia que a intervenção pode ter. A comparação entre duas formas de intervenção
resulta na escolha da que é tem menos custos, para uma determinada dimensão
temporal (independentemente da mais-valia que possa ter, relativamente a outras
intervenções alternativas).
Análise custo-efetividade
Este tipo de análise permite a comparação entre alternativas de intervenção, não
apenas em termos de custos mas também em termos de ganhos associados. Os
custos são expressos em unidades monetárias e os ganhos em termos de unidades
clínico-epidemiológicas (anos de vida, ganhos de saúde expressos por indicadores
fisiológicos, eventos clínicos evitados, etc.).
Comparar alternativas
Página 127 / 163

Rácio custo‐efetividade incremental – RCEI (ICER)
“Regra” de decisão para financiamento em Portugal (na indústria farmacêutica: Se

ICER < 20 000-30 000/QALY, a alternativa A é custo-efetiva.
O rácio custo‐efetividade incremental (RCEI) refere-se ao custo adicional para obter

mais uma “unidade de saúde”).
Página 128 / 163

Análise custo-beneficio
Trata-se de uma avaliação económica em que os custos da intervenção em estudo
análise bem como os efeitos da intervenção são valorizados em termos financeiros
(unidades monetárias).
Análise custo-utilidade
Trata-se de uma avaliação económica que permite a comparação entre diferentes
alternativas de intervenção, através de rácios entre custos (expressos em unidades
monetárias) e efeitos ou consequências, medidos (por exemplo) através de anos de
vida ajustados pela qualidade: os QALY (quality-adjusted life years).
Para além do tipo de indicadores utilizados, importa realçar algumas diferenças entre
análise custo-benefício e análise custo-utilidade:
• Análise custo-utilidade é usado quando existe uma valorização (da utilidade)
dos outcomes, usando para o efeito o conceito de QALYs. Ou seja, não se
pretende apenas ver o ganho „material‘ associado a uma intervenção; há
também uma leitura do valor (added-value) associado ao essa intervenção.
• As consequências (ou efeitos) das intervenções são ajustadas por níveis ou
graus de preferência por cada outcome (os “pesos de utilidade” - utility
weights). Por exemplo, qual a preferência (percepção de utilidade) entre treinar
1 hora por dia e em boa forma física e treinar 3 horas por dia e ficar em óptima
Página 129 / 163

forma física? O conceito de Utilidade permite a descrição das preferências de

quem pode beneficiar da intervenção.
• Efeitos múltiplos são resumidos num único indicador: os QALY. O instrumento
mais conhecido, que avalia QALYs é o EuroQol 5D (EQ-5D). Para mais
informação sobre o instrumento, consultar https://euroqol.org/
Rácio Custo-Utilidade = Custo (em euros) / Utilidade (em QALYs)
Página 130 / 163

CAPÍTULO VII – Análise estatística
VII.1 Do questionário para a construção de uma base de dados: codificação

de dados
VII.1 Como dar nomes às variáveis e passar do questionário para a base de

dados
1. Escrever um código (único) em cada questionário preenchido.
Isso é fundamental para associar de forma unívoca os dados dos questionários aos
dados registados em base de dados. Desta forma, será sempre possível validar com
detalhe os dados inseridos. Ou seja, se surgir um número ‘estranho’ nos resultados,
será possível voltar ao questionário e confirmar a resposta correta.
2. Criar, para cada pergunta, um código. O mesmo para cada opção de resposta. As
perguntas são geralmente codificadas de acordo com o seu número no questionário.
Exemplo:
2. Qual é o seu sexo? a. masculino b. feminino
Neste exemplo, a pergunta “sexo” resultará na variável “sexo” ou “p2”. O investigador

poderá de seguida atribuir o valor 1 a “masculino” e o valor 2 a “feminino”. Neste caso,
o valor registado na variável “sexo” será “1”. É muito importante criar um dicionário de
variáveis e valores, para garantir que este tipo de notação seja facilmente percetível a
qualquer momento, e por qualquer investigador.
Nos casos de resposta “Sim / Não”, o habitual é codificar o “Sim” com o “1” e o “Não”
com o “0”.
Em casos de escalas tipo Likert, o código das respostas corresponde à posição da
ordem do item na escala. Por exemplo, numa escala tipo Likert de seis pontos, em que
1 representa “não satisfeito” e 6 “completamente satisfeito”, a resposta
"completamente satisfeito" é inserida como 6 na base de dados.
Em casos de itens codificados na ordem inversa, o investigador deve codificar os itens
pela ordem oposta (no exemplo, o item 6 seria codificado com 1 e o item 1 seria
Página 131 / 163

codificado com 6).

Os itens em falta podem ser deixados em branco, nas bases de dados. Por vezes,
para tornar mais claro que não foi esquecimento por parte da pessoa que fez a
inserção de dados, utiliza-se um valor impossível, atendendo à gama de valores da
variável. Por exemplo, se a resposta só pode variar entre ”0” e “1”, pode indicar-se “9”
para os casos de missing data (resposta omissa).
3. Criar a base de dados: geralmente, é mais fácil inserir os dados em folha de Excel e
importá-la depois para o software estatístico desejado. A estrutura típica das bases de
dados é a seguinte: as colunas representam variáveis e as linhas representam os
casos (cada linha corresponde a uma pessoa).
VII.2 Duas estratégias de análise em avaliação de efetividade e custo-efetividade

Existem duas abordagens de análise estatística, uma mais conservadora (ou seja,
com menos probabilidade de encontrar diferença quando se compara o braço de
intervenção com o ou os braços de controlo) do que outra.
A diferença entre as abordagens tem a ver com o tamanho amostral que se considera.
Ao longo do estudo, é natural “perder” elementos amostrais (os dropouts). Assim
sendo, o tamanho amostral no início do estudo não corresponde ao tamanho amostral
no final, e a quantidade de perdas será diferente entre os dois braços do estudo. É
diferente considerar como base amostral (ou seja, o denominador, para podermos
indicar a taxa de sucesso no estudo) todos os indivíduos que entraram, desde o início,
no estudo, ou considerar como base amostral apenas os indivíduos que completaram
a intervenção (do início ao fim).
S considerarmos todos os elementos amostrais (que entraram no estudo no início do
mesmo), estamos a seguir uma amostragem de Intention to Treat Analysis (ITT). É
uma abordagem conservadora porque o denominador vai ser o maior possível e,
assim sendo, o número de casos de sucesso da intervenção (que fica em numerador)
fica mais “diluído” (a taxa de sucesso será, portanto, menor).
A Per Protocol Analysis (PPA), apenas considera as pessoas que participaram em
todo o processo de intervenção (ou seja, que completaram o protocolo de
intervenção). Nesse caso, o denominador será menor e, assim sendo, a taxa de
Página 132 / 163

sucesso tenderá a ser superior ao que seria encontrado pela abordagem ITT.
VII.3 Diferença entre população e amostra
População Conjunto de todos os elementos/observações para os quais se irá

generalizar os resultados obtidos no estudo (por exemplo,
pessoas adultas com diagnóstico de depressão, tratadas em
hospitais portugueses)
População Conjunto de todos os elementos/observações nos quais se
-alvo baseia o estudo. Por vezes, é diferente da população (por

exemplo, utentes adultos com diagnóstico de depressão, de um
hospital específico)
Amostra Subconjunto da população (ou população-alvo), composto por n
observada elementos, a partir dos quais se estuda a variável/característica

de interesse.
‐ É uma realização da amostra, aleatória ou não aleatória

(X1, X2, . . . , Xn)
‐ Denota-se por (x1, x2, … xn)
VII.4 Classificação dos dados
Variáveis quantitativas
Discretas Tomam um número (finito ou infinito), numerável, de valores
‐ Ex. nº de batimentos cardíacos, nº de internamentos

diários
Contínuas Tomam uma infinidade não numerável de valores
‐ Ex. peso, altura, índice de massa corporal
Página 133 / 163

Variáveis quantitativas – Escalas de medida

Intervalar Variáveis numéricas, passíveis de ordenação e com intervalos
constantes em unidades de medida (ou seja, a distância entre o 0
e o 1 é a mesma distância encontrada entre o 1 e 2, entre o 2 e o
3, e por aí fora)
O zero é uma medida arbitrária
‐ Ex. temperatura (0ºC não significa a ausência de

temperatura)
Proporcional ou Possuem um zero absoluto, representativo da origem da medida
de razão
É possível quantificar as diferentes entre as medições
‐ Ex. distâncias, peso, preço…
Variáveis qualitativas
Nominais Variáveis não passíveis de quantificação ou ordenação
Baseadas na classificação de elementos e formação de grupos
‐ Ex. sexo, estado civil…
Ordinais Variáveis classificativas, passíveis de ordenação
A magnitude da diferença entre os níveis não é quantificável
‐ Ex. escolaridade, nível salarial…
VII.5 Características amostrais
Medidas de localização
Moda Observação mais frequente/prevalente da amostra.
Página 134 / 163

Calculável para qualquer tipo de dados.
Designa-se por classe modal se os dados forem agrupados.
Média É uma medida de tendência central.
Calculável somente para dados quantitativos
Quantil Denota-se por Qp, 0 < p < 1
empírico
Quantis com designações particulares:
de ordem p
‐ Q0.25, Q0.5 e Q0.75: 1º, 2º e 3º quartil, respetivamente
‐ Q0,1, Q0,2, …,Q0,8, Q0,9: decis
‐ Q0,01, Q0,02, …, Q0,98, Q0,99: percentis
Mediana Ponto central da amostra ordenada

amostral
Corresponde ao quantil de ordem p = 0,5 (2º quartil)
‐ 50% dos valores da amostra são menores ou iguais à

mediana
‐ 50% dos valores da amostra são iguais ou superiores à
mediana
Medidas de dispersão
Amplitude Amplitude do intervalo entre os valores máximo e mínimo
amostral
Amplitude Amplitude do intervalo entre o 1º e o 3º quartis

interquartis
Página 135 / 163

Variância Medida de dispersão das observações relativamente à média
amostral ou
Desvio-padrão Raiz quadrada da variância
amostral Reflete a variabilidade das observações em relação à média
‐ Medida expressa na mesma unidade de medida que os

dados
Coeficiente de Medida de dispersão relativa
variação
‐ Elucidativa da ordem de grandeza do desvio-padrão face
(ou coeficiente de à média
dispersão)
VII.6 Inferência estatística: Conceitos base
Inferência Dedução das propriedades de uma população (parâmetros) com

estatística base na análise das características amostrais (estimativas)
Realizada por meio de estimação e testes de hipóteses
Estimação Obtenção de informação, a partir da amostra, que permita ter

uma ideia sobre o valor (desconhecido) do parâmetro
‐ Estimação pontual: estimativa traduzida num único valor
Página 136 / 163

‐ Estimação intervalar: intervalo no qual se espera conter,

com um certo grau de confiança, o verdadeiro valor do
parâmetro
Estimação
pontual
Testes de hipóteses
Página 137 / 163

Página 138 / 163

Página 139 / 163

Página 140 / 163

Página 141 / 163

Página 142 / 163

CAPÍTULO VIII – Escrita e disseminação dos resultados
“ Esse est percipi.

(To be is to be perceived)
- George Berkeley -
in Principle #3 in “Principles and Dialogues”-
VIII.1 Comunicação de resultados

Escrever e disseminar a informação relativa aos resultados de um estudo pode e deve
ser visto como sendo a essência do estudo. Um estudo cujos resultados não sejam
partilhados simplesmente não existe, por melhor que tenha sido feito.
Neste capítulo vamos ver como é que os resultados de um estudo devem ser
apresentados na forma mais típica da comunicação científica: artigos científicos.
Vamos também refletir um pouco sobre estratégias de divulgação dos estudos
realizados e seus resultados, para além da partilha através de artigos científicos.
VIII.1.1 A escrita dos resultados científicos

Os resultados do estudo devem ser apresentados de forma objetiva e o mais sucinta
possível, através de materiais ilustrativos – tabelas e figuras – e texto. As revistas que
publicam artigos científicos têm regras próprias para cada secção (nomeadamente
para a apresentação dos artigos), que iremos discutir mais à frente neste capítulo,
tanto no que se refere ao número de palavras, como ao número de tabelas e figuras.
Os resultados devem ser apresentados também sem qualquer interpretação, e numa
sequência ordenada e lógica. Note-se que, enquanto a secção dos métodos deve
explicar o modo como os dados foram recolhidos (i.e., cada método ou técnica que foi
utilizada) e analisados, a secção dos resultados deve apresentar os próprios dados
recolhidos.
Página 143 / 163

Resultados: O que encontrei?

Muitos investigadores tendem a confundir a informação a apresentar na secção da
discussão com a informação a apresentar na secção dos resultados.
De uma forma abreviada, podemos dizer que a secção dos resultados NÃO DEVE:
 Explicar os métodos (por exemplo, não deve ser descrito o processo de

recodificação de variáveis)
 Interpretar os dados. Deve apenas descrever o necessário para que os

resultados relativos a cada uma das variáveis sejam compreensíveis para o leitor
 Comparar os resultados obtidos no estudo com os resultados de outros

estudos
 Repetir informação. Os resultados podem ser apresentados sob a forma de

texto, tabelas, gráficos ou outro tipo de figuras. Mas o que é apresentado de uma
forma não deve ser mostrado na outra.
 Incluir demasiados números na parte do texto corrido. As tabelas e os gráficos

devem ser usados precisamente para resumir essa informação
 Incluir dados que resultem do estudo e que já tenham sido publicados noutros
artigos
 Incluir tabelas demasiado grandes e complexas, ou muito pequenas
 Omitir dados contraditórios.
Por outro lado, a secção dos resultados DEVE:
 Apresentar uma seleção dos dados mais importantes do estudo, organizados

em texto e acompanhados de tabelas, gráficos ou outro tipo de figuras (por
exemplo, esquemas com relação entre variáveis), sequenciadas de uma forma
lógica. A opção por uma forma ou outra dependerá da quantidade e do tipo de
resultados que forem obtidos
 Ter uma estrutura lógica, que permita a apresentação da informação e das

ideias de uma forma tão clara quanto possível
Página 144 / 163

 Dar respostas aos objetivos e hipóteses da investigação
 Reportar “resultados negativos” (ou seja, resultados contrários ao que era a

hipótese do investigador ou às teorias existentes).
Estilo e normas de escrita científica

Claro que, como em relação a outras partes do artigo, discutidas no Capítulo 2, a
escrita deve seguir as normas de estilo científico. Cada revista científica tem as suas
normas específicas, pelo que é boa prática escolher-se a revista onde se pretende
publicar o estudo logo de início, ainda antes de começar a escrita do artigo científico.
As normas de estilo científico mais conhecidas são as normas:
 da American Psychological Association (APA), mais habituais na área da

psicologia e de outras ciências humanas e sociais; ver em http://www.apastyle.org/
e tutorial sobre os aspectos principais em:
http://www.apastyle.org/learn/tutorials/basics-tutorial.aspx
 de Vancouver (para ciências biomédicas, definidas pelo International

Committee of Medical Journal Editors). Ver em:
http://openjournals.net/files/Ref/VANCOUVER%20Reference%20guide.pdf
Estilo de linguagem
Os resultados devem ser escritos de forma concisa e objetiva, sem qualquer
interpretação. Como vimos antes, a interpretação dos resultados, atendendo aos
méritos, virtudes e limites dos métodos e ao que se sabe de outros estudos, deve ser
feita apenas na secção da discussão.
Algumas sugestões práticas para a escrita dos resultados:
 É preferível escrever no pretérito imperfeito: “Os resultados mostraram…”
 Uso da voz passiva, porque facilita o recurso à forma impessoal: “Verificou-se

que…”
Página 145 / 163

VIII.1.2 Resultados: Estrutura

De uma forma geral, e sempre que aplicável, a apresentação dos resultados deve
seguir a seguinte estrutura:
1. Descrição da amostra
2. Análise univariada
3. Análise bivariada
4. Análise multivariada
Exemplo: Descrição da amostra
Group
Intervention Control Total
% de N % de N % de N % de N % de N % de N
válida da válida da válida da válida da válida da válida da
Group
Contagem coluna linha Contagem coluna linha Contagem coluna linha
Sexo Masculino 25 Intervention
38,5% 47,2% 28 Control
45,2% 52,8% 53 Total
41,7% 100,0%
% de N % de N % de N % de N % de N % de N
Feminino 40 61,5% 54,1% 34 54,8% 45,9% 74 58,3% 100,0%
válida da válida da válida da válida da válida da válida da
Total 65
Contagem 100,0%
linha 51,2%
coluna Contagem 62 100,0%
linha 48,8%
coluna Contagem127 100,0%
linha 100,0%
coluna
Qual o Solteiro/a 22 36,7% 33,8% 38 63,3% 61,3% 60 100,0% 47,2%
seu Casado/a 31 67,4% 47,7% 15 32,6% 24,2% 46 100,0% 36,2%
estado ou em
civil? união de
[baseline] facto
Divorciado 12 60,0% 18,5% 8 40,0% 12,9% 20 100,0% 15,7%
/a ou
separado/
a
Viúvo/a 0 0,0% 0,0% 1 100,0% 1,6% 1 100,0% 0,8%
Total 65 51,2% 100,0% 62 48,8% 100,0% 127 100,0% 100,0%
Tabelas e figuras
A forma como apresentamos os resultados sob a forma de tabelas e/ou figuras é muito
importante. A sua preparação deve ser feita assim que tenhamos todos os dados
analisados.
Algumas regras simples:
 As tabelas e figuras têm uma numeração distinta, devendo ser apresentadas

pela ordem que é seguida no texto
 O título das tabelas deve ser apresentado no topo das mesmas, enquanto os
Página 146 / 163

títulos das figuras devem ser colocados por baixo
 O título deve ser informativo quanto ao que é apresentado na tabela ou figura.

Se necessário, devem incluir outras informações necessárias numa legenda
 Quando se referencia uma figura no texto, a referência pode surgir abreviada

(e.g., “Fig. 1”), exceto quando esta aparece no início de uma frase (deve vir
referenciada como “Figura 1”). Já no caso das tabelas, a sua referência nunca
deve aparecer abreviada
 Demasiados dados numa figura podem torná-la ilegível. É preferível construir

mais do que uma figura ou representar os dados de outra forma (por exemplo, em
tabela) do que sobrepor informação. Devem, contudo, evitar-se redundâncias, com
apresentação dos mesmos resultados sob a forma de tabela e figura
 As tabelas e figuras devem ser autoexplicativas, apresentando toda a

informação (necessária!) para poder ser interpretada sem recurso ao texto, que
deve apresentar apenas os dados mais relevantes nelas contidas
 Quando preparamos as tabelas e as figuras para a secção dos Resultados,

devemos ter em atenção a escala em que os apresentamos pois podemos induzir
o leitor em erro ao reportarmos uma diferença relevante que pode na realidade não
ser assim tão considerável.
VIII.2 Disseminação dos resultados de investigação

Mas como se devem divulgar os resultados de um estudo? Até aqui, temos abordado
a de escrita dos resultados sob a forma de artigo. No entanto, existem outros meios de
comunicação que podem ser usados.
A conclusão do processo de investigação oferece uma excelente oportunidade para
partilhar resultados em meio académico. No entanto, o desenvolvimento do plano de
disseminação dos resultados deve começar muito antes pois, como iremos ver,
existem várias atividades que vão sendo trabalhadas desde muito cedo neste
processo. Há relatórios de progresso a serem preparados para submeter à entidade
financiadora, resultados preliminares podem ser apresentados em congressos
Página 147 / 163

científicos e o protocolo de investigação do projeto pode ser de interesse publicar

numa revista com revisão de pares.
Hoje em dia existem diversos recursos disponíveis para se ir partilhando a evolução
do projeto, desde o seu início. A seguir, iremos discutir algumas orientações gerais
que podem ajudar na divulgação dos resultados dos projetos. Esta é uma
componente-chave do processo de investigação que não pode, nem deve ser
negligenciada. Iremos, por isso, abordar os métodos mais comuns de disseminação e
as suas características. Por fim, faremos um breve apanhado sobre a importância da
construção de um plano de disseminação.
VIII.2.1 O que é a disseminação dos resultados?

A disseminação de resultados dever ser planeada em função do público-alvo. É um
dever de quem investiga comunicar e interagir com diferentes setores da sociedade,
promovendo a integração da investigação em processos de tomada de decisão. A
importância da disseminação de resultados é destacada no Princípio 36 da
Declaração de Helsínquia:
“Researchers, authors, sponsors, editors and publishers all have ethical obligations
with regard to the publication and dissemination of the results of research.
Researchers have a duty to make publicly available the results of their research on
human subjects and are accountable for the completeness and accuracy of their
reports. All parties should adhere to accepted guidelines for ethical reporting. Negative
and inconclusive as well as positive results must be published or otherwise made
publicly available. Sources of funding, institutional affiliations and conflicts of interest
must be declared in the publication. Reports of research not in accordance with the
principles of this Declaration should not be accepted for publication.”
Os investigadores têm à sua disposição uma grande variedade de ferramentas para

partilhar os resultados da sua investigação com a público académico. De seguida,
iremos apresentar algumas das ferramentas de comunicação mais utilizadas. Note-se,
no entanto, que cada uma dessas ferramentas não deve ser considerada
simplesmente como um instrumento independente, uma vez que cada uma apresenta
pontos fortes e pontos fracos, o seu uso combinado permite alcançar o público-alvo e
suportar um plano de disseminação mais consistente e estruturado.
Página 148 / 163

As ferramentas de disseminação abordadas nesta secção incluem:

1.Relatórios de investigação
2.Artigos de revisão de pares
3.Artigos de conferências
4.Press release
5.Policy brief
6.Social media
Relatórios de investigação
O que é? Durante a execução de um projeto, é necessário preparar relatórios de
progresso, com uma periodicidade regular (por exemplo, a cada seis meses ou no final
de cada trimestre), de acompanhamento da sua evolução. Além destes relatórios
intermédios, é ainda elaborado habitualmente um relatório final que resuma tudo o que
foi feito durante o período de implementação do projeto. Ainda que o conteúdo do
relatório dependa dos requisitos específicos da entidade financiadora, importa referir
que este tipo de documento serve sobretudo como um resumo do que foi feito, de
como foi feito, incluindo a apresentação dos resultados e das conclusões do estudo.
Público-alvo: Embora os relatórios de investigação se destinem principalmente à

entidade financiadora, podem ser também usados por um público mais amplo que
esteja interessado nesse campo de investigação.
Tamanho e estilo: A extensão de um relatório é altamente variável. No entanto,

relatórios de pequenos projetos não devem ir além das 20 páginas. Geralmente, é
imposto um limite máximo de caracteres para o reporte em cada secção do relatório.
Conteúdo: Apesar das variações no tamanho e estilo do relatório, o seu conteúdo é
bastante similar. Regra geral, o conteúdo de um relatório espelha o processo de
investigação em si. A tabela seguinte apresenta um esboço geral das secções de um
relatório.
Secção Descrição
Período de reporte Período a que se refere o relatório apresentado
Identificação da entidade responsável pela elaboração
Entidade
do relatório e, se solicitado, dos parceiros envolvidos.
Página 149 / 163

Esta última parte é especialmente importante se o

projeto tem instituições parceiras que colaboraram
ativamente nas atividades que irão ser descritas no
relatório
Resumo dos trabalhos desenvolvidos, resultados
Resumo
alcançados até à data e desvios à proposta aprovada
Referência às atividades desenvolvidas e que, embora
Descrição da evolução
não financiadas, tenham sido determinantes para a boa
do projeto
execução do projeto
Representação gráfica comparativa do trabalho previsto
na candidatura aprovada com o realizado até ao
Cronograma momento.
Nota: a elaboração de cronograma já foi discutida no
Capítulo 2
Resultados alcançados e indicadores de execução. Por
exemplo, x participações em conferências nacionais e x
Resultados alcançados
em conferências internacionais, x artigos publicados em
revistas com revisão de pares, x capítulos de livro, etc.
Alterações ao Nesta secção deverão ser elencadas as alterações
planeamento previsto na feitas no projeto e que tenham sido previamente
candidatura submetidas e aprovadas pela entidade financiadora
Considerações Reporte de questões não abrangidas pelas secções
adicionais anteriores
Artigos científicos
O que é? Como já referido, uma das formas mais usadas, e a mais creditada pela
comunidade científica, para divulgação dos resultados do estudo é a publicação em
revistas com revisão de pares (com ou sem fator de impacto). O objetivo deste tipo de
escrita é apresentar à comunidade científica o estudo com explicitação detalhada dos
métodos utilizados, expondo os resultados encontrados e as implicações para a
prática são consistentes.
Mas quais são os critérios que podemos usar para escolher uma revista científica?
1. Em primeiro lugar, devemos ponderar em que tipo de revista queremos publicar:
nacional ou internacional? Geral ou específica? Com ou sem revisão de pares? Em
open access?
2. Uma das métricas mais usadas para avaliação de uma revista a ser considerada no
processo de escolha da revista é o fator de impacto. O factor de impacto da Thomson
Scientific calcula para cada uma das revistas indexadas no Journal Citation Reports
(um recurso que reúne dados bibliométricos de publicações científicas a nível
Página 150 / 163

mundial), a média de citações recebidas no ano de referência pelos artigos publicados

nos dois anos anteriores. Esta base de dados pode ser acedida através do site:
https://jcr.incites.thomsonreuters.com/
3. O quartil é outro dos indicadores usados, permitindo comparar as revistas
existentes dentro de uma dada área. O conjunto total de revistas indexadas em cada
área científica está dividido em quatro grandes grupos (ou quartis). Na base de dados
do Journal Citation Reports o quartil 1 (Q1) integra o top 25% da distribuição dos
fatores de impacto, o Q2 para a posição de médio-alta (entre 25 e 50%), o Q3 posição
média baixa-baixo (50-75%), e o Q4 a posição mais baixa (inferior 25% da
distribuição).
Além do Journal Citation Reports, o quartil em que cada revista se encontra pode
ainda ser consultado no Scimago Journal & Country Rank (SJR), que tem disponível
também uma classificação das revistas por país (além de outros dados bibliométricos).
Assim, por exemplo, consultando o SJR podemos ver que a revista BMC Psychiatry
tem vindo a subir de quartil nos últimos anos, passado do Q3 em 2002 (assinalado a
laranja na imagem abaixo), para o Q2 entre 2003 e 2005, e de novo em 2008.
Finalmente, entre 2006 e 2007, e mais tarde desde 2009 tem-se mantido no Q1 das
revistas na área da Psiquiatria e Saúde Mental.
Fonte: http://www.scimagojr.com
Público-alvo: O público-alvo dos artigos científicos é sobretudo a comunidade

académica.
Tamanho e estilo: A extensão e o estilo do artigo dependerão do tipo e dos requisitos

da revista. Por exemplo, no The Psychologist: Practice & Research Journal (a revista
científica da Ordem dos Psicólogos Portugueses) artigos originais devem ter no
máximo 30 páginas, cerca de 10 000 palavras (incluindo todas as partes do
Página 151 / 163

manuscrito: página de rosto, resumo, texto, referências, tabelas e figuras). Os

resumos não devem ter mais de 500 palavras.
Conteúdo: O conteúdo de um artigo científico segue uma estrutura tradicional com as

secções: resumo, introdução, métodos, resultados, discussão e conclusão. Note-se
que o foco de cada secção pode variar dependendo do tipo de revista. Por exemplo,
se os resultados forem publicados numa revista de âmbito mais geral, deverá ser
apresentada uma compreensão detalhada sobre como o estudo foi realizado e como
contribui para o conhecimento existente. Já se a revista escolhida tiver um âmbito
mais especializado (por exemplo, especialidade clínica) o foco deve ser colocado mais
nos resultados do estudo e no modo como eles podem contribuir para a prática clínica
naquela área de investigação.
Forças: Representa uma contribuição relevante para a comunidade académica;

constitui uma oportunidade de melhorar a investigação que é feita na área.
Fraquezas: O processo pode ser longo; revistas de elevado fator de impacto têm uma
taxa de rejeição de artigos muito alta (o British Medical Journal / BMJ rejeita cerca de
93% dos trabalhos submetidos).
Conferências
O que é? A apresentação dos resultados do estudo numa conferência, seja ela
nacional ou internacional, ajuda a divulgar a investigação que foi feita mais
rapidamente, em comparação com o tempo necessário para publicar artigos
científicos. As conferências também são uma oportunidade para os investigadores
com os mesmos interesses interagirem e partilharem ideias, bem como de apresentar
o seu trabalho a potenciais entidades financiadoras (se estas estiverem representadas
no congresso).
Público-alvo: O público-alvo das conferências é sobretudo a comunidade académica,

em especial os investigadores com interesse na área da conferência.
Tamanho e estilo: As conferências permitem a apresentação do trabalho em forma
de póster ou comunicação oral. O processo de participação em conferência inicia-se
Página 152 / 163

habitualmente pela submissão de um resumo que será depois avaliado por um comité
de seleção. O resumo exige a articulação, de forma clara e concisa, geralmente entre
250-300 palavras, a essência do projeto.
No caso dos pósteres, e sobretudo quando existem prémios para os melhores
trabalhos, a organização da conferência pode exigir que cada investigador faça uma
pequena apresentação do seu conteúdo (5-10 minutos). Para as comunicações orais,
estas têm uma duração aproximada de 15 minutos, com 5 minutos adicionais para
perguntas.
Conteúdo: Tanto os pósteres como as comunicações orais seguem a estrutura

habitual de um artigo, com uma introdução ao tema, a descrição dos métodos
utilizados, seguindo-se a apresentação dos resultados e uma breve discussão e
conclusões gerais. Note-se que para as comunicações orais, dado o curto período de
tempo das mesmas, a apresentação (geralmente construída em formato powerpoint
ou similar) deve ser bem construída e fácil de seguir. Deve ainda ser rica em
resultados que suportem o seu mérito intelectual e carácter diferenciador.
Forças: São um espaço para interação com outros investigadores; permitem um

aumento da visibilidade dos resultados do estudo (mesmo com a apresentação de
resultados preliminares); possibilita a obtenção de feedback importante sobre o estudo
que podem ajudar a escrita do artigo científico.
Fraquezas: As conferências de alto nível são mais competitivas; exigem uma boa
capacidade de síntese e de comunicação oral (em alguns casos, uma boa
apresentação e boas competências de comunicação oral podem aumentar a
atratividade do estudo).
Policy brief
O que é? Um policy brief é um documento curto que apresenta os resultados e as
recomendações de um projeto de investigação a um público especializado.
Geralmente, são usados para defender mudanças legislativas e políticas a nível local,
regional e nacional.
Público-alvo: Principais decisores políticos que, por falta de tempo e enorme
Página 153 / 163

produção científica numa dada área, tendem a selecionar a evidência mais adequada
ao seu ponto de vista político.
Tamanho e estilo: A extensão não deve exceder quatro páginas (aproximadamente

1500 palavras) organizadas de acordo com as secções seguintes: título; sumário
executivo; enquadramento e importância do tema; discussão crítica das opções
políticas; recomendações de políticas; anexos e fontes consultadas ou recomendadas.
Conteúdo: Em geral, os policy briefs variam no conteúdo. No entanto, têm como

elementos mais comuns os seguintes:
1. Foco num único problema ou aspeto específico do problema
2. Documento não académico – não inclui secção dedicada aos métodos; procura
convencer o leitor sobre a importância do problema e possíveis soluções
3. Baseado na evidência – os argumentos e ações apresentadas devem ser apoiados
na evidência
4. Conciso – curto e fácil de ler
5. Compreensível – não deve incluir o uso de jargão
6. Acessível – deve estar disponível para o público-alvo
7. Atrativo – deve ter um design atraente (cores, logotipos, etc.)
Forças: Se elaborados com cuidado, os policy brief podem ser uma ferramenta
poderosa para comunicar os resultados da pesquisa ao público das políticas de
desenvolvimento.
Fraquezas: Considerando o complexo ambiente dos decisores políticos, a

disponibilização de resultados de estudos por si só é insuficiente para influenciar a
agenda política. O valor de uma nota política deve ser visto não apenas em termos de
apresentação de evidências de qualidade, mas também na tradução de novos
conhecimentos em mensagens e orientações relevantes para o contexto dos
decisores políticos.
Press release
Página 154 / 163

O que é? Os meios de comunicação social são uma das audiências mais cruciais para
o investigador pois podem atuar como público-alvo e, ao mesmo tempo, como
disseminadores. Representam uma dos meios mais eficientes e eficazes de divulgar
resultados, na medida em que podem alcançar grupos populacionais que são
inacessíveis para a equipa de investigação. Além disso, podem aumentar a
consciencialização e tornar públicos ou mais visíveis para os decisores políticos
determinados problemas.
Público-alvo: Todos os meios de comunicação de interesse.
Tamanho e estilo: um press release tem o seu próprio estilo:

- Não deve ocupar mais do que uma página A4.
- O título deve ser conciso, cativante e informativo
- O conteúdo deve conciso, salientando os aspetos mais importantes do estudo
Conteúdo: O press release deve conter uma descrição do "quem, o quê, quando e
por quê" do estudo em palavras claras. Deve começar com a apresentação das
informações mais importantes (por que é importante publicar) e terminar com o menos
importante (ou seja, investigadores ou instituição responsável pelo estudo).
Forças: Os meios de comunicação social podem alcançar uma ampla gama de

público a nível nacional e internacional e abordar questões importantes na área.
Fraquezas: os jornalistas não são especialistas em investigação e, portanto, cabe à

equipa de investigação fornecer-lhes informações simples e precisas que sejam úteis
para o público.
Social media
O que é? O recurso às plataformas de redes sociais, como blogs, Twitter, Facebook,
LinkedIn, etc., permite a partilha rápida de resultados com públicos mais amplos. A
participação ativa nas redes sociais permite a divulgação dos resultados de uma forma
rápida e eficaz.
Público-alvo: O público-alvo é bastante abrangente.
Página 155 / 163

Tamanho e estilo: A divulgação de resultados através das redes sociais requer a

elaboração de um plano de comunicação. Embora de uma forma adaptada a cada
plataforma, a informação deve ser breve, concisa e compreensível para o leitor leigo, e
não necessariamente forma. Por exemplo, em alguns casos, podem ser partilhados
fotos ou vídeos de forma a causar mais impacto em determinados grupos-alvo.
Conteúdo: O conteúdo deve ser adaptado às características do público-alvo e à

plataforma que será usada para divulgação dos resultados.
Forças: É uma forma rápida e simples de partilhar informações do projeto de uma

forma regular; permite ainda alcançar um público amplo tanto da comunidade
académica como não académica.
Fraquezas: Ao mesmo tempo, tem o potencial de se transformar rapidamente numa

armadilha. Portanto, é essencial estar ciente das regras básicas para o uso destas
ferramentas. Algumas delas estão incluídas nas regras de condutas gerais de
comportamento profissional. Outras dependem do tipo de conteúdo publicado e giram
em torno de direitos autorais, propriedade intelectual ou problemas de
confidencialidade. As razões comuns para que os investigadores não se envolvam
com as redes sociais incluem o medo de parecer que estão a divulgar informação de
uma forma não profissional, com a publicação de algo errado.
VIII.2.2 Como desenvolver uma estratégia de disseminação?

As estratégias de implementação para que possam ser efetivas devem ser definidas
antes do início do estudo.
O planeamento da estratégia de disseminação/comunicação dos resultados deve
considerar as seguintes questões:
Objetivo: O que se pretende alcançar com a disseminação? Qual o impacto que se
pretende ter?
Audiência: A quem se dirige (comunidade científica, stakeholders, profissionais de
saúde, público em geral)? Quem estaria interessado em conhecer os resultados do
Página 156 / 163

estudo?
Canal: qual é a maneira mais efetiva de alcançar cada público-alvo?
Execução: Quando deve ter lugar cada etapa do plano de disseminação (por exemplo,
em que momentos durante a implementação do estudo e depois do fim do estudo)?
Quem será responsável pelas atividades de disseminação?
Características-chave de um plano de disseminação efetivo

1. Adaptado ao público de interesse (i.e. evitar usar linguagem complicada e jargão
científico);
2. Combina diferentes métodos de disseminação para aumentar impacto;
3. Influencia recursos, relações e redes de trabalho existentes.
Página 157 / 163

BIBLIOGRAFIA ACONSELHADA
Sobre métodos epidemiológicos (conceitos, desenhos de investigação)

Beaglehole R, Bonita R, Kjellstrom T. Epidemiologia Básica. ENSP. Lisboa. 1993.
Investigação Passo a Passo – perguntas e respostas essenciais para a Investigação
Clínica. APMCG 2008.
Stone DB, Armstrong RW, Macrina DM, Pankau JW. Introdução à epidemiologia.
McGraw-Hill. Lisboa. 1996.
Wang D, Bakhai A. Clinical Trials: A Practical Guide to Design, Analysis, and
Reporting. Remedica. Chicago. 2006.
Sobre avaliação custo-efetividade

Muenning P. Cost Effectiveness Analysis in Health. A Pratical Approach (2nd Edition).
John Wiley & Sons. 2008.
Sobre princípios, métodos e técnicas estatísticas aplicadas à investigação

em saúde
Aguiar P. Guia Prático de Estatística em Investigação Epidemiológica: SPSS.
Climepsi. Lisboa. 2007.
Sobre indicadores e construção de escalas/questionários

Dicionário de termos epidemiológicos e metodológicos.
Foddy W. Como perguntar. Oeiras: Celta. 2002.
Hill MM, Hill A. Investigação por questionário. 2nd ed Lisboa: Edições Sílabo. 2008
Last J. Um dicionário de Epidemiologia. Segunda edição. Departamento de Estudos e
Planeamento da Saúde. Ministério da Saúde. Lisboa. 1988.
Moreira JM. Questionários: Teoria e Prática. Almedina. 2009.
Streiner DL, Norman GR. Health Measurement Scales: A Practical Guide to Their
Development and Use. 4th ed. Oxford: Oxford University Press. 2008.
Página 158 / 163

ANEXOS
Anexo I – Consentimento informado
Estudo sobre a efetividade de um programa de promoção da saúde

mental em situações laborais precárias e de desemprego
CONSENTIMENTO INFORMADO
Este documento descreve o estudo para o qual o/a convidamos a participar. Por favor leia-o
atentamente. No fim, o(a) investigador(a) irá perguntar-lhe se concorda em participar. Se não se
sentir totalmente esclarecido, sinta-se à vontade para perguntar qualquer questão que tenha ao(à)
investigador(a). Não fique com dúvidas. Caso decida participar e se surgirem novas questões, poderá
contactar o(a) investigador(a) para esclarecê-las.
1. BREVE DESCRIÇÃO DO ESTUDO

Este estudo pretende avaliar a efetividade de um programa de promoção da saúde mental em
situações laborais precárias ou de desemprego. É um estudo que está a ser desenvolvido pela
Faculdade de Medicina da Universidade de Lisboa, instituição responsável pela recolha e análise dos
dados.
2. OBJETIVO DA RECOLHA DE DADOS

Desenvolver uma avaliação da efetividade de um programa de promoção da saúde mental em
situações laborais precárias ou de desemprego, direcionado para a promoção da saúde mental e
para a capacitação socioemocional e psicológica para a procura e reintegração profissional.
3. INTERVENÇÃO
Trata-se de uma formação que decorrerá ao longo de algumas sessões.
Informações relevantes:
• Cada sessão terá a duração de aproximadamente até duas horas;
• Não se pretende julgar o comportamento/ atitudes de cada participante, mas contribuir para que
possam regressar com qualidade ao trabalho, lidando eficazmente com as dificuldades que uma
situação laboral precária possa implicar;
• As informações recolhidas serão utilizadas única e exclusivamente para fins científicos;
• Será mantido o anonimato de cada participante e confidencialidade das respostas.
4. O QUE É QUE EU GANHO EM PARTICIPAR?

As pessoas que decidam participar não terão gratificações ou remunerações. Caso decida participar,
Página 159 / 163

estará a contribuir para o conhecimento do impacto na saúde mental das situações de emprego
precárias e do desemprego.
5. O QUE ACONTECE SE EU DECIDIR NÃO PARTICIPAR?

Caso decida não participar, não será prejudicado/a em nenhum aspeto. Nenhuma pessoa será
informada da sua decisão caso opte por não participar. No decorrer do estudo pode interromper a sua
participação, para o que bastará comunicar-nos a sua decisão.

Para os devidos efeitos, declaro estar devidamente esclarecido/a sobre o estudo, aceitar participar
no estudo e dar o meu consentimento para que se faça a recolha da informação, que será utilizada
apenas para os fins mencionados.
Data: ___ de ______________ de __________
______________________________ ___________________________________
(O Participante ou o seu (O Investigador)
representante legal, se aplicável)
Qualquer dúvida, por favor não hesite em contatar-nos:
Dr.ª Ana Virgolino
Instituto de Medicina Preventiva e Saúde Pública

Faculdade de Medicina de Lisboa
Telefone: (+351) 217985130, Ext.: 47094
Página 160 / 163


Para os devidos efeitos, declaro estar devidamente esclarecido/a sobre o estudo, aceitar participar
no estudo e dar o meu consentimento para que se faça a recolha da informação, que será utilizada
apenas para os fins mencionados.
Data: ___ de ______________ de __________
______________________________ ___________________________________
(O Participante ou o seu (O Investigador)
representante legal, se aplicável)
Qualquer dúvida, por favor não hesite em contatar-nos:
Dr.ª Ana Virgolino
Instituto de Medicina Preventiva e Saúde Pública

Faculdade de Medicina de Lisboa
Telefone: (+351) 217985130, Ext.: 47094
Página 161 / 163

Anexo II – Protocolo de investigação

(Artigo completo disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5517795/)
Página 162 / 163

Anexo III – Revisão sistemática de literatura

(Artigo completo disponível em:
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-
311X2015000200229&lng=en&nrm=iso&tlng=en)
Página 163 / 163

Manual de Apoio Ao Curso

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Manual de Apoio Ao Curso

Enviado por

Direitos autorais:

Formatos disponíveis

Manual – Métodos de Avaliação de Efetividade em Intervenção Psicológica

CAPÍTULO I - Quando e o que avaliar? ....................................................................................................... 7

III.1 Revisão da evidência para apoio à decisão ................................................................................... 46

VII.2 Duas estratégias de análise em avaliação de efetividade e custo-efetividade ..................... 132

Investigar faz parte da natureza humana. É um reflexo da curiosidade e da

A informação que nos chega é construída e disseminada a um ritmo demasiado rápido

O rigor de um pensamento analítico e sistemático, próprio da ciência, implica a

É fundamental que o trabalho realizado pelos psicólogos ganhe a credibilidade e

Este manual expressa um modo pessoal de ver a produção científica no contexto da

Lisboa, dezembro de 2017

CAPÍTULO I - Quando e o que avaliar?

I.1 Por que razão importa avaliar a efetividade?

Para compreendermos a importância em avaliar efetividade, importa antes de mais

Eficácia Efetividade Eficiência

Eficiência: Trata-se de um indicador económico, expressando a relação entre os

Os três conceitos – eficácia, efetividade e eficiência – expressam graus diferentes de

Só faz sentido avaliar a efetividade quando a eficácia está assegurada. E só faz

 Sabe-se que a dessensibilização sistemática é uma intervenção eficaz para o

 Se a efetividade está garantida (i.e., com elevados níveis de sucesso em “consulta

(terapias dinâmicas, terapia familiar, etc.).

O estudo destes conceitos, eficácia, efetividade e eficiência, implica obviamente a

I.2 Em que contextos importa avaliar a efetividade?

Faz sentido avaliar efetividade quando existe conhecimento suficiente para se

Qual a efetividade de intervenções de promoção de saúde mental em contexto

Qual a efetividade de um determinado sistema de reforço em contexto laboral?

Qual a efetividade de intervenções psicoterapêuticas em casos de ansiedade ou

Qual a efetividade de intervenções psicoeducativas em contexto de gestão de

Qual a efetividade de uma medida de saúde pública, na área da saúde mental?

I.3 Avaliação de efetividade: definição de pergunta, objetivos e hipóteses de

I.3.1 Pergunta de investigação

Como definir uma pergunta de investigação?

“ Durante anos perguntei “Qual é a resposta certa?”. Agora procuro saber

Uma pergunta de investigação representa uma incerteza relativamente:

 objetivos (ou seja, isentos da interpretação não sustentada em observação de

 válidos (ou seja, baseados em procedimentos e instrumentos de medição

 replicáveis (outros investigadores utilizando os mesmos métodos com populações

Critérios de uma boa pergunta de investigação

A pergunta deve ser passível de ser respondida através de métodos

 acesso aos dados necessários para o estudo

Exequível (Feasible)  custo financeiro

A pergunta deve ter interesse científico, não apenas para o próprio

A pergunta deve apresentar algum elemento de novidade.

 Recorre a uma nova técnica de avaliação?

 Implica o estudo de uma população ainda não estudada

 Estuda a associação entre variáveis ainda não relacionadas?

Os métodos para estudar a pergunta devem garantir os princípios da

Ética  Princípio da não-maleficência

Para além de ser interessante e nova, a pergunta deve ser relevante. Ou

 Permite avançar o conhecimento científico?

 Permite definir políticas mais adequadas ou justas?

A pergunta deve identificar a população em estudo. Qual a população de

 Pessoas com depressão major

A pergunta deve incluir informação sobre aspetos relacionados com a

 Treino de competência interpessoais

Intervenção (ou  Treino de assertividade

Se se tratar de um estudo controlado (que inclui um grupo para

 Sem treino de assertividade

 Com intervenção cognitivo-comportamental (por oposição a

 Sem treino imagético

 Sem treino de mindfulness

Qual o indicador utilizado para medir sucesso ou grau de efeito da

 Resultados escolares (matemática, português, ...)