Escolar Documentos
Profissional Documentos
Cultura Documentos
PESQUISA E
ESTATÍSTICA NAS
CIÊNCIAS DA SAÚDE
NOTA HISTÓRICA
Os enfermeiros estiveram na vanguarda do movimento para utilizar estatísticas a fim de melhorar os cuidados
de saúde. Por exemplo, Florence Nightingale (1820 – 1910) utilizou dados dos arquivos do exército britânico
para demonstrar como a maioria das mortes no exército britânico durante a Guerra da Criméia (1853 – 1856)
não foram causadas por combate direto, mas sim por doenças contraídas fora do campo de batalha ou como
resultado de ferimentos não tratados. Suas análises estatísticas convenceram o governo britânico a manter
hospitais de campanha e fornecer cuidados de enfermagem aos soldados. Nightingale transmitiu sua paixão
por estatística para sua homônima, Florence Nightingale David, a filha mais velha de seus amigos mais
próximos. Florence Nightingale David (1909 – 1995) tornou-se estatística e trabalhou sob orientação de Karl
Pearson. Ela produziu a primeira das Tabelas do Coeficiente de Correlação em 1938. Durante a Segundas
Guerra Mundial, ela utilizou modelos estatísticos para ajudar a Inglaterra a se preparar para os ataques aéreos
alemães. Posteriormente, David deixou a Inglaterra e fundou o Departamento de Estatística da Universidade
da Califórnia em. 1970 (Salsburg, 2001).
desvio padrão, para descrever característica de forma para alterar seu estado. As perguntas
uma amostra populacional. Estatística inferencial respondidas com esses tipos de estatísticas
são técnicas estatísticas (por exemplo, teste qui- geralmente são mais complexas do que aquelas
quadrado, teste t, análise de variância de um fator) respondidas por estatísticas descritivas. Suas
que permitem tirar conclusões sobre as relações perguntas e linhas de investigação geralmente são
encontradas entre diferentes variáveis em uma baseadas em teorias estabelecidas na literatura de
amostra populacional. pesquisa. Os estudos explicativos dependem de
perguntas inferenciais como: “As mulheres que
são sedentárias no terceiro trimestre da gestação
Estudos descritivos e estatísticas têm maior ou menor probabilidade de ter uma
cesariana do que as mulheres que se exercitam
descritivas regularmente durante o terceiro trimestre?” ou
“As pessoas com seguro de saúde tem uma
Estudos cujo objetivo principal é descritivo e estadia hospitalar mais longa ou mais curta após
exploratório simplesmente descrevem situações e serem admitidas por uma crise de asma em
eventos. Esses estudos usam perguntas comparação com pessoas sem seguro de saúde?”.
descritivas, como: “Qual é o estado civil das Os estudos explicativos não necessariamente
pessoas nos Estados Unidos ?” e “Qual é a tentam estabelecer causalidade, mas muitas vezes
duração média da internação hospitalar após ser tentam entender como as variáveis estão
admitido por um ataque de asma?”. Estatísticas relacionadas entre si. Por exemplo, uma pergunta
são tipicamente usadas para analisar os dados a poderia ser: “A duração da internação hospitalar
fim de responder a esse tipo de pergunta. A tabela por uma crise de asma difere dependendo do
1-1 ilustra o uso de estatística descritivas para status do seguro de saúde?”. Estatísticas
responder à pergunta sobre o estado civil das inferenciais são usadas para examinar como uma
mulheres no EUA, usando dados da Pesquisa da variável está relacionada a outras variáveis, ou
Comunidade Americana de 2006 -2008 seja, a relação entre as variáveis.
(Departamento do Censo dos EUA, 2000). Um exemplo de estudo explicativo é aquele
conduzido por Ludwig-Beymer e Gerc (2002),
que examinaram a relação entre o comportamento
de exercício físico e recepção da vacina contra
gripe em uma amostra de 999 profissionais de
saúde. A Tabela 1-2 mostra os dados desse estudo
em uma tabela de cruzamento. Uma tabela de
cruzamento é uma maneira de exibir a relação
entre duas variáveis. A Tabela 1-2 mostra que
48,1% dos profissionais de saúde que exercitavam
regularmente receberam a vacina contra gripe, em
comparação com 52,4% daqueles que não se
exercitavam regularmente. Embora esses números
não sejam idênticos (48,1% versus 52,4%), um
teste estatístico de probabilidade (o teste qui-
quadrado) indica que eles não são estatisticamente
diferentes, o que significa que os dois grupos não
Como mostrado na Tabela 1-1, a pesquisa diferiram em sua probabilidade de obter a vacina
constatou que aproximadamente 50.2% das contra gripe mais do que esperaria apenas por
mulheres estavam atualmente casadas, 30,8% acaso e, portanto, a pequena diferença que vemos
nunca se casaram, 10,6% eram divorciadas, 2,2% provavelmente pode ser atribuída ao acaso em vez
estavam separadas e 6,3% eram viúvas. dos hábitos de exercício físico.
pesquisadores introduzem uma intervenção (por são medidas, é fácil perder o foco do propósito
exemplo, alterar uma das variáveis em estudo), inicial do estudo e gerar “resultados” que parecem
uma vez que esses tipos de estudos são ser úteis. No entanto, esses resultados são
considerados ter maior validade, tornando a insignificantes a menos que existam no contexto
inferência causal mais sólida do que em designs de uma linha de investigação organizada. O
de estudo puramente observacionais. Os designs Quadro 1-1 lista alguns dos erros que os
experimentais verdadeiros incluem seleção pesquisadores cometem ao embarcar em projetos
aleatória e atribuição aleatória dos participantes de pesquisa. Esses erros são frequentemente
do estudo, seja para o grupo de intervenção ou cometidos quando não há um plano de estudo ou
para um ou mais grupos de controle que não quando o plano é insuficientemente detalhado.
receberam a intervenção. Trabalhos resultantes de estudos que possuem
planos de estudo inadequados frequentemente
Os designs quasi-experimentais são semelhantes carecem de foco e clareza. Embora existam vários
aos designs experimentais, exceto que eles métodos conhecidos para escrever um plano de
carecem de um ou mais dos seguintes aspectos: estudo, todos seguem os mesmos princípios
atribuição aleatória para o grupo de intervenção básicos.
ou controle ou, em alguns casos, um verdadeiro
grupo controle.
Ensaios clínicos randomizados (ECRs) são QUADRO 1-1 OITO ERROS COMUNS NA PESQU
considerados designs experimentais porque os
participantes do estudo são randomicamente ① Realizar um projeto sem revisar a literatura exi
atribuídos a um grupo de intervenção ou a um
grupo controle e são acompanhados ao longo do ② Coletar dados antes de um plano bem definido
tempo para determinar se a intervenção tem
③ Tentar encaixar perguntas de pesquisa relevan
impacto em um resultado de saúde específico. No
entanto, os ensaios clínicos randomizados ④ Definir termos de forma geral ou ambígua
geralmente não selecionam os participantes do
estudo aleatoriamente da população. Em vez ⑤ Não fundamentar a pesquisa em uma base teó
disso, eles têm critérios de elegibilidade estritos ⑥ Não tornar explícitas e claras as suposições sub
que os interessados em participar do estudo
devem atender antes de serem permitidos a ⑦ Não reconhecer as limitações da abordagem
participar. Qualquer pessoa que não atenda a esses ⑧ Não antecipar hipóteses rivais que possam ex
critérios de elegibilidade é excluída do estudo.
Essa falta de seleção aleatória de participantes do desafiar interpretações e conclusões
estudo da população em geral pode limitar a Fonte: Munro’s statistical methods for health care research / Stacey B. P
validade externa do estudo, ou seja, os resultados
podem não ser generalizáveis para a população
em geral.
pesquisa anteriores. Se não houver resultados interesse, ou seja, aquelas variáveis que se espera
anteriores, é permitido basear as hipóteses em que mudem em resposta às características,
opinião especializada ou em uma justificativa exposições ou intervenções em estudo, como
sólida. estado de saúde, uso de serviços de saúde e custos
de internação. Alguns exemplos de variáveis
Em um projeto de pesquisa, as hipóteses servem usadas por Armitage (2005) incluem o seguinte:
como guia para a análise de dados. Deve haver
uma hipótese específica para cada relação que A atividade física autorrelatada é
está sendo testada. Em uma dissertação, não é definida como o relato dos participantes
incomum, por exemplo, ter inúmeras hipóteses sobre quantas vezes eles participaram de
que estão sendo testadas. Claro, muitas delas atividade física nos últimos 3 meses
podem ser agrupadas sob títulos (por exemplo, (classificada em uma escala de 7 pontos
características sociodemográficas, atividade que variou de nunca a frequentemente)
física). Novos pesquisadores devem ter cuidado O controle comportamental percebido é
especial para anotar cada relação que planejam definido pela média das respostas de
testar para se manterem organizados e focado. As quatro itens na escala Likert (as
hipóteses testadas por Armitage (2005) incluem as respostas variaram de 1 a 7; pontuações
seguintes: mais altas indicam maiores níveis de
controle comportamental percebido). Os
Aqueles que se percebem capazes de se itens da escala foram:
exercitar serão mais propensos a se 1. Em que medida você se vê capaz de
engajar em atividade física do que participar de atividade física? (incapaz
aqueles que não o fazem – capaz)
2. Quão confiante você está de que
Aqueles que percebem normas subjetivas
conseguirá participar regularmente de
de apoio ao exercício têm mais atividade física? (pouco confiante –
probabilidade de exercitar muito confiante)
Aqueles com uma intenção 3. Eu acredito que tenho habilidade para
comportamental positiva de se exercitar participar regularmente de atividade
tem mais probabilidade de fazê-lo do que física. (definitivamente não -
aqueles sem uma intenção definitivamente sim)
comportamental positiva de se exercitar 4. Quanto controle pessoal você sente que
tem sobre a participação regular em
atividade física? (nenhum controle –
controle completo)
❺ Termos-chave e variáveis
dados. Cada técnica estatística faz suposições Estudos longitudinais (ou estudos prospectivos
sobre os dados, em um bom plano de estudo ou de coorte) são projetados para coletar em mais
maximiza a extensão em que os dados atendem a de um ponto no tempo, acompanhando os
essas suposições. Detalhes dessas suposições são participantes ao longo do tempo para identificar
explicados posteriormente no texto quando as resultados futuros. Como os estudos longitudinais
técnicas estatísticas são discutidas. A escolha do determinam claramente que a causa presumida (a
desenho depende de vários fatores, incluindo o exposição) ocorreu antes do resultado presumido,
tipo de problema, ambiente de pesquisa e recursos eles são fornecedores de evidências mais fortes
disponíveis. Os desenhos de pesquisa comumente para causalidade do que os estudos transversais ou
utilizados em estudos de saúde incluem estudos de caso-controle. No entanto, mesmo com estudos
observacionais, estudos quase-experimentais e longitudinais, pode haver explicações alternativas
estudos experimentais. para as associações encontradas e, portanto, como
em outros designs de estudos observacionais, as
Desenhos de estudos observacionais conclusões geralmente são formuladas em termos
de associação em vez de causalidade.
Estudos observacionais são aqueles em que um
fenômeno é simplesmente observado e nenhuma Desenhos de estudos quase-experimentais e
intervenção é instituída. Eles são apropriados experimentais
quando o objetivo do estudo é descritivo, quando
as hipóteses são exploratórias ou quando não é Os desenhos de estudos quase-experimentais e
possível manipular a exposição em estudo, por experimentais diferem dos observacionais pelo
exemplo, quando a exposição é potencialmente gato de que o pesquisador é um agente ativo no
prejudicial e, portanto, não pode ser eticamente trabalho experimental. Ambos os tipos são
atribuída aos participantes do estudo em um prospectivos (acompanham os participantes ao
modelo experimental. Os três principais tipos de longo do tempo) e envolvem medições
estudos observacionais são estudos transversais, realizadas em pelo menos dois momentos
estudos de caso-controle e estudos longitudinais
separados no tempo, geralmente uma medida
(também conhecidos como “estudos de coorte”).
pré-testes, ou linha de base, e uma medida pós-
Estudos transversais envolvem a coleta de dados teste. Ambos os tipos de design envolvem um
sobre o status atual de resultado e exposição dos tratamento ou algum tipo de intervenção
participantes do estudo em um determinado aplicada a alguns dos participantes e um grupo
momento. Os participantes do estudo (a amostra) de comparação que não recebe a intervenção
podem ser selecionados aleatoriamente da (ou seja, grupo controle). Esses dois grupos são
população, ou a pesquisa pode utilizar grupos então comparados em termos do resultado de
intactos ou amostras por conveniência (por interesse durante o acompanhamento do estudo.
exemplo, membros de um centro comunitário). Quaisquer diferenças no resultado entre os dois
Estudos transversais fornecem apenas evidências grupos podem ser atribuídas ao tratamento.
indiretas sobre a ordem temporal, ou seja, quais Experimentos controlados também envolvem a
variáveis ocorrem primeiro. Devidos a essa seleção aleatória de sujeitos da população de
incapacidade de determinar a ordem temporal, interesse e a atribuição da intervenção em
declarações causais não podem ser feitas a partir estudo de maneira aleatória. Em outras
de análises de dados temporais. Não podem saber palavras, cada participante do estudo tem a
se a causa presumida precedeu o resultado mesma chance de receber o tratamento em
presumido em um estudo transversal. estudo.
Estudos de caso-controle envolvem a coleta de Os desenhos quase-experimentais carecem de
dados sobre o status atual de resultado dos seleção aleatória e/ou atribuição aleatória da
participantes do estudo (por exemplo, se eles têm
intervenção do estudo. Os designs
ou não o resultado de saúde em estudo) e o status
experimentais diferem dos quase-experimentais
de exposição passada. Embora os estudos de caso-
controle forneçam alguma evidência de que a principalmente na quantidade de controle que o
causa presumida precedeu o resultado, devido à experimentador tem sobre fontes externas de
possível recuperação incorreta de exposições viés e erro aleatório, ambos os quais podem
passadas, a maioria dos pesquisadores evita fazer questionar a validade e confiabilidade dos
declarações causais a partir de estudos de caso- resultados. A evidência de estudos
controle, e em vez disso, formulam conclusões em experimentais é considerada mais forte do que
termos de associação em vez de causalidade. a evidência de estudos tanto quase-
experimentais quanto observacionais.
PESQUISA E ESTATÍSTICA NAS CIÊNCIAS DA SAÚDE
Segue uma breve discussão de um design de Na amostragem aleatória igual, cada pessoa na
estudo com base na pesquisa de Armitage população tem a mesma probabilidade de ser
(2005): escolhida para a amostra. Isso também é
conhecido como amostragem “auto-ponderada”.
Este é um estudo observacional Outros procedimentos de amostragem aleatória
longitudinal com clientes adultos de mais complexos, nos quais amostras são
uma academia de ginástica recém- selecionadas aleatoriamente dentro de subgrupos
inaugurada. Todos os novos membros da população, as vezes são usados em estudos,
foram convidados a participar do especialmente em algumas pesquisas nacionais.
Os dados desses estudos devem ser analisados
estudo. Aqueles que concordaram em
comum software especializado que leva em conta
participar preencheram um
as diferenças na probabilidade de cada pessoa ser
questionário autoadministrado no selecionada para o estudo. O uso de uma amostra
início e um questionário idêntico três aleatória da população reduz as chances de viés e
meses depois. aumenta a validade externa, ou generalização dos
resultados do estudo. Segue uma breve descrição
da amostragem na pesquisa de Armitage (2005),
❼ Amostra e amostragem que utilizou uma amostra de conveniência:
Todos os participantes do estudo foram
O mecanismo pelo qual os participantes são recrutados em uma única academia de
selecionados para um estudo é parte crítica do ginástica recém-inaugurada no sul da
design da pesquisa e é um tópico tão completo Inglaterra
que merece sua própria seção no plano de estudo. A amostra final consistiu em 94 novos
Em geral, os estudos tentam encontrar clientes adultos
participantes que representem todos os membros Os clientes eram 56% do sexo
da população de interesse, pois geralmente é masculino, e a idade média era de 37,57
impossível coletar dados de toda a população. Por anos (faixa de 18 a 65 anos)
exemplo, pesquisadores interessados em abster
informações sobre mulheres com diabetes
gestacional podem apenas conseguir reunir dados ❽ Análise estatística
de uma clínica que atende essas mulheres.
Amostragem é um processo de selecionar uma A análise estatística dos dados ocorre em quatro
parte da população para representar toda a etapas:
população. Uma consideração importante ao Os dados devem ser inseridos em um
avaliar uma amostra é garantir que ela represente banco de dados
a população em estudo. É importante indicar Os dados devem ser “limpos”
exatamente qual é a população-alvo, ou seja, o Estatísticas descritivas são usadas para
grupo para o qual os pesquisadores desejam descrever a amostra em características
generalizar os resultados do estudo. Mesmo com demográficas e para avaliar e descrever
o uso de um conjunto de dados existente, o plano as variáveis dependentes e
do estudo deve conter uma explicação de como as independentes.
pessoas foram escolhidas para participar do Cada hipótese é listada com o teste
estudo. Também deve conter uma breve descrição inferencial que será usado para testá-la.
das características sociodemográficas da amostra.
A escolha real do teste depende do design do
A amostragem pode ser aleatória (ou seja, a estudo usado para coletar os dados, do tamanho
probabilidade de ser selecionado é conhecida) ou da amostra, da escala de medida das variáveis na
não aleatória (ou seja, a probabilidade de seleção hipótese e da distribuição dessas variáveis. Os
é desconhecida). Na amostragem não aleatória, a testes escolhidos inicialmente no plano do estudo
conveniência ou o julgamento subjetivo são podem ser alterados à medida que mais
usados para decidir quem é escolhido para a informações sobre a natureza das variáveis são
amostra. Uma desvantagem é que é difícil obtidas.
determinar se a amostra inclui membros de todos
os segmentos relevantes da população. Tipos de
amostras não aleatórias incluem amostragem por
conveniência, amostragem em cascara,
amostragem por quota e amostragem sistemática.
A amostragem aleatória é a seleção de um grupo
de indivíduos de uma população de forma que
cada pessoa seja escolhida inteiramente por acaso.
Inserção de dados Descrevendo a amostra
O primeiro passo antes de qualquer análise de O segundo passo na análise de dados é descrever
dados é inserir os dados em um banco de dados. as características da amostra usando estatísticas
Existem várias opções de software de banco de descritivas. É comum criar tabelas que exibam
dados que variam em termos de facilidade de uso. características sociodemográficas da amostra,
Alguns softwares, como Excel e SPSS, permitem como idade, gênero, etnia e nível de educação.
ao usuário inserir dados em uma planilha, em uma Essas descrições ajudam os leitores a entender a
interface na qual as linhas representam os população do estudo. Os valores gerais e a
participantes do estudo e as colunas representam distribuição das principais variáveis
as variáveis. O apêndice A contém orientações independentes e dependentes também são
detalhadas em como configurar uma planilha de descritos.
entrada de dados no SPSS.
Estatísticas inferenciais usadas para testar
Limpeza de dados hipóteses
Após os dados serem inseridos em um banco de O terceiro passo na análise de dados é listar as
dados, a limpeza dos dados envolve garantir que estatísticas inferenciais que serão usadas para
todas as variáveis tenham valores válidos e testar as hipóteses. As hipóteses, incluindo as
utilizáveis. Essa etapa é concluída executando variáveis independentes e dependentes em cada
frequências em cada variáveis e examinando hipótese, devem ser claramente declaradas. O
cuidadosamente essas frequências em busca de teste exato realizado para testar cada hipótese
valores inválidos, valores incomuns, grande depende do design do estudo, do tamanho da
quantidade de dados ausentes e variabilidade amostra, da distribuição das variáveis (ou seja,
adequada. Por exemplo, se a variável gênero tem normal ou não normal), escala de medida das
o valor 0 para homens e o valor 1 para mulheres, variáveis na hipótese (nominal, ordinal, intervalar,
qualquer caso que apresente um valor de 3 para razão) e tipo de comparações a serem feitas. Em
gênero deve ser examinado e explicado. A geral, estatísticas não paramétricas, que não
distribuição de frequência de cada variável é exigem que as variáveis atendam a certas
então verificada em busca de valores suposições de distribuição, são usadas para
excepcionalmente grandes ou pequenos para pequenos tamanhos de amostra e para variáveis
garantir que tenham sido inseridos corretamente que não estão normalmente distribuídas, enquanto
no banco de dados. Por exemplo, se o peso de um estatísticas paramétricas, que exigem que certas
participante estiver listado em 703 Kg, deve ser suposições de distribuição sejam atendidas, são
verificado se não é na verdade 70,3 Kg devido a usadas para análise de grandes tamanhos de
um erro de entrada de dados (digitação). Em amostra com variáveis normalmente distribuídas.
alguns casos, as cópias em papel a partir das quais Essas técnicas serão descritas posteriormente em
os dados foram inseridos podem ser verificadas momento oportuno. Alguns planos de estudo
quanto à precisão. Em outros casos, podem incluir estatísticas multivariadas para
especialmente se o estudo se baseia em dados controlar cariáveis de confusão e eliminar
secundários, os dados não podem ser verificados. hipóteses rivais (também discutidos em outra
Todos os valores inválidos e fora do intervalo seção).
devem então ser definidos como “system
missing” ou “dados perdidos” ou “valores
ausentes”. Pressupostos e limitações
❾
O próximo passa na limpeza dos dados é verificar
as variáveis com dados ausentes. Se muitos Todo estudo possui pressupostos, limitações e
participantes estiverem sem valores para uma delimitações que devem sem explicitamente
determinada variável, a variável pode não ser declarados. Pressupostos são afirmações que são
utilizável. Além disso, as variáveis devem ser consideradas verdadeiras mesmo que a evidência
examinadas quanto à variabilidade adequada direta da verdade esteja ausente ou não estava
dentro de cada variável. Se quase todas bem documentada. Por exemplo, no estudo sobre
responderem da mesma maneira a uma variável atividade física, assume-se que os participantes
específica (por exemplo, se 99% do grupo for foram honestos em relação ao seu nível de
composto por mulheres), então essa variável não atividade física. Limitações sãos fraquezas ou
pode ser usada durante a análise, pois não há desvantagens do estudo que potencialmente
participantes do sexo masculino em seu estudo limitam a validade dos resultados. Por exemplo,
para os quais você possa comparar os uma limitação do estudo sobre atividade física é o
participantes do sexo feminino. uso de um grupo intacto (ou seja, clientes de uma
PESQUISA E ESTATÍSTICA NAS CIÊNCIAS DA SAÚDE