Escolar Documentos
Profissional Documentos
Cultura Documentos
Livro Bioestatística e Epidemiologia
Livro Bioestatística e Epidemiologia
Epidemiologia
PROFESSORAS
Dra. Izabel Galhardo Demarchi
Me. Renata Cristina Souza Chatalov
PRODUÇÃO DE MATERIAIS
Coordenador de Conteúdo Sidney Edson Mella Junior Revisão Textual Meyre Aparecida Barbosa da Silva Editoração
Matheus Silva de Souza Ilustração Bruno Cesar Pardinho, Geison Odlevati Ferreira Fotos Shutterstock.
FICHA CATALOGRÁFICA
Bioestatística e Epidemiologia.
Izabel Galhardo Demarchi, Renata Cristina Souza Chatalov.
Maringá - PR.: Unicesumar, 2021. Reimpresso em 2023.
328 p.
“Graduação - EaD”.
Impresso por:
CDD - 22 ed. 615
CIP - NBR 12899 - AACR/2
ISBN 978-65-5615-521-0
Reitor
Wilson de Matos Silva
Graduada em Engenharia Ambiental e Sanitária, Tecnolo-
gia Ambiental, com especialização em Gestão Ambiental
e Mestrado em Engenharia Urbana. Docente desde 2012,
nos cursos de Engenharia Civil e Engenharia Elétrica.
No final de 2012 iniciou as atividades na educação à
distância. Tem experiência com a disciplina de estatís-
tica há mais de 8 anos e vasta experiência na escrita de
materiais nesta área. Além da área de Bioestatística, tem
afinidade também pela área de tratamento de efluentes,
resíduos sólidos e licenciamento ambiental.
Lattes: http://lattes.cnpq.br/7312835687328748
Sempre que encontrar esse ícone, esteja conectado à internet e inicie o aplicativo
Unicesumar Experience. Aproxime seu dispositivo móvel da página indicada e veja os
recursos em Realidade Aumentada. Explore as ferramentas do App para saber das
possibilidades de interação de cada objeto.
RODA DE CONVERSA
PÍLULA DE APRENDIZAGEM
Uma dose extra de conhecimento é sempre bem-vinda. Posicionando seu leitor de QRCode
sobre o código, você terá acesso aos vídeos que complementam o assunto discutido
PENSANDO JUNTOS
EXPLORANDO IDEIAS
EU INDICO
Enquanto estuda, você pode acessar conteúdos online que ampliaram a discussão sobre
os assuntos de maneira interativa usando a tecnologia a seu favor.
Você já teve a curiosidade de conhecer um pouco mais sobre o que faz um profissional
da área da saúde? Pensou? Me diga quais áreas você irá atuar: Diagnóstico, Medica-
mentos, Imagenologia, Alimentos, Industria, Epidemiologia, Área Ambiental? Você sabia
que as técnicas utilizadas na área de Bioestatística e Epidemiologia poderão te ajudar
em seu cotidiano, na maioria das tuas áreas de atuação? Você sabe como?
Com os conhecimentos obtidos na disciplina de Bioestatística e Epidemiologia, você
aplicará os conceitos destas áreas no campo da biologia e da saúde, sendo essencial
para problematização, para o planejamento, coleta de dados, análise crítica e principal-
mente como ferramenta para auxílio da tomada de decisão e gestão de saúde.
Na disciplina da Bioestatística muitas vezes, você vai trabalhar com análise de dados,
certo? Para isso é importante que você entenda como “tratar” esses dados provenien-
tes de uma pesquisa. Assim, sugerimos que você faça uma pesquisa no site do IBGE
e veja quais são as regras para construir um quadro e uma tabela. Depois faça uma
análise dos dados populacionais, e também, no painel de indicadores sobre a questão
de saúde e saneamento do Brasil. Esta aproximação servirá de base para trabalharmos
os conceitos da epidemiologia.
Você percebeu como é fácil construir uma tabela a partir de dados fidedignos? É impor-
tante que você não se esqueça das regras específicas, pois delas dependem um bom
resultado e interpretação adequada das informações levantadas.
Neste estudo iniciaremos com a oportunidade de conhecer a origem da Bioestatística,
sua definição, sua importância, bem como entender que as técnicas estatísticas são
essenciais para uma pesquisa. Além disso, você vai compreender como fazer uma
coleta de dados utilizando as principais técnicas de amostragem, como construir tabe-
las e compreender suas regras. Vamos aprender também a elaborar gráficos e fazer
sua leitura e interpretação. É fundamental entender como ocorre a análise dos dados
oriundos de uma pesquisa para que se possa analisar situações quanto à frequência,
incidência, ocorrências, dentre outras variáveis. Informações de como trabalhar com
as medidas de posição, separatrizes, variabilidade podem ajudar em experimentos, em
resultados e em possíveis situações que envolvam as incertezas, e são imprescindíveis
para futura atuação profissional. Na parte de bioestatística, finalizamos com um as-
sunto muito importante para sua formação, a inferência estatística, que visa por meio
de testes, analisar uma amostra e fazer projeções para a população.
Na segunda parte deste livro estudaremos os princípios básicos de epidemiologia.
Esta ciência traz ferramentas fundamentais para os profissionais de saúde, e possui
interfaces com outras disciplinas, como a estatística, a geografia, a ecologia, a ética, a
sociologia e a clínica. Inicialmente apresentaremos os conceitos, objetivos e perspectivas
históricas da epidemiologia, incluindo a compreensão do processo saúde-doença, os
fatores etiológicos (preditores), a causalidade e as medidas preventivas. Na sequência
estudaremos os métodos epidemiológicos utilizados para a compreensão da distribuição
das doenças, a coleta de dados das populações/indivíduos, os indicadores de saúde e
a estrutura e funções da Vigilância Epidemiológica. As medidas de frequência, preva-
lência e incidência serão detalhadas na Unidade III, permitindo que você compreenda
a distribuição dos casos de acordo com a duração e tempo da doença. Além disso,
também serão definidas e interpretadas nesta unidade as medidas de associação. Na
Unidade IV, definiremos os desenhos de estudos epidemiológicos, compreendendo
os principais estudos descritivos e analíticos. Serão apresentados os estudos do tipo
transversal, caso-controle, coorte e ensaios clínicos humanos e não humanos (os ditos
experimentais). Por fim, na última unidade mostraremos algumas das aplicações da
epidemiologia na saúde, como a Epidemiologia Moderna, Genética, Ambiental, Clínica
baseada em evidências, Social, e Hospitalar. Abordaremos também a aplicação da
epidemiologia para o planejamento e gestão em saúde, que subsidiam as tomadas
de decisões das políticas públicas ou privadas, para a avaliação dos serviços de saúde
oferecidos à população.
Na prática, este conhecimento traz a você, futuro(a) profissional de saúde, um dife-
rencial. Você pode perceber que em seu campo profissional certamente utilizará a
Bioestatística e Epidemiologia de várias maneiras, como por exemplo, para testar uma
hipótese, para analisar condições determinantes a saúde da população, para conduzir
experimentos científicos tecnicamente na análise de fenômenos e nas aplicações no
campo das ciências biológicas, exatas e da saúde.
Como você pode ter observado, os conhecimentos de Bioestatística e Epidemiologia são
fundamentais na formação do profissional de saúde. Você já sabia de toda sua impor-
tância? Já conhecia suas aplicações? Podemos constatar que sem uma devida analisa e
trabalho dos dados, somos apenas uma pessoa com opinião. Vamos mergulhar juntos
no universo desta disciplina, para que você seja um profissional diferenciado. Vamos lá?
CAMINHOS DE
APRENDIZAGEM
1 2
13 41
VISÃO GERAL E TABELAS E
PRINCÍPIOS DA GRÁFICOS
BIOESTATÍSTICA
3 4
71 117
MEDIDAS DE CORRELAÇÃO
POSIÇÃO E REGRESSÃO LINEAR
DISPERSÃO E INFERÊNCIA
ESTATÍSTICA
5 155 6
199
EPIDEMIOLOGIA: INDICADORES DE
DEFINIÇÃO, SAÚDE E A
OBJETIVOS E VIGILÂNCIA
PERSPECTIVAS EPIDEMIOLÓGICA
HISTÓRICAS
8
7
225 255
MEDIDAS DE PRINCIPAIS
FREQUÊNCIA E DESENHOS DE
DE ASSOCIAÇÃO ESTUDOS
EPIDEMIOLÓGICOS
9
287
EPIDEMIOLOGIA
APLICADA EM
SAÚDE
1
Visão Geral e
Princípios da
Bioestatística
Me. Renata Cristina Souza Chatalov
Olá, aluno(a), esta unidade será essencial para sua trajetória profis-
sional na área da saúde. Por meio dela, você terá oportunidade de
conhecer a origem da Bioestatística, sua definição, sua importância
bem como entender que as técnicas estatísticas são essenciais para
uma pesquisa, além disso, você compreenderá como fazer uma
coleta de dados utilizando as principais técnicas de amostragem.
Vamos lá?
UNICESUMAR
14
UNIDADE 1
Sabemos que a dengue ainda é uma epidemia em várias regiões do mundo. Sendo assim, considere
que você já é um profissional da saúde e está atuando na Secretaria de Saúde de seu município e deseja
realizar um experimento a respeito dos casos de dengue em um dos bairros do município. Porém o
bairro em questão possui 35 mil pessoas, segundo dados da prefeitura. Você tem o prazo de uma semana
para fazer a pesquisa e dispõem de pouca mão de obra e poucos recursos financeiros. Neste contexto,
você se questiona: como será possível fazer essa pesquisa? É aí que a Bioestatística pode ajudar. Uti-
lizando técnicas de estatística, como a amostragem, na qual você poderá selecionar algumas pessoas
que farão parte da sua amostra, mas que seja representativa para toda população do bairro. Considere
esta situação hipotética apresentada e, para que possamos nos ambientar com tal prática, que tal nos
apropriarmos de uma das aplicações da Bioestatística e colocarmos a mão na massa? Vamos lá? Faça
uma pesquisa com os membros de sua família, perguntando se eles têm tomado cuidado com ações
preventivas contra dengue.
Diante de tudo isso que discutimos até o momento, faça suas anotações em um Diário de Bordo.
Aqui, neste espaço, você pode anotar suas primeiras impressões até o momento. Escreva os resultados
de sua pesquisa com seus familiares, anotando, também, as dificuldades para realizar a pesquisa e os
pontos a melhorar. Faça esta reflexão.
DIÁRIO DE BORDO
15
UNICESUMAR
Até o momento, estudamos que o futuro profissional da saúde, usará a Bioestatística na prática, e que
ela é fundamental para sua formação. Mas o que ela significa? Como podemos conceituá-la? A Bioesta-
tística é um ramo da estatística que traz aplicações no campo das Ciências Biológicas e da Saúde, sendo
fundamental para problematização, planejamento, coleta de dados, crítica e sumarização dos dados,
avaliação, análise e interpretação de todos os dados que resultam nas pesquisas de campo (RODRI-
GUES; LIMA; BARBOSA, 2017). Conhecer a Bioestatística é essencial para as áreas da: Epidemiologia,
à Ecologia, à Psicologia Social e à Medicina baseada em evidência.
Se a Bioestatística, porém, deriva da própria Estatística, como definir Estatística? Para Parenti, Silva
e Silveira (2017, p. 13):
“
Estatística é a ciência por meio da qual se faz inferências sobre um fenômeno aleatório
específico com base em uma amostra relativamente limitada. A área de estatística tem
duas subáreas: estatística matemática e estatística aplicada. A estatística matemática se
preocupa com o desenvolvimento de novos métodos de inferência estatística e requer
conhecimento detalhado de matemática complexa para a sua execução. A estatística
aplicada envolve a aplicação dos métodos de estatística matemática em assuntos espe-
cíficos, como economia, psicologia e saúde pública.
Desde a Antiguidade, a estatística está presente na vida do homem. Ela é utilizada como fonte de dados,
que, por sua vez, são dados ou teorias utilizadas para explicar uma informação de alguma coisa. Para
Parenti (2018, p. 14):
16
UNIDADE 1
“
É a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise
e a interpretação de dados. Apesar de estarmos habituados à análise de informações
populacionais, principalmente quando tratamos de censos demográficos, ela também
pode ser usada como fonte em outras ciências e, no nosso caso, especialmente nas
ciências ligadas à vida e aos seres vivos.
Podemos observar que a estatística está voltada para problematização de estudos, coleta de dados,
tabulação, apresentação e análise de dados.
No futuro, o pensamento estatístico será tão necessário para a cidadania eficiente como saber
ler e escrever.
(H. G. Wells)
Depois que vimos o que significa a estatística e como ela pode ser útil em nossa vida, com um va-
lor importante para todos nós conheceremos suas duas vertentes. A estatística pode ser dividida
em estatística descritiva e inferencial. A estatística descritiva, segundo Arango (2011), é a parte da
estatística que é encarregada do levantamento, organização, classificação e descrição dos dados em
tabelas, gráficos ou outros recursos visuais, além do cálculo de parâmetros representativos desses
dados. Enquanto a estatística inferencial trata do ramo da estatística, que tem por intuito fazer
afirmações a partir de dados observados, ou seja, fazer projeções para uma população com dados
baseados em amostras.
Assim, mais do que dados, a estatística dá-nos oportunidade de olhar as informações coletadas,
fazer análise de modo crítico e pode ser utilizada dentro da área das Ciências Biológicas e da Saúde
em vários contextos, tais como levantamento de dados, diagnósticos, contagem de ocorrências, análise
de dados pandêmicos, comprovação da utilização de medicamentos, entre outros (PARENTI, 2018).
No nível da iniciação, a estatística não deve ser apresentada como um ramo da Matemática. A boa
estatística não deve ser identificada com rigor ou pureza matemáticos, mas ser mais, estreitamente,
relacionada com pensamento cuidadoso. Em particular, os alunos devem apreciar como a Estatística é
associada com o método científico: “observamos a natureza e formulamos questões, cogitamos dados
que lançam luz sobre essas questões, analisamos os dados e comparamos os resultados com o que tínha-
mos pensado previamente, levantamos novas questões e assim sucessivamente” (HOGG, 2001, p. 342).
Geralmente, um profissional da Estatística deve ter bons conhecimentos matemáticos, além de interpre-
tação para criação de novos métodos estatísticos. Por outro lado, Hogg (2001) apresenta-nos que a eficácia
no ensino de estatística para acadêmicos de áreas não exatas dará-se conforme forem relacionados os
17
UNICESUMAR
conteúdos com as habilidades e as competências em questão bem como a utilização de exemplos voltados
à área de formação.
Sendo assim, a Bioestatística é uma ramificação da estatística aplicada que utiliza métodos estatísticos
para problemas biológicos e médicos. Evidentemente, estas áreas da estatística se sobrepõem de alguma
maneira. Em alguns casos, por exemplo, em razão de uma aplicação da Bioestatística, os métodos padrão
não se aplicam e devem ser modificados. Nessas situações, os bioestatísticos empenham-se para desenvolver
novos métodos.
Nas áreas das Ciências Biológicas e da Saúde, não é diferente, nestas áreas, cabe aos pesquisadores a
avaliação dos dados, a interpretação de resultados e a análise das conclusões, com aplicações, por exemplo,
em atividades desenvolvidas em determinado ambiente. Além disso, em tais áreas, a Bioestatística oferece
a possibilidade de análise e interpretação de informações sobre medicamentos, equipamentos, avaliação
de protocolos e artigos científicos (GLANTZ, 2014).
Uma boa maneira de aprender a Bioestatística e seu papel no processo de pesquisa é seguir o fluxo de
uma pesquisa desde o início do estágio de planejamento até a conclusão, momento em que, geralmente, a
pesquisa com os resultados alcançados é publicada.
Assim, a questão está em como direcionar o aprendizado da estatística de maneira que o profissional
da área da saúde possa utilizar estes conceitos. Para isso, é importante que você conheça todas as etapas do
método científico.
A seguir, veremos alguns exemplos da utilização do método científico com perguntas, tais como:
• Qual é a incidência de dengue na cidade de São Paulo?
• Quantos casos da covid-19 ocorreram na cidade de Curitiba?
• Se uma pessoa consumir alimentos transgênicos, ela poderá elevar o risco de doenças gástricas?
Uma Variável corresponde ao que estamos estudando, ela pode ser dividida em: qualitativa e quanti-
tativa. Uma variável qualitativa nominal é referente a um atributo, enquanto uma variável qualitativa
ordinal refere-se a uma ordem, hierarquia. Por sua vez, uma variável quantitativa contínua refere-se a
medições, e uma variável quantitativa discreta trata de contagem.
18
UNIDADE 1
Descrição da Imagem: a Figura 1 apresenta um fluxograma da Variável. Ela está dividida em duas variáreis: a qualitativa
e a quantitativa. A variável qualitativa está dividida em nominal e ordinal. Para a variável qualitativa nominal temos
uma característica única, e, na variável qualitativa ordinal, a hierarquia. Já a variável quantitativa discreta, trata-se de
contagem e, para a variável quantitativa, contínua as medições.
Assim, o método científico nos traz maneiras para respondermos as perguntas que estão presentes em
nossos estudos, e a estatística está presente em seus passos, que são:
a) Fazer observações: nesta etapa da pesquisa, é preciso olhar a todas as variáveis ao redor do
pesquisador, fazer anotações, investigação, definir o algo de sua pesquisa, delimitar sua pesquisa.
b) Definir uma questão: nesta etapa do método científico, o pesquisador especificará o que quer
saber em relação ao que está sendo estudado. É importante que a questão em si seja tangível.
c) Formular uma hipótese: nesta etapa, o pesquisador irá fundamentar seu conhecimento
prévio para explicar o fenômeno observado, direcionando para um parâmetro a ser estudado.
Nesta etapa o pesquisador pode utilizar alguns testes estatísticos, tais como testes de hipóteses.
d) Coletar dados: depois que são definidos e delimitados todos os critérios da pesquisa, será definido
como serão coletados os dados, e nesta etapa, a estatística ajudará o pesquisador, pois, na prática,
muitas vezes, ele utilizará amostras, e a estatística traz as maneiras de como fazer essas coletas.
e) Analisar os dados: nesta fase, depois de coletar os dados, é preciso analisar os dados coletados,
fazer a tabulação para apresentação em tabelas e gráficos.
f) Conclusões: depois de passar por todas as etapas anteriores, o pesquisador faz sua conclusão
do seu estudo, é importante observar que a estatística é uma ferramenta que ajudará na tomada
de decisões.
19
UNICESUMAR
20
UNIDADE 1
Descrição da Imagem: a Figura 2 apresenta as etapas para a construção de uma pesquisa científica. Apresenta-
mos a fase 1 - Fazer observações. Nesta fase, o pesquisador é motivado pela pesquisa e interessado em conhecer
melhor o mundo em que vive. Faz a observação dos fatos, fenômenos, comportamentos e atividades e percebe
que muitas coisas já são conhecidas e outras ainda não. Além disso, define o objeto de investigação, que é o alvo
da sua pesquisa, o que ele deseja investigar de fato. Caso o objeto de estudo seja passível de mensurações, o
pesquisador começa a perceber que a estatística vai ser bastante útil em seu processo de construção de conheci-
mento. Por exemplo: diante dos tempos atuais, um pesquisador quer saber a dinâmica do novo Corona vírus em
uma cidade, para isso, o pesquisador deve compreender esse vírus, a partir de quantificações de novos casos da
doença, número de internações hospitalares, número de óbitos, quanto foi gasto para controlar e prevenir. Na
fase 2, apresentamos como definir uma questão. Nesta etapa, o pesquisador especificará o que quer saber em
relação ao que está sendo estudado. O pesquisador define, pontualmente, sua pergunta de estudo e precisa ser
bem objetiva, estabelecendo quem serão os sujeitos da pesquisa e se haverá comparações entre grupos. Trata-se
de uma etapa essencial para que se possa escolher como será utilizada a estatística de análise de dados, que se
será baseada principalmente na pergunta formulada e no desenho estabelecido. A seguir vem a fase 3 - Formular
uma hipótese. Aqui o pesquisador fundamentará seu conhecimento prévio para imaginar o que poderia explicar
o fenômeno observado, isto é, o que poderia responder àquela questão que já foi definida anteriormente. Caso
essa hipótese seja direcionada a um parâmetro, aqui os testes estatísticos poderão ajudar o pesquisador. Coleta
de dados está na fase 4. Nesta fase, depois de definidos todos os critérios que delimitarão a população, o pesqui-
sador deverá estabelecer como será feita a coleta de dados, e tem à disposição técnicas baseadas na estatística
de amostragem para que possam auxiliar o pesquisador selecionar a amostra que representará essa população. A
penúltima fase, a quinta fase é a Análise de dados. O pesquisador avalia os dados coletados na pesquisa, podendo
extrapolar dados amostrais. Podem ser apresentados sob forma de tabelas e gráficos e técnicas estatísticas. Na
última fase, que é a 6, temos a Conclusão. A partir das informações obtidas, o pesquisador pode fazer compara-
ções com estudos prévios fazendo reflexões sobre o estudo realizado por ele. Essas técnicas estatísticas podem
orientar os pesquisadores nas tomadas de decisões.
Assim, quando a Estatística é apresentada a um aluno de graduação, ele poderá perguntar: Se a Esta-
tística é essencial às pesquisas, ela é importante para quem quer atuar no meio científico? A resposta a
este questionamento é sim. Em especial quando falamos em construção do conhecimento. Na prática,
é preciso estudar sempre, estar atualizado, à medida que novos estudos, sobretudo, da sua área de in-
teresse ou atuação são divulgados. Nesse entendimento, um profissional que trabalha em sala de aula
pode utilizar a pesquisa em sua área de atuação e se basear em conhecimentos estatísticos, para fazer
uma publicação científica, por exemplo.
Assim, a estatística também tem função de auxiliar a pesquisa científica e precisa estar alinhada aos
conhecimentos e ao objeto de estudo, como: estudar uma dada enfermidade, a ação de um medicamento,
entre outros. Dessa maneira, a Bioestatística está relacionada aos segmentos de ciências da vida, como:
Ciências Biológicas, Enfermagem, Ecologia, Saúde Pública, Saúde Coletiva, Epidemiologia, Genética,
entre outros. Dessa forma, “um pesquisador, ao agrupar as informações de determinado estudo, nor-
malmente, ele trabalhará com os resultados provenientes de uma coleta de dados, como contagens,
experimentos e outros” (PARENTI, 2018, p. 4). Esses dados são chamados de dados primários uma
vez que o primeiro a ter acesso aos mesmos é o próprio pesquisador, ou a sua equipe. Considera-se
que o pesquisador tenha trabalhado de forma a garantir um nível adequado de qualidade de dados e
que as limitações dos mesmos sejam conhecidas.
São usuais, no entanto, nos estudos, os dados secundários provenientes de outras fontes, tais como: pu-
blicações de artigos em periódicos científicos, artigos ou comunicações em eventos científicos ou institutos
de pesquisa e estatísticas. Como os dados secundários não foram obtidos, diretamente, pelo pesquisador e
sua equipe, verifica-se que a qualidade deles pode estar prejudicada. Contudo, pelo menos nos exemplos de
21
UNICESUMAR
fontes de dados secundários que foram mencionados, espera-se que a qualidade seja elevada. No caso de
periódicos científicos, a qualidade está relacionada, normalmente, ao prestígio da publicação. É importante,
que nesta jornada de construção e consolidação do saber e de sua trajetória acadêmica, você compreenda e
internalize que a qualidade das informações presentes nos periódicos e nos artigos são de extrema impor-
tância. Não é necessário mencionar, aqui, o cuidado que se deve expressar com pesquisas e informações
provenientes de fontes não confiáveis. Cabe mencionarmos os impactos e os perigos relacionados com a
propagação de informações irreais, em especial no contexto da saúde. Provavelmente, você recebeu alguma
corrente no WhatsApp, no início da pandemia do novo coronavírus, contendo alguma informação sem
a devida indicação da fonte científica e que parecesse, no mínimo, duvidosa. Acertei? Isso aconteceu com
grande parte da população e nos faz refletir sobre a problemática envolvida em tal prática. Nesse contexto,
como profissionais da saúde, devemos, por obrigações éticas, pautar nossas decisões mediante a consulta
de pesquisas confiáveis publicadas e divulgadas em periódicos com relevância e robustez científica.
Para entendermos melhor a análise estatística, dois conceitos são primordiais ao entendimento da
análise estatística de dados: população e amostra.
Uma população (N) refere-se a um conjunto de elementos que têm, pelo menos, uma característica
em comum, como todos os acadêmicos dos cursos da área de saúde da UniCesumar. Uma popula-
ção pode ser composta de um número tão grande de elementos que, muitas vezes, não conseguimos
quantificar. Nesse caso, dizemos que a população é de tamanho infinito. Supondo que faremos uma
pesquisa para investigar hábitos alimentares dos funcionários de um hospital, podemos entender que
nossa população (que estamos estudando) é finita, porque teremos o número de pessoas que trabalham
neste hospital. No entanto, se tivermos como objetivo de pesquisa investigar os hábitos alimentares dos
indivíduos adultos residentes em uma grande cidade, o tamanho populacional pode ser bastante amplo.
Quando temos um estudo em que usamos toda a população, denominamos censo. Entretanto, em
boa parte dos estudos, a obtenção de todos os dados de todos os elementos da população pode ser
inviável, devido às dificuldades de acesso aos indivíduos, o tempo para concluir a coleta das informa-
ções, os custos financeiros e entre outras limitações. Nesse caso, utilizam-se informações provenientes
de uma amostra, ou seja, de uma parte da população.
22
UNIDADE 1
Assim, podemos definir amostra (n) como sendo um subconjunto finito da população, isto é, uma
parte representativa da população, por exemplo: se como população temos todos os alunos dos cursos
de Saúde da UniCesumar, uma amostra seriam os alunos do primeiro ano do curso.
Uma característica importante da amostra que não podemos esquecer, é que ela seja representativa
da população da qual foi retirada, isto é, deve ter características similares às daquela população. Uma
amostra representativa é uma miniatura da população, como podemos observar na Figura 3. No en-
tanto uma amostra que não representa, adequadamente, a respectiva população é chamada enviesada
ou tendenciosa.
Descrição da Imagem: a figura apresenta dois círculos e, em cada círculo, existem grupos de indivíduos com
diferentes características. O grupo maior é destinado à representação de uma população e está ao lado esquer-
do, enquanto o grupo menor que se refere à amostra e se posiciona à direita. Há uma seta que sai da população
para a amostra, representando uma parcela da população, contudo, nesta amostra, observam-se características
representativas da população.
23
UNICESUMAR
Façamos, juntos, uma nova reflexão. Considere o seguinte cenário hipotético. Você objetiva realizar
uma pesquisa para avaliar os hábitos relacionados à saúde dos habitantes adultos de uma cidade de
porte médio e, para tanto, realizou a coleta de dados, por meio de entrevistas realizadas na praça de
alimentação de um shopping Center do município em questão.
É importante considerar que, nesse caso hipotético descrito, a amostra selecionada, ou seja, o públi-
co presente na praça de alimentação de um shopping pode fazer com a que pesquisa não alcance seu
objetivo de verificar os hábitos alimentares de uma população, direcionando você a uma conclusão
errada sobre tais hábitos. E por que isso aconteceu? Porque não houve nenhum critério para a seleção
desta amostra.
Uma das formas de se garantir que a amostra seja representativa quanto à população, consiste
na utilização de técnicas estatísticas, com as quais, ainda em nosso exemplo hipotético apresentado,
poderíamos dividir a cidade em setores, em bairros, e para cada setor seria selecionado determinado
número de habitantes para participarem da pesquisa. Dessa maneira, você conseguiria uma amostra
mais representativa da população.
É preciso observar que, por mais cuidados que tenhamos na seleção dos elementos que farão parte
da amostra, ela jamais será, perfeitamente, igual à população em todas as suas características, visto que
ela é uma fatia da totalidade dos indivíduos. Entretanto uma estratégia importante para obtermos
amostras tão representativas quanto possível consiste em usar os chamados planos probabilísticos,
que, com base em técnicas estatísticas, definem como os indivíduos serão melhor selecionados para
a composição da amostra.
Agora que já sabemos a definição de população e amostra, que tal analisar um exemplo para
diferenciar, na prática, estes termos que estudamos? Vamos lá? Uma médica pediatra quer
fazer uma análise estatística do uso de medicamentos homeopáticos por pacientes de um a três
anos de idade. Ela deseja comparar os efeitos do uso destes medicamentos com os alopáticos.
Os medicamentos homeopáticos são produzidos de forma diferente dos fitoterápicos, através
de dinamização. Neste tipo de terapia, são, também, utilizados, além de princípios ativos de
origem vegetal, outros de origem animal, mineral e sintética. Um tratamento homeopático não
busca eliminar apenas os sintomas da doença, e sim estimular o organismo a se fortalecer.
Logo, o tratamento homeopático é eficaz para curar o doente, e não apenas aliviá-lo. Já o tra-
tamento alopático busca, por meio de medicamentos de ação química, eliminar os sintomas
e manifestações da doença por meio do chamado princípio dos contrários. Por exemplo: uso
de laxantes na prisão de ventre.
Fonte: CRFESP (2019).
24
UNIDADE 1
Para que possamos avançar, considere o exemplo presente em nosso elemento #Explorando Ideias#
apresentado anteriormente. Suponha que a médica inicia sua pesquisa definindo a população para
estudo (todos os seus pacientes que se enquadrem na faixa etária apresentada). Depois disso, ela selecio-
nará dois tipos de amostras diferentes para oferecer a medicação ao paciente, assim terá como amostras:
• Amostra 1: que será composta pelos pacientes cujos pais optaram por medicamentos ho-
meopáticos. Sistematicamente, sua análise terá como indicador o número de vezes em que as
crianças apresentaram alguma alteração na saúde no período de um ano bem como o tipo de
doença que apresentaram.
• Amostra 2: será composta pelos pacientes cujos pais não utilizam medicamentos homeopáticos
nos tratamentos indicados pela pediatra.
Para dar continuidade em sua pesquisa, a médica realiza os registros e as verificações necessárias ao
longo de um ano, de acordo com a proposta inicial da pesquisa, e, ao término deste prazo, ela poderá,
por intermédio dos dados obtidos, verificar se a sua hipótese inicial foi comprovada, ou não. Assim, os
dados poderão ser utilizados em desdobramentos da mesma pesquisa, ou provocar a necessidade de
uma nova coleta de dados. A vantagem deste tipo de análise é que ele oportuniza ao profissional mais
segurança na tomada de decisões, além de melhores e mais confiáveis argumentos junto aos pacientes
e aos clientes e maior sucesso nas abordagens escolhidas.
Você pode estar se perguntando agora, mas, e na prática, como fica?
Um ganho para os profissionais das áreas de Biológicas e da Saúde consiste no conhecimento sobre
diferentes experimentos de uma maneira mais clara e objetiva para obtenção de dados concretos que
podem interferir na qualidade do seu trabalho. Façamos uma nova reflexão, com base em um novo
cenário hipotético:
“
Considere que um profissional da saúde trabalhe em dois laboratórios que ficam localiza-
dos em regiões distintas, porém, em uma mesma cidade. No laboratório 1, o profissional
atende pacientes de baixa renda que quase não fazem consultas nem exames. Já no labo-
ratório 2 o mesmo profissional, atende pacientes que tem uma rotina elevada de consultas
e exames. Assim, note que esse profissional consegue, ainda que intrinsicamente, analisar
como está a frequência na procura de exames, em relação aos dois laboratórios e conse-
quentemente, em relação ás duas regiões da mesma cidade. Para tanto, esse profissional
considera que a população será composta pelos pacientes do laboratório 1 e laboratório
2, já a amostra será composta pelos pacientes que procuraram atendimento nos últimos
6 meses. Caso queira verificar com detalhamento, descrição e por meio da Estatística, esse
profissional poderá elaborar uma tabela para cada laboratório, para agrupar os dados
que vão servir de parâmetro. Ao finalizar sua pesquisa, o profissional poderá analisar e
levantar informações que lhe possibilitem concluir com propriedade estatística em qual
dos laboratórios será necessário um maior estoque, mais colaboradores, dentre outras
informações voltadas a gestão (PARENTI, 2018, p. 17-18).
25
UNICESUMAR
26
UNIDADE 1
Descrição da Imagem: a figura 4 apresenta as análises das variáveis. De cima pra baixo: Variáveis quantitativas
discretas: analisar a relação entre o número de cigarros que são consumidos por dia por cada um dos pacientes
com a idade de início do consumo de cigarros e a idade atual; Variáveis quantitativas contínuas: avaliar o peso
dos pacientes bem como o estado de saúde; Variáveis qualitativas nominais: fazer uma relação entre o gênero
dos investigados ao hábito de fumar; Variáveis qualitativas ordinais: fazer um registro quanto o grau/estágio da
doença pulmonar que os pacientes se encontram, classificando-os em: inicial, intermediário e terminal.
Dessa forma, é fundamental e muito importante destacar qual será a variável que o pesquisador es-
colherá para analisar no seu objeto de estudo. Parenti, Silva e Silveira (2017) trazem-nos conceitos
de pesquisa experimental, que objetivam identificar as relações entre duas variáveis. No método
experimental, deve-se provocar variações na ocorrência de uma variável e verificar se ela é a causa de
algum efeito em outra, por exemplo: podemos utilizar diferentes medicamentos para determinada
doença e observar os seus resultados. Na pesquisa correlacional, não tem como provocar mudanças
nas variáveis, assim, o pesquisador observa as alterações e seus efeitos, elencando as variáveis que serão
observadas, por exemplo: avaliar os efeitos das alterações naturais de temperatura em determinado
ambiente e nos seres que vivem ali. A pesquisa de levantamento tem variáveis não interferentes,
como uma pesquisa eleitoral, que terá como universo a população da cidade, do estado ou do país. A
amostra deve ser composta por número representativo de cada segmento da sociedade, por exemplo
pessoas que podem votar que farão parte desta amostra. Existem, ainda, outros tipos de pesquisa que
atendem às necessidades específicas de cada objeto de estudo e que terão suas características próprias,
como os estudos de caso e as observações.
27
UNICESUMAR
Ao decidir realizar uma pesquisa na área da saúde, é imprescindível que o pesquisador conhe-
ça as normas estabelecidas pelo Conselho Nacional da Saúde por intermédio da Resolução
Nº 01/88, de 13 de junho de 1988. Essas normas referem-se a questões éticas que envolvem
pesquisas com seres humanos, em relação à dignidade, à adequação aos princípios éticos
e científicos, à privacidade do indivíduo e aos possíveis riscos que o estudo possa acarretar.
Fonte: Brasil (1988, on-line).
Neste sentido, é relevante que o pesquisador tenha em mente: Qual é o meu objeto de pesquisa? Qual
é meu público-alvo? Quais hipóteses desejo comprovar com a minha pesquisa? Que tipo de pesquisa
se adéqua melhor ao meu objeto de estudo? Respondidas estas questões, o pesquisador pode pensar
em quais metodologias poderá usar para sua investigação. Com a escolha da metodologia, virão as
decisões sobre como tratar os dados estatísticos levantados, que tipos de questões deverão ser feitas,
se os dados serão quantitativos ou qualitativos e, assim, sucessivamente.
Como você pôde perceber, falamos bastante do conceito de amostra. Mas por que esse conceito é
tão importante dentro de uma pesquisa? Na prática, temos situações em que não se torna viável o uso
de uma população, e o pesquisador precisa utilizar uma amostra. Mas quais são essas situações? De
acordo com Barbetta (2014), as técnicas de amostragem são utilizadas quando temos:
1. Economia: geralmente, nas pesquisas, é muito mais econômico trabalharmos com amostra, ou
seja, com uma pequena parcela da população, do que como um todo. Supondo que você precisa
fazer uma pesquisa em um bairro que tem 25 mil pessoas, imagine o custo para entrevistar todas
as pessoas que fazem parte da população deste bairro? Fica mais econômico selecionarmos
uma amostra, ou seja, uma parte de moradores do bairro para fazer parte da entrevista, do que
trabalharmos com 25 mil pessoas.
2. Tempo: muitas vezes, o pesquisador não tem tempo suficiente para estudar toda população,
por exemplo, ele tem por objeto de pesquisa saber se as pessoas em um bairro fazem reciclagem.
Nesse bairro tem 25 mil pessoas, e o pesquisador tem cinco dias para fazer a pesquisa, nesse
caso, ele deverá recorrer a uma técnica de amostragem para dar continuidade à sua pesquisa.
3. Confiabilidade e operacionalidade: quando o pesquisador precisa reduzir o número de
elementos, na qual ele poderá dar mais ênfase aos casos individuais estudados.
Para Barbetta (2014), entretanto, existem situações em que as técnicas de amostragens não são viáveis,
tais como:
28
UNIDADE 1
1. Quando a população pequena: nesse caso, quando a população é pequena, fica melhor estu-
dar todos os elementos do que uma parte apenas, imagine a situação: um professor tem quinze
alunos em uma turma e quer saber quantos praticam a reciclagem em suas casas. Nesse caso,
por se tratar de uma população pequena, vale a pena o professor trabalhar com todos seus
quinze alunos, do que com uma parte deles apenas.
2. Quando a característica é de fácil mensuração: este caso ocorre por exemplo, quando a po-
pulação é de fácil acesso, e quando não compensa elaborar um plano de amostragem. Considere
que um professor quer saber dentre os alunos de sua escola, quantos são a favor de participar
da feira de ciências, para isso, ele pode entrevistar, ou colocar urnas na escola e incentivar a
participação de todos na própria escola.
3. Necessidade de alta precisão: por exemplo, o Instituto Brasileiro de Geografia e Estatística
(IBGE) faz o censo demográfico, a cada dez anos, para conhecer as características da popula-
ção brasileira. Nesse caso, a pesquisa é feita com toda população, e não com parte da amostra.
Segundo Arango (2011), um conceito importante que se deve ter em mente quando se trata de le-
vantamento de dados é o de que o sucesso nas conclusões tiradas acerca da população com base nas
informações colhidas de uma ou mais amostras depende da criteriosa seleção desta(s). Dessa forma, se
os dados forem mal coletados, certamente, carregarão suas distorções para qualquer análise que se faça
deles. Toda pesquisa tem suas limitações, nos seus resultados, decorrentes da metodologia empregada
na investigação. Para termos sucesso nas conclusões em uma pesquisa, é preciso ter a metodologia
bem descrita bem como o passo a passo do estudo.
Basicamente, existem dois tipos de validade, validade interna e validade externa. A validade
interna diz se as conclusões de uma pesquisa são corretas para a amostra estudada. Essa va-
lidade é pré-requisito para a validade externa. A validade externa diz se as conclusões de uma
pesquisa são aplicáveis à população da qual a amostra se originou ou a outras populações.
A limitação dos resultados de uma pesquisa científica deve ser discutida à luz dos possíveis erros
metodológicos (vieses) que constituem ameaças à validade da pesquisa. Busca-se, então, um nível de
confiança que é possível depositar nos resultados e conclusões a partir de uma análise criteriosa dos
possíveis erros e suas causas. Chamamos de viés um erro sistemático (vício, distorção) e não intencional,
proveniente de questões metodológicas. Existem dois fatores que influenciam no correto levantamento
dos dados: a representatividade e a fidedignidade.
29
UNICESUMAR
Com essas informações, uma amostra representativa da população de domicílios deveria observar que:
• Todos os locais sejam alcançados pela pesquisa, observando-se a distribuição geográfica (área
urbana, com seus três bairros e área rural). Não sendo possível, por simples conveniência, efetuar
a pesquisa somente em domicílios urbanos no bairro A.
• Seja considerada, nesse caso, a população de cada setor geográfico. A amostra deverá ser cons-
tituída de partes proporcionais idênticas às da população. Assim, 10% da amostra seriam cons-
tituídos por domicílios rurais, 20% do bairro A etc. Na falta das populações, poderiam ser
empregados pesos para a constituição da amostra, de acordo com o pesquisador.
• Exista total aleatoriedade na escolha dos domicílios.
30
UNIDADE 1
Estes aspectos são importantes para evitar caracterizar a amostra como tendenciosa e, consequen-
temente, adquirir credibilidade, sem espaço para gerar conclusões duvidosas.
Outro aspecto que deve ser levado em conta no trabalho de levantamento de dados e cons-
tituição das amostras é o da fidedignidade dos dados ou das informações, relacionada com a
precisão dos dados ou com a sua qualidade.
A falta de precisão pode ser ocasionada por vários motivos. De uma maneira geral, podemos
ter as situações: equipamentos que não sejam aferidos corretamente, falta de calibração de equipa-
mentos, questionário mal elaborado (no caso de entrevistas, com perguntas tendenciosas) e falhas
na hora da coleta. No primeiro caso, o uso de balança mal calibrada, réguas com defeito, coletor
de amostra (de água, por exemplo) inadequado, amostras em mau estado de conservação pode
causar erros nas medições. Existem, também, alguns exames laboratoriais, como os que implicam
contagem e estão sujeitos à falha. Nesses casos, durante o levantamento dos dados da amostra, é
recomendado, para minimizar as falhas, utilizar os mesmos aparelhos.
Já no segundo caso, existem informações que carregam grande margem de erro. Por exemplo,
suponha que um questionário contenha a seguinte pergunta: Quanto tempo faz desde que você foi
ao médico pela última vez? Mesmo que a pessoa entrevistada tenha boa vontade em responder e
não esteja tencionando falsear a resposta, ela pode encontrar dificuldades em realmente precisar
o tempo solicitado pela pergunta. A razão da resposta do entrevistado poder apresentar uma falha
de informação é simplesmente o fato de que um conjunto de informações não é, devidamente,
registrado e, para obtê-las, às vezes, não existe alternativa a não ser contar com a memória do en-
trevistado. Outro exemplo de uma questão que poderia suscitar erros seria: Já dirigiu embriagado?
Tratando-se de um tema que, em boa parte dos casos, cria constrangimento ao entrevistado, ou
ele pode falsear a sua resposta, exagerando ou escondendo a verdadeira informação. Pelos mais
variados motivos, desde a precária memória em alguns casos, passando pelo medo e a própria
fantasia do entrevistado, é comum a falta de precisão das respostas. Por este motivo, os questioná-
rios de levantamento de dados devem ser elaborados com extremo cuidado, evitando perguntas
vagas ou que deem margem a respostas muito subjetivas. Naturalmente, seus resultados devem
ser tomados com grande cautela.
Agora que já sabemos que a amostragem é importante nas pesquisas e que é utilizada na prática,
conheceremos algumas técnicas estatísticas de amostragem. Já estudamos em nossa disciplina,
que a população (N) refere-se ao universo da pesquisa, como sendo um conjunto de elementos
que tenha pelo menos uma característica em comum (CRESPO, 2009). E a amostra (n) é uma
parte da população. Por exemplo, ao utilizarmos como população todos os pacientes internados
em determinado hospital, pode-se definir que serão parte da pesquisa apenas os internados em
leitos ímpares ou os que permanecerem internados por mais de dois dias. O critério de escolha
para a determinação da amostra seguirá as necessidades e os objetivos da pesquisa, desde que
sejam imparciais, não tendenciosos e representativos da população. Para isso, deve-se definir a
população que se busca e a característica investigada.
31
UNICESUMAR
32
UNIDADE 1
Uma ferramenta importante para a realização de seleção de amostras aleatórias são os de-
nominados números aleatórios. Estes são números, compreendidos em um intervalo, cuja
probabilidade de serem selecionados é igual, como em um sorteio. Em programas como o
Excel®, a função geradora de números aleatórios permite definir o intervalo do sorteio e por
tipo de número, inteiro ou real. Para isto utiliza a função ALEATORIO ou ALEATORIOENTRE, de-
pendendo da versão. No último caso, a função é acompanhada de um argumento que permite
mudar o intervalo do sorteio. Por exemplo: ALEATORIOENTRE (a, b) sorteia números entre a e b.
(H. G. Arango)
b) Amostragem sistemática: os elementos são escolhidos a partir de um fator que se repete. Para
que ocorra, a população deve estar ordenada de forma aleatória, como em uma lista ou fila. Por
exemplo, a partir das fichas de consultas da mesma Unidade Básica de Saúde (UBS), retira-se
a 15, depois a 30, a 45, e assim sucessivamente, até atingir um número de pacientes desejado,
que deve ser proporcional ao número da população de pacientes atendidos. Ou define-se que
a pesquisa se dará com os pacientes que estiveram em consulta no mês de maio. Para exem-
plificar, você pode observar a Figura 6, na qual temos treze pessoas em uma fila (ordenada).
Considere que selecionaremos uma amostra composta por cinco pessoas. Para tanto, podemos
utilizar a equação 1 a seguir:
I= N
n
33
UNICESUMAR
Em que:
I = intervalo
N = População
n = amostra
Para isso, temos:
I= 13
5
Portanto, escolheremos (ou sortearemos) a primeira pessoa que comporá a amostra, e contará o in-
tervalo de 3 em 3. Supondo que determinamos que a primeira pessoa da fila será a primeira a compor
a amostra, somaremos mais três, a próxima pessoa será a número 4, depois, somaremos mais 3, será a
número 7, somamos mais 3 e teremos a pessoa na posição 10, e, por último, somamos mais 3 e teremos
a pessoa na posição 13. Assim, a amostra torna-se sistemática, ou seja, foi definido por meio de um sis-
tema antes de selecionar a amostra, que esta será composta pelos indivíduos nas posições: 1, 4, 7, 10 e 13.
Descrição da Imagem: na figura, temos a amostragem Sistemática em que se observa uma imagem composta
por 13 pessoas, foi calculado, anteriormente, que o sistema será de 3 em 3, ou seja, sistematizado para a seleção
dos indivíduos que estão na posição: 1, 4, 7, 10 e 13 que passam a compor a amostra.
34
UNIDADE 1
Descrição da Imagem: na figura, temos a amostragem estratificada, na qual temos um grupo de pessoas dividi-
das em dois grupos, o primeiro grupo composto doze pessoas, e o segundo grupo composto por nove pessoas.
Descrição da Imagem: a figura 8 é composta por cinco grupos de três pessoas, sendo destacado dois grupos
compostos por três pessoas.
35
UNICESUMAR
Temos um resumo das técnicas de amostragem probabilística com suas divisões bem como suas pala-
vras chaves e um exemplo. Podemos perceber que a amostragem probabilística (Figura 9), que se trata
daquela amostragem que todos os elementos podem fazer parte da amostra é dividida em: amostra-
gem casual simples - sorteio simples; amostragem sistemática - definição de um sistema; amostragem
estratificada - subdivisão de grupos e amostragem por conglomerados - territórios.
Descrição da Imagem: na figura, temos um resumo da amostragem probabilística; primeiro temos a amostragem
casual, que é um sorteio simples, como: Sortear 5% de uma população de 100 pessoas. Temos a amostragem
sistemática, que é a definição de um sistema, e como exemplo temos: Amostra composta por 25 casas em um
intervalo definido de cinco em cinco. Temos a amostragem estratificada composta pela subdivisão de grupos, e
como exemplo temos: População composta por 1000 pessoas, 800 homens e 200 mulheres, definido 10%. Portanto,
80 homens e 20 mulheres. Por fim, temos a amostragem por conglomerados, que é locais/cluster, como exemplo
temos: em uma cidade sortear um bairro dentre todos os conglomerados.
Além disso, a amostragem também pode ser não probabilística, isso significa que existe uma escolha
deliberada dos elementos da amostra e, dependendo dos critérios do pesquisador, temos:
• Amostragem por acessibilidade ou por Conveniência: a seleção se dará a partir de elementos
que estejam ao alcance do pesquisador. Essa amostragem não tem verdadeiro valor estatístico e
serve mais como forma de buscar dados iniciais para a pesquisa, como a amostra ser composta
por um grupo de dados formado com perguntas feitas a pessoas em um shopping da cidade.
Na Figura 10, você pode observar que as pessoas participantes da amostra são selecionadas de
acordo com os critérios estabelecidos pelo pesquisador.
36
UNIDADE 1
Descrição da Imagem: na figura, temos a amostragem por conveniência e temos um grupo de 15 pessoas, e a
pessoa sorteando, por conveniência 5, pessoas destacadas na figura.
• Amostragem por julgamento ou intencional: neste caso, a seleção ocorre a partir do julga-
mento do pesquisador, por exemplo, quando se quer fazer uma pesquisa com o intuito de se
comprovar que o consumo de carne tem influência sobre a saúde das pessoas. Escolhe-se Porto
Alegre - RS como base para a coleta da amostragem por se considerar que seja a capital onde
mais se consome este alimento no Brasil.
• Amostragem por cotas: neste caso, oferece mais rigor à coleta, sendo que a fixação das cotas
deve seguir critérios que caracterizam a amostra como representativa da população. No exemplo
da carne, primeiro é feita uma análise da população de Porto Alegre e, depois, são definidas as
proporções entre homens, mulheres, as faixas etárias e os estratos sociais. Em seguida, serão
entrevistados um número de pessoas correspondente à proporcionalidade de cada um desses
grupos. Dessa maneira, haverá uma amostragem significativa de toda a população da cidade.
Temos um resumo das técnicas de amostragem não probabilística (Figura 11) com suas divisões bem
como suas palavras chaves e um exemplo. Podemos perceber que a amostragem por conveniência
ou acessibilidade é aquela em que os elementos que comporão a amostra estão de fácil acesso do
pesquisador; a amostragem por julgamento é aquela em que há interferência, ou seja, julgamento do
pesquisador, e, na amostragem por cotas, as cotas são fixas pelo pesquisador, em seguida, é feita a coleta
de dados que comporão a pesquisa.
37
UNICESUMAR
Amostragem não
probabilística
Descrição da Imagem: a
Amostragem por Figura 11 apresenta-nos
Amostragem por Amostragem por a amostragem não pro-
conveniência ou
julgamento cotas babilística, iniciando pela
acessibilidade Amostragem por conve-
niência ou acessibilidade,
que se trata de elemen-
Elementos tos a partir do alcance do
Julgamento do pesquisador. Temos, por
a partir do
Fixa cotas exemplo, a aplicação de
alcance do pesquisador questionários/entrevistas
pesquisador em uma escola para le-
vantarmos dados iniciais.
Depois, a amostragem por
julgamento, que se trata de
Ex.: Aplicação de Ex.: Um pesquisador julgamento do pesquisa-
questionários/ passa a integrar um Ex.: Define dor. Temos como exemplo:
entrevistas em grupo de pesquisa proporções e um pesquisador supõe que
uma escola para de um laboratório cotas, para então o departamento de Biolo-
fazer a coleta de gia tem mais publicações e
levantamentos de em específico por
ele pesquisa lá a partir dis-
dados iniciais. compreender que o dados. so. Por fim, a Amostragem
laboratório tem por cotas, nas quais são fi-
condições e xadas as cotas, por exem-
expertise em sua plo: define proporções e
área de interesse. cotas para, então, fazer a
coleta de dados.
Assim podemos observar que as técnicas de amostragem podem ser muito úteis para os pesquisadores,
Parenti, Silva e Silveira (2014) salientam que é importante que os investimentos em pesquisa possam
ser ampliados, aproximando a teoria do cotidiano, e que o tipo de pesquisa e as ferramentas usadas em
geral não requerem alto investimento, mas a geração de informações adequadas a respeito de doenças
e tratamentos fará a diferença na vida de cada um.
Dessa forma, podemos citar várias linhas de investimentos necessários nos dias de hoje, como o
aumento da resistência bacteriana, a ausência de tratamentos eficazes para doenças endêmicas em países
pobres, como a dengue, as pesquisas em saúde mental, entre outros. Os diferentes tipos de amostragem
podem se mostrar bastante úteis no cotidiano dos profissionais da área biológica e da saúde, pois auxilia
tanto na administração de consultórios e clínicas quanto na determinação de estratégias de tratamentos,
medicamentos e outras. Dependendo dos objetivos propostos pela pesquisa, o desafio é determinar
que tipo de amostragem escolher para que os dados obtidos sejam um reflexo real da investigação.
É possível perceber que as pesquisas, geralmente, requerem atenção especial dos profissionais da área
biológica e da saúde tanto para atualização e frequente busca por alternativas e novos procedimentos
quanto para alimentar a própria necessidade de busca. O médico, o enfermeiro, o farmacêutico, o biólo-
go, enfim, todos os profissionais dessa área devem estar atentos às possibilidades e aos conhecimentos
desenvolvidos em pesquisas.
38
UNIDADE 1
Você percebeu que a Bioestatística será bem aplicada em seu futuro profissional? Ao escolher as áreas
das Ciências Biológicas e da Saúde verá que, para realizar uma pesquisa, será necessário entender o
conceito de população (N) e amostra (n) bem como entender os meios de pesquisa e a técnica de
amostragem que será utilizada. Como exemplo você pode fazer uma pesquisa com seus alunos em um
colégio, com o objetivo de saber se eles praticam ou não a reciclagem. Mas, no momento em que for fazer
essa pesquisa, se o colégio tem 5.000 alunos, e você tem um tempo curto para fazê-la, pode recorrer a
uma técnica de amostragem que estudamos aqui nesta unidade, na disciplina de Bioestatística e fazer
essa pesquisa com uma amostra representativa da população. Além disso, quando você vai a campo,
por exemplo, fazer uma coleta de água em um rio para verificar a qualidade da água, ao retirar essa
amostra de água (está utilizando uma técnica de amostragem) e ao leva-la ao laboratório para estudar
parâmetros físico-químicos e microbiológicos, saindo o resultado, ao interpretar, você estará fazendo
uma projeção da qualidade da água daquele rio, então, você utilizou a técnica de estatística inferencial.
39
Olá, aluno (a), chegamos à avaliação e, aqui, você fará um Mapa de Empatia que consiste em fazer
a autoavaliação de uma forma mais divertida de tudo que foi estudado até agora nesta unidade.
Vamos lá? Você se identificará e se perguntará como fará um mapa sobre as técnicas de estatística
e amostragem. Vejamos, você poderá pensar em como estas informações tratadas nesta unidade
como as técnicas de estatística poderão ajudar você em uma pesquisa, em que se tem as etapas
de planejamento, coleta de dados, agrupamento dos dados (tabelas e gráficos) análise e avaliação
podem ajudar em uma pesquisa científica, em sua vida profissional ou, até mesmo, em sala de
aula. Também, verá como as técnicas de amostragem podem ajudar a trabalhar, corretamente,
com uma amostra que seja representativa da população. Então, comece escrevendo seu nome,
sua idade e preencha com comentários, tópicos ou perguntas sobre si mesmo dentro do quadro
da empatia. E, no final, você verá o tanto de coisas que descobrirá sobre este tema proposto.
Assim, utilize o Mapa de Empatia para refletir e se expressar nas questões a seguir:
O que vê?
O que você já viu em relação na prática utilizando técnicas estatísticas?
O que escuta?
O que você já tinha ouvido falar sobre Bioestatística?
Você já tinha ouvido falar em técnicas de amostragem?
Consegue entender suas importâncias nas pesquisas?
O que você achou do conteúdo estudado até o momento? Faz sentido um futuro professor da
área da Saúde ou da área das Ciências Biológicas estudar técnicas de Estatística? Quais são suas
aplicações?
As dores
Quais são suas dificuldades?
Você acha que vem coisas mais difíceis na disciplina?
Consegue entender como os conceitos e exemplos são essenciais para sua compreensão?
Os ganhos
O que você ainda acha que tem que estudar para entender melhor a Bioestatística?
40
2
Tabelas e Gráficos
Me. Renata Cristina Souza Chatalov
Olá, aluno(a), esta unidade será fundamental para sua futura atua-
ção profissional na área das Ciências Biológicas e da Saúde. Aqui,
aprenderá a construir tabelas bem como compreenderá suas re-
gras. Além disso, aprenderá a elaborar gráficos e fará suas leitura
e interpretação.
UNICESUMAR
42
UNIDADE 2
Para isso, convido você a fazer a leitura do artigo intitulado Análise e inter-
pretação de tabelas e gráficos estatísticos. A fim de utilizar dados interdisci-
plinares. Nesse artigo, você verá o ensino e a aprendizagem da Estatística bem
como a utilização de procedimentos e conceitos. Acesse o qrcode a seguir:
Como apresentamos na Unidade 1, os dados sobre a dengue, daremos
continuidade no mesmo exemplo, tudo bem? Sabemos que esta nossa situação
é hipotética, e você, graduando (a) na área de Biológicas e da Saúde, que está
atuando em sala de aula, quer fazer um experimento a respeito dos casos de dengue do seu bairro.
Desta forma, faça uma pesquisa em forma de formulário com dez pessoas, que podem ser membros
de sua família ou mesmo colegas de trabalho, contendo a seguinte pergunta: Você já teve dengue?, com
isso, as possíveis respostas do seu formulário serão: ( ) Sim ou ( ) Não.
Organize estes dados com a quantidade de pessoas que responderam sim e a quantidade de pes-
soas que responderam não. Em seguida, construa uma tabela ou um gráfico, mediante os resultados
desta pesquisa e, ao fazê-lo, você já estará utilizando mais uma técnica apresentada pela bioestatística.
Diante disso, convido você, a fazer suas anotações em um Diário de Bordo, a fim de anotar suas
primeiras impressões até o momento. Escreva os resultados de sua pesquisa, depois de fazer o gráfico
ou a tabela, reflita sobre como você pode trabalhar essa questão em sala de aula ou em outra ocupação
dentro do seu segmento de trabalho.
DIÁRIO DE BORDO
43
UNICESUMAR
Conheça as normas para apresentação dos dados em tabelas bem como definições, termi-
nologia e simbologia:
IBGE – Normas de apresentação tabular (IBGE, 1993).
NBR 14724:2011 - Informação e documentação - Trabalhos acadêmicos – Apresentação
(ABNT, 2011).
Na construção de tabelas, os dados são apresentados em colunas verticais e linhas horizontais, con-
forme a classificação dos resultados da pesquisa. Algumas orientações preliminares são as seguintes
(ARANGO, 2011, p. 31):
44
UNIDADE 2
1. Para construção de uma tabela é importante que ela seja: simples, clara e objetiva.
Assim, é apropriado que grandes volumes de informação sejam descritos em várias
tabelas, ao invés de serem apresentados em uma única tabela;
2. Uma tabela precisa ser auto-explicativa, ou seja, sua compreensão não deve ser vin-
culada do texto. Dessa forma, nenhuma “casa” da tabela deve ficar em branco, sempre
apresentando um símbolo ou número, caso houver duas ou mais tabelas em um texto,
deverão receber um número de identificação, que será referido no texto.
3. As colunas externas de uma tabela não devem ser fechadas.
4. Na parte superior e inferior, as tabelas devem ser fechadas por linhas horizontais.
5. A utilização de linhas verticais para separação de colunas no corpo da tabela é op-
cional.
6. Ao fazer arredondamentos de números, é importante que seja mantida uniformidade
quanto ao número de casas decimais.
7. Os totais e os subtotais devem ser destacados, como por exemplo, em negrito.
8. A tabela deve ser maior no sentido vertical que no horizontal. Contudo, se uma
tabela apresentar muitas linhas e poucas colunas (estreita demais), convém separá-la
em uma maior quantidade de colunas. Neste caso, as colunas deverão ser separadas
por linhas duplas.
Sendo assim, uma tabela pode ser dividida, hierarquicamente, em dois componentes chamados: prin-
cipais e secundários. Os componentes principais são (ARANGO, 2011, p. 32):
1. Corpo: referente ao conjunto das informações, dos dados que foram coletados e que
aparecem no decorrer da tabela, no sentido horizontal e vertical.
2. Coluna indicadora: é a divisão em sentido vertical, onde aparece a designação da
natureza do conteúdo da linha.
3. Cabeçalho: indica a natureza do conteúdo de cada coluna.
4. Casa: refere-se as divisões que aparecem no corpo da tabela.
45
UNICESUMAR
1. Todo número inteiro constituído de mais de três algarismos deve ser agrupado de três em três,
da direita para a esquerda, separando cada grupo por um ponto (p. ex.: 56.342.901).
2. Exceto:
I. Algarismos que representam o ano (p. ex.: 2010).
II. Números de telefone (p. ex.: 3222-2222).
III. Placas de veículos (p. ex.: AAA 2222).
3. A parte decimal de um número deverá ser separada da parte inteira pela vírgula (p. ex.: 0,56).
4. A unidade de medida não leva o “s” do plural nem o ponto final como abreviação (p. ex.: cm,
m, kg etc.).
5. Os símbolos de medida aparecem depois do número, sem espaço entre eles (p. ex.: 4,2m; 3h).
Agora que você já viu todos os elementos que compõem uma tabela, que tal vermos um exemplo? Já
estudamos que uma tabela tem como objetivo apresentar os dados agrupados, de maneira que uma
pessoa interessada pode visualizar e compreender o que querem dizer aqueles dados. Você conhecerá,
agora, os principais tipos de tabelas, que podem ser:
Simples.
Dupla entrada.
Distribuição de frequência.
Uma tabela simples é aquela em que contém a variável que estamos estudando com sua respectiva con-
tagem, ou seja, com sua frequência. A Tabela 1 apresenta uma tabela simples, com seus elementos básicos:
46
UNIDADE 2
Tabela 1 - Casos de dengue nos bairros de uma cidade no mês de fevereiro de 2020
Título
Topo Bairro Número de casos
Coluna
Centro 12
Zona 01 2
Casa ou
Zona 02 3 célula
Corpo
Zona 03 5
Zona 04 1 Linhas
Total 23
Rodapé
Fonte: o autor.
Você sabe qual é a diferença entre Tabela e Quadro? Um quadro, geralmente, traz informa-
ções qualitativas (podendo trazer informações quantitativas em alguns casos) e é fechado nas
bordas laterais, enquanto uma tabela traz informações quantitativas, referentes a contagens,
a frequências, e as bordas laterais são abertas.
Além disso, uma tabela simples pode ser temporal, geográfica ou específica (categórica). Uma tabela
é considerada temporal quando as observações da variável ocorrem de acordo com tempo. A Tabela
2 traz um exemplo de série temporal ou histórica:
Tabela 2 - Casos de dengue no decorrer dos anos em uma cidade
Uma tabela simples, também, pode ser geográfica, quando a variável analisada é referente ao local ou
território. Um exemplo de série geográfica pode ser observado na Tabela 3.
47
UNICESUMAR
Uma tabela, também, pode ser de dupla entrada, isso significa que
temos a necessidade de apresentar em uma única tabela, mais dados
estudados em uma variável, para isso, é preciso fazer uma junção
de duas ou mais séries (CRESPO, 2009).
Ao fazer esta junção dos dados para serem apresentados em uma
única tabela, teremos: duas ordens de classificação, uma vertical (na
coluna) e uma horizontal (nas linhas). Para apresentar uma tabela de
dupla entrada, temos a Tabela 5, que trata do número de matrículas
da Educação Básica do ano de 2019, e os dados estão apresentados
(dupla entrada) a seguir:
48
UNIDADE 2
Tabela 5 - Número de Matrículas da Educação Básica, por Etapa de Ensino, segundo a Região Geográfica, a Unidade da Federação
e o Município - 2019
Etapa de Ensino
Educação
Educação
Educação Profissional
Região de
Educação Ensino Ensino Profissional - Formação Educação
Jovens e
Infantil Fundamental Médio Técnica de Inicial Especial
Adultos
Nível Médio Continuada
(EJA)
(FIC)
Norte 690.631 3.015.573 781.394 124.007 2.651 346.815 117.487
Nordeste 2.349.305 7.889.261 2.112.466 554.150 14.414 1.338.224 352.573
Sudeste 3.919.235 10.349.288 2.992.471 786.331 8.617 985.163 449.539
Sul 1.347.509 3.550.498 986.056 317.365 12.069 378.387 232.504
Centro
666.098 2.119.110 593.504 93.121 2.024 225.079 98.864
-Oeste
Brasil 8.972.778 26.923.730 7.465.891 1.874.974 39.775 3.273.668 1.250.967
Na Tabela 5, podemos observar que a região (coluna) é referente às regiões no Brasil, já as etapas de
ensino: Educação Infantil, Ensino Fundamental, Ensino Médio, Ensino Profissional, Educação de
Jovens e Adultos e Educação Especial são analisados, também, nas colunas e linhas. Temos, então, um
exemplo de tabela com a dupla entrada, ou seja, mais que uma variável sendo estudada, na qual pode-
mos analisar as regiões brasileiras (geográficas) e etapas de ensino (categorias). Lembre-se de que, em
uma tabela de dupla entrada: cada uma das respostas combinadas fica agregada em uma única célula.
Agora que você já conhece as tabelas simples bem como os tipos de série e a dupla entrada, que
tal aprendermos a construir uma tabela do zero? Mas, antes, precisamos relembrar alguns conceitos
matemáticos fundamentais aqui na Bioestatística, pois os cálculos das frequências precisam de duas
grandezas: razão e proporção. Definir razão pode se tornar uma tarefa inglória se formos atrás de
todos os significados para este termo (ARANGO, 2011). Aqui, trataremos da parte que aplicaremos
na disciplina de Bioestatística, vejamos alguns exemplos:
Supondo que um corpo tem seis metros de comprimento, e outro corpo três metros, ao dividirmos
o comprimento de um pelo outro, teremos:
6
=2
3
Ainda, podemos afirmar que, o corpo é duas vezes o tamanho do menor, ou, ainda, que tem a metade
do comprimento do maior, e esta divisão chamamos de razão.
1
A razão pode ser representada como 1:2, o que significa que cada metro do corpo menor cor-
2
responde a 2 metros do corpo maior.
49
UNICESUMAR
Outro exemplo: dos 1.200 pacientes que procuram a emergência hospitalar na última semana, 240
eram idosos. A razão de idosos que procuraram a emergência esta semana foi de:
240(240) 1
240 1200
1200(240) 5
Isto é, a cada cinco pacientes, um deles era idoso.
Segundo Parenti (2017, p. 49):
“
Os conceitos de razão e proporção estão relacionados entre si. Assim, a razão entre o
quociente (divisão) entre dois números e a proporção é a igualdade entre duas razões. As
proporções são aplicadas em situações em que as informações devem ser comparadas
e são calculadas pelo uso de ‘regra de três simples’.
Para entender melhor a proporção, vejamos o exemplo a seguir: para produzir 600 pães no refeitório de um
hospital, são utilizados 100 kg de farinha. Sendo assim, quantos pães podem ser feitos com 25 kg de farinha?
600 100
=
x 25
100.x = 600.25
100 x = 1500
1500
x=
100
x = 150
Assim, podemos dizer que é possível produzir 150 pães com 25 kg de farinha.
Agora que já relembramos os conceitos matemáticos necessários para construir uma tabela de
frequências, você aprenderá passo a passo como elaborar. Vamos lá?
Primeiramente, trabalharemos com a organização dos dados: você organiza dados numéricos
criando disposições ordenadas ou distribuídas. Para preparar seus dados coletados com o intuito de
organizá-los, inicialmente, decidiremos se precisaremos analisar suas variáveis numéricas com base
em grupos que sejam criados pelos valores de uma segunda variável categórica. Esta decisão afetará o
modo como você prepara os dados.
De acordo com Levine, Stephan e Szabat (2016), caso decida analisar suas variáveis numéricas em
grupos que sejam definidos pelos valores de uma segunda variável categórica, você deve, então, decidir
se utilizará um formato empilhado ou não empilhado. Em um formato empilhado, todos os valores
de uma variável numérica aparecem em uma única coluna, enquanto uma segunda coluna, em sepa-
rado, contém os valores categorizados que identificadas a qual subgrupo pertence cada um dos valores
numéricos. Em um formato não empilhado, os valores de uma variável numérica são divididos por
subgrupos e colocados em colunas separadas.
50
UNIDADE 2
Vamos ao exemplo supondo que você pretende comparar os custos em restaurantes localiza-
dos na cidade com os custos em restaurantes localizados em bairros. Para preparar esses dados
de forma não empilhada, poderia ser criada uma coluna para a variável custo com alimentação e
outra coluna para a variável localização, uma variável categórica com os valores de cidade e bairros.
Observe o custo de 20 refeições, no Quadro 2 a seguir:
Quadro 2 - Disposição de dados não empilhados
Você pode observar que, desta forma, fica um pouco mais complexo trabalharmos com os dados.
Este modelo de não empilhados foi apresentado para que você tenha ciência de como trabalhar com
os dados. Mas se observarmos esses dados, fica difícil tomarmos conclusões acerca dos custos das
refeições, como qual valor (em R$) que mais aparece (mais se repete), certo? Nem qual percentual
deste valor pago dentre estas 20 refeições. Podemos facilitar a análise dos nossos dados quando
trabalhamos com a disposição de dados ordenados, ou seja, quando colocamos os dados em rol.
Segundo Levine, Stephan e Szabat (2016), uma disposição ordenada organiza os valores de uma
variável em ordem de classificação, partindo do menor valor para o maior, ou seja, organizamos os
dados em uma lista (crescente). Uma disposição ordenada pode ajudar a obter mais entendimento
entre a amplitude dos valores em seus dados e é, particularmente, útil quando você tem mais do
que um valor se repetindo. Veja, no Quadro 3, os mesmos dados apresentados anteriormente, de
maneira ordenada.
Quadro 3 - Disposição de dados não empilhados em rol
51
UNICESUMAR
Analise, no Quadro 3, que fica bem mais fácil trabalhar com os dados seguindo uma ordem cres-
cente, ou seja, do menor valor para o maior valor. Outro exemplo clássico de rol que, certamente,
você já viu em sala de aula, é a lista de presença dos seus alunos. Os nomes estão em ordem alfa-
bética, ou seja, em um rol, assim, fica mais fácil para localizar algum aluno, porque os dados estão
organizados. Além disso, o rol é um passo importante para construção de tabelas de frequências.
Mas o que são tabelas de frequências? Trata-se de uma distribuição, de modo tabular, os valores de
uma variável numérica em um conjunto de classes (linhas) numericamente ordenadas. Podemos
ter uma distribuição de frequências com intervalo de classes e sem intervalo de classes.
Primeiro, você aprenderá a construir uma distribuição de frequências sem intervalo de classes,
utilizando a contagem de uma variável qualitativa nominal. Vejamos a situação a seguir: em pro-
fessor do curso de Enfermagem, aplicou um questionário para entender, qual(is) disciplina(s) os
alunos tinham como preferência em uma turma. Para isso, selecionou uma turma com 40 alunos
e fez a seguinte pergunta: “Qual disciplina você mais gosta neste ano?” Dentre as opções dadas
aos alunos eles tiveram:
• Anatomia Humana.
• Biologia celular e molecular.
• Parasitologia.
• Bioestatística.
Dados Brutos
Anatomia Humana Anatomia Humana Bioestatística Biologia Celular e
Molecular
Bioestatística Parasitologia Bioestatística Bioestatística
Parasitologia Parasitologia Parasitologia Parasitologia
Biologia celular e Biologia celular e Biologia celular e Biologia Celular e
molecular molecular molecular Molecular
Anatomia Humana Parasitologia Anatomia Humana Biologia Celular e
Molecular
Anatomia Humana Anatomia Humana Anatomia Humana Biologia Celular e
Molecular
Bioestatística Parasitologia Bioestatística Biologia Celular e
Molecular
Parasitologia Parasitologia Parasitologia Biologia Celular e
Molecular
Parasitologia Parasitologia Parasitologia Parasitologia
Parasitologia Parasitologia Parasitologia Parasitologia
Fonte: o autor.
52
UNIDADE 2
Para facilitar a construção da nossa tabela, faremos um rol, utilizando as disciplinas com ordem alfa-
bética (Quadro 5).
Quadro 5 - Votos dos 40 alunos de uma turma sobre a preferência de disciplinas (em rol)
Dados em rol
Anatomia Humana Bioestatística Biologia celular e Parasitologia
molecular
Anatomia Humana Bioestatística Biologia celular e Parasitologia
molecular
Anatomia Humana Bioestatística Parasitologia Parasitologia
Anatomia Humana Biologia celular e Parasitologia Parasitologia
molecular
Anatomia Humana Biologia celular e Parasitologia Parasitologia
molecular
Anatomia Humana Biologia celular e Parasitologia Parasitologia
molecular
Anatomia Humana Biologia celular e Parasitologia Parasitologia
molecular
Bioestatística Biologia celular e Parasitologia Parasitologia
molecular
Bioestatística Biologia celular e Parasitologia Parasitologia
molecular
Bioestatística Biologia celular e Parasitologia Parasitologia
molecular
Fonte: o autor.
Agora que temos os dados em rol, construiremos a tabela de frequências (Fi), que se trata de agrupar
os dados em uma tabela, contando quantas vezes cada variável (nesse caso, cada disciplina) se repetiu,
isso é o que chamamos de frequência. Para isso, organizamos a tabela (utilizando a ordem alfabética),
contendo todos os elementos (título, cabeçalho, linhas, entre outros). Utilizando os dados em rol,
construiremos uma tabela de frequências com a preferência de 40 alunos de uma turma do curso de
Enfermagem (Tabela 6).
Tabela 6 - Distribuição de frequências referentes à preferência de 40 alunos de uma turma do curso de Enfermagem
53
UNICESUMAR
Como você pode observar, inserimos a coluna contagem somente para você entender como funciona
a distribuição de frequência, geralmente, ela não aparece, mas como é a primeira vez que você está
construindo essa tabela, elaboramos essa coluna para melhor entendimento.
Observe que, na disciplina Anatomia Humana, a repetição, ou seja, a contagem foi de sete alunos,
portanto, a frequência desta classe (desta linha) é igual a sete. Já na segunda classe, ou seja, segunda linha,
temos a disciplina Bioestatística, com votos de seis alunos, portanto, a frequência para esta disciplina
é igual a seis. Enquanto na terceira classe, a contagem para disciplina de Biologia Celular e Molecular
é igual a nove, sendo assim, na coluna frequência, inserimos a informação que é igual a nove. Por fim,
na última classe, com a disciplina Parasitologia, teve a preferência de 18 alunos.
Uma classe em uma distribuição de frequência corresponde ao número de linhas desta tabela,
exceto cabeçalho e total.
Podemos, entretanto, reconstruir esta tabela, inserindo algumas colunas complementares que são
importantes em uma distribuição de frequência, tais como:
a) Frequência Relativa (FR %): corresponde à proporção entre a frequência da classe pelo total de
números observados, e a equação a seguir apresenta-nos como calcular a frequência relativa.
Fi
Fr (%) .100
n
Em que:
Fr (%) = Frequência relativa (em percentual)
Fi = Frequência da classe
n = número total de elementos (ou somatória das frequências, correspondente ao total).
b) Frequência Acumulada (Fac): referente à frequência de todos os valores inferiores ao limite
superior da classe, ou seja, repete-se a primeira frequência, em seguida, vamos somando com
as posteriores.
c) Frequência Relativa Acumulada (FRAC %): trata-se de uma classe em que a frequência acu-
mulada da classe, dividindo pelo total da distribuição, ou seja, pelo total. A equação referente
à frequência acumulada pode ser observada a seguir:
Fac
Frac(%) .100
n
54
UNIDADE 2
Em que:
Frac (%) = Frequência relativa acumulada (em percentual)
Fi = Frequência acumulada da classe
n = número total de elementos (ou somatória das frequências, correspondente ao total).
Agora, você aprenderá a construir a tabela de distribuição de frequências com estas colunas comple-
mentares (Tabela 7). Vamos lá!
Tabela 7 - Distribuição de frequências referentes a preferência de 40 alunos de uma turma do curso de Enfermagem
Frequência
Disciplina FR (%) Fac FRAC (%)
(Fi)
Anatomia 7 7
Humana
7 .100 17, 5 7 .100 17, 5
40 40
6 13
Bioestatística 6 .100 15 7 6 13 .100 32, 5
40 40
Biologia 9 22
Celular e 9 .100 22, 5 13 9 22 .100 55
Molecular 40 40
18 40
Parasitologia 18 .100 45 22 18 40 .100 100
40 40
Total 40 100
Fonte: o autor.
Como você pode observar, apresentamos as colunas FR (%), Fac e FRAC (%) com todas as fórmulas
e resoluções. Na coluna FR (%), utilizamos a equação a seguir:
Fi
Fr (%) .100
n
Em seguida, substituímos cada valor da frequência, dividimos pelo total (que neste caso é igual a 40),
e temos que a proporção de alunos que preferem a disciplina Anatomia Humana é de 17,5%. Essa
coluna também serve para situações em que queremos saber a proporção em percentual, por exemplo:
qual o percentual de alunos que preferem a disciplina de Biologia Celular e Molecular? Simplesmente,
basta olhar na coluna FR (%) e responder que: 22,5% dos alunos preferem a disciplina Biologia Ce-
lular e Molecular. Neste momento, você pode estar se questionando, quando construirá tabelas de
frequências e se é preciso apresentar todos os cálculos nesta tabela. A resposta é: não, necessariamente.
No exemplo apresentado, fizemos a resolução completa apresentando os cálculos em cada uma das
classes para que você possa visualizar a equação correspondente bem como a substituição dos valores
para compor a tabela.
55
UNICESUMAR
Na maioria das vezes, quando elaboramos estas tabelas, normalmente, não apresentamos os cálculos.
Agora, você verá a mesma tabela, sem apresentar os cálculos (Tabela 8).
Tabela 8 - Distribuição de frequências referentes a preferência de 40 alunos de uma turma do curso de Enfermagem (sem os cálculos)
Além disso, temos como ir tirando prova real para verificar se os cálculos apresentados estão corretos.
Observe a seguir:
a) Na linha Total, observe que a somatória das frequências deve ser igual ao número de elemen-
tos coletados, ou seja, para este caso, foram entrevistados 40 alunos do curso de Enfermagem,
então, a somatória deve ser igual a 40.
b) Na coluna FR %, analise que a somatória das frequências relativas em percentual, a somatória
deve ser igual a 100, correspondente a 100 por cento. Caso sua somatória dê, por exemplo, 98%,
é necessário conferir os cálculos anteriores.
c) Na coluna Frequência Acumulada (Fac): aqui, somamos as frequências das classes com as
frequências posteriores, certo? Mas a prova real, trata-se do último valor encontrado na colu-
na FAC ser igual ao total de elementos analisados, ou seja, o valor dever ser igual ao total da
somatória da coluna frequência.
d) Na coluna Frequência Relativa Acumulada (FRAC %): o último valor correspondente à variável
analisada deve ser igual a 100.
56
UNIDADE 2
Não se esqueça: o coração da sua tabela é a coluna frequência, por isso, é importante estes valores
serem distribuídos de maneira correta.
Descrição da Imagem: na figura, temos a sequência dos passos para a construção de uma distribuição de frequências
sem intervalo de classes, temos: 1º passo – coletar os dados; 2º passo – colocar os dados em rol; 3º passo – construir
a tabela e contar as repetições; 4º passo – fazer as colunas frequência relativa (FR %), frequência acumulada (FAC) e
frequência relativa acumulada FRAC (%), e o passo 5 – conferir os dados.
57
UNICESUMAR
Até agora, vimos como trabalhar com uma distribuição de frequências, sem intervalo de classes, mas
com uma variável quantitativa discreta. Vejamos um exemplo: supondo que um diretor de uma escola
anotou durante 30 dias o número de atendimento aos pais e obteve o seguinte resultado:
Dados Brutos
3 3 2 4 5
2 2 2 4 4
2 3 3 5 2
4 2 3 2 3
1 2 3 2 2
3 4 2 3 2
Dados em Rol
2 2 2 3 4
2 2 2 3 4
2 2 3 3 4
2 2 3 3 4
2 2 3 3 5
2 2 3 4 5
14 14
2 14 .100 46, 7 14 .100 46, 7
30 30
9 23
3 9 .100 30 14 9 23 .100 76, 7
30 30
5 28
4 5 .100 16, 7 23 5 28 .100 93, 3
30 30
2 30
5 2 .100 6, 6 28 2 30 .100 100
30 30
Total 30 100
Fonte: o autor.
58
UNIDADE 2
59
UNICESUMAR
AT Xmáx Xmín
Em que:
AT = Amplitude Total
Xmáx = Maior valor do conjunto de dados
Xmín = menor valor do conjunto de dados
3º passo: determinar o número de classes. Para uma distribuição de frequências com intervalo de
classes, os números de linhas são definidos pela equação a seguir:
k= n
Em que:
K = número de classes
n = número total de elementos
Obs.: é muito importante que o número de classes seja arredondado.
4º passo: determinar a amplitude do intervalo, ou seja, a distância entre o limite inferior da classe e o
limite superior da classe, dado pela equação:
AT
h=
k
Em que:
h = Amplitude do intervalo
AT = Amplitude total
k = número de classes
60
UNIDADE 2
Descrição da Imagem: na figura, temos uma sequência dos passos para a construção de uma distribuição de fre-
quências com intervalo de classes: 1º passo – rol; 2º passo – cálculo da AT; 3º passo – cálculo do número de classes
(linhas); 4º passo – cálculo da amplitude do intervalo, e o passo 5 – construção da tabela respeitando o intervalo de
classes entre os limites.
Para entender melhor a construção de uma distribuição de frequências com intervalo de classes, observe
os dados a seguir, que são referentes às notas de alunos do curso de Ciências Biológicas:
61
UNICESUMAR
AT Xmáx Xmín
AT 10, 0 3, 0 7, 0
3,0 5,0 6,5 7,5 9,0
3,0 6,0 7,0 8,0 9,0
3,0 6,0 7,0 8,0 9,5
3,0 6,0 7,0 8,5 9,5
4,0 6,5 7,0 8,5 10,0
4,5 6,5 7,0 8,5 10,0
k= n
k = 30
=k 5=, 47 arredondando 5
4º passo: agora, resolveremos a amplitude do intervalo, utilizando a equação a seguir:
AT
h=
k
7
h=
5
h = 1, 4
62
UNIDADE 2
Antes de construir nossa tabela de frequências, precisamos entender o que são limites inferiores e
superiores. Temos quatro maneiras de utilizar os limites inferiores e superiores:
1. |------- Nesta primeira notação, incluímos o limite inferior e excluímos o limite superior.
2. -------| Nesta notação, excluímos o limite inferior e incluímos o limite superior.
3. ------- Nesta notação, excluímos ambos os limites.
4. |------| Nesta notação, incluímos ambos os limites.
Qual delas usar? Utilizaremos a primeira notação, que inclui limite inferior e exclui limite superior,
mas, em alguns casos, somente na última classe, teremos que usar a quarta notação, que inclui ambos
os limites, isso pode ocorrer para que o maior valor do conjunto de dados seja contado.
Como já temos todas as informações, construiremos nossa tabela (Tabela 11):
Tabela 11 - Distribuição de frequências referente às notas de seus alunos (com intervalo de classes)
Número
de
Notas FR(%) FAC FRAC (%) Ponto médio (xi)
alunos
(Fi)
5 5
3,0 |----- 4,4 5 .100 16, 7 5 .100 16, 7 3, 0 4, 4 2 3, 7
30 30
2 7
4,4 |----- 5,8 2 .100 6, 6 5+2=7 .100 23, 3 4, 4 5, 8 2 5,1
30 30
11 11
5,8 |----- 7,2 11 .100 36, 7 7+11=18 .100 36, 7 5, 8 7, 2 2 6, 5
30 30
6 24
7,2 |----- 8,6 6 .100 20 18+6=24 .100 80 7, 2 8, 6 2 7, 9
30 30
6 30
8,6 |-----| 10,0 6 .100 20 24+6=30 .100 100 8, 6 10, 0 2 9, 3
30 30
Total 30 100
Fonte: o autor.
Agora, temos a tabela resolvida, observe que, na última classe, tivemos que utilizar a notação que inclui
limite inferior e inclui limite superior |-----|, isso foi feito para que a nota 10,0 fosse incluída na contagem.
Observe, nesta tabela, que há uma coluna complementar a mais, a coluna ponto médio, que é de-
terminado pela equação:
Xi ( Li Ls ) 2
63
UNICESUMAR
Em que:
Xi = Ponto médio
Li = Limite inferir do intervalo de classe (independentemente da notação)
Ls = Limite superior do intervalo de classe (independentemente da notação)
É importante ficar atento porque só existe ponto médio em uma distribuição de frequências com
intervalo de classes. O ponto médio será importante, em nossa próxima unidade, no cálculo da média.
Outra maneira de apresentar os dados provenientes de uma pesquisa são os gráficos (Figura 3). Um
gráfico tem por objetivo apresentar uma ideia visual do comportamento de um conjunto de valores,
tem a vantagem de facilitar a compreensão de determinada situação que queira ser descrita, permitindo
a interpretação rápida de suas principais características (ARANGO, 2011).
64
UNIDADE 2
É importante frisar que um gráfico não traz tantas informações quanto a uma tabela. E você vai se
perguntar: usarei gráfico ou tabelas em minhas pesquisas? A resposta é: fica a critério do pesquisador,
ou seja, a pessoa que está fazendo a pesquisa pode utilizar gráficos ou tabelas, ou fazer uma mesclagem
entre eles. Os gráficos estão sempre presentes em trabalhos científicos, artigos, congressos, seminários,
simpósios, em que é preciso comunicar um grande volume de informações com tempo limitado, de
forma compreensível e agradável.
Temos vários modelos de gráficos, que veremos a seguir:
a) Gráfico de colunas: quando temos as categorias apresentadas no eixo horizontal e a frequên-
cia no eixo vertical (BARBETTA, 2014). Para construção do gráfico de colunas, utilizaremos
os dados referentes às matrículas na Educação Infantil, retirados do INEP (2019). A Figura 3,
apresenta um gráfico de colunas:
Descrição da Imagem: a figura traz um gráfico de colunas em que as barras estão na direção vertical, primeiro com
a região Norte em que temos 690.631 alunos, seguida da região Nordeste com 2.349.305 alunos, seguida da região
Sudeste com 3.919.235, após, com a região Sul, 1.347.509 alunos e, por fim, a região Centro-Oeste com 666.098 alunos.
Como você pode observar, na horizontal, temos as regiões do país e, na vertical temos o número de
matrículas na Educação Básica. Caso você queira saber o número de matriculados na região Norte,
por exemplo, basta olhar na região Norte e verificar que há pouco mais do que 500.000 matrículas,
no ano de 2019.
65
UNICESUMAR
b) Gráfico de barras: em que cada variável é representada por uma barra de comprimento
proporcional à sua ocorrência (BARBETTA, 2014). Temos as barras na vertical, na Figura 4.
Descrição da Imagem: a figura traz um gráfico de colunas em que as barras estão na direção horizontal: de baixo
para cima aparece primeiro a região Norte em que temos 690.631 alunos, seguida da região Nordeste com 2.349.305
alunos, seguida da região Sudeste com 3.919.235, após, a região Sul com 1.347.509 alunos e, por fim, a região Centro-
-Oeste com 666.098 alunos.
c) Gráfico de linhas: são gráficos bem interessantes no uso de séries temporais, ou seja, a variável
predominante é o fator tempo (cronológico), esse tipo de gráfico mostra informações da série
estudada em pontos e que são marcados por segmentos de linha reta. A Figura 5 apresenta-nos
um gráfico de linhas.
Descrição da Imagem: a figura traz um gráfico de linhas com os meses de janeiro a dezembro, apresentando a evo-
lução do índice pluviométrico no período.
66
UNIDADE 2
Na Figura 5, com o gráfico de linhas, você pode observar que o aumento no índice pluviométrico é apresentado
mês a mês (tempo), e, para interpretar esse gráfico, basta visualizar que podemos concluir que o mês
de julho foi que apresentou maior quantidade de chuvas.
d) Gráfico de setores: também conhecido como gráfico de pizza, é um gráfico circular, em que
os valores são representados proporcionais às respectivas frequências. Para a construção deste
gráfico, utilizaremos os dados referentes às preferências de alunos de uma turma do curso de
Ciências Biológicas (Figura 6).
Descrição da Imagem: a figura traz um gráfico em formato de pizza, circular, sendo que a proporção maior está com
45% na disciplina Zoologia I, seguida de 23% na disciplina Biologia Celular e Molecular, seguida da disciplina Bioesta-
tística com 15% e, por fim, a disciplina Anatomia com 7%.
Neste tipo de gráfico, podemos verificar a proporção dentre as disciplinas que os alunos escolheram
como preferidas. Fica nítida a preferência pela disciplina Zoologia I, seguida da disciplina Biologia
Celular e Molecular, sendo a menos preferida a disciplina Anatomia Humana, para esta turma men-
cionada no exemplo.
67
UNICESUMAR
10
Quantidade de alunos
8
6 6
6 5
4
2
2
0
3,0 4,4 4,4 5,8 5,8 7,2 7,2 8,6 8,6 10,0
Descrição da Imagem: a figura representa um histograma, em que temos gráficos na vertical, juntos, ou seja, sem
espaço entre as barras, iniciando com cinco alunos com notas maiores ou iguais a 3,0 e menores do que 4,4; dois alunos
com notas maiores ou iguais a 4,4 e menores do que 5,8; onze alunos com notas maiores ou iguais a 5,8 e menores
que 7,2; seis alunos com notas maiores ou iguais a 7,2 e menores do que 8,6 e seis alunos com notas maiores ou iguais
a 8,6 e menores ou iguais a 10,0.
Na Figura 7, que representa um histograma, para interpretação, você deve olhar as notas bem como a
quantidade de alunos, observe que, no primeiro retângulo, temos cinco alunos com notas maiores ou
iguais a 3,0 e menores do que 4,4, e assim sucessivamente. Você pode, também, construir todos os seus
gráficos em suas pesquisas com o auxílio do Microsoft Excel®, basta inserir todos os dados, selecionar
e escolher o modelo que melhor represente os dados com que está trabalhando. Dessa maneira, fica a
critério do pesquisador a utilização de tabelas e gráficos para apresentar os resultados de uma pesquisa,
podendo seu uso ser intercalado.
Você percebeu o quanto a construção de tabelas e gráficos pode ser significativa e aplicada na sua
profissão? Existem muitas possibilidades. Você pode trabalhar com pesquisa e apresentar os resultados
em tabelas e gráficos, com dados disponíveis no próprio INEP sobre a Educação Básica ou, até mesmo,
coletar dados de seus alunos, construir tabelas e gráficos para entender o comportamento de sua turma
em alguns quesitos (dê preferência por disciplinas, notas, frequências, evasões, entre outros) Veja que
tudo isso está relacionado e que a Bioestatística está presente em sua na vida diária.
68
UNIDADE 2
Vimos, em nossos estudos, como as técnicas de estatística são fundamentais para tomada de decisões e
que, para organizar uma tabela, precisamos seguir algumas normas específicas que foram apresentadas
no decorrer dessa unidade. Além disso, os gráficos também podem ser utilizados para visualizar o
resultado de uma pesquisa. Assim, ao tabular os resultados da pesquisa propostos no início de nosso
estudo, mais especificamente na experimentação, em que colocamos uma situação hipotética, que rea-
lizará um experimento para saber se as pessoas de um bairro (ou membros da família tiveram dengue).
Aqui, na ação, após toda coleta de dados a partir de um formulário elaborado por você, certamente, terá
resultados a serem tabulados. É isso mesmo, com todas as técnicas estudadas, você poderá criar tabelas
de frequências, colunas complementares para melhorar os resultados obtidos e, a partir de então, tomar
decisões. Supondo que suas respostas sejam que, dentro de um grupo de dez pessoas, oito responderam
que já tiveram dengue, ou seja, 80% dos entrevistados, como profissional da área de Ciências Biológicas
e Saúde, o que você pode propor? Com base nesse estudo, pode propor palestras para sensibilização
da população, um dia D de combate ao foco de dengue, orientar, disseminar informações acerca dos
cuidados que devemos ter com a dengue. Aqui, você pode perceber, que usamos uma técnica estatística,
e a partir de então, foram feitas ações de melhoria no combate a dengue.
69
Caro(a) estudante, a utilização de tabelas e gráficos são a forma de apresentar resultados oriundos
de uma pesquisa, como vimos em nossa unidade, existem normas específicas para sua elaboração
e confecção. A partir desta conceitualização, desenvolva um Mapa Mental que aborde os con-
ceitos com que trabalhamos nesta unidade: Tabelas e Gráficos. Procure colocar as informações
pertinentes sobre cada uma das relações apresentadas na área de Biológicas e da Saúde.
MAPA MENTAL
70
3
Medidas de Posição e
Dispersão
Me. Renata Cristina Souza Chatalov
Para que possamos continuar nossas reflexões, vamos nos apropriar dos conceitos
e resgataremos os exemplos e a trajetória das unidades anteriores. Neste momen-
to de sua leitura, você, provavelmente, deve estar se perguntando: “agora que já
coletei os dados, organizei em tabelas, qual a próxima etapa? O que posso fazer
com eles? Por que estou aprendendo tudo isso? Em que será útil no meu dia a
dia? Para que possamos problematizar e refletir, compartilharei outra história que
foi muito relevante em minha trajetória. Vou nos transportar para a primeira vez
em que entrei em uma escola como professora da disciplina Estatística. Naquele
momento, eu tinha várias expectativas quanto à minha atuação como docente.
Aquele ambiente inspirava o conhecimento e o meu desejo de ensinar. No entanto,
já em sala de aula, quando fiz a primeira explicação/apresentação a respeito do
que se tratava a disciplina de cálculo, explicitei que, também, trabalharíamos com
a interpretação de dados e informações e notei que isso foi uma surpresa para
os estudantes daquela turma. Na aula seguinte, fiz uma revisão de conteúdos de
Matemática Básica, como fração, multiplicação e expressão numérica, quando
percebi a necessidade de mais aulas relembrando este conteúdo com meus alunos.
Então, para ter um parâmetro de como estava a turma, fiz um teste, sem valer
nota, mas para ter um diagnóstico real de como poderia trabalhar. Depois que
fiz as correções dos testes, calculei a média, a variância e o desvio padrão daquela
turma e entendi que havia muita dispersão, ou seja, parte da turma necessitava de
uma atenção especial em cálculos básicos de matemática, outra parte era inter-
mediária, e outra parte tinha gabaritado o teste. Com essa turma heterogênea, era
preciso cuidado e atenção, e isso me desafiava nesta primeira experiência como
professora. Com este relato de minha história, desejo que, nesta unidade, você se
atente aos conteúdos que desbravaremos e compreender juntos, que tratam de
formas de se calcular as medidas de posição e dispersão e sobre como perceber
o quanto estas são importantes em nossa tomada de decisões.
Você percebeu que, como professora da disciplina Estatística, utilizei medidas
de dispersão para mensurar o conhecimento prévio da turma em Matemática
Básica e, com base nos resultados, fui traçando um planejamento pedagógico
pensando na melhor maneira do aprendizado da minha turma. Agora que en-
tendemos que a estatística pode nos ajudar a construir elementos para tomada
de decisões, você, também, pode se apropriar destes preceitos para a tomada de
decisão em sua trajetória profissional e verá que essas medidas ajudarão você a
interpretar os resultados de que precisa em um conjunto de dados.
72
UNIDADE 3
DIÁRIO DE BORDO
73
UNICESUMAR
Média
dante, estudaremos as medi-
das de posição, as separatrizes
e a dispersão. As medidas de
tendência central possibilitam
representar um conjunto de
dados com apenas um número
(MARTINEZ, 2015). As medi- Mediana
das de posição mais utilizadas e
as que estudaremos são: a mé-
dia, a moda e a mediana.
Moda
Figura 1 - Medidas de tendência central (ou medidas de posição)
Fonte: o autor.
74
UNIDADE 3
Cada uma dessas medidas envolve fórmulas e aplicações diferentes, tornando a Bioestatística
ainda mais fascinante. “As medidas de tendência central só podem ser calculadas para variáveis
quantitativas” (PARENTI; SILVA; SILVEIRA, 2017, p. 116).
A medida de posição média é a medida de tendência central mais conhecida e mais importante para
um conjunto de valores. Tenho certeza de que você já a utilizou no seu dia a dia, pois é bem simples
de ser calculada. Para o cálculo da média, basta somar todos os valores e, em seguida, dividir pelo total
de elementos. A média amostral é representada por um x com uma barra em cima ( X ), e a média
populacional pela letra grega µ (lê-se mi). Mesmo sendo representadas de maneira diferente, a forma
de calcular é a mesma.
Para calcularmos a média, quando temos dados desagrupados, ou seja, sem estarem em tabelas,
podendo ser brutos ou em rol, é dada por:
f) Média Populacional:
Xi
µ
N
Em que:
µ = Média Populacional
∑ = Somatória
X i = Valor de cada elemento
N = Total da População
g) Média Amostral:
X
Xi
n
Em que:
X = Média Amostral
∑ = Somatória
X i = Valor de cada elemento
n = Total da Amostra
75
UNICESUMAR
Como você pode observar, o cálculo da média é o mesmo tanto para a população quanto para a amos-
tra. Aposto que, neste momento, você está se questionando: mas como funciona na prática? Sempre
que não for mencionado que os dados são populacionais, você pode considerar uma amostra, e isso
acontece porque, geralmente, o trabalho com amostras tem um custo e um tempo menor do que o
trabalho com população. Você pode observar que, na área das Ciências Biológicas e da Saúde, o uso
de amostras é recorrente.
Para compreender melhor o que eu desejo explicar para você aqui, o cálculo da média, vejamos um
exemplo. As idades (em anos) de oito pessoas que estão apresentadas, a seguir:
X
Xi
n
X
X i x1 x2 x3.......xn
n n
Assim:
38 40 49 67 33 57 54 64
X
8
402
X 50, 25
8
Você pode observar que a média é apresentada na mesma unidade de medida da variável analisada. E
como interpretamos uma média de 50, 25 anos? Em primeiro lugar, tendo a média como uma medida
de tendência central, podemos afirmar que as idades das oito pessoas de nossa amostra estão em torno
de 50, 25 anos. A Figura 2 ajuda-nos a visualizar a média e os dados apresentados.
Descrição da Imagem: a imagem apresenta uma reta com os valores de dois em dois, iniciando em 30, 32, 34, 36
e terminando em 68; a média está representada, na reta, no valor de 50, 25 anos, os valores estão apresentados na
dispersão e marcados pontos em: 33,38, 40, 49, 54, 57, 64 e 67.
76
UNIDADE 3
Dessa forma, lembre-se de que a média é uma medida-resumo, isto é, ela visa sintetizar em um único
valor todas as nossas observações amostrais. Em outras palavras, afirmarmos que a idade de 50, 25 anos
é um valor que tem por intuito representar as idades de todas as oito pessoas analisadas. No entanto
você pode observar que a média é um resumo incompleto de nosso conjunto de dados uma vez que
ela não informa o tamanho da dispersão de nossos dados a seu redor. Observe que, com a média de
50, 25 anos, temos pessoas com 33 anos, com 48 e com 67. Para explicar toda esta dispersão, existe o
desvio padrão, que discutiremos um pouco mais à frente.
Supondo que, agora, temos uma amostra composta por oito mulheres, e a variável que nos interessa
é o número de filhos, para isso, temos:
1, 1, 1, 2, 2, 3, 3, e 4
X
Xi
n
111 2 2 3 3 4
X
8
17
X
8
X 2, 125
Se o número de filhos é uma variável discreta, e não temos casas decimais, seria possível ter uma média
de 2,125 filhos? Ainda que a variável estudada não admita casas decimais, a sua média pode sim ter
casas decimais. Entretanto, neste exemplo apresentado, basta uma casa decimal para a média, aí po-
demos utilizar a regra de arredondamento e dizer que as famílias têm, em média, 2,1 filhos. Também
podemos ter interesse em calcular a média, em dados qualitativos apresentados em tabelas. Vejamos
o exemplo, na Tabela 1, a seguir:
Tabela 1 - Média das estaturas (em cm) de 30 adolescentes, conforme a classificação de seus pesos
Para calcular a média neste caso, trabalharemos com a média ponderada, dada pela equação:
X
X i . fi
n
77
UNICESUMAR
Em que:
X = média
X i = cada um dos valores (ou ponto médio)
n = número total de elementos (ou somatória das frequências)
Temos:
X
X i . fi
n
(6.145, 5) (14.148, 8) (10.149, 3)
X
30
873 2.083, 32 1.493
X
30
4.449, 32
X
30
X 148, 31
Em vez de calcular dessa maneira, para facilitar, você pode, dentro da sua tabela, criar uma coluna
complementar e chamá-la de xi.fi, colocar os resultados em cada classe da multiplicação da frequência
pelo valor da variável e, depois, somar com o total na Tabela 2. Vejamos a seguir:
Tabela 2 - Média das estaturas (em cm) de 30 adolescentes, conforme a classificação de seus pesos com coluna complementar
Agora, com o resultado da somatória das frequências pela variável, utilizamos a mesma equação. Veja
como fica:
X
X i . fi
n
4.449, 32
X=
30
X = 148, 31
78
UNIDADE 3
Você, também, poderá encontrar situações, no seu cotidiano, já atuando como profissional, em que
você precisará calcular a média de idade de seus pacientes, ou, ainda, calcular médias de seus alunos
utilizando os dados quantitativos. Vejamos um exemplo hipotético em que analisaremos as notas de
uma turma do curso de Biomedicina, na Tabela 3 a seguir:
Tabela 3 - Notas de 30 alunos do Curso de Biomedicina
Para que o professor saiba a média em questão, ele realizará uma análise simples, multiplicará a nota
(variável que está sendo estudada) pelo número de alunos, em seguida dividirá pelo total da turma,
que, neste caso, é de 30 alunos. Utilizando a equação da média, temos:
X
X i . fi
n
(7.8) (8.12) (9.6) (10.4)
X
30
56 96 54 40
X
30
246
X
30
X 8, 2
Outra opção para calcular, como vimos anteriormente, é criar a coluna complementar, ficando, desta
forma, na Tabela 4:
Tabela 4 - Notas de 30 alunos do Curso de Biomedicina
79
UNICESUMAR
X
X i . fi
n
246
X=
30
X = 8, 2
Na Tabela 6, temos as notas dos alunos do curso para calcularmos a média. A fim
de facilitar, inseriremos uma coluna complementar, determinaremos o ponto médio
primeiro, utilizando a equação a seguir:
Xi ( Li Ls ) 2
Em que:
Xi = Ponto médio
Li = Limite inferior do intervalo de classe (independente da notação)
Ls = Limite superior do intervalo de classe (independente da notação)
80
UNIDADE 3
Tabela 6 - Distribuição de frequências referente às notas de alunos do Curso de Biomedicina (com intervalo de classes)
Agora que temos o ponto médio, basta inserir uma coluna complementar “xi.fi” e utilizar a equação
da média, que já trabalhamos, anteriormente. Reescrevendo, na Tabela 7, temos:
Tabela 7 - Distribuição de frequências referente às notas de alunos do Curso de Biomedicina (com intervalo de classes)
Total 30 203,4
Fonte: o autor.
X
X i . fi
n
203, 4
X=
30
X = 6, 78
A média da turma é 6,78, arredondando temos que a média da turma de Biomedicina é de 6,8.
81
UNICESUMAR
A medida de tendência central mais conhecida e mais utilizada é a média, mas não é sempre
que ela é a mais apropriada para representar os dados, às vezes, a mediana é mais adequada
para representar um conjunto de dados. Isso ocorre sempre que a variabilidade dos dados
for alta, pois a média é afetada por valores extremos, e a mediana não, ela apenas leva em
consideração os valores centrais.
Fonte: Parenti, Silva e Silveira (2017, p. 120).
82
UNIDADE 3
Outra medida de posição importante é a moda. Você deve ter ouvido falar da expressão: “música que
está na moda”,“roupa que está na moda”, isso significa que tem muita frequência, muitas pessoas ouvindo
a mesma música, muitas pessoas usando mesmo estilo de roupa. Aqui na Bioestatística, esse conceito é
bem válido. Assim, para Martinez (2015), a moda é a observação que ocorre com maior frequência no
conjunto de dados, ou seja, o valor que mais se repete. Imagine que em uma loja de calçados femininos
foram vendidos 20 pares de sapatos em um único dia. Os pares tinham estas numerações:
34 37 34 36 36
35 36 37 33 36
36 36 36 36 39
36 35 34 36 36
A numeração que aparece com mais frequência é o número 36. Significa que é uma informação muito
importante ao gerente da loja, pois indica que ele não pode deixar de ter calçados 36 em seu estoque,
porque vendem com mais frequência.
É importante não confundir moda com maioria. A moda é a observação mais frequente, mas
isso não implica, necessariamente, que a moda corresponde à maioria das observações.
(E. Z. Martines).
Em outro exemplo, suponha que, em uma turma de 1º ano de Nutrição, as idades dos 20 alunos (em
anos completos) são:
30 25 19 18 18
18 18 18 18 18
19 20 23 25 27
24 22 22 18 18
Podemos descrever, adequadamente, as idades destes alunos dizendo que a idade mais frequente, ou
moda, é 18 anos. No entanto, em alguns casos, a moda pode não ser a medida mais apropriada para
caracterizar os dados. Como os valores a seguir são os níveis séricos de triglicérides (em mg/dl) em
uma amostra de sete pacientes:
83
UNICESUMAR
A moda, neste exemplo, seria 140 mg/dl, sendo o valor mais frequente. Mas será que a moda é a medida
de posição que melhor caracteriza esses dados? Talvez a média ou a mediana (que veremos a seguir)
sejam mais úteis para esta finalidade. Em algumas situações, a moda pode não ser única. Por exemplo,
o tempo de aleitamento materno (em meses) de 8 crianças usuárias de um serviço de saúde:
1, 2, 3, 3, 4, 6, 6
Neste exemplo, temos dois valores mais frequentes, 3 e 6 meses. Podemos dizer que se trata de uma
série bimodal, ou seja, dois valores de moda. Novamente, a média ou a mediana podem ser mais
úteis para descrever os dados desse exemplo. Podemos não ter moda em um conjunto de dados, caso
nenhum número se repita mais vezes do que outro. Quando isso acontece, chamamos a distribuição
de amodal. Se tivermos mais do que duas modas, teremos uma distribuição multimodal (PARENTI;
SILVA; SILVEIRA, 2017).
Em alguns casos podemos ter interesse em saber a moda, mas os dados estão apresentados em tabela,
como fazer? Bem simples, basta olharmos os dados e a coluna frequência, assim, vamos encontrar a
classe modal, para então sabermos a moda. Observe os dados a seguir, na Tabela 8.
Tabela 8 - Notas de alunos do Curso de Nutrição
Para determinar a moda em tabelas, primeiramente, procuraremos a classe modal. Para isso, basta
observar na coluna que tem a maior frequência. Em nosso exemplo, a segunda classe tem doze alunos,
que corresponde ao valor que aparece com mais frequência, portanto, esta é a classe modal.
Em tabelas de frequências, também, podemos ter mais do que uma moda. Analise a seguir, na
Tabela 9.
Tabela 9 - Notas de alunos do Curso de Nutrição
84
UNIDADE 3
Neste caso, as notas que aparecem com maior frequência são 8 e 10, temos uma série bimodal, ou seja,
com duas modas. E quando temos dados em tabelas de frequências com intervalo de classes, como fica?
Primeiro passo é localizar a classe modal, ou seja, a classe que tem a maior frequência e, em seguida,
utilizar a equação a seguir:
h.( Fi Fi1 )
Mo Li
( Fi Fi1 ) ( Fi Fi1 )
Em que:
Mo = Moda
Li = Limite da classe inferior (na classe modal)
h = Amplitude do intervalo (distância entre Li e Ls)
Fi = Frequência da classe
Fi−1 = Frequência da classe anterior
Fi+1 = Frequência da classe posterior
Determine a moda. Para calcular a moda, procuraremos, na tabela, na coluna frequências, a maior
frequência para indicar a classe modal. Podemos observar que a moda está na terceira classe da tabela,
mas qual a moda? Determinaremos a seguir:
h.( Fi Fi1 )
Mo Li
( Fi Fi1 ) ( Fi Fi1 )
1, 4.(11 2)
Mo 5, 8
(11 2) (11 6)
1, 4.(9)
Mo 5, 8
(9) (5)
12, 6
Mo 5, 8
14
Mo 5, 8 0, 9
Mo 6, 7
85
UNICESUMAR
Encontramos que a nota que representa a moda é igual a 6,7; mas os dados não foram dados em rol,
com esta equação, encontramos o valor mais aproximado, observem que este valor está dentro dos
valores estabelecidos nos limites inferiores e superiores. Para Parenti, Silva e Silveira (2017), a mediana
é definida como sendo o valor central da distribuição dos dados ordenados, e este divide a distribuição
ao meio, sendo que metade dos valores será menor ou igual à mediana, e a outra metade será maior ou
igual à mediana. Até o momento, quando calculávamos a média e a moda, fazíamos, diretamente, sem
ter que colocar os dados em rol, mas, para calcular a mediana, obrigatoriamente, devemos colocar os
dados em rol. Supondo que temos as idades de cinco alunos do curso de Nutrição, que são dadas a seguir:
25 22 18 23 24
Encontre a mediana entre as idades dos alunos. Sabemos que a mediana divide o conjunto de dados
em duas partes iguais, não seria correto fazer simplesmente assim:
25 22 18 23 24
Mediana
Dessa forma está errada, pois a idade de 18 anos não é o que divide o conjunto de dados em rol, pois,
na mediana, estes dados devem ser ordenados, portanto:
18 22 23 24 25
Mediana
Agora, temos a mediana, que é igual à idade de 23 anos.
Vejamos outro exemplo: idades (em anos) de sete pessoas estão apresentadas a seguir:
Mediana igual a 49. Agora, representaremos, na Figura 3, para que você consiga analisar os valores
antes e depois da mediana.
86
UNIDADE 3
Descrição da Imagem: a figura apresenta uma representação da mediana onde se encontra uma reta com os valo-
res de dois em dois, iniciando em 30, 32, 34, 36 e terminando em 68, a mediana está representada no valor de 49, os
valores estão apresentados na dispersão e marcados pontos em: 33, 38, 40, 49, 54, 57, 64 e 67.
Se substituirmos a maior idade de 67 para 75 anos, o que aconteceria com a mediana? Seu valor se
modificaria? O número do meio continuaria sendo 49 anos. Esta é uma característica importante
da mediana: ela não é sensível a valores atípicos de nosso conjunto de dados, e entendemos por valor
atípico um número bastante grande ou pequeno em relação aos demais.
No cálculo da mediana, temos duas situações quando temos o conjunto de dados com números
pares e ímpares. Quando tivermos um número ímpar de elementos, a mediana será exatamente o valor
central. Também pode ser calculado pela equação a seguir:
(n 1)
p
2
Em que:
P = posição do elemento que está à mediana
n = número de elementos
87
UNICESUMAR
(n 1)
p
2
(7 1)
p
2
8
p
2
p4
O ‘p’ encontrado igual a 4, não é a mediana, mas sim o valor que ocupa a posição mediana, ou seja, com
os dados em rol, a mediana ocupa a 4ª posição:
n
p1
2
n
p2 1
2
Em que:
P = posição do elemento que está à mediana
n = número de elementos
88
UNIDADE 3
n
p1
2
n
p2 1
2
8
p1 4 ª posição
2
8
p2 1 5ª posição
2
Temos:
5,0 5,5 6,0 7,0 7,5 8,0 9,0 9,0
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Agora, tiraremos uma média simples entre o elemento que está na quarta e na quinta posição:
(7, 0 7, 5)
Md
2
14, 5
Md
2
Md 7, 25
Muitas vezes, podemos ter o interesse em calcular a mediana em dados agrupados em tabelas, para
isso, precisaremos que nossa Tabela 11 tenha a coluna frequência acumulada (FAC).
Tabela 11 - Notas de 30 alunos do Curso de Nutrição
Para encontrar a mediana, como os dados já se encontram agrupados em uma tabela de frequências,
por meio da coluna frequência acumulada, vamos localizar o elemento que ocupa a posição mediana,
como nosso conjunto de dados é par, temos:
89
UNICESUMAR
n
p1
2
n
p2 1
2
30
p1 15ª posição
2
30
p2 1 16 ª posição
2
Agora com na coluna FAC, vamos localizar os elementos que ocupam a 15ª e a 16ª posição. Veja na
tabela 12, a seguir:
Tabela 12 - Notas de 30 alunos do Curso de Nutrição
Para este caso, o elemento que ocupa a 15ª e 16ª posição está na segunda classe é a nota 8,0, portanto,
a nota mediana desta turma é 8,0. E se tivesse uma nota em uma classe, e outra na classe posterior?
Simples, bastaria tirar a média simples entre as duas notas.
Também podemos ter interesse em calcular a mediana em uma distribuição de frequências com
intervalo de classes. Para determinar a mediana, utilizamos a seguinte equação:
n
h.( Fac1 )
Md Li 2
Fi
Em que:
Md = Mediana
Li = Limite da classe inferior (na classe mediana)
h = Amplitude do intervalo (distância entre Li e Ls)
n = número de elementos
Fi = Frequência da classe
Fac−1 = Frequência acumulada da classe anterior
Agora, entenderá como calcular a mediana em dados agrupados em uma distribuição de frequências
com intervalo de classes. Observe na Tabela 13 a seguir.
90
UNIDADE 3
Tabela 13 - Distribuição de frequências referente às notas de alunos do Curso de Nutrição (com intervalo de classes)
Para resolvermos, temos primeiro que encontrar a posição mediana na coluna FAC. Como nosso
conjunto de dados é par, temos:
n
p1
2
n
p2 1
2
30
p1 15ª posição
2
30
p2 1 16 ª posição
2
Podemos observar, na tabela, que os dados estão na 3ª classe. Trabalharemos com estes dados e subs-
tituiremos na equação da mediana.
n
h.( Fac1 )
Md Li 2
Fi
30
1, 4.( 7)
Md 5, 8 2
2
1, 4.(15 7)
Md 5, 8
11
1, 4.(8)
Md 5, 8
11
11, 2
Md 5, 8
11
Md 5, 8 1, 02
Md 6, 82
91
UNICESUMAR
a) Média:
X
Xi
n
b) Moda: valor que mais se repete, portanto é 3,850 kg. Assim: O valor mais frequente para o peso
dos recém-nascidos naquela maternidade é de 3,850 kg.
(n 1)
p
2
(5 1)
p
2
6
p
2
p3
A mediana será o terceiro elemento do conjunto de dados ordenados. Portanto, 3,950. Assim: metade
das crianças nascidas na maternidade pesava menos de 3,950kg, e a outra metade pesava mais do que
3,950 kg.
92
UNIDADE 3
A medida de tendência central mais conhecida e mais utilizada é a média, mas não é sempre
que ela é a mais apropriada para representar os dados, às vezes, a mediana é mais adequada
para representar um conjunto de dados. Isso ocorre sempre que a variabilidade dos dados
for alta, pois a média é afetada por valores extremos, e a mediana não, ela, apenas, leva em
consideração os valores centrais.
Fonte: Parenti, Silva e Silveira (2017).
Outras medidas que você pode utilizar são as separatrizes que dividirão as séries em partes iguais, e as
principais são: mediana (que já estudamos), quartis, decis e percentis. Os quartis dividem uma série
de dados em quatro partes iguais, assim, temos: 1º quartil, 2º quartil e 3º quartil (CRESPO, 2009). Esta
representação encontra-se na Figura 4, a seguir.
Q1 Q2 Q3
(mediana)
Figura 4 - Representação dos quartis / Fonte: o autor.
Descrição da Imagem: a figura traz a representação dos quartis, onde se encontram Três Quartis. De cima para bai-
xo, vem o primeiro Quartil (Q1), que apresenta 25% dos dados menores e 75% maiores; logo abaixo, vem o segundo
Quartil (Q2), onde temos 50% dos dados menores e 50% maiores, é a medida que coincide com a mediana, e no último
e terceiro Quartil (Q3) temos 75% dos dados menores e 25% maiores.
93
UNICESUMAR
Assim, como pode observar na Figura 5, segundo Crespo (2009) temos os três quartis:
Descrição da Imagem: a figura apresenta os Três Quartis. De cima para baixo, vem o primeiro Quartil (Q1), que apre-
senta 25% dos dados menores e 75% maiores; logo abaixo, vem o segundo Quartil (Q2), onde temos 50% dos dados
menores e 50% maiores, é a medida que coincide com a mediana, e no último e terceiro Quartil (Q3), temos 75% dos
dados menores e 25% maiores.
Para calcular, é bem simples, basta organizar a série de dados em rol, e utilizar as equações a seguir:
Por exemplo, calcularemos Q1, Q2 e Q3 para um grupo que tem idades de oito pessoas:
94
UNIDADE 3
P 0, 25.(n 1)
P 0, 25.(8 1)
P 0, 25.9
P 2, 25
(38 40)
Q1
2
78
Q1
2
Q1 39
b) 2º Quartil (Q2):
P 0, 50.(n 1)
P 0, 50.(8 1)
P 0, 50.9
P 4, 5
(49 54)
Q2
2
103
Q1
2
Q1 51, 5
c) 3º Quartil (Q3):
P 0, 75.(n 1)
P 0, 75.(8 1)
P 0, 75.9
P 6, 75
95
UNICESUMAR
(57 64)
Q3
2
121
Q1
2
Q1 60, 5
Outra medida separatriz é o decil. Este divide uma série em dez partes iguais (CRESPO, 2009). As
equações para calcular estão apresentadas a seguir:
Por exemplo: calcular D3 e D4 e para um grupo que tem idades de oito pessoas:
P 0, 30.(8 1)
P 0, 30.(9)
P 2, 7
O 3º decil será o elemento que ocupa a posição 2,7, arredondando para 3º, assim, nosso terceiro decil
é igual a 40.
96
UNIDADE 3
4º Quartil (Q4):
P 0, 40.(n 1)
P 0, 40.(8 1)
P 0, 40.(9)
P 3, 6
O 4º decil será o elemento que ocupa a posição 3,6, arredondando para 4º, assim, nosso quarto decil é
igual a 49. Como percentil, temos como definição: os noventa e nove valores que separarão uma série
de dados em cem partes iguais (CRESPO, 2009). Pode ser calculado por meio das equações a seguir:
Por exemplo: calcular P50 e P75 e para um grupo que tem idades de oito pessoas:
P 0, 50.(n 1)
P 0, 50.(n 1)
P 0, 50.(8 1)
P 0, 50.(9)
P 4, 5
Portanto, o P50 é igual ao elemento que está na 4,5ª posição, portanto uma média simples entre 49 e 54:
97
UNICESUMAR
Vejamos outro exemplo. Seja a estatura (em cm) observada em duas amostras de adolescentes saudáveis,
denotaremos essas amostras por A e B. As estaturas dos adolescentes da amostra A são:
98
UNIDADE 3
Ao calcular a média da amostra A e B, ambas são 158 cm. As medianas de ambas as amostras (A e
B) são iguais a 158,5. Assim, as amostras A e B possuem médias e medianas idênticas. Mas o fato de
as amostras A e B possuírem medidas de posição iguais (média e mediana) permite-nos afirmar que
adolescentes das amostras A e B são semelhantes em relação à estatura?
Vejamos a Figura 6 que apresenta o grupo A e B.
Descrição da Imagem: a figura faz a representação do Grupo A e B. Nestas duas imagens, apresenta-se o grupo A
com valores distribuídos na reta em: 149 156 157 158 159 160 161 164, e a média representando 158; no grupo
A, a figura apresenta os pontos (dados) mais próximos da média; já o grupo B com valores distribuídos na reta em:
132 138 152 157 160 171 176 178, no grupo B, a figura traz os pontos mais distantes, ou seja, mais dispersos
da média, que é igual a 158.
Na Figura 6, podemos observar as dispersões destas observações. Percebemos que, embora as medidas
de locação sejam iguais, as amostras têm diferença quanto à dispersão dos dados. Na amostra A, as
observações possuem uma dispersão menor em relação à média de 158 cm, já na amostra B, as obser-
vações encontram-se mais dispersas em relação a mesma média amostral. Se dissermos somente que a
média das estaturas é de 158 cm, estaremos dizendo que nossas observações amostrais flutuam em torno
de 158 cm, mas não temos informação do tamanho da dispersão dos dados em relação a essa média.
Com isso, podemos evidenciar que as medidas de posição (média, moda e mediana), muitas vezes,
dão um resumo incompleto do comportamento de nossos dados uma vez que elas não nos dizem
nada a respeito da dispersão dos dados. Assim, torna-se tão importante a apresentação de medidas de
variabilidade dos dados.
99
UNICESUMAR
Vamos conhecer estas medidas de dispersão? Iniciamos pela Amplitude total, de acordo com Mar-
tinez (2015), a amplitude é dada pela distância entre o maior valor do conjunto de dados pelo menor
valor do conjunto de dados. Assim, a amplitude total só leva em consideração os extremos, não chega
a comparar os valores da distribuição com a média destes dados. É calculada pela equação a seguir:
AT Xmáx Xmín
Em que:
AT = Amplitude total
Xmáx = Maior valor do conjunto de dados
Xmín = Menor valor do conjunto de dados
Por exemplo, temos oito pessoas cujas idades são apresentadas a seguir:
A pessoa mais velha tem 64 anos, e a mais nova, 33 anos. A amplitude amostral é, portanto:
AT Xmáx Xmín
AT 64 33
AT 31
Podemos interpretar a AT como sendo a maior diferença que é possível encontrar entre duas quaisquer
observações de nossa amostra (MARTINEZ, 2015). Assim, a AT deve ser utilizada com certa cautela
para descrever a amplitude de nossos dados, dado que ela é, fortemente, influenciada por valores atí-
picos, sendo não recomendado seu uso sozinha para interpretação de variabilidade dos dados.
Outra medida de dispersão é a variância, calculada com todos os dados da série e comparada
cada um deles com a média. A variância mede a distância de cada um dos valores em relação à média
(MARTINEZ, 2015). Por uma questão matemática, precisamos elevar ao quadrado cada uma dessas
distâncias para podermos eliminar o sinal. Depois disso, fazemos a média dos quadrados destas dife-
renças. Lembre-se de que não teremos variância negativa, certo?
Caso a variância esteja sendo calculada para os dados de uma população, representaremos este
valor pela letra grega sigma ao quadrado σ2. Em vez de dividirmos por n-1, dividimos o somatório
por N, sendo que n é o número de elementos da amostra, e N é o número de elementos da população.
A variância populacional e amostral é calculada por:
a) Variância Populacional
σ 2
( X i µ )2
N
100
UNIDADE 3
Em que:
s 2 = Variância Populacional
X i = Cada valor/elemento
µ = média populacional
N = Número de elementos
Σ = Somatória
b) Variância Amostral
S 2
( X i X )2
n 1
Em que:
S 2 = Variância Amostral
X i = Cada valor/elemento
X = média amostral
n −1 = Número de elementos (menos 1)
Σ = Somatória
Como você pode observar, a única diferença na prática do cálculo da variância populacional e amostral
é que, na variância amostral, tiraremos um elemento na hora de fazer a divisão. É válido lembrar que,
na maioria das situações, utilizamos amostras, por questão de custo, da forma de coletar, entre outros.
Entenderá na prática.
Determinaremos a variância amostral. Lembrando que precisaremos da média para calcular a variância.
a) A média amostral
X
Xi
n
38 40 49 67 33 57 54 64
X
8
402
X 50, 25
8
101
UNICESUMAR
Agora que relembramos a média, calcularemos a variância amostral, substituindo os valores na equação:
S2
( X i X )2
n 1
(38 50, 25)2 (40 50, 25)2 (49 50, 25)2 (67 50, 25)2 (33 50,225)2 (57 50, 25)2 (54 50, 25)2 (64 50, 25)2
S2
8 1
(12, 25)2 (10, 25)2 (1, 25)2 (16, 75)2 (17, 25)2 (6, 75)2 (3, 75)2 (13,775)2
S2
7
(150, 06 ) (105, 06 ) (1, 56 ) (280, 56 ) (297 , 56) (45, 56) (14, 06) (189, 06)
S2
7
2 1.083, 48
S
7
S 2 154, 78
Como você pode observar, a variância calcula a soma dos quadrados das distâncias em relação à média.
Como elevamos todos os termos ao quadrado, a nossa unidade de medida também fica alterada. Se,
por exemplo, estivermos calculando a variância da altura de alunos do curso de Ciências Biológicas, e a
medida está em cm, todos os elementos determinados estarão em cm2. Sendo assim, nós não podemos
comparar a variância, diretamente, com a média ou com outras medidas, pois precisaremos extrair a
raiz da variância, e a isso denominamos desvio padrão.
Como desvio padrão é a raiz quadrada da variância, calculamos pela equação a seguir:
a) Desvio padrão populacional:
s = s2
Em que:
s = desvio padrão Populacional
s 2 = variância populacional
S = S2
Em que:
S = desvio padrão amostral
S2= variância amostral
102
UNIDADE 3
S = S2
S = 154, 78
S = 12, 44
A variabilidade entre as idades do grupo analisado é de 12,44 anos.
Se quisermos comparar a variabilidade de duas ou mais amostras (ou populações), para Parenti,
Silva e Silveira (2017), podemos fazer esta comparação somente com o uso do desvio padrão. Mas
podemos comparar utilizando o coeficiente de variação, que nos dará em percentual a variabilidade
dos dados, determinado por:
a) Coeficiente de variação (populacional):
σ
CV (%) .100
µ
Em que:
CV% = Coeficiente de variação
σ = desvio padrão populacional
µ = média populacional
S
CV (%) .100
X
CV% = Coeficiente de variação
S = desvio padrão amostral
X = média amostral
S
CV (%) .100
X
12, 44
CV (%) .100
50, 25
CV (%) 0, 2475 .100
CV (%) 24, 75%
103
UNICESUMAR
S
CV (%) .100
X
1, 2
CV (%) .100
6, 5
CV (%) 0, 1846.100
CV (%) 18, 46%
S
CV (%) .100
X
2, 0
CV (%) .100
6, 8
CV (%) 0, 2941.100
CV (%) 29, 41%
104
UNIDADE 3
1. Calcular a média
2. Calcular a média
105
UNICESUMAR
Também podemos ter interesse em calcular: variância, desvio padrão, em dados que aparecem em
tabelas de frequências. Vejamos a seguir:
a) Cálculo das medidas de variabilidade em tabelas de frequências sem intervalo de classes:
as notas de 30 alunos do curso de Ciências Biológicas estão apresentadas na distribuição de
frequências a seguir:
Tabela 14 - Notas de 30 alunos do Curso de Ciências Biológicas
O primeiro passo é sabermos a média, antes de calcular a variância amostral, para isso, temos:
X
X i . fi
n
(7.8) (8.12) (9.6) (10.4)
X
30
56 96 54 40
X
30
246
X
30
X 8, 2
S2
( X i X )2 . fi
n 1
Em que:
S 2 = Variância Amostral
X i = Cada valor/elemento
X = média amostral
n −1 = Número de elementos (menos 1)
Σ = Somatória
Fi = frequência
106
UNIDADE 3
Para facilitar nosso cálculo, abriremos uma coluna a mais em nossa distribuição de frequência e inse-
riremos o numerador da equação da variância, conforme Tabela 15.
Tabela 15 - Notas de 30 alunos do Curso de Ciências Biológicas
2
Com os dados da somatória de ( X i − X ) . fi , substituiremos na equação:
S 2
( X i X )2 . fi
n 1
Agora que temos o resultado e substituindo o valor “28,3” encontrado na tabela, por meio da coluna
( X i − X )2 . fi , temos:
28, 3
S2
30 1
28, 3
S2
29
S 2 0, 9759
Com o resultado da variância, conseguimos calcular o desvio padrão:
S = S2
S = 0, 9759
S = 0, 9878
Podemos calcular o coeficiente de variação:
S
CV (%) .100
X
107
UNICESUMAR
0, 9878
CV (%) .100
8, 2
CV (%) 0, 1205.100
CV (%) 12, 05%
108
UNIDADE 3
Tabela 17 - Distribuição de frequências referente às notas de alunos do Curso de Ciências Biológicas (com intervalo de classes)
X
X i . fi
n
203, 4
X=
30
X = 6, 78
Arredondando, temos que a média da turma de Ciências Biológicas é de 6,8. Com o resultado da mé-
dia, vamos reescrever a tabela, para determinar a variância amostral, para utilizar a equação a seguir:
S2
( X i X )2 . fi
n 1
Com a tabela ajustada, temos:
Tabela 18 - Distribuição de frequências referente às notas de alunos do curso de Ciências Biológicas (com intervalo de classes)
109
UNICESUMAR
S2
( X i X )2 . fi
n 1
Substituindo, na equação, pelos valores encontrados na Tabela 18, temos:
99, 58
S2
30 1
99, 58
S2
29
S 2 34, 34
Logo após, determinaremos o desvio padrão:
S = S2
S = 34, 34
S = 5, 86
Agora, com o desvio padrão, podemos calcular o CV(%):
S
CV (%) .100
X
5, 86
CV (%) .100
6, 8
CV (%) 0, 8671.100
CV (%) 86, 71%
No caso desta turma, com um coeficiente de variação de 86,71%, podemos concluir que há uma dis-
persão muito grande das notas, e que a média pode não ser a medida ideal para interpretar estes dados.
Mas quando olhamos para os dados com mais cautela, temos alunos que tiraram 3,0; 4,0; 5,0; 10. E o
que isso quer dizer? Como conclusão, temos que essa turma apresenta uma grande dispersão no quesito
nota, porque o resultado encontrado de 86,71% é superior a 50%. Isso quer dizer que existem alunos
que estão indo bem na disciplina, mas também existem alunos que não estão aprendendo.
Assim, podemos refletir: com tanta dispersão, o que posso melhorar para que todos tenham um
aprendizado? As medidas de dispersão podem ajudar neste caminho. Agora que temos os dados em
mãos, podemos trabalhar para melhorar a maneira de ensinar nesta turma.
110
UNIDADE 3
Caro(a) estudante, finalizamos esta unidade compreendendo o processo pelo qual as medidas de posi-
ção, as separatrizes e a dispersão podem ajudar a trabalhar melhor com os dados e auxiliar no processo
decisório. Como educadores e profissionais da saúde, temos que ter a consciência da importância da
Bioestatística, pois, como vimos, ela traz a preocupação de entender como os dados podem trazer
indicativos para um professor em sala de aula.
A partir das medidas de posição, você conseguirá trabalhar com seus dados, entendendo o com-
portamento dos mesmos, e com as medidas de dispersão, como você percebeu, conseguimos entender
se a média é representativa, ou não, para o conjunto de dados. Dentro da Bioestatística, você poderá
observar os resultados de sua pesquisa sendo uma ferramenta, essencial para a tomada de decisões, e
que estará presente no seu futuro profissional.
111
1. Um profissional de Ciências Biológicas que atua em um laboratório fará uma compra de
um componente específico de para uma análise laboratorial, para isso, fez uma pesquisa
com dois fornecedores diferentes. Para comparar o nível de impurezas presentes nas
compras feitas aos dois fornecedores, o biólogo solicitou a medição de porcentagem
de impurezas presentes em cada um dos grupos, obtendo o que segue resultado:
Para saber qual dos fornecedores traz mais impurezas, o biólogo utilizou uma medida
que estudou na disciplina de Bioestatística, o coeficiente de variação. Os resultados
do C.V. (%) foram: 37% para o fornecedor A, e 30% para o fornecedor B. Mediante os
resultados obtidos, analise as afirmativas a seguir.
I) O fornecedor A apresenta uma maior dispersão, por isso, terá a preferência de
compra pelo biólogo.
II) O fornecedor B apresenta uma menor dispersão de impureza, por isso, é mais uni-
forme às impurezas.
III) Por meio do coeficiente de variação, conseguimos medir qual dos fornecedores traz
uma menor impureza, e isso pode influenciar na aquisição do material.
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.
2. A tabela a seguir apresenta o tempo de duração (em dias) para se realizar análises de
água. Os laboratórios estão credenciados em uma cidade no estado do Paraná.
112
Considerando esta informação, a mediana é igual a:
a) 1,2.
b) 3,2.
c) 4,9.
d) 5,5.
e) 6,7
3. Um Biólogo fez pesquisa em site de uma revista e perguntou sobre as áreas da biologia
de que os profissionais mais gostavam. Os participantes eram internautas e responde-
ram, voluntariamente, a pergunta. As respostas estão apresentadas na Tabela a seguir.
113
Diante destas informações, a média dessa turma foi igual a:
a) 5,9.
b) 6,7.
c) 7,5.
d) 7,9.
e) 8,3.
Fonte: o autor.
114
115
MEU ESPAÇO
MEU ESPAÇO
116
4
Correlação Regressão
Linear e Inferência
Estatística
Me. Renata Cristina Souza Chatalov
Ao iniciar a leitura deste material, você pode já se perguntar: porque estudar correlação e regressão
linear? Terei que fazer estimações de y a partir de x conhecido? Para que fazer um teste de hipóteses?
Quando você estuda um comportamento conhecido e pode fazer estimações ou testar uma amostra,
estará, certamente, utilizando uma técnica importante que será trabalhada aqui em Bioestatística.
A correlação e a regressão linear ajudarão você a mensurar a força da relação entre X e Y, e a reta de
regressão linear, você poderá fazer estimativas para Y a partir de X conhecido e,
com isso, poderá trabalhar dentro de um modelo matemático conhecido, que
ajudará em sua pesquisa. Já a inferência estatística trata-se de um conjunto de
técnicas que tem por objetivo principal analisar uma população, por meio de
evidências de uma amostra, para isso, temos: teste de hipóteses e intervalo de con-
fiança, que estudaremos. Convido a fazer a leitura do artigo, acessando o qrcode:
Assim, convido você a fazer um levantamento de artigos, reportagens,
que tragam situações envolvendo correlação linear, regressão linear e inferência estatística. Faça um
compilado e comece a identificar que os testes de hipóteses poderão ajudá-lo na tomada de decisões.
E aí, conseguiu fazer o experimento sugerido? Anote todas suas primeiras impressões até o momento,
escreva os resultados de sua pesquisa aqui no Diário de Bordo. Este espaço é seu!
DIÁRIO DE BORDO
118
UNIDADE 4
Agora, partindo para a conceitualização da última unidade, avaliaremos se há uma associação entre
duas variáveis com características quantitativas, que é objetivo de inúmeros estudos em ciências bio-
lógicas e/ou da saúde. Por exemplo: um biomédico pode ter interesse se há relação entre a quantidade
de chumbo em medida na água e no volume de efluentes despejados em certo rio; um profissional
da área da saúde pode querer saber se existe relação entre a pressão arterial e idade das pessoas; um
professor pode querer saber a relação entre peso e altura, e assim por diante.
Quando existe a necessidade de analisar a relação entre essas duas variáveis, chamamos de
correlação.
Vejamos um exemplo: um professor de enfermagem deseja saber se existe correlação entre o tempo
dedicado ao estudo e o desempenho dos alunos na disciplina Bioestatística. Assim, ele selecionou oito
alunos, assim, podemos observar o número de horas (x) e nota obtida na prova de Bioestatística (y)
para cada aluno(a).
119
UNICESUMAR
Se fosse perguntado a você, neste momento: existe uma relação entre as horas de estudo e nota da
prova? Ao observar a Tabela 1, você conseguiria responder com facilidade? Provavelmente, não. Por
quê? Fica difícil concluir algo somente observando a tabela, pois temos grande variação nos dados. Por
isso, o primeiro passo é tentar organizar esses dados em um gráfico para visualizar melhor a relação
entre as variáveis X e Y.
Para analisarmos se há correlação entre as variáveis X e Y, inicialmente, os dados são representados
em um gráfico cartesiano de pontos, que chamamos de diagrama de dispersão. Cada ponto do gráfico
corresponde a um aluno e é marcado segundo seu valor para X e para Y (Figura 1).
Figura 1 - Gráfico de dispersão sobre a relação entre horas de estudo (X) e nota na disciplina de bioestatística (y) / Fonte: o autor.
Descrição da Imagem: a figura mostra um gráfico de dispersão em que o eixo (X) está na horizontal, representando
as horas de estudo dos alunos; no eixo Y, que está na vertical, temos as notas distribuídas dos oitos alunos.
Analisando a Figura 1, podemos observar que os alunos que se dedicaram estudando por mais horas
tiveram um desempenho melhor, e os que dedicaram menos horas ao estudo, a ter um desempenho
pior na prova. Entretanto podemos observar que temos algumas exceções, como o aluno “C” que se
dedicou horas de estudo e sua nota foi 4. Isso significa que, embora pareça existir uma correlação entre
estas duas variáveis, ela não é perfeita.
Para sabermos com mais precisão, existe outra maneira, que é avaliar a correlação e usar um coe-
ficiente, que tem a vantagem de ser um valor numérico.
120
UNIDADE 4
“
O coeficiente de correlação produto-momento (r) é uma medida da intensidade de
associação existente entre duas variáveis quantitativas, e sua fórmula de cálculo foi
proposta por Karl Pearson em 1896. Por essa razão, é também denominado coeficiente
de correlação de Pearson. Por ter sido o primeiro a ser proposto (vários outros foram
criados depois), muitas vezes r recebe simplesmente nome de coeficiente de correlação
(MARTINEZ, 2015, p. 85).
O coeficiente de correlação pode variar entre -1 e +1. Quando temos valores negativos de r, temos cor-
relação do tipo inversa, ou seja, à medida que X aumenta Y diminui. Já quando temos valores positivos
para r ocorrem quando a correlação é direta, ou seja, X e Y variam no mesmo sentido. Por exemplo,
temos que as taxas sanguíneas de insulina e glicose apresentam correlação negativa; enquanto a taxa
do hormônio glucagônio tem correlação positiva com a glicemia (MARTINEZ, 2015).
É importante salientar que, quando temos uma correlação linear negativa, não significa que é uma
correlação ruim, apenas o sentido do gráfico será decrescente. O valor máximo (tanto r = +1 como r
= -1) é obtido quando todos os pontos do diagrama estão em uma linha reta inclinada. Quando temos
uma correlação linear igual a r +1, significa que temos uma correlação linear perfeita e positiva, como
você pode observar na Figura 2.
Descrição da Imagem: na figura, temos um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y está
na vertical, ao observar a dispersão, pode-se visualizar uma reta no sentido crescente, porque r = +1.
121
UNICESUMAR
Quando temos uma correlação linear igual r -1, significa que temos uma correlação linear perfeita e
negativa, como você pode observar na Figura 3.
Descrição da Imagem: na figura, temos um gráfico de dispersão em que o eixo (X) está na horizontal e o eixo Y está
na vertical, ao observar a dispersão, pode-se visualizar uma reta no sentido decrescente, à medida que x cresce y
decresce, pois r = -1.
Por outro lado, quando não existe correlação entre X e Y, os pontos se distribuem de maneira que não
temos uma relação, podendo ser em formato de nuvens circulares ou formatos não definidos, não
tendo uma tendência crescente ou decrescente (Figura 4).
Descrição da Imagem: na figura, há um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y está na
vertical; ao observar a dispersão, podemos observar que a figura não tem uma reta crescente nem decrescente, pois
o r é igual a 0,09.
122
UNIDADE 4
Descrição da Imagem: na figura, há um gráfico de dispersão em que o eixo (X) está na horizontal e o eixo Y está na
vertical, ao observar a dispersão, temos que os dados estão dispersos, mas tem uma tendência crescente, pois o r é
igual a 0,65.
O que significa, então, esses valores de r? Observe a Figura 6 a seguir, que traz uma correlação igual a r = 0,56.
Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y
está na vertical; ao observar a dispersão, temos que os dados estão dispersos, mas tem uma leve tendência crescente,
pois o r é igual a 0,55.
123
UNICESUMAR
O que significa, então, o valor 0,55 encontrado? Assim, o coeficiente de correlação nunca será maior
que 1 nem menor que –1. Dessa maneira, os valores de r iguais a zero evidenciam que não há asso-
ciação entre as variáveis X e Y. Enquanto valores próximos a zero (sejam eles negativos ou positivos)
indicam uma correlação muito fraca entre as variáveis, os valores de r próximos a –1 ou a 1 indicam
associações fortes entre X e Y. Portanto, o valor r = 0,588 indica uma correlação fraca ou forte? Apesar
de uma boa resposta a esta pergunta subjetiva, para nos embasar, temos autores, livros, textos, artigos
científicos para nos ajudar a interpretar a magnitude de um coeficiente de correlação.
Segundo Zou et al. (2003) a proposta para interpretação do coeficiente de correlação linear (r)
pode ser observada no Quadro 1.
Quadro 1 - Interpretação do coeficiente de correlação linear
Zou et al. (2003) interpretam o sinal do coeficiente de correlação como a direção da associação. Os
coeficientes de correlação linear que são maiores do que zero apresentam correlações positivas (quanto
maior X, maior Y), e coeficientes menores que zero indicam correlações negativas (quanto maior X,
menor Y). Já a correlação igual a zero indica que não existe uma correlação linear.
É importante salientar que a interpretação de r pode variar de acordo com a experiência de au-
tores, principalmente as intermediárias (-0,8, 0,5, -0,2, -0,3 e outros), o que não muda é que +1 e -1
são correlações perfeitas e zero não há correlação linear. Para facilitar nosso entendimento, analise na
Figura 7 que quanto mais próximo aos extremos (-1 e +1) mais forte é a correlação, e, à medida que se
aproxima de zero, a correlação vai ficando mais fraca.
Descrição da Imagem: a figura apresenta uma reta que tem nove barras (na vertical), iniciando o traço em -1, -8, -0,5,
-,02, 0, 0,2, 0,5 0,8 e +1.
124
UNIDADE 4
Então, podemos concluir que uma correlação igual a -0,90 é mais forte do que uma
correlação igual a 0,40? Sim, porque -0,90 está mais próximo de -1, e 0,40 está mais
próximo de zero. Mas como encontramos o coeficiente de correlação de Pearson?
É representada pela letra “r” e determinado pela seguinte equação:
x. y n
( x).( y )
r
2 ( x) ( y )2
2
x . y2
n n
Em que:
r = Coeficiente de correlação de Pearson (a ser encontrado)
∑x = valores da somatória da variável x
∑y = valores da somatória da variável y
∑x.y = valores da somatória da variável x multiplicado pela variável y
∑x2 = valores da somatória da variável x ao quadrado
∑y2 = valores da somatória da variável y ao quadrado
Agora que temos a equação que determina o coeficiente de Pearson, vimos que se
trata de uma equação bem complexa, mas fique tranquilo(a), querido(a) aluno(a),
resolveremos juntos o passo a passo. Vejamos um exemplo: um professor de ciências
biológicas deseja saber se existe correlação entre o tempo dedicado ao estudo e o
desempenho dos alunos na disciplina de Bioestatística. Assim, ele selecionou oito
alunos, assim, podemos observar o número de horas (X) e a nota obtida na prova
de Bioestatística (Y) para cada aluno.
125
UNICESUMAR
Para facilitar nosso cálculo, você deve ter percebido que vamos precisar elevar todos os valores de X
ao quadrado, todos os valores de Y ao quadrado e somar tudo isso, então, vamos reescrever a tabela,
com essas colunas. Observe a seguir (Tabela 3):
Tabela 3 - Relação entre as horas de estudo e nota na disciplina de Bioestatística
Agora que temos o total e já determinamos os valores que precisamos, faremos a substituição na equa-
ção para determinar o coeficiente de Pearson.
x. y n
( x).( y )
r
2 ( x) 2 ( y )
2 2
x . y
n n
126
UNIDADE 4
(44.54)
332 8
r
(44)2 (54)2
280
. 414
8 8
(2.376)
332 8
r
1.936 2.916
280 . 414
8 8
332 297
r
280 242. 414 364, 5
35
r
38. 49, 5
35
r
1.881
35
r
43, 37
r 0, 81
Portanto, existe uma correlação linear e forte entre as horas de estudo (x) e a nota na prova de B0ioes-
tatística (y) uma vez que o valor encontrado de r é igual a 0,81.
Você achou complicado utilizar esta equação? Ajudaremos com uma maneira simples, em que
você consegue tirar a prova real utilizando o Microsoft Excel®, mas lembre-se, agora você está
em processo de aprendizagem e, ao fazer cálculos passo a passo da forma algébrica, você estará
exercitando seu raciocínio lógico, isso ajudará você na tomada de decisões.
Utilizando o Microsoft Excel®, basta reescrever a tabela na planilha, vá em inserir função –
Estatística – Correl, onde abrirá para você a função = correl, em seguida, no item matriz um,
selecione todas as notas da variável X (sem cabeçalho e total), clique em matriz 2 e selecione
todas as notas da variável Y (sem cabeçalho e total).
127
UNICESUMAR
Quando falamos em relações lineares entre as variáveis X e Y, significa que, ao utilizarmos o coeficien-
te de correlação de Pearson, estamos nos referindo a uma situação em que uma variável é, direta ou
inversamente, proporcional a outra (CRESPO, 2009). Vimos em nosso exemplo, que quanto às horas
dedicadas a estudos tem uma relação forte com a nota da disciplina de Bioestatística. Portanto, é de
fundamental importância construir um gráfico de dispersão entre as variáveis antes de calcularmos
o coeficiente de correlação (que já fizemos anteriormente, na Figura 7), e, então, observarmos se é
realmente adequado utilizarmos essa medida de associação.
Figura 8 - Gráfico de dispersão sobre a relação entre horas de estudo (X) e nota na disciplina de Bioestatística (Y) / Fonte: o autor.
Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal representando
as horas de estudo dos alunos; no eixo Y, que está na vertical, temos as notas distribuídas dos oitos alunos.
Se a dispersão que é apresentada no gráfico permite visualizar uma reta imaginária passando pelos
pontos, entendemos que há a sugestão de uma relação linear (ainda que essa reta tenha uma inclina-
ção pequena).
Um erro comum entre as pessoas que estão aprendendo bioestatística é pensar que o coeficiente
de correlação serve para testar se há uma relação linear entre as variáveis X e Y. Quando usamos o
coeficiente de correlação, já partimos do princípio de que a possível relação entre as variáveis se dá de
forma linear, por isso, a importância do gráfico de dispersão, assim, o coeficiente de Pearson serve para
medir o tamanho dessa associação linear, e não para verificar se há linearidade na relação entre X e Y.
128
UNIDADE 4
Também podemos ter situações em que temos valores atípicos, ou seja, em que podemos
chamar de fora da linearidade. O que fazemos com esses valores? Podemos excluir, ajustar?
A resposta a esta pergunta não é simples. Em nenhuma situação podemos eliminar observa-
ções de nosso banco de dados com o propósito de deixar os resultados mais interessantes
ou de destacar possíveis associações entre as variáveis que valorizariam nosso estudo, prin-
cipalmente nas áreas biológica e da saúde, que podem trazer dados que podem orientar o
direcionamento de uma pesquisa, além de não ser uma conduta ética por parte do pesquisador.
Para isso, é importante que você vá novamente aos dados coletados, faça comparação com os
dados da pesquisa de campo, verifique os questionários, os prontuários, a fonte original dos
dados para, então, verificar a possibilidade de erros de digitação ou anotação. Ainda que não
fosse esse o erro encontrado, não é correto eliminá-lo, arbitrariamente. É de suma importância
buscar outras informações sobre aquele dado para possa entender se realmente ele pertence
àquela população de interesse do estudo.
Depois que calculamos a correlação linear, podemos ter o interesse em determinar a Regressão Linear.
A análise de regressão explicita em uma equação matemática a forma da relação entre uma variável
chamada dependente e uma ou mais variáveis chamadas independentes, ou seja, quando temos o
interesse, estudo da regressão aplica-se àquelas situações em que há razões para supor uma relação de
causa-efeito entre duas variáveis quantitativas e se deseja expressar, matematicamente, essa relação.
“
O termo regressão deve-se a Francis Galton, que publicou, em 1886, um artigo no qual
tentou explicar por que pais de alta estatura tinham filhos com estatura em média mais
baixa do que a deles e pais de baixa estatura tinham filhos em média mais altos. Esse
fenômeno foi chamado de regressão à média, termo que, apesar de inadequado para
expressar a dependência entre duas variáveis quantitativas, acabou sendo incorporado
pelo uso à linguagem estatística (MARTINEZ, 2015, p. 103).
Para entender melhor, em nosso estudo, o professor de Enfermagem quis saber se há relação entre o
tempo de estudo e nota na prova da disciplina Bioestatística. A variável dependente é a nota da prova,
pois, supostamente, recebe o efeito do tempo dedicado aos estudos. Por sua vez, o tempo de estudo (X)
é a variável independente, dado que, supostamente, ela exerce algum efeito sobre a variável dependente.
Sendo assim, os objetivos da regressão linear são, segundo Martinez (2015):
1. Avaliar uma possível dependência de y em relação a x.
2. Expressar matematicamente está relação por meio de uma equação.
129
UNICESUMAR
Vamos considerar que a variável independente Y de interesse é quantitativa contínua. O modelo de regressão
simples envolve uma única variável independente X. A equação para determinar a regressão linear é dada por:
y a b.x
Em que:
ŷ = valor predito da variável resposta
a = constante de regressão que representa o intercepto entre a linha de regressão e o eixo y
b = coeficiente linear de regressão da variável resposta y em função da variável explicativa x incli-
nação da reta; taxa de mudança na variável y por unidade de mudança na variável x
x = valor da variável explicativa (variável independente)
O coeficiente de regressão “b” fornece uma estimativa da variação esperada de y a partir da variação de
uma unidade em x (BARBETTA et al., 2014). A partir desta equação, é possível encontrar os valores
preditos para y e a reta de regressão. Vimos, anteriormente, que a relação entre x e y pode ser mostrada
por um diagrama de dispersão.
Para calcular a regressão linear, vamos determinar “a” e “b”. Assim, utilizaremos as equações:
x. y n
( x).( y )
b
2 ( x)
2
x
n
Em que:
∑x = valores da somatória da variável x
∑y = valores da somatória da variável y
∑x.y = valores da somatória da variável x multiplicado pela variável y
Para determinar “a”, utilizaremos a equação a seguir:
a Y b. X
Em que:
Y = média de Y
X = média de X
b = valor que é determinado por equação e encontrado valor de “b”.
Y
y
n
130
UNIDADE 4
Em que:
y = somatória de todos os valores de y
n = número total de elementos
X
x
n
Em que:
x = somatória de todos os valores de x
n = número total de elementos
Agora que já sabemos como determinar a correlação linear, relembraremos nosso exemplo: um professor
de Enfermagem deseja saber se existe correlação entre o tempo dedicado ao estudo e o desempenho
dos alunos na disciplina Bioestatística. Assim, ele selecionou oito alunos, assim, podemos observar o
número de horas (X) e a nota obtida na prova de Bioestatística (Y) para cada aluno (apresentaremos
a tabela a seguir, com as colunas necessárias para calcular a regressão linear).
Tabela 4 - Relação entre as horas de estudo e nota na disciplina de Bioestatística
( x).( y)
x. y
b n
( x )2
x2
n
131
UNICESUMAR
(44).(54)
332
b 8
(44)2
280
8
2.376
332
b 8
1.936
280
8
332 297
b
280 242
35
b
38
b 0, 92
Agora, determinaremos “a”, utilizando a equação a seguir:
a Y b. X
Y
y
n
54
Y =
8
Y = 6, 75
X
x
n
44
X=
8
X = 5, 5
a Y b. X
a 6, 75 0, 92.5, 5
a 6, 75 5, 06
a 1, 69
132
UNIDADE 4
y 1, 69 0, 92.x
Com a equação da reta, podemos substituir dois pontos quaisquer por X para traçar a reta. A Figura
9 apresenta-nos o gráfico de dispersão com a reta de regressão linear.
Figura 9 - Gráfico de dispersão e reta de regressão linear sobre a relação entre horas de estudo (x) e nota na disciplina de
bioestatística / Fonte: o autor.
Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal representando
as horas de estudo dos alunos; no eixo Y, que está na vertical; temos as notas distribuídas dos oitos alunos, na qual
temos a reta em sentido crescente representando a regressão linear.
Podemos observar como o valor de r encontrado, anteriormente, foi igual a 0,80, e o valor de “bx” é
positivo, nossa reta ajustada tem sentido crescente. Caso nosso valor de r fosse negativo, nossa reta
ajustada teria o sentido decrescente. Outro ponto importante em uma análise utilizando ferramentas
estatísticas é a inferência. Imagine que um profissional da saúde trabalha em um laboratório e está
conduzindo um estudo cujo objetivo é analisar se um novo medicamento pode ser capaz de trazer
bons resultados ao tratamento de determinada doença. Para realizar essa pesquisa, este profissional
selecionou uma amostra de 80 pessoas portadoras da doença, e estas foram divididas em dois grupos
com 40 pessoas cada. As pessoas do grupo A foram submetidas ao medicamento que está sendo avaliado,
as pessoas do grupo B, receberam um placebo. Os resultados estão apresentados na Tabela a seguir:
133
UNICESUMAR
Podemos observar que: 20 40 50% das pessoas que estão no grupo A, responderam ao trata-
mento que está sendo avaliado, já 10 40 25% das pessoas alocadas no grupo B responderam ao
tratamento com o medicamento sem o princípio ativo (placebo). Dessa maneira, a razão entre essas
porcentagens é 50%( grupoA) / 25%( grupoB ) = 2 , isto é, podemos concluir que entre as 80 pessoas
que tem a doença e estão participando do estudo, se utilizarem o medicamento (da pesquisa) tem o
dobro de chances de responder à doença quando comparados ao grupo B.
Agora, temos a contribuição da Bioestatística neste estudo: este resultado encontrado é válido para
portadoras da doença ou somente para as 80 pessoas que participaram do estudo?
Inicialmente, o resultado obtido descreve apenas as 80 pessoas que compuseram esta amostra. No entanto
nosso intuito é que os nossos resultados tragam valor para todas as pessoas que fazem parte da população
e que tenham essa doença, não importando se foram selecionados, ou não, para compor a amostra da
pesquisa. Para obtermos isso, fazemos uso da inferência estatística, ferramenta usada para extrapolar os
achados de nossa amostra para todos os indivíduos que fazem parte da população (MARTINEZ, 2015).
A Figura 10 apresenta-nos o processo pelo qual obtemos conclusões sobre uma população (N) a
partir de dados obtidos, por meio de uma amostra (n).
Descrição da Imagem: a figura apresenta um círculo grande com bolinhas dentro dele e com a letra N (maiúscula)
representando a população. Dentro desse círculo grande, temos um círculo menor, que representa a parte que será
analisada (amostra), seguida de uma seta, e essa bolinha menor é evidenciada com a letra n (minúscula).
134
UNIDADE 4
Outro conceito importante que precisamos estudar aqui na inferência estatística é o Parâmetro, essen-
cial para entendermos a inferência estatística. Trata-se de valor calculado a partir de uma população,
ou seja, usando todos os elementos (MARTINEZ, 2015). Por exemplo: um professor de Farmácia
quer estudar a altura (em cm) das crianças que estão cursando a 1ª série em determinado município.
A população inclui todas as crianças deste município. A média da altura encontrada (em cm), que é
calculada a partir da análise do peso de todas as crianças da população é um parâmetro.
Pedimos que tome cuidado para não confundir Parâmetro com Variável. O parâmetro, como já
vimos, é uma característica numérica de uma população, já uma variável é uma característica dos in-
divíduos que estamos pesquisamos. Segundo Parenti, Silva e Silveira (2017), o parâmetro é um número
fixo, já os valores de uma variável são passíveis de variação de um indivíduo a outro. Por exemplo:
entre os alunos estudados, a idade e o prato preferido são variáveis, já a média da altura de todos os
alunos de determinada cidade é um parâmetro.
Nem sempre, na prática, conseguiremos trabalhar com parâmetros, trabalharemos com amostra.
Assim, a média amostral, que é resultante de uma amostra de tamanho n, é uma estimativa da média
populacional. Dessa maneira, as estimativas são quantidades calculadas da amostra com a finalidade
de representar um parâmetro de interesse (MARTINEZ, 2015).
A diferença entre uma média populacional (parâmetro) da média amostral (estimativa) é denotada por:
a) média populacional: representado pela letra grega µ.
b) média amostral: representado por “xis barra” X .
“
Quando conduzimos uma pesquisa com base em uma amostra de n indivíduos, po-
demos calcular o valor de x com base nas observações amostrais. Mas, obviamente,
não podemos calcular o valor de n, dado que não temos à nossa disposição todos os
elementos da população. Assim, entendemos que o parâmetro é um número fixo, mas
geralmente não conhecemos seu valor (MARTINEZ, 2015, p. 166).
135
UNICESUMAR
O intervalo de confiança para a média (µ) de uma população é construído em torno da estimativa
pontual X .
Para construir este intervalo, fixamos uma probabilidade “ 1 – α” de que o intervalo construído
contenha o parâmetro populacional. Desta forma α será a probabilidade de que o intervalo obtido
não contenha o valor do parâmetro, isto é, α será a probabilidade de erro. Sabendo-se que a média da
amostra apresenta uma distribuição normal (média µ e desvio padrão σ/ ) se a população de onde
for extraída a amostra for normal (ou se a amostra for superior a 30 e retirada de qualquer população)
de média µ e de desvio padrão σ, podemos então utilizar a curva normal para estabelecer os limites
para o intervalo de confiança (BARBETTA, 2014).
Para entendermos melhor o intervalo de confiança, temos que entender que a margem de erro é
a sua peça chave, ou seja, no meio do intervalo de confiança é que fica a média amostral. Observe na
equação a seguir:
Limite inferior do intervalo de confianç Limite superior do intervalo de confianç
X
X ME X ME
A distância que temos entre a média e o limite do intervalo de confiança é exatamente igual à
margem de erro. É importante salientar que o nível de confiança deve ser selecionado, previamente,
pelo pesquisador, e que a média populacional fica dentro do intervalo de confiança.
Para calcular o limite superior XLS e inferior XLI do intervalo de confiança para nível de confiança
igual a (1 – α) usa-se a seguinte expressão oriunda da discussão sobre as áreas embaixo da curva normal
e a distribuição normal padronizada:
S
X LS X ME X Zc
n
S
X LI X ME X Z c
n
Em que:
X = média
Zc = Z crítico - valor a ser encontrado na Tabela de Curva Normal (Tabela Z)
S = desvio padrão
n = número de elementos da amostra
α = intervalo de confiança (ex.: 90%, 95%, 98%).
Você verá que é bem simples este cálculo, e temos duas situações:
1º caso: para σ conhecido ou amostra grande (n ≥ 30): para determinar, utilizaremos a equação a seguir:
s
X ± Zc.
n
136
UNIDADE 4
Em que:
X = média
Zc = “Z” crítico (encontrado na Tabela Z)
σ = desvio padrão
n = número de elementos da amostra.
Vejamos um exemplo: um professor fez uma pesquisa com 100 alunos, e a média de idade deste grupo
de alunos é de 24 anos. Sabendo-se que o desvio padrão é igual a quatro anos, determine o intervalo
de 95% de confiança para a média. Para a resolução, devemos entender que o que calcularemos nessa
s
equação é apenas: Zc. , pois a média que já é dada, nós somaremos e diminuiremos pelo intervalo
n
encontrado.
1º passo: encontrar o Zcrítico: com a tabela de distribuição normal reduzida (vista no nosso capítulo
4) é que encontraremos Zcrítico.
Temos 95% para encontrar o valor na curva, vamos:
(95 100) 0, 95
Só que esta tabela é reduzida, então, não encontraremos o valor de 0,95, para isso, vamos:
0, 95 2 0, 475
Descrição da Imagem: a figura apresenta, em forma de sino, na qual essa curva não toca o eixo, sendo dividida em
sua metade com pontilhados que indicam a média cuja área destacada é 0,4750.
2º passo: agora, vamos até a Tabela Z para encontrar o valor referente a 0,4750, mas, desta vez, nós
procuraremos os valores e acharemos Z. Veja a seguir:
137
UNICESUMAR
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4454 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4764 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
Fonte: Crespo (2009, p. 218).
Encontramos o valor de 1,96. Você poderá encontrar qualquer valor utilizando somente a tabela Z.
Agora que temos o Zcrítico, desvio padrão (dado no exercício) e número de elementos (também dado
no exercício), vamos resolver.
3º passo: resolver a equação (margem de erro):
138
UNIDADE 4
s
Zc.
n
4
1, 96.
100
4
1, 96.
10
1, 96.0, 4 = 0, 784
4º passo: agora que temos a margem de erro, determinamos o intervalo de confiança, somaremos com
a média o valor da margem de erro e diminuiremos a média pela margem de erro, utilizando:
s
X Zc.
n
24 0, 784 24, 784
24 0, 784 23, 216
ou
24 ± 0, 784
2º caso: Intervalo de confiança para a média (σ desconhecido): quando desejamos estimar a média
de uma população normal com variância desconhecida, temos duas situações:
a) Se n >30: utilizamos a distribuição normal com estimador s2 de σ2 (visto anteriormente).
b) Se n ≤ 30: utilizamos a distribuição t de Student.
Vejamos um exemplo: uma amostra de dez pessoas com as idades: 9, 8, 12, 7, 9, 6, 11, 6, 10 e 9, tem, em
média, 8,7, um desvio padrão 2 e foi extraída de uma população Normal. Construa um intervalo de
confiança para média ao nível de 95%.
Utilizando a equação do intervalo de confiança para t de Student, temos:
s
IC X tc.
n
Em que:
X = média
tcritíco= valor a ser encontrado na Tabela t de Student
S = desvio padrão
n = número de elementos da amostra
139
UNICESUMAR
Utilizaremos a Tabela t de Student em um teste bicaudal que podemos observar na Figura 12.
Descrição da Imagem: a figura apresenta uma curva em formato de sino, dividida em duas partes iguais, e as pontas
do eixo estão pintadas destacando-se pela cor cinza, com duas setas destacando esses eixos.
Para resolver nosso exercício, temos que encontrar nosso tcrítico, assim, temos:
• 95% é nosso intervalo de confiança.
• Como nossa área interessada para trabalhar com essa tabela são as caudas, devemos encontrar
esse valor.
• Se a área é 95%, para termos os 100%, faltam 5%, certo. São esses 5% que são divididos nas caudas.
Descrição da Imagem: a figura apresenta uma curva em formato de sino, divididas em duas partes iguais, e as pontas
do eixo estão pintadas destacando-se pela cor cinza, com duas setas destacando esses eixos, representando 2,5% em
cada eixo. O eixo do meio é igual a 95%.
Como você pode perceber, os 95% é o que temos em nosso exercício, e os 5% foram divididos nas duas
áreas do gráfico, representando 2,5% em cada cauda. Mas, para utilizar a tabela t Student, consideraremos
que 5% teste são bicaudal, e procuraremos esse valor na tabela. Apenas mais um detalhe, antes de ir à tabela,
é importante que você entenda que o grau de liberdade é igual a n – 1, portanto, temos 10 elementos, para
o grau de liberdade teremos: 10-1 = 9. Assim, buscaremos “9” quanto ao grau de liberdade.
Vamos procurar a linha 9 e a coluna 5% em nossa tabela T Student apresentada a seguir:
140
Tabela 7 - Tabela t de Student - Probabilidade para um teste bicaudal
G.
liber- 0,95 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001
dade
1 0,0787 0,1584 0,3249 0,5095 0,7265 1,0000 1,3764 1,9626 3,0777 6,3138 12,7062 31,8205 63,657 636,619
2 0,0708 0,1421 0,2887 0,4447 0,6172 0,8165 1,0607 1,3862 1,8856 2,9200 4,3027 6,9646 9,9248 31,5991
3 0,0681 0,1366 0,2767 0,4242 0,5844 0,7649 0,9785 1,2498 1,6377 2,3534 3,1824 4,5407 5,8409 12,9240
4 0,0667 0,1338 0,2707 0,4142 0,5686 0,7407 0,9410 1,1896 1,5332 2,1318 2,7764 3,7469 4,6041 8,6103
5 0,0659 0,1322 0,2672 0,4082 0,5594 0,7267 0,9195 1,1558 1,4759 2,0150 2,5706 3,3649 4,0321 6,8688
6 0,0654 0,1311 0,2648 0,4043 0,5534 0,7176 0,9057 1,1342 1,4398 1,9432 2,4469 3,1427 3,7074 5,9588
7 0,0650 0,1303 0,2632 0,4015 0,5491 0,7111 0,8960 1,1192 1,4149 1,8946 2,3646 2,9980 3,4995 5,4079
8 0,0647 0,1297 0,2619 0,3995 0,5459 0,7064 0,8889 1,1081 1,3968 1,8595 2,3060 2,8965 3,3554 5,0413
9 0,0645 0,1293 0,2610 0,3979 0,5435 0,7027 0,8834 1,0997 1,3830 1,8331 2,2622 2,8214 3,2498 4,7809
10 0,0643 0,1289 0,2602 0,3966 0,5415 0,6998 0,8791 1,0931 1,3722 1,8125 2,2281 2,7638 3,1693 4,5869
11 0,0642 0,1286 0,2596 0,3956 0,5399 0,6974 0,8755 1,0877 1,3634 1,7959 2,2010 2,7181 3,1058 4,4370
141
12 0,0640 0,1283 0,2590 0,3947 0,5386 0,6955 0,8726 1,0832 1,3562 1,7823 2,1788 2,6810 3,0545 4,3178
13 0,0639 0,1281 0,2586 0,3940 0,5375 0,6938 0,8702 1,0795 1,3502 1,7709 2,1604 2,6503 3,0123 4,2208
14 0,0638 0,1280 0,2582 0,3933 0,5366 0,6924 0,8681 1,0763 1,3450 1,7613 2,1448 2,6245 2,9768 4,1405
15 0,0638 0,1278 0,2579 0,3928 0,5357 0,6912 0,8662 1,0735 1,3406 1,7531 2,1314 2,6025 2,9467 4,0728
16 0,0637 0,1277 0,2576 0,3923 0,5350 0,6901 0,8647 1,0711 1,3368 1,7459 2,1199 2,5835 2,9208 4,0150
17 0,0636 0,1276 0,2573 0,3919 0,5344 0,6892 0,8633 1,0690 1,3334 1,7396 2,1098 2,5669 2,8982 3,9651
18 0,0636 0,1274 0,2571 0,3915 0,5338 0,6884 0,8620 1,0672 1,3304 1,7341 2,1009 2,5524 2,8784 3,9216
19 0,0635 0,1274 0,2569 0,3912 0,5333 0,6876 0,8610 1,0655 1,3277 1,7291 2,0930 2,5395 2,8609 3,8834
20 0,0635 0,1273 0,2567 0,3909 0,5329 0,6870 0,8600 1,0640 1,3253 1,7247 2,0860 2,5280 2,8453 3,8495
21 0,0635 0,1272 0,2566 0,3906 0,5325 0,6864 0,8591 1,0627 1,3232 1,7207 2,0796 2,5176 2,8314 3,8193
22 0,0634 0,1271 0,2564 0,3904 0,5321 0,6858 0,8583 1,0614 1,3212 1,7171 2,0739 2,5083 2,8188 3,7921
23 0,0634 0,1271 0,2563 0,3902 0,5317 0,6853 0,8575 1,0603 1,3195 1,7139 2,0687 2,4999 2,8073 3,7676
UNIDADE 4
G.
liber- 0,95 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001
dade
UNICESUMAR
24 0,0634 0,1270 0,2562 0,3900 0,5314 0,6848 0,8569 1,0593 1,3178 1,7109 2,0639 2,4922 2,7969 3,7454
25 0,0633 0,1269 0,2561 0,3898 0,5312 0,6844 0,8562 1,0584 1,3163 1,7081 2,0595 2,4851 2,7874 3,7251
26 0,0633 0,1269 0,2560 0,3896 0,5309 0,6840 0,8557 1,0575 1,3150 1,7056 2,0555 2,4786 2,7787 3,7066
27 0,0633 0,1268 0,2559 0,3894 0,5306 0,6837 0,8551 1,0567 1,3137 1,7033 2,0518 2,4727 2,7707 3,6896
28 0,0633 0,1268 0,2558 0,3893 0,5304 0,6834 0,8546 1,0560 1,3125 1,7011 2,0484 2,4671 2,7633 3,6739
29 0,0633 0,1268 0,2557 0,3892 0,5302 0,6830 0,8542 1,0553 1,3114 1,6991 2,0452 2,4620 2,7564 3,6594
30 0,0632 0,1267 0,2556 0,3890 0,5300 0,6828 0,8538 1,0547 1,3104 1,6973 2,0423 2,4573 2,7500 3,6460
60 0,0630 0,1262 0,2545 0,3872 0,5272 0,6786 0,8477 1,0455 1,2958 1,6706 2,0003 2,3901 2,6603 3,4602
90 0,0629 0,1260 0,2541 0,3866 0,5263 0,6772 0,8456 1,0424 1,2910 1,6620 1,9867 2,3685 2,6316 3,4019
120 0,0628 0,1259 0,2539 0,3862 0,5258 0,6765 0,8446 1,0409 1,2886 1,6577 1,9799 2,3578 2,6174 3,3735
150 0,0628 0,1259 0,2538 0,3861 0,5255 0,6761 0,8440 1,0400 1,2872 1,6551 1,9759 2,3515 2,6090 3,3566
180 0,0628 0,1258 0,2537 0,3859 0,5253 0,6759 0,8436 1,0394 1,2863 1,6534 1,9732 2,3472 2,6034 3,3454
142
210 0,0628 0,1258 0,2537 0,3858 0,5252 0,6757 0,8433 1,0390 1,2856 1,6521 1,9713 2,3442 2,5994 3,3375
240 0,0628 0,1258 0,2536 0,3858 0,5251 0,6755 0,8431 1,0387 1,2851 1,6512 1,9699 2,3420 2,5965 3,3315
270 0,0628 0,1258 0,2536 0,3857 0,5250 0,6754 0,8430 1,0384 1,2847 1,6505 1,9688 2,3402 2,5942 3,3269
300 0,0628 0,1258 0,2536 0,3857 0,5250 0,6753 0,8428 1,0382 1,2844 1,6499 1,9679 2,3388 2,5923 3,3233
400 0,0627 0,1257 0,2535 0,3856 0,5248 0,6751 0,8425 1,0378 1,2837 1,6487 1,9659 2,3357 2,5882 3,3150
500 0,0627 0,1257 0,2535 0,3855 0,5247 0,6750 0,8423 1,0375 1,2832 1,6479 1,9647 2,3338 2,5857 3,3101
800 0,0627 0,1257 0,2534 0,3855 0,5246 0,6748 0,8421 1,0371 1,2826 1,6468 1,9629 2,3310 2,5820 3,3027
1000 0,0627 0,1257 0,2534 0,3854 0,5246 0,6747 0,8420 1,0370 1,2824 1,6464 1,9623 2,3301 2,5808 3,3003
Fonte: Barbeta et al. (2014, p. 300).
Obs.: Distribuição de t-Student segundo os graus de liberdade e uma dada probabilidade em um teste bicaudal (primeira linha). Para um teste monocaudal, considere me-
tade do valor de probabilidade apontado.
UNIDADE 4
s
IC X tc.
n
2
IC 8, 7 2, 2622.
10
2
IC 8, 7 2, 2622.
3, 16
IC 8, 7 2, 2622.0, 63
IC 8, 7 1, 43
IC 8, 7 1, 43 10, 13
IC 8, 7 1, 43 7, 27
Isso significa que as hipóteses estatísticas são estabelecidas pelos critérios do pesquisador, baseado
no que ele está buscando, ou seja, com informações teóricas, muitas vezes. Já o teste de hipótese em
si, trata-se de uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos ele-
mentos amostrais. São dois os tipos de hipóteses: designa-se H0, denominada hipótese nula, a hipótese
estatística a ser testada, e H1, a hipótese alternativa. A hipótese nula expressa uma igualdade, enquanto
a hipótese alternativa é dada por uma desigualdade.
143
UNICESUMAR
Existem dois tipos possíveis de erros quando fazemos um teste estatístico para acei-
tar ou rejeitar H0. Nós podemos rejeitar a hipótese H0, quando ela é verdadeira, ou
aceitar H0, quando ela é falsa (MARTINEZ, 2015). O erro de rejeitar H0, sendo H0 ver-
dadeira, é denominado Erro tipo I, e a probabilidade de se cometer o Erro tipo I é
designada α. Por outro lado, o erro de aceitar H0, sendo H0 falsa, é denominado Erro
tipo II, e a probabilidade de cometer o Erro tipo II é designada β.
Os possíveis erros e acertos de uma decisão com base em um teste de hipótese
estatístico estão apresentados a seguir:
• Erro do tipo 1: trata-se do erro que se comete ao rejeitar a hipótese H0 quando
ela é verdadeira. O nível de significância do teste é designado por α, que é a
probabilidade de se cometer o erro do tipo 1.
• Erro do Tipo 2: é o erro que se comete ao aceitar a hipótese H0 quando ela
é falsa. Rejeitar H0 implica a aceitação de H1 e vice-versa. A probabilidade de
cometer um erro do tipo 2 é dada por 1 – α.
144
UNIDADE 4
Teste bilateral
A região crítica está nas duas regiões extremas (caudas) sob a curva (Figura 14).
A região crítica está na região extrema (cauda) direita sob a curva (Figura 15).
145
UNICESUMAR
A região crítica está na região extrema (cauda) esquerda sob a curva (Figura 16).
Depois de apresentarmos os conceitos fundamentais dentro de um teste de hipótese, você verá que não
é um teste complicado. A seguir, apresentaremos o roteiro para realização de um teste de hipóteses.
1º passo: estabelecer a hipótese nula H0.
2º passo: estabelecer a hipótese alternativa H1.
3º passo: fixar o nível de significância α: em que definimos o nível de confiança para um intervalo
de confiança, como a probabilidade 1 – α. Escolhas comuns para α são 0,05; 0,01 e 0,10, com 0,05
sendo a mais comum.
Os valores críticos de z relativos aos níveis de significância usados com maior frequência podem
ser observados a seguir (valores já retirados da Tabela Z de distribuição normal reduzida):
Nível de significância α 0,10 0,05 0,01
Valores críticos de z para testes unilaterais ± 1,28 ± 1,64 ±2,33
Valores críticos de z para testes bilaterais ± 1,64 ± 1,96 ± 2,58
Para entendermos este passo a passo, vejamos um exemplo: supondo que um professor de ciências
biológicas deseja testar H0: μ = 20 contra H1: μ > 20, sabendo que o desvio padrão da população é igual
a 4 e a amostra testada foi de 16 elementos:
146
UNIDADE 4
H0: μ = 20
2º passo: estabelecer a hipótese alternativa H1:
H1: μ > 20
3º passo: fixar o nível de significância α: Para esse exercício vamos admitir que α = 0,05 = 5%.
4º passo: determinar a região de rejeição da hipótese nula: Como H1: μ > 20, vamos utilizar o teste
unilateral à direita, que podemos observar na Figura 17.
X µ0
zcalculado
s
n
Em que:
Zcalculado = valores da tabela Z
X = média da amostra
µ0 = é a média da população (hipótese a ser testada)
σ = desvio padrão da população
n = número de elementos da amostra
Substituindo os valores na equação, temos:
147
UNICESUMAR
X µ0
zcalculado
s
n
X 20
1, 64
4
16
X 20
1, 64
4
4
X 20
1, 64
1
1, 64 20 X
X 21, 64
6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A.
Nesse exercício, temos:
Rejeitar H0 quando > 21,64
Não Rejeitar H0 quando ≤ 21,64
H0: µ = 50 (µ0)
H1: µ ≠ 50 (µ0)
148
UNIDADE 4
4º passo: determinar a região de rejeição da hipótese nula: como H1: μ ≠ 50, utilizaremos o teste
bilateral, que podemos observar na Figura 18.
X µ0
zcalculado
s
n
48 50
zcalculado
4
36
2
zcalculado
4
6
2
zcalculado
0, 666
zcalculado 3
6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A.. Nesse
exercício, temos:
Rejeita-se H0 pois, o resultado amostral afirma que a média é diferente de 50 meses, ao nível de
95% de confiança.
149
UNICESUMAR
Você percebeu, caro(a) estudante, que a correlação e a regressão linear poderão ajudá-lo(a) como
professor(a). Você pode ter uma turma, analisar duas disciplinas e fazer projeções sobre as possíveis
notas de seus alunos, desde que tenham uma correlação linear forte. Você, também, identificou como
as técnicas estudadas em Bioestatística sobre a inferência poderão, por meio de testes, construir um
modelo de aceitação ou rejeição de uma hipótese.
150
1. Um professor de Ciências Biológicas fez uma análise com 20 alunos, com o objetivo
de saber se existe relação entre as disciplinas Anatomia Humana e Fisiologia Humana.
Com isso, calculou a regressão linear, e o valor encontrado foi igual a r = 0,85. Assim,
o professor pode concluir que:
a) Existe uma correlação linear forte e positiva entre as disciplinas de Anatomia Humana
e Fisiologia Humana.
b) Existe uma correlação linear forte e negativa entre as disciplinas de Anatomia Humana
e Fisiologia Humana.
c) Existe uma correlação linear fraca e positiva entre as disciplinas de Anatomia Humana
e Fisiologia Humana.
d) Existe uma correlação linear fraca e negativa entre as disciplinas de Anatomia Humana
e Fisiologia Humana.
e) Não existe uma correlação linear fraca e positiva entre as disciplinas de Anatomia
Humana e Fisiologia Humana.
151
3. O diagrama de dispersão pode ajudar na interpretação e, também, a verificar se existe
alguma correlação entre as variáveis X e Y. Diante disso, analise o gráfico (Figura 19)
de dispersão a seguir:
Fonte: o autor.
Descrição da Imagem: a figura apresenta um gráfico de dispersão, no qual temos pontos x, y apre-
AGORA É COM VOCÊ
sentados na ordem a seguir (sempre lendo primeiro eixo x seguida de vírgula eixo y, para separar o
próximo ponto separamos por traço) 10,11- 12,11- 13,2 - 14,1- 15,1- 10,1- 9,1 - 8,1.
152
4. Um professor fez um experimento com uma amostra de 100 peças, com um tempo
médio de vida de 501,2 minutos e desvio padrão igual a 4. O intervalo de confiança
para média populacional com 95% de confiança é igual a:
a) IC 501, 2 0, 998
b) IC 501, 2 1, 775
c) IC 501, 2 3, 75
d) IC 501, 2 4, 99
e) IC 501, 2 0, 784
153
MEU ESPAÇO
154
5
Epidemiologia:
Definição, Objetivos
e Perspectivas
Históricas
Dra. Izabel Galhardo Demarchi
156
UNIDADE 5
CONCEITOS EPIDEMIOLÓGICOS
Bem-vindo (a) ao primeiro tópico de Epidemiologia! Caro (a) aluno (a), neste tópico você aprenderá
alguns conceitos teóricos da nossa disciplina para podermos dar continuidade aos próximos conteúdos.
Nesta Unidade, nós estudaremos a definição de Epidemiologia e outros temas importantes para padro-
nizarmos a nossa linguagem. Espero que você adquira a base teórica da Epidemiologia para avançarmos
para os conteúdos mais complexos.
O que é Epidemiologia?
Primeiramente, você deve estar se perguntando, mas o que é Epidemiologia? Atualmente, Epidemio-
logia é a principal ciência da informação em saúde, base da medicina, da saúde coletiva e das outras
formações profissionais de saúde (ALMEIDA FILHO; BARRETO, 2011). Pode ser considerada o
eixo da saúde pública e uma disciplina essencial para todas as disciplinas clínicas (ROUQUAYROL;
ALMEIDA FILHO, 1999).
Em termos etimológicos (origem da palavra), “Epidemiologia” significa o estudo do que afeta
a população ou estudo sobre populações (epi=sobre; demo=população; logos=estudo) Atualmen-
te, considerando que a Epidemiologia tem uma complexidade crescente e que sua abrangência
partiu do individual para um conceito de coletividade, existem muitas definições para este termo
(PEREIRA, 2002).
157
UNICESUMAR
“
ciência que estuda o processo saúde-enfermidade na sociedade, ana-
lisando a distribuição populacional e fatores determinantes do risco
de doenças, agravos e eventos associados à saúde, propondo medidas
específicas de prevenção, controle ou erradicação de enfermidades,
danos ou problemas de saúde e de proteção, promoção ou recuperação
da saúde individual ou coletiva, produzindo informação e conheci-
mento para apoiar a tomada de decisão no planejamento, adminis-
tração e avaliação de sistemas, programas, serviços e ações de saúde.
158
UNIDADE 5
Objetivos da Epidemiologia
159
UNICESUMAR
PERSPECTIVA HISTÓRICA
160
UNIDADE 5
As raízes da Epidemiologia estão dentro da História da Medicina e da evolução das causas das doenças,
e podemos traçá-las desde a antiguidade clássica (PEREIRA, 2002). Segundo Almeida Filho e Barreto
(2011), a Epidemiologia é uma ciência que busca respostas para questões transcendentes sobre a vida,
a saúde, o sofrimento e a morte, e que se modifica sem cessar. No campo científico, a Epidemiologia
emergiu no final do século XIX e se consolidou como ciência em meados do século XX. Inicialmente,
abordaremos os principais elementos da Epidemiologia, com base na cultura ocidental moderna, e
as circunstâncias que que fizeram emergir os três pilares fundamentais da Epidemiologia: a clínica, a
medicina social e a estatística (ALMEIDA FILHO; BARRETO, 2011).
Os primeiros relatos associados à Epidemiologia são encontrados na História Antiga, em que exis-
tia uma tensão entre a medicina curativa e preventiva, e entre a medicina individual e coletiva. Esse
pensamento ocidental era encontrado na Grécia antiga em 420 a.C. Na mitologia grega, cultuava-se
o deus da saúde, Asclépios (também chamado de Esculápio), concomitantemente conhecido como
deus da medicina (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016; ROU-
QUAYROL; ALMEIDA FILHO, 1999).
161
UNICESUMAR
Esse antagonismo entre a medicina curativa e a medicina preventiva é encontrado na figura das
filhas e herdeiras de Asclépios, Panacéia e Higéia. Este paradoxo entre a medicina individual/curativa
e coletiva/preventiva é ainda um pensamento predominante até os dias de hoje. Panacéia era conside-
rada a “padroeira” da medicina individual curativa, a qual representava a prática terapêutica baseada
em intervenções por manobras físicas, encantamentos, preces e uso de medicamentos (pharmakon=
fármacos) em indivíduos doentes (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO,
2016). A irmã, Higéia (que deu origem ao termo higiene), era venerada por aqueles que consideravam
a saúde resultante da harmonia entre os homens e o ambiente. Os chamados higeus buscavam promo-
ver a saúde e evitar as doenças por meio de ações preventivas, a partir da manutenção do equilíbrio
entre os elementos fundamentais: terra, fogo, ar e água. A sobrevivência dessas crenças e práticas levou
à derivação da palavra higiene e ao seu conceito no sentido de promoção da saúde, principalmente
em âmbito coletivo (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL;
ALMEIDA FILHO, 1999).
O precursor da Epidemiologia, também con-
siderado por muitos o pai da Epidemiologia, foi
Hipócrates de Cós. O raciocínio epidemiológico
foi antecipado por Hipócrates a partir de seus es-
tudos sobre as epidemias (termo criado por ele) e
a distribuição das enfermidades nos ambientes. No
seu escrito Corpus Hippocraticus, fica clara a visão
racional da medicina, afastando as teorias sobrena-
turais, bem diferente da concepção mágico-religio-
sa predominante na antiguidade (PEREIRA, 2002;
ALMEIDA FILHO; BARRETO, 2011).
Hipócrates definiu que a saúde do homem de-
penderia da harmonia entre os fluidos (bile amarela
e negra, fleugma ou linfa, e sangue) e do equilíbrio
destes elementos naturais, ou seja, as doenças eram
produto da relação complexa entre a constituição
do indivíduo e do ambiente que o cerca. Em seu
texto, ele orientava ao médico sempre considerar
os fatores ambientais como o clima, a maneira de
viver, os hábitos de comer e de beber, durante a
avaliação clínica do indivíduo. Ele também defen- Figura 1 - Hipócrates de Cós, o iniciador da Epidemiologia,
que estudou as causas das doenças seguindo um raciocínio
dia o exame clínico minucioso e sistemático do lógico e não miasmático.
pacientes, que consiste em base para o diagnóstico e descrição da História Natural das Doenças.
Além de ser considerado o pai da medicina, muitos o consideram o pai da Epidemiologia, ou ainda
o primeiro epidemiologista (PEREIRA, 2002).
162
UNIDADE 5
Um dos seus trabalhos clássicos, denominado como Ares, águas, lugares, buscou apresentar ex-
plicações no racional, e não no sobrenatural, a respeito das doenças nas populações, ligando-as aos
fatores ambientais, defendendo o conceito ecológico da saúde-enfermidade, utilizado até os dias de
hoje. Suas observações não se limitavam apenas ao paciente em si, mas sim à coletividade. A partir
daí, surgiu a ideia do miasma (emanação), em que a doença era originada de situações insalubres,
como a má qualidade do ar. Essas emanações insalubres seriam capazes de causar doenças como
malária, que vem do latim maus ares (junção de mal e ar), que se relaciona com a crença sobre o
modo de transmissão da doença. As emanações passariam do doente para os indivíduos suscetíveis,
o que explicava a origem das epidemias de doenças contagiosas da época (PEREIRA, 2002; ALMEI-
DA FILHO; BARRETO, 2011).
A preservação dos ensinamentos de Hipócrates foi mantida principalmente por Galeno (138-201
a.C) na Roma antiga, por árabes na Idade Média e retomada por clínicos na Europa Ocidental, no
período da Renascença e, posteriormente, por toda parte. Um dos médicos mais famosos naquele
período, foi Claudius Galeno, natural de Bergama (Turquia). Galeno sustentou a teoria humoral de
Hipócrates e a ampliou (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016;
ROUQUAYROL; ALMEIDA FILHO, 1999).
Além de Galeno, a era romana nos deixou mais um legado para a Epidemiologia, pelas mãos do im-
perador Marco Aurélio, que solicitava a realização de censos periódicos e de um registro compulsório de
nascimentos e óbitos, o que mais tarde seria conhecido como “estatísticas vitais”. O império romano tinha
o que podemos chamar de infraestrutura sanitária, formada por aquedutos que levavam água de melhor
qualidade para Roma, e de esgotos, que até hoje são preservados (ALMEIDA FILHO; BARRETO, 2011;
BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999).
163
UNICESUMAR
Neste período, destacamos o médico persa Avicena (989-1037), autor da obra Cânon da
Medicina, que trata dos princípios gerais da medicina, adotando os termos Etiologia, sintomas,
diagnose, prognose e terapêutica. Nessa obra, foi preconizado o uso sistemático do registro
da ocorrência de doenças, antecipando a Epidemiologia (ALMEIDA FILHO; BARRETO,
2011; MEDRONHO, 2009; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999).
O avanço no campo cultural, filosófico e social, articulado à emergência de um novo
modo de produção, resultou na constituição das ciências modernas. O novo entendimento
do mundo superou a metafísica religiosa medieval e, entre os séculos XVI e XVIII, houve
um enorme e complexo esforço para a produção de dados, informações e conhecimento
em todos os níveis do saber e localidades em que se expandia a civilização ocidental
(ALMEIDA FILHO; BARRETO, 2011). No século XVI, o médico espanhol Angelério
descreveu um estudo sobre as pestes, denominado Epidemiologia, tendo então criado
o termo. No final do século XVIII e início do século XIX, iniciando com a Revolução
Francesa, as epidemias como cólera, febre tifóide e febre amarela eram graves problemas
de saúde nas cidades, aumentando as preocupações com higiene, o aprimoramento da
legislação sanitária e a criação de estruturas administrativas para controle e prevenção
das doenças (PEREIRA, 2002).
Todos esses avanços e o impacto dos movimentos renascentistas na formação da
Epidemiologia permitem dizer que ela surgiu da consolidação de um tripé de elementos
conceituais (saberes sobre a doença), metodológicos (diretrizes quantitativas) e ideoló-
gicos (práticas de transformação da sociedade): Clínica, estatística e Medicina Social,
respectivamente (ALMEIDA FILHO; BARRETO, 2011; BUSATO, 2016).
A seguir, você aprenderá sobre as raízes epidemiológicas em cada um dos três eixos.
Epidemiologia na Clínica
164
UNIDADE 5
165
UNICESUMAR
Um outro exemplo importante da clínica médica é Robert Koch (1843-1910), que em 1882 descobriu
o agente causador da tuberculose e escreveu os postulados da teoria microbiana da doença (“teoria do
germe”). Koch postulou que o microrganismo deveria ser isolado em cultura de cada caso da doença.
Uma vez isolado, deveria ser inoculado em um animal para reproduzir a doença experimentalmente.
Aplicando-se os métodos de Koch, em 1880 e 1989 foram descobertos os agentes da febre tifóide,
hanseníase, malária, cólera, erisipela, difteria, brucelose, pneumonia e outros (ALMEIDA FILHO,
BARRETO, 2011).
Como podemos ver, na segunda metade do sé-
culo XIX e na primeira do século XX ocorreu uma
reorientação do pensamento médico e uma altera-
ção dos conceitos de doença e contágio. A partir da
comprovação de seres microscópicos e seu papel
na gênese da enfermidades, a clínica e a patologia
tornaram-se subordinadas aos laboratórios, que
também ditavam as normas de higiene e legislação
sanitária. As escolas de saúde pública passaram as
formas aos sanitaristas, e os ensinos passaram a
se concentrar em laboratórios. Foram fundados
diversos institutos de pesquisas aplicadas à prática
clínica, como o Instituto Pasteur e, consequente-
mente, aumentou-se o número de produções cien-
tíficas com progresso da ciência e tecnologia. Não
somente os avanços da bacteriologia; houve uma
significativa consolidação dos métodos de preven-
ção de doenças, como as imunizações e a promoção
Figura 3 - Robert Koch, o descobridor do agente etiológico da
da saúde ambiental (PEREIRA, 2002). tuberculose. / Fonte: Wikimedia (2016, on-line)².
Em relação às imunizações, destaca-se Edward Jenner (1749), que teve um grande interesse na
varíola, considerada um problema de saúde universal para a época. Sabia-se que os sobreviventes à
doença estariam imunes, e tornou-se uma prática comum infectar indivíduos saudáveis administrando
um material retirado de pacientes com varíola. Esse procedimento ficou conhecido como variolização,
e tornou-se um método preventivo muito comum na prática médica. No entanto, muitos indivíduos
foram a óbito, ou alguns desenvolveram a doença ou ainda outras infecções (GORDIS, 2009). Com
o objetivo de encontrar uma prática mais segura para prevenir a varíola, Jenner passou a estudar a
varíola bovina, e observou que as mulheres ordenhadoras de vacas desenvolviam a varíola mais bran-
da e que após surtos da doença essas mulheres não desenvolviam a infecção. Então, Jenner decidiu
testar a hipótese de que a varíola bovina poderia prevenir a doença nos homens. Somente em 1967 a
Organização Mundial da Saúde (OMS) realizou uma intensa campanha internacional para erradicar
a varíola, usando vacinas contendo o vírus da varíola bovina. Em 1980, a OMS emitiu um certificado
de erradicação da doença (GORDIS, 2009).
166
UNIDADE 5
Epidemiologia na Estatística
Segundo Busato (2016, p. 24), “a articulação entre a clínica, medicina social e a estatística, resulta na
evolução da Epidemiologia, ressaltando a sua vocação de ciência aplicada no diagnóstico e na solução
de problemas de saúde”. A estatística é um método capaz de analisar os riscos, os fatores de risco e os
desfechos em saúde, promovendo maior confiabilidade nos resultados obtidos pelas pesquisas. Além
disso, com a computadorização, a avaliação de causa e efeito tiveram maior precisão na análise estatística.
167
UNICESUMAR
168
UNIDADE 5
Medicina Social
169
UNICESUMAR
Em meados do século XIX, o médico sanitarista Rudolf Ludwing Karl Virchow (1821-1902) destacou-se
como um dos principais personagens da medicina social. O legislativo de Berlim enviou Virchow para a
Alta Silésia, onde vivia uma população de origem polonesa (da mesma origem da família de Virchow),
para estudar um surto de tifo. O seu relatório constatou que as pessoas viviam em condições deploráveis
e denunciou o capitalismo, pois descreveu que a prevenção das epidemias não dependia somente de
remédios ou medidas de higiene, mas dependia de uma ampla reforma das condições sócio-econômicas
(MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Em 1850, os jovens idealistas médico-sociais, oficiais de saúde pública e membros da Royal Me-
dical Society organizaram na Inglaterra a London Epidemiological Society. Dentre os membros mais
importantes destacou-se John Snow (1813-1858), considerado o fundador (pai) da Epidemiologia.
Snow desenvolveu numerosos estudos para esclarecer a origem das epidemias de cólera ocorridas em
Londres (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; GORDIS, 2009; PEREIRA, 2002;
BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999).
Naquele período, Londres era uma megalópole de 2,5 milhões de habitantes, e que tinha uma
precária condição de higiene e de saneamento.
Os dejetos eram acumulados por toda parte da
cidade e jogados no rio Tâmisa, cuja água era uti-
lizada para abastecimento por duas companhias
de distribuição. Para Snow, a teoria do miasma
não explicava a transmissão de cólera. Em 1849,
no segundo ano da epidemia, Snow publicou o
panfleto intitulado ‘Sobre a Maneira de Trans-
missão da Cólera’ (On the Mode of Communi-
cation of Cholera), defendendo a ideia de que a
doença era transmitida pela água (contaminação
hídrica) (ALMEIDA FILHO; BARRETO, 2011;
BUSATO, 2016).
Snow observou que os casos mais frequentes
estavam entre as pessoas que usavam água forne-
cida por empresas que a recolhiam de um poço na
Broad Street. A captação da água era realizada em
pontos muito poluídos do rio pelas companhias
Lambeth Company e Southwark and Vauxhall
Company. Naquela época, por motivos técnicos
e não de saúde, a companhia Lambeth transferiu
o lugar de captação da água para um local menos Figura 5 - John Snow, o pai da Epidemiologia, realizou estudos
sobre o cólera em Londres durante o período de 1849-1856.
poluído do rio Tâmisa, mas a outra companhia não Fonte: Wikimedia (2015, on-line)³.
moveu o local de captação da água. Snow racio-
cinou que a transferência do lugar de captação da água deveria reduzir a taxa de mortalidade por cólera
170
UNIDADE 5
naqueles que recebiam água pela companhia Lambeth em relação aos que recebiam água pela outra
empresa. Snow encontrou uma taxa de mortalidade de 315 casas por 10.000 casas quando a água era
distribuída pela Southwark and Vauxhall Company. Naquelas abastecidas pela Lambeth Company, a taxa
era de apenas 38 casos de óbito a cada 10.000 casas (GORDIS, 2009; PEREIRA, 2002; BUSATO, 2016).
O número de casos de cólera era quase 14 vezes maior na área que recebia água da companhia
Southwark and Vauxhall em relação à região abastecida pela Lambeth Company. Então, ele propôs
ao conselho administrativo que fosse removida a bomba do poço de Broad Street, e os casos de cólera
começaram a diminuir. A partir disso, ele publicou a segunda edição de On the Mode of Communi-
cation of cholera, acrescentando esses resultados. Em 1884, Robert Kock isolou e cultivou a bactéria
(ALMEIDA FILHO; BARRETO, 2011).
Na Inglaterra, na França e na Alemanha, surgiu o movimento conhecido como sanitarismo, no qual
a maioria dos funcionários era de agências oficiais que realizavam o controle de doenças. Os sanitaristas
faziam discursos e praticavam as questões de saúde baseados na aplicação de tecnologia e em atividades
profiláticas, como a imunização, o saneamento e o controle de vetores. As ações eram destinadas prin-
cipalmente aos pobres e a setores excluídos da sociedade. Além do sanitarismo, a estatística, a patologia
e as pesquisas microbianas aplicadas no campo social da saúde (Saúde Pública) contextualizaram a
constituição da Epidemiologia como campo científico (ALMEIDA FILHO; BARRETO, 2011).
Epidemiologia Atual
No Mundo
Em 1918, a escola pioneira de saúde pública foi inaugurada em Baltimore (EUA), Johns Hopkins School
of Hygiene and Public Health, a qual serviu de modelo de “escola de saúde pública” e foi difundida pelo
mundo todo, com o apoio da Fundação Rockefeller. Wade Hampton Frost (1880-1938), sanitarista do
National Public Health Service, assumiu a nova cátedra de Epidemiologia na escola John Hopkins
e foi o primeiro professor da disciplina no mundo. Frost utilizou novas técnicas estatísticas para es-
tudar a prevalência e a incidência de doenças transmissíveis (ALMEIDA FILHO; BARRETO, 2011;
MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999).
Em 1928, a fusão da antiga Escola da Medicina Tropical com o Departamento de Higiene da
University College formou a London School of Hygiene and Tropical Medicine. O primeiro pro-
fessor de Epidemiologia e Estatística Vital foi Major Greenwood (1880-1949), conhecido também
como o fundador da estatística moderna. Ele foi o principal responsável em introduzir a estatística
na pesquisa epidemiológica (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROU-
QUAYROL; ALMEIDA FILHO, 1999).
171
UNICESUMAR
Em 1929, com a crise econômica mundial e social, o avanço tecnológico e a especialização da prática
médica levaram à elevação dos custos e da elitização da assistência à saúde, reduzindo o seu alcance social.
Nesse período, o caráter social das doenças foi resgatado a partir da Epidemiologia. Em 1936, o clínico
britânico John Ryle (1889-1950), o primeiro diretor do Instituto de Medicina Social da Universidade de
Oxford, propôs a sistematização do modelo de História Natural das Doenças, essencial para a crescente
medicina preventiva. Nesse modelo, a saúde poderia ser alcançada pelas ações intervencionistas reali-
zadas antes do aparecimento da doença. Posteriormente, a noção de prevenção se estendeu em muitos
países que internacionalizaram o movimento ideológico da Medicina Preventiva como prática médica
(ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999).
Nas décadas de 1930 e 40, muitos países passaram a incorporar os aspectos de prevenção nos con-
teúdos de formação de profissionais de saúde. Foram criados departamentos de medicina preventiva
que abordavam os conteúdos de Epidemiologia, administração em saúde e ciências da conduta, que
eram ministrados pelas escolas de saúde pública somente. O conceito de prevenção foi ampliado para
prevenção primária, secundária e terciária (descritos ainda nesta unidade), incorporando toda a prática
médica (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009).
Com a Segunda Guerra Mundial, houve uma necessidade de desenvolver métodos eficientes para
medir a saúde física e mental dos exércitos, abrindo a possibilidade de aplicação dos métodos epi-
demiológicos à população civil. No período pós-guerra, grandes inquéritos epidemiológicos foram
realizados, principalmente de doenças não-infecciosas, como pretendia a nova ciência (MEDRONHO,
2009; ROUQUAYROL; ALMEIDA FILHO, 1999).
Em 1954, a institucionalização da disciplina levou à fundação da International Epidemiological
Association (IEA), à transformação do tradicional American Journal of Hygiene em American
Journal of Epidemiology em 1964. Na década de 1950, novos desenhos de investigação começaram
a ser desenvolvidos por programas de investigação e departamentos de Epidemiologia (ALMEIDA
FILHO; BARRETO, 2011; MEDRONHO, 2009; PEREIRA, 2002; ROTHMAN; GREENLAND;
LASH, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Na teoria, foram definidos os indicadores básicos da saúde, prevalência e incidência, e formalizado
o conceito de risco. Também foi introduzida a Bioestatística como ferramenta de análise dos estudos
para a identificação das causas das enfermidades. Neste campo, destacou-se Jerome Cornfield (1912-
1979), que desenvolveu os estimadores do risco relativo (risco de desenvolver uma determinada doença
quando exposto a um fator de risco) e introduziu as técnicas de regressão logística (análise estatística)
na Epidemiologia (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009).
Na década de 1960, houve um grande avanço tecnológico e científico com o desenvolvimento e
difusão da computação eletrônica. Isso levou à matematização cada vez maior da disciplina. Com a
computação, foi possível criar e utilizar os bancos de dados, que aliados às ferramentas e softwares
(programas) de estatística, expandiram a investigação epidemiológica. Na década de 1970, a matemática
passou a validar as investigações científicas dos riscos, fatores e efeitos, ou seja, ela passou a ser indis-
pensável para a confrontação da experiência clínica ou da demonstração experimental (ALMEIDA
FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999).
172
UNIDADE 5
Na década de 80, foi consolidada a Epidemiologia clínica, aquela fora do contexto coletivo, com
ênfase em procedimentos de identificação de caso e na avaliação da eficácia terapêutica, conforme
o que recentemente é conhecido como medicina baseada em evidência. Nos anos de 1990, houve
uma ampliação do objetivo de conhecimento da disciplina, surgindo novos horizontes de pesquisa,
destacando-se a Epidemiologia Molecular, a Epidemiologia Genética, a Farmacoepidemiologia e a
Epidemiologia de Serviços de Saúde (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009).
No Brasil
173
UNICESUMAR
Em meados de 1950, foram criados os departamentos de Medicina Preventiva (ou Social) em fa-
culdades de Medicina, e a disciplina de Epidemiologia foi inserida nos cursos de medicina. Em 1960,
foram realizadas campanhas de vacinação para a erradicação da varíola, e em 1970, contra a poliomielite.
Juntamente com a epidemia de doença meningocócica, as campanhas e a epidemia contribuíram para a
consolidação do Sistema Nacional de Vigilância Epidemiológica do Brasil. Ainda em 1970, foram criados
núcleos de saúde coletiva, e em 1979 criou-se a Associação Brasileira de Pós-graduação em Saúde Co-
letiva (ABRASCO), atuando também nos serviços de saúde (MEDRONHO, 2009; ALMEIDA FILHO;
BARRETO, 2011).
O ápice do movimento de reforma sanitária deu-se na VIII Conferência Nacional de Saúde,
considerada o marco da criação do Sistema Único de Saúde (SUS). Em 1898, durante o Seminário
Estratégias para o Desenvolvimento da Epidemiologia no Brasil, foi elaborado o I Plano Diretor,
que abordava questões sobre o desenvolvimento da disciplina no Brasil para a graduação, pós-gra-
duação, pesquisas e serviços de saúde (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011).
Em 1990, foi realizado o I Congresso Brasileiro de Epidemiologia (Campinas, SP) e criado o Centro
Nacional de Epidemiologia, órgão vinculado ao Ministério da Saúde (criado em 1953). Esse órgão
era responsável por promover e disseminar o uso de Epidemiologia para todos os níveis de atenção
na saúde do SUS. Posteriormente, foram realizados outros congressos de Epidemiologia, com cada
vez mais trabalhos científico apresentados e maior número de participantes, e também atualizado
o Plano Diretor (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011).
Desde 2005, a Comissão de Epidemiologia da ABRASCO lançou o IV Plano Diretor de Desenvol-
vimento da Epidemiologia no Brasil, que afirma o uso da Epidemiologia na saúde pública, refletindo
um grande aumento das pesquisas epidemiológicas com impacto social e as relações com os diversos
determinantes de saúde (social, econômico, político e cultural) (MEDRONHO, 2009; ALMEIDA
FILHO E BARRETO, 2011).
APLICAÇÕES DA EPIDEMIOLOGIA
174
UNIDADE 5
Desta forma, uma das ações da Epidemiologia, além de identificar os problemas de saúde, é de propor
medidas preventivas dos riscos e os danos a fim de evitar a ocorrência das doenças, agravos, ou compli-
cações, como a vacinação do exemplo acima (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL;
ALMEIDA FILHO, 1999; GORDIS, 2009).
g) formular explicações ou gerar hipóteses do porque esses eventos são mais frequentes em de-
terminados grupos.
175
UNICESUMAR
A distribuição de eventos em uma população nos leva a questionar: quais são os fatores que influen-
ciaram ou que causaram essa distribuição? Uma variável de exposição constitui um fator de risco ou
não para uma determinada patologia? A resposta para esta questão se torna muito importante do
ponto de vista da saúde coletiva, para que se possa tomar decisões para a resolução de problemas de
saúde (ALMEIDA FILHO; BARRETO, 2011; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO,
1999; GORDIS, 2009). No entanto, o maior desafio da Epidemiologia consiste na correta produção de
hipóteses e no processo de validação destas para a busca de soluções para os problemas identificados
(ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009;
ROTHMAN et al. 2011).
Você já pensou como a Epidemiologia está relacionada com a sua rotina e suas relações indi-
viduais e coletivas? Avalie a importância da Epidemiologia no seu cotidiano.
176
UNIDADE 5
Para se confirmar um caso (uma doença, ou qualquer outro evento em saúde) é necessário evidenciar
os fatos, como um diagnóstico clínico e laboratorial que confirmem o caso. Até uma nova intervenção
deve ter seu efeito comprovado. Esse tipo de ciência é denominada medicina baseada em evidência.
Essas evidências podem ser obtidas de diferentes fontes, como as experiências em animais, observações
clínicas adquiridas com os anos, achados laboratoriais, análises comparativas de estatísticas e inquéritos
populacionais (PEREIRA, 2002; FRANCO; PASSOS, 2011; BENSEÑOR; LOTUFO, 2005).
Caso as evidências apontem uma relação causal, gera-se uma hipótese, e procura-se confirmar essa
causa ou descartá-la por uma simples coincidência (PEREIRA, 2002; ROUQUAYROL; ALMEIDA
FILHO, 1999; GORDIS, 2009). Não são todos os métodos epidemiológicos que permitem diferen-
ciar uma coincidência de uma verdadeira relação causal, e os estudos mais adequados que inferem
causalidade são os ensaios clínicos randomizados e controlados (PEREIRA, 2002; GORDIS, 2009;
BENSEÑOR; LOTUFO, 2005).
177
UNICESUMAR
Uma vez que a Epidemiologia dispõe de instrumentos adequados para determinar o impacto das
medidas e intervenções em saúde, as informações epidemiológicas deveriam ser utilizadas para as
tomadas de decisão na fase de planejamento e de organização dos serviços de saúde (MEDRO-
NHO, 2009). Algumas informações epidemiológicas podem ser utilizadas para subsidiar as decisões
relativas à prioridade e ao melhor destino dos recursos. Dentre essas informações, encontram-se a
magnitude e a distribuição dos problemas de saúde, que são os fatores de risco e os agravos à saúde, e
das características da população; as relações causais entre as características populacionais e os recursos
humanos, financeiros e materiais (PEREIRA, 2002).
Para a adequação da oferta de serviços, da orientação e da reorganização, é preciso analisar a necessidade
de saúde, a demanda, a oferta, o acesso, o uso e a equidade. O conceito de necessidade de saúde pode ser
visto do aspecto clínico (necessidade individual, clínica, voltada para a opinião médica) e a necessidade
178
UNIDADE 5
percebida pelo indivíduo. Não basta o problema ser identificado como necessidade, para a saúde coletiva é
importante que esse problema também tenha demanda. As informações de morbidade e mortalidade são os
indicadores que mais refletem a necessidade populacional. Ainda, a Epidemiologia pode colaborar para a
elaboração de novos indicadores e parâmetros de avaliação da qualidade dos serviços (MEDRONHO, 2009)
Os serviços devem estar disponíveis (acessíveis) em quantidade e qualidade suficientes para atender
todos aqueles que dele necessitem. No entanto, é comum observarmos discrepâncias na oferta de serviços
de acordo com a região ou localidade, muitas vezes uma prioridade da lei do mercado e não da necessida-
de de atenção à saúde. A organização e a distribuição dos serviços dependem da forma de financiamento
(público, privado) e da demanda de necessidade tecnológica (MEDRONHO, 2009).
A oferta do serviço é medida pelas quantidades de recursos físicos (número de consultórios e leitos),
humanos (médicos, dentistas, enfermeiros e etc.), de equipamentos ou ainda de horas semanais de dispo-
nibilidade e o volume de produção que se é capaz de oferecer. O acesso aos serviços depende, em todos os
níveis de atenção à saúde, não só da disponibilidade dos recursos, mas também da distância, das barreiras
geográficas, culturais, econômicas, e até funcionais. Também depende do tempo, do transporte, e até mesmo
das filas, salas de espera, horários e outras condições que viabilizam o uso do serviço por diferentes grupos
populacionais (MEDRONHO, 2009). Assim, a Epidemiologia faz o levantamento desses dados, quantifi-
cando a frequência e a distribuição da demanda, da oferta e do acesso, facilitando ao gestor e à população
decidirem onde os recursos devem ser mais bem aplicados.
A preocupação em avaliar a assistência à saúde é mais antiga quanto a medicina, mas somente no início
deste século a avaliação de qualidade na área da saúde como um conjunto de conhecimentos organi-
zados passou a ser praticada. O conceito de qualidade deve abranger os aspectos de acesso, adequação,
efetividade, equidade, custos e a satisfação do paciente. Inclui também o desempenho do profissional de
saúde, a qualidade e a utilização de insumos (vacinas, diagnósticos, medicamentos e outros), e o adequado
abastecimento e desenvolvimento dos sistemas de informação (MEDRONHO, 2009).
Os mesmos princípios utilizados para a identificação etiológica também podem ser aplicados para
a avaliação epidemiológica dos serviços e programas (PEREIRA, 2002; FRANCO; PASSOS, 2011).
Observa-se se um recurso (material, humano ou financeiro) ou um processo foi bem empregado na
saúde (PEREIRA, 2002). Os resultados observados geralmente são os indicadores de saúde (veja a Uni-
dade II). Por exemplo: observa-se se os índices de morbimortalidade de uma população melhoraram
após o investimento financeiro destinado ao treinamento de pessoal (PEREIRA, 2002). A partir da
obtenção dos resultados dos indicadores, deve-se comparar aos padrões, os quais são especificações
numéricas precisas consideradas como grau aceitável de qualidade. Essas especificações podem ser
obtidas em revisões de literatura, opinião de especialistas, consensos e resultados de ensaios clínicos,
principalmente os randomizados (MEDRONHO, 2009).
179
UNICESUMAR
Os hospitais têm utilizado crescentemente os indicadores e padrões para suas bases administrati-
vas, principalmente o indicador de mortalidade, o tempo de permanência e a taxa de readmissão. Em
relação à taxa de mortalidade, a identificação das mortes evitáveis deve ser um objetivo fundamental,
pois pode representar o uso inadequado de tecnologias, falhas nas supervisões, altas inapropriadas,
infecção hospitalar, erros cirúrgicos e procedimentos invasivos (MEDRONHO, 2009; GORDIS, 2009).
Nesse sentido, podem ser avaliados os parâmetros de eficácia, efetividade e eficiência. A eficácia
investiga o impacto das tecnologias em condições ideais de observação (em ambiente laboratorial),
como uma experiência epidemiológica ou uma avaliação de produtos (vacinas, medicamentos, pro-
dutos de diagnóstico e outros) e procedimentos (cirurgias, técnicas de educação em saúde, etc.). A
efetividade é utilizada para avaliar o impacto que os serviços e programas geram em condições normais
(reais), como efeitos vacinais, a implantação de programas (como de farmacovigilância), a avaliação
da toxicidade de um produto recém-lançado no mercado. A eficiência leva em consideração não só
o impacto, mas também os recursos empregados em um programa e serviço. Assim, a eficiência pode
comparar o resultado de diversas tecnologias para avaliar qual confere maior benefício e menor custo
(MEDRONHO, 2009; PEREIRA, 2002; GORDIS, 2009).
A Epidemiologia também é utilizada para verificar os benefícios de políticas de rastreamento de
doenças, como o rastreamento para detecção precoce de câncer (mama, colo do útero, próstata e ou-
tros). Por exemplo: podemos utilizar estudos em seres humanos para verificar se o rastreamento de
câncer de mama tem reduzido os índices de mortalidade (GORDIS, 2009).
A avaliação da qualidade dos serviços de saúde praticados no Brasil ainda é muito limitada, restrin-
gindo-se à análise da estrutura física e aos aspectos quantitativos da produção de serviços. Visuali-
za-se uma avaliação precária do indicador de morbimortalidade ou o uso de padrões, parâmetros e
indicadores inadequados ou obsoletos. É indiscutível a necessidade de avaliar o sistema e os serviços
de saúde utilizando indicadores e outras ferramentas com alta qualidade e precisão, para que que se
tomem medidas e intervenções confiáveis e seguras, assim como a utilização desses resultados para o
planejamento e organização dos serviços (MEDRONHO, 2009).
A produção hospitalar dos serviços financiados pelo sistema público de saúde é coberta por uma
base de dados nacional. Atualmente, esse sistema é uma fonte de informação que pode ser utilizada para
avaliar a assistência hospitalar. O sistema de informação mais importante para os hospitais é o Sistema
de Informações Hospitalares (SIH) pertencente ao Sistema Único de Saúde (SUS). O SIH é um banco de
dados administrativo que fornece informações sobre morbidade, consumo de recursos, uso de procedi-
mentos de diagnóstico, perfil sociodemográfico e geográfico e outros. Desta maneira, o SIH é um valioso
instrumento para o planejamento e a avaliação da qualidade dos serviços prestados (MEDRONHO, 2009).
180
UNIDADE 5
181
UNICESUMAR
Seguimos estudando o processo saúde-doença ou História Natural das Doenças, como também abor-
daremos os conceitos de causalidade e fatores etiológicos.
A História Natural das Doenças (HND) compreende o conjunto de processos que interagem
levando a algum dano na saúde do indivíduo. Esses processos interativos compreendem as relações
entre o agente, o suscetível e o meio ambiente. A HND vai desde os primeiros estímulos patológicos
até os efeitos de doença, como a invalidez, as sequelas, a recuperação ou a morte (LEAVELL; CLARK
apud ROUQUAYROL; ALMEIDA FILHO, 1999).
A utilidade da HND é descrever as múltiplas causas e as diferentes enfermidades que acometem
o indivíduo, servindo de base para a compreensão de condições reais e específicas e, principalmente,
apontando as diversas medidas de prevenção e controle (ROUQUAYROL; ALMEIDA FILHO, 1999).
A HND pode ser dividida em dois estágios ou fases (ROUQUAYROL; ALMEIDA FILHO, 1999; PE-
REIRA, 2002; FRANCO; PASSOS, 2011):
• Período pré-patogênico: aquele em que o suscetível (focaremos aqui o homem) é exposto
aos fatores biopsicossociais. Refere-se ao período anterior à doença, à interação preliminar dos
fatores potencialmente causadores da doença;
• Período patogênico: seria aquele em que ocorre a manifestação da doença propriamente dita. É o
período em que o indivíduo acometido pela doença manifesta sinais e sintomas. O indivíduo iniciou
a interação estímulo-hospedeiro e possui alterações fisiopatológicas. Nesse período, a enfermidade
pode progredir para a cura, a recuperação, a cronicidade, as sequelas, a invalidez e até a morte.
Para compreendermos melhor esses processos, faremos uma breve revisão dos conceitos de saúde e doença.
O termo saúde, no mais simples que se possa descrever, seria a ausência de doença, e por isso esse
182
UNIDADE 5
conceito não é mais usado. “A saúde já foi considerada uma espécie de silêncio orgânico”, na qual existe
um estado de harmonia e equilíbrio funcional em que os diferentes sistemas e aparelhos não sinalizam
irregularidades (FRANCO; PASSOS, 2011, p. 2). Rotineiramente, na prática clínica, os indivíduos são
rotulados como sadios ou doentes a partir de exames clínicos e laboratoriais que indicam a presença
ou ausência de anormalidades (PEREIRA, 2002), e é claro que não podemos considerar como uma
pessoa saudável aquela que contém uma infecção ou qualquer outra doença (FRANCO; PASSOS, 2011).
Em 1948, em sua constituição, a OMS adotou a definição de que “saúde é um completo estado de
bem-estar físico, mental e social, e não meramente a ausência de doença”. O Brasil incorporou o direito
à saúde na Constituição Federal do Brasil de 1988, e ampliou o seu conceito na Lei Orgânica da Saúde
8.080 (de 19 de setembro de 1990) e na Lei 12.864 de 24 de setembro de 2013 (BRASIL, 1990; 2013):
“é direito de todos e dever do estado, garantido mediante políticas sociais e econômicas que visem à
redução do risco de doença e de outros agravos e ao acesso universal e igualitário às ações e serviços,
para sua promoção, proteção e recuperação” (Art. 196 da Constituição Federal do Brasil) (BRASIL, 1988).
A partir das leis mencionadas acima, definiram-se os determinantes e condicionantes de saúde:
alimentação, moradia, o saneamento básico, meio ambiente, transporte, trabalho, renda, educação,
atividade físicas, lazer e acesso aos bens e serviços essenciais (BUSATO, 2016).
Em contrapartida, a doença seria a falta ou perturbação da saúde (PEREIRA, 2002), ou ainda um
“desajustamento ou uma falha nos mecanismos de adaptação do organismo ou uma ausência de rea-
ção aos estímulos, cuja ação está exposto” (JENICEK; CLÉROUX, apud HERZLICH, 2004). Ainda, a
portaria n° 204 de 17 de fevereiro de 2016 (BUSATO, 2016, p. 27) descreve o agravo como:
“
“qualquer dano à integridade física ou mental do indivíduo, provocado por circuns-
tâncias nocivas, tais como acidentes, intoxicações por substâncias químicas, abuso
de drogas ou lesões decorrentes de violências interpessoais […]”; e a doença como:
“enfermidade ou estado clínico, independente de origem ou fonte, que represente ou
possa representar um dano significativo para os seres humanos; [...]”.
O processo saúde-doença implica múltiplas e complexas interações. O processo é definido por Jenicek
e Cleroux (apud HERZLICH, 2004) como uma perturbação da estrutura, função de um órgão, sistema
ou de todo um organismo, podendo, ainda, alterar suas funções vitais. De um modo geral, o processo
saúde-doença na coletividade humana é o processo biológico de desgaste e reprodução, resultando
em um funcionamento biológico diferente com consequência para o desenvolvimento regular das
atividades do cotidiano. Seria o surgimento da doença (ROUQUAYROL; ALMEIDA FILHO, 1999).
A divisão do processo saúde-doença é útil para identificação dos riscos e dos danos à saúde, mas
também para pontuar as ações preventivas e curativas nos diversos momentos, também preocupando-se
com o momento em que a doença afeta o indivíduo ou o coletivo (PEREIRA, 2002). A Epidemiologia
não se preocupa, portanto, somente com o conhecimento dos problemas de saúde, incapacidade, doença
ou morte, mas também com a melhoria dos indicadores de saúde e de elevação da qualidade de vida das
populações (FONSECA; CORBO, 2007; BUSATO, 2016).
183
UNICESUMAR
A História Natural das Doenças é dividida em período pré-patogênico e patogênico. Para cada
período, há medidas de prevenção específicas e gerais para promover o controle ou a intervenção do
processo saúde-doença, conforme apresentado no Quadro 1.
Período pré-patogênico
Essa fase inicial ou de suscetibilidade é aquela em que o indivíduo ainda não manifesta a doença, mas
existem condições para o seu aparecimento. As condições de vida, características pessoais (como sexo,
idade e outros) e os hábitos podem facilitar ou dificultar os danos à saúde e são considerados fatores
de risco ou de proteção (PEREIRA, 2002; GORDIS, 2009).
Quando o indivíduo é exposto aos fatores de risco, tem maior probabilidade de desenvolver uma
determinada enfermidade. Por exemplo: a exposição ao fumo predispõe ao câncer de pulmão. Ao passo
que os fatores de proteção indicam que quando o indivíduo é exposto ao fator, ele tem uma menor chance
de desenvolver aquele problema de saúde. Por
exemplo, pessoas que praticam atividade físi-
ca regularmente estão mais protegidas contra
doenças coronarianas (PEREIRA, 2002).
A partir da multicausalidade, constrói-se o
modelo sistêmico, que é constituído de várias
causas que podem estar em diferentes níveis
de organização (veja a figura abaixo). O círculo
externo representa a sociedade, que engloba
os demais, como as famílias, que compreen-
dem o indivíduo, que é composto por órgãos
e células. Poderíamos ir mais adiante, com as
moléculas e os átomos. A partir deste círculo,
podemos procurar uma explicação ao dano à
saúde. Essa explicação incorpora o aspecto so-
cial à visão biomédica individualista, levando
Figura 8: Modelo sistêmico da pesquisa epidemiológica
a uma visão social e holística e, assim, cons- Fonte: a autora, adaptado de Pereira (2002).
truindo a Epidemiologia Social. As soluções
para o problema se darão de acordo com o nível afetado, variando desde uma intervenção individual
a uma coletiva (PEREIRA, 2002; FRANCO; PASSOS, 2011).
Na lógica multicausal, a tríade ecológica é a mais utilizada em Epidemiologia para identificar fatores
de risco, e é representada por três aspectos: o hospedeiro, o agente e o meio ambiente (Pereira, 2002;
Busato, 2016; Gordis, 2009; Rouquayrol e Almeida Filho, 1999; Almeida Filho e Barreto, 2011; Franco
e Passos, 2011).
184
UNIDADE 5
Este modelo representa a multicausalidade dos problemas de saúde e mostra a igual importância de
cada elemento que compõe a tríade. Sendo assim, todas as características devem ter a mesma relevân-
cia para o estudo de qualquer agravo à saúde. A partir da identificação das características da tríade
é possível analisar o processo saúde-doença e localizar racionalmente as intervenções (PEREIRA,
2002; BUSATO, 2016; GORDIS, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO;
BARRETO, 2011; FRANCO; PASSOS, 2011).
Nos fatores do hospedeiro, devemos levar em consideração a herança genética, a anatomia, a fi-
siologia do organismo e os hábitos e costumes, por exemplo. Nos fatores ambientais, temos o ambiente
físico, químico, biológico e social (PEREIRA, 2002; BUSATO, 2016; FRANCO; PASSOS, 2011; ROU-
QUAYROL; ALMEIDA FILHO, 1999). A pesquisa genética tem se fortalecido nas últimas décadas,
uma vez que muitos genes têm sido atribuídos à diferentes patologias. A essa investigação podemos
dar o nome de Epidemiologia Genética (PEREIRA, 2002; FRANCO; PASSOS, 2011).
Em relação à anatomia e à fisiologia do hospedeiro, é claro e evidente que, por exemplo, o sexo influen-
cia nas patologias encontradas, como é o caso de câncer colo do útero em mulheres e do de próstata nos
homens. Assim, temos as características como idade, raça, sexo (FRANCO; PASSOS, 2011) e os aspectos
imunológicos do hospedeiro, incluindo as imunizações naturais e artificiais (vacinação) (GORDIS, 2009).
Em relação ao estilo de vida, os hábitos e as condutas podem favorecer ou prevenir a ocorrência de danos
à saúde. Muitas doenças estão relacionadas com os hábitos diários; por exemplo: as doenças coronarianas
estão relacionadas ao sedentarismo, ao tabagismo, à obesidade, ao consumo elevado de gorduras e outros.
Assim como, nas doenças infecciosas, o hábito da prática sexual sem uso de preservativos pode predispor
às infecções sexualmente transmissíveis (PEREIRA, 2002; BUSATO, 2016).
Em relação aos fatores ambientais, que são designados como intrínsecos e extrínsecos ao hos-
pedeiro, podemos classificá-los como físico, biológico e social. No ambiente físico, temos os aspectos
do ar, água e lugares, assim como a constituição da flora e da fauna de um dado local. Por exemplo: as
altitudes, a umidade relativa do ar, a geografia, o clima, os recursos hídricos e a temperatura podem
influenciar a multiplicação de vetores e a sobrevivência de parasitas. Ainda temos os terremotos, as
inundações, a poluição e outras características que podem afetar a saúde ou a vida do indivíduo e da
sociedade (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999).
185
UNICESUMAR
No ambiente biológico, encontramos os seres vivos: agentes, vetores e reservatórios das doenças. As
condições ecológicas determinam a concentração de doentes em uma dada região, assim como, a distribuição
dos agentes biológicos, vetores, reservatórios e seres humanos infectados e os suscetíveis (PEREIRA, 2002).
O ambiente social está relacionado com os aspectos sociais, econômicos, políticos e culturais. É a
parte humana do meio ambiente organizada em sociedade. Aqui temos exemplos de fatores que afetam
a saúde do indivíduo: renda, nível de escolaridade, ocupação, transporte, emprego e outros. A partir da
quantificação dos aspectos sociais, podemos encontrar desigualdades, por exemplo, de cobertura dos
sistemas de saneamento e de serviços de saúde. Essas identificações das desigualdades determinam os
tipos e as intensidades das medidas preventivas e curativas utilizadas na intervenção do processo de
doença (PEREIRA, 2002; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999).
Podemos concluir que o estado de saúde-doença depende da interação e do equilíbrio desses fatores
ecológicos da tríade. A saúde reflete o resultado homeostase e a doença é resultante do desequilíbrio
desses fatores (FRANCO; PASSOS, 2011). O período pré-patológico pode evoluir ou não para a fase
patológica, e isso depende das ações e medidas tomadas neste período de exposição aos fatores de
risco. A prevenção da exposição aos fatores de risco e aos de proteção conduzirá a uma promoção da
saúde do indivíduo, evitando que este seja afetado por problemas de saúde.
Período patogênico
186
UNIDADE 5
Manifestações clínicas
Figura 10: Horizonte clínico da doença representado pelo ‘iceberg’ / Fonte: autoria própria, adaptado de Saúde & Cidadania (2017).
O iceberg representa o horizonte clínico, em que acima do mar encontram-se os casos clinicamente
aparentes, e abaixo, os inaparentes. No nível clínico, podemos ter vários desfechos, como o óbito, a
cronicidade do caso, que pode evoluir ou não para o óbito, a gravidade e a agudização, invalidez, os
casos fatais, as sequelas ou ainda a cura (GORDIS, 2009; FRANCO; PASSOS, 2011; ROUQUAYROL;
ALMEIDA FILHO, 1999).
A fase residual é aquela em que doença não progrediu para o óbito ou não houve cura completa,
observando-se alterações anatômicas e funcionais que se estabilizam. Podemos até dizer que é a pro-
gressão para a cronicidade. Esta estabilização é alcançada por tratamentos ou pelo próprio curso natural
da doença, que muitas vezes deixa sequelas. Neste caso, tomam-se medidas de recuperação à saúde
com o objetivo de reabilitar o indivíduo diante o aspecto físico, psicológico ou social. Por exemplo: a
reabilitação de indivíduos que sofreram acidentes a partir da fisioterapia (Pereira, 2002; Franco; Passos,
2011; Rouquayrol; Almeida Filho, 1999).
187
UNICESUMAR
Quadro 1 - Modelo de História Natural das Doenças: do horizonte clínico às medidas de prevenção.
Morte
Susceptibilidade Fase clínica Fase de incapacidade
Pré patogênese Patogênese residual
Invalidez
MEDIDAS PREVENTIVAS
188
UNIDADE 5
O objetivo principal da saúde pública é evitar as doenças, prolongar a vida e desenvolver a saúde
física e mental na sociedade. Esses objetivos se sobrepõe aos da Epidemiologia, a qual tem sido um
instrumento fundamental para a orientação das ações de saúde pública. As práticas de saúde podem
se basear no conhecimento epidemiológico para o planejamento, a execução e a avaliação de medidas
preventivas (ROUQUAYROL; ALMEIDA FILHO, 1999). Atualmente, a prevenção de danos à saúde é
classificada em (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999):
• prevenção primária: medidas aplicadas na fase anterior do início da doença, ou seja, no período
pré-patogênico;
• prevenção secundária: ações que interferem no curso da doença, no período patogênico;
• prevenção terciária: aplicada no estágio mais avançado da doença, com o objetivo de prevenir
a piora do quadro clínico, também aplicada no período patogênico.
A medidas de prevenção não são apenas responsabilidade dos profissionais de saúde, mas também
dos gestores e, principalmente, da sociedade.
Prevenção primária
As ações de prevenção primária são dirigidas para a manutenção da saúde, evitando a ocorrência da
fase patológica e de novos casos de agravos à saúde. É o que refere à promoção da saúde, não focando
apenas o individual, mas sim a melhoria da qualidade de vida da coletividade humana. Por exemplo:
práticas de educação para a saúde e saneamento ambiental, prática de esportes (PEREIRA, 2002;
FRANCO; PASSOS, 2011). A prevenção primária também engloba as ações de proteção específica,
como a imunização, a saúde ocupacional, a higiene pessoal e do lar; a proteção contra acidentes; o
aconselhamento genético; e o controle de vetores (ROUQUAYROL; ALMEIDA FILHO, 1999)
Na prevenção primária, a resposta às ações depende dos custos envolvidos, da magnitude da evi-
dência (unicausal; multicausal), da facilidade em reduzir ou eliminar a exposição ao fator específico
(GORDIS, 2009).
Prevenção secundária
As medidas de prevenção secundária são voltadas para o período patológico, seja em fase subclínica
ou clínica. Essas ações previnem a evolução do processo patológico no organismo, no sentido de fazê-lo
regredir ou cessar, como no caso do uso de antibióticos para doenças bacterianas. Nesse caso, há o
uso da medida preventiva com o intuito de prevenir um agravo maior, e não com função curativa. Por
exemplo: a utilização de aspirina por indivíduos que já tiveram infarto do miocárdio pode prevenir um
segundo infarto. Portanto, as ações secundárias visam a prevenir reincidências, complicações, sequelas
e óbitos (PEREIRA, 2002; FRANCO E PASSOS, 2011).
189
UNICESUMAR
A prevenção secundária também aborda o diagnóstico precoce a partir de inquéritos para a des-
coberta de casos na comunidade, os exames periódicos individuais, o isolamento do indivíduo para
evitar propagação das doenças e o tratamento da doença (ROUQUAYROL; ALMEIDA FILHO, 1999).
Na prevenção secundária, devemos considerar a gravidade da doença, se há possibilidade de de-
tecção precoce por métodos de diagnóstico, o quão onerosa e invasiva será a detecção, se o indivíduo
terá benefícios (como o tratamento, ausência ou mínimos efeitos colaterais) (GORDIS, 2009).
Prevenção terciária
Neste caso, as medidas preventivas se destinam à fase residual da doença, visando a desenvolver a
capacidade funcional do indivíduo, que foi reduzida pela doença. Exemplo: recuperar o indivíduo
que sofreu de poliomielite na infância; reabilitar aquele que sofreu um acidente (PEREIRA, 2002;
FRANCO; PASSOS, 2011). Nesses casos, englobam-se as medidas de reabilitação, a fisioterapia, a
terapia ocupacional e o emprego ao reabilitado (ROUQUAYROL; ALMEIDA FILHO, 1999).
Na saúde pública do Brasil, desdobram-se três níveis de atenção à saúde (PEREIRA, 2002; FRANCO;
PASSOS, 2011; GORDIS, 2009):
1. Atenção primária: aquela voltada para a promoção da saúde, ou seja, aquela em que as medidas
são destinadas à manutenção do bem-estar coletivo, sem uma doença específica. Por exemplo:
aquela que promove uma boa qualidade nutricional, de moradia, de emprego e até da imuni-
zação. As atividades são comumente realizadas pelas Unidades Básicas de Saúde (UBS);
2. Atenção secundária: engloba medidas que impedem o aparecimento de um determinado dano
à saúde, voltadas para a proteção da saúde. Inclui também a identificação e o tratamento de
processos patológicos, e a limitação do dano. As medidas são geralmente realizadas nas clínicas,
laboratórios e hospitais;
3. Atenção terciária: envolve medidas que desenvolvem o potencial funcional do organismo afe-
tado. Seria a reabilitação promovida, geralmente, por uma equipe multiprofissional que fornece
ações integradas para dar suporte físico, mental e social. Geralmente, as ações são realizadas
nas clínicas e hospitais.
190
UNIDADE 5
No Brasil, os três níveis de atenção à saúde são articulados a partir das Redes de Atenção em Saú-
de (RAS), garantindo a integralidade do cuidado. As diretrizes para a organização das RAS no
âmbito do Sistema Único de Saúde foi oficializado por meio da Portaria GM/MS nº 4.279, publi-
cada no Diário Oficial de 31/12/2010. As RAS possuem como eixo norteador e porta de entra-
da a atenção primária, que se articula e integra com a secundária e terciária. (MENDES, 2011).
Chegamos ao final de mais uma Unidade; agora você conheceu os conceitos básicos e a história da
nossa disciplina, que apesar de muito antiga, é atualizada e aplicada em todos os ciclos da vida. Agora
você já possui a base conceitual da Epidemiologia e podemos prosseguir para os próximos conteúdos
e aprofundar as práticas e os conceitos epidemiológicos.
CONSIDERAÇÕES FINAIS
Nesta unidade, estudamos os conceitos de Epidemiologia, saúde, doença, processo saúde-doença, fa-
tores etiológicos e prevenção. Todos esses conceitos são base para que você compreenda as próximas
unidades. Observamos que a saúde é o bem-estar físico, mental e psicossocial, e que deve ser estudada
pela Epidemiologia para identificar os desequilíbrios que acarretam os problemas de saúde. Concluí-
mos que a Epidemiologia é fundamental para o planejamento e orientação dos serviços de saúde,
uma vez que as necessidades da população são evidenciadas a partir dos estudos epidemiológicos. A
identificação das prioridades coletivas permite que sejam propostas medidas para os problemas de
saúde encontrados, como as medidas preventivas.
Concluímos que o estudo epidemiológico deve ser realizado rotineiramente a partir da coleta de da-
dos em clínicas, laboratórios, universidades, hospitais e outras instituições (como as de pesquisa), ou até
mesmo pelo indivíduo da comunidade. Esses dados devem ser interpretados quali e quantitativamente
para que se possa inferir a verdadeira situação de saúde da população. Uma das maneiras de transformar
os dados em informações é aplicando os cálculos dos indicadores de saúde e as medidas de ocorrência.
Vimos que são muitas as aplicações da Epidemiologia e que, desde a Grécia Antiga, os seus conceitos
e práticas vêm sendo aplicados nos níveis individual e coletivo, com o objetivo de compreender o pro-
cesso saúde-doença, identificar causas dos problemas de saúde e propor medidas de prevenção, a fim
de melhorar a qualidade e a expectativa de vida humana e ambiental. Muitas experiências de grandes
estudiosos, como John Snow, foram descritas aqui nesta unidade para que possamos compreender
que os estudos epidemiológicos não cessam; ao contrário, eles estão em constante transformação e
alcançam cada vez mais credibilidade na área científica. Os estudos mais importantes são aqueles com
cunho social e que podem modificar toda a história de uma sociedade.
191
1. Conceitue a ciência Epidemiologia.
c) James Lind realizou o primeiro ensaio clínico, e descobriu que o escorbuto era causado
pela deficiência de vitamina D.
d) Roberto Kock é considerado o Pai das Estatísticas Vitais e identificou causas de mor-
talidade, como prematuridade e raquitismo.
e) Oswaldo Cruz foi um médico sanitarista que descobriu o agente etiológico da Doença
de Chagas, o Trypanosoma cruzi.
192
4. Assinale Verdadeiro (V) ou Falso (F) quanto à História Natural das Doenças (HND).
( ) A HND é dividida em período pré-patogênico e patogênico. O primeiro refere-se à fase
que antecede a doença, e o segundo, à doença propriamente dita.
( ) A HND estuda a tríade ecológica que envolve apenas os aspectos do hospedeiro, do
agente e do ambiente, e não o social.
( ) Na fase patológica, além da doença, tem-se a preocupação com as suas sequelas,
com a incapacidade e até com o óbito.
Assinale a alternativa correta:
a) V; V; F.
b) F; F; V.
c) V; F; V.
d) F; F; F.
e) V; V; V.
5. Assinale Verdadeiro (V) ou Falso (F) para as alternativas referentes às medidas preven-
tivas utilizadas na Epidemiologia.
( ) A prevenção primária é voltada para ações que previnem o aparecimento da doença;
são medidas que antecedem o período patogênico. Por exemplo: saneamento básico
e imunizações.
( ) A prevenção secundária inclui medidas de proteção à saúde que interferem na fase
patológica. Por exemplo: diagnóstico e tratamento de uma doença específica.
193
Leia o texto sobre a imunização contra a varíola (variolização) e veja a importância
do conhecimento da História Natural das Doenças, a aplicação da estatística e da
medicina social para se obter a eficácia de medidas preventivas (como a vacinação),
quando aplicadas sobre as reais necessidades da população (como a varíola):
“A tentativa de imunização contra a varíola configura-se como uma prática milenar, an-
terior à constituição e divulgação do método experimental em biomedicina, que marcou
o final do século XIX, e à elaboração das teorias e conceitos que envolvem a elucidação
do processo imunitário, e à fabricação de vacinas em escala industrial, que só ocorreram
no século XX. Mesmo antes de se reconhecer a similaridade entre o cowpox (doença que
acometia os bovinos) e a varíola e de ter sido criada a vacinação, já se tinha observado que
a varíola podia ser evitada a partir do contato do homem sadio com o doente. Esta cons-
tatação impulsionou a disseminação de práticas, inicialmente orientais, que alcançaram
a Europa no início do século XVIII, conhecidas como ‘variolização’, ‘inoculação’ [...]. Apesar
de se estabelecerem como diferenciadas tecnicamente entre si, consistiam em implantar
no homem sadio o vírus variólico contido na secreção retirada das pústulas de pessoas
AGORA ÉCOMPLEMENTAR
doentes, na tentativa de provocar a instalação da varíola na sua forma mais branda com
manifestação local, tentando evitar a doença na expressão mais grave.
[...] A difusão da vacina antivariólica nos países europeus, a partir de fins do século XVIII,
veio aumentar o questionamento acerca da prática da inoculação do vírus variólico, incor-
COM VOCÊ
194
[...] A Gazeta Médica da Bahia, por exemplo, divulgou um artigo, assinado pelo médico
Pacífico Pereira, onde esse apoiava e elogiava a atuação de outro médico, Lucien Papillaud,
que desde 1847, no Sul do Brasil, se dedicava à prática da inoculação do vírus variólico,
tanto em indivíduos não vacinados como em alguns anteriormente vacinados. Baseado
em experiências formuladas por ele, Papillaud defendia a inoculação pós-vacinal através
da aplicação do vírus variólico, apontando-o como preservativo da varíola epidêmica,
indicando o vírus vacinal para o controle da varíola esporádica (endêmica). A estatística
elaborada por ele, em uma de suas experiências, mostra que entre 84 pessoas inoculadas
com o vírus extraído de variolosos (vírus variólico), 63 apresentaram erupção, sendo que,
entre estes, nove caracterizavam-se, segundo ele, como erupções variólicas. Dessa forma,
nesta experiência, o risco de contrair a varíola através deste tipo de aplicação era de mais
de 10%. [...]. Aparecem na prática deste médico três questões associadas: além do tipo de
agente a ser inoculado (vacinal ou variólico) sugere, também, diferenciação do estado de
distribuição da varíola epidêmica ou endêmica para escolha da aplicação a ser formulada,
distinguindo a revacinação da prática que denominou de inoculação pós-vacinal.
LEITURAÉCOMPLEMENTAR
[...] Com a introdução da vacina animal e a incorporação, no Brasil, principalmente a partir
da década de 1920, de novas técnicas de produção em escala industrial, gerou-se um novo
perfil da questão, que, em termos do controle da doença, culminou com sua erradicação
mundial, na década de 1970. Novas questões vêm surgindo, no início do presente século,
em relação à varíola, voltando a transformá-la em problema mundial, diante da perspectiva
COM VOCÊ
do vírus ser utilizado como arma biológica.
[...] Apesar de a vacinação se constituir como uma prática estatal, esta não respondia às
expectativas de controle da doença, devido às extensas dimensões territoriais e à falta de
serviços locais e nacionais articulados e adequados às necessidades e possibilidades das
práticas sanitárias.
195
A História e Suas Epidemias - A Convivência do Homem com os
Microorganismos
Stefan Cunha Ujvari
Editora: SENAC Rio
Sinopse: este livro faz o resgate abrangente e minucioso da luta travada
pela humanidade contra os germes ao longo dos séculos - desde a tenta-
tiva de compreensão das primeiras epidemias da História, passando pela
descoberta dos microorganismos como causadores de infecção e também
dos antibióticos e vacinas que levaram ao controle ou extinção de alguns deles. Descreve com
riqueza de detalhes a disputa aparentemente sem fim entre homens e micróbios; estes, a cada
avanço científico para destruí-los, contra-atacam com mutações e tipos mais resistentes.
COMPLEMENTAR
Erin Brockovich
Ano: 2000
Sinopse: Julia Roberts é a atriz principal e interpreta Erin, uma mulher
divorciada, com três filhos e sem um tostão no bolso que, depois de so-
frer um acidente, implora ao seu advogado para trabalhar com ele. Ela
VOCÊ
196
197
MEU ESPAÇO
MEU ESPAÇO
198
6
Indicadores de
Saúde e a Vigilância
Epidemiológica
Dra. Izabel Galhardo Demarchi
Olá aluno (a) nesta unidade vamos conceituar os métodos da ciência epi-
demiológica, ressaltando a questão das variáveis e indicadores de saúde,
problematizando instrumentos e técnicas de medida de doença e saúde na
pesquisa populacional e descrever o processo de coleta de dados para a
geração de informações epidemiológicas para a caracterização dos eventos
de saúde que ocorrem nas populações, nos grupos de indivíduos e na cole-
tividade humana. Vamos também apresentar as formas de expressão dos
resultados dos indicadores de saúde, conceituando a frequência absoluta
e relativa; os indicadores de saúde, ressaltando a importância do indicador
para a avaliação da situação de saúde das populações. E por fim, descre-
ver a estrutura e as funções do sistema de vigilância epidemiológica para
doenças transmissíveis e não transmissíveis. Identificar as fontes de dados
em saúde e conhecer os sistemas de informação em saúde.
UNICESUMAR
200
UNIDADE 6
Caro (a) aluno (a), você aprenderá a utilizar algumas das ferramentas epidemio-
lógicas usadas para quantificar a situação de saúde de uma população, assim
como compreenderá o papel da Vigilância Epidemiológica para a coleta de dados
e a geração de informações em saúde que podem ser utilizadas pelos gestores,
sanitaristas e pesquisadores para as tomadas de decisões e o planejamento das
ações e dos serviços de saúde.
Nesta Unidade, primeiramente, definiremos a noção de metodologia, desde o
descobrimento do problema e da obtenção de soluções até a geração e a correção
de hipóteses. Também abordaremos como as variáveis e indicadores epidemio-
lógicos são utilizados no campo epidemiológico.
Quando analisamos a situação de saúde de populações, nós nos deparamos
com diversos problemas de saúde, que precisam ter a ocorrência confirmada e
mecanismos para sua identificação e resolução e para a geração de novas ideias.
Para se ter fatos reais relevantes, que mereçam prioridade e maior atenção pelos
gestores e comunidade, a pesquisa do problema deve ser sistematizada e genera-
lizada, ou seja, de ponta (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL;
ALMEIDA FILHO, 1999).
Portanto, inicialmente, precisamos descobrir qual é o problema, a ‘’lacuna”
em um conjunto de conhecimento. O problema pode estar evidente e claro, ou
podemos sugerir um problema a partir de métodos quantitativos, ou ainda re-
colocar um velho problema à luz dos novos conhecimentos (ALMEIDA FILHO;
BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Por exemplo, pode-
mos verificar que a AIDS tem sido um problema evidente no mundo; observa-se
que as mortes por acidente de trânsito têm aumentado significativamente nos
últimos anos; e que casos de sarampo voltaram a ser notificados em algumas
regiões do país.
Após a colocação do problema, devemos procurar conhecimentos e instrumen-
tos para a solução deste problema. Por exemplo: encontrar técnicas que detectem
precocemente indivíduos infectados pelo HIV para se evitar o desenvolvimento
da AIDS propriamente dita, como a detecção precoce da infecção por métodos
laboratoriais. Em seguida, deve-se solucionar o problema, o que é uma das etapas
mais difíceis, pois podemos utilizar meios empíricos e teóricos já existentes ou
identificados, ou ainda inventar novas ideias (hipóteses, teorias e técnicas) (AL-
MEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011; ROUQUAYROL;
ALMEIDA FILHO, 1999). Por exemplo, investigar novos medicamentos para o
tratamento do HIV, ou métodos de cura.
201
UNICESUMAR
202
UNIDADE 6
Processo de seleção de amostras de elementos da população alvo para realizar um levantamento epidemiológico.
203
UNICESUMAR
Todo esse processo de geração de conhecimento científico-técnico é iniciado pela observação, tomada
como matéria-prima. As observações são transformadas em dados que podem produzir informa-
ções no final do processo produtivo, emergindo como conhecimento científico e tecnológico. Na
observação temos a identificação, a seleção, a coleta e o registro sistemático de características, pro-
priedades ou atributos relevantes de objetos naturais, culturais, pessoais e sociais. Podem ser objetos
de observação: o homem, o ambiente, as condições sócio-econômicas, uma célula, a massa corpórea,
uma doença, etc. (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Os dados podem ser expressos como indicadores, no sentido de que indicam parâmetros (valor
ideal de uma dada dimensão) ou propriedades (quantificáveis) do objeto em observação. Os dados não
refletem nenhuma informação quando analisados isoladamente, é necessário que haja um aglomerado
de dados para que tenham algum valor científico ou para que sejam utilizados para tomadas de decisão.
A transformação do dado em informação requer uma ferramenta analítica a partir da qual o dado é
organizado, classificado, condensado e interpretado. Por exemplo: o peso de um feto em particular é
um dado, compará-lo com um parâmetro estabelecido gera a informação de desnutrição ou de um bom
estado nutricional (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
204
UNIDADE 6
205
UNICESUMAR
206
UNIDADE 6
207
UNICESUMAR
Os instrumentos de coleta devem ser tão simples quanto possível e fáceis de serem organizados
e analisados posteriormente. Deve-se assegurar o correto preenchimento dos dados que tenham va-
riáveis suficientes para a produção de informação, pois a insuficiência de dados poderá prejudicar a
interpretação do estudo, assim como a coleta excessiva e complexa, que pode levar a erros e falhas de
preenchimento. Torna-se, também, muito importante a capacitação e o treinamento dos pesquisadores
ou dos indivíduos que alimentam os sistemas. Os instrumentos mais utilizados são os formulários,
protocolos, questionários e roteiros, que podem ser aplicados diretamente e pessoalmente para o
participante ou via internet, correspondência e outros (ALMEIDA FILHO; BARRETO, 2011; ROU-
QUAYROL; ALMEIDA FILHO, 1999).
RESULTADOS EPIDEMIOLÓGICOS
A maioria dos resultados ou informações em saúde são expressos como indicadores, e a preparação
destes envolve a contagem de unidades, como o número de doentes, de óbitos, etc. A forma mais sim-
ples de representar um resultado é a partir do número absoluto, denominando de frequência absoluta.
Essa forma de expressão de um resultado é a mais utilizada pela imprensa leiga rotineiramente. Por
exemplo: foram detectados dez casos de dengue na semana. Esses resultados podem ser utilizados para
comparar a situação de saúde entre regiões e em tempos diferentes (veja a Tabela 1) (PEREIRA, 2002;
GORDIS, 2009; FRANCO; PASSOS, 2011).
Outra forma de expressão é a frequência relativa, mais utilizada para facilitar a comparação e inter-
pretação e na qual os valores absolutos são expressos em relação a outros valores absolutos, calculan-
do-se a porcentagem (%) (veja Tabela 1) (PEREIRA, 2002; GORDIS, 2009; FRANCO; PASSOS, 2011).
208
UNIDADE 6
Para você entender melhor a frequência absoluta e relativa, vamos dar como exemplo os resultados
de Pierre Louis (mencionado na Unidade I), que realizou estudos para investigar a mortalidade por
pneumonia após tratamento com a sangria (Tabela 1). O estudo revelou, a partir da frequência absoluta
e relativa do número de óbitos, que a sangria realizada logo no início dos sintomas era extremamente
prejudicial para o tratamento da doença (PEREIRA, 2002).
Tabela 1 – Letalidade da pneumonia em franceses submetidos à sangria, Paris, 1835.
209
UNICESUMAR
Figura 4 – A utilização de computadores para digitação e armazenamento de bancos de dados também permite a construção
de gráficos e tabelas, e a análise estatísticas dos dados.
210
UNIDADE 6
A representatividade se refere à cobertura populacional que esse indicador alcança. Geralmente, para
que o indicador tenha esse alcance, utiliza-se a técnica de amostragem para se obter um processo adequado
de seleção das unidades componentes da amostra. Deve-se considerar os aspectos éticos, uma vez que os
indicadores devem manter o sigilo e não podem acarretar malefícios ou prejuízos às pessoas investigadas.
Do ângulo técnico-administrativo, o indicador deve ser de fácil cálculo, interpretação e obtenção, baixo
custo operacional, e ainda o cálculo deve ser simples e flexível (PEREIRA, 2002; FRANCO; PASSOS, 2011;
MEDRONHO, 2009).
Atualmente, a forma mais confiável para se obter informações válidas e de fácil transformação de dados
é a utilização de computadores para a digitação de bancos de dados informatizados. Os dados são arma-
zenados em computadores e, assim, são mais fáceis de serem manipulados, atualizados e comparados no
tempo e espaço (PEREIRA, 2002). A escolha do coeficiente é determinada pelos dados disponíveis e pelo
propósito da análise dos dados, e deve ser realizada de forma adequada para evitar vieses nas interpretações
da situação de saúde (GORDIS, 2009; FRANCO; PASSOS, 2011; MEDRONHO, 2009).
Morbidade
Limitações: as pessoas muitas vezes não percebem as anormalidades ou ainda tardam a procurar os serviços
de saúde, o que pode alterar as estatísticas e a variabilidade dos registros de morbidade (PEREIRA, 2002).
211
UNICESUMAR
Mortalidade
212
UNIDADE 6
Mortes/1000
nascidos vivos
175
100
50
25
10
1
TAXAS MUNDIAIS DE MORTALIDADE INFANTIL
Figura 5 – Taxa (ou coeficiente) de mortalidade infantil no mundo, ano de 2008. As áreas mais vermelhas são as com maior taxa de mortalidade
em menores de um ano de idade. Legenda: óbitos/mil nascidos vivos; taxa de mortalidade infantil no mundo. / Fonte: Wikimedia (2014, on-line)¹.
213
UNICESUMAR
Outros indicadores
214
UNIDADE 6
VIGILÂNCIA EPIDEMIOLÓGICA
215
UNICESUMAR
“
conjunto de ações que proporciona o conhecimento, a detecção ou prevenção de qual-
quer mudança nos fatores determinantes e condicionantes de saúde individual ou
coletiva, com a finalidade de recomendar e adotar as medidas de prevenção e controle
das doenças ou agravos.
Consequentemente, a vigilância deixou de ser um setor acessório e passou a integrar o nível decisório
da gestão. As atividades principais da VE são a coleta e o processamento dos dados coletados; a aná-
lise e a interpretação dos dados processados; a recomendação das medidas de controle apropriadas; a
promoção das ações de controle indicadas; a avaliação da eficácia e efetividade das medidas adotadas;
e a divulgação de informações pertinentes (MINISTÉRIO DA SAÚDE, 2009).
A VE tem muitos desafios, como a profunda mudança no perfil epidemiológico das populações (mu-
danças sociais e demográficas); o declínio das taxas de mortalidade por doenças infecciosas e parasitárias
e do crescente aumento das mortes por causas externas e doenças crônicas degenerativas, o que implicou
na incorporação de doenças e agravos não transmissíveis ao escopo de atividades da VE. Ainda, a VE tem
o propósito de fornecer orientação técnica permanente para os profissionais de saúde, que têm a respon-
sabilidade de decidir sobre a execução de ações de controle de doenças e agravos, tornando disponíveis,
para esse fim, informações atualizadas sobre a ocorrência desses casos, bem como dos fatores que a con-
dicionam, numa área geográfica ou população definida (MINISTÉRIO DA SAÚDE, 2009).
Os dados coletados geralmente são os dados demográficos, socioeconômicos, ambientais, de mor-
bidade e mortalidade e as notificações de surtos e epidemias. Esses dados são coletados a partir da
observação de pessoas e de doenças e agravos em saúde. A partir da observação de pessoas, podem ser
investigados os fatores de risco, os prognósticos para a doença, a eficácia de dada vacina/medicamento
(MINISTÉRIO DA SAÚDE, 2009).
A observação de doenças e
agravos permite detectar as varia-
ções de tendências e a frequência
dos problemas de saúde, identifi-
cando as doenças e agravos com
valores altos e baixos. Também
possibilita traçar o perfil das
doenças, priorizar problemas e
agir em função do diagnóstico
da situação. Faz parte da VE o
Centro de Controle de Zoonoses,
que realiza atividades dirigidas
aos vetores (Aedes sp., fleboto-
míneos e outros), reservatórios e
Figura 6 – Centro de Controle de Zoonoses, pertencente à Vigilância Epidemiológica
hospedeiros (MINISTÉRIO DA do município de Guaratinguetá (SP). Essa instituição tem a função de controle de
vetores, e suas atividades são voltadas para os reservatórios e hospedeiros de
SAÚDE, 2009). doenças que acometem os animais / Fonte: (Wikimedia, 2015, on-line)³.
216
UNIDADE 6
217
UNICESUMAR
CONSIDERAÇÕES FINAIS
Caro(a) aluno(a), você aprendeu a aplicação de algumas ferramentas epidemiológicas, como os indicadores
de saúde e a Vigilância Epidemiológica (VE). Pode entender que a construção dos indicadores e as ações
de VE ocorrem diariamente ou de forma periódica.
Conhecemos as estratégias metodológicas para realizar os estudos epidemiológicos, desde o sur-
gimento da pergunta científica, passando pela detecção do problema e pela formulação de hipóteses
até a solução do problema e a validação da hipótese.
Descrevemos o conceito de dados, como realizar a coleta de dados e a importância da transformação
dos dados em informação. Nós caracterizamos as variáveis epidemiológicas (qualitativas e quantitativas;
contínuas e discretas; dependentes e independentes; resposta e preditora) e citamos as fontes para coleta
dos dados (IBGE, SINAN, SIM e outras bases). Você também pode compreender o papel das informações
para determinar a situação de saúde, planejamento e gestão em saúde.
Descrevemos também como expressar os resultados epidemiológicos em frequências, absolu-
ta e relativa (porcentagem, coeficientes e taxas). Abordamos o conceito de indicador de saúde e
apresentamos os principais indicadores, morbidade e mortalidade, seus cálculos, interpretações
e limitações. A partir disso, você pode compreender a importância desses parâmetros para o pla-
nejamento de ações e serviços em saúde pelos gestores e para a avaliação de programas e serviços
de saúde.
Finalmente, fizemos uma síntese de como atua a Vigilância Epidemiológica e vimos que a observação
das pessoas e das doenças e agravos em saúde, rotineiramente ou de forma periódica, é fundamental
para se estabelecer a situação de saúde de uma população, identificar fatores determinantes e condi-
cionantes de saúde, avaliar ações e programas e subsidiar as tomadas de decisão.
Assim chegamos ao fim de mais uma unidade.. Espero que você tenha compreendido as funções e
como utilizar a metodologia epidemiológica e os indicadores de saúde para o estudo da situação de
saúde das populações, assim como que tenha entendido a importância da Vigilância Epidemiológica
nas atividades diárias dos serviços de saúde e gestão.
218
1. Para que servem os indicadores de saúde?
2. Em relação à fase que vai da coleta de dados até a geração de informação em saúde,
selecione a alternativa correta.
a) Os dados epidemiológicos podem ser utilizados de forma bruta para se gerar conhe-
cimento sobre a situação de saúde de uma população.
b) Os dados podem ser coletados rotineiramente nas atividades e serviços de saúde,
mas nunca ocasionalmente.
c) A coleta de dados periódica, realizada por inquéritos epidemiológicos, não pode ser
utilizada para a interpretação da situação de saúde, uma vez que não possui credibi-
lidade científica.
d) As variáveis qualitativas não possuem a mesma relevância epidemiológica que as
variáveis quantitativas.
e) Os dados devem ser trabalhados, matemática e estatisticamente, para gerar uma
informação utilizável para interpretar a situação de saúde de uma população.
219
4. Em relação aos indicadores de saúde, assinale verdadeiro (V) ou falso (F).
( ) Os indicadores de saúde são utilizados para subsidiar a tomada de decisão de forma
racional e bem fundamentada.
( ) Os indicadores podem ser expressos por frequência absoluta (a mais utilizada), relativa
(porcentagem) e, em menor caso, por coeficientes ou taxas.
( ) O indicador de morbidade é calculado pelo número de pessoas doentes dividido pelo
de número de pessoas na população.
( ) A morbidade pode ser obtida em base de dados de notificação compulsória e em
inquéritos epidemiológicos, enquanto que na mortalidade os dados são retirados
apenas de declaração de óbito.
( ) O indicador de mortalidade tem muitas limitações, como a subcontagem ou sobre-
contagem do numerador e o preenchimento de declaração de óbito com causas mal
definidas.
5. Em relação ao papel da Vigilância Epidemiológica (VE), assinale verdadeiro (V) ou falso (F).
( ) A VE é responsável pela vigilância das condições sanitárias de portos, restaurantes,
escolas e outros estabelecimentos.
( ) A VE deve proporcionar o conhecimento, a detecção ou a prevenção de qualquer
mudança nos fatores determinantes e condicionantes de saúde individual ou coletiva.
( ) Outra finalidade da VE é recomendar e adotar as medidas de prevenção e controle
AGORA É COM VOCÊ
220
Neste texto, você poderá construir uma visão crítica sobre os dados utilizados para os
resultados dos indicadores de saúde de mortalidade e morbidade. Aqui são expostos os
principais problemas enfrentados para a confiabilidade dos indicadores.
“Ao avaliar a exatidão dos dados de mortalidade, muitos autores consideram “padrão ouro”
os diagnósticos obtidos nas necropsias. Ainda que estes se constituam em excelente fonte
de informação para o preenchimento de causas nas declarações de óbito, sabe-se que não
é bem assim. De fato, mesmo que 100% das mortes fossem submetidas à necropsia, não
se teria 100% de exatidão nas mesmas, visto que nem todos os patologistas preenchem
adequadamente os atestados de óbito.
[...] quando a evolução para o óbito é muito rápida, a proporção de erros de diagnóstico é
grande, como o verificado com a hemorragia cerebral e a oclusão coronária.
[...] Entre nós, há poucos estudos comparando as informações do atestado de óbito com
dados de autópsia.
LEITURAÉCOMPLEMENTAR
[...] Por outro lado, apenas os dados da necropsia não são, muitas vezes, suficientes para
elaboração de uma sequência causal lógica e adequado preenchimento da declaração de
óbito. Pensa-se, nesse caso, haver necessidade também de informações clínicas, razão pela
qual acredita-se que a melhor forma de preencher a declaração de óbito é a originada da
união das informações de uma necropsia e um prontuário, ambos bem elaborados.
COM VOCÊ
[...] O que foi aqui descrito quanto à fidedignidade dos dados de mortalidade diz respeito
apenas à declaração da causa básica, a qual nem sempre é feita de maneira correta pelos
médicos. Por outro lado, as estatísticas podem apresentar falhas, mesmo quando a causa
da morte é declarada corretamente, porque existe a possibilidade de erros na codificação
da causa, por conta de codificadores mal preparados. No Brasil, após a municipalização
das ações de saúde, a codificação das causas de morte passou a ser feita nas secretarias
municipais de saúde, o que fez com que a quantidade de codificadores crescesse assusta-
doramente, sendo que o Brasil é, hoje, talvez, o país com maior número de codificadores
de causas de morte. Esse fato fez com que se tornasse difícil o seu treinamento e, parti-
cularmente, o acompanhamento e a supervisão necessários para o bom andamento dos
trabalhos. Assim, corre-se o risco de ver deterioradas as estatísticas de mortalidade, caso
AGORA
não seja feita boa formação dos codificadores e supervisão, em nível municipal. A tentati-
va de sanar essa questão e uniformizar o trabalho desenvolvido foi feita por meio de um
programa para seleção eletrônica da causa básica da morte, o qual vem sendo utilizado
regularmente através do programa Seletor da Causa Básica – SCB, desenvolvido pelo Centro
Brasileiro de Classificação de Doenças em conjunto com o Datasus/Ministério da Saúde.
Este, embora ainda com algumas falhas, representa a esperança de uma boa codificação
221
da causa da morte, além de assegurar a comparabilidade dos seus dados, em todo o País.
Outro fator que pode afetar as estatísticas de mortalidade por causas, somente para es-
tudos de tendências, é a introdução de novas revisões da Classificação Internacional de
Doenças. Com o objetivo de sanar esse viés, a OMS e a Rede de Centros Colaboradores
da OMS para a Classificação de Doenças publicam uma equivalência dos códigos entre as
revisões, a qual deve ser usada nesses estudos, sempre que o período estudado englobar
mais do que uma revisão. Um cuidado também a ser tomado para evitar distorção dos
dados, na análise epidemiológica, refere-se à necessidade de selecioná-los segundo local de
residência do falecido ou, em caso específico, segundo local de ocorrência. Além de todos
esses aspectos, é preciso introduzir no currículo das escolas médicas (nos últimos anos e
mesmo na residência médica) temas relacionados às estatísticas de mortalidade, seus usos
e a importância do preenchimento do atestado de óbito e a maneira correta de fazê-lo.
A excessiva multiplicação dos cursos de medicina é bastante preocupante, visto que pode levar
a uma situação em que, se os alunos estão correndo o risco de serem mal preparados nas artes
de diagnosticar e tratar, certamente, não serão melhores quanto a declarar do que morreram
AGORA ÉCOMPLEMENTAR
seus pacientes.”
222
Epidemiologia. Indicadores de Saúde e Análises de Dados
Tatiana Gabriela Brassea Galleguillos
Editora: Saraiva
Sinopse: o livro apresenta os conceitos de Epidemiologia e estatística, bem
como sua utilização no decorrer do tempo. Discute as diferentes teorias
que explicam o processo saúde-doença, inclusive a que contempla os
Determinantes Sociais em Saúde. Mostra os indicadores mais utilizados
para medir morbidade e mortalidade, associando-os às metas mundiais
e nacionais, como os Objetivos do Milênio. Aponta as características de doenças transmissíveis
e não transmissíveis e os impactos que causam nas diferentes regiões do país. Por fim, explica
a transição epidemiológica ocorrida no Brasil e o planejamento em saúde, a partir do uso de
indicadores epidemiológicos, como ferramenta de gestão do SUS. O conteúdo pode ser aplicado
COMPLEMENTAR
para os cursos técnicos em Agente Comunitário de Saúde, Enfermagem, Gerência em Saúde,
Registros e Informações em Saúde, Vigilância em Saúde, entre outros.
VOCÊ
A Organização Pan-Americana de Saúde subsidia a Rede Interagencial
de Informações em Saúde (RIPSA), que traz as bases de dados para
os Indicadores e Dados Básicos para a Saúde no Brasil. Acesse o link
abaixo e veja mais.
Para acessar, use seu leitor de QR Code.
É COM
MATERIAL
AGORA
223
MEU ESPAÇO
224
7
Medidas de
Frequência e de
Associação
Dra. Izabel Galhardo Demarchi
226
UNIDADE 7
“
ciência que estuda o processo saúde-enfermidade na sociedade, analisando a distri-
buição populacional e fatores determinantes do risco de doenças, agravos e eventos
associados à saúde, propondo medidas específicas de prevenção, controle ou erradicação
de enfermidades, danos ou problemas de saúde e de proteção; promoção ou recuperação
da saúde individual ou coletiva, produzindo informação e conhecimento para apoiar a
tomada de decisão no planejamento, administração e avaliação de sistemas, programas,
serviços e ações de saúde.
Podemos ver que o objetivo da Epidemiologia é verificar a distribuição dos determinantes das doenças,
dos agravos e de outros eventos ligados à saúde nas populações. Contudo, qual é a ferramenta dos epi-
demiologistas para verificar e analisar essa distribuição? Destacamos aqui a importância e a utilização
das medidas de frequência das doenças e outros desfechos nas populações.
227
UNICESUMAR
Para explorar melhor a ocorrência das doenças e sabendo-se que os riscos das doenças são afetados
pelos fatores pessoais, de tempo e lugar, precisamos perguntar (GORDIS, 2009):
60
40
20
228
UNIDADE 7
Neste gráfico, disponibilizado pelo Ministério da Saúde, verificamos que o maior número de casos
de violência ocorre no sexo feminino e que, de acordo com os anos, o número de casos mantém uma
constância e é quase duas vezes maior nas mulheres que nos homens.
No exemplo acima, foi utilizada representação gráfica do tipo linear para mostrar a frequência
dos casos de violência. Veja que a discussão do porquê o maior número de casos ocorre nas mulhe-
res ainda não é feita. Essa análise qualitativa não será trabalhada aqui, até porque são necessários
muitos outros dados e informações.
A pergunta Onde indicará a distribuição geográfica da doença; pode ser em um bairro, uma cidade,
uma zona rural, um estado, um país ou ser global. Destacamos aqui a variável lugar (UNAIDS, 2008):
Prevalência de HIV
em adultos %
>15
5 - 15
2-5
1-2
<1
sem dados
Figura 2. Prevalência global de HIV/AIDS em adultos jovens (15 a 49 anos) no ano de 2008. / Fonte: Wikimedia (2015, on-line)³.
Você conhece as doenças mais frequentes em seu município, estado e país? No Brasil, as
doenças mais frequentes e que mais matam são as doenças cardiovasculares e as neoplasias.
229
UNICESUMAR
As fontes de dados utilizadas para se obter as informações de uma pessoa doente, o período e o lo-
cal da doença são provenientes de registros contínuos, como as Declarações de óbito, notificações
(sistemas de informação), prontuários médicos e hospitalares, ou ainda registros periódicos como os
inquéritos epidemiológicos e estudos científicos (GORDIS, 2009; PEREIRA, 2003). Os dados podem
ser representados utilizando cartogramas (distribuição dos casos de acordo com a área geográfica, por
exemplo, a figura 2) e diagramas (linear ou tabular, veja a figura 1). A partir dos cartogramas, podemos
compreender a distribuição da doença conforme o lugar (alas de um hospital, bairros, municípios,
países, ou global), e os diagramas podem trabalhar diversas variáveis como, a frequência da doença de
acordo com tempo, lugar e pessoa. O diagrama pode ser linear, como na figura 1, utilizando linhas ou
ainda barras (como na figura 3). outra forma de representar os dados é utilizando tabelas (FRANCO;
PASSOS, 2011).
Mas como medir os fenômenos?A ocorrência das doenças pode ser medida utilizando-se taxas ou
proporções. As taxas mostram a rapidez de ocorrência de uma doença numa população, e as proporções
nos mostram a fração da população que é afetada por aquele fenômeno. As medidas de ocorrência de
uma doença é também chamada de medida de morbidade, em que estão incluídas a prevalência e in-
cidência; também existem as medidas de mortalidade (GORDIS, 2009; FRANCO; PASSOS, 2011), que
foram discutidas na unidade anterior, no tópico 4 (Indicadores de Saúde, coeficientes de mortalidade).
Resumidamente, a medida de prevalência é aquela utilizada para verificar a frequência de casos
novos e antigos de uma doença, enquanto que a incidência refere-se apenas aos casos novos de uma
enfermidade. A seguir, definiremos os conceitos, cálculos e interpretações das medidas de frequência
de prevalência e incidência.
230
UNIDADE 7
PREVALÊNCIA
0,02 x 10.000= a prevalência é de 200 casos a cada 10.000 pessoas naquele período ou tempo;
0,02 x 1.000= a prevalência é de 20 casos a cada mil pessoas naquele momento ou período.
231
UNICESUMAR
Dizemos que a prevalência é uma medida de frequência retrospectiva, uma vez que conta com o nú-
mero de casos antigos e do presente, refletindo o passado até o momento da pesquisa (GORDIS, 2009).
Um exemplo de retrospectivo: realiza-se um estudo no ano de 2017 e utilizam-se dados dos anos de
2000 a 2015 para verificar a prevalência de uma doença, ou seja, a pesquisa utiliza dados do passado e
do momento da pesquisa. Na prevalência, não levamos em consideração a duração da doença (GOR-
DIS, 2009), isto é, podemos ter pessoas com 10 a 20 anos de duração de uma doença, como a artrite
reumatoide. Consequentemente, essas pessoas sempre farão parte do numerador (GORDIS, 2009).
Portanto, a prevalência pode ser considerada uma fotografia da doença naquele lugar e tempo,
sendo uma medida estática. É também muito útil para medir a frequência e a magnitude de proble-
mas crônicos, como a diabetes mellitus, a hipertensão arterial, as neoplasias e outras doenças de longa
duração ou com longo período de latência, como a infecção pelo HIV e as hepatites virais (GORDIS,
2009; FRANCO; PASSOS, 2011). Na figura 3, temos a representação gráfica na forma de barra da
distribuição da prevalência da infecção pelo HIV e morte, nos EUA, utilizando dados de 1980 a 2015:
800
Total (milhões)
600
400
200
1980
1985
1990
1995
2000
2005
2010
2015
Figura 3. Prevalência de pessoas infectadas pelo HIV e óbitos por AIDS a cada mil pessoas nos Estados Unidos da América, no
período de 1980 a 2015 / Fonte: Wikimedia (2018, on-line)4.
Em azul, temos a prevalência de pessoas vivendo com HIV, e em laranja, a taxa de óbito por Síndrome
da Imunodeficiência Adquirida (AIDS).
232
UNIDADE 7
233
UNICESUMAR
• problemas com os numeradores: muitas vezes definir quem tem a doença não é uma tarefa fácil.
Isso pode ocorrer quando a doença é de difícil diagnóstico, como a asma, a artrite reumatoide ou
a neoplasia. Ou ainda, a pessoa pode ter a doença, mas não está ciente que a possui, ou não tem a
atenção médica ou a informação. O indivíduo pode ainda não recordar de ter tido o episódio da
doença ou a exposição aos fatores investigados. O entrevistador ou pesquisador pode não cadastrar
corretamente a informação ou não formular corretamente a pergunta, ou ainda ser tendencioso;
• problemas com denominadores: contagens seletivas de certos grupos na população, deixando de
adicionar todos os indivíduos que deveriam compor o denominador. Outro erro é o de utilizar os
dados populacionais do IBGE de um ano diferente do estudado. Gordis (2009) afirma que todos
do denominador devem ter o potencial para entrar no grupo representado no numerador. Como
exemplo: em um estudo que avalia a prevalência de câncer de colo uterino, mulheres histerectomi-
zadas (histerectomia é a remoção parcial ou total do útero) não devem compor o denominador, pois
não estão sob o risco de câncer de colo uterino. Incluí-las no denominador levaria a taxas incorretas.
• problemas com dados hospitalares: as admissões nos hospitais são seletivas em relação às ca-
racterísticas pessoais, à gravidade da doença, às condições associadas, e às políticas de admissão;
os registros hospitalares não são elaborados para pesquisas e podem ser incompletos, ilegíveis ou
perdidos, ou ainda muito variados na qualidade do diagnóstico; a população do denominador
não é geralmente bem definida.
INCIDÊNCIA
A incidência é uma medida de frequência dinâmica, como um filme, e é prospectiva. Isso significa que as
frequências das doenças variam conforme se passa o tempo. Sem contar os casos antigos, ela mede os dados
do presente e os novos que surgem prospectivamente (GORDIS, 2009; FRANCO;PASSOS, 2011; PEREIRA,
2003). Um exemplo de prospectivo é quando se inicia um estudo em 2017 e os dados são coletados nesse
mesmo ano e nos seguintes, por exemplo até 2020. Ou ainda, os dados são coletados do passado, mas só se
contabilizam os casos novos e não os que persistiram ao longo dos anos do estudo. A incidência de uma
doença é definida como o número de casos novos de uma doença ou agravo que ocorrem um período
determinado de tempo em uma população que está sob o risco de desenvolver a doença. O cálculo da taxa
de incidência se dá pela equação (GORDIS, 2009; FRANCO; PASSOS, 2011; PEREIRA, 2003):
234
UNIDADE 7
Número de casos novos da doença em um período de tempo, dividido pelo número de pessoas da
população sob o risco de desenvolver a doença. o Resultado deve ser multiplicado por 10n
No denominador, devemos utilizar a população exposta ao risco de desenvolver a doença, ou seja,
aquelas que já possuem a doença não podem ser contadas para compor o denominador. A potência de
10 pode ser 100 (%), 1.000, 10.000, 100.000, 1 milhão ou outro número. O fundamental na incidência é
contar apenas os casos NOVOS no numerador. A incidência mede a ocorrência de um evento, a iden-
tificação de uma pessoa que desenvolve uma doença e que não a apresentava anteriormente. Como é
uma medida que avalia a transição do saudável para o doente, dizemos que a incidência é uma medida
de risco, diferentemente da prevalência (GORDIS, 2009; FRANCO; PASSOS, 2011; PEREIRA, 2003).
O indivíduo do denominador deve ter potencial para ser um numerador (GORDIS, 2009). Tomemos
como exemplo a pesquisa da incidência de câncer de colo uterino. Neste caso, o denominador deve ser
composto apenas por mulheres, pois os homens não possuem potencial para ter câncer de colo uterino.
O mesmo se aplica para a pesquisa de câncer de próstata em homens, na qual não devemos incluir as
mulheres no denominador, uma vez que não possuem próstata.
A incidência é muito útil para medir a frequência e a magnitude de problemas agudos (dengue, gripe,
infecções parasitárias, alergias). As doenças que os geram têm curta duração e os casos não se mantém
por longo período, não havendo uma prevalência significativa ao longo de um ano, por exemplo. Para
doenças que ocorrem sazonalmente ou cuja duração dos sintomas é de semanas ou poucos meses,
podemos utilizar a incidência como medida de frequência (GORDIS, 2009; PEREIRA, 2003). Também
utilizamos a incidência quando pretendemos avaliar a eficácia de uma vacina (estudos do tipo ensaio
clínico). Nestes estudos experimentais, uma população sem a doença é submetida à imunização com a
vacina e observa-se, ao longo do tempo (prospectivo), o aparecimento da doença, ou seja, a frequência
dos casos novos. Veja o exemplo da figura abaixo:
900
800
700
Casos (milhões)
235
UNICESUMAR
Neste exemplo, podemos ver a diferença entre incidência e prevalência. No ano de 2015, na cidade X, ti-
nhamos uma população de 500 mil pessoas, 320 casos novos e 42 casos antigos de tuberculose, totalizando
362 casos existentes. A incidência é calculada apenas com os casos novos de tuberculose (320/499.958,
lembre-se que o denominador é a população que está sob o risco de adoecer, e 42 já estavam doentes) a
cada 100.000 habitantes. A prevalência se calcula a partir do total de casos, somando-se os antigos e os
novos (362/500.000). Por isso, a prevalência é maior que a incidência. Observamos ainda que no ano de
2016 a incidência foi mais elevada, mas a prevalência manteve-se constante, pois a prevalência ainda leva
em consideração os casos curados e os óbitos, e reflete a constância da doença ao longo do tempo.
A tuberculose geralmente é uma doença crônica com duração maior que seis meses a um ano, na
qual a prevalência é a medida de frequência mais utilizada, mas a incidência é uma medida que nos
mostra o risco de a doença acometer uma população, enquanto a prevalência não (GORDIS, 2009).
Portanto, a escolha da medida de frequência deve ser adequada e determinada pela característica de
duração da doença. Para doenças de longa duração, podemos utilizar prevalência e incidência, e para
as de curta duração, a ideal e recomendada é a incidência. Todas devem ser calculadas quando se têm
os números confiáveis do numerador e do denominador (GORDIS, 2009; FRANCO; PASSOS, 2011).
Em algumas situações, podemos utilizar a relação entre a incidência e prevalência, principalmente na-
quelas em que as taxas de uma doença não se alteram, ou a taxa de imigração é semelhante a de emigração.
Podemos aplicar a seguinte equação (GORDIS, 2009; FRANCO; PASSOS, 2011; PEREIRA, 2003):
236
UNIDADE 7
Após a identificação dos principais problemas de saúde de uma população, é preciso perguntar: quais
são as causas para que ocorram os óbitos, as doenças, os agravos?
A pesquisa dos fatores de risco ou de proteção que determinam os fenômenos de doença e saúde
podem ser realizados por estudos epidemiológicos observacionais ou experimentais. Brevemente, os
observacionais são aqueles em que o pesquisador coleta os dados (retrospectivos ou prospectivos),
observa os fenômenos finais e os de exposição e não interfere na saúde ou na doença do indivíduo,
enquanto que os experimentais são aqueles em que o pesquisador interfere na saúde do indivíduo,
como na testagem de uma novo medicamento, vacina ou método de diagnóstico por exemplo (GOR-
DIS, 2009; FRANCO; PASSOS, 2011; BENSEÑOR; LOTUFO, 2005).
237
UNICESUMAR
238
UNIDADE 7
Mas o que seriam associação e causalidade? Essas duas palavras não são sinônimos. Dois eventos po-
dem estar associados sem que um seja a causa do outro; eles podem também estar etiologicamente ligados.
O termo associação tem o significado de relação (ou correlação) estatística entre dois ou mais eventos.
Causalidade, relação de causa e efeito entre dois eventos, significa que a presença de um deles contribui
para a presença do outro (ALMEIDA FILHO; BARRETO, 2011). É o que ocorre entre um fator de risco e
uma doença. A remoção do fator de risco, por sua vez, diminui a frequência da doença. Exemplo: a falta de
higiene das mãos, a presença de pessoas doentes em locais fechados, a falta de imunização pela vacina da
gripe são fatores que estão associados à gripe, e o agente viral é a causa da doença.
O risco é a probabilidade de que pessoas que estão sem uma doença, mas expostas a certos “fatores de risco”
adquiram a doença. Qual é o risco da pessoa não vacinada contrair o vírus influenza e adquirir uma gripe?
A investigação epidemiológica gera resultados que indicam os riscos de que uma pessoa exposta a um
determinado desenvolva uma enfermidade ou um outro evento. O risco é uma quantificação da associação
entre a exposição a um fator e o surgimento de uma doença (PEREIRA, 2003; ALMEIDA FILHO; BARRETO,
2011; BENSEÑOR; LOTUFO, 2005). Por exemplo, qual é o risco de desenvolver uma doença coronariana
quando exposto a altos níveis de colesterol? Essa resposta pode ser dada a partir de cálculos matemáticos
de risco. Logo, o risco é a probabilidade de ocorrer um evento quando há a exposição a um fator. No en-
tanto, nem todos as pessoas têm os mesmos riscos. Há pessoas que se expõem ou vivem perigosamente e
que possuem maior probabilidade de morrer precocemente. Há outras que não se expõem intensamente,
mas que estão sobre o risco de adoecer ou sofrer por algum dano, e não de morrer tão precocemente. No
caso da doença coronariana, os coeficientes mais elevados estão nos grupos de pessoas que fumam, mas as
pessoas que não fumam também podem ser atingidas, porém com menor probabilidade (MEDRONHO,
2009; PEREIRA, 2003; ROUQUAYROL; ALMEIDA FILHO, 1999; BENSEÑOR; LOTUFO, 2005).
Um dos estudos de coorte mais famosos e que inspiraram muitas pesquisas foi o estudo de
Framingham (EUA), conhecido como Framinghan Heart Study. O estudo iniciou em 1949 para
identificar fatores associados com o risco aumentado de doença cardíaca coronariana (DCC).
Uma amostra representativa de 5.209 homens e mulheres, com idade de 30 a 59 anos, foi se-
lecionada de aproximadamente 10.000 pessoas daquela faixa etária vivendo em Framingham.
Destes, 5.127 não tinham doença cardíaca coronariana quando do primeiro exame e estavam
portanto, em risco de desenvolverem DCC. Essas pessoas foram reexaminadas a cada 2 anos
para avaliar evidências de DCC, e todas foram submetidas a eletrocardiograma e exames de
sangue (triglicerídeos, colesterol total, glicemia, e outros). O estudo transcorreu por mais de 30
anos e demonstrou que o risco de desenvolver DCC está associado com a pressão arterial, o
colesterol sérico, o hábito de fumar, a intolerância a glicose e a hipertrofia ventricular esquerda
Fonte: Lotufo (2008).
239
UNICESUMAR
Para verificarmos a associação entre um fator de risco e uma doença, podemos utilizar as medidas
de risco e de probabilidade de um evento ocorrer após a exposição a um fator de risco. Para os estudos
retrospectivos do tipo transversal e de caso-controle, recomendamos o cálculo da razão de chances:
A palavra Odds ratio (OR) vem do inglês odds=pares e ratio= proporção, e é a divisão entre a probabi-
lidade de um evento acontecer quando se está exposto ou não a um fator de risco. É uma estimativa do
risco relativo, é a chance, a probabilidade (GORDIS, 2009; BUSATO, 2016; BENSEÑOR; LOTUFO, 2005).
Para compreendermos o cálculo e a interpretação das medidas de OR, razão de prevalência (RP)
e risco relativo (RR), é imprescindível construir uma tabela de contingência, também chamada de
tabela 2 x 2 (GORDIS, 2009; FRANCO; PASSOS, 2011; BENSEÑOR; LOTUFO, 2005). A sugestão
é que você sempre construa a tabela colocando a exposição à esquerda na vertical e o evento final
(desfecho: doença, óbito, agravo) à direita na horizontal; veja o exemplo a seguir:
Tabela 2 - Modelo de tabela 2x2 ou de contingência (exposição x desfecho)
Observe que os pares concordantes, as respostas Sim e Sim (A) e Não e Não (B), permanecem no mesmo
local em ambas as tabelas, enquanto que os pares que discordam, respostas Não e Sim (C), Sim e Não (D),
mudam de posição na tabela. Isso pode confundí-los quando forem aplicar as fórmulas das medidas de
associação. Por isso, é sempre importante, entender o cálculo da medida e não só saber aplicar fórmulas.
240
UNIDADE 7
A razão de chances (OR) é, na verdade, a razão entre o produto dos pares concordantes e
o produto dos pares discordantes (GORDIS, 2009; FRANCO; PASSOS, 2011; BUSATO, 2016;
BENSEÑOR; LOTUFO, 2005).
Câncer de pulmão
Exposição ao fumo
Casos (Sim) Controles (Não) Total
Fumantes (Sim) 1.292 (A) 1.246 (B) 2.538 (A + B)
Não fumantes (Não) 8 (C) 54 (D) 62 (C +D)
2.600
Total 1.300 (A + C) 1.300 (B + D)
(A +B +C +D)
Fonte: a autora.
Assim, de 1.300 pessoas com o câncer de pulmão, 1.296 relataram serem fumantes; e de 1.300
controles, 1.246 também eram fumantes. Neste caso, como se trata de um estudo retrospectivo,
a medida de OR é a mais apropriada para indicar uma associação entre o fumo e o câncer de
pulmão. Logo:
241
UNICESUMAR
Tabela 5 - Exemplo 2, tabela de contingência de estudo de caso-controle sobre o câncer de pulmão e exposição ao fumo
(dados hipotéticos)
Exposição ao fumo
Câncer de pulmão
Fumantes (Sim) Não fumantes (Não) Total
Casos (Sim) 1.292 (A) 8 (C) 1.300 (A + B)
Controles (Não) 1.246 (B) 54 (D) 1.300 (C +D)
2.600
Total 2.538 (A + B) 62 (C + D)
(A +B +C +D)
Fonte: a autora.
Dislipidemia
Exposição
Doentes (Sim) Não doentes (Não) Total
Consumo de carne acima de 2 vezes por
200 (A) 200 (B) 400 (A + B)
semana (Sim)
Consumo de carne menor que 2 vezes na
100 (C) 100 (D) 200 (C +D)
semana (Não)
600
Total 300 (A + C) 300 (B + D)
(A +B +C +D)
Fonte: a autora.
Logo, OR = (200 x 100)/ (200 x 100)= 20000/20000= 1 (um). Neste caso, não há associação entre o
consumo de carne gordurosa, hipoteticamente, em relação às dislipidemias. O consumo de carne gor-
durosa não interferiu no indivíduo desenvolver essa doença, ou seja, a probabilidade da dislipidemia
ocorrer em indivíduos que consomem carne gordurosa mais de duas vezes por semana com aqueles
que se alimentam com menor quantidade é a mesma.
Portanto, quando OR, RP e RR forem igual a 1, não há associação entre a exposição ao fator de
risco e a ocorrência do desfecho final. A chance de o aparecimento de uma doença é a mesma para
o grupo exposto e o não exposto (PEREIRA, 2003; ALMEIDA FILHO; BARRETO, 2011; GORDIS,
2009; MEDRONHO, 2009; BUSATO, 2016; BENSEÑOR; LOTUFO, 2005).
242
UNIDADE 7
Logo, a OR é = (25 x 100)/ (300 x 75) = 2.500/22.500 = 0,11. Neste caso, a OR foi menor que um, ou
seja, a chance do evento ocorrer no grupo exposto foi menor que uma vez. Este resultado mostra que
o uso do protetor solar não é um fator de risco, mas sim de proteção (PEREIRA, 2003; ALMEIDA
FILHO; BARRETO, 2011; GORDIS, 2009; MEDRONHO, 2009). Para que os clínicos entendam esse
valor menor que um, podemos fazer o seguinte raciocínio:
Se 1 é a chance nula (não há associação), logo 1 – 0,11 (OR) = 0,89 multiplicado por 100 porcento =
89% de chance a menos da doença ocorrer nos indivíduos expostos em relação ao não expostos.
Portanto, quando OR, RP e RR for menor que um, isso indica a presença de um fator de proteção e não
de risco. Não devemos jamais descrever as medidas de associação com resultado menor que um desta
maneira: a chance de o indivíduo exposto desenvolver a doença é 0,11 vezes maior que no indivíduo
não exposto. Você pode observar que não faz sentido a afirmação. Portanto, devemos prestar muita
atenção nos resultados de OR, RP e RR, para que se possa interpretá-los de forma correta, evitando a
confusão e a descredibilidade do resultado.
Conforme exemplo anterior do câncer de pulmão, podemos também expor diferentemente o
resultado de OR e RR acima de 1, neste caso:
243
UNICESUMAR
A razão de prevalência é outra medida de associação que pode ser utilizada para verificar a proba-
bilidade de o evento acontecer na população. Expressa uma comparação matemática da prevalência
entre os grupos de expostos e não-expostos a um determinado fator em estudo. Significa quantas
vezes a prevalência é maior ou menor quando existe a exposição a determinado fator (PEREIRA,
2003; ALMEIDA FILHO; BARRETO, 2011; GORDIS, 2009; MEDRONHO, 2009).
O cálculo de RP é = prevalência da doença nos expostos / prevalência da doença nos não expostos
= (A/A+B)/(C/C+D) (GORDIS, 2009).
Tomemos o exemplo da tabela 4 (exemplo 1):
Logo, a prevalência do câncer de pulmão é de 1.292 em 2.538 pessoas expostas ao fumo, e de 8 casos
em 62 pessoas não fumantes. Assim, RP = (1.292/1.292+ 1.246) / (8/8+54) = (1.292/2.538) / (8/62) =
0,51/0,13 = 3,9 ≈ 4. Portanto, a prevalência de câncer de pulmão é quatro vezes maior em indivíduos
fumantes em relação aos não fumantes.
Atualmente, observamos que os estudos epidemiológicos retrospectivos têm utilizado mais a me-
dida de OR do que RP para verificar a associação de fatores de risco com doenças e outros eventos.
Acredita-se que, como RP tem o mesmo fundamento que o risco relativo, mas não infere causalidade
por se tratar de estudo retrospectivo e ser uma medida que estima o risco e não o confirma, OR ainda
é a medida mais apropriada e que evita confusão e interpretação inadequada.
O resultado de RP > 1, = 1 ou < 1 deve ser interpretado como OR e RR, ou seja, <1 indica fator de
proteção, = 1 não há associação, e >1 indica fator de risco (PEREIRA, 2003; ALMEIDA FILHO; BAR-
RETO, 2011; GORDIS, 2009; MEDRONHO, 2009; BENSEÑOR; LOTUFO, 2005).
244
UNIDADE 7
Para os estudos prospectivos, como de coorte e ensaios clínicos, calculamos incidência como
medida de frequência e risco relativo (a mais indicada) como medida de associação. Nestes ca-
sos, a medida de risco é verdadeira e infere causalidade, ou seja, indica o real fator de risco de
uma doença, a causa de uma doença. Esses estudos afirmam as hipóteses levantadas nos estudos
retrospectivos. Nesses estudos, o risco pode ser interpretado como (PEREIRA, 2003; GORDIS,
2009; BUSATO, 2016; BENSEÑOR; LOTUFO, 2005):
• Risco absoluto ou taxa de incidência: indica o número de casos novos de uma doença ou
outro evento em um determinado período. Utilizando a doença coronariana como exem-
plo, teríamos 15 óbitos por coronariopatia por ano a cada mil adultos com colesterol sérico
elevado, e cinco óbitos a cada mil adultos com níveis baixos. Essa é a forma mais adequada
e simples de quantificar o risco, e seu maior significado é quando comparado com resul-
tados obtidos anterior ou posteriormente. Esta comparação é obtida pelo cálculo do risco
relativo ou do risco atribuível;
• Risco relativo (RR): é o cálculo que resulta em quantas vezes o risco de desenvolver uma
doença é maior em um grupo comparado a outro grupo. Podemos calcular quantas vezes
é o risco de uma pessoa exposta a um fator desenvolver um evento em relação à não ex-
posta. Continuando o exemplo, o risco relativo é calculado pela razão entre as duas taxas
de incidência (15 dividido por 5 resultando em 3). O RR indica que o risco de morrer por
doença coronariana é três vezes maior em indivíduos com colesterol sérico elevado em
relação aqueles que possuem colesterol sérico baixo;
• Risco atribuível (RA, à exposição): é a diferença entre a incidência do evento em dois grupos,
o do exposto a um fator de risco e do não exposto. No exemplo da doença coronariana, o RA
é a diferença entre as incidências (15 - 5= 10). Sendo assim, ocorrem 10 óbitos anuais por
coronariopatia por mil adultos com colesterol sérico elevado. Seriam os óbitos em excesso.
RR= incidência no grupo exposto (A/A+B) dividido pela incidência no grupo não exposto (C/C+D)
245
UNICESUMAR
Exemplo: um estudo de coorte (hipotético), selecionou 11.000 pessoas ao longo de 10 anos e observou o
número de pessoas que adoeciam por doença cardiovascular e associou com a exposição à diabetes mellitus:
Tabela 9 - Exemplo 1, modelo de um estudo de coorte sobre a doença cardiovascular e a exposição à diabetes mellitus.
Logo, RR= 6 significa que a incidência de doença cardiovascular é seis vezes maior quando a pessoa
possui diabetes mellitus em relação àquelas que não possuem diabetes.
Outro exemplo hipotético: um estudo do tipo ensaio clínico avaliou a eficácia da vacina contra pneumonia
e verificou a incidência da doença ao longo de 10 anos após a vacinação. Tomemos os seguintes resultados:
Tabela 10 - Exemplo 2, tabela de contingência de um ensaio clínico para uma vacina contra a pneumonia.
Neste caso, temos um risco relativo de 0,5. Esse resultado mostra que a vacina teve um efeito protetor
contra a pneumonia (1 - 0,5 = 0,5 x 100% = 50%), em que o risco de se desenvolver a pneumonia é 50%
menor nos vacinados em relação aos que não receberam a vacina. O resultado menor que 1 é muitas
vezes encontrado quando desejamos testar novos medicamentos, vacinas e métodos de diagnóstico
de doenças (BENSEÑOR; LOTUFO, 2005).
246
UNIDADE 7
Caso, o RR apresente um resultado igual a 1, isso indica que a incidência da doença é a mesma
no grupo exposto e não exposto, não havendo diferença, ou ainda que não há associação entre o
fator pesquisado e a doença, não podendo considerá-lo fator de risco ou de proteção (PEREIRA,
2003; ALMEIDA FILHO; BARRETO, 2011; GORDIS, 2009; MEDRONHO, 2009; BUSATO, 2016;
BENSEÑOR; LOTUFO, 2005).
Resumindo,
Se RR, OR e RP:
=1 Não há associação
>1 Risco nos expostos > não expostos (Risco)
<1 Risco nos expostos < não expostos (proteção)
Chegamos ao final desta unidade, uma das mais importantes da nossa disciplina. Agora você
pode entender melhor as medidas de ocorrência das doenças, agravos e óbitos, e como podemos
utilizá-las para a interpretação da situação de saúde das nossas populações, planejamento tomadas
de medida em saúde. Até a próxima!
CONSIDERAÇÕES FINAIS
Caro(a) aluno(a), chegamos ao final desta unidade. Esperamos que você tenha compreendido a
importância e as aplicações das medidas de frequência e de associação.
Vimos a importância da frequência e distribuição das doenças de acordo com o tempo, pessoa
e lugar e utilizamos para isso figuras e tabelas, além das medidas de frequência, prevalência, inci-
dência, seus cálculos e interpretações. Nós utilizamos exemplos hipotéticos para que você possa
compreender a aplicação dessas medidas na verificação da situação de saúde das populações e
determinar quais são as doenças ou causas de enfermidades que ocorrem com maior frequência
nas populações.
Abordamos as medidas de associação e suas aplicações para a identificação de fatores de risco,
causas ou ainda fatores de proteção que levam à ocorrência de doenças, óbitos ou outros desfechos
em saúde. Destacamos as medidas de odds ratio (proporção dos pares, razão das chances) e a razão
de prevalência como medidas de associação para os estudos retrospectivos, aqueles que utilizam
dados do passado e presente (prevalência), como os transversais e de caso-controle. Destacamos
o risco relativo, utilizado em estudos prospectivos, como os de coorte e o ensaio clínico, que uti-
lizam a incidência dos eventos. Você pode aprender como interpretar o resultado das medidas de
associação e a identificar fatores de risco ou de proteção para as doenças.
Como você pode observar, existem muitos tipos de estudos, retrospectivos e prospectivos, que
podem ser realizados para verificar a situação de saúde das populações e identificar fatores de
risco e de proteção para as doenças.
247
1. Qual é a ferramenta dos epidemiologistas para verificar a distribuição das doenças e
seus determinantes nas populações? Justifique.
2. Entre 1.000 crianças vacinadas contra o sarampo no sexto mês de vida, 50 desenvol-
veram a doença no ano seguinte, a contar da data de aplicação da vacina. Que tipo de
medida de frequência é esta?
a) Taxa de mortalidade
b) Prevalência.
c) Incidência.
d) Taxa de detecção.
e) Nenhuma das alternativas.
3. No ano de 2002 (dados hipotéticos), foram detectados 553 casos novos de hanseníase
nos serviços de saúde do Distrito Federal. No final daquele ano, um total de 3.045 estava
em tratamento, incluindo os mais antigos e os que se descobriu, recentemente, serem
portadores do bacilo de Hansen. Tomando-se estes números para os devidos cálculos
e admitindo-se uma população de 1 milhão de habitantes.
I) A taxa de incidência de hanseníase é de 55,3 novos casos a cada 100.000 habitantes.
II) A taxa de prevalência de hanseníase é de 304,5 casos (novos e antigos) a cada
100.000 habitantes.
AGORA É COM VOCÊ
248
4. Estime a prevalência de diabetes mellitus em uma empresa com 2.000 funcionários em
que um exame médico periódico inicial mostrou 300 diabéticos. O seguimento desses
indivíduos mostrou o aparecimento de mais 40 casos novos de diabetes a cada ano. A
prevalência de diabetes mellitus no início do seguimento foi de:
a) 10%
b) 15%
c) 20%
d) 25%
e) 30%
249
7. Em um estudo do tipo caso-controle retrospectivo, observou-se o aparecimento de
hepatocarcinoma em indivíduos expostos e não expostos ao consumo de álcool. Dos
120 casos de hepatocarcinoma, 92 consumiam álcool, enquanto que nos controles
(230 pessoas), apenas 20 pessoas consumiam álcool. Monte uma tabela 2 x 2 (de con-
tingência) e calcule o risco relativo (RR) e a Odds ratio (OR) para verificar a associação
do hepatocarcinoma quando há exposição ao álcool. Assinale V para a alternativa
verdadeira e F para a falsa:
( ) A OR é de 6,8. Indica que o risco de se desenvolver hepatocarcinoma em indivíduos
que consomem álcool é quase sete vezes maior em relação às pessoas que não fazem
o uso de álcool.
( ) O risco relativo é de 6,8, o que significa que as pessoas expostas ao álcool possuem
um risco forte (sete vezes maior) de desenvolver hepatocarcinoma em relação às não
expostas.
( ) A OR é de aproximadamente 35, isto significa que a probabilidade do indivíduo exposto
ao consumo de álcool desenvolver hepatocarcinoma é 35 vezes maior em relação
aos não expostos.
8. Em uma população de 1000 adultos, um exame clínico inicial revelou 100 indivíduos
com hipertensão arterial. Durante mais cinco anos seguintes, 40 pacientes adicionais
desenvolveram hipertensão arterial; cinco destes indivíduos morreram desde o pri-
meiro diagnóstico. O risco de desenvolver hipertensão arterial dentro de cinco anos é:
a) 100/1000
AGORA É COM VOCÊ
b) 100/900
c) 40/1000
d) 40/900
e) 40/100
250
Para leitura complementar, selecionamos um artigo científico publicado em 2010 na Revista
Latino-Americana de Enfermagem sobre a incidência de infecção hospitalar em unidade de
tratamento intensivo (UTI) em um hospital universitário do Brasil. Lembre-se que os casos
de infecção hospitalar são considerados agudos e novos, e que a incidência é a melhor
medida para expressar sua frequência. Os pesquisadores da área de enfermagem reali-
zaram um estudo prospectivo (medida de frequência adequada é a incidência), descritivo
e epidemiológico a partir de dados coletados da UTI de um hospital. Observe como foi
feito o estudo, critérios de inclusão e exclusão, dados coletados e análises estatísticas e
epidemiológicas realizadas.
[...] Antes da coleta de dados, a pesquisa foi aprovada pelo Comitê de Ética da instituição,
[...] de acordo com a Resolução 196/96 do Conselho Nacional de Saúde, que controla pes-
quisas envolvendo seres humanos. A coleta de dados foi feita por estudantes da gradua-
ção, previamente capacitados, nos prontuários dos pacientes e através dos resultados de
AGORA ÉCOMPLEMENTAR
exames microbiológicos dos mesmos.
COM VOCÊ
de ocorrência das infecções.
Veja que para este estudo do tipo prospectivo foi aplicada corretamente a medida de
associação de risco relativo. E ainda, foi aplicada a análise estatística sobre os dados para
aumentar a confiabilidade nos resultados. A seguir, está o resumo da pesquisa contendo
LEITURA
seus principais resultados:
251
‘Este estudo prospectivo objetivou determinar a incidência da infecção hospitalar (IH) em
uma unidade de terapia intensiva (UTI), sua associação com características clínicas do
paciente e sítios de ocorrência. Inclui-se 1.886 pacientes de UTI de um hospital universi-
tário, entre agosto de 2005 e janeiro de 2008. Utilizou-se, neste estudo, o teste exato de
Fisher e Risco Relativo. Foram identificadas 383 (20,3%) IH: 144 (37,6%) do trato urinário,
98 (25,6%) pneumonia, 58 (15,1%) sepses, 54 (14,1%) do sítio cirúrgico e 29 (7,7%) outras.
A permanência média foi de 19,3 dias para pacientes com IH e 20,2 dias para colonizados
com microrganismos resistentes. Registrou-se 39,5% óbitos entre pacientes com IH (RR: 4,4;
3,4-5,6). A IH esteve associada a pacientes provenientes de outras unidades da instituição/
unidade de emergência, permanência superior a 4 dias de internação, infecção comunitá-
ria à internação, colonizados por microrganismos resistentes, em uso de procedimentos
invasivos e óbitos resultantes de IH”.
Fonte: OLIVEIRA, A. C.; KOVNER, C. T.; SILVA, R. S. Infecção hospitalar em unidade de tra-
tamento intensivo de um hospital universitário brasileiro. Revista Latino-Americana de
Enfermagem; v. 18, n. 2, p. 97-104, 2010.
LEITURA COM VOCÊ
252
Princípios de Bioestatística- 7ª Edição
Stanton A. Glantz
Editora: Artmed
Sinopse: a 7ª edição de Princípios de Bioestatística desvenda esse assunto
desafiador de maneira interessante e agradável, sem a necessidade de
conhecimentos prévios. O autor torna o assunto divertido e prazeroso
ao combinar estudos fictícios sobre seres de outros planetas com artigos
reais da literatura biomédica. A obra inicia com noções básicas, incluindo
análise de variância e o teste t, e depois avança para testes de comparações múltiplas, tabelas
de contingência, regressão e muito mais.
COMPLEMENTAR
A seguir, está o link para acessar um artigo científico, anexado na base
Scielo, que aborda como aplicar a Odds ratio (razão de chances) e a
razão de prevalência em estudos transversais. Tenha uma boa leitura.
Para acessar, use seu leitor de QR Code.
AGORA É COM
MATERIAL VOCÊ
253
MEU ESPAÇO
254
8
Principais Desenhos
de Estudos
Epidemiológicos
Dra. Izabel Galhardo Demarchi
Caro(a) aluno(a), bem-vindo à mais uma unidade. Chegamos em um dos conteúdos mais inte-
ressantes da disciplina! Lembra-se que a Epidemiologia é baseada em estudos observacionais
(sem intervenção) ou experimentais (intervencionistas) realizados em populações? Esses estudos
verificam a frequência de fenômenos do processo saúde-doença (como doenças, agravos e óbitos,
ou cura e recuperação, etc.), e identificam fatores de risco ou de proteção relacionados a esses
eventos, que ocorrem nas populações. A partir dos estudos epidemiológicos, podemos conhecer a
situação de saúde de uma população e identificar grupos de risco, verificar a ocorrência e causas
de doenças e óbitos, e ainda determinar a eficácia de medicamentos e vacinas.
Para isso, é importantíssimo realizar um estudo bem planejado, com escolha criteriosa das
variáveis investigadas, e utilizar uma fonte de dados de alta confiabilidade. Com esses cuidados,
os resultados dos estudos epidemiológicos podem responder muitas perguntas. Existem muitos
tipos de estudos epidemiológicos: aqueles que descrevem a frequência de eventos nas populações
(descritivos) e os que verificam a associação de fatores causais com os eventos (analíticos). Nesta
unidade, descrevemos e exemplificamos os principais estudos epidemiológicos: descritivos e
analíticos. Os estudos analíticos observacionais abordados aqui são: o transversal (tópico II), o
caso-controle e o coorte; e o do tipo experimental de ensaio clínico (em humanos e não humanos).
Todos os estudos devem ser concisos e diretos, com metodologia e objetivos bem delineados.
Isso contribuirá para a obtenção de resultados que respondem às questões de saúde. Em cada
tópico desta unidade, nós abordaremos um tipo de estudo epidemiológico, e você conhecerá suas
funções e interpretações, e compreenderá a aplicação prática destes estudos para o conhecimento
da saúde da população e identificação de fatores associados aos desfechos em saúde.
256
UNIDADE 8
EPIDEMIOLOGIA DESCRITIVA
257
UNICESUMAR
Variável tempo
Na variável tempo temos os estudos que investigam a ocorrência da doença em um curto prazo de tempo
(séries temporais) e os que observam a frequência da doença ao longo de muitos anos (tendência geral),
possibilitando verificar a diminuição, o aumento ou a manutenção do número de casos. Podemos ainda ter
as distribuições cronológicas da doença, como as variações cíclicas e variações sazonais (GORDIS, 2009;
MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005; ROUQUAYROL; ALMEIDA
FILHO, 2011).
• Séries temporais: conjunto de observações ordenadas no tempo (mês, ano, semana, dia).
Exemplo: número mensal de nascimentos, de óbitos ou de casos de uma doença notificável.
A frequência da doença é estudada em um curto intervalo de tempo.
• Tendência geral (história ou secular): é a modificação na frequência com a qual as doen-
ças ocorrem num período bastante longo de anos, independentemente de sua característica
cíclica ou irregular. Apresenta sempre uma tendência secular ao aumento, à diminuição ou à
constância. Exemplo: em mais de 20 anos de estudo, observamos que a taxa de mortalidade
materna reduziu em aproximadamente 70% (Figura 1).
258
UNIDADE 8
0 5 10 15 20 25
Tempo (anos)
Casos Vetor
Figura 2 - Representação gráfica da distribuição cíclica de uma doença tropical (hipotético) de acordo com os anos. / Fonte: a autora.
Obs.: A partir do gráfico, observa-se que o pico (elevação) no número de casos ocorre a cada cinco anos, mesmo período em
que ocorre um aumento na população de vetores da doença.
259
UNICESUMAR
Para que possamos verificar essas variações de acordo com o tempo, podemos utilizar o Diagrama de
Controle, que é um dispositivo gráfico (Figura 3 e 4) destinado ao acompanhamento, no tempo, semana
a semana, mês a mês, da evolução dos coeficientes de incidência. O objetivo do diagrama é estabelecer
e implementar medidas profiláticas que possam manter a doença sob controle. No eixo das ordenadas
(Y), deverão ser registradas as medidas de incidência, e no eixo das abscissas (X), a variável relacionada
ao tempo (PEREIRA, 2003; FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999;
ALMEIDA FILHO; BARRETO, 2011). Veja o gráfico abaixo:
Figura 3. Diagramação da incidência da doença (eixo das ordenadas, Y) de acordo com o tempo (eixo das abcissas, X)
Fonte: a autora.
Devemos distribuir o número de casos de acordo com o tempo. A partir de dados obtidos anteriormente
(registrados em bases de dados ou obtidos pelos mesmos pesquisadores), podemos calcular a média (Ẋ)
do número de casos ao longo dos anos anteriores e aplicar um desvio-padrão fixo de 1,96 para mais e
para menos, e assim traçar um canal endêmico da doença (veja a figura 4) (PEREIRA, 2003; FRANCO;
PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
O termo endêmico se refere a qualquer doença espacialmente localizada, temporalmente ilimitada,
habitualmente presente entre os membros de uma população e cujo nível de incidência se situe sistemati-
camente dentro dos limites da faixa endêmica referente àquela população e época determinada. Podemos
dizer, que uma doença é endêmica quando ela a sua distribuição ocorre dentro do esperado, ou seja, dentro
da normalidade. Ela sempre é registrada e a ocorrência é uma constante (PEREIRA, 2003; FRANCO;
PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
A média dos casos deve utilizar dados mais próximos do período do estudo atual. Por exemplo: na figura 5,
para construir o diagrama de controle da distribuição dos casos notificados de malária no Pará do ano de 1999,
foi utilizada uma série histórica de casos notificados de malária (de 1992 a 1998), que subsidiou a determina-
ção dos limites superior e inferior de casos esperados no diagrama de controle de 1999 (PINHEIRO, 2000).
Quando somamos o desvio-padrão na média do número de casos ocorridos anteriormente à pesquisa,
traçamos no gráfico, o limite superior do canal endêmico, e quando subtraímos o desvio-padrão da média,
obtemos o limite inferior do canal endêmico. Se no período estudado, o número de casos permanecer dentro
do canal endêmico, podemos dizer que a frequência da doença é endêmica e ocorreu conforme o esperado
para aquele momento. Quando o número de casos excede o limite superior do canal endêmico, podemos dizer
que houve uma epidemia da doença naquele período. Quando o número de casos se situa abaixo do limite
inferior do canal endêmico, dizemos que a doença está eliminada ou erradicada (Figura 4) (PEREIRA, 2003;
FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
260
UNIDADE 8
DIAGRAMA DE CONTROLE
Frequência
da doença (Y)
Epidemia
Limite superior do
X + 1,96 DP canal endêmico
Canal endêmico
Limite inferior do
X - 1,96 DP canal endêmico
Eliminação
Tempo(X)
0
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Como podemos ver na Figura 5, o índice parasitário anual por habitante excedeu o limite superior
do canal endêmico a partir do mês de junho até dezembro de 1999, baseando-se nos dados dos anos
anteriores (1992 a 1998). Portanto, observamos um pico epidêmico da doença a partir de junho de
1999. Com a detecção de uma epidemia, no ano 2000, a partir do Plano de Intensificação das Ações de
Controle da Malária da Amazônia Legal (PIACM) foi recomendado como estratégia o fortalecimento
dos serviços de atenção básica no atendimento dos paciente portadores de malária, notadamente no que
se refere ao diagnóstico precoce e ao tratamento correto dos casos, visando reduzir a morbi-mortalidade.
261
UNICESUMAR
Antes de afirmarmos que uma doença foi eliminada, erradicada, ou que ocorreu uma endemicidade
ou epidemia, devemos rever os conceitos dessas palavras para não cometer erros graves na interpretação
da ocorrência de uma doença. Veja a seguir alguns conceitos de relevância (PEREIRA, 2003; FRANCO;
PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011):
• Erradicação: é a extinção, por métodos artificiais, do agente etiológico de um agravo, ou do
vetor, sendo impossível sua reintrodução e totalmente desnecessária a manutenção de quaisquer
medidas de prevenção. Exemplo: a varíola foi erradicada no mundo em 1980, e não se realiza
mais nenhuma medida preventiva da doença, nem a vacinação.
• Eliminação: é atingida quando se obtêm a cessação da sua transmissão em extensa área geo-
gráfica, persistindo, no entanto, o risco de sua reintrodução, seja por falha na utilização dos
instrumentos de vigilância ou controle, seja pela modificação do comportamento do agente
ou vetor. Exemplo: No Brasil, o tétano neonatal foi eliminado no ano 2003 após a introdução
maciça da vacinação em mulheres em idade fértil. No entanto, a vacinação e as medidas de
higiene ainda são preservadas para que a doença se mantenha sob controle.
• Epidemia: é toda a flutuação que excede significativamente os valores normais de incidência
da doença, tendo como referência uma série de casos ocorridos em anos anteriores. Exemplo: o
número de casos de dengue excedeu o esperado para aquele mesmo período do ano, tornando-se
uma epidemia. O surto epidêmico é a ocorrência epidêmica restrita a um espaço extremamente
delimitado (colégio, quartel, edifício, bairro, restaurante). Exemplo: um surto de salmonelose
em uma escola da cidade X. Ocorreu um número de casos maior que o esperado em um lugar
restrito e limitado.
• Endemia: qualquer doença espacialmente localizada, temporalmente ilimitada, habitualmente
presente entre os membros de uma população e cujo nível de incidência se situe sistematica-
mente dentro dos limites da faixa endêmica referente àquela população e época determinada.
Exemplo: na cidade de Maringá, ocorrem anualmente 100 casos de leishmaniose.
• Pandemia: é a ocorrência epidêmica caracterizada por uma larga distribuição espacial, atingindo
várias nações. É uma elevação não habitual da incidência de uma dada patologia. Exemplo: a
pandemia do H1N1 ocorrida no ano de 2009. Ou ainda a pandemia da AIDS.
262
UNIDADE 8
Veja essa situação: o sudeste brasileiro está quase 90% urbanizado, enquanto que o norte, 62%. A
distribuição de doenças relacionadas à urbanização é maior no sudeste que no norte. Verificamos
também que a atenção primária na zona urbana é bastante superior em relação a população rural.
Tomemos como exemplos as doenças sexualmente transmissíveis (DST): elas ocorrem com maior
frequência nas áreas urbanas devido ao maior contingente populacional, à promiscuidade e a outros
fatores. As doenças ocupacionais também ocorrem nas áreas urbanas, devido à maior concentração
de indústrias (PEREIRA, 2003; ALMEIDA FILHO; BARRETO, 2011).
Na área rural, observamos uma maior ocorrência de doenças relacionadas à presença de vetores,
ao tipo de habitação, ao saneamento ambiental e aos modos de vida. Nas áreas rurais, encontramos
uma maior prevalência de doenças como a leishmanioses, a malária (Figura 6), a doença de Chagas
e outras. Devemos também levar em consideração a diminuta disponibilidade de assistência médica;
essas áreas possuem, muitas vezes, poucas e precárias oportunidades de trabalho; caracterizam-se
por baixos salários. Apesar de ligadas à terra, as pessoas geralmente são mal alimentadas ou ainda
desnutridas; existe uma baixa proporção de domicílios com saneamento (PEREIRA, 2003; FRANCO;
PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
A variável lugar também pode se referir a bairros, municípios, estados, regiões e países. Uma forma repre-
sentativa da distribuição de casos de eventos em saúde é o mapa (veja a figura 6). Os mapas são muitos utili-
zados para mostrar as áreas de maior ocorrência da doença, assim como as áreas protegidas (GORDIS, 2009).
Figura 6. Mapa de risco da malária por município de infecção, Brasil, ano de 2011. IPA: índice parasitária anual por mil habitantes
Fonte: MINISTÉRIO DA SAÚDE. Secretária de Vigilância em Saúde. Boletim Epidemiológico. Situação epidemiológica da malária
no Brasil, 2000 a 2011. v. 44, n. 1, 16 p., 2013.
263
UNICESUMAR
O conhecimento do lugar em que a doença ocorre permite aos gestores e à população promover me-
didas de controle das doenças e dos fatores de risco de forma pontual e localizada. Por isso os estudos
descritivos não podem cessar; devem ser contínuos pois, após a tomada das medidas e as ações de
saúde, podemos realizar novamente o estudo para verificar a eficácia e os resultados de sua aplicação
sobre a frequência dos eventos relacionados à saúde (PEREIRA, 2003; FRANCO; PASSOS, 2011;
ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
Você já pensou que a sua saúde reflete o ambiente em que você vive?
264
UNIDADE 8
A ocupação do indivíduo pode afetar sua qualidade de vida e influenciar a prevalência das doenças.
Por exemplo: o saturnismo (intoxicação aguda ou crônica por chumbo) está ligado com a tipografia
(impressão de jornais, indústrias automobilísticas, pintores); a brucelose (doença infecciosa causada
pela bactéria Brucella) a matadouros e frigoríficos; o sedentarismo pode estar ligado a empresários
e executivos que possuem maior taxa de doenças cardiovasculares ou depressão (PEREIRA, 2003;
ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
O estado civil também pode influenciar a saúde, uma vez que, em geral, os coeficientes de morbi-
mortalidade por doenças mentais, suicídios ou acidentes e DSTs são mais elevados entre não casados
(viúvos, solteiros, desquitados, divorciados). Acredita-se que isso pode estar relacionado à solidão, à
instabilidade, ou à maior exposição aos fatores (PEREIRA, 2003; ALMEIDA FILHO; BARRETO, 2011).
Os fatores socioeconômicos também são importantes determinantes. Tomemos o estado de saúde
das nações, que é um dos critérios através dos quais se torna possível classificá-las nas categorias de
desenvolvidas, em desenvolvimento ou subdesenvolvidas. Sabemos que regiões mais desenvolvidas
disponibilizam os melhores sistemas de saúde, menores taxas de doenças transmissíveis, menor nú-
mero de óbitos por violência e doenças infecciosas (PEREIRA, 2003; ROUQUAYROL; ALMEIDA
FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
265
UNICESUMAR
266
UNIDADE 8
267
UNICESUMAR
Doença cardiovascular
Dosagem da
glicemia
Doentes (Sim) Não doentes (Não) Total
Diabético (Sim) 8 (A) 1.992 (B) 2.000 (A + B)
Não diabético 18 (C) 17.982 (D) 18.000 (C +D)
Total 26 (A + C) 19.974 (B + D) 20.000
(A +B +C +D)
Fonte: a autora.
A medida de associação mais indicada é a Odds ratio (OR), multiplicação dos pares que
concordam (AxD) dividido pelo resultado da multiplicação dos discordantes (BxC),
assim: 8 x 17.982/ 18x1992= 4,01. Isso significa que os pacientes expostos a diabetes
mellitus têm uma chance quatro vezes maior de desenvolver a doença cardiovascular
em relação aos pacientes não expostos à diabetes mellitus.
268
UNIDADE 8
ESTUDO CASO-CONTROLE
269
UNICESUMAR
270
UNIDADE 8
expostos
doentes
não expostos Sofreu exposição
no passado?
expostos
não doentes
não expostos
Figura 8 – Delineamento de um estudo do tipo caso-controle / Fonte: a autora.
No entanto, esse tipo de estudo pode apresentar alguns problemas: é incapaz de avaliar o risco, apenas
verifica associação, e é vulnerável a inúmeros vieses (seleção, memória, etc). Os estudos de caso-con-
trole não podem medir as reais taxas de incidência ou prevalência de uma doença, pois a proporção de
sujeitos com a doença no estudo é determinada pelo número de casos e controles que o investigador
decide amostrar, e não pelas suas proporções na população. Assim, as medidas de risco e razão de pre-
valência não são recomendadas (GORDIS, 2009; ALMEIDA FILHO; BARRETO, 2011; ROTHMAN,
GREENLAND; LASH, 2011; HULLEY et al., 2015).
O que os estudos caso-controle podem fornecer são informações descritivas sobre as características
dos casos e, o que é mais importante, uma estimativa da magnitude da associação entre cada variável
preditora e a presença e ausência da doença. Essas estimativas são expressas na forma de razão de chances
(Odds), que se aproxima do risco relativo e da razão de prevalência (PEREIRA, 2003; GORDIS, 2009;
MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROTHMAN; GREENLAND; LASH, 2011).
Portanto, a forma de análise da associação entre um fator preditor e um desfecho é a utilização
da medida de Odds ratio. E como medida de significância estatística podemos utilizar o teste do
Qui-Quadrado ou Mantel-Haenszel. Os testes estatísticos devem ser selecionados de acordo com a
distribuição de normalidade da amostra, e este conteúdo você encontrará na disciplina de estatística ou
Bioestatística (PEREIRA, 2003; GORDIS, 2009; MEDRONHO, 2009; ALMEIDA FILHO; BARRETO,
2011; ROTHMAN, GREENLAND E LASH, 2011; HULLEY et al., 2015).
271
UNICESUMAR
272
UNIDADE 8
ESTUDO DE COORTE
273
UNICESUMAR
TEMPO
1 ano ou mais
Figura 9 – Delineamento de um estudo de coorte / Fonte: a autora.
Neste outro exemplo (Figura 10), o pesquisador pode dividir a população a ser estudada em dois gru-
pos, desde o início da pesquisa, em indivíduos que são expostos a fatores de risco e os que não sofrem
exposição a esse determinado fator. Ambos os grupos são acompanhados por um período (um ano
ou mais), e observa-se o aparecimento de doenças em cada grupo (GORDIS, 2009).
Expostos
Doentes
Não doentes
População
Não expostos
TEMPO
1 ano ou mais
Figura 10 – Delineamento de um estudo de coorte utilizando dois subgrupos / Fonte: a autora.
274
UNIDADE 8
As vantagens dos estudos de coorte é que permitem o cálculo direto das taxas de incidência (pros-
pectivo) e o do risco relativo (RR); podem ser bem planejados; evidenciam associações de um fator
de risco com uma ou mais doenças, ou outro desfecho; há uma menor probabilidade de conclusões
falsas ou inexatas. Isto é devido ao acompanhamento presencial do pesquisador e à observação direta
dos fatores preditores e desfechos, assim como à facilidade de análise dos resultados (PEREIRA, 2003;
GORDIS, 2009; MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
Diferentemente dos estudos observacionais, a coorte é prospectiva e, para acompanhar o paciente ao
longo do tempo, requer uma infraestrutura adequada para o atendimento dos indivíduos, a realização
de exames e outros procedimentos; e recursos humanos que prestem serviços durante a pesquisa. Por
isso seu custo é elevado. Para se obter bons resultados, o ideal é acompanhar a população a ser estudada
por um período de um ano ou mais, por isso são de longa duração e dispendioso. Encontramos na lite-
ratura estudos de 20 a 30 anos de seguimento. No decorrer da pesquisa, podem ocorrer modificações na
composição do grupo selecionado, em decorrência de perdas por diferentes motivos (óbito, migração,
e outros). Pode-se ainda haver a dificuldade em manter a uniformidade do trabalho (PEREIRA, 2003;
GORDIS, 2009; MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
Nos estudos que acompanham subgrupos, o indivíduo que estava alocado no grupo não exposto pode
sofrer a exposição ao fator de risco (por vontade própria, ou acidentalmente), uma vez que essa intervenção
não pode ser feita pelo pesquisador. O ideal é que este indivíduo seja excluído da pesquisa, e não alocado
no outro grupo, o que poderia levar a erros de seleção e outros problemas metodológicos (PEREIRA,
2003; GORDIS, 2009; MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
No final da pesquisa, podemos observar mais de um desfecho, como a ocorrência da doença e de
agravos. Nestes casos, utilizamos a medida de incidência para verificar a frequência e a distribuição
dos desfechos encontrados. As formas de análise são o risco relativo e o risco atribuível (RA, RAP%).
Também utilizamos a estatística para validar a significância do risco (GORDIS, 2009; MEDRONHO,
2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
Tomemos o exemplo hipotético: uma investigação realizada em um banco de sangue de um hospital
chegou aos seguintes resultados: entre 2 mil pessoas que receberam transfusão sanguínea, acompanha-
das durante um ano, 200 contraíram hepatite. No grupo controle, de 5 mil pessoas que não receberam
transfusão, acompanhadas igualmente durante período idêntico, apenas cinco contraíram a doença.
Primeiro, montamos a tabela de contingência (2x2):
Tabela 3 – Exemplo 4, estudo de coorte sobre a hepatite e a exposição a transfusão sanguínea
Hepatite
275
UNICESUMAR
Por se tratar de um estudo de coorte prospectiva, medem-se a incidência e o risco. O RR é dado pela
fórmula [(A/A+B)/(C/C+D)] (incidência de hepatite no grupo exposto a transfusão, dividido pela incidência
da doença no não exposto). Logo, a incidência de hepatite foi de 10% (200/2000= 0,10 x 100%), ou de 100
casos a cada mil pessoas. O risco de se ter hepatite sem receber transfusão de sangue foi de 0,1% ou 1 caso
a cada mil pessoas (5/5000= 0,001). Qual é o risco de se ter hepatite quando exposto à transfusão de sangue
em relação aos não expostos? Calculamos o RR (0,10/0,001) de 100, ou seja, a o risco de ter hepatite é 100
vezes maior nos indivíduos expostos à transfusão em relação ao outro grupo.
Nos estudos de coorte, também encontramos fatores de proteção associados aos desfechos. Nestes
casos, o RR será menor que um e pode ser interpretado como explicado anteriormente. Um RR igual a 1
mostra que não há risco de adoecer quando exposto a um fator de risco, não há diferença entre ser exposto
ou não. Outro estudo que utiliza o RR como medida de análise da exposição e um evento em saúde é o
experimental do tipo ensaio clínico.
Os estudos experimentais realizam intervenção na saúde do indivíduo participante da pesquisa. Eles são
sempre prospectivos, e não existe estudo experimental retrospectivo. Os indivíduos são alocados aleatoria-
mente para grupos, chamados de estudo (ou experimental, teste) e controle (ou testemunha, de referência),
de modo a serem submetidos ou não a uma vacina, um medicamento, um diagnóstico, um outro produto
ou procedimento, para terem seus efeitos avaliados em condições controladas de observação (Figura 11 )
(PEREIRA, 2003; GORDIS, 2009; MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
Os estudos experimentais em seres humanos são considerados o padrão-ouro dos estudos epidemio-
lógicos, ou seja, o melhor tipo de estudo, aquele que é uma referência em afirmar causa e efeito. Além dos
estudos experimentais em humanos, podemos realizar estudos sobre microrganismos, células e moléculas
(in vitro) e em animais (in vivo). Os estudos com drogas, vacinas e outros testes in vivo e os ensaios clínicos
devem obedecer às regras e leis internacionais e nacionais das instituições de Ética em Pesquisa com Seres
Vivos (PEREIRA, 2003; GORDIS, 2009; MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO,
2005; ALMEIDA FILHO; BARRETO, 2011).
Os estudos experimentais realizados em humanos são chamados de ensaios clínicos, e podem
ser randomizados ou não randômicos. A randomização significa a alocação aleatória de uma
pessoa em um dos grupos, evitando seleção de conveniência ou qualquer outro viés subjetivo
dos investigadores (GORDIS, 2009). Os ensaios clínicos randomizados são considerados ideais
para avaliar a efetividade de uma intervenção ou outro desfecho esperado. Neste estudo, temos
um grupo de indivíduos que receberão a intervenção, e outro que não. O grupo controle pode
receber um placebo, por exemplo, mas não a intervenção teste (PEREIRA, 2003; GORDIS, 2009;
MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
276
UNIDADE 8
Os estudos do tipo ensaio clínico randomizados são considerados o “padrão-ouro” dos es-
tudos epidemiológicos, ou seja, os de maior credibilidade e confiabilidade no campo científico.
Este estudo é o que possui maior evidência em avaliar as políticas públicas e clínicas em saúde
(GORDIS, 2009). Você ainda pode ler ou ouvir falar que o ensaio clínico foi cego ou duplo-cego.
O estudo cego significa que o grupo teste e o controle não sabem se receberam a intervenção tes-
te ou o placebo, e o duplo-cego é quando nem os grupos e nem o pesquisador sabem o que está
sendo testado em um dado momento. Somente no final da pesquisa isso é revelado e, nesse caso,
é preciso que um membro da pesquisa, não o pesquisador principal, tenha conhecimento de qual
grupo recebeu a intervenção (PEREIRA, 2003; GORDIS, 2009; MEDRONHO, 2009; HULLEY et
al., 2015; BENSEÑOR; LOTUFO, 2005; ROTHMAN; GREENLAND; LASH, 2011).
277
UNICESUMAR
Grupo teste
(intervenção)
Vacina
Doentes
Aleatorização
Não doentes
Placebo
População
Grupo controle
TEMPO
Figura 11 – Delineamento de um estudo do tipo ensaio clínico randomizado / Fonte: a autora.
Os ensaios clínicos randomizados possuem muitas vantagens, como serem constituídos de grupos ho-
mogêneos, evitando variáveis de confusão. Por exemplo: quanto ao sexo, a alocação aleatória permitirá a
distribuição homogênea de homens e mulheres nos grupos, com mínimas chances de haver um grupo
formado unicamente de mulheres e o outro de homens. Isso poderia prejudicar os resultados da pesquisa,
devido ao aspecto hormonal ou a outra característica que o sexo influencie. É fácil selecionar os contro-
les, pois não receber uma intervenção e participar da pesquisa é interessante e convidativo. A decisão
da intervenção é do pesquisador e permite a testagem de inúmeros fatores. Esses estudos possuem alta
credibilidade como evidências científicas. Os resultados são medidos em incidência e a interpretação é
simples. Assim como os estudos de coorte, os experimentais podem ter muitos desfechos clínicos, os quais
podem ser investigados simultaneamente. É o estudo que afirma causalidade dos problemas de saúde (PE-
REIRA, 2003; GORDIS, 2009; MEDRONHO, 2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
Embora seja o melhor tipo de estudo, encontramos também alguns problemas: algumas situações não
podem ser investigadas. Por exemplo: determinar que pessoas fumem e outras não fumem. Questões éticas
podem inviabilizar os estudos. Por exemplo: na testagem de um novo medicamento de HIV, selecionar
um grupo que não receberá terapia antiretroviral; alguns participantes deixarem de receber tratamentos
benéficos ou passarem a receber os maléficos; tais estudos requerem estrutura administrativa e técnica de
porte razoável, estável, bem preparada e estimulada; possuem custo elevado, pois necessitam de recursos
humanos e financeiros; são de longa duração, como os testes de vacinas, que podem requisitar de cinco a
dez anos para se obter uma conclusão; pode haver conflito de interesse entre o pesquisador e a empresa que
fornece a intervenção (o medicamento, a vacina, ou outro) (PEREIRA, 2003; GORDIS, 2009; MEDRONHO,
2009; HULLEY et al., 2015; BENSEÑOR; LOTUFO, 2005).
278
UNIDADE 8
Alguns países permitem que os participantes da pesquisa recebam algum tipo de pagamento (até
em dinheiro), mas no Brasil isso não é permitido. Em nosso país, as pesquisas devem subsidiar todos
os gastos do paciente em relação à intervenção e garantir um seguro saúde. As substâncias e proce-
dimentos devem ser altamente seguros para experimentação em seres humanos, com protocolos de
experimentação aprovados pelos Comitês em Pesquisa com Seres Humanos. Mesmo com todos os
cuidados, ainda podem ocorrer problemas durante a pesquisa, como efeitos indesejados, desde uma
toxicidade até o óbito do indivíduo submetido à experimentação. Isto tem gerado muitas indenizações
às instituições. Além disso, existe uma burocracia para se obter um parecer favorável para a realização
da pesquisa, que pode demorar até anos para ser obtido (ZUCHETTI; MORRONE, 2012). É por isso
tudo que muitas pesquisas não continuam ou nem chegam a ser propostas, tendo apenas resultados
dos estudos transversais ou de caso-controle.
Os estudos clínicos são conduzidos em fases distintas (pré-clínica e clínica), e cada uma visa a responder
questões específicas. A fase pré-clínica é aquela realizada antes de iniciar as testagens em seres humanos.
É aquela em que os cientistas levam anos testando as substâncias in vitro (nos laboratórios, com células e
outros organismos) e em animais (in vivo). A fase clínica é a fase de testes em seres humanos, e é composta
por quatro fases sucessivas (I, II, III e IV). A fase I, verifica a segurança do tratamento; a Fase II verifica a
eficácia do tratamento; na Fase III, compara-se o novo tratamento com o existente (de referência, ou placebo);
e a Fase IV é realizada para se confirmar se os resultados obtidos na fase III são aplicáveis em uma grande
parte da população. Somente depois da conclusão de todas as fases, o medicamento ou outro insumo po-
derá ser liberado para comercialização e disponibilizado para uso. Na leitura complementar desta unidade,
você obterá mais informações de como conduzir um estudo clínico (GORDIS, 2009; MEDRONHO, 2009;
ROTHMAN; GREENLAND; LASH, 2011; HULLEY et al., 2015).
Para analisar os resultados dos ensaios clínicos, podemos utilizar o cálculo de risco relativo (RR) (GOR-
DIS, 2009; MEDRONHO, 2009; PEREIRA, 2003) = incidência em vacinados ou submetidos à experimen-
tação (IV), dividido pela incidência em não vacinados/não submetidos à experimentação (INV).
Podemos ainda calcular a eficácia da intervenção comparando-a com o placebo ou o não vacinado.
Seria a aplicação do risco atribuída ao grupo que não recebeu a intervenção de desenvolver o problema
em saúde em relação aos que receberam. Mostra a redução da doença pelo uso da intervenção (GORDIS,
2009; MEDRONHO, 2009; PEREIRA, 2003) =
279
UNICESUMAR
Rubéola
Vacina
Doentes (Sim) Não doentes (Não) Total
Sim 20 (A) 880 (B) 1.000 (A + B)
Não 100(C) 900 (D) 1.000 (C +D)
Total 120 (A + C) 1.780 (B + D) 2.000 (A +B +C +D)
Fonte: a autora.
A incidência da doença no grupo vacinado foi de 20 casos a cada mil pessoas (0,02 ou 2%), e no grupo não
vacinado foi de 100 casos a cada mil pessoas (0,10 ou 10%). O RR foi de 0,2 (incidência no exposto de 0,02,
dividido pela incidência nos não expostos, de 0,1). Isto significa que a vacina protegeu fortemente o grupo
exposto. Quando RR é menor que um, indica proteção. A eficácia da vacina foi de 80% [(0,1 -0,02)/0,1)
x100%].Outra forma de interpretar é: o risco de desenvolver a rubéola é 80% menor nos vacinados em
relação aos que não receberam a vacina.
CONSIDERAÇÕES FINAIS
Caro(a) aluno(a)! Chegamos ao final desta unidade! Espero que você tenha compreendido a importância e
a aplicação dos estudos epidemiológicos para a compreensão dos problemas de saúde e seus determinantes.
Nesta unidade, você aprendeu os conceitos e as aplicações dos principais tipos de estudos epidemiológicos:
os observacionais e os experimentais. Dentre os estudos observacionais retrospectivos, que utilizam a me-
dida de prevalência, os mais utilizados são os descritivos, transversais e de caso-controle, e o observacional
de coorte prospectivo (medida de incidência). Por último, abordamos o padrão-ouro da epidemiologia, o
estudo experimental do tipo ensaio clínico.
O estudo descritivo descreve a situação de saúde de uma população de acordo com tempo, lugar e pessoa,
e é o primeiro estudo a ser realizado, pois inicialmente precisamos descrever o problema de saúde e, depois,
é necessário verificar os fatores envolvidos. Os demais estudos abordados são utilizados para verificar fatores
de risco associados aos problemas de saúde.
A partir dos estudos transversais e de caso-controle, podemos sugerir hipóteses de fatores de risco
relacionados às doenças ou outros desfechos. Esses estudos não afirmam causalidade, pois medem a esti-
mativa do risco da exposição (Odds ratio ou razão de prevalência), e não o verdadeiro risco (risco relativo,
incidência). Os estudos que afirmam causalidade são o de coorte e o ensaio clínico. O estudo de coorte
acompanha um grupo de pessoas e observa a incidência de desfechos e seus determinantes, sem realizar
qualquer pesquisa de intervenção na saúde do indivíduo. Os estudos do tipo ensaio clínico são aqueles
que avaliam uma intervenção (novo medicamento, vacina ou outro) em um grupo teste e outro que não
receberá a intervenção (controle ou placebo).
Como você pode ver, realizar um estudo epidemiológico ainda requer muito planejamento, leitura de
outros livros, de estudos publicados na literatura, leis e normativas referentes aos estudos em animais e em
seres humanos. Por isso, para você melhor compreender as aplicações da Epidemiologia na área das ciências
da saúde, temos a última unidade da nossa disciplina.
280
1. Para que servem e como são construídos os diagramas de controle?
2. Moradores de três bairros com três diferentes tipos de abastecimento de água foram
requisitados para participar de uma pesquisa para identificar cólera. Como várias
mortes por cólera ocorreram recentemente, praticamente todos foram submetidos ao
exame. A proporção de moradores em cada bairro que era portadora foi computada
e comparada. Classifique esse estudo assinalando a alternativa correta. Lembre-se de
que a causa e o efeito foram identificados ao mesmo tempo.
a) Estudo de corte transversal
b) Estudo de caso-controle
c) Estudo experimental
d) Estudo de coorte
e) Ensaio clínico não randomizado
3. Um estudo epidemiológico foi desenvolvido numa cidade hipotética com 1.000 mu-
lheres. Das mulheres que faziam reposição hormonal, a enxaqueca estava presente
em 200. Por outro lado, dentre as 600 que não usaram hormônio, a enxaqueca esteve
presente em 180. Os dados sobre enxaqueca e reposição hormonal foram colhidos
simultaneamente.
I) A medida de associação mais indicada para ser calculada nesse estudo é a Odds ratio.
II) Trata-se de um estudo transversal
4. Em um estudo de caso-controle que está sendo planejado, pacientes com infarto agudo
do miocárdio servirão como casos. Qual dos seguintes tipos de pessoas seria uma má
escolha para servirem como controles?
a) Sujeitos que não têm história de infarto do miocárdio.
b) Sujeitos que foram admitidos no hospital por doença não cardíaca.
281
c) Sujeitos cuja distribuição etária é semelhante à dos casos.
d) Sujeitos cujos fatores de risco cardíaco são semelhantes aos dos casos.
e) Sujeitos cujas características sociodemográficas são similares às dos casos.
acetil salicílico (Aspirina), dia sim e dia não; a outra metade, apenas placebo. Ao final
de 30 meses de seguimento, em que as perdas foram pequenas (0,5%), obtiveram-se
os seguintes resultados: 600 médicos do grupo de estudo relataram, pelo menos, um
episódio de enxaqueca, comparados com 800 no grupo controle. O risco relativo foi
menor que 1, aproximadamente 0,8. Interprete os resultados e assinale Verdadeiro (V)
ou Falso (F):
( ) O ácido acetil salicílico (aspirina), em baixas doses não se mostrou útil como preventivo
de enxaqueca.
( ) A aspirina mostrou uma proteção fraca para a enxaqueca.
( ) Estudos randomizados não permitem afirmar causalidade e não possuem credibili-
dade científica.
( ) Ensaios clínicos randomizados são considerados padrão-ouro, e afirmam a causalidade
de um problema de saúde.
282
Como dito anteriormente, os ensaios clínicos são realizados em quatro fases. Para que
você compreenda melhor, selecionamos trechos de um artigo editorial da revista Brazilian
Journal of Videoendoscopic Surgery:
“A pesquisa de drogas pela indústria envolve ensaios clínicos randomizados (ECRs) nas
suas diferentes fases. São realizadas basicamente em quatro fases:
Estudos Fase I
AGORA ÉCOMPLEMENTAR
pessoas e, em seguida, aumenta-se a dose gradualmente.
Estudos de Fase II
São projetados para avaliar se um medicamento possui atividade biológica e para deter-
COM VOCÊ
minar sua segurança e tolerabilidade.
Os estudos de fase III são ensaios clínicos randomizados delineados para avaliar a eficácia
e a segurança de uma intervenção. Os resultados dos estudos de fase III são desfechos
clínicos, tais como morte ou sobrevida livre de tumor. As avaliações de segurança ocorrem
durante um período mais longo quando comparados com estudos de fase II. Estudos de
fase IV ocorrem após aprovação e avaliam os resultados associados a uma droga ou inter-
venção na prática clínica com o uso na população geral.
LEITURA
Na avaliação crítica de um ensaio clínico randomizado, devemos fazer algumas perguntas
importantes, usando algumas informações já assinaladas anteriormente.
283
A primeira pergunta que se deve fazer é ‘Os pacientes selecionados neste estudo são
semelhantes aos pacientes que eu trato?’. O trabalho deve dizer claramente quais foram
os critérios de inclusão e exclusão (idade, sexo, doenças anteriores, etc.). Trabalhos com
critérios muito rígidos de inclusão são mais restritivos na generalização das conclusões
(porém são mais específicos). Deve mencionar ainda como os pacientes foram seleciona-
dos da população geral (só entraram os pacientes que procuraram o hospital terciário?
São apenas voluntários remunerados? ou são apenas os pacientes de uma comunidade
carente próxima ao hospital?). Lembrar que só podemos generalizar para as populações
semelhantes ao do estudo em questão. Cabe ao leitor decidir se as diferenças entre a po-
pulação selecionada no estudo e a população que lhe interessa são importantes ou não.
Um dos aspectos fundamentais é o evento final de interesse. Muitos trabalhos são até
metodologicamente bem montados, porém estudam variáveis que não são muito úteis
clinicamente, ou que não representam aquilo que deveriam. Por exemplo, no tratamento
da endometriose com uma medicação antiestrogênica, o pesquisador verifica somente
uma diminuição estatisticamente significativa do score da AFS (quantifica a extensão
da doença) e conclui que o tratamento é eficaz. Porém, o que a endometriose causa é
AGORA ÉCOMPLEMENTAR
basicamente infertilidade e dor pélvica, e o estudo em questão não avaliou o que real-
mente interessa (evento final de interesse), ou seja, se a paciente melhorou da dor ou
se conseguiu engravidar (não interessa à paciente melhorar somente o score da AFS).
Outro exemplo seria uma pesquisa para verificar a eficácia de um novo quimioterápico,
tendo como parâmetro apenas a diminuição da massa tumoral (porém, a diminuição do
COM VOCÊ
tumor pode não se correlacionar com a sobrevida, variável de interesse para a paciente)”.
Fonte: Oliveira, M.C.P.; Parente, R.C. Entendendo Ensaios Clínicos Randomizados Unders-
tanding Randomized Controlled Trials. Bras. J. Video-Sur, 2010, v. 3, n. 4: 176-180.
LEITURA
284
Epidemiologia e Bioestatística - Fundamentos Para A Leitura Crítica
Petrônio Fagundes De Oliveira Filho
Editora: RuBio
Sinopse: Epidemiologia e Bioestatística Fundamentos para a Leitura Crítica
é uma ferramenta útil, que ajuda a compreender informações técnicas que
chegam com rapidez e volume cada vez maiores e, ocasionalmente, com nível
de evidência questionável. Por isso, é preciso que estudantes e profissionais
das áreas biomédicas adquiram competências para julgar a validade e a
importância clínica de artigos científicos. Consequentemente, nos últimos anos, a Bioestatística e a
Epidemiologia, aliadas à Informática, vêm se tornando fundamentais para a leitura crítica.
COMPLEMENTAR
No Brasil, para a realização de um estudo experimental do tipo en-
saio clínico, deve-se submeter um projeto de pesquisa para o Comitê
Nacional de Pesquisa com Seres Humanos. Todos os estudos con-
VOCÊ
duzidos no Brasil são registrados no Registro Brasileiro de Ensaios
clínicos (REBEC).
Para acessar, use seu leitor de QR Code.
AGORA É COM
MATERIAL
285
MEU ESPAÇO
286
9
Epidemiologia
Aplicada em Saúde
Dra. Izabel Galhardo Demarchi
Olá aluno (a) finalizaremos a última unidade em estudar o papel dos bio-
marcadores, das técnicas moleculares e dos fatores genéticos na ocorrência
de doenças em populações, desde a descoberta de genes à aplicação na
saúde. Vamos discutir e definir as evidências epidemiológicas nas práticas
clínicas, visando ao estudo de determinantes e efeitos das decisões clínicas;
compreender os fatores exógenos (ambientais) aos seres humanos que al-
teram os padrões de doença e saúde; os determinantes sociais no processo
saúde-doença no âmbito da coletividade;. E por fim conhecer seus conceitos,
a legislação e a aplicabilidade da Epidemiologia no ambiente hospitalar para
o planejamento e gestão, integrando as normas de notificação compulsória
de doenças e agravos estabelecidos pela Vigilância Epidemiológica. Vamos
aplicar a Epidemiologia para a avaliação de efeitos dos serviços de saúde,
com o objetivo de subsidiar as tomadas de decisões, desde o planejamento,
gestão à eficiência dos serviços de saúde.
UNICESUMAR
288
UNIDADE 9
Nos últimos tempos, a Epidemiologia tem se tornado de grande importância nas ciências da saúde
e tem se expandido entre todos que procuram entender o processo saúde-doença nas populações.
Como disciplina científica, a Epidemiologia é capaz de responder a muitas perguntas relacionadas à
saúde humana e animal e, também, de demonstrar associações entre diversos eventos (presentes ou
do passado) e os determinantes relacionados com a saúde. Além disso, pode propor medidas de pre-
venção, proteção e recuperação à saúde e avaliar a eficácia dessas tomadas de decisão. Com essa ampla
utilização da Epidemiologia, muitas vezes é difícil entender como uma mesma disciplina pode receber
diferentes denominações, como Epidemiologia Molecular, Epidemiologia Genética, Epidemiologia
Ambiental, entre outras (ALMEIDA FILHO; BARRETO, 2011).
Essas diversas denominações contemplam o estudo “dos determinantes de estados e eventos re-
lacionados com a saúde de populações”. Considerando a complexidade dos determinantes da saú-
de-doença, das diversas causalidades e dos fenômenos biológicos, físicos, químicos e sociais, é que
encontramos essas diferentes definições para a Epidemiologia. Nos tópicos a seguir, descreveremos os
mais importantes níveis de determinações reconhecidos e estudados na Epidemiologia (ALMEIDA
FILHO; BARRETO, 2011).
289
UNICESUMAR
Com o grande avanço da Biologia Molecular, foi possível identificar moléculas relacionadas com
os eventos de saúde que ocorrem no organismo, genericamente chamadas de biomarcadores, o que
levou ao rápido e intenso desenvolvimento da Epidemiologia Molecular. O desenvolvimento da
Biologia Molecular também abriu espaço para o estudo dos efeitos genéticos e epigenéticos, poten-
cializando a decifração do genoma humano e desenvolvendo a Epidemiologia Genética, também
denominada de Epidemiologia Genômica (ALMEIDA FILHO; BARRETO, 2011).
O avanço da Biologia Molecular e da Genética permitiu que novas tecnologias fossem desenvolvidas
para análise de ácidos nucleicos e de seus produtos de expressão (como as proteínas), e que tudo isso
fosse incorporado aos estudos epidemiológicos, originando a Epidemiologia Molecular. Essa disciplina
seria uma subespecialidade da Epidemiologia que se apoia no uso de técnicas de Biologia Molecular
para investigar a distribuição e os determinantes das doenças nas populações (ALMEIDA FILHO;
BARRETO, 2011). Por exemplo, a partir da técnica molecular de reação em cadeia da polimerase
(PCR, polymerase chain reaction associada a transcrição reversa) é possível detectar o material viral
do HIV (RNA e proteínas retrovirais) no sangue humano, o que permite determinar a distribuição da
infecção por HIV nas populações.
Além das doenças infecciosas, a Epidemiologia Molecular pode ser empregada para outros
agravos em saúde, como as doenças neoplásicas e as nutricionais. As técnicas moleculares são
aplicadas na Epidemiologia Genética para estudos que investigam a interação gene-ambiente
como determinante de doenças (ALMEIDA FILHO; BARRETO, 2011). Neste tópico, apresenta-
remos algumas técnicas de Biologia Molecular que auxiliam os epidemiologistas a identificar o
padrão de ocorrência de doenças nas populações.
As técnicas de tipagem molecular são capazes de identificar subtipos de agentes infecciosos que
muitas vezes não seriam identificados por técnicas convencionais (fenotípicas) de tipagem (ALMEI-
DA FILHO; BARRETO, 2011). Tomemos como exemplo o HIV: a técnica de genotipagem permite
identificar o tipo viral com que o indivíduo está infectado, como HIV-1 ou HIV-2, enquanto que a
técnica de microscopia eletrônica permite apenas a detecção do vírus e não do subtipo viral. Além do
tipo viral, as técnicas moleculares permitem a detecção da carga viral do HIV e também de mutações
relacionadas à falha terapêutica (MALE et al., 2012).
A maioria dos estudos de Epidemiologia Molecular são observacionais, descritivos ou analíticos.
Nos estudos descritivos, os pesquisadores constatam a ocorrência (frequência) de um evento em saúde,
utilizando técnicas moleculares. Os testes analíticos podem testar hipóteses e avaliar associações entre
a exposição e os desfechos. Também são aplicados os estudos do tipo experimental: muitos ensaios
clínicos foram conduzidos para verificar a eficácia de medicamentos antivirais contra o HIV em
pacientes com AIDS. Nesses casos, foi verificada a supressão da carga viral do indivíduo utilizando
métodos moleculares para determinar a carga de RNA do vírus no sangue de cada participante (AL-
MEIDA FILHO; BARRETO, 2011).
290
UNIDADE 9
Todas as técnicas de tipagem molecular são baseadas na análise de diferenças ou sequências do DNA
cromossômico ou extracromossômico e de moléculas de RNA. Os sistemas de genotipagem podem
ser agrupados basicamente em três tipos de análise: padrão de bandas de eletroforese (Figura 1); hi-
bridização de ácidos nucleicos e sequenciamento de ácidos nucleicos (Figura 2).
Figura 1 – Padrão de bandas moleculares de eletroforese em gel de agarose / Fonte: Wikimedia (2017, on-line)¹.
Obs.: A partir da eletroforese em gel de agarose, o DNA de menor tamanho percorre maior distância no gel (mais abaixo na
imagem). Na primeira coluna, temos o DNA com tamanhos de fragmentos conhecidos, que foi utilizado como referência. Nas
demais colunas, bandas diferentes indicam diferentes tamanhos de fragmentos; e diferentes intensidades indicam diferen-
tes concentrações (quanto mais brilhante, mais DNA). As bandas de DNA tornam-se visíveis usando brometo de etídio e luz
ultravioleta.
291
UNICESUMAR
D
Figura 2 – Sequenciamento de DNA. / Fonte: Wikimedia (2014, on-line)².
Obs.: A partir do cromatograma e das técnicas de sequenciamento de DNA, é possível identificar o genoma de organismos.
Todas essas técnicas permitem o uso de equipamentos comuns e a padronização de reagentes para
a análise de diferentes agentes infecciosos e outros agentes de interesse. A análise do padrão de
eletroforese de DNA convencional permite separar moléculas de 500 a 20 kb. Dentre os métodos
mais conhecidos estão: polimorfismo de tamanho do fragmento de restrição (RFLP, restriction
fragment length polymorphism) e métodos baseados na PCR (ALMEIDA FILHO; BARRETO, 2011).
A técnica de RFLP tem como base a digestão do DNA com endonucleases de restrição (enzimas
específicas que cortam o DNA em fragmentos) e posterior separação dos fragmentos obtidos por
eletroforese em gel de agarose (Figura 1), originando padrões de eletroforese baseados no número
e tamanho dos fragmentos. As endonucleases reconhecem sequências únicas de DNA e cortam em
posições específicas, gerando diferentes fragmentos. Em cada microrganismo esses fragmentos são
diferentes, permitindo então diferenciá-los de acordo com os fragmentos expressos (ALMEIDA
FILHO; BARRETO, 2011).
292
UNIDADE 9
293
UNICESUMAR
Na Epidemiologia Genética ou Genômica são identificados genes como fatores de risco para
doenças humanas. Muitas doenças comuns podem ter um componente genético por agregação
familiar, por apresentarem restrição étnica ou evidência em modelos animais. Por exemplo: doen-
ças do coração, diabetes, hipertensão e o câncer possuem complexas características genéticas em
comum e têm se tornado um dos principais focos da Epidemiologia Genética moderna (ALMEIDA
FILHO; BARRETO, 2011; GORDIS, 2009).
O termo genômica é utilizado regularmente como referência ao estudo das funções e interações
de todos os genes do genoma, e novas disciplinas ‘ômicas’ tem surgido para estudar expressões,
produtos e interações de genes, como a Proteômica, a Transcriptômica, a Metabolômica, a Nutrige-
nômica, a Farmacogenômica e a Toxicogenômica. As descobertas genéticas evoluíram rapidamente
com os estudos caso-controle em grande escala de várias doenças crônicas comuns, que forneceram
resultados sobre as variações genéticas relativas às doenças (ROTHMAN; GREENLAND; LASH,
2011; GORDIS, 2009).
O sequenciamento genético identifica a ordem dos nucleotídeos em um fragmento de DNA e
permite mapear genes para a identificação de marcadores de doenças. A Epidemiologia Genética
é baseada no que nós aprendemos sobre o genoma humano; portanto, o seu alvo e as suas questões
estão em constante movimento. A transmissão e expressão da informação genética é mais complexa
do que se acreditava há poucos anos atrás. É claro que além das mutações genéticas, a expressão de
um gene é ainda influenciada pelo número de variantes, pela conformação do DNA e pelas mo-
dificações químicas, como a metilação. Muitos métodos que detectam estes aspectos ainda estão
em desenvolvimento. Apesar de todos esses avanços na genotipagem, muitas formas de avaliar as
interações gene-gene e gene-ambiente ainda são rudimentares (ALMEIDA FILHO; BARRETO,
2011; ROTHMAN; GREENLAND; LASH, 2011).
A partir de técnicas moleculares, podemos identificar genes envolvidos com neoplasias malig-
nas, como no caso do câncer de mama. O primeiro gene de predisposição ao câncer de mama
(BRCA1) foi mapeado no braço longo do cromossomo 17, em 1994, a partir da participação de
muitas famílias. No ano seguinte, foi mapeado o segundo gene de susceptibilidade ao câncer
de mama (BRCA2) no braço curto do cromossomo 13. A prevalência de câncer de mama foi
estimada em 0,11% para portadores de mutações em BRCA1/2 na população geral, e entre
13% e 16% em famílias de alto risco com três ou mais casos de câncer de mama ou ovário
Fonte: Amendola e Vieira (2005).
294
UNIDADE 9
EPIDEMIOLOGIA CLÍNICA
(MEDICINA BASEADA EM EVIDÊNCIA)
295
UNICESUMAR
As evidências são obtidas por diferentes fontes, que vão desde estudos pré-clínicos
aos experimentos clínicos, os chamados artigos originais. Mas não se espera que o profis-
sional de saúde tenha tempo para analisar criticamente todos os resultados de cada uma
dessas pesquisas, mas sim que, a partir de estudos sistemáticos, protocolos, documentos,
diretrizes e outros, o profissional reúna evidências de qualidade para a sua tomada de
decisão. A cada dia, muitos artigos originais são publicados, e cada vez mais necessita-
mos de evidências que sejam de fácil acesso e localização pelos mais diferentes usuários
(ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Os artigos originais de maior credibilidade para levantamento de evidências
clínicas são os grandes ensaios clínicos randomizados e os estudos observacionais
que possuem boa qualidade metodológica. Mesmo com a utilização de ferramentas
de busca estratégicas, como o PubMed/Medline, ainda se gasta muito tempo para
a leitura dos artigos originais e perdem-se muitas informações devido ao grande
volume de resultados. Consequentemente, os estudos de revisões sistemáticas e
de metanálise tornam-se importantes ferramentas para reunir evidências clínicas
(ALMEIDA FILHO; BARRETO, 2011; BENSEÑOR; LOTUFO, 2005).
Os estudos de revisão sistemática reúnem os principais estudos sobre o tema em
questão utilizando técnicas específicas, explícitas e reprodutíveis de identificação de
pesquisas originais. Os estudos de metanálise também são de grande importância
clínica, uma vez que incorporam as técnicas estatísticas (risco relativo, diferença de
médias e etc) sobre os resultados dos diferentes estudos originais selecionados para
a revisão sistemática. Ao reunir o resultado dos diferentes estudos, o profissional
adquire os resultados estatisticamente significativos e os mais confiáveis para apoiar
as decisões clínicas (ALMEIDA FILHO; BARRETO, 2011; BENSEÑOR. LOTUFO,
2005; FRANCO; PASSOS, 2011).
Também podemos utilizar as diretrizes (guidelines= inglês) para obter evidências
confiáveis para apoiar as tomadas de decisão. Os guidelines compreendem um con-
junto de recomendações clínicas para o manejo de um determinado problema. Em
geral, são elaboradas por uma agência governamental (como o Ministério da Saúde,
a Organização Mundial da Saúde e outros) ou de uma sociedade média (Sociedade
Americana de Pediatria, por exemplo) (ALMEIDA FILHO; BARRETO, 2011; BEN-
SEÑOR. LOTUFO, 2005; FRANCO; PASSOS, 2011). Os livros ainda constituem uma
fonte tradicional para orientar condutas clínicas, e têm a vantagem de apresentar
grande densidade de condutas de forma organizada e de fácil acesso. No entanto, os
livros possuem a maior desvantagem: a desatualização, especialmente em áreas com
maior dinamismo, como a molecular (ALMEIDA FILHO; BARRETO, 2011).
Para uma boa leitura de um artigo científico para levantamento de evidências que
subsidiarão as tomadas de decisão, o leitor deve (ALMEIDA FILHO; BARRETO, 2011;
BENSEÑOR. LOTUFO, 2005; ROUQUAYROL; ALMEIDA FILHO, 1999):
296
UNIDADE 9
1. Examinar título, autores, instituição, a revista e a data de publicação do estudo. Quanto mais
atual o estudo, melhor.
2. Após, o profissional deve identificar o que o autor quis pesquisar a partir da leitura da intro-
dução e do resumo (abstract, resumo em inglês). Nesta etapa, o leitor identificará o objetivo
do estudo, o desfecho clínico, a hipótese.
3. Para verificar a validade interna do estudo, deve-se ler o material e os métodos. Nesta etapa, o
leitor identifica a população estudada, o delineamento da pesquisa (ensaio clínico randomizado
ou não, e outros), vieses (erros sistemáticos) e as variáveis investigadas.
4. Na leitura dos resultados, o profissional deve examinar os resultados (figuras, tabelas, e texto)
e verificar os achados principais e aqueles que tiveram significância estatística, os quais devem
ser tomados como evidências relevantes.
5. Para validar externamente os resultados da pesquisa e sua aplicabilidade, o leitor deve se perguntar
“qual é a capacidade de generalização dos resultados? São válidos para o contexto de trabalho?”.
6. Por último, o leitor deve terminar a leitura do artigo a partir das conclusões e se perguntar se
concorda ou não com as conclusões dos autores.
Os artigos originais e revisões podem ser obtidos no portal do PubMed da U. S. National Library
of Medicine dos Estados Unidos, que dá acesso gratuito ao Medline (principal banco de títulos e
resumos de artigos da área médica), ao periódico da CAPES (acesso restrito a certas instituições),
SciELO, BIREME (Centro Latino-Americano e do Caribe de Informações em Ciências da Saúde), e
Cochrane Collaboration. Os guidelines podem ser obtidos no National Guideline Clearinghouse,
U.K. National Electronic Library for Health e Projeto Diretrizes (ALMEIDA FILHO; BARRETO, 2011;
BENSEÑOR. LOTUFO, 2005).
Na BIREME, quando o artigo não está disponível eletronicamente, o serviço SCAD, é a melhor opção
para aquisição. Os artigos são encomendados, pagos, e o recebimento se dá por correio, fax ou
e-mail. Os artigos do PubMed que não estão disponíveis também podem ser solicitados pelo SCAD.
Fonte: ALMEIDA FILHO; BARRETO, 2011.
A prática de saúde com base em evidências não substitui o raciocínio integral do profissional de saúde.
Pelo contrário, as evidências devem estimular a avaliação crítica na escolha das alternativas que irão be-
neficiar e minimizar os riscos para as pessoas. Após identificadas e avaliadas as evidências, elas precisam
ser integradas à situação real do clínico. Mesmo que uma determinada conduta seja definida como forte
e a qualidade da evidência seja considerada alta, o profissional deve sempre avaliar criticamente a ade-
quação para a realidade específica (ALMEIDA FILHO; BARRETO, 2011; BENSEÑOR. LOTUFO, 2005).
297
UNICESUMAR
Para responder às dúvidas e questões que irão identificar as ações e intervenções que levem ao
máximo de benefícios e o mínimo de riscos, o profissional deve se utilizar de seus conhecimentos
e experiências adquiridos e de resultados de investigações em seres humanos sob efeito de inter-
venções na ocorrência de eventos clinicamente relevantes (ALMEIDA FILHO; BARRETO, 2011;
ROUQUAYROL; ALMEIDA FILHO, 1999).
EPIDEMIOLOGIA
AMBIENTAL E
SOCIAL
298
UNIDADE 9
Epidemiologia Ambiental
Para esse tópico,“o ambiente será definido como o espaço ou contexto de atuação dos fatores exógenos aos
seres humanos que afetam os padrões de saúde e de doença” (ALMEIDA FILHO; BARRETO, 2011, p. 363).
Logo, a Epidemiologia Ambiental estuda a distribuição dos eventos relacionados à saúde em populações
de acordo com os determinantes ambientais, tais como os biológicos, físicos (ruídos, vibrações, iluminação,
descargas elétricas e etc) e químicos (radiações, metais pesados, compostos orgânicos voláteis, pesticidas,
hormônios adicionados à alimentação, e outros) (ALMEIDA FILHO; BARRETO, 2011; ROTHMAN;
GREENLAND; LASH, 2011; MEDRONHO et al., 2009).
A Epidemiologia Ambiental tem o papel de elucidar eventos, como catástrofes (queimadas, guerras,
enchentes, tsunamis, furacões, terremotos), com os esforços de traçar os cenários futuros sobre os efeitos
da mudança climática na saúde. Nesta disciplina, também são estudados os fatores sociais, econômicos,
políticos e culturais que de alguma maneira facilitam ou dificultam o contato humano com os fatores am-
bientais (ALMEIDA FILHO; BARRETO, 2011; ROTHMAN; GREENLAND; LASH, 2011).
Um exemplo clássico da atuação da Epidemiologia Ambiental é um estudo publicado em 1938, que
revelou a relação do flúor na água com a cárie dentária em crianças. Este estudo mostrou a importância do
uso do flúor na água como fator de proteção à cárie dentária no mundo. Com o avanço tecnológico após
1960, a Epidemiologia Ambiental vem acumulando conhecimentos relevantes que estão sendo incorporados
à formulação de políticas e de marcos regulatórios, o que vem promovendo avanços na saúde e redução
de poluentes, contaminantes do ar, água e solo. Não é por acaso que a Epidemiologia Ambiental vem as-
sumindo um papel decisivo na construção da agenda global de sustentabilidade ambiental e das Metas do
Milênio (Nações Unidas), na perspectiva da saúde e da equidade (ALMEIDA FILHO; BARRETO, 2011;
ROTHMAN; GREENLAND; LASH, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
No caso da Epidemiologia Ambiental, os agentes causais de interesse são diversos e fazem parte de
complexos compostos, como pesticidas, solventes, partículas atmosféricas. Até o comportamento e o hábito
humano são capazes de alterar a exposição, como a ingestão de alimentos e líquidos, a inalação, o contato
com a pele e outros. Tudo isso torna mais difícil mensurar a exposição aos fatores de risco (ALMEIDA
FILHO; BARRETO, 2011).
Nesses casos, podem ser aplicados questionários, instrumentos de mensuração química ou física e outros
meios. Todos devem ter alto grau de precisão, sensibilidade e especificidade. As medidas podem ser reali-
zadas diretamente nos indivíduos (ex.: dosagem de chumbo no sangue; organoclorados, mercúrio), no seu
microambiente (ex.: concentração de monóxido de carbono no domicílio), macroambiente (nível de cloro em
reservatórios de água; saneamento dos municípios), e marcadores biológicos (ex.: cotinina medida no sangue,
na saliva ou urina após a exposição ambiental ao cigarro) (ALMEIDA FILHO; BARRETO, 2011; ROTHMAN;
GREENLAND; LASH, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO et al., 2009).
A Epidemiologia Ambiental utiliza todos os desenhos de estudos epidemiológicos, do ecológico (po-
pulacional) ao ensaios clínicos randomizados (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO et al.,
2009). Atualmente, a partir dos estudos epidemiológicos realizados, estima-se que 25 a 33% da carga global
de doenças seja atribuída aos fatores de risco ambientais, e que esses riscos tendem a diminuir com o desen-
299
UNICESUMAR
volvimento econômico. Dentre os fatores que ameaçam a vida humana estão: má qualidade do ar, da água e
solo, agentes infecciosos (leptospirose, doenças de transmissão vetorial, malária, dengue e outras), alterações
ambientais (inundações, secas, terremotos, incêndios, etc.), mudanças ambientais globais (aquecimento
global, redução da camada de ozônio, acidentes industriais e nucleares, derramamento de óleo, e outros),
e perturbações sociais (guerras, terrorismos, armas químicas e biológicas) (Figura 3) (ALMEIDA FILHO;
BARRETO, 2011; ROTHMAN; GREENLAND; LASH, 2011;ROUQUAYROL; ALMEIDA FILHO, 1999).
As informações e os achados da Epidemiologia Ambiental podem contribuir para prevenir e
controlar os efeitos na saúde relacionados ao ambiente. Estima-se que de 13 a 37% da carga global
de doenças poderiam ser evitadas com as melhorias ambientais, como sistemas de água e esgoto,
por exemplo. Não podemos esquecer também de mencionar os problemas relacionados à segurança
alimentar. A possibilidade de transmissão de doenças pelos alimentos, como a doença da vaca louca,
destaca o papel dos estudos epidemiológicos ambientais, assim como os avanços com a biotecnologia
e os alimentos transgênicos, os quais são geneticamente modificados, levando à resistência de plantas
a insetos, fungos, microrganismos e outros (ALMEIDA FILHO; BARRETO, 2011).
Degradação • Fome,
ambiental • Insegurança desnutrição, e
• Contaminação alimentar doenças
• Pesca • Desabrigados e associadas
• Agricultura refugiados • Doenças mentais
Figura 3 – Possíveis caminhos dos efeitos das mudanças climáticas sobre as condições de saúde.
Fonte: adaptada de McMichael, Woodruff e Hales (2006).
300
UNIDADE 9
Epidemiologia Social
Quando falamos de Epidemiologia Social nos vem a pergunta: mas a Epidemiologia não é
de princípio social? Afinal, os fenômenos estudados por essa disciplina pertencem ao âmbito
coletivo, e portanto, remetem ao social. No conceito da Epidemiologia Social, incorporamos
conceitos políticos na problematização da saúde, como classes sociais, poder, justiça e desi-
gualdades que afetam a saúde das populações. Nesta disciplina, a preocupação é em estudar
explicitamente os determinantes sociais do processo saúde-doença, como raça, etnia, classe,
grau de escolaridade e posição socioeconômica (ALMEIDA FILHO; BARRETO, 2011; RO-
THMAN; GREENLAND; LASH, 2011).
A observação de como os aspectos socioeconômicos atingem as populações é bastante antiga
e, ao longo dos anos, evidências se acumulam de que tanto o nível de pobreza como o contexto
social em que ela se desenvolve são importantes para a determinação do estado de saúde dos
indivíduos. Sabemos que indivíduos pobres vivendo em ambientes degradados apresentam pior
estado de saúde do que indivíduos pobres que vivem em ambientes melhores. Essas observações
dos aspectos sociais sobre as doenças se acentuaram no século XIX, assim como a associação das
taxas de mortalidade e morbidade com a renda e condições de moradia, por exemplo (ALMEIDA
FILHO; BARRETO, 2011; ROTHMAN; GREENLAND; LASH, 2011).
O mundo social é concebido em um espaço multidimensional, no qual os agentes sociais
ocupam posições relativas (econômico, social, cultural). As relações desses diferentes fatores de-
terminam os diferentes riscos de adoecer e morrer. Ainda, o estilo de vida, as escolhas individuais,
os hábitos e comportamentos são potencializadores das doenças ou da saúde, e os indivíduos não
são independentes de seus grupos sociais na escolha de seus hábitos. Isso reforça a ideia de que as
forças dos hábitos são coletivas. Por isso, é importante conhecer os determinantes mais complexos
do comportamento humano, além das condições materiais, para que as práticas de promoção e
prevenção possam ser efetivas (ALMEIDA FILHO; BARRETO, 2011).
Quando estudamos o processo saúde-enfermidade levando em consideração os grupos sociais
e não apenas o indivíduo, elaboramos questões que envolvem as populações. Por exemplo: se
fossemos estudar o HIV e AIDS a nível da Epidemiologia Clínica, poderíamos perguntar: o que
coloca a pessoa em risco de adquirir a infecção? No âmbito social, perguntaríamos: quais carac-
terísticas populacionais aumentam a vulnerabilidade a epidemias de HIV? (ALMEIDA FILHO;
BARRETO, 2011).
301
UNICESUMAR
No curso da vida (infância à senescência), a trajetória pessoal moldada no contexto social e pelas
condições materiais de vida determina o estado de saúde de uma população. Os efeitos cumulativos,
resultantes da intensidade e duração das exposições nocivas ao longo da vida também contextuali-
zam a Epidemiologia Social. Neste caso, não só os aspectos materiais são levados em consideração,
mas também o psicossocial, que leva em conta o sucesso, o fracasso ou frustração, a exclusão social, o
racismo, o desemprego, que podem produzir doenças como resultado de múltiplos estressores e falta
de habituação (ALMEIDA FILHO; BARRETO, 2011; ROTHMAN; GREENLAND; LASH, 2011).
Como a renda, o estado civil e a desigualdade de gênero afetam a qualidade de vida da sua
população?
O estudo dos aspectos sociais é um grande desafio do ponto de vista metodológico, pois é necessário realizar
estudos populacionais que permitam considerar de forma apropriada os efeitos contextuais e composi-
cionais daquela população. Os instrumentos de mensuração de fatores de risco e os métodos de análise,
como questionários e outros, parecem ser ineficientes para uma abordagem correta desses problemas
complexos. Por isso, os epidemiologistas são cada vez mais estimulados a desenvolver novas ferramentas
e estratégias de análise dos fatores sociais no processo saúde-doença. Tudo isso tem como objetivo final
a redução das desigualdades sociais a partir da elaboração de intervenções sociais no campo da saúde e
da formulação de política públicas baseadas no reconhecimento dos direitos da cidadania, da garantia de
liberdade democrática e a da busca da felicidade humana (ALMEIDA FILHO; BARRETO, 2011).
EPIDEMIOLOGIA HOSPITALAR
Em 23 de novembro de 2004, foi publicada a Portaria n° 2.529, que instituiu o Subsistema Nacional de Vigi-
lância Epidemiológica em Âmbito Hospitalar, integrado ao Sistema Nacional de Vigilância Epidemiológica
(SNVE). Essa publicação fortaleceu a Epidemiologia hospitalar (BUSATO, 2016). A Epidemiologia pode
ser amplamente empregada no ambiente hospitalar, uma vez que o hospital apresenta especificidades e
desafios próprios: vigilância de infecção hospitalar, controle de qualidade, análise da utilização dos servi-
ços, melhoramento da notificação compulsória e aprimoramento das decisões clínicas (PEREIRA, 2003).
302
UNIDADE 9
303
UNICESUMAR
Dentre os muitos softwares para digitação de banco de dados e análise dos resultados epi-
demiológicos, temos o EPIDATA® e EPI INFO®. O Epidata (disponível em:<http:www.epidata.
dk>) é uma base da Dinamarca gratuita, e muito utilizado devido a fácil digitação e análise
dos bancos de dados, minimização dos erros de digitação. Muito útil para estudos descritivos,
o Epi Info é uma base de dados construída pelo Centers for Disease Control and Prevention
(disponível em: https://www.cdc.gov/epiinfo/index.html). Também é uma ferramenta gratuita
para digitação de banco de dados e análise dos resultados, porém com métodos estatísticos
mais avançados que o Epidata. Os dois softwares oferecem manuais e versões em português
e podem ser utilizados por epidemiologistas, estudantes e outros profissionais de saúde. As
plataformas são atualizadas constantemente para garantir a compatibilidade com as versões
de Windows, Linux e outros sistemas operacionais
Fonte: ALMEIDA FILHO; BARRETO (2011).
304
UNIDADE 9
No hospital em que você trabalha ou a que tem acesso, quais são os indica-
dores gerados pelos sistemas de informação existentes?
Nós temos observado que a Epidemiologia tem sido amplamente utilizada para o
planejamento, a gestão e a avaliação dos serviços de saúde. Você poderá compreender
a aplicação da Epidemiologia para cada uma dessas ações.
305
UNICESUMAR
Do planejamento
306
UNIDADE 9
Da gestão
O conceito de gestão remete ao de administração, no que diz respeito às ações de planejar, orga-
nizar, dirigir e controlar. Planejar consiste em tomar decisões sobre os objetivos a serem alcan-
çados, as atividades que deverão ser desenvolvidas e os recursos utilizados. Organizar refere-se
a dividir a autoridade e a responsabilidade entre as pessoas para realizar as tarefas e atingir os
objetivos. Controlar consiste em acompanhar e fiscalizar a mobilização de recursos na realização
de tarefas para assegurar o alcance dos objetivos. Nesse sentido, a gestão é um componente do
planejamento em saúde, especificamente utilizado no momento tático-operacional (ALMEIDA
FILHO; BARRETO, 2011).
Na gestão em saúde, a Epidemiologia contribui para: elaborar diagnósticos e análises da si-
tuação de saúde (necessidades e serviços); definir critérios para a repartição de recursos; auxiliar
na elaboração de políticas públicas de saúde; elaborar planos e programas; organizar ações e
serviços; e avaliar sistemas, políticas, programas e serviços. Portanto, a Epidemiologia contribui
para o desenho e implantação de processos de produção de ações de saúde, auxiliando o gestor
na atuação sobre o processo saúde-doença-cuidado, desde a identificação dos determinantes de
saúde, passando pelos riscos, até os danos; na mobilização de tecnologias médico-sanitárias para
atender às necessidades e demandas. Quanto às intervenções sobre as relações de trabalho, a Epi-
demiologia tem pouco a oferecer ao gestor (ALMEIDA FILHO; BARRETO, 2011).
A avaliação dos serviços de saúde é uma das ações mais importantes para se determinar a efe-
tividade e impacto das atividades relacionados à saúde nas populações. São inúmeros os aspectos
que podem ser avaliados: serviços, programas, políticas ou sistemas de saúde. A avaliação deve ser
vinculada ao processo decisório da gestão como ferramenta estratégica para o planejamento e a
elaboração de intervenções; como formativo com o objetivo de fornecer informação para melhorar
uma intervenção no seu decorrer; como somativo para determinar os efeitos de uma intervenção
e decidir se ela deve ser mantida, transformada ou interrompida. É de fundamental contribuição
para o progresso dos conhecimentos (ALMEIDA FILHO; BARRETO, 2011; GORDIS, 2009).
307
UNICESUMAR
Existem 3 perguntas básicas para avaliação de resultados de intervenção: a intervenção pode alcançar
os resultados pretendidos (eficácia)? A intervenção alcança os resultados pretendidos (efetividade)?
Qual é a relação custo-benefício da intervenção (eficiência)? Todos os estudos epidemiológicos po-
dem responder essas questões, tanto os observacionais quanto os experimentais (ALMEIDA FILHO;
BARRETO, 2011; FRANCO; PASSOS, 2011).
Podemos dar como exemplo de avaliação de programas e serviços a avaliação da efetividade de
programas de rastreamento de doenças, como o câncer de colo uterino realizado a partir da realização
do exame de Papanicolaou. Para a avaliação, podemos utilizar medidas operacionais e as de desfecho.
Nas medidas operacionais, podemos avaliar o número de pessoas rastreadas pelo exame; a proporção
de pessoas da população-alvo (mulheres) e o número de vezes que foram rastreadas; a prevalência de
doença pré-clínica detectada; o custo total do programa; o custo por casos encontrados, não conhecidos
previamente; a proporção de resultados positivos levados ao diagnóstico final e tratamento; o valor
preditivo de um teste positivo na população rastreada. Dentre as medidas de desfecho podemos avaliar:
a redução da mortalidade na população rastreada; o aumento do percentual de casos detectados em
308
UNIDADE 9
CONSIDERAÇÕES FINAIS
Caro(a) aluno(a), chegamos ao fim da disciplina. Na última unidade, vimos como a Epidemiologia é
aplicada em diferentes áreas das ciências da saúde, e aqui nós destacamos apenas algumas.
Introduzimos a Epidemiologia Molecular e a Epidemiologia Genética, destacando o papel dos bio-
marcadores, das técnicas moleculares e dos fatores genéticos na ocorrência de doenças em populações.
Nós apresentamos brevemente o uso da técnica de reação em cadeia da polimerase e o sequenciamento
genético como ferramentas atuais para detecção de doenças infecciosas e não infecciosas, como os
cânceres.
Descrevemos como a Epidemiologia Clínica é praticada por profissionais de saúde para a desco-
berta dos determinantes das doenças e óbitos, assim como para tomadas de decisão. Destacamos que
as revisões sistemáticas de literatura e metanálise são estudos que podem ser utilizados para encon-
trar evidências clínicas que poderão auxiliar o clínico na tomada de decisão. Ainda, mostramos neste
tópico, como o leitor deve ler um artigo científico e utilizar seus resultados para a situação específica
exigida naquele momento.
Você aprendeu como a Epidemiologia é utilizada para a saúde ambiental e social. Destacamos
para você como os fatores exógenos aos seres humanos podem alterar os padrões de doença e saúde,
assim como os fatores sociais e descrevemos a Epidemiologia Hospitalar, destacando o papel dos
hospitais para a coleta e o processamento de dados epidemiológicos e para o planejamento e gestão
dos serviços de saúde, notificação de doenças e agravos.
Por último, apresentamos brevemente como a Epidemiologia é utilizada para a obtenção de dados
para subsidiar as tomadas de decisões e para o planejamento e gestão em saúde, assim como para
avaliar os efeitos dos serviços de saúde.
Espero que você tenha adquirido muitos conhecimentos e que essa disciplina tenha feito a diferença
para a sua formação em Gestão Hospitalar. Muito obrigada pela sua dedicação. Desejamos a você sucesso!
309
1. A Epidemiologia Ambiental é capaz de mensurar os fatores:
a) químicos, físicos e biológicos relacionados ao ambiente.
b) moleculares.
c) clínicos.
d) genéticos.
e) econômicos.
310
4. Qual é a função da Epidemiologia Social?
5. A Epidemiologia pode ser aplicada para o planejamento das ações em saúde, avaliar
os serviços de saúde e como subsídio para a gestão. Dentre os atributos da avaliação
em saúde estão:
I) Acessibilidade e cobertura.
II) Eficácia, efetividade e eficiência.
III) Adequação e aceitabilidade.
IV) Equidade e satisfação do paciente.
Assinale a alternativa correta.
a) Apenas I e II estão corretas.
b) Apenas II e III estão corretas.
c) Apenas I está correta.
d) Apenas II, III e IV estão corretas.
e) Todas as alternativas estão corretas.
311
No Brasil, a partir da constante coleta de dados pelas instituições de saúde sobre o processo
saúde-doença, foi possível verificar uma transição epidemiológica das doenças. Este tema
tem sido muito relevante do ponto de vista de gestão pública, uma vez que houve uma
mudança no perfil de morbi e mortalidade. No artigo a seguir, de Pereira, Alves-Souza e
Vale (2015), você poderá compreender melhor o que é a transição epidemiológica ocorrida
no Brasil e em outras regiões do mundo.
redução nas taxas de mortalidade infantil e de mortalidade por doenças infecciosas forta-
lecem a idéia de que houve mudanças significativas nos padrões de vida dos brasileiros’.
312
Uma das principais características do processo de transição epidemiológica é o
aumento na prevalência de doenças crônicas não transmissíveis, surgindo com maior
impacto em países desenvolvidos e a partir da década de 1960 vem se espalhando
rapidamente pelo Brasil. Algumas doenças são ainda mais frequentes a partir dos 60
anos, destacando-se as doenças osteoarticulares, hipertensão arterial sistêmica (HAS),
doenças cardiovasculares, diabetes mellitus, doenças respiratórias crônicas, doenças
transmissíveis respondem por 66,3% da carga da doença, enquanto as doenças in-
fecciosas por 23,5% e causas externas, 10,2%. […] Observa-se uma mudança ‘atípica’
nesta transição. Esta é decorrente não apenas da reemergência ou presença constante dos
casos de doenças infecciosas e parasitárias – se não com casos elevados de mortalidade,
mas ainda com casos relevantes de morbidade, detectada pelo sistema de
vigilância epidemiológica e pelos registros ambulatoriais e hospitalares –como também
pelo importante crescimento das causas externas, expressão da violência social em suas
diferentes formas.
AGORA ÉCOMPLEMENTAR
rentes regiões do país apresentam taxas, coeficientes e situações desiguais, ou até
mesmo em microrregiões do mesmo estado, da mesma cidade, demonstrando
assim, diferenças importantes nos diversos grupos populacionais em relação às condições
de vida e trabalho no país”.
COM VOCÊ
Fonte: Pereira, R .A.; Alves-Souza, R. A.; Vale, J.S. O PROCESSO DE TRANSIÇÃO EPIDEMIO-
LÓGICA NO BRASIL: UMA REVISÃO DE LITERATURA. Revista Científica da Faculdade de
Educação e Meio Ambiente, 2015, v.6, n.1, p.99-108.
LEITURA
313
A História da humanidade contada pelos vírus, bactérias, parasitas
e outros microrganismos...
Stefan Cunha Ujvari
Editora: Contexto
Sinopse: Malária, sífilis, tuberculose, ebola, gripe, AIDS, sarampo e outros
males que atacam a humanidade revelam muito mais da história do que
se imagina. Os passos do homem ao longo das épocas, a convivência com
diversos animais, o encontro com outros seres humanos, tudo isso pode ser desvendado com o
estudo microscópico de vírus, bactérias e parasitas que cruzaram - e cruzam - seu caminho. Este
livro, escrito por um médico infectologista, traz a genética para a área das ciências do homem.
Comentário: este livro pode auxiliar no entendimento do nascimento da Epidemiologia Moderna
e da sua importância para a saúde humana, animal e ambiental.
COMPLEMENTAR
Decisões Extremas
Ano: 2010
Sinopse: John é um profissional de publicidade casado com uma linda
mulher, com quem tem três crianças. O casal descobre que as duas crian-
VOCÊ
ças mais novas têm uma doença fatal e John deixa a carreira de lado para
dedicar-se à busca de uma cura. Ele conhece o Dr. Robert, um brilhante
cientista excêntrico, que lutará com ele contra tempo para descobrir a cura
para a anomalia.
Comentário: este filme mostra a aplicação da Epidemiologia Molecular, Genética e Clínica para
descobertas de tratamentos para doenças raras.
AGORA É COM
MATERIAL
314
UNIDADE 1
UNIDADE 2
Listas
ordenadas
Gráfico de "pizza"
em que cada fatia
representa propor-
cionalidade
Gráfico feito a
partir de uma
distribuição de
frequências
315
UNIDADE 3
1. D. Apenas a afirmativa I é incorreta, pois como tem um maior C.V. não terá a preferência de
compra.
2. D. Resolução:
n
h.( Fac1 )
Md Li 2
Fi
30
2.( 0)
Md 4 2
20
2.(15 0)
Md 4
20
CONFIRA SUAS RESPOSTAS
30
Md 4
20
Md 4 1, 5
Md 5, 5
3. E. A disciplina que apresenta maior frequência (basta olhar na coluna frequência) é a disciplina
de Bioquímica.
4. C. Para encontrar a média da turma, basta utilizar a equação do cálculo da média para dados
agrupados. Resolução:
UNIDADE 4
1. A. Existe uma correlação linear forte e positiva entre as disciplinas de Anatomia Humana e Fi-
siologia Humana. Porque o r encontrado é positivo e próximo de +1, por isso, é forte e positiva.
2. 2) D.
y 0, 74.x 2, 38
y 0, 74.6, 0 2, 38
y 4, 44 2, 38
y 6, 82
arredondando 6, 8
316
3. E. Não existe uma correlação linear, uma vez que não há uma tendência de reta crescente ou
decrescente, o r calculado pode ter valores próximos de zero.
4. 4) E.
4
IC 501, 2 1, 96.
100
4
IC 501, 2 1, 96.
10
IC 501, 2 1, 96.0, 4
IC 501, 2 0, 784
5. C. Para amostras menores do que 30 elementos, utilizamos a distribuição t de Student.
UNIDADE 5
3. Opção correta é a letra A (John Snow, medico inglês, dedicou seus estudos para a medicina
social, destacando-se pelo estudo do cólera e a transmissão hídrica).
UNIDADE 6
2. Opção correta é a E.
3. Opção correta é a B.
317
4. Opção correta é V;F;V;F;V.
UNIDADE 7
2. A opção correta é a alternativa C, pois se tratam de casos novos (incidência) após a vacinação
(estudo prospectivo do tipo ensaio clínico).
4. A opção correta é a alternativa B (15%), porque no início havia 300 pessoas com diabetes mellitus
em uma população de 2000 pessoas, resultando em 300 dividido por 2000= 0,15 multiplicado
por 100% = 15%.
5. A opção correta é a alternativa A, pois a incidência foi de 40 casos em 1700 pessoas que estavam
sob o risco de desenvolver diabetes mellitus (2000 pessoas subtraído de 300 que já estavam
doentes, assim 1700 estavam sob o risco de desenvolver). Lembre-se que a diabetes é uma
doença crônica de longa duração, portanto, nos anos posteriores ao estudo, 300 ainda estavam
doentes e não podem compor o denominador.
7. Tabela de contingência (2 x 2). Inicialmente monte a tabela: sempre inicie com a exposição ao lado
esquerdo (na vertical) e a doença em cima (na horizontal). De 120 casos, 92 consumiam álcool,
resultando em 28 pessoas que tinham a doença, mas não consumiam álcool (não expostos).
Das 230 controles, 20 consumiam álcool, portanto, 210 não faziam o uso do álcool.
O cálculo de Odds ratio são os pares que concordam divididos pelos que discordam. Logo, a
exposição ao álcool e a presença do hepatocarcinoma (92), e o não consumo e a ausência de
doença (210) são os pares que concordam, e os demais, os que discordam (28 e 20):
Odds ratio (OR)= (92 multiplicado por 210) dividido por (28 multiplicado por 20)= 19320/560= 34,5.
318
Isso significa que a probabilidade de o indivíduo exposto ao consumo de álcool desenvolver
hepatocarcinoma é quase 35 vezes maior (risco forte) em relação àqueles que não consomem
álcool excessivamente.
O cálculo de risco relativo (RR) é a incidência no grupo exposto dividido pela incidência no
grupo não exposto. Logo, a incidência de hepatocarcinoma é de 92 casos no grupo exposto
ao consumo de álcool (112 pessoas expostas), e no não exposto, a incidência é de 28 casos de
hepatocarcinoma em 238 pessoas.
Isso significa que o risco de desenvolver hepatocarcinoma é quase sete vezes maior em indiví-
duos que consomem álcool em relação aos que não consomem. O risco também é considerado
de forte associação.
8. A opção correta é a alternativa D, pois o risco é calculado pela incidência. A incidência foi de 40
casos novos em 900 pessoas que estavam sob o risco de adoecer (1000 pessoas subtraído de
100 que já possuíam a doença crônica).
4. A opção correta é a alternativa D. Os sujeitos cujos fatores de risco cardíaco são semelhantes
aos dos casos. Os objetivos de um estudo de casos e controles é determinar diferenças nos
fatores de risco observados em indivíduos com um efeito particular. Entretanto, se os casos e
os controles forem extremamente parecidos uns com os outros, haverá o risco de sobreposição,
com o resultado de que nenhuma diferença será detectável e o estudo se tornará inútil.
6. F;V;F;V.
319
UNIDADE 9
3. V;F;V.
320
UNIDADE 1
ARANGO, H. G. Bioestatística: teórica e computacional: com banco de dados reais em disco. 3. ed.
Rio de Janeiro: Guanabara Koogan, 2011.
BRASIL. Resolução n° 01/88 13 de junho de 1988. O Conselho Nacional de Saúde, no uso da com-
petência que lhe é outorgada pelo Decreto n° 93.933 de 14 de janeiro de 1987, RESOLVE: aprovar as
normas de pesquisa em saúde. Brasília: CNN, 1987. Disponível em: https://www.invitare.com.br/arq/
legislacao/conep-cns-ms/Resolu-o-01-de-1988-REVOGADA-CNS.MS.pdf. Acesso em: 14 maio 2021.
HOGG, R. V. Statistical Education: improvements are badly needed. The American Statistician, v. 45,
n. 4, 1991. Disponível em: https://amstat.tandfonline.com/doi/abs/10.1080/00031305.1991.10475832?-
journalCode=utas2 0#.WqRK7ujwbIU. Acesso em: 14 maio 2021.
IBGE. Notas Técnicas. Rio de Janeiro: IBGE, 1983. Disponível em: https://www.ibge.gov.br/apps/snig/
v1/notas_metodologicas.html?loc=0. Acesso em: 14 maio 2021.
PARENTI, T. M. S.; SILVA, J. S. F. da; SILVEIRA, J. Bioestatística. Porto Alegre: SAGAH, 2017.
PEREIRA, M. G. Epidemiologia: teoria e prática. 7. ed. Rio de Janeiro: Guanabara Koogan, 2003.
REFERÊNCIAS
script=sci_arttext&pid=S003470942017000600619&lng=en&nrm=iso. Acesso em: 14 maio 2021.
UNIDADE 2
ARANGO, H. G. Bioestatística: teórica e computacional: com banco de dados reais em disco. 3. ed.
Reimpr. Rio de Janeiro: Guanabara Koogan, 2011.
321
IBGE. Normas de apresentação tabular. 3. ed. Rio de Janeiro: IBGE, 1993.
INEP. Sinopse Estatística da Educação Básica 2019. Brasília: Inep, 2020. Disponível em: http://portal.
inep.gov.br/sinopses-estatisticas-da-educacao-basica. Acesso em: 17 maio. 2021.
LEVINE, D. M.; STEPHAN, D. F.; SZABAT, K A. Estatística – Teoria e Aplicações. Usando Microsoft
Excel em Português. 7. ed. Rio de Janeiro: LTC, 2016.
PARENTI, T. M. S.; SILVA, J. S. F. da.; SILVEIRA, J. Bioestatística. Porto Alegre: SAGAH, 2017.
UNIDADE 3
BASTOS, J. L. D.; DUQUIA, R. P. Medidas de dispersão: os valores estão próximos entre si ou variam
muito? Notas de Epidemiologia e Estatística. Scientia Medica, Porto Alegre, v. 17, n. 1, p. 40-44, jan./
mar., 2007. Disponível em: https://webcache.googleusercontent.com/search?q=cache:pxyqpAQBmGY
J:https://revistaseletronicas.pucrs.br/ojs/index.php/scientiamedica/article/download/1650/1845/+&-
cd=2&hl=pt-BR&ct=clnk&gl=br. Acesso em: 17 maio 2021.
INEP. Sinopse Estatística da Educação Básica 2019. Brasília: Inep, 2020. Disponível em: http://portal.
inep.gov.br/sinopses-estatisticas-da-educacao-basica. Acesso em: 18 maio 2021.
MARTINEZ, E. Z. Bioestatística para os cursos de graduação da área da saúde. São Paulo: Blücher,
2015. Disponível em: https://pt.slideshare.net/bookcadastro/9788521209027. Acesso em: 18 maio 2021.
PARENTI, T. M. S.; SILVA, J. S. F. da.; SILVEIRA, J. Bioestatística. Porto Alegre: SAGAH, 2017.
UNIDADE 4
REFERÊNCIAS
ANDERSON, L. O. et al. Identification of priority areas for reducing the likelihood of burning
and forest fires in South America August to October 2020. 16 p. São José dos Campos: SEI/Ce-
maden, 2020.
322
PARENTI, T. M. S.; SILVA, J. S. F. da.; SILVEIRA, J. Bioestatística. Porto Alegre: SAGAH, 2017.
ZOU, K. H.; TUNCALI, K.; SILVERMAN, S. G. Correlation and simple linear regression. Ra-
diology, v. 227, n. 3, p. 617-622, 2003.
UNIDADE 5
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia & saúde: fundamentos, métodos, aplica-
ções. Rio de Janeiro: Guanabara Koogan, 2011, p. 699.
BBC, British Broadcasting Corporation. History. Historic figures: James Lind (1716-1794). Disponível
em: <http://www.bbc.co.uk/history/historic_figures/lind_james.shtml>. Acesso em: 05 maio 2017.
BENSEÑOR, I. M.; LOTUFO, P. A. Epidemiologia: abordagem prática. São Paulo: Sarvier, 2005, p. 303.
BRASIL. Lei nº 8.080, de 19 de setembro de 1990. Brasília, 1990. Disponível em: <https://www.planalto.
gov.br/ccivil_03/LEIS/L8080.htm>. Acesso em: 19 maio 2017.
______. Lei nº 12.864, de 24 de setembro de 2013. Brasília, 2013. Disponível em: <http://www.planalto.
gov.br/ccivil_03/_ato2011-2014/2013/lei/l12864.htm>. Acesso em 19 maio 2017.
Ordem Social, Capítulo II, Seção II, Artigo 196-200. Brasília: Senado Federal: 1988. Disponível em:
<https://www.planalto.gov.br/ccivil_03/LEIS/L8080.htm>. Acesso em: 19 maio 2017.
FONSECA, A. F.; CORBO, A. D’A. O território e o processo saúde-doença. Rio de Janeiro: EPSJV;
Fiocruz, 2007, p. 265.
FRANCO, L. J.; PASSOS, A. D. C. Fundamentos de Epidemiologia. 2. ed. Barueri: Manole, 2011, p. 424.
HERZLICH, C. Saúde e doença no início do século XXI: entre a experiência privada e a esfera pública.
REFERÊNCIAS
Physis: revista de saúde coletiva, v. 14, n. 2, 2004. p. 383-394,
MEDRONHO, R. de A.; BLOCH, K. V.; LUIZ, R. R.; WERNECK, G. L. Epidemiologia. 2. ed. São Paulo:
Atheneu, 2009, p. 685
PEREIRA, M. G. Epidemiologia: teoria e prática. 6. ed. Rio de Janeiro: Guanabara Koogan, 2002, p. 596.
323
ROTHMAN, K. J.; GREENLAND, S.; LASH, T. L. Epidemiologia moderna. 3. ed. Porto Alegre: Art-
med, 2011, p. 887.
ROUQUAYROL, M. Z.; ALMEIDA FILHO, N. de. Epidemiologia & Saúde. 5. ed. Rio de Janeiro:
MEDSI, 1999, p. 600.
SAÚDE & CIDADANIA. Vigilância em Saúde Pública, 2017. Disponível em: <http://portalses.saude.sc.
gov.br/arquivos/sala_de_leitura/saude_e_cidadania/ed_07/05_01_01.html>. Acesso em: 25 maio 2017.
REFERÊNCIA ON-LINE
1 Em: <https://commons.wikimedia.org/wiki/File:Louis_Pasteur,_foto_av_F%C3%A9lix_Nadar.
jpg>. Acesso em: 27 fev. 2018
3 Em: <https://commons.wikimedia.org/wiki/John_Snow_(physician)#/media/File:John_Snow.jpg>.
Acesso em: 27 fev. 2018
UNIDADE 6
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia & saúde: fundamentos, métodos, aplica-
ções. Rio de Janeiro: Guanabara Koogan, 2011, p. 699.
PEREIRA, M. G. Epidemiologia: teoria e prática. 6. ed. Rio de Janeiro: Guanabara Koogan, 2002, p.596.
REFERÊNCIAS
ROTHMAN, K. J.; GREENLAND, S.; LASH, T. L. Epidemiologia moderna. 3. ed. Porto Alegre: Art-
med, 2011, p. 887.
ROUQUAYROL, M. Z.; ALMEIDA FILHO, N. de. Epidemiologia & Saúde. 5. ed. Rio de Janeiro:
MEDSI, 1999, p. 600.
FRANCO, L. J.; PASSOS, A. D. C. Fundamentos de Epidemiologia. 2. ed. Barueri: Manole, 2011, p. 424.
324
MEDRONHO, R. de A.; BLOCH, K. V.; LUIZ, R. R.; WERNECK, G. L. Epidemiologia. 2. ed. São Paulo:
Atheneu, 2009, p. 685.
REFERÊNCIA ON-LINE
1 Em: <https://commons.wikimedia.org/wiki/File:Infant_Mortality_Rate_World_map.png?uselan-
g=pt-br>. Acesso em: 27 fev. 2018
3 Em: <https://commons.wikimedia.org/wiki/File:Guaratinguet%C3%A1_Zoonoses.jpg?uselang=p-
t-br>. Acesso em: 27 fev. 2018
UNIDADE 7
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia & saúde: fundamentos, métodos, aplica-
ções. Rio de Janeiro: Guanabara Koogan, 2011, p. 699.
BENSEÑOR, I. M.; LOTUFO, P. A. Epidemiologia: abordagem prática. São Paulo: SARVIER, 2005,
p. 303.
BRASIL. Sala de Apoio à Gestão Estratégica. Ministério da Saúde. Disponível em: <http://sage.saude.
gov.br/> . Acesso em: 20 jul. 2017.
FRANCO, L. J.; PASSOS, A. D. C. Fundamentos de Epidemiologia. 2. ed. Barueri: Manole, 2011, p. 424.
LOTUFO, P. A. O escore de risco de Framingham para doenças cardiovasculares. Revista Médica, São
Paulo, v. 87, n. 4, p. 232-237, 2008.
MEDRONHO, R. de A.; BLOCH, K. V.; LUIZ, R. R.; WERNECK, G. L. Epidemiologia. 2. ed. São Paulo:
REFERÊNCIAS
Atheneu, 2009, p. 685.
PEREIRA, M. G. Epidemiologia: teoria e prática. 6. ed. Rio de Janeiro: Guanabara Koogan, 2003, p. 596.
ROTHMAN, K. J.; GREENLAND, S.; LASH, T. L. Epidemiologia moderna. 3. ed. Porto Alegre: Art-
med, 2011, p. 887.
ROUQUAYROL, M. Z.; ALMEIDA FILHO, N. de. Epidemiologia & Saúde. 5. ed. Rio de Janeiro:
MEDSI, 1999, p. 600.
325
REFERÊNCIA ON-LINE
1 Em: <https://commons.wikimedia.org/wiki/File:People_living_with_HIV_AIDS_world_map.
PNG>. Acesso em: 27 fev. 2018.
4 Em: <https://commons.wikimedia.org/wiki/File:Prevalence_of_HIV_infections_in_the_United_
States_and_total_AIDS_deaths.svg>. Acesso em: 27 fev. 2018.
UNIDADE 8
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia & saúde: fundamentos, métodos, aplica-
ções. Rio de Janeiro: Guanabara Koogan, 2011, p. 699.
BENSEÑOR, I. M.; LOTUFO, P. A. Epidemiologia: abordagem prática.São Paulo: Sarvier, 2005, p. 303.
FRANCO, L. J.; PASSOS, A. D. C. Fundamentos de Epidemiologia. 2. ed. Barueri: Manole, 2011, p. 424.
HULLEY, S. B.; CUMMINGS, S. R.; BROWNER, W. S.; GRADY, D. G.; NEWMAN, T. B. Delineando
a pesquisa clínica. 4. ed. Porto Alegre: Artmed, 2015, p. 386.
MEDRONHO, R. de A.; BLOCH, K. V.; LUIZ, R. R.; WERNECK, G. L. Epidemiologia. 2. ed. São Paulo:
Atheneu, 2009, p. 685.
PEREIRA, M. G. Epidemiologia: teoria e prática. 6. ed. Rio de Janeiro: Guanabara Koogan, 2003, p. 596.
ROTHMAN, K. J.; GREENLAND, S.; LASH, T. L. Epidemiologia moderna. 3. ed. Porto Alegre: Art-
med, 2011, p. 887.
ROUQUAYROL, M. Z.; ALMEIDA FILHO, N. de. Epidemiologia & Saúde. 5. ed. Rio de Janeiro:
MEDSI, 1999, p. 600.
ZUCCHETTI, C.; MORRONE, F. B. Perfil da pesquisa clínica no Brasil. Rev HCPA, v. 32, n. 3, p. 340-
347, 2012.
326
REFERÊNCIA ON-LINE
UNIDADE 9
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia & saúde: fundamentos, métodos, aplica-
ções. Rio de Janeiro: Guanabara Koogan, 2011, p. 699.
BENSEÑOR, I. M.; LOTUFO, P. A. Epidemiologia: abordagem prática. São Paulo: SARVIER, 2005,
p. 303.
FRANCO, L. J.; PASSOS, A. D. C. Fundamentos de Epidemiologia. 2. ed. Barueri: Manole, 2011, p. 424.
MALE D, BROSTOFF J, ROTH D, ROITT I. Immunology. 8. ed. Rio de Janeiro: Elsevier, 2012.
MCMICHAEL, A.J.; WOODRUFF, R.E.; HALES, S. Climate change and human health: present and
future risks. Lancet, v.367, p.859-869, 2006.
MEDRONHO, R. de A.; BLOCH, K. V.; LUIZ, R. R.; WERNECK, G. L. Epidemiologia. 2. ed. São Paulo:
Atheneu, 2009, p. 685.
PEREIRA, M. G. Epidemiologia: teoria e prática. 6. ed. Rio de Janeiro: Guanabara Koogan, 2003, p. 596.
ROTHMAN, K. J.; GREENLAND, S.; LASH, T. L. Epidemiologia moderna. 3. ed. Porto Alegre: Art-
med, 2011, p. 887.
REFERÊNCIAS
ROUQUAYROL, M. Z.; ALMEIDA FILHO, N. de. Epidemiologia & Saúde. 5. ed. Rio de Janeiro:
MEDSI, 1999, p. 600.
REFERÊNCIA ON-LINE
327
MEU ESPAÇO
328