Bioestatistica e Epidemologia

C A D E R N O
ESTUDO
AUTOR:
BIOESTATÍSTICA
MARCELO WERNER
E EPIDEMIOLOGIA
Ficha catalográfica elaborada na fonte pela Biblioteca da Faculdade Avantis
Aline M. d’Oliveira CRB 14 – 1063
Werner, Marcelo
W492b Bioestatística e epidemiologia [caderno de estudo
eletrônico] / Marcelo Werner. Balneário Camboriú: Faculdade
Avantis, 2017.
110 p. il.
Inclui Índice
ISBN: 978-85-66237-81-8 [recurso eletrônico]
1.Bioestatística. 2. Epidemiologia. I. Faculdade Avantis.

II. Título.
CDD 21ª ed.

570.151 - Bioestatística
CADERNO DE ESTUDO
BIOESTATÍSTICA
E EPIDEMIOLOGIA
AUTOR: MARCELO WERNER
PROJETO GRÁFICO E DIAGRAMAÇÃO

ANA LÚCIA DAL PIZZOL - anadiagrama@gmail.com
SUMÁRIO
AUTOR......................................................................................... 9
APRESENTAÇÃO...........................................................................10
UNIDADE 1..................................................................................12
BIOESTATÍSTICA
CAPÍTULO 1
1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA................................................................12
1.1 TIPOS DE DADOS COMUNS NAS CIÊNCIAS DA SAÚDE...................................................................13
1.2 ERRO, ACURÁCIA, PRECISÃO E ARREDONDAMENTO.....................................................................14
1.3 COLETA DE DADOS EM POPULAÇÕES E AMOSTRAS......................................................................15
1.4 PROBABILIDADE..........................................................................................................................18
1.4.1 Probabilidade de um evento..................................................................................................19
1.4.2 Contando os resultados possíveis.........................................................................................20
1.4.3 Multiplicando e adicionando probabilidades..........................................................................22
1.4.4 Modelos probabilísticos........................................................................................................23
1.4.4.1 Modelos para variáveis aleatórias discretas.......................................................................24
1.4.4.2 Modelo para variáveis aleatórias contínuas........................................................................25
1.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 1.....................................................................................26
SUMÁRIO
CAPÍTULO 2
2 BIOESTATÍSTICA DESCRITIVA...................................................................................27
2.1 MEDIDAS DE TENDÊNCIA CENTRAL..............................................................................................27
2.1.1 Média aritmética simples.....................................................................................................28
2.1.2 Mediana...............................................................................................................................29
2.1.3 Moda....................................................................................................................................31
2.1.4 Ponto médio.........................................................................................................................31
2.2 MEDIDAS DE VARIAÇÃO E DISPERSÃO..........................................................................................32
2.2.1 Amplitude.............................................................................................................................33
2.2.2 Variância...............................................................................................................................33
2.2.3 Desvio-padrão.......................................................................................................................35
2.2.4 Coeficiente de variação.........................................................................................................36
2.3 DISTRIBUIÇÃO DE FREQUÊNCIAS ................................................................................................38
2.3.1 Representações gráficas da distribuição de frequência.........................................................40
2.4 RELAÇÕES ENTRE DUAS VARIÁVEIS..............................................................................................40
2.4.1 Regressão linear simples......................................................................................................41
2.4.2 Correlação linear simples.....................................................................................................45
CAPÍTULO 3
3 BIOESTATÍSTICA INFERENCIAL.................................................................................49
3.1 NOÇÕES DE TESTES DE HIPÓTESE...............................................................................................49
3.2 O ESCORE PADRÃO E A ESTATÍSTICA “Z”......................................................................................50
SUMÁRIO
3.3 TESTE “T” DE STUDENT PARA UMA AMOSTRA..............................................................................54

3.4 ANÁLISE DE VARIÂNCIA (ANOVA)..................................................................................................56
3.5 TESTE NÃO-PARAMÉTRICO PARA DUAS AMOSTRAS: MANN-WHITNEY (“U”)..................................57
3.6 TESTE NÃO-PARAMÉTRICO PARA 3 OU MAIS AMOSTRAS: KRUSKAL-WALLIS (“H”).........................60
UNIDADE 2..................................................................................64
EPIDEMIOLOGIA
CAPÍTULO 4
4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA................................................................64
4.1 PERSPECTIVAS HISTÓRICAS.........................................................................................................65
4.2 EVOLUÇÃO CONCEITUAL...............................................................................................................66
4.3 DEFINIÇÕES BÁSICAS..................................................................................................................67
CAPÍTULO 5
5 PROCESSO SAÚDE-DOENÇA....................................................................................70
5.1 MODELOS EXPLICATIVOS DO PROCESSO SAÚDE-DOENÇA ...........................................................70
5.1.1 Modelo biomédico ou de medicina científica ocidental.........................................................71
5.1.2 Modelo de História Natural da Doença (HND) e prevenção....................................................71
5.1.3 Modelo sistêmico.................................................................................................................74
SUMÁRIO
CAPÍTULO 6
6 EPIDEMIOLOGIA DESCRITIVA....................................................................................77
6.1 – INDICADORES DE SAÚDE COLETIVA...........................................................................................77
6.1.1 Morbidade............................................................................................................................78
6.1.2 Mortalidade..........................................................................................................................82
6.2 – MEDIDAS DE ASSOCIAÇÃO........................................................................................................84
6.2.1 – Risco relativo e risco atribuível.........................................................................................85
6.2.2 – Razão de chances ou Odds Ratio.......................................................................................88
6.3 – TESTES DIAGNÓSTICOS............................................................................................................89
6.4 – VIGILÂNCIA À SAÚDE................................................................................................................92
6.4.1 - Sistemas de Informação em Saúde (SIS)............................................................................93
CAPÍTULO 7
7 PROCESSO EPIDÊMICO............................................................................................97
7.1 FREQUÊNCIA E DISTRIBUIÇÃO DAS DOENÇAS: EPIDEMIA E ENDEMIA...........................................97
7.2 EPIDEMIOLOGIA DAS DOENÇAS INFECCIOSAS............................................................................100
7.2.1 Reservatórios de agentes infecciosos.................................................................................100
7.2.2 Saída do agente infeccioso e modos de transmissão..........................................................101
7.2.3 Entrada do agente no hospedeiro........................................................................................103
7.2.4 Hospedeiro suscetível.........................................................................................................103
BIOESTATÍSTICA E
EPIDEMIOLOGIA 7
SUMÁRIO
7.2.5 Implicações para a saúde pública.......................................................................................104

7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS.................................................................105
7.3.1 Características das doenças não-infecciosas......................................................................105
7.3.2 Doenças cardiovasculares...................................................................................................106
7.3.3 Câncer................................................................................................................................106
7.3.4 Causas externas.................................................................................................................107
7.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO 7...................................................................................108
REFERÊNCIAS BIBLIOGRÁFICAS................................................... 110
BIOESTATÍSTICA E
EPIDEMIOLOGIA 8
AUTOR
MARCELO WERNER
O autor é Biólogo e Economista, mestre em Ciência e Tecnologia Ambiental e especialista
em Ensino de Ciências e Ensino Virtual. É professor na Faculdade Avantis desde 2014, tutor da
Secretaria Nacional de Segurança Pública desde 2015 e servidor do Ministério da Justiça desde
2004.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 9
APRESENTAÇÃO
O caderno de estudos de Bioestatística e Epidemiologia acompanhará sua aprendizagem

nessa disciplina e será fonte suficiente para você alcançar um ótimo aproveitamento ao final do
semestre. Apesar disso, inúmeros exemplos e exercícios estarão disponíveis em nosso ambiente de
virtual de aprendizagem (AVA). Lá também encontraremos material complementar, como vídeos
e tabelas. Além disso, uma breve revisão de matemática básica, auxiliará aqueles que, porventura,
tenham dificuldade com a aritmética e a álgebra necessárias para o bom desenvolvimento do
nosso processo de ensino e aprendizagem.
Este caderno está dividido em duas unidades: Bioestatística e Epidemiologia. É verdade que
há um forte relacionamento entre as duas ciências, pois a Epidemiologia representa o estudo da
medicina preventiva e da saúde pública, enquanto a Bioestatística é seu fundamento científico e
quantitativo. Contudo, muitas ferramentas bioestatísticas podem (e devem) ser usadas, mesmo
fora do contexto epidemiológico, em seus trabalhos na faculdade, em seu trabalho de conclusão
de curso e em sua vida profissional. Devo ressaltar que, ao utilizarmos dados reais, os cálculos
manuais não são adequados devido ao grande número de medições e à variedade de escalas
numéricas. Para isso, programas de computador (muitos gratuitos) são eficazes em realizar os
cálculos, para que você formule conclusões. No AVA também teremos uma série de sugestões
a respeito. Porém, é imprescindível que você execute os primeiros procedimentos estatísticos
passo a passo, de forma manual, para que possa executá-los posteriormente nos programas de
computador com mais confiança. A boa notícia é que em nossas avaliações e exercícios, sempre
que possível, os números serão fáceis de calcular, seja pela quantidade, seja pela complexidade.
Por isso, apesar de ser altamente recomendável, não é imprescindível o uso de calculadora
durante a avaliação (isso mesmo, os cálculos não serão complexos); importante ressaltar que não
é possível usar a calculadora do seu celular.
A primeira unidade está dividida em 3 capítulos. O capítulo 1 traz os conceitos básicos de

Bioestatística. Ao final do capítulo você será capaz de identificar os principais tipos de dados
biológicos, bem como os princípios necessários para coletar dados cientificamente; também
compreenderá a importância da probabilidade para a tomada de decisões baseadas em dados.
O capítulo 2 introduz as medidas que permitem descrever o conjunto de dados com o qual você
BIOESTATÍSTICA E
EPIDEMIOLOGIA 10
conduzirá uma pesquisa, além de proporcionar métodos para apresentar grande quantidade de
dados e descrever relações entre variáveis. As conclusões, previsões e inferências a partir do seu
conjunto de dados poderão ser feitas ao final do capítulo 3, no qual estudaremos os principais
testes estatísticos.
A segunda unidade está dividida em 4 capítulos. É possível encontrar uma grande variedade
de classificações dos assuntos em Epidemiologia. Optamos por uma divisão que prioriza o
conhecimento sintético e objetivo dessa ciência básica da Saúde Pública. Assim, você encontrará
os conceitos básicos no capítulo 4, além de ser capaz, ao final do estudo, de descrever o
desenvolvimento da ciência epidemiológica ao longo do tempo e estabelecer padrões para seu
futuro. No capítulo 5, o processo saúde-doença será abordado a partir de 3 modelos; ao final, você
será capaz de reconhecer como os serviços de saúde com os quais você tem contato transitam entre
esses modelos. O capítulo 6 apresenta técnicas que permitirão que você descreva indicadores de
saúde de populações, bem como quantifique fatores de risco para os mais diversos agravos à saúde;
além disso, nesse capítulo entraremos em contato com os sistemas que alimentam os serviços de
saúde, permitindo-os promover a prevenção e a recuperação da saúde da população. Por fim, no
capitulo 7, estudaremos o processo epidêmico através da distribuição espacial e temporal das
doenças e de características das doenças transmissíveis e não- transmissíveis importantes na
disseminação das enfermidades. Finalizando cada capítulo, você encontrará considerações finais
que representam um breve resumo do que foi estudado.
Os conceitos e técnicas com os quais entraremos em contato a partir de agora, apesar de

extensos e nem sempre simples, correspondem a uma introdução. Uma introdução bastante
robusta, que será mais do que suficiente para um bom aproveitamento nas avaliações, como já
foi dito, mas também em eventuais concursos dos quais você participe, exames do Ministério
da Educação (como o ENADE e outros que possam vir) e, principalmente, para a sua prática
acadêmica e profissional. Não obstante, você poderá se deparar com situações na vida real
em que outras técnicas serão necessárias. Se for o caso, saiba que sempre poderá contar com
auxílio extra, através do AVA. Também se houver dificuldade para a incorporação de definições
necessárias ao desenvolvimento das atividades, nosso canal de comunicação está sempre aberto.
Por fim, lembre-se que o ensino semipresencial traz grandes vantagens, como a possibilidade
de você gerenciar seu tempo, mas também requer responsabilidade e dedicação. Sendo o principal
interessado no ensino, você experimentará um aprendizado muito mais significativo.
Boa sorte e até breve.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 11
UNIDADE 1
BIOESTATÍSTICA
CAPÍTULO 1
1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA
O termo ‘estatística’ tem origem latina e deriva da palavra ‘estado’. Essa associação se deve
à importância histórica da coleta de dados para os governos, em ações referentes a censos
demográficos, recrutamentos militares e coleta de impostos. Em 1749, o professor alemão
Gottfried Achenwall (1719 – 1772) utilizou pela primeira vez a palavra Statistik e somente 42 anos
depois, registrou-se a primeira publicação do termo em inglês.
Agora que sabemos a origem, precisamos entender o que significa realmente a palavra
estatística. É muito comum encontrarmos o termo como sinônimo de dados. Por exemplo,
ouvimos um narrador de futebol comentar sobre as estatísticas do jogo (referindo-se ao número
de faltas, porcentagem de posse de bola etc.), o Ministério do Trabalho divulgar as estatísticas
da mão-de-obra (tais como taxas de desemprego ou remuneração média do trabalhador), as
Secretarias de Educação publicarem estatísticas do ensino médio (referindo-se à criação de novas
vagas, à relação entre o número de professores e alunos, às taxas de evasão etc.). Ainda que seja
possível encontrar essa definição em alguns dicionários, neste caderno de estudos utilizaremos
o sentido científico de Estatística, que pode ser compreendido como a coleta ordenada, análise
e interpretação de dados como o objetivo de apresentar e avaliar as conclusões baseadas nesses
dados. Além disso, há outro significado – menos amplo – que aparecerá neste livro: refere-se à
estimativa de um parâmetro populacional, a partir de uma amostra (veremos mais detalhadamente
no item 1.3); nesse caso, a palavra deve ser escrita com a letra inicial minúscula.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 12
Quando a estatística é aplicada a informações biológicas, chamamos de Bioestatística. Essa
ciência tem se desenvolvido principalmente a partir do final do século XIX e é responsável
pelo aumento da expectativa de vida ocorrida em todos os países do mundo e pela melhora nas
condições de saúde das populações. Neste caderno, os termos Estatística e Bioestatística serão
utilizados como sinônimos, uma vez que sempre trataremos de informações biológicas.
1.1 TIPOS DE DADOS COMUNS NAS CIÊNCIAS DA SAÚDE
As características que podem se diferenciar entre uma entidade biológica e outra, tais como
tamanho, cor, composição química etc., são os principais dados utilizados em Bioestatística. Esses
dados (também chamados de variáveis) podem ser divididos de diversas formas, dependendo
do objetivo e tipo de Estatística a ser utilizada. Em nosso curso utilizaremos uma classificação
bastante simples, mas que é suficiente para alcançarmos os objetivos propostos.
As variáveis qualitativas são representadas pelos dados que se encontram em categorias

Variáveis
ou atributos. Podemos citar como exemplos a manifestação da cor dos olhos em mamíferos, qualitativas:
classificação em macho ou fêmea, entre outras (é muito comum encontramos fenótipos genéticos nominais
(e.g. fator
nesse tipo de variável). As variáveis qualitativas podem ser divididas em nominais e ordinais. Rh positivo
ou negativo)
Os dados qualitativos nominais referem-se a atributos que não guardam entre si hierarquia,
ordinais
tais como homem e mulher, preto ou branco, tipo sanguíneo A, B, AB ou O etc. Já as variáveis (e.g. primeira
ou segunda
qualitativas ordinais são atributos que têm relação de hierarquia entre si, tais como baixo peso, dentição)
eutrófico, sobrepeso, obesidade.
As variáveis quantitativas são mais comuns em Bioestatística, possibilitam resultados mais

robustos, são representadas por valores numéricos e podem ser divididas em dois tipos. As
variáveis quantitativas discretas representam (em geral) valores consecutivos e inteiros, tais
como o número de dentes extraídos de um paciente, o número de consultas de um fisioterapeuta
na semana etc. Já as variáveis quantitativas contínuas representam apenas aproximações dentro
de um intervalo observado, como por exemplo, o peso inicial de um paciente submetido a uma
dieta restritiva de calorias. Para ficar mais claro, suponha que o referido paciente tenha medido
seu peso antes do tratamento em uma balança que informa apenas o número de quilogramas,
sem decimais, e o valor foi 87 kg. Em seguida, ele utilizou uma balança que registra, além dos
quilogramas, também seus decimais; nesse caso, seu peso foi igual a 86,8 kg. O mesmo indivíduo
poderia ter seu peso medido em balanças cada vez mais precisas, apresentando pesos iguais
BIOESTATÍSTICA E
EPIDEMIOLOGIA 13
a 86,83 kg, 86,825 kg e assim por diante. Perceba que as medições menos precisas são apenas Variáveis
arredondamentos que permitem definirmos um intervalo de valores contínuos; por isso, esse quantitativas:
tipo de variável se chama quantitativa contínua. discretas

(e.g. número
de animais
infectados)
contínuas
(e.g. altura de
pacientes)
1.2 ERRO, ACURÁCIA, PRECISÃO E ARREDONDAMENTO
Acurácia representa a proximidade das medições coletadas em relação ao valor real da variável
medida, enquanto precisão refere-se à proximidade dos valores de cada medição repetida em
relação à mesma variável. A Figura 1 ilustra a diferença entre acurácia e precisão:
Figura 1. Modelo ilustrativo de acurácia e precisão.

Fonte: BUSSAB; MORETTIN, 1987 (adaptado).
Todo pesquisador deve almejar grande acurácia e precisão. Contudo, erros acontecem
e devemos estar preparados para representá-los. Para isso, é importante relembrar regras
simples de arredondamento, que nos indicam que os números menores que 5 (cinco) devem ser
rebaixados, enquanto números iguais ou maiores que 5 (cinco) devem ser aumentados, quando
formos reduzir as casas decimais. Relembrando o exemplo do paciente submetido à dieta
restritiva, perceba que seu peso na balança mais precisa, igual a 86,825 kg, foi arredondado para
86,83 kg, que, por sua vez, foi arredondado para 86,8 kg e, por fim, arredondado para 87 kg, na
balança menos precisa. Nesse caso, o peso indicado nesta última balança representa um intervalo
entre uma continuidade de valores entre 86,5 kg e 87,4 kg (pois ambos representam extremos de
valores que seriam arredondados para 87 kg). Note que, mesmo na balança mais precisa, 86,825
BIOESTATÍSTICA E
EPIDEMIOLOGIA 14
kg representa apenas um intervalo entre 86,8245 kg e 86,8254 kg.
Agora que você está familiarizado com as regras de arredondamento, podemos introduzir o
conceito de acurácia representada pela indicação numérica da medição. Suponha que você tenha
percebido uma lesão no pescoço de um paciente e a mediu, obtendo o resultado igual a 3 cm.
A apresentação dessa informação, indicará que a referida lesão tem entre 2,5 cm e 3,4 cm (pois
ambos os valores representam os valores extremos que devem ser arredondados para 3 cm, caso
ocorram). Caso você apresente a mesma informação com uma casa decimal a mais, ou seja, 3,0 cm,
qualquer observador treinado em Bioestatística saberá que se trata de uma lesão cujo tamanho
tem entre 2,95 cm e 3,04 cm. Se ainda há dúvidas, podemos continuar aprofundando o mesmo
exemplo. A representação da lesão como tendo 3,00 cm indica que seu verdadeiro valor está em
uma continuidade de valores entre 2,995 cm e 3,004 cm; já 3,000 cm representa o intervalo entre
2,9995 e 3,0004 e assim por diante.
1.3 COLETA DE DADOS EM POPULAÇÕES E AMOSTRAS
População:
conjunto
O objetivo principal da análise bioestatística consiste em inferir (i.e. deduzir) características completo das
variáveis de
de um grupo de variáveis através da generalização da análise de uma amostra desse grupo. Essa interesse
generalização pressupõe o conhecimento de importantes conceitos, tais como população e Amostra:
uma parte
amostra, parâmetros e estatísticas, amostragens aleatórias e outliers. idealmente
representativa
da população
Em Bioestatística, o termo população tem um significado ligeiramente diferente do que se
emprega no cotidiano. Biólogos e profissionais da saúde podem ser referir a populações como
sendo um grupo de seres humanos ou outras espécies de animais. Contudo, para os bioestatísticos,
população significa um grupo completo de variáveis sobre as quais se deseja tirar conclusões.
Por exemplo, se uma pesquisadora pretende definir a altura média dos calouros do curso de
Fisioterapia da Faculdade Avantis, a população será composta pelos valores que representam
as alturas de todos os calouros do referido curso. Vale ressaltar que é de extrema importância
delimitar a população de acordo com o objetivo da pesquisa, a fim de evitar extrapolações Viés (pl. vieses):
que introduzam vieses nos resultados das análises. Imagine se, por conveniência, a mesma tendenciosidade
ou erro
pesquisadora coletasse as alturas de todos os alunos que estivessem na terceira aula de anatomia sistemático
do primeiro período, sem se preocupar em identificar os alunos que são repetentes (e, portanto,
não são calouros) ou os calouros que faltaram naquele dia. Se isso ocorresse, o objetivo passaria
a ser a definição da altura média dos alunos daquela aula de anatomia.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 15
Na realidade da pesquisa científica, quase nunca é possível obter dados da população
inteira por diversos motivos, como recursos financeiros e humanos limitados, tempo reduzido
e dinâmica populacional (morte, nascimento, ausências temporárias, mudança de categorias,
entre outros motivos). Por isso, é muito comum utilizarmos amostras para inferir informações
sobre a população. Amostras são partes da população que, de preferência, a represente bem. A
qualidade da amostra depende do seu tamanho em relação à população (quanto maior a amostra,
menor será o erro amostral) e da aleatoriedade da coleta das variáveis (é ideal que cada membro
da população tenha a mesma probabilidade de ser escolhido para ser medido). Você certamente já
participou de uma coleta de dados em que toda a população foi medida: aqui mesmo, na Faculdade
Avantis, todos os alunos têm que preencher um formulário com sua data de nascimento; nesse
caso, a instituição fez um censo (quando toda a população é medida). Lembra quando dissemos
que, quanto maior a amostra, menor será o erro amostral? Pois é, no censo, o erro amostral é igual
a zero, pois trata-se da maior amostra possível; essa amostra é a própria população.
Importante ressaltar que, quando se mede variáveis de uma população (todos os membros que
interessam para a pesquisa), temos um parâmetro; por exemplo, se medirmos a quantidade de
calorias ingeridas por cada um dos ratos de um determinado biotério e dividirmos pelo número
total de ratos, teremos um parâmetro populacional (a ingestão média de calorias). Já quando
se mede variáveis de uma amostra (parte da população), temos uma estatística; retomando o
exemplo, se escolhermos alguns ratos para realizar a medição e dividirmos o total de calorias
medido pelo número de animais escolhidos, teremos uma estatística.
Já comentamos que o tamanho da amostra é importante para a qualidade do resultado da

pesquisa; agora vamos nos dedicar um pouco a discutir a aleatoriedade da coleta das variáveis.
Imagine que um pesquisador esteja tentado comprovar que os alunos do curso de Enfermagem
têm um IMC (índice de massa corporal) maior que os alunos de Nutrição, pois estes têm melhor
conhecimento em dietética (ou qualquer outra hipótese). Para isso, ele decide medir o peso e a
altura (necessários para calcular o IMC) de 10% dos alunos de cada curso, pois seria inviável medir
todos. No momento da medição dos alunos de Enfermagem, ele escolhe os maiores, enquanto no
curso de Nutrição, ele escolhe os menores alunos para garantir a confirmação da sua hipótese. É
claro que isso não seria justo, tampouco teria relevância científica. Para evitar distorções desse
tipo, que nem sempre são assim tão evidentes (às vezes ocorre sem intenção), há técnicas de
amostragem probabilística que servem para garantir a aleatoriedade da amostra, permitindo que
esta seja mais representativa da população. A seguir, serão apresentadas as quatro técnicas de
amostragem probabilística mais importantes:
Amostragem aleatória simples – todos os membros da população são computados e têm a

mesma chance de ser escolhidos através de um sorteio. Apesar de ser a amostragem ideal, muitas
vezes torna-se inviável; imagine que você pretenda identificar a porcentagem de pessoas com
BIOESTATÍSTICA E
EPIDEMIOLOGIA 16
depressão na cidade e, para isso, queira utilizar a amostragem aleatória simples. Para início de
conversa, você teria que ter o nome de todas as pessoas da cidade para realizar o sorteio, em uma
grande urna, por exemplo (difícil, né?).
Amostragem sistemática – os membros de uma população devem estar ordenados e, sem que
o pesquisador saiba previamente a ordem, deve escolher o nésimo membro da população, sendo
“n” um número escolhido de acordo com o tamanho da população. Suponha que você queira
conhecer o número de pessoas deprimidas na sua sala de aula, sem perguntar para todo mundo;
para isso, sem saber aonde estão localizados seus colegas de sala, você determina um número –
5, por exemplo – e pergunta ao quinto aluno da fila, depois ao 10º, depois ao 15º, ao 20º e assim
por diante (a cada cinco colegas). Novamente perceba que, no caso de populações grandes, essa
técnica se torna bastante difícil.
Amostragem estratificada – a população é dividida em subpopulações relevantes para o

estudo e uma porcentagem dessa subpopulação é medida. Voltando ao exemplo da determinação
da porcentagem de depressão, você poderia decidir dividir a cidade em bairros e entrevistar uma
porcentagem de cada bairro (1%, digamos). Dessa forma, cada bairro estaria representado de
acordo com sua população.
Amostragem por conglomerado – assim como na amostragem estratificada, a população

também é dividida em subpopulações relevantes, mas desta vez, o pesquisador sorteia uma
subpopulação e entrevista ou mede todos os seus membros. Dependendo do objetivo do estudo,
esse tipo de amostragem pode introduzir muito viés e, por isso, deve ser utilizada com cautela.
Imagine que você queira determinar a força média dos alunos de Educação Física e, para isso,
divida a turma em homens e mulheres; ao sortear um grupo para ser medido, você estará
privilegiando alunos que têm uma intensidade de força muito diferente do outro grupo, em
média. Contudo, algumas vezes esse tipo de amostragem pode se revelar eficiente. Suponha que
você trabalhe na Secretaria de Educação de Santa Catarina e decida determinar a qualidade do
ensino através de visitas às escolas da rede estadual (isso realmente ocorre). Para isso, sortear
algumas entre todas as escolas do estado (aleatória simples), escolher algumas em determinada
ordem (sistemática) ou escolher uma porcentagem de cada cidade ou região (estratificada)
tornaria o trabalho praticamente inviável, pois representantes teriam que se descolar para várias
cidades. Nesse caso, a amostragem por conglomerado se mostra mais eficaz: você poderia dividir
em grupos (cidades, por exemplo) e sortear duas ou três a cada ano, para que os representantes
visitassem todas as unidades daquelas cidades.
Outra consideração importante a fazer sobre variáveis coletadas de populações é que,

ocasionalmente, conjuntos de dados têm variáveis que são muito discrepantes em relação ao
restante da amostra; são os outliers. Suponha que você esteja tentando determinar o tamanho
BIOESTATÍSTICA E
EPIDEMIOLOGIA 17
médio dos recém-nascidos em uma maternidade e, para isso, sorteou aleatoriamente 5 bebês; Outliers:
valores muito
seus tamanhos em centímetros foram 41, 42, 45, 47 e 71. Perceba que o último membro da amostra discrepantes em
um conjunto de
apresenta um tamanho muito diferente do restante, sendo considerado um outlier. Sempre que variáveis
um pesquisador se deparar com essa situação, a primeira providência é checar o registro, pois
pode ter havido um erro de medição ou de marcação. Nessa pesquisa específica, você poderia
verificar se o tamanho correto não seria 41 cm mas, por erro de digitação, foi computado 71. Se
não for o caso, você poderia verificar se o indivíduo realmente é um recém-nascido ou é mais
velho. Após todas as verificações, você pode concluir que realmente se trata de um valor correto
e que dados muito diferentes da média podem ocorrer (realmente houve um recém-nascido
norte-americano com essa estatura). Nesse caso, cabe ao pesquisador a decisão de acomodar a
variável discrepante através de procedimentos estatísticos (que não serão discutidos aqui, pois
extrapolam os objetivos do nosso curso), repetir o experimento com um novo conjunto de dados
ou, até mesmo, excluí-la.
1.4 PROBABILIDADE
A probabilidade é uma parte tão extensa da Matemática, que poderíamos ter um curso inteiro
sobre ela. Contudo, para os propósitos dessa disciplina, poderemos resumi-la a apenas alguns
tópicos que serão de interesse da Biologia e que também servirão para melhor aplicação dos
conceitos da estatística inferencial, a qual será introduzida mais adiante.
Em muitos casos, a probabilidade é intuitiva. Prova disso, é que quase qualquer pessoa deve
responder corretamente se perguntada sobre a chance de se obter uma cara, ao jogarmos uma
moeda que não seja viciada e que possua dois lados diferentes (cara e coroa). Infelizmente, nem
sempre é possível identificar de pronto o resultado de um experimento que envolva probabilidade
e, por isso, será necessário um maior aprofundamento no tema.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 18
1.4.1 Probabilidade de um evento
Quando nos depararmos com probabilidade, uma fórmula básica poderá resolver a maior
parte dos problemas:
P(a) = probabilidade de ocorrer o evento “a”;
a = número de vezes que ocorre o evento “a”;
S = nº total de possíveis resultados para aquele experimento ou espaço amostral.
Voltando ao exemplo da moeda não viciada, vamos utilizar a fórmula para calcular a
probabilidade de se obter uma CARA ao jogarmos uma moeda. Fácil: a probabilidade do evento
CARA, ou seja, P(CARA), é igual ao número de vezes que ocorre CARA, dividido pelo número total
de possíveis resultados de uma moeda (espaço amostral) ou simplesmente:
Isso significa que, ao jogarmos uma moeda não viciada, a probabilidade de se obter uma CARA
é igual a 0,5 ou, se quisermos nos referir à porcentagem, basta multiplicar por 100; nesse caso,
50% (0,5 x 100).
Agora que você já sabe o básico sobre o assunto, vamos a um exemplo mais adequado. Suponha
que você seja uma fisioterapeuta que participa de um programa de residência, juntamente com
outros 3 colegas e, num determinado dia, 4 pacientes precisam de atendimento urgente, sendo
que três deles têm a necessidade de ventilação mecânica. Sabendo que cada profissional terá
que atender um dos 4 pacientes, qual a probabilidade de você ter que realizar o procedimento de
ventilação mecânica? Usando novamente a fórmula, temos:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 19
Você encontrará exercícios e mais exemplos no Ambiente Virtual de
Aprendizagem.
1.4.2 Contando os resultados possíveis
Nem sempre o espaço amostral (S) está claro. Sendo assim, muitas vezes será preciso
calculá-lo antes de utilizar a fórmula básica. A condição mais frequente é quando um evento é
composto por sucessivas fases. Nesse caso, o número de resultados possíveis de cada fase deve
ser multiplicado, para chegarmos ao espaço amostral (S). Se cada fase possuir o mesmo número
de resultados possíveis, podemos representar matematicamente por:
k = número de resultados possíveis de cada fase;
n = número de fases.
Com isso em mente, vamos relembrar as aulas de genética. Uma série de três nucleotídeos é
chamada de códon, que codifica um aminoácido. Lembrando que um nucleotídeo pode conter
qualquer uma de 4 bases (adenina, citosina, guanina e timina), calcule o espaço amostral (S).
Primeiramente, identificaremos o número de resultados possíveis de cada fase (k = 4). Em
seguida, o número de fases (n = 3). Sendo assim,
BIOESTATÍSTICA E
EPIDEMIOLOGIA 20
VAMOS REFLETIR:
Se nosso mecanismo de “montagem” de aminoácidos permite 64 variedades diferentes,
por que temos apenas 20 tipos?
Agora que já sabemos contar resultados possíveis (espaço amostral) que não estejam evidentes,
podemos calcular suas probabilidades. Desta vez, vamos usar um jogo para o exemplo. Suponha
que você tenha jogado um par dados e queira saber a probabilidade de obter o número 12 na soma
dos dois dados, supondo que estes não sejam viciados (esse jogo se chama craps e é muito comum
em cassinos dos EUA e da UE). Primeiramente, relembre as fórmulas:
Agora, vamos determinar o número de vezes que ocorre o evento escolhido. Para isso, pense
como podemos obter a soma igual a 12 em dois dados. Há apenas 1 possibilidade: 6 no primeiro
dado e 6 no segundo. Em seguida, devemos nos dedicar a encontrar o espaço amostral. Para isso,
devemos saber qual é o número de resultados possíveis de cada fase (dado), ou seja 6 (1, 2, 3, 4, 5
ou 6), para, em seguida, elevarmos ao número de fases. Portanto,
VAMOS REFLETIR:
A probabilidade de se obter a soma dos dois dados igual a 7 seria maior, menor ou igual
à probabilidade de se obter 12?
Você encontrará exercícios e mais exemplos no
Ambiente Virtual de Aprendizagem.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 21
1.4.3 Multiplicando e adicionando probabilidades
Outro recurso bastante útil para a Bioestatística refere-se às operações com probabilidades.
Sempre que dois ou mais eventos forem condições obrigatórias para o resultado final, as
probabilidades individuais devem ser multiplicadas. Já quando, em dois ou mais eventos
mutuamente exclusivos, qualquer deles for condição para o resultado final, as probabilidades
individuais devem ser somadas. Em resumo, quando for necessário determinar a probabilidade
de uma condição E de outra (E de tantas quantas forem), deve-se multiplicar as probabilidades
individuais; quando for necessário determinar a probabilidade de uma condição OU de outra
(OU de tantas quantas forem), deve-se somar as probabilidades individuais.
Por exemplo, suponha que na espécie humana, homens (♂) e mulheres (♀) nasçam na mesma
proporção (na realidade, homens têm uma prevalência ligeiramente superior no nascimento).
Sendo assim, podemos calcular a probabilidade de uma gestante qualquer ter uma menina (que
será a mesma para um menino),
Agora, se uma gestante qualquer, que pretenda ter dois filhos, nos perguntar sobre a
probabilidade de ambos serem meninas ou ambos meninos ou um menino e uma menina,
precisamos realizar operações com probabilidade:
1ª gravidez 2ª gravidez
P(♀) = 0,5 P(♀) = 0,5
P(♂) = 0,5 P(♂) = 0,5
BIOESTATÍSTICA E
EPIDEMIOLOGIA 22
Vamos começar respondendo qual é a probabilidade de a gestante ter duas meninas. Para isso,
é necessário que a primeira gravidez gere uma menina E a segunda também. Assim, devemos
multiplicar as probabilidades individuais:
O mesmo pode ser feito para determinar a probabilidade de dois meninos:
Já para uma menina e um menino, devemos levar em consideração duas possibilidades: um

menino nascer na primeira e uma menina nascer na segunda gestação OU uma menina nascer na
primeira e um menino nascer na segunda gestação. Para esse cálculo:

Aprendizagem.
1.4.4 Modelos probabilísticos
Modelos probabilísticos são ferramentas utilizadas para simplificar a realidade dos dados, sem
que o pesquisador perca as principais características do conjunto das variáveis. Se soubermos a
distribuição de um conjunto de variáveis aleatórias, podemos obter suas medidas de localização
BIOESTATÍSTICA E
EPIDEMIOLOGIA 23
e variação (as quais discutiremos mais adiante).
1.4.4.1 Modelos para variáveis aleatórias discretas
Você lembra o que são variáveis quantitativas discretas (se tiver dúvida, revise o item 1.1)? Para
esse tipo de variável, dois modelos são muito utilizados. O primeiro é o modelo de distribuição
binomial, utilizado para descrever situações em que a variável aleatória pode ser agrupada em
apenas dois resultados possíveis (e.g. probabilidade de duas gestações gerar meninas ou não).
Nesse tipo de modelo, a probabilidade de sucesso ou fracasso não muda de ensaio para ensaio e
os eventos são idênticos e independentes. No exemplo da gestação, mesmo que uma mulher já
seja mãe de cinco meninas, a próxima gravidez terá a mesma probabilidade da primeira, ou seja,
aproximadamente 50% de nascer uma menina. Através do modelo binomial, podemos responder
questões do tipo: qual a probabilidade de, em duas gravidezes, nascer 2 meninas, 1 menina ou
nenhuma menina. Foi o que fizemos no exemplo do item 1.4.3, para exemplificar o cálculo de
multiplicações e adições de probabilidade; o resultado, colocado em forma de modelo binomial
foi:
0 menina 25%
1 menina 50% ou graficamente:

0♀ 1♀ 2♀
2 meninas 25%

Outro modelo para descrever variáveis discretas é a distribuição de Poisson, que é muito
útil quando se pretende descrever situações que ocorrem em um campo ou intervalo definido
(geralmente área ou tempo), como, por exemplo, o número de infectados por H1N1 nos últimos
dois meses ou o número de bactérias em uma placa de Petri.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 24
1.4.4.2 Modelo para variáveis aleatórias contínuas
A mais importante distribuição contínua de probabilidade é a Distribuição Normal ou

Gaussiana (também chamada Curva de Gauss). A maior parte dos dados biológicos tem essa
distribuição. Alguns exemplos são alturas, pesos e outras características físicas, erros de medida
em experimentos científicos, medidas de inteligência e aptidão, pontuações em testes variados
e numerosas medidas e indicadores de saúde. Todo gráfico da distribuição normal é simétrico
em torno da média da distribuição e tem forma de sino. Mais adiante veremos que diversas
propriedades úteis para a confirmação ou refutação de hipóteses científicas nas Ciências da Saúde
são derivadas da Curva de Gauss. Por enquanto, vamos nos concentrar nas suas características
básicas. Um exemplo simples pode ajudar muito na compreensão. Suponha que você pese todos
os alunos da faculdade e obtenha a média igual a 70 kg (esse será o centro da distribuição, ou seja,
a coluna mais alta na Figura 2). Muitos alunos estarão próximos desse peso, enquanto poucos
estarão muito abaixo ou muito acima desse peso (colunas à esquerda e à direita, que são mais
baixas, representando menor frequência).
Curva de Gauss
40 kg 50 kg 60 kg 70 kg 80 kg 90 kg 100 kg
Figura 2. Modelo de distribuição normal, com média igual a 70 kg e desvio-padrão igual a 10 kg.
Fonte: o autor.
Uma propriedade importante da curva normal é sua distribuição, que pode determinar a
proporção dos valores que se encontram em qualquer amplitude específica. Por exemplo: 68,3%
dos valores estarão a 1 desvio-padrão da média (estudaremos melhor essas medidas no capítulo
seguinte), enquanto 95,4% dos valores devem estar a 2 desvios-padrão da média.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 25
1.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO 1
Neste capítulo aprendemos que Bioestatística compreende a coleta ordenada, a análise e a

interpretação de variáveis biológicas. Através desses procedimentos, o pesquisador que utiliza
a Bioestatística pode apresentar e avaliar as conclusões baseadas nas variáveis coletadas.
Essas variáveis, ou dados, podem ser classificados em qualitativos (que, por sua vez podem ser
divididos em nominais e ordinais) e quantitativos (divididos em discretos e contínuos). Como
vimos, alguns dados quantitativos podem apresentar valores muito diferentes do conjunto de
variáveis (outliers); quando forem identificados devem ser conferidos, ajustados ou, até mesmo,
excluídos, desde que haja justificativa.
A partir do estudo do capítulo 1, você já é capaz de definir acurácia, que é representada pela
proximidade das medições em relação aos valores reais, e precisão, que é representada pela
proximidade das medições entre si (mesmo que não sejam próximas do valor real). Além disso,
podemos diferenciar populações (conjunto completo de variáveis de interesse) de amostras
(subconjuntos da população) e perceber a importância do tamanho amostral para a determinação
do erro (quanto maior a amostra, menor será o erro amostral). Outra consideração importante
sobre coleta de variáveis é a técnica de amostragem utilizada; neste capítulo, vimos 4 técnicas
de amostragem probabilística que podem ser usadas em estudos científicos: aleatória simples,
sistemática, estratificada e por conglomerado.
Neste primeiro capítulo você também trilhou os primeiros passos na probabilidade e já

consegue calcular as chances de um evento qualquer ocorrer simplesmente dividindo o número
de vezes que esse evento ocorre pelo número total de ocorrências possíveis, também chamado
de espaço amostral (ou P(a)=a/S). Mesmo quando não está claro o tamanho do espaço amostral,
como, por exemplo, quando um experimento é composto por mais de uma fase, você consegue
defini-lo através da multiplicação dos espaços amostrais individuais (ou, quando todos os espaços
amostrais forem iguais, através da fórmula S=kn). Também vimos como realizar operações,
adicionando (quando uma condição OU outra for exigida para o resultado final) e multiplicando
(quando uma condição E outra for exigida) probabilidades individuais em eventos mutuamente
exclusivos. Por fim, fomos apresentados aos modelos probabilísticos mais importantes para
variáveis discretas (binomial e Poisson) e para variáveis contínuas (Curva de Gauss ou normal).
No próximo capítulo aprenderemos as principais técnicas para apresentação de dados

biológicos: a Bioestatística descritiva.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 26
CAPÍTULO 2
2 BIOESTATÍSTICA DESCRITIVA
Agora que estamos mais familiarizados com alguns conceitos da Bioestatística, podemos
iniciar alguns cálculos. A partir de agora, um pouco de conhecimento de matemática básica será
bastante útil.
Se tiver dificuldade, experimente o nivelamento no Ambiente Virtual de

Aprendizagem.
Como já citamos, a Bioestatística descritiva é responsável por descrever nossas variáveis ou

dados de diversas formas, de acordo com o objetivo do trabalho científico ou das intenções do
pesquisador.
2.1 MEDIDAS DE TENDÊNCIA CENTRAL
Tanto em amostras como em populações de variáveis, podemos encontrar valores que são
próximos do centro das observações. A descrição desses parâmetros ou estatísticas (lembra-se da
diferença? Se não, revise o item 1.3) pode ser feita através de diversas medidas que são úteis para
descrever propriedades importantes das populações.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 27
2.1.1 Média aritmética simples
A medida de tendência central mais utilizada é a média aritmética simples, muitas vezes
referida apenas como média. Para facilitar a compreensão e adequarmos nossa linguagem às
expressões utilizadas em concursos, vestibulares, ENEM e ENADE, vamos indicar os símbolos
que representam os itens que compõem as fórmulas que usaremos (uma lista completa desses
símbolos pode ser encontrada no AVA). Cada medida ou variável será representada pela letra X;
portanto, se medirmos a glicemia de três pessoas para calcularmos a média do índice glicêmico
desses três indivíduos, as medições seriam X1, X2 e X3. De forma geral, Xi indica que o número de
variáveis é indeterminado, podendo assumir qualquer valor integral, que será igual ao tamanho
do conjunto de dados (no nosso exemplo, nossas medições vão até X3). Falando em tamanho do
conjunto de dados, a letra “N” (maiúscula) representa o número de variáveis de uma população,
enquanto a letra “n” (minúscula) representa o número de variáveis de uma amostra. Outro
símbolo utilizado na fórmula da média é o “∑” (letra grega sigma maiúscula). Por fim, a letra grega
“µ” (letra grega mu minúscula) representa a média populacional, enquanto o símbolo (leia “x
barra”) representa a média amostral.
Ou seja, para obtermos a média, basta somar os valores de todas as variáveis e dividir o
resultado pelo número de variáveis. Por exemplo, suponha que alguém pretenda descrever a
média de comprimidos que seus 3 pacientes ingerem por semana, sabendo que o paciente A
ingere 4 comprimidos, o paciente B ingere 5 comprimidos e o paciente C ingere 6 comprimidos.
Como já descrito, basta somar os três valores (4 + 5 + 6 = 15) e dividir o resultado pelo número de
variáveis (N = 3 pacientes); a média aritmética simples para esse conjunto de dados é:
Note que foi utilizado ”, pois estamos considerando que o pesquisador possui apenas 3
pacientes (portanto, não é uma amostra, mas sim a população). Caso as variáveis fossem obtidas
de uma amostra (e.g. número de comprimidos dos 3 pacientes mais idosos), apenas deveríamos
BIOESTATÍSTICA E
EPIDEMIOLOGIA 28
trocar por “ , mas o cálculo e o resultado não mudariam.

Aprendizagem.
2.1.2 Mediana
A mediana é definida com a variável que se encontra no centro de um conjunto ordenado de

dados. Sendo assim, há exatamente o mesmo número de variáveis que se encontram acima e que
se encontram abaixo da mediana. Considere as seguintes medições da pressão arterial sistólica,
em mmHg, de 5 indivíduos que serão submetidos a cirurgias simples no seu consultório: (123,
144, 112, 156 e 109). Para o cálculo da mediana, primeiramente devemos ordenar (do menor
para o maior valor) esse conjunto de dados; sendo assim: (109, 112, 123, 144 e 156). Agora é só
identificar o valor central, ou seja, a mediana desse conjunto de variáveis é igual 123 mmHg.
Fácil? Infelizmente, não é tudo. Quando o valor de “N” ou “n” (lembra o que significa?) for ímpar,
como no nosso exemplo (n = 5), sempre existirá UM valor central.
Contudo, quando “N” for par, não teremos exatamente um valor central. Veja o exemplo
a seguir: um dentista pretende descrever a mediana do número de cáries de 4 pacientes, que
possuem respectivamente 2, 5, 3 e 9 cáries. Para isso, ele coloca as medições em ordem (2, 3, 5 e
9) e verifica que não há somente um valor central, mas sim 2 (3 e 5). Sempre que o valor de “n”
for um número par, deve-se calcular a média aritmética simples dos dois valores centrais. Nesse
caso, a mediana é igual a 4 (pois a média entre 3 e 5 é = (3+5) / 2 = 4). A fórmula geral da mediana é:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 29
Note que o resultado da expressão subscrita “(n+1)/2” representa a posição da variável “X”,
em um conjunto de dados ordenados, que indica o valor da mediana. Retomando o primeiro
exemplo, temos:
(109, 112, 123, 144 e 156)

X1 X2 X3 X4 X5
Já para o segundo exemplo:
(2, 3, média X2 e X3 5, 9)
X1 X2 X2,5 X3 X4
temos que calcular o valor médio entre X2 e X3 (X2,5), ou seja, 4.
A mediana é uma medida de tendência central muito útil em casos específicos. Por exemplo,
quando algumas medições não podem ser realizadas por impossibilidade instrumental (e.g. um
aparelho que não consegue medir valores muito baixos ou muito altos). Observe:
Suponha que um pesquisador mediu o nível de serotonina no lobo frontal de 3 presidiários

com um instrumento que possibilita o registro de valores a partir de 9 µg (microgramas). No
primeiro indivíduo, o valor foi de 17 µg, no segundo 11 µg e no terceiro o valor não foi visualizado
no instrumento, pois ficou abaixo de 9 µg. Sendo assim, os dados foram ordenados (<9, 11 e 17).
Com esse conjunto de dados, não é possível calcular a média aritmética simples, pois é necessário
somar todos os valores (no caso do último presidiário, não sabemos se esse valor foi 8, 1, zero ou
qualquer valor abaixo de 9). Sendo assim, a única alternativa é utilizar a mediana, que é a 11 µg de
serotonina, para descrever esse conjunto de dados.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 30
Aprendizagem.
2.1.3 Moda
A moda representa o valor mais frequente observado nas medições de um conjunto de dados.
Até agora, nossos exemplos apresentaram valores com a mesma frequência nos conjuntos de
dados (cada valor apareceu apenas uma vez). Nesses casos, chamamos o conjunto de amodal,
pois não há moda (do grego a = negação). Agora, analise os exemplos de conjuntos de dados a
seguir:
Exemplo 1 – idades, em anos, de 11 alunos (1, 3, 4, 4, 4, 4, 6, 8, 9, 11, 11). O valor que mais se
repete e, portanto, tem a maior frequência, é o 4; portanto, a moda é igual a 4 (simples, não é
mesmo?)
Exemplo 2 – mortes devidas a acidentes em 9 cidades (1, 3, 3, 4, 1, 1, 3, 8, 9, 17, 11). Nesse

conjunto, há dois valores que se repetem com a mesma frequência: 1 e 3 (cada um se repete 3
vezes); portanto, esse conjunto de dados é bimodal (do grego bi = dois).
Também podemos ter conjuntos com mais que duas modas, que podem ser chamados de
multimodais. Além disso, diferentemente da média e da mediana, a moda pode ser utilizada para
descrever conjuntos de dados qualitativos, como por exemplo, o tipo sanguíneo mais frequente
na população brasileira.
2.1.4 Ponto médio
O ponto médio é simplesmente a média aritmética simples entre o maior e o menor número
em um conjunto de dados quantitativos. Essa medida de tendência central tem um poder de
descrição dos dados menor que a média, pois utiliza apenas os valores extremos. Contudo,
assim como a mediana (que só utiliza valores centrais), o ponto médio pode ser útil quando um
BIOESTATÍSTICA E
EPIDEMIOLOGIA 31
pesquisador tiver problemas com medições que se encontrem no centro do conjunto. A fórmula
do ponto médio é:
Xmáximo é o maior valor do conjunto de dados e
Xmínimo é o menor valor do conjunto de dados.
Imagine que você deseja descrever um conjunto de dados composto pelo tempo de internação,
em dias, de 3 pacientes submetidos a cirurgias estéticas no último mês. Você analisou as fichas
e descobriu que o paciente A ficou 3 dias internado, o paciente B ficou 7 dias e o paciente C ficou
13 dias internado. Suponha ainda que o paciente B não autorizou a divulgação da informação
relacionada à sua internação. Seu conjunto de dados seria: 3, 7 (que não poderia ser divulgado)
e 13. Sua única opção seria divulgar o ponto médio do número de dias de internação devido a
cirurgias estéticas no último mês, que seria:

Aprendizagem.
2.2 MEDIDAS DE VARIAÇÃO E DISPERSÃO
Agora que você já sabe como descrever como seus dados se encontram ao redor do centro,
é desejável descrever sua dispersão ou variação. Quando temos muitos valores próximos das
medidas de tendência central, como a média, temos também baixa variação ou dispersão. Ao
BIOESTATÍSTICA E
EPIDEMIOLOGIA 32
contrário, quando os valores se dispersam ao longo da escala de medição, nosso conjunto de
dados apresenta muita variação.
2.2.1 Amplitude
A mais simples medida de dispersão é a amplitude. Ela é, nada mais, que a diferença entre
o maior e o menor valor de um conjunto de dados quantitativos. Vamos direto a um exemplo:
suponha que você queira descrever a amplitude de um conjunto de variáveis formado pela
frequência cardíaca de 3 bebês, cujas medições foram 122, 154 e 133 batimentos por minuto. A
fórmula geral e o cálculo para esse exemplo são apresentados a seguir:
Assim como a mediana e o ponto médio (tendência central), a amplitude também pode deixar
de lado uma parte da informação sobre os dados, pois é calculada a partir de valores extremos
somente.
2.2.2 Variância
Uma maneira de calcular a dispersão utilizando todas as observações é através da medição

da distância entre cada variável em relação à média do conjunto de variáveis. É exatamente isso
que o cálculo da variância faz. Contudo, se a média é a medida de tendência central que leva em
consideração todos os dados e estes se afastam da média tanto para mais como para menos, o
resultado de qualquer cálculo que leve em consideração a diferença das variáveis em relação à
média, não seria sempre igual a zero? Vejamos um exemplo. Suponha que você trabalhe em um
hemocentro e está responsável por verificar a quantidade média de sangue em um conjunto de
três bolsas. Após medi-las, você constatou que elas possuem respectivamente 110 ml, 120 ml e
160 ml. Você inicialmente calcula a média, conforme já estudamos:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 33
Em seguida, calcula a diferença entre cada variável e a média do conjunto:
110 – 130 = – 20
120 – 130 = – 10 após, calcule a soma das diferenças
160 – 130 = + 30
A diferença sempre será igual a zero. Para resolver esse problema, no cálculo da variância,
cada valor que representa a diferença entre as variáveis e a média do conjunto (no nosso exemplo
) é elevado ao quadrado. Lembre-se que qualquer número elevado a expoente par,
torna-se positivo. Antes de partirmos para a fórmula, precisamos compreender mais um conceito.
A variância populacional é representada pela letra grega “σ2”, enquanto a variância amostral é
representada pela letra “s2”, assim como acontece no cálculo da média (onde uma letra grega
representa a média populacional e uma letra latina representa a média amostral). Contudo, no
caso da variância, o cálculo é ligeiramente diferente, como se observa nas fórmulas:
Retomando nosso exemplo, e considerando que as três bolsas de sangue representam uma
amostra, acompanhe o cálculo da variância amostral:
Se as três bolsas de sangue medidas fossem as únicas bolsas existentes, teríamos toda a
população. Nesse caso, perceba a diferença no cálculo da variância populacional:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 34
Note que, por mais estranho que pareça, a unidade da variância ( ) está ao quadrado em
relação à unidade original (ml). Isso acontece porque elevamos todas as variáveis ao quadrado.

Aprendizagem.
2.2.3 Desvio-padrão
Ufa! A explicação sobre o cálculo da variância foi extensa. Isso se deve porque essa medida
de dispersão não é tão comum no nosso dia a dia (como a média), nem tão simples (quanto a
moda ou a amplitude). Porém, se você conseguiu compreender, já estará apto a calcular o
desvio-padrão, que é a medida de dispersão mais utilizada. O desvio-padrão é simplesmente a
raiz quadrada da variância. Lembra que no cálculo da variância colocamos todos os dados ao
quadrado? Então, agora vamos fazer a operação inversa (o inverso da potência é a raiz). Com isso,
teremos novamente a unidade da medida de dispersão igual à unidade das variáveis. Analise a
fórmula do desvio-padrão populacional e do desvio-padrão amostral:
ou somente
Como você já deve ter percebido, o desvio-padrão populacional é representado pela letra grega
“σ”, enquanto o desvio-padrão amostral é representado pela letra latina “s”.
Vamos continuar no cálculo de medidas de dispersão para as bolsas de sangue. Se você quiser
BIOESTATÍSTICA E
EPIDEMIOLOGIA 35
descrever a variação dos dados através do desvio-padrão, basta calcular a raiz quadrada da
variância (aproveitamos os cálculos acima), como segue:

Aprendizagem.
Agora que você sabe melhor o que essa medida de dispersão significa, que tal retornar ao item
1.4.4.2? Lá você encontrará os parâmetros de dispersão da Curva de Gauss (ou normal) baseados
no desvio-padrão a partir da média.
2.2.4 Coeficiente de variação
As medidas de variação que estudadas até agora têm magnitudes que são dependentes das
magnitudes dos dados. A amplitude e o desvio-padrão têm a mesma unidade das variáveis,
enquanto a variância tem o quadrado da unidade das variáveis. Contudo, algumas vezes nos
deparamos com conjuntos de variáveis que possuem unidades com escalas diferentes, como por
exemplo o número de dentes de um adulto e o número de dentes de uma criança.
Suponha que você queira comparar a variação no número de dentes cariados de um grupo de
3 adultos com o número de dentes cariados de um grupo de 3 crianças. Para isso, você coletou os
seguintes dados: adultos (8, 10 e 12 dentes cariados) e crianças (3, 5 e 7 dentes cariados). Como
você já deve saber, as médias desses dois conjuntos de dados são: e . Calculando o
desvio-padrão dessas duas amostras, temos:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 36
Em ambos os casos, o valor do desvio-padrão foi igual a dois, o que pode levar um pesquisador
a acreditar que a dispersão ou variabilidade dos dois grupos foi igual. Contudo, temos que
lembrar que os grupos têm escalas diferentes, já que o número de dentes na arcada de uma
criança é menor que o número de dentes na arcada de um adulto (e, principalmente, suas médias
são diferentes). Quando isso acontece, só poderemos comparar as dispersões ou variabilidades
utilizando o coeficiente de variação, muitas vezes representado pelas letras CV. Essa medida de
dispersão é simplesmente a divisão do desvio-padrão do grupo, pela média do mesmo grupo;
matematicamente:
Outro detalhe importante refere-se à unidade do coeficiente de variação. Como o desvio-

padrão e a média têm a mesma unidade, a divisão entre eles a anula e, portanto, o CV não tem
unidade. Porém, se quisermos multiplicar seu resultado por 100, teremos uma porcentagem, o
que pode ser bastante útil para apresentar a variação. Vejamos então, qual dos dois grupos do
nosso exemplo realmente variou mais.
VAMOS REFLETIR:
Se esses dados fossem verdadeiros, como você explicaria a maior variabilidade
identificada no grupo das crianças?
BIOESTATÍSTICA E
EPIDEMIOLOGIA 37
2.3 DISTRIBUIÇÃO DE FREQUÊNCIAS
A distribuição de frequências é uma forma bastante prática e útil de descrever os dados,

principalmente quando o “n” é muito grande. Essa forma de descrever os dados pode ser
utilizada para variáveis qualitativas, como podemos observar na seguinte tabela de distribuição
de frequências:
Tabela 1. Frequências observada e relativa supostas de 200 indivíduos em função do tipo

sanguíneo.
Tipo sanguíneo Frequência observada Frequência relativa

(classes) (nº de dados por classe) (total / nº cada classe)
A 10 0,05 ou 5%
B 20 0,1 ou 10%
AB 40 0,2 ou 20%
O 130 0,65 ou 65%
Total 200 1 ou 100%
Fonte: o autor.
Contudo, nesse nosso curso de Bioestatística, estamos mais interessados nas distribuições
de frequências de dados quantitativos. Porém, dividir as classes em conjuntos com variáveis
quantitativas exige alguns passos adicionais. Primeiramente, devemos definir o número de classes.
Há várias sugestões e você, quando for construir uma tabela de distribuição de frequências para
descrever seus dados em uma pesquisa real, pode escolher a que melhor lhe convier, desde seja
justificada a escolha. O cálculo mais difundido para determinar o número de classes é a Fórmula
de Sturges: , onde “k” é o número de classes e “n” o tamanho da amostra.
Já a sugestão mais simples (e utilizada por autores da nossa bibliografia) é simplesmente .
Em nossos exemplos e avaliações, utilizaremos esta última fórmula, que apresenta uma ótima
aproximação da fórmula de Sturges, exceto quando as amostras forem muito grandes ou muito
pequenas.
Agora que definimos o cálculo do número de classes ( ), precisamos determinar o intervalo

de cada classe (muitas vezes indicado pela letra “h”). Para isso, não há dúvidas; apenas divida
a amplitude do conjunto de dados pelo número de classes previamente calculado, ou seja,
. Realizados esses passos, basta montarmos nossa tabela de distribuição de
BIOESTATÍSTICA E
EPIDEMIOLOGIA 38
frequência para variáveis quantitativas.
Vamos a um exemplo. Suponha que um fisioterapeuta tenha coletado dados sobre o número
de pacientes com escaras em determinado hospital, nos últimos 9 anos e obtido os seguintes
resultados: (3, 5, 8, 8, 9, 10, 10, 14 e 15). Como já vimos, o número de classes será igual a 3 (
, sendo n = 9); o intervalo de cada classe será igual 4 ( ). A
primeira classe se inicia pelo menor número do conjunto de dados (3, nesse caso), e tem uma
amplitude de classe igual a 4, conforme h calculado. Portanto, a primeira classe vai de 3 (limite
inferior) até 7 (que é o resultado de 3 + 4, e que é seu limite superior). A segunda classe se inicia
com o limite superior da primeira classe (7) e termina em 11 (7 + 4). Por fim, a última classe se
inicia com o limite superior da segunda classe (11), indo até 15 (11 + 4). Relembrando, o conjunto
das variáveis é (3, 5, 8, 8, 9, 10, 10, 14 e 15). O profissional já tem os parâmetros necessários para
preencher a tabela de distribuição de frequências, que ficaria assim:
Tabela 2. Tabela de distribuição de frequências do número de pacientes com escaras em um

hospital nos últimos 9 anos (dados fictícios).
Classes Limite inf. ; Limite sup. (intervalo de Frequência observada

(k) classe: h) (Fi)
C1 2
C2 5
C3 2
Fonte: o autor.
Vamos relembrar as notações do intervalo de classe que aprendemos no

ensino médio. Os colchetes fechados indicam que o intervalo começa ou termina
no número grafado dentro dele, enquanto o colchete aberto indica o limite,
excluindo o próprio número grafado. Sendo assim, no exemplo acima, o intervalo
indica que, se houver um número 3 no conjunto de dados, ele deve ser computado nesta
classe (colchete fechado), mas se houver um número 7, não (colchete aberto).
Outra consideração importante, refere-se às informações adicionais em uma tabela de

distribuição de frequência. Muitas vezes, você irá se deparar com a frequência relativa (assim
como no exemplo das variáveis qualitativas acima), que nada mais é do que a porcentagem das
observações em cada classe, e a frequência acumulada, que, como o próprio nome diz, é a soma
das observações da classe com as observações das classes anteriores.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 39
2.3.1 Representações gráficas da distribuição de frequência
Lembre-se que as distribuições de frequência são úteis principalmente

Lembre-sequando
que ascoletamos
distribuições de frequência
e descrevemos grandessão úteis principalmente
quantidades quando
de dados (apesar de coletamos
e descrevemos grandes
que, para finsquantidades de dados
didáticos, utilizamos (apesar
conjuntos de que,
pequenos para fins
em nossos didáticos,
exemplos). A utilizamos
partir das
conjuntos pequenos emtabelas
nossosdeexemplos).
distribuição A
departir
frequência que acabamos
das tabelas de aprender
de distribuição a
de frequência que
montar, podemos apresentar os dados através de gráficos adequados a esse
acabamos de aprender a montar, podemos apresentar os dados através de gráficos adequados a
tipo de informação. O principal tipo de gráfico de distribuição de frequência é o
esse tipo de informação. O principal tipo de gráfico de distribuição de frequência é o histograma,
histograma, que nada mais é do que um gráfico de colunas, onde no eixo x
que nada mais é do queestão
(horizontal) um gráfico
indicadasde
ascolunas,
classes eonde noy eixo
no eixo x (horizontal)
(vertical) estão
estão indicadas as indicadas as
classes e no eixo y (vertical)
frequências estão indicadas
observadas. O outro tipoasdefrequências observadas.
gráfico é o polígono O outro que
de frequências, tipo de gráfico é
o polígono deéfrequências,
um gráfico deque
linhas de uma
é um tabela
gráfico dede frequências,
linhas de umaque se inicia
tabela e termina no que se inicia
de frequências,
zero, passando necessariamente pelos pontos representados pelas frequências
e termina no zero, passando necessariamente pelos pontos representados pelas frequências
observadas. Tendo como base o exemplo anterior, um histograma e um polígono
observadas. Tendo como base o exemplo anterior, um histograma e um polígono de frequências
de frequências seriam plotados assim:
seriam plotados assim:
Histograma do número de Polígono de frequência

escaras nos últimos 9 do número de escaras
anos nos últimos 9 anos
5 5
Número de observações
Número de observações
4 4
3 3
2 2
1 1
0 0
C1 C2 C3 C1 C2 C3
Classes Classes
Figura 3. Histograma e polígono

Figura de frequências
3. Histograma referentes
e polígono de ao número
frequências deaopacientes
referentes número decom escarascom
pacientes emescaras
um hospital nos
últimos 9 anos (dados
em um fictícios).
hospital
Fonte: o autor.
nos últimos 9 anos (dados fictícios).
Fonte: o autor.
2.4 RELAÇÕES ENTRE DUAS VARIÁVEIS
A descrição das relações entre variáveis pode fornecer informações importantes sobre as
características dos dados. Em nosso curso, estudaremos apenas as técnicas que consideram
relações entre duas variáveis. Contudo, ressaltamos que há outros procedimentos que consideram
BIOESTATÍSTICA E
EPIDEMIOLOGIA 40
a relação entre mais de duas variáveis, como a correlação e a regressão múltiplas.
Você já deve ter ouvido falar em características que variam de acordo com a variação de outras
características como, por exemplo, que o peso de uma pessoa está relacionado à sua altura ou que
a quantidade de cigarros que uma pessoa fuma por dia está relacionada com a probabilidade que
essa pessoa tem de desenvolver câncer de pulmão, entre muitas outros.
Essa relação entre as variáveis pode ser de dependência de uma sobre a outra. Nesse caso,
utilizaremos as técnicas de regressão linear simples para descrever o grau e a direção das variações
dos dados. Contudo, há casos em que a relação entre as variáveis não é estabelecida por uma
dependência. Quando isso ocorre, devemos utilizar as técnicas de correlação linear simples para
descrever o grau e a porcentagem de variação em comum dos dois conjuntos de variáveis. Ainda
que as duas técnicas procurem descrever a relação linear entre duas variáveis, você já começa a
perceber a diferença entre regressão e correlação. Então vamos nos aprofundar mais um pouco.
2.4.1 Regressão linear simples
Quando a relação entre duas variáveis apresenta uma dependência funcional de uma sobre
a outra, podemos usar a regressão simples para descrever essa relação ou mesmo estimar ou
interpolar medições. Nesses casos, a magnitude de uma das variáveis (chamada de variável
dependente) é determinada pela magnitude de outra variável (que chamamos de independente),
enquanto o contrário não é verdadeiro. Por isso, na regressão é essencial sabermos determinar
qual é a variável dependente e qual é a variável independente. Por exemplo, considerando que
haja uma relação entre a pressão arterial e a idade em humanos, qual das variáveis você acha que
é a independente, ou seja, a que determina a variação da outra? É claro que a idade é a variável
independente, pois sua magnitude impõe uma variação na magnitude da pressão arterial,
enquanto o contrário não é verdadeiro. Não seria lógico supormos que uma pressão arterial
alta ou baixa determine a idade de uma pessoa, certo? Também é claro que, apesar de não ser
o único fator, podemos facilmente considerar a idade um dos fatores determinantes da pressão
arterial. Uma maneira simples e conveniente de descrever as relações entre variáveis é através de
um gráfico de dispersão (também conhecido como scatter plot). Vejamos um exemplo: imagine
que a Tabela 3 contém informação sobre a medição da pressão arterial sistólica de 4 pessoas,
juntamente com suas idades.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 41
Tabela 3. Pressão arterial sistólica e idades supostas de 4 pessoas.
Pressão arterial sistólica (em mmHg) Idade (em anos)

120 28
145 45
140 40
170 65
Fonte: o autor.
Uma forma bastante informativa é plotar os dados da variável dependente

no eixo Y do gráfico (vertical) e os dados da variável independente no eixo X
Uma forma bastante informativa é plotar os dados da variável dependente no eixo Y do gráfico
(horizontal). Sendo assim,
(vertical) e os dados da variável independente no eixo X (horizontal). Sendo assim,
Pressão arterial
170
Pressão arterial sistólica (em mmHg)
160
150
140
130
120
110
18 23 28 33 38 43 48 53 58 63 68
Idade (em anos)

Figura 4. Gráfico de dispersão de valores de pressão arterial sistólica em função da idade de
Figura
quatro4. Gráfico
pessoas de (valores
dispersão supostos).
de valores de pressão arterial sistólica em função da idade de quatro pessoas (valores
supostos).
Fonte: o autor.
Fonte: o autor.
Apresentado dessa forma, podemos ver claramente que a pressão arterial sistólica aumenta
com o aumento da idade. Contudo, precisamos quantificar essa relação (afinal, estamos estudando
Bioestatística). Sendo assim, vamos à equação da reta da regressão linear simples:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 42
Relembrando, “y” é a variável dependente e “x” é a variável independente. Já “a” e “b”, são
calculados através das seguintes fórmulas:
Concordo que o cálculo parece ser muito trabalhoso, mas vamos direto a um exemplo, que
será muito esclarecedor. Vamos supor que uma fisioterapeuta acredite que haja uma relação de
dependência entre as variáveis a seguir e pretenda relacionar a angulação da escoliose de três
adolescentes com as horas que eles permanecem sentados por dia em frente ao computador.
As medições revelaram que o adolescente Paulo fica 2 horas por dia em frente ao computador e
apresentou 4º de angulação; o adolescente José fica 4 horas e apresentou 5º; por fim, o adolescente
João fica 6 horas e apresentou angulação de 6º. Para começar, é ideal calcular os somatórios
(lembra do símbolo ∑, não é mesmo?) antes de colocar na fórmula. A forma mais fácil de fazer
isso, é preenchendo uma tabela com os dados e realizar os cálculos simples:
Tabela 4. Valores supostos de horas em frente ao computador e angulação de escoliose de 3

adolescentes.
x y
Adolescentes x.y x2
(horas por dia) (angulação)
Paulo 2 4 8 4
José 4 5 20 16
João 6 6 36 36
∑ (soma) 12 15 64 56
Fonte: o autor.
Sendo assim, já sabemos que o tamanho da amostra (n) é igual a 3 e temos os somatórios de
“x” (12), “y” (15), “x.y” (64) e “x2” (56). Agora é só substituir na fórmula para calcular o “b”:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 43
Para calcularmos o “a”, precisamos, além do valor de “b”, calculado acima, os valores das
médias de “y” e “x”, representados por . Para isso, vamos incluir mais uma linha na nossa
tabela:
Tabela 5. Valores supostos de horas em frente ao computador, angulação de escoliose e médias

de 3 adolescentes.
x y
Adolescentes x.y x2
Paulo 2 4 8 4
José 4 5 20 16
João 6 6 36 36
∑ (soma) 12 15 64 56
Média 4 (12/3) 5 (15/3) - -
Fonte: o autor.
E substituir os termos para calcular o valor de “a”:
Por fim, vamos substituir os valores de “b” e “a” na equação da reta:
Essa equação descreve a relação entre as variáveis independentes (horas em frente ao computador
por dia) e as variáveis dependentes (angulações de escoliose em adolescentes). Além disso, é
possível fazer estimações e interpolações de dados que não foram coletados. Por exemplo, quanto
você esperaria que fosse a angulação da escoliose de um paciente adolescente que permanece 5
horas por dia em frente ao computador (perceba que não há esse dado na tabela)? Sabendo que essa
variável é representada por “x” (pois é a variável independente), é só substituirmos na equação da
reta, para encontrarmos a variável “y” (grau de angulação da escoliose):
BIOESTATÍSTICA E
EPIDEMIOLOGIA 44
2.4.2 Correlação linear simples
Na correlação linear simples também consideramos a relação entre duas variáveis, mas
nenhuma dessas variáveis apresenta dependência funcional sobre a outra. Se a relação entre
variáveis não é considerada de dependência, não há variável independente ou variável dependente
e devemos utilizar técnicas de correlação. O coeficiente de correlação (r) descreve a relação entre
duas variáveis que estão sendo examinadas e sua fórmula é:
Diferentemente da regressão, na correlação não há a necessidade de se determinar qual

variável é representada por “x” ou por “y”. Da mesma forma da regressão, é bastante útil preencher
a tabela, que agora deve ter uma coluna a mais em relação à tabela anterior (y2). Vamos utilizar o
mesmo conjunto de dados sobre a escoliose, aplicado à regressão (dessa vez, a fisioterapeuta não
considera que o tempo que os adolescentes ficam em frente ao computador influencie o grau de
escoliose):
Tabela 6. Valores supostos de horas em frente ao computador e angulação de escoliose de 3

adolescentes.
x y
Adolescentes x.y x2 y2
Paulo 2 4 8 4 16
José 4 5 20 16 25
João 6 6 36 36 36
∑ (soma) 12 15 64 56 77
Fonte: o autor.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 45
Substituindo os termos na fórmula, temos:
O coeficiente de correlação pode assumir qualquer valor entre 1 e – 1, sendo que os valores
positivos indicam relação diretamente proporcional entre as variáveis, ou seja, quando o valor de
uma variável aumenta, a outra também aumenta ou quando o valor de uma diminui, o valor da
outra também diminui. Já os valores negativos indicam que a relação é inversamente proporcional,
ou seja, quando o valor de uma variável aumenta, a outra diminui e vice-versa. Além disso, a
magnitude do coeficiente reflete o grau de correlação entre duas variáveis. Podemos aplicar uma
regra prática para estabelecer que:
“r” entre 0 e 0,25 ou entre – 0,25 e 0, temos uma correlação pequena;
“r” entre 0,25 e 0,50 ou entre – 0,50 e – 0,25, temos uma correlação fraca;
“r” entre 0,50 e 0,75 ou entre – 0,75 e – 0,50, temos uma correlação moderada;
“r” entre 0,75 e 0,99 ou entre – 0,99 e – 0,75, temos uma correlação forte;
“r” igual a 1, temos uma correlação positiva perfeita e
“r” igual a – 1, temos uma correlação negativa perfeita.
Outra medida que pode descrever a relação entre duas variáveis é o coeficiente de
determinação, simplesmente representado pelo quadrado do coeficiente de correlação, ou r2.
Essa medida descreve quanto do total da variabilidade encontrada em uma das variáveis (“x” ou
“y”) pode ser atribuída à outra variável.

Aprendizagem.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 46
A descrição, o resumo e a apresentação dos dados são os objetos da Bioestatística descritiva.

Neste capítulo, aprendemos a calcular diversas medidas de tendência central (MTC), que indicam
como nossas variáveis se distribuem ao redor do centro. A medida mais utilizada, como vimos,
é a média aritmética simples. Contudo, em determinadas situações, outras MTC podem ser
mais adequadas, como, por exemplo, quando não conseguimos registrar uma variável porque o
instrumento de medição não possui escala suficiente; nesse caso, a mediana é a única maneira
de descrevermos um conjunto de dados. Também há a possibilidade de nos depararmos com
uma dificuldade para utilizar algum valor intermediário do nosso conjunto de dados; quando
isso ocorrer, devemos utilizar o ponto médio, que é a média aritmética simples entre o maior e o
menor valor do conjunto. Em outras situações mais restritas, a moda, que representa o valor mais
frequente obtido, pode ser útil.
Além de descrever a centralidade dos dados, é recomendável informar o quanto esses dados
variam. Por isso, calculamos outras medidas que representam essa informação, tais como
a amplitude (diferença entre o maior e o menor valor das variáveis), a variância (soma dos
desvios em relação à média ao quadrado, dividido por “n” ou “n-1”; populacional e amostral,
respectivamente) e o desvio-padrão (raiz quadrada da variância). Essas três medidas de dispersão
(MD) são dependentes da escala dos dados que serão descritos; por isso, quando houver
necessidade de comparar dispersões entre grupos de variáveis que têm escalas diferentes,
devemos utilizar uma MD que seja relativa. Nesse caso, dispomos do coeficiente de variação, que
representa a porcentagem de dispersão e é calculado simplesmente dividindo-se o desvio-padrão
pela média do conjunto de dados.
Ainda estudamos uma forma bastante prática de descrever ou apresentar grandes conjuntos
de dados: a distribuição de frequências, que é corresponde à divisão do conjunto em classes (cujo
número é calculado através do arredondamento para cima da raiz de “n”), a determinação do
intervalo de cada classe (calculado através da divisão da amplitude do conjunto de dados pelo
número de classes) e a contagem de observações em cada classe. A apresentação gráfica de uma
distribuição de frequências é feita através de histograma (gráfico de coluna) ou polígono de
frequências (gráfico de linha).
Além da apresentação de grandes conjuntos de dados e das medidas de tendência central

e dispersão, também estudamos formas de descrever e quantificar a relação entre grupos
de variáveis, como a regressão e a correlação linear simples. Se for possível identificar uma
relação funcional entre esses grupos de dados (e.g. ingestão calórica e IMC), podemos estimar
BIOESTATÍSTICA E
EPIDEMIOLOGIA 47
ou interpolar uma variável dependente (que sofre influência) em função da magnitude de uma
variável independente (que causa influência) através da regressão. Já quando não houver essa
relação e a variação dos grupos for causada por um terceiro fator (e.g. número de homicídios
e quantidade de café ingerido; ambos devem aumentar devido a um terceiro fator, que é o
crescimento populacional), podemos utilizar o coeficiente de correlação para determinar o
grau de relação entre dois grupos de variáveis. Importante ressaltar que, tanto a distribuição
de frequências, quanto a regressão e correlação, além de permitirem a descrição dos dados
(motivo pelo qual se encontram no capítulo intitulado Bioestatística descritiva), também podem
ser ferramentas para inferência dos dados, que será objeto do próximo capítulo. Contudo, não
utilizaremos esses recursos, pois extrapolam os objetivos do nosso curso.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 48
CAPÍTULO 3
3 BIOESTATÍSTICA INFERENCIAL
A Bioestatística inferencial representa a parte da disciplina que estuda os testes estatísticos.

Esses testes possibilitam que os pesquisadores calculem estatísticas adequadas para suas amostras
e façam inferências ou generalizem conclusões para a população à qual as amostras pertencem.
Neste capítulo, estudaremos os principais testes estatísticos e algumas de suas aplicações. Mas
antes, precisamos trabalhar alguns conceitos.
3.1 NOÇÕES DE TESTES DE HIPÓTESE
O principal objetivo da análise estatística é inferir, ou tirar conclusões, sobre uma população,
através do exame de uma amostra, uma vez que é quase sempre impossível medir toda a população.
Para isso, convencionou-se estabelecer hipóteses estatísticas (de preferência antes da coleta dos
dados, para evitar influência dos pesquisadores) e testá-las. De forma geral, temos duas hipóteses
antagônicas: a hipótese nula, representada por H0, e a hipótese alternativa, representada por
H1 (você poderá encontrar também as notações Hnull e Ha para descrever as hipóteses nula e
alternativa, respectivamente).
A hipótese nula contém a afirmação de que não há diferença estatisticamente significante

entre um valor alegado para a média populacional. Por exemplo, retomando o exemplo do peso
dos alunos da Faculdade, podemos estabelecer a hipótese nula de que a média é igual a 70 kg. Já a
hipótese alternativa, contém a afirmação de que há diferença estatisticamente significante entre
o valor a ser testado através de uma amostra e a média real da população. Nesse caso, a hipótese
alternativa para o exemplo seria de que a população possui um média de peso maior, menor ou
simplesmente diferente de 70 kg, o que seria testado a partir de uma ou mais amostras.
Os testes estatísticos nos fornecem um valor de probabilidade, chamado “valor p” (ou, mais
BIOESTATÍSTICA E
EPIDEMIOLOGIA 49
comumente, p-value), que proporciona ao pesquisador o poder de decidir se há ou não evidência
para rejeitar a hipótese nula. Se a hipótese nula for rejeitada, assume-se de a hipótese alternativa
é verdadeira. Nos exemplos que seguirão às explicações sobre os testes estatísticos serão incluídas
hipóteses nulas e alternativa, o que facilitará a compreensão.
A regra geral é: sempre que o valor calculado da estatística ultrapassar o valor crítico tabelado,
a hipótese nula será rejeitada. Consequentemente, se o valor crítico for maior que o valor
calculado, a hipótese nula será aceita. O AVA contém os valores críticos tabelados para todas as
estatísticas utilizadas em nosso curso. Essas tabelas são dependentes do nível de confiança, que
sempre será de 95% nas avaliações, exemplos e exercícios. Esse nível significa que em 95% das
vezes, o pesquisador concluirá corretamente sobre a escolha da hipótese; significa também que
em 5% das vezes, cometerá erro. A propósito, nas avaliações, esse valor será necessariamente
informado no enunciado da questão. Importante ressaltar que, apesar de 95% ser o nível de
confiança mais utilizado em estudos científicos, você pode decidir realizar na vida acadêmica ou
profissional estudos mais restritivos (como, por exemplo, quando houver risco para a saúde dos
envolvidos, pois não é admissível que 5% dos usuários do produto da pesquisa tenham prejuízos
à saúde) ou menos restritivos. Se for o caso, não se preocupe, pois é muito fácil encontrar tabelas
com outros níveis de significância em livros de estatística ou na internet.
3.2 O ESCORE PADRÃO E A ESTATÍSTICA “Z”
No item 1.4.4.2, iniciamos a explicação sobre curva normal com o auxílio de um exemplo sobre
o peso dos alunos desta Faculdade; vamos ser mais específicos agora. Suponha que você tenha
pesado todos os alunos (vamos imaginar n = 4000), calculado a média (µ = 70 kg) e o desvio-
padrão dessa população (digamos σ = 10 kg).
O escore padrão, ou “Z” nos permite calcular quantos desvios-padrão a partir da média uma
determinada medição se encontra. Sua fórmula é (já sabemos o significado de todos os símbolos,
mas se ainda tiver dúvida, verifique no AVA):
Agora vamos pegar dois alunos quaisquer que pesam 90 kg e 40 kg e calcular seus escores
BIOESTATÍSTICA E
EPIDEMIOLOGIA 50
padrões (relembrando que µ = 70 kg e σ = 10 kg).
Esses resultados nos informam que o aluno mais pesado está 2 desvios-padrão acima da média,
enquanto o aluno mais leve está a 3 desvios-padrão abaixo da média. Mas o que isso significa?
Vejamos algumas das proporções da Curva de Gauss (no AVA, você encontra a tabela com muitas
outras proporções):
o intervalo entre µ ± 1σ contém 68,27% das medições;
o intervalo entre µ ± 2σ contém 95,44% das medições e
o intervalo entre µ ± 3σ contém 99,73% das medições.
Figura 5. Proporções da Distribuição de Gauss.

Fonte: Zar, 2010.
No nosso exemplo, significa que 68,27% dos 4000 alunos têm entre 60 kg e 80 kg (µ, que
é 70 kg, ± 1σ, que é 10 kg); 95,44% têm entre 50 kg e 90 kg; e 99,73% têm entre 40 kg e 100
kg. Interessante, não é? Veja como ficaria a curva normal, com a anotação do nosso aluno mais
pesado:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 51
Figura 6. Proporções de uma Distribuição normal com média igual a 70 e desvio-padrão 10.
Fonte: o autor.
Toda a parte clara sob a curva normal representa os alunos que têm menos que 90 kg, enquanto
a parte rosa representa alunos que têm mais que esse peso.
Já o teste “Z” apresenta outra informação, além de quantos desvios-padrão uma determinada
medição está além ou aquém da média, como ocorre com o escore padrão. Mas antes de
continuarmos, precisamos compreender outro conceito: o erro padrão da média, que é a
estimativa do desvio-padrão de todas as médias de tamanho “n” eventualmente retiradas de uma
população. Sua fórmula é:
Já a fórmula do teste “Z” é:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 52
Além disso, é importante frisar que as estatísticas “Z” e “t” (que será visto na sequência)
apresentam distribuições simétricas. Sabendo disso, cabe ressaltar que o teste pode ser unilateral
ou bilateral. Se optarmos por um teste unilateral, estaremos indicando que estamos verificando
se a média amostral é maior ou menor que a média populacional (somente uma das duas
opções). Já se optarmos pelo teste bilateral, estaremos indicando que desejamos verificar se a
média amostral é diferente (pode ser maior ou menor) da média populacional. Na maioria das
vezes, é preferível optar pelo teste bilateral, pois eventualmente os tratamentos podem ter efeito
inesperado (e.g. aumento de flúor na água aumentar a incidência de cárie dental). Além disso,
considerando a simetria dessas distribuições, qualquer valor positivo será correspondente ao
mesmo valor negativo, como veremos no exemplo abaixo.
Vamos ao exemplo. Imagine que o secretário de saúde do seu município afirme ter todos os
dados e informe que a idade média das gestantes atendidas através do SUS é igual a 25 anos,
com um desvio-padrão de 5 anos. Contudo, você deseja conduzir um estudo, pois percebe uma
predominância de jovens adultas e adolescentes nos atendimentos em postos de saúde. Para isso,
você determina as hipóteses nula, ou seja, a média informada pelo secretário é igual a média
real da população, e alternativa, ou seja, a média informada é diferente. Em seguida, você realiza
uma amostragem probabilística (conforme vimos no item 1.3) e verifica a idade de 25 gestantes.
Realiza o cálculo da idade média da sua amostra, que revela o resultado de 22 anos. Agora você já
tem os dados para realizar um teste estatístico, cujo resultado será:
Como já vimos no item 3.1, os resultados de todos os testes estatísticos devem ser confrontados
com os valores críticos, que estão nas tabelas para consulta no AVA. Para esse caso, verifica-se
que o valor crítico para o nível de confiança é de –1,96. Esse valor (assim como o valor positivo
1,96) proporciona exatamente a porcentagem de 5% de ocorrer aleatoriamente no conjunto de
dados. Sendo assim, qualquer valor que o ultrapasse tem probabilidade, ou p-value, menor que
5%. Considerando que nossos exemplos, avaliações e exercícios levam em conta o nível de 95%,
deve-se rejeitar a hipótese nula, pois o valor calculado ultrapassa o valor crítico.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 53
3.3 TESTE “T” DE STUDENT PARA UMA AMOSTRA
O teste “t” deve ser utilizado quando não possuirmos os parâmetros populacionais (desvio-
padrão “σ”, por exemplo) e/ou quando o “n” amostral for muito menor que a população. Raramente
um pesquisador possui os parâmetros da população, como no caso do secretário que afirmava
tê-los (pelo resultado do item anterior, parece que na realidade não tinha). Isso acontece porque
muitas vezes é inviável medir o conjunto completo de variáveis, seja por falta de tempo, verba
para a pesquisa ou simplesmente impossibilidade prática. Por essa razão, o teste “t” é muito mais
utilizado na Bioestatística que o teste “Z”.
Felizmente, tudo o que aprendemos sobre o teste “Z” servirá para o teste “t”. A única diferença
será o valor crítico, que pertence à tabela própria desta estatística (que, como todas as outras,
encontra-se no AVA). Confira a fórmula para o cálculo de “t” para uma amostra:
Vamos ao exemplo, dessa vez realizando o passo a passo de uma pesquisa quantitativa.
Destaco que em nossos exemplos e avaliações, o valor da estatística crítica sempre será dado.
Contudo, as tabelas estão disponíveis no AVA e, se você for procurá-los para conduzir estudos
ou realizar exercícios, saiba que o tamanho da amostra influencia no seu valor. Você precisa
procurar na linha indicada pelos graus de liberdade (referenciado como GL ou v), que nada mais
é que o número de dados menos 1 (n – 1).
Suponha que você queira descobrir se o uso de um anticoncepcional com estrógeno causa
alterações de peso em mulheres, tanto para mais, quanto para menos (teste bilateral). Para isso,
você mediu o peso de 4 mulheres antes e depois de dois anos de uso contínuo. As diferenças
foram 6, 6, – 6 e 6 (valores positivos indicam ganho de peso; o valor negativo indica perda de
peso). O valor crítico de “t” para “n” = 4 é 3,18 (conforme tabela no AVA) e, como sempre, o nível
de significância é de 95%.
O primeiro passo é formular as hipóteses nula e alternativa. Como já vimos, a hipótese nula é
a hipótese da igualdade e a hipótese alternativa é a da diferença. Portanto, para esse caso,
Ho: µ = 0, ou seja, a média da população de onde esta amostra foi retirada (pesos de todas as
mulheres que tomam esse tipo de anticoncepcional) é igual a zero e
BIOESTATÍSTICA E
EPIDEMIOLOGIA 54
H1: µ ≠ 0, ou seja, a média pode ser maior ou menor que zero (houve alteração de peso para
mais ou para menos).
O próximo passo é realizar o cálculo do teste:
O último passo consiste em interpretar o resultado. Considerando que o valor calculado foi
igual a 1 e não ultrapassou o valor crítico, que é igual a 3,18, devemos aceitar a hipótese nula,
ou seja, o anticoncepcional não altera o peso das usuárias (ainda que o peso médio daquela
amostra tenha sido 3 kg maior, não significa que a população de mulheres que tomam esse
anticoncepcional terá peso maior).
VAMOS REFLETIR:
Se a amostra fosse de 64 mulheres, como acha que seria o resultado? Pesquise e
descubra a importância de amostras grandes.
VOCÊ SABIA?
O teste “t” também pode ser utilizado para comparar médias, mas para o propósito
do nosso curso, o teste para uma amostra (que acabamos de discutir) será mais do que
suficiente.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 55
3.4 ANÁLISE DE VARIÂNCIA (ANOVA)
Quando for necessária a comparação entre mais de dois grupos paramétricos (que aprendemos
a realizar com os testes “t” e “Z”), a probabilidade de rejeitar incorretamente a hipótese nula
aumenta. Para evitar esse aumento na probabilidade de erro, quando houver mais de dois
tratamentos para serem comparados, deve-se optar pela análise de variância, ou ANOVA. Em
nossos exemplos, exercícios e avaliações isso não será necessário. Além disso, o estudo da ANOVA
está além dos objetivos desse nosso curso. Contudo, é importante ressaltar que situações como a
descrita aqui podem ocorrer na pesquisa real.
Para os propósitos dessa disciplina, será suficiente saber a característica principal da análise
de variância. Este teste compara a variação entre os grupos, com a variação de ocorre dentro dos
grupos. Sua fórmula resumida é:
ou seja, quanto maior a proporção da variação entre um grupo, maior será o valor de F, enquanto
que uma grande variação dentro de um grupo, reduzirá o valor de F. Como em qualquer teste
estatístico, o aumento da estatística calculada aumenta as chances de se rejeitar a hipótese nula
(pois quando comparamos com as estatísticas críticas tabeladas, há maior chance de ultrapassá-
las).
Veja um exemplo simples. Suponha que você seja um odontólogo tentando determinar se há
diferença estatisticamente significante no escurecimento da dentina que transparece através do
esmalte em indivíduos que ingerem água, suco de uva ou café. Como de praxe, a hipótese nula será
a de que não há diferença no escurecimento da dentina em relação à ingestão das três bebidas,
enquanto a hipótese alternativa será a de que pelo menos uma bebida causa mais escurecimento
que outra. Perceba que há três grupos (água, café e suco de uva) e suponha que haja 3 medições
em cada grupo. Se houver uma grande variação dentro de cada grupo, ou seja, cada medição for
muito diferente de outras, é mais provável que a bebida não causa tanta diferença, mas sim outras
características dos participantes do experimento. Já se for observada uma grande variação entre
os três tratamentos, é mais provável que as bebidas causem o escurecimento. É essa relação, entre
a variação entre grupos com a variação dentro dos grupos que a ANOVA nos fornece.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 56
3.5 TESTE NÃO-PARAMÉTRICO PARA DUAS AMOSTRAS: MANN-WHITNEY (“U”)
Todos os testes estatísticos que estudamos até agora podem ser agrupados em uma categoria
chamada de testes paramétricos, pois são baseados em parâmetros populacionais, tais como
média, desvio-padrão etc. Porém, alguns métodos estatísticos não requerem a estimação dos
parâmetros e, portanto, podem ser usados para análise de variáveis cujas distribuições não são
conhecidas (por exemplo, quando não podemos verificar se os dados têm uma distribuição
normal). Além disso, a maioria dos testes não-paramétrios utiliza técnicas que convertem os
dados observados em posições relativas (ou rankings), o que traz a vantagem de diminuir a
influência de outliers (se você esqueceu o que significa, reveja o item 1.3). Por outro lado, alguma
informação sobre os dados é perdida na conversão e, quando comparado aos testes paramétricos,
os testes não-paramétricos têm uma probabilidade de cometer erro ligeiramente superior).
Outra consideração bastante importante: é necessária alguma experiência em análise de dados

e o conhecimento de outros métodos de verificação de distribuições (que extrapola os objetivos
do nosso curso) para identificar a necessidade de se utilizar um teste não-paramétrico. Mas não
se preocupe; nossos exercícios, exemplos e avaliações indicarão claramente essa necessidade.
Agora que já temos uma noção de estatística não-paramétrica, vamos ser mais específicos. A
comparação de conjuntos de variáveis não-paramétricas é necessária para verificarmos se esses
conjuntos apresentam diferença estatisticamente significante entre eles, ou a variação percebida
foi apenas aleatória. Imagine, por exemplo, que você pretende descobrir se os alunos da sua sala
têm alturas diferentes das alunas. Antes de mais nada, você formula as hipóteses, sendo: H0:
alunos e alunas têm alturas iguais e H1: alunos e alunas têm alturas diferentes. Em seguida você
realiza uma das 4 amostragens probabilísticas que você aprendeu e mede 7 alunos selecionados
(cujos resultados, em centímetros, são: 190, 187, 184, 181, 180, 174 e 169) e 5 alunas selecionadas
(resultados: 164, 165, 168, 173 e 178). Se você desejasse utilizar alguma técnica de estatística
descritiva, poderia informar que a média dos alunos é maior que a média das alunas ou alguma
informação sobre o desvio-padrão, coeficiente de variação etc.
Contudo, como já dissemos, a Bioestatística inferencial (tema deste capítulo) vai além. O
que queremos determinar é se, dado o nível de significância (como sempre, 95%), essas duas
amostras, que chamamos genericamente de Grupo 1 e Grupo 2, vêm de populações com alturas
médias diferentes ou iguais. Sendo assim, vamos às fórmulas do teste “U” (Mann-Whitney):
BIOESTATÍSTICA E
EPIDEMIOLOGIA 57
onde n1 é o número de dados do grupo 1 (alunos, neste caso);
n2 é o número de dados do grupo 2 (alunas) e
R1 é a soma dos rankings das variáveis do grupo 1.
Para facilitar a compreensão, vamos dispor os dados em duas colunas e determinar suas
quantidades de dados ou tamanhos amostrais (n):
Tabela 7. Altura suposta, em centímetros, de 7 alunos e 5 alunas.
Fonte: o autor.
Agora falta somente a soma dos rankings do grupo 1 (R1). Para isso, basta colocar o número
ordinal em cada uma das medições, independentemente da amostra, começando pelo menor
(se for começar pelo maior, o resultado será o mesmo). Sendo assim, o menor número de todas
as 12 medições será o número 1; o segundo menor, o número 2 e assim por diante. Após colocar
todos os ordinais, basta somar os que pertencem ao grupo 1 para obter o R1 que precisamos para
completar a fórmula. Vejamos como fica:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 58
Tabela 8. Altura suposta, em centímetros, de 7 alunos e 5 alunas e suas posições relativas
(entre parênteses).
Fonte: o autor.
Finalmente, vamos calcular o U1 e U2 e comparar o maior deles com o U crítico, fornecido pela
tabela do AVA, que é igual a 30 para esse conjunto de dados (com n1 = 7 e n2 = 5). Como sempre, se
o valor da estatística calculada for maior que o crítico, rejeitamos a hipótese nula (há igualdade)
e aceitamos a hipótese alternativa (há diferença). Vamos aos cálculos:
Considerando que o maior número entre U1 e U2 é 32, devemos compará-lo com o valor
de U crítico tabelado, que é 30. Sendo o U calculado maior que o crítico tabelado, rejeitamos
H0 e aceitamos H1, ou seja, os alunos e as alunas não têm a mesma altura, pois a diferença é
estatisticamente significante.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 59
3.6 TESTE NÃO-PARAMÉTRICO PARA 3 OU MAIS AMOSTRAS: KRUSKAL-WALLIS (“H”)
O princípio do teste de Kruskal-Wallis é o mesmo da estatística “U”, pois também utilizaremos

o tamanho de cada amostra, além da soma do ranking ou posições relativas. Apesar de apresentar
uma fórmula diferente, todas as considerações a respeito das características de um conjunto de
dados não-paramétricos feitas no item anterior, continuam válidas (inclusive a informação nos
exercícios, exemplos e avaliações sobre a necessidade de se utilizar um teste não-paramétrico).
O teste “H” deve ser usado quando precisarmos identificar se há diferença significante entre 3
ou mais amostras, pois o teste “U” permite a comparação apenas entre 2 amostras. A fórmula do
teste de Krusal-Wallis é:
A fórmula parece ser uma pouco mais complicada que a anterior, mas se calcularmos o
termo separadamente, facilitará muito o processo. Lembre-se que o “i” sobescrito em “R”
e “n” representa o número de grupos que devem ser comparados. Vamos supor que desejamos
comparar três ou quatro grupos. Nesses casos, os termos ficariam assim, respectivamente:
Mais fácil, não é mesmo? Agora vamos a um exemplo. Imagine que você queira determinar
se há diferença estatisticamente significante entre o índice de massa corporal (IMC) de três
grupos de 5 mulheres cada, selecionadas aleatoriamente nas cidades de Balneário Camboriú,
Itajaí e Camboriú. Como você já deve saber, vamos iniciar formulando as hipóteses. H0: mulheres
têm o mesmo IMC nas três cidades e H1: em pelo menos uma das três cidades as mulheres têm
IMC diferente. Agora, apresentamos os dados, juntamente com seus tamanhos amostrais (n) e
rankings em parênteses, assim como fizemos no item anterior:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 60
Tabela 9. IMC suposto de 15 mulheres e suas posições relativas (entre parênteses).
Fonte: o autor.
Antes de realizarmos o cálculo final, valor calcular separadamente a expressão :
Finalmente, podemos substituir na fórmula:
Considerando que o valor crítico de “H” para 3 grupos de 5 variáveis cada é igual 5,78 (tabela
no AVA), rejeitamos a hipótese nula, pois o “H” calculado ultrapassou o “H” crítico. Portanto,
pelo menos em uma das 3 cidades, as mulheres apresentam um IMC maior e a diferença não foi
aleatória. Sempre que isso acontece, cabe ao pesquisador explicar essa diferença na conclusão ou
considerações finais do seu trabalho.
Agora que já conhecemos os procedimentos para o cálculo de dois testes estatísticos não-
paramétricos, gostaria de acrescentar uma informação que não será necessária em nossas
avaliações (para evitar o aumento da complexidade em assuntos tão pouco discutidos ao longo
da nossa educação formal), mas que pode aparecer em sua pesquisa na prática. Trata-se da
possibilidade de nos depararmos com valores iguais entre as variáveis. Quando isso ocorrer,
para calcularmos o ranking, devemos fazer a média aritmética simples das posições e atribuir o
valor aos valores repetidos. Por exemplo, se tivermos os valores 13, 15, 15 e 17, os rankings, entre
parênteses, ficariam: 13 (1); 15 (2,5 – que é a média entre as posições 2 e 3); 15 (2,5); 17 (4).
BIOESTATÍSTICA E
EPIDEMIOLOGIA 61
Aprendizagem.
A Bioestatística inferencial é representada por diversos testes estatísticos que possibilitam

ao pesquisador confirmar ou refutar hipóteses sobre populações, a partir de amostras. Neste
capítulo, entramos em contato com os testes de hipótese e agora já podemos usá-los para aceitar
ou rejeitar hipóteses, que devem ser formuladas preferencialmente antes da coleta dos dados.
Aprendemos que a hipótese nula (H0) representa a igualdade (e.g. a altura média de um grupo
não é diferente da altura média do outro grupo), enquanto a hipótese alternativa (H1) representa
a diferença (e.g. a altura média de um grupo é maior/menor que a altura média do outro). Já os
cálculos dos testes estatísticos com os quais nos deparamos neste capítulo fornecerão os valores
que serão comparados com os valores críticos (tabelados) e sempre que esses valores calculados
forem maiores que os valores críticos, devemos rejeitar a hipótese nula (e aceitar a hipótese
alternativa), ou seja, podemos afirmar que há diferença estatisticamente significante entre os
grupos ou parâmetros comparados.
Dividimos os testes em paramétricos (quando temos a possibilidade de comparar uma

estatística amostral com um parâmetro populacional) e não-paramétricos. Entre os paramétricos,
aprendemos a calcular o teste “z” e “t” de Student para uma amostra (há outras possibilidades, mas
essas formas são suficientes para alcançarmos nossos objetivos), cujos resultados representam
distâncias padronizadas em relação à média populacional ou média alegada. Na prática, a única
diferença entre esses dois testes consiste no valor das estatísticas tabeladas. Importante frisar
que só poderemos utilizar o teste “z” quando os parâmetros populacionais (e.g. desvio-padrão)
forem conhecidos ou quando o “n” for grande (maior que 30). Como raramente isso ocorre, quase
sempre se utilizará o teste “t” na pesquisa real. Outra observação necessária refere-se ao aumento
na probabilidade de se rejeitar incorretamente a hipótese nula quando houver a necessidade de
comparação entre 3 ou mais tratamentos. Para esses casos, é indicado o uso da análise de variância
(ANOVA), ou estatística “F”, que compara a variação entre os tratamentos, com a variação que
ocorre dentro dos tratamentos.
Os 3 testes paramétricos descritos no parágrafo anterior são prioritários quando um
BIOESTATÍSTICA E
EPIDEMIOLOGIA 62
pesquisador for escolher a estatística adequada, pois apresentam menores probabilidades de
incorrer em erros em relação aos testes não-paramétricos. Contudo, algumas vezes é necessário
utilizar estes últimos, pois as distribuições não são conhecidas. Em geral, os testes não-
paramétricos utilizam a posição relativa das variáveis para o cálculo e, por isso, não é necessário
a estimação dos parâmetros populacionais. Neste capítulo 3, aprendemos a calcular o teste não-
paramétrico de Mann-Whitney, ou estatística “U”, que permite a comparação entre dois grupos,
e o teste não-paramétrico de Kruskal-Wallis, para comparação entre 3 ou mais grupos.
Gostaria de lembrar que em qualquer teste estatístico, sempre que o valor calculado for maior
que o valor crítico (tabelado), deve-se rejeitar a hipótese nula. Além disso, como já foi citado,
os valores críticos dependem da quantidade de dados e do nível de confiança escolhido para o
estudo específico. Em nossos exercícios e avaliações esse nível será de 95% para todos os casos e
os valores críticos sempre serão fornecidos. Chegamos ao fim da Bioestatística e nos próximos 4
capítulos, estudaremos temas relacionados à Epidemiologia.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 63
UNIDADE 2
EPIDEMIOLOGIA
CAPÍTULO 4
4 – CONCEITOS BÁSICOS DE EPIDEMIOLOGIA
A Epidemiologia é a ciência básica da saúde pública, que utiliza os métodos da Bioestatística,

que aprendemos na Unidade 1, para quantificar os fenômenos dos processos de saúde e doença.
Por isso, cada vez mais a Epidemiologia tem se tornado uma importante fonte de informação para
as Ciências da Saúde. Quanto à etimologia, a palavra deriva do grego: epi (sobre) + demos (povo)
+ logos (ciência), ou seja, Epidemiologia pode ser entendida como a ciência que estuda o que
acontece com uma população.
Agora que sabemos a origem da palavra e a utilidade de ciência, vamos a uma definição
mais completa. A Associação Internacional de Epidemiologia (IEA), em seu Guia de Métodos de
Ensino, define essa ciência como sendo “o estudo dos fatores que determinam a frequência e a
distribuição das doenças nas coletividades humanas” (ALMEIDA FILHO; ROUQUAYROL, 2013, p.
4). A definição pode ser ampliada, diferenciando a atenção individual da coletiva:
“... enquanto a clínica dedica-se ao estudo da doença no indivíduo, analisando

caso a caso, a epidemiologia debruça-se sobre os problemas de saúde em
grupos de pessoas, às vezes grupos pequenos, na maioria das vezes envolvendo
populações numerosas” (RODRIGUES et al., 2014, p. 9).
BIOESTATÍSTICA E
EPIDEMIOLOGIA 64
Ainda de acordo com o IEA, são três os principais objetivos da epidemiologia:
I. Descrever a distribuição e a magnitude dos problemas de saúde das populações humanas.
II. Proporcionar dados essenciais para o planejamento, execução e avaliação das ações de
prevenção, controle e tratamento das doenças, bem como para estabelecer prioridades.
III. Identificar fatores etiológicos na gênese das enfermidades.
4.1 PERSPECTIVAS HISTÓRICAS
Hipócrates (460 a.C - 377 a.C), considerado o pai da medicina científica, foi o primeiro a sugerir
que as causas das doenças não eram intrínsecas à pessoa nem aos desígnios divinos, mas que
estava relacionada a certas características ambientais. Embora as causas relatadas por Hipócrates
tenham sido superadas, ele lançou as bases para a procura da causalidade das doenças e agravos
à saúde, norte principal da epidemiologia até hoje.
Hipócrates, em Tratado dos ares, das águas e dos lugares (século V a.C.), coloca os termos
epidêmico e endêmico, derivados de epidemion (verbo que significa visitar, referindo-se às
enfermidades que visitam) e endemion (residir, referindo-se às enfermidades que permanecem
na comunidade). Ele sugeriu neste trabalho que condições, tais como o clima de uma região, a
água ou sua situação num lugar em que os ventos sejam favoráveis são elementos que podem
ajudar o médico a avaliar a saúde geral de seus habitantes. Em outra obra, Tratado do prognóstico
e aforismos, ele trouxe a ideia, então revolucionária, de que o médico poderia predizer a evolução
de uma doença mediante a observação de um número suficiente de casos. Essa também é, até
hoje, uma das principais características da epidemiologia e da demografia.
Infelizmente, os herdeiros de Hipócrates deixaram de lado o espírito coletivo de sua

medicina. Além disso, na Idade Média, houve o declínio científico nas Ciências da Saúde, que se
preocupavam mais com as práticas religiosas e de magia, revelando a ideologia da época medieval
(salvar a alma, mesmo que o corpo material pereça). Nos séculos dominados por essa vertente,
a preocupação coletiva era revivida em momentos críticos, como as explosões de peste, pragas e
outras epidemias.
Ainda que tenha havido algumas manifestações de preocupação com a saúde coletiva da
população, principalmente no mundo árabe (por exemplo, em Bagdá e Córdoba, no século X),
BIOESTATÍSTICA E
EPIDEMIOLOGIA 65
somente no século XVII teremos contato com uma publicação que tratou de assuntos tipicamente
epidemiológicos. Trata-se de um trabalho do inglês John Graunt, em 1662, publicado em Londres,
sobre as observações a respeito das estatísticas de mortalidade, no qual analisou nascimentos e
óbitos semanais, quantificou o padrão de doença na população londrina e apontou características
importantes nesses eventos, tais como: diferenças entre homens e mulheres, entre população
urbana e rural, elevada mortalidade infantil e variações sazonais. Graunt também é considerado
um dos precursores da epidemiologia e da demografia como disciplinas, já que criou as bases para
a observação da distribuição de frequência de dados populacionais de mortalidade coletados
rotineiramente (a propósito, como vimos na Unidade 1, é uma forma adequada de descrever
grandes quantidades de dados, lembra?)
Outro inglês, John Snow, é pioneiro na procura sistemática dos determinantes das epidemias.
Miasmas:
Seu ensaio sobre a maneira de transmissão da cólera, publicado em 1855, apresenta estudos supostos gases
de animais e
a respeito das epidemias da doença ocorridas em Londres em 1849 e 1854. Suas anotações dejetos em
decomposição
sistemáticas sobre os casos levaram a desenvolver a ideia de que a epidemia da cólera era que transmitem
doenças
ocasionada por parasitas invisíveis e não por miasmas, como se pensava na época. Ele elaborou
hipóteses sobre a qualidade da água como meio principal de contágio.
4.2 EVOLUÇÃO CONCEITUAL
A partir das primeiras décadas do século XX, com a melhoria do nível de vida nos países
desenvolvidos e com o consequente declínio na incidência das doenças infecciosas, outras
enfermidades de caráter não-transmissível (doenças cardiovasculares, câncer e outras) passaram
a ser incluídas entre os objetos de estudos epidemiológicos. Além disso, pesquisas mais recentes,
sobretudo as que utilizam o método de estratificação social, enriqueceram esse campo da ciência,
ensejando novos debates.
No entanto, é a partir do final da Segunda Guerra Mundial que assistimos ao intenso

desenvolvimento da metodologia epidemiológica, com a ampla incorporação da estatística,
propiciada em boa parte pelo aparecimento dos computadores. A aplicação da epidemiologia
passa a cobrir um largo espectro de agravos à saúde. Os estudos de Doll e Hill (1954), estabelecendo
associação entre o tabagismo e o câncer de pulmão, e os estudos de doenças cardiovasculares
desenvolvidas na população da cidade de Framingham, Estados Unidos, são dois exemplos
BIOESTATÍSTICA E
EPIDEMIOLOGIA 66
da aplicação do método epidemiológico em doenças crônicas que são importantes marcos na
Epidemiologia.
Hoje a Epidemiologia constitui importante instrumento para a pesquisa na área da saúde,

seja no campo da clínica, seja no da saúde pública. No Brasil, a organização dos serviços do
Sistema Único de Saúde (SUS) baseia-se na descentralização sendo, portanto, indispensável
o conhecimento da epidemiologia nos serviços locais de saúde. Essas novas metodologias e
concepções ampliaram ainda mais o espectro de atuação da ciência epidemiológica, que inclui
além dos agravos à saúde, as condições que promovem a prevenção. Também passaram a ser
objeto de estudo epidemiológico causas externas, como acidentes de trânsito e outras doenças
difusas, tais como obesidade e cárie.
4.3 DEFINIÇÕES BÁSICAS
Morbidade:
Algumas definições, com as quais não estamos familiarizados no dia a dia, são essenciais para relativo a
a compreensão da lógica epidemiológica. Por isso, trabalharemos nesse item alguns conceitos doenças
que serão úteis no estudo da Epidemiologia, principalmente quando for necessário descrever Mortalidade:
relativo a
eventos de morbidade e mortalidade. mortes
Primeiramente, vamos conceituar saúde e doença. Pode parecer óbvio a você o que significa
saúde. Contudo, quando é preciso expressar em palavras, algumas pessoas têm dificuldade
em definir adequadamente esse termo. A Organização Mundial da Saúde (OMS) define saúde
como sendo “um estado de completo bem-estar físico, mental e social, e não apenas a ausência
de doença ou enfermidade” (RODRIGUES et al., p. 10). Já doença, sob essa mesma perspectiva
pode ser descrita como desajuste ou falha nos mecanismos de adaptação do organismo ou uma
ausência de reação aos estímulos a cuja ação está exposto, desencadeando um processo que
conduz a uma perturbação da estrutura ou da função de um órgão, de um sistema ou de todo um
organismo ou de suas funções vitais. Essas abordagens são bastante simplistas, pois a percepção
de saúde ou doença é subjetiva e varia de acordo com as características do indivíduo. No âmbito
do Sistema Único de Saúde (SUS), uma definição mais abrangente, defendida por muitos autores,
inclui os planos biológicos (alteração de função orgânica), individual (condição geral de saúde)
e coletivo (fenômeno clínico e social dependente de vários fatores, inclusive extrínsecos ao
indivíduo como, por exemplo, local de moradia).
Por outro lado, doença é a falta ou perturbação da saúde, moléstia, mal ou enfermidade e pode
BIOESTATÍSTICA E
EPIDEMIOLOGIA 67
ser classificada de várias maneiras. Quanto à forma, as doenças podem ser manifestas ou clínicas
(apresentam sinais e/ou sintomas), subclínica (aquela em que o indivíduo que não apresenta
nenhum sinal ou sintoma e somente é revelada através de exames complementares), abortiva
(desaparece rapidamente após poucos sinais ou sintomas) e fulminante (leva rapidamente
a óbito). Quanto à transmissibilidade, podem ser transmissíveis ou infecciosas (causada por
transmissão de um agente patogênico para um hospedeiro suscetível) ou não-transmissíveis
(todas as que não resultam de infecção, como por exemplo, diabetes). Por fim, quando à duração,
as doenças podem ser agudas (curta duração) ou crônicas (longa duração).
Outro conceito importante em Epidemiologia é aquele relacionado à delimitação da distribuição

das doenças ou mortes em intervalos definidos. Para compreendermos melhor como os agravos
à saúde se distribuem, precisamos saber diferenciar prevalência de incidência. Prevalência é a Prevalência – nº
total de casos
medida que descreve a quantidade de doença verificada em determinado momento, ou seja, o totais
número de casos totais dessa doença em uma população. Já incidência representa a quantidade Incidência – nº
de casos de uma doença em um intervalo de tempo, ou seja, o número de casos novos em uma de casos novos
população. Por exemplo, suponha que em nossa cidade, o número total de pessoas com câncer
de boca, no último dia 31 de dezembro seja igual a 80; destes, 20 foram diagnosticados no ano
passado. Sendo assim, a prevalência de câncer de boca em Balneário Camboriú é de 80, enquanto
a incidência no ano passado foi de 20.
Após o estudo desse capítulo, estamos aptos a conceituar Epidemiologia, que é a ciência
básica da saúde pública, e cujos objetivos são: determinar a distribuição espacial e temporal das
doenças entre as populações, identificar as causas dessas doenças e proporcionar informação
para ações de promoção, prevenção e recuperação da saúde. Sob a perspectiva histórica, vimos
que Hipócrates (cinco séculos antes de Cristo) iniciou a tradição científica na medicina ao
procurar causas para os agravos à saúde da população. Já no século XVII, o inglês John Graunt
lançou um tratado que relacionava variáveis (como sexo, idade etc.) ao número de mortos,
viabilizando os estudos de distribuição de frequências de dados populacionais, utilizados até
hoje. Dois séculos mais tarde, John Snow utilizou a procura sistemática dos determinantes das
epidemias (formulando a hipótese de contaminação da água para a disseminação da cólera em
Londres), usada em estudos epidemiológicos na atualidade.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 68
Outra constatação interessante foi a de que, na época dos pioneiros da Epidemiologia,
as doenças transmissíveis constituíam o único objeto de estudo dessa ciência. Contudo,
principalmente após a Segunda Guerra Mundial, a evolução da tecnologia permitiu a ampliação
da investigação epidemiológica, ao mesmo tempo em que a prevalência de doenças infecciosas
diminuiu drasticamente, em função da disseminação de antibióticos e vacinação. Esses fatores
fizeram com que doenças não-transmissíveis e crônicas, tais com câncer e diabetes, fossem
introduzidas no estudo epidemiológico. Dessa forma, a Epidemiologia se tornou um instrumento
mais completo e essencial para a pesquisa na área da saúde pública e na clínica médica.
Neste capítulo também entramos em contato com alguns termos utilizados com frequência
na Epidemiologia, tais como medidas de mortalidade (relativas a mortes) e morbidade (relativas
a doenças), além de definirmos os conceitos de saúde e doença de forma ampla, conforme
entendido pela Organização Mundial da Saúde. Outra importante informação trazida pelo
capítulo 4 se refere às maneiras de descrever medidas de saúde/doença em função do número
de casos totais em uma população em dado momento (prevalência) e em função do número de
novos casos em determinado período, em uma dada população (incidência). Conhecendo esses
conceitos, podemos seguir para o estudo do processo que leva uma pessoa saudável a se tornar
doente; isso será feito no próximo capítulo, no qual explicaremos o processo saúde-doença
através de 3 modelos explicativos.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 69
CAPÍTULO 5
5 PROCESSO SAÚDE-DOENÇA
Agora que já podemos definir saúde e doença, vamos estudar o caminho que leva uma pessoa
saudável a se transformar em uma pessoa doente, ou vice-versa. Esse caminho será referido, a
partir de agora, como sendo o processo saúde-doença, que representa o conjunto de relações e
variáveis que produzem e condicionam o estado de saúde-doença de uma população, e que varia
em diversos momentos históricos do desenvolvimento científico da humanidade. A Epidemiologia
fornece informações e conceitos específicos para a aplicação prática do conhecimento. Essa
aplicação é realizada através de modelos explicativos do processo saúde-doença, que são
construções teóricas que procuram entender a realidade desse complexo processo.
5.1 MODELOS EXPLICATIVOS DO PROCESSO SAÚDE-DOENÇA
Os modelos descritos a seguir constituem visões diferentes de abordar o processo de saúde

e doença e não têm hierarquia entre si, ou seja, não há um melhor do que outros em todas as
ocasiões. Cabe ao profissional de saúde compreender a realidade da prática cotidiana para
utilizar o modelo mais adequado. Além disso, é importante frisar que iremos discutir apenas
os principais modelos e não incluiremos algumas abordagens que já não se aplicam (e servem
apenas à história, brevemente citada no capítulo 1), como o modelo mágico-religioso ou o
empírico-racional (de Hipócrates). Por outro lado, novos modelos poderão surgir e serem mais
adequados às Ciências da Saúde, dado seu estágio de desenvolvimento científico.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 70
5.1.1 Modelo biomédico ou de medicina científica ocidental
Os princípios teóricos do modelo biomédico atual baseiam-se na orientação científica do século

XVII, da qual incorporou uma visão mecanicista e reducionista do ser humano e da natureza.
Essa orientação surgiu quando filósofos como Galileu, Descartes, Newton, Bacon, entre outros,
conceberam a realidade do mundo como uma máquina. Neste modelo, o conceito de doença deve
ser analisado em termos estritamente biológicos. Assim, doença pode ser definida como uma
falha nos mecanismos de adaptação do organismo ou ainda como sendo uma ausência de reação Etiopatogenia:
análise
aos estímulos causados pela exposição. Esse processo conduz a uma perturbação da estrutura ou especializada
das causas que
função de um órgão, de um sistema, organismo ou de suas funções vitais. O conceito de doença ocasionam o
desenvolvimento
no modelo biomédico é abordado a partir de duas perspectivas. A primeira é do ponto de vista de certas
doenças.
clínico, em que os problemas de saúde são classificados de acordo com a duração das alterações,
disfunções e sintomas em agudos (curta duração) e crônicos (longa duração). A segunda
perspectiva do modelo biomédico leva em consideração o caráter etiopatogênico do processo de
adoecimento; nesse caso, as doenças são classificadas em infecciosas e não-infecciosas. A tabela
a seguir resume a classificação das doenças de acordo com o modelo biomédico e traz alguns
exemplos:
Tabela 10. Classificação e exemplos de doenças com base na etiologia e duração
Duração
Etiologia
Aguda Crônica
Infecciosas Tétano, gripe, sarampo Tuberculose, Chagas
Não-infecciosas Envenenamento, acidentes Diabetes, obesidade

Fonte: o autor.
5.1.2 Modelo de História Natural da Doença (HND) e prevenção
O modelo de HND, também chamado de processual, define doença como sendo um conjunto
de processos ativos que criam o estímulo patológico, seguida da resposta do ser humano a
BIOESTATÍSTICA E
EPIDEMIOLOGIA 71
esse estímulo e finalizando em alterações que levam ao defeito, à invalidez, à recuperação ou à
morte. Esse modelo considera que a determinação do estado patológico se dá em dois domínios
complementares e consecutivos: o meio externo e o meio interno. No meio externo, os fatores
que contribuem para o surgimento do processo de enfermidade podem ser físicos, biológicos,
sociais, políticos e culturais. Já no meio interno, ocorrem uma série de modificações progressivas
de natureza fisiológica, bioquímica ou histológica, próprias de cada doença. Outra consideração
importante do modelo processual (ou de HND) é a divisão da evolução do processo patológico em
duas fases consecutivas, começando pelo período de pré-patogênese e continuando no período
de patogênese. No primeiro, os sintomas ou manifestações patológicas ainda não apresentam
sinais, enquanto no segundo essas manifestações já se encontram ativas.
Os agentes que atuam no período pré-patogênico e que levam os estímulos do meio externo
até o meio interno podem ser de diversas naturezas e podem estar associados, aumentando a
probabilidade de que o processo resulte em doença. Seguem alguns exemplos:
l
lagentes físicos ou químicos, como radiação ultravioleta ou mercúrio em um rio;
l
lbiopatógenos, como parasitas, bactérias e vírus;
l
lagentes nutricionais, como carência de vitaminas ou excesso de açúcar;
l
lagentes genéticos, como na doença celíaca ou mutações genéticas;
Além dos agentes patogênicos, há fatores que são determinantes parciais ou fatores
contribuintes que aumentam ainda mais o risco do desenvolvimento da doença. São os
determinantes econômicos (grande parte das doenças são mais comuns em classes mais baixas,
enquanto outras são mais comuns em classes mais altas), culturais (tais como hábitos de
higiene e alimentação, preconceitos e crendices), ecológicos (como desastres naturais e poluição
atmosférica) e psicossociais (por exemplo, quando o sistema imunológico é suprimido devido à
episódios de depressão).
Já no período patogênico, o modelo de HND define que se iniciam as primeiras alterações

visíveis no sujeito afetado. Essas perturbações começam no nível celular e são de origem
bioquímica, que continuam e se transformam em distúrbios na forma e função de órgãos e
sistemas. Apesar de já estar instalada a doença, as primeiras alterações são subclínicas, pois
somente exames clínicos ou laboratoriais orientados podem detectá-las. Esses distúrbios podem
evoluir para incapacitação, cronicidade, convalescença (período de recuperação), morte ou cura.
A linha imaginária que divide as alterações subclínicas das alterações clínicas (quando já se pode
perceber a doença diretamente) é chamado de horizonte clínico.
Vamos utilizar o modelo processual para investigar uma doença específica como, por
BIOESTATÍSTICA E
EPIDEMIOLOGIA 72
exemplo, a cárie dentária. Podemos identificar no período pré-patogênico um desequilíbrio entre
ambiente (ph da saliva), hospedeiro (má higienização e alimentação) e agente (maior atividade
do S.mutans). As repercussões desse desequilíbrio podem passar para o período patogênico ao
originar uma mancha branca não cavitada (horizonte clínico ultrapassado, pois já é possível
observar a alteração diretamente), evoluindo para uma cárie que atinge a dentina e a polpa,
causando uma incapacitação. O esquema a seguir resume as fases e os possíveis desdobramentos
de uma doença qualquer, de acordo com o modelo processual ou de HND.
Figura 7. Fases do modelo de HND e seus possíveis desdobramentos.

Fonte: LEAVELL; CLARK, 1976 (adaptado).
Esse modelo tem a vantagem de considerar todo o processo de saúde-doença, promovendo

atitudes e práticas em saúde que apresentam uma dimensão qualitativa, pois procura explicar
e fazer valer os mais diversificados métodos de controle e prevenção das doenças e seus
consequentes problemas.
A partir dessa perspectiva, os níveis de prevenção e promoção de saúde tornam-se barreiras

que podem ser interpostas nas diversas etapas do ciclo evolutivo da doença. O modelo de HND
propõe três níveis de prevenção, a saber: prevenção primária, secundária e terciária. Na prevenção
primária, que ocorre no período pré-patogênico, são trabalhadas a promoção da saúde, como a
melhoria das condições sanitárias e educação e vigilância em saúde, e a proteção específica, como
por exemplo o uso de flúor na água para evitar cárie ou campanhas de imunização. Na prevenção
secundária, que ocorre no horizonte clínico das doenças, são preconizados o diagnóstico precoce
BIOESTATÍSTICA E
EPIDEMIOLOGIA 73
e tratamento imediato das patologias que não foram evitadas, além da limitação do dano;
como exemplo, podemos citar a remineralização do esmalte para mancha branca não cavitada,
restaurações ou tratamento em fase inicial de câncer. Por fim, a prevenção terciária, que ocorre
quando é necessária a reabilitação devido às sequelas, como por exemplo, quando um paciente
recebe uma prótese dentária.
5.1.3 Modelo sistêmico
Busca conhecer o conjunto de motivos que provoca a doença, ou seja, faz o papel de
investigação, buscando amplos conhecimentos e hipóteses para o problema, além de desenvolver
o conhecimento científico das doenças buscando relacionar as mais diversas razões que possam
causar o problema. Para a compreensão desse modelo explicativo do processo saúde-doença,
é necessário estar familiarizado com o conceito de ecossistema. Nesse sentido, ecossistema é
um conjunto de sistemas de seres vivos e inanimados, onde a mudança no estado de qualquer
elemento provoca mudança no estado dos demais elementos. Na concepção do modelo sistêmico,
as epidemias são descritas como sendo consequência da quebra no equilíbrio do ecossistema
Como esse modelo é mais abrangente, o conceito de agente é diferente daquele que estudamos
no modelo biomédico. No modelo sistêmico, o conceito de agente extrapola as divisões e tanto
pode ser um agente físico, químico, um gene ou biológico (nesse caso, chamamos de bioagente).
Já o hospedeiro ou suscetível é aquele em que a doença se desenvolverá e terá oportunidade de se
manifestar clinicamente. Segundo o modelo sistêmico, as relações entre hospedeiro e bioagente
patogênico são conduzidas através de três categorias:
GG a resistência, que é o sistema de defesa que tenta impedir a difusão dos agentes infecciosos;
pode estar associada ao estado nutricional, emocional ou genético do hospedeiro e é
resultado de fatores permanentes ou temporários;
GG a suscetibilidade, considerada no nível da espécie; por exemplo, a espécie humana é

suscetível à penetração de larvas de ancilostomídeos, mas há indivíduos que são resistentes
(nesse caso, principalmente negros);
GG a imunidade, que é um tipo específico de resistência associada a anticorpos que possuem

ação específica sobre determinados micro-organismos.
Além do agente e do suscetível, o modelo sistêmico também inclui o ambiente, considerado
BIOESTATÍSTICA E
EPIDEMIOLOGIA 74
de forma ampla, onde a situação geográfica, a temperatura, os poluentes, o aspecto social, entre
tantas outras variáveis confluem para determinar a ocorrência da enfermidade ou a manutenção
da saúde. Esses três elementos formam o sistema epidemiológico em equilíbrio dinâmico,
que define a estrutura geral de um problema de saúde. Um sistema epidemiológico formado
por agente, suscetível e ambiente é dotado de organização interna que regula as interações
determinantes da produção da doença.
Neste capítulo, estudamos as inter-relações e as variáveis que dirigem o processo de saúde e

doença em uma população através de modelos, que são teorias utilizadas para explicar a complexa
transformação de um indivíduo saudável em doente. Essas construções teóricas representam
diferentes interpretações, que podem ser alteradas em função do desenvolvimento da ciência, da
época, da cultura etc., sem que sejam necessariamente hierárquicas entre si.
O modelo biomédico foi primeiro visto neste capítulo e é baseado na compreensão de que
a doença deve ser analisada em termos estritamente biológicos. Sob essa perspectiva, pode-
se dividir os agravos à saúde de acordo com a duração das alterações, disfunções ou sintomas
em agudos e crônicos, representando respectivamente curta e longa duração. Além disso, as
doenças também são diferenciadas em relação às causas (etiologia) e classificados em infecciosas
e não-infecciosas. As doenças infecciosas são causadas por organismos patogênicos, vetores ou
veículos que o carregam ou que podem ser transmitidas por outros indivíduos contaminados,
através de contato. Já não-infecciosas compõem um variado grupo de doenças derivadas de
problemas genéticos, estilos de vida, traumas e acidentes, entre outros, que não envolvem
agentes patogênicos.
Outro modelo estudado neste capítulo foi o da história natural das doenças, que considera o
estímulo patológico físico, químico, social, cultural ou biológico do meio externo como o início
da doença, caracterizada pelo seu período pré-patogênico. Em seguida, ocorre a continuidade no
meio interno, onde o estímulo provoca alterações histológicas, bioquímicas ou fisiológicas que
resultam em defeito, invalidez, morte ou recuperação, sintomas que são visíveis e caracterizam
o período patogênico da doença (limite entre as alterações subclínicas e clínicas é chamado de
horizonte clínico). O modelo de história natural da doença prevê três níveis de prevenção do
agravo: primário, que ocorre no período pré-patogênico, secundário, que ocorre no horizonte
clínico da doença (primeiros sintomas), e terciário, que ocorre na reabilitação.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 75
Por fim, estudamos o modelo sistêmico, para o qual um desequilíbrio entre os fatores que
compõem o sistema epidemiológico, composto por agente causador (ou bioagente, se for
biológico), hospedeiro suscetível e ambiente, provoca alterações que podem levar à doença. Para
esse modelo, as relações entre o hospedeiro e o bioagente são conduzidas através da resistência
(tentativa de impedir a difusão dos agentes causadores), suscetibilidade (característica de cada
espécie) e imunidade (relação dependente de anticorpos de ação específica contra determinados
micro-organismos).
No próximo capítulo, aprenderemos formas de descrever as condições de saúde e doença

em populações através de indicadores, medidas de risco, diagnósticos e sistemas de vigilância
epidemiológica.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 76
CAPÍTULO 6
6 EPIDEMIOLOGIA DESCRITIVA
Como já vimos, a Bioestatística é uma ciência que se relaciona intimamente com a

Epidemiologia, pois através de seus métodos é possível identificar padrões e diferenças
significantes entre pessoas, grupos ou populações. Além das medições já estudas, dispomos de
outros indicadores e medidas que são típicos da Epidemiologia, que discutiremos nesse capítulo.
6.1 – INDICADORES DE SAÚDE COLETIVA
O conhecimento das condições de morbidade e mortalidade na população é essencial para a

promoção de ações de prevenção e o delineamento das políticas de saúde pública. Para ter acesso
a esse conhecimento é necessário medir a Saúde Coletiva, através indicadores de saúde. Esses
indicadores podem ser descritos a partir de valores absolutos ou relativos.
Os valores absolutos descrevem o número total de ocorrências de morbidade ou mortalidade.

Apresentados dessa forma, esses indicadores têm a desvantagem de reduzirem a capacidade de
comparação ao longo do tempo (pois o tamanho das populações oscila), bem como inviabilizam Valores
a comparação entre populações diferentes (pois podem apresentar uma quantidade muito absolutos –
número total
diferente). Por outro lado, os valores absolutos são úteis para a administração dos recursos da de ocorrências
saúde pública como, por exemplo, para a definição do número total de leitos ou de comprimidos
de um medicamento para uma determinada população.
Já os valores relativos são construídos a partir da relação entre dois fatores, como por exemplo,
número de mortes em relação a uma quantidade de pessoas. Dessa forma, os valores relativos
permitem comparar a realidade atual com algum ponto no passado ou comparar a realidade
entre as diversas populações. Contudo, para viabilizar essa comparação, é necessário seguir
uma padronização em relação à quantidade de pessoas. Por exemplo, suponha que você queira
BIOESTATÍSTICA E
EPIDEMIOLOGIA 77
descrever a mortalidade em sua cidade, para depois compará-la com a mortalidade medida para
o Brasil inteiro em números relativos. Apenas para facilitar os cálculos, vamos considerar que
nossa cidade possui 100.000 habitantes e que 300 morreram no último ano. Você poderia decidir
descrever o coeficiente de mortalidade com base em grupos de 1.000 habitantes. Nesse caso, você
pode dizer que o coeficiente ou taxa de mortalidade (alguns autores diferenciam taxa e coeficiente, Valores relativos
– proporção de
mas essa discussão ultrapassa o objetivo da nossa disciplina) para a sua cidade é igual 3 mortes ocorrências
por 1.000 habitantes. Para comparar com a taxa do Brasil inteiro, será necessário descrever o
número de mortes a cada grupo de 1.000 habitantes também. Para seu conhecimento, ocorrem
no Brasil pouco mais de 1 milhão e 200 mil mortes por ano, o que significa aproximadamente 6
mortes a cada grupo de mil habitantes.
Os indicadores de saúde coletiva podem ser muito abrangentes, assim como o próprio
conceito de saúde. Entre outros, podemos nos deparar com indicadores de saúde ambiental,
tais como os que descrevem as condições de saneamento básico, qualidade do ar e acesso à
água tratada, e indicadores de serviços de saúde, tais como taxas de profissionais de saúde ou
leitos hospitalares por grupos de população e acesso aos serviços de saúde básica. Contudo,
os indicadores mais importantes e que estão de acordo com nossos objetivos nesse curso de
Bioestatística e Epidemiologia são aqueles que se referem diretamente às condições de saúde
e doença de indivíduos ou populações como, por exemplo, taxas de mortalidade e morbidade.
Vejamos a seguir algumas características específicas dessas taxas para as populações de interesse.
6.1.1 Morbidade
Morbidade, que como já vimos expressa a condição de doença, pode ser descrita através de
coeficientes ou taxas que medem o risco de uma pessoa adoecer. Os coeficientes de prevalência e
de incidência (se ainda tiver dúvida sobre esses termos, revise o item 4.3) são expressos de acordo
com as equações a seguir:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 78
Vamos a um exemplo: imagine que você queira descrever a prevalência e a incidência de anemia
numa população, digamos entre os moradores da sua rua (vamos considerar, para facilitação dos
cálculos, 100 pessoas). Para isso, você descobriu que hoje há 3 moradores com anemia e que no
mês passado, 5 moradores foram diagnosticados com a doença (é possível que a prevalência seja
menor que a incidência porque a condição de anemia é facilmente reversível com alimentação
e suplementação adequadas). Com esses dados, já é possível calcular as taxas de prevalência e
incidência da anemia na sua rua.
Geralmente os valores são frações bem pequenas (como de fato aconteceu no nosso exemplo),
pois os indicadores representam uma parcela da população que tem a condição expressa. Se toda
a população fosse acometida pela anemia, por exemplo, teríamos como taxa de prevalência ou
incidência um valor igual a 1, significando que 100% da população de interesse está acometida
pela condição. Por esse motivo, os valores de incidência e prevalência, tanto nas apresentações
de morbidade quanto nas apresentações de mortalidade, são multiplicados por uma potência
de 10 adequada à descrição (essa potência representa o tamanho do grupo que pretendemos
descrever). No exemplo acima, poderíamos multiplicar por 102 (ou seja, 100) para termos um
valor mais facilmente compreensível. Veja como ficaria a taxa de prevalência (o exemplo pode ser
aplicado igualmente à taxa de incidência):
Ou seja, temos 3 pessoas anêmicas para cada grupo de 100 moradores. Contudo, você pode
querer comparar com uma cidade que apresentou 25 pessoas anêmicas a cada 1.000 moradores.
Nesse caso, você deverá multiplicar pela potência de 10 adequada (ou seja, 103 = 1.000). Sendo
assim,
BIOESTATÍSTICA E
EPIDEMIOLOGIA 79
Sua rua poderia ser descrita como tendo 30 pessoas anêmicas a cada grupo de 1.000 moradores
(e descobrir que a taxa de prevalência de anemia na sua rua é maior que na cidade). As fórmulas
gerais para o cálculo de taxas de prevalência e incidência são:
onde “n” é a potência adequada à descrição dos dados de acordo com sua escala. Para
informação, o Instituto Brasileiro de Geografia e Estatística (IBGE) utiliza 10 elevado à potência 3
para descrever a taxa de mortalidade geral no Brasil (ou seja, multiplicado por 1.000, como vimos
no item 6.1).
Considerando que as condições de doença são variadas, podemos descrever as taxas ou

coeficientes em diversos níveis, conforme a gravidade ou infecção, por exemplo. Para determinada
população de possíveis hospedeiros suscetíveis, alguns serão expostos ao agente causador da
doença (pode ser um patógeno ou um agente físico, entre outros). Desses indivíduos que foram
expostos, nem todos serão infectados devido a uma série de fatores, como a duração da exposição
ou quantidade e eficiência do agente causador. Mesmo entre os infectados, somente uma fração
ficará efetivamente doente, pois uma parte conseguirá superar o desequilíbrio entre fatores,
através do sistema imunológico, por exemplo. Já entre os doentes, alguns serão considerados
graves e, por fim, entre os doentes graves, alguns morrerão. Para facilitar o entendimento, analise
a figura a seguir.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 80
Figura 8. Esquema representativo das proporções da população em relação aos diversos estágios da doença.
Fonte: ALMEIDA FILHO; ROUQUAYROL, 2013.
A partir dessas variadas condições, podemos descrever diversos coeficientes (muitos autores
têm a tendência de se referir a coeficientes quando tratam de indicadores mais restritos e taxas
quando tratam de indicadores mais gerais). Nesse contexto, o coeficiente de uma doença numa
dada população é igual ao número de doentes sobre essa população, multiplicado pela potência
de 10 adequada ao número de indivíduos, como já vimos. Outros indicadores mais específicos,
sejam de prevalência ou incidência (você já sabe a diferença, não é?), são:
ou seja, o coeficiente de incidência ou de prevalência de infecção representa a proporção de

pessoas infectadas (e não somente as doentes) na população de interesse.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 81
ou seja, a patogenicidade (incidência ou de prevalência) representa a proporção de pessoas
efetivamente doentes entre as infectadas (e não mais somente sobre a população).
ou seja, a virulência representa a proporção de doentes graves entre todos os doentes.
ou seja, a letalidade da doença representa a proporção de óbitos entre os doentes (e não sobre
toda a população de interesse; se fosse assim, seria a taxa de mortalidade, como veremos a seguir).
6.1.2 Mortalidade
Assim como a morbidade mede a proporção de doentes numa população, as taxas de

mortalidade medem os óbitos na população. A taxa mais abrangente é a mortalidade geral
(independente da causa, idade ou outras condições) sobre a população geral. Tipicamente, o
valor resultante é multiplicado por 103, como podemos observar no caso desse indicador para o
Brasil, que apresentou uma taxa de mortalidade geral próxima de 6 mortes a cada grupo de mil
pessoas em 2016:
VAMOS REFLETIR:
Você consegue identificar a diferença entre taxa de mortalidade geral e taxa de
letalidade, estudada no item anterior?
BIOESTATÍSTICA E
EPIDEMIOLOGIA 82
Esta taxa apresenta variações de acordo com a composição da população por idade. Por esta
razão, alguns países subdesenvolvidos apresentam valores próximos aos valores observados em
países desenvolvidos, onde há uma grande proporção de pessoas idosas (que apresentam uma
taxa de mortalidade específica maior que a dos jovens). Para resolver esse problema, é possível
determinar um cálculo de mortalidade mais específico por faixas etárias (por exemplo, de 0 a 10
anos, de 10 a 20 anos, e assim por diante) e calcular a média entre esses indicadores. Em nossos
exercícios e avalições não será necessário chegar a esse nível de detalhamento, razão pela qual
não haverá uma taxa de mortalidade ajustada pela idade em nossos exemplos.
Algumas taxas específicas de mortalidade são utilizadas largamente e,
Algumas taxas específicas de mortalidade são utilizadas largamente e, por isso, seu Taxa de
por isso, seu entendimento é muito importante para a compreensão da ciência
entendimento é muito importante para a compreensão da ciência epidemiológica. Entre mortalidade
epidemiológica. Entre eles, destaca-se a taxa de mortalidade infantil geral, que infantil neonatal
eles, destaca-se a taxa de mortalidade infantil geral, que pode ser desmembrada em taxa de – óbito em até
pode ser desmembrada em taxa de mortalidade infantil precoce ou neonatal 28 dias de vida
mortalidade infantil precoce ou neonatal (quando ocorre a morte do recém-nascido em até 28
(quando ocorre a morte do recém-nascido em até 28 dias) e taxa de mortalidade Taxa de
dias) e taxa de mortalidade infantil tardia ou pós-neonatal (óbitos entre 28 dias e um ano de vida). mortalidade
infantil pós-
infantil tardia ou pós-neonatal (óbitos entre 28 dias e um ano de vida). As taxas neonatal – óbito
As taxas de mortalidade infantil são mais adequadas para representar a qualidade de saúde de
entre 28 e 365
depopulação,
uma mortalidade
comoinfantil são no
se verifica mais adequadas
gráfico parasão
a seguir (todas representar a qualidade
taxas de mortalidade degeral,
infantil dias de vida
saúde
com base de umadepopulação,
no ano 2014): como se verifica no gráfico a seguir (todas são taxas
de mortalidade infantil geral, com base no ano de 2014):
Taxa de mortalidade infantil geral

óbitos (entre 0 e 1 ano) *103
nascidos vivos
120
100
80
60
40
20
0
Mônaco Japão Noruega Brasil Zâmbia Somália Afeganistão
TMI geral (2014)
Figura 9. Taxas
Figura de mortalidade
9. Taxas infantil geral
de mortalidade de 3 geral
infantil paísesde
de 3baixa renda,de3 baixa
países países renda,
de alta renda e o Brasil
3 países (renda
de alta média-
renda
e o Brasil
-baixa), 2014. (renda média-baixa), 2014.
Fonte: o autor.
Fonte: o autor.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 83
Além das taxas de mortalidade infantil neonatal e pós-neonatal, há outras taxas ou
coeficientes menos utilizados, mas que podem ser úteis em casos específicos. Por exemplo, se
você deseja investigar as condições de assistência pré-natal ou de saúde e nutrição materna, pode
utilizar o coeficiente de mortalidade perinatal, que calcula o número óbitos fetais a partir de 22
semanas completas de gestação, acrescidos dos óbitos neonatais precoces (de 0 a 6 dias) sobre os
nascimentos totais. Ou ainda se você deseja identificar a incidência ou prevalência de anomalias
fetais, pode utilizar o coeficiente de natimortalidade, que representa a proporção de nascidos
mortos sobre o total de nascidos (mortos e vivos). Na realidade, dependendo do seu objeto de
estudo, você pode utilizar o indicador que melhor descrever seus dados. O importante é que você
já está familiarizado com as taxas de mortalidade, assim como com as de morbidade, e apto a
utilizá-las, pois todas têm o mesmo princípio: calcular proporções de mortes ou doenças sobre
grupos de pessoas.
6.2 – MEDIDAS DE ASSOCIAÇÃO
As medidas de associação permitem que o pesquisador em Epidemiologia identifique fatores

de risco ou fatores de proteção a partir das ocorrências proporcionais de saúde ou doença em
grupos de indivíduos expostos a um fator e em grupos de indivíduos não-expostos ao mesmo
fator. Por exemplo, você pode querer descobrir se fumar é fator de risco ou de proteção para
câncer de boca. Para isso, poderia utilizar os dados para calcular uma medida de associação.
Mas antes de tudo, será necessário definirmos o tipo de estudo feito, pois isso definirá a medida
adequada.
Entre os principais estudos relacionados à Epidemiologia, podemos citar o estudo de coorte

e o estudo de caso-controle (observacionais). Resumidamente, um estudo de coorte é aquele em
que o pesquisador acompanha um grupo que possui características, experiências ou condições
semelhantes. No exemplo da determinação do cigarro como fator de risco ou de proteção para
câncer de boca, um estudo de coorte típico envolveria o acompanhamento de dois grupos
semelhantes, com exceção da condição de fumante ou não-fumante. Perceba que no estudo de
coorte, a doença ainda não está presente. Após um determinado período, digamos cinco anos, o
pesquisador contabiliza o número de pessoas do grupo fumante que adquiriram câncer de boca,
assim como o número de pessoas do grupo não-fumante que adquiriram câncer de boca.
Apesar de ser muito útil, nem sempre é possível realizar um estudo de coorte, devido ao
BIOESTATÍSTICA E
EPIDEMIOLOGIA 84
tempo de espera ser tipicamente longo. Uma solução seria conduzir um estudo de caso-controle,
quando a doença já está presente e o pesquisador procura um grupo que possui a condição a
ser testada (no nosso exemplo, ser fumante) e compara com um grupo (que será chamado de
controle) que não possui a condição a ser testada (não-fumante, no nosso exemplo). Perceba que
nesse caso, não é necessário aguardar o adoecimento dos participantes, sendo necessário apenas
comparar a incidência dos expostos ao fator, com a incidência dos não-expostos ao fator.
6.2.1 – Risco relativo e risco atribuível
Quando trabalharmos com estudos de coorte, devemos utilizar o risco relativo e o risco
atribuível para indicar se o fator a ser testado é de risco ou de proteção. O risco relativo (RR)
indica a probabilidade de um indivíduo ser acometido de uma doença ser for exposto a um fator
e é calculado dividindo-se a proporção de doentes expostos pela proporção de doentes que não
foram expostos ao fator, ou seja,
Para se descobrir a incidência de expostos, basta dividir o número de doentes do grupo

exposto pelo número total do grupo exposto. Da mesma forma, para se descobrir a incidência
de não-expostos, basta dividir o número de doentes do grupo não-exposto pelo número total do
grupo não-exposto. Sendo assim, podemos desenvolver melhor a fórmula, que ficaria
Se você achar complicado calcular o risco relativo dessa forma, há uma maneira alternativa
que poderá lhe ajudar. Para trabalhar com a nova maneira, será necessário construirmos uma
tabela 2 X 2, muito útil ao estudo de Epidemiologia.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 85
Tabela 11. Esquema geral de uma tabela para dois grupos e duas condições.
Exposto Não-exposto Total

Doente a b a+b
Não doente c d c+d
Total a+c b+d a+b+c+d
Fonte: o autor.
Na Tabela 11 podemos perceber que o total de expostos (a + c) é composto por alguns indivíduos
que ficaram doentes (a) durante a pesquisa (lembre-se que se trata de um estudo de coorte) e que
não ficaram doentes (c), assim como ocorre com os não-expostos. Também podemos perceber
que o total de doentes (a + b) é composto por indivíduos do grupo exposto (a) e do grupo não-
exposto (b). Sendo assim, podemos reescrever a fórmula do risco relativo da seguinte maneira
Vamos utilizar essa última maneira para calcular um exemplo. Suponha que você acompanhou
50 fumantes e após 5 anos, contabilizou 2 pessoas com câncer de boca. No outro grupo, era
composto por 200 pessoas que não fumam, você contabilizou no final do mesmo período 4
pessoas com câncer de boca. Dessa maneira, antes de calcular o risco relativo do cigarro para
câncer de boca, vamos preencher a tabela:
Tabela 12. Distribuição de expostos e não-expostos ao fumo em função da ocorrência ou não

de câncer de boca em estudo de coorte.
Fumante Não fumante (não-

Total
(exposto ao fator) exposto)
Com câncer de boca 2 4 2+4=6
Sem câncer de boca 48 196 48 + 196 = 244
Total 50 200 6 + 244 = 250
Fonte: o autor.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 86
Substituindo com os dados tabelados, temos
O valor do risco relativo determina se o fator é de risco ou de proteção da seguinte maneira:
GG RR = 1, não há qualquer associação (o fator não é de risco nem de proteção);
GG RR > 1, fator de risco;
GG RR < 1, fator de proteção.
Sendo assim, considerando que o RR calculado foi igual a 2 (e que os dados são verdadeiros),
o hábito de fumar é um fator de risco para o aparecimento de câncer de boca. Além disso, o risco
relativo calculado indica quantas vezes é mais provável ser acometido da doença se for exposto
ao fator. Nesse caso, é duas vezes mais provável ser acometido pelo câncer de boca se o indivíduo
for fumante, em relação ao indivíduo que não fuma.
Agora que já sabemos calcular o risco relativo, fica bastante fácil calcular o risco atribuível
(RA), que também pode ser usado em estudos de coorte. Enquanto o risco relativo indica a
probabilidade de ser acometido por uma doença se alguém for exposto a um fator, o risco
atribuível indica a probabilidade adicional de alguém ser acometido por uma doença se for
exposto ao fator. Sua fórmula é:
Voltando ao nosso exemplo, onde já havíamos calculado a incidência de expostos ao fumo

(0,04) e a incidência de não-expostos (0,02), podemos calcular diretamente o risco atribuível:
Ou seja, fumar adiciona um risco de 0,02 (ou 2%) às chances de um indivíduo ser acometido
por câncer de boca. Perceba que mesmo que alguém não fume, tem uma probabilidade de adquirir
a doença (nesse caso, 0,02). Contudo, se esse mesmo alguém faz uso do cigarro, ele adiciona uma
BIOESTATÍSTICA E
EPIDEMIOLOGIA 87
probabilidade igual ao risco atribuível à sua chance de ser acometido pela doença.
6.2.2 – Razão de chances ou Odds Ratio
Já quando formos trabalhar com estudos de caso-controle, não podemos utilizar o risco
relativo e o risco atribuível. Nesse caso, devemos utilizar a razão de chances (mais comumente
vista com seu nome em inglês, odds ratio). Vamos utilizar a mesma tabela 2 X 2 que facilitará o
exemplo (nas avaliações, os dados estarão dispostos em tabelas 2 X 2 se houver necessidade de
calcular RR, RA ou odds ratio).
Tabela 13. Distribuição de expostos e não-expostos ao fumo em função da ocorrência ou não

de câncer de boca em estudo de caso-controle.
Fumante Não fumante

Total
(exposto ao fator) (não-exposto)
Com câncer de boca 2 4 2+4=6
Sem câncer de boca 48 196 48 + 196 = 244
Total 50 200 6 + 244 = 250

Fonte: o autor.
Considerando que agora estamos trabalhando com um estudo do tipo caso-controle, no qual
escolhemos aletoriamente 250 pessoas e contamos quantos tinham câncer de boca e quantos
fumavam, devemos calcular a razão de chances ou odds ratio (OR). Considerando os parâmetros
da Tabela 11 (esquema padrão), a fórmula do OR é
Calculando OR com os dados do nosso exemplo, temos
BIOESTATÍSTICA E
EPIDEMIOLOGIA 88
Aprendizagem.
Um odds ratio maior que 1 também significa que o fator contribuiu para o desenvolvimento
da doença. Perceba que não podemos falar em risco, pois em estudos de caso-controle a doença
já está instalada.
6.3 – TESTES DIAGNÓSTICOS
A identificação dos casos de doenças é de fundamental importância para a pesquisa e a

ação epidemiológica. Cada condição de saúde-doença pode ser diagnosticada por uma série de
testes que são mais ou menos eficazes em diagnosticá-la. Essa eficiência está relacionada, entre
outros fatores, ao custo e à disponibilidade dos recursos e, por isso, geralmente os testes mais
eficientes são mais caros. O teste diagnóstico que identifica mais eficazmente uma condição de
saúde-doença é chamado de teste padrão-ouro. Em teoria, o teste padrão-ouro identifica todas
as ocorrências positivas e negativas para a condição específica. Por outro lado, testes alternativos
estão mais disponíveis, mas identificam apenas uma porcentagem dessas ocorrências.
Por exemplo, podemos dizer que o teste padrão-ouro para verificação da presença de cárie
nas crianças em idade escolar é o exame clínico associado a um exame de imagem, feito por um
odontólogo. Nesse caso, supomos que nenhuma cavitação passará despercebida (identificação
de casos positivos para a doença) e todos os dentes hígidos serão identificados como livres de
cárie (identificação dos casos negativos para a doença). Contudo, suponha que você decida fazer
um estudo epidemiológico para verificar a ocorrência de cárie dentária nas crianças em idade
escolar das escolas públicas do seu município, a fim de realizar uma ação de promoção, proteção
ou recuperação da saúde, com base nos resultados. Infelizmente, dificilmente você conseguiria
dispor de odontólogos e exames de imagens para todas as crianças em um prazo adequado
para sua pesquisa. Uma solução possível seria solicitar que os professores e professoras dessas
BIOESTATÍSTICA E
EPIDEMIOLOGIA 89
crianças verificassem a condição de doença (teste diagnóstico alternativo). Mas será que esse
diagnóstico alternativo seria eficaz?
Podemos verificar a eficiência de um teste alternativo através da validação dos testes

diagnósticos, utilizando valores que indicam a proporção de acertos e erros em relação ao teste
padrão-ouro. Na validação de testes diagnósticos, chamamos de sensibilidade a capacidade de
um teste identificar os verdadeiros casos positivos entre os doentes, enquanto a especificidade
mede a capacidade de um teste identificar os verdadeiros negativos entre os sadios. Além disso,
podemos medir a acurácia (lembra da Unidade 1?), calculando a proporção de acertos do teste
alternativo em relação aos erros, quando comparados com o testes padrão-ouro. Novamente
utilizaremos uma tabela 2 X 2 para facilitar a compreensão.
Tabela 14. Possíveis resultados de um teste alternativo em função dos resultados de um teste
padrão-ouro.
Teste alternativo Teste padrão-ouro

Presença da doença Ausência da doença
Positivo Verdadeiro positivo (VP) Falso positivo (FP)
Negativo Falso negativo (FN) Verdadeiro negativo (VN)
Total Total de doentes Total de sadios

Fonte: o autor.
Sendo assim, a sensibilidade (S) e a especificidade (E) são dadas por:
Já a acurácia é obtida por:
BIOESTATÍSTICA E
EPIDEMIOLOGIA 90
Vamos voltar ao exemplo da utilização dos professores como teste diagnóstico para a
presença de cárie. Para verificar a validade dessa alternativa, você selecionou aleatoriamente 20
diagnósticos dos professores e realizou o exame clínico e de imagem feito por odontólogos (teste
padrão-ouro), com os seguintes resultados: os dentistas identificaram 10 casos com a doença,
dos quais os professores descobriram apenas 7 e, dos 10 casos sem a doença, os professores
entenderam que, em um caso havia a doença. Os resultados foram colocados na Tabela a seguir,
para facilitar a compreensão.
Tabela 15. Resultados para validação do teste diagnóstico do exemplo do item 6.3.
Odontólogos + exame de imagem

Professores
Presença de cárie Ausência de cárie
Presença de cárie 7 (VP) 1 (FP)
Ausência de cárie 3 (FN) 9 (VN)
Total 10 10
Fonte: o autor.
Com os dados tabelados, vamos aos cálculos da sensibilidade (S), especificidade (E) e acurácia:
Sendo assim, o teste alternativo para a presença de cárie em crianças, representado pela
verificação dos alunos pelos professores e professoras tem uma sensibilidade de 0,7 (ou 70%
pois, como já vimos na Unidade 1, as proporções podem ser multiplicadas por 100 para obtermos
a porcentagem), uma especificidade de 0,9 (ou 90%) e uma acurácia de 0,8 (ou 80%).
BIOESTATÍSTICA E
EPIDEMIOLOGIA 91
Aprendizagem.
Considerando os resultados, você acha que é válido utilizar o teste alternativo para diagnosticar
cárie nas crianças do seu município? Os valores calculados foram altos e, considerando a
impossibilidade de alocar dentistas e exames de imagem para todas as crianças, fica claro que
professores e professoras podem substituir o teste padrão-ouro. Porém, não há uma regra geral
para determinar a validade de um teste diagnóstico, pois cada doença tem uma repercussão
específica. O que deve ser observado, entretanto, é que devemos escolher uma alta sensibilidade
quando a doença é grave e tratável, mas não pode passar despercebida. Já quando a doença é
incurável ou de difícil tratamento, deve-se optar por uma alta especificidade. Por fim, quando
uma doença grave for curável e houver consequências graves se forem identificados falsos
positivos e falsos negativos, deve-se priorizar uma alta acurácia.
6.4 – VIGILÂNCIA À SAÚDE
Vigilância é a observação contínua da distribuição de doenças. Isso é feito através da coleta

sistemática, consolidação e avaliação das informações de morbidade e mortalidade, entre outros
dados relevantes. A divulgação dessas informações viabiliza as ações governamentais e permite
que todos os interessados (pesquisadores, agentes públicos, imprensa, organismos internacionais
etc.) tenham acesso aos dados.
Todo sistema de vigilância à saúde deve ser permanentemente atualizado para ser efetivo. As
inovações científicas e tecnológicas, como banco de dados e sistemas informatizados, permitem
aumentar a abrangência e qualidade da informação, especialmente aquelas que têm importância
epidemiológica. A partir dessas informações, o SUS efetiva ações de promoção e proteção da
saúde, de natureza preventiva, cujo objetivo é reduzir fatores de risco que constituem ameaça à
saúde das pessoas, podendo provocar-lhes incapacidades e doenças. Entre as ações de promoção
da saúde, encontram-se a educação, a disseminação de bons padrões de alimentação e nutrição, a
adoção de estilos de vida saudáveis, o uso adequado e desenvolvimento de aptidões e capacidades,
os aconselhamentos específicos, como os de cunho genético e sexual, entre outras. Já as ações de
BIOESTATÍSTICA E
EPIDEMIOLOGIA 92
proteção incluem vigilância epidemiológica, vacinações, saneamento básico, vigilância sanitária,
exames médicos e odontológicos periódicos.
Nem sempre a ação preventiva é capaz de mitigar o surgimento de enfermidades. Quando

isso acontece, as informações de vigilância à saúde também subsidiam ações de recuperação,
que envolvem o diagnóstico e o tratamento de doenças, acidentes e danos de toda natureza,
além da invalidez e a reabilitação. Alguns exemplos de ações de recuperação: consultas médicas
e odontológicas, vacinação, atendimento de enfermagem, exames diagnósticos e tratamento,
inclusive em regime de internação. Todas essas ações têm que ser planejadas a partir de estudos
epidemiológicos para que sejam definidas as prioridades de prevenção (priorizando grupos de
risco, por exemplo), cobertura e concentração de ambulatórios e hospitais etc. Por sua vez, esses
estudos dependem de dados de todo o sistema de saúde, obtidos principalmente através de
sistemas de informação em saúde.
6.4.1 - Sistemas de Informação em Saúde (SIS)
SIS são conjuntos de unidades de produção, análise e divulgação de dados de saúde em geral,
com atuação integrada e articulada, para que sejam atendidas as demandas de serviços de saúde
pela população, bem como para que sirva de auxiliar no gerenciamento dos recursos, com a
finalidade de maior aproveitamento e melhores resultados.
O mais importante SIS é o Sistema de informação de agravos de notificação (Sinan), que é

alimentado pela notificação e investigação de casos de doenças e agravos que constam da lista
nacional de doenças de notificação compulsória. Entre essas doenças, estão incluídas suspeitas
ou confirmações de botulismo, cólera, raiva humana, febre amarela, poliomielite e sarampo.
Também são incluídos surtos ou casos com muitas ocorrências associadas de difteria, influenza
humana ou agravos inusitados. Também é possível que os municípios incluam outros problemas
de saúde que sejam importantes no nível local. Por esse motivo, o número de doenças e agravos
contemplados pelo Sinan vem aumentando progressivamente e ajudando a expressar as diferenças
regionais de perfis de morbidade. A entrada de dados no Sinan é feita mediante a utilização de
três formulários: a Ficha individual de notificação, preenchida para cada ocorrência, a Ficha
individual de investigação (identificação da fonte de infecção e dos mecanismos de transmissão)
e a Notificação negativa (indica que, apesar de não haver a ocorrência da doença, a equipe de
vigilância epidemiológica está alerta).
BIOESTATÍSTICA E
EPIDEMIOLOGIA 93
Outra fonte importante de dados epidemiológicos e o Sistema de informação sobre
mortalidade (SIM), que é alimentado pelas declarações de óbito expedidas pelos médicos. As
informações contidas nessas declarações possibilitam o delineamento do perfil de morbidade
de uma área, no que diz respeito às doenças mais letais e às doenças crônicas não sujeitas à
notificação compulsória, representando, na prática, a única fonte regular de dados. Para as
doenças de notificação compulsória que levaram a óbito, a utilização eficiente dessa fonte de
dados depende da verificação da presença desses agravos no banco de dados do Sinan. Também
é possível calcular a mortalidade proporcional por causas, faixa etária, sexo, local de ocorrência
e residência, letalidade de agravos dos quais se conheça a incidência, bem como taxas de
mortalidade geral, infantil, materna ou por qualquer outra variável contida na declaração de óbito,
pois são disponibilizadas várias formas de cruzamento dos dados. Entretanto, em muitas áreas, o
uso dessa rica fonte de dados é prejudicado pelo não preenchimento correto das declarações. Por
isso, é necessário realizar uma análise crítica dos dados, para evitar registro excessivo de causas
mal definidas, causas perinatais em adultos, causas exclusivas de um sexo sendo registrada em
outro etc.
Diversos outros sistemas de informação específica estão disponíveis e podem ser acessados
por gestores ou pesquisadores. Entre eles podemos citar o Sistema de informações sobre nascidos
vivos (Sinasc), que fornece dados para riscos à saúde materna e infantil; o Sistema de informações
hospitalares (SIH/SUS), que reúne aproximadamente 70% dos internamentos no país; o Sistema
de informações de vigilância alimentar e nutricional (Sisvan), que monitora o estado nutricional
dos diversos grupos populacionais; entre tantos outros.
A distribuição de agravos à saúde, bem como a identificação de diferentes padrões de

morbimortalidade entre indivíduos ou populações é o objeto principal da Epidemiologia
descritiva, pois seu conhecimento permite a promoção de ações de prevenção e orienta as
políticas públicas de saúde.
Os indicadores de saúde coletiva, que podem ser apresentados em valores absolutos (úteis
para a administração dos recursos da saúde) ou relativos (úteis para comparações temporais e
geográficas), são os principais instrumentos utilizados para descrever os padrões de saúde e
doença em populações. Existem uma grande diversidade de indicadores, que podem ser usados
BIOESTATÍSTICA E
EPIDEMIOLOGIA 94
em situações específicas, de acordo com a pesquisa ou divulgação que você pretende fazer. Em
geral, podemos dividi-los em indicadores de morbidade (e.g. patogenicidade, infecção, virulência,
letalidade etc.) e de mortalidade (e.g. infantil neonatal e pós-neonatal, materna, geral etc.).
Já as medidas de associação, são instrumentos que descrevem o risco em grupos de indivíduos

que estão expostos ou não a fatores físicos, químicos, biológicos ou sociais. Você aprendeu que,
quando a descrição do risco for referente a um estudo de coorte (acompanhamento de grupos
formados de acordo com características escolhidas), poderá utilizar o risco relativo (indicador
da probabilidade de um indivíduo ser acometido pela enfermidade, conforme a característica)
e o risco atribuível (risco adicional atribuído à característica). Essas medidas não são úteis para
estudos de caso-controle (quando um grupo já tem a doença instalada e é comparado ao grupo
controle); nesse caso, é necessário calcular a razão de chances (ou odds ratio). Em ambas as
situações, um valor da medida de associação maior que 1, indica que a característica escolhida
para ser testada contribui para o desenvolvimento da doença.
Outra importante ferramenta para a identificação de casos de agravos à saúde é o teste

diagnóstico. Infelizmente, os testes mais eficientes (chamados de padrão-ouro) não estão sempre
disponíveis para toda a população e, por isso, é necessária a utilização de testes alternativos.
Contudo, esses testes alternativos têm que apresentar uma acurácia adequada, que pode ser
calculada através da validação de testes diagnósticos. Para isso, é necessário que o pesquisador
descubra a proporção de acertos nos testes alternativos em relação aos acertos do teste padrão-
ouro. Outras características desejáveis dos testes são a sensibilidade (que representa sua
capacidade de identificar os verdadeiros casos positivos entre os doentes) e a especificidade
(capacidade de identificar os verdadeiros negativos entre os indivíduos sadios). É importante
ressaltar que cada doença tem uma repercussão específica e, por isso, não há uma regra geral
para se determinar o nível de sensibilidade ou especificidade mínimo para se validar um teste
alternativo; contudo, é recomendável que haja uma alta sensibilidade quando a doença a ser
testada é grave e tratável, e que haja uma alta especificidade quando a doença for incurável ou de
difícil tratamento.
Ainda estudamos neste capítulo as noções básicas de vigilância à saúde, que é a observação
contínua da distribuição das doenças, com a finalidade de promover a saúde da população (através
de educação, segurança alimentar e nutricional, entre outras ações), proteger a saúde (vacinação,
exames etc.) e recuperar (consultas, diagnósticos, internação etc.). Os sistemas de informação
em saúde são os instrumentos de produção, análise e divulgação dos dados da saúde coletiva
que orientam as ações da vigilância em saúde. Entre os principais, podemos citar o Sistema de
informação de agravos de notificação (Sinan, responsável pela divulgação e investigação de doenças
de notificação compulsória), o Sistema de informações sobre mortalidade (SIM, alimentado pelas
declarações de óbitos), o Sistema de informações sobre nascidos vivos, o Sistemas de informações
BIOESTATÍSTICA E
EPIDEMIOLOGIA 95
hospitalares do SUS e o Sistema de informações de vigilância nutricional e alimentar.
No próximo capítulo, estudaremos as estruturas e características epidemiológicas das doenças

(ou o processo epidêmico), em função do tipo de agente causador.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 96
CAPÍTULO 7
7 PROCESSO EPIDÊMICO
O processo epidêmico representa o estudo de variações nas ocorrências de agravos à saúde

através do conhecimento da estrutura e das características epidemiológicas de cada doença.
Essa estrutura representa a forma de interação dos diferentes fatores da doença relativos ao
meio ambiente, hospedeiro e ao agente (seja ele químico, físico ou biológico), que determina
o comportamento desse agravo no âmbito de uma população delimitada e num período de
tempo estabelecido. Já as características epidemiológicas da doença constituem as repercussões
resultantes da estrutura epidemiológica em cada momento e se expressa pela frequência e
distribuição da doença na população em determinado instante, segundo as variáveis tempo,
espaço e agente.
É importante ressaltar que a estrutura epidemiológica tem um caráter dinâmico, modificando-

se no tempo e no espaço. Portanto, o comportamento da distribuição espacial e temporal de uma
enfermidade pode variar, sem que isso signifique uma alteração importante na sua forma de
interagir com os fatores, pois flutuações cíclicas ou sazonais ocorrem o tempo todo. Contudo,
dependendo da magnitude, considerando o local, a população atingida ou a época do ano, a
variação no número de casos pode significar uma alteração estrutural que merece investigação
e atuação dos envolvidos na promoção e proteção à saúde. Além disso, algumas doenças são tão
raras em determinadas populações, que um único caso merece uma investigação epidemiológica,
como por exemplo, poliomielite, peste ou ebola.
7.1 FREQUÊNCIA E DISTRIBUIÇÃO DAS DOENÇAS: EPIDEMIA E ENDEMIA
A quantidade de uma determinada doença que é normalmente encontrada na população

pode ser referenciada como sendo o nível endêmico dessa doença. Portando, endemia é quando
BIOESTATÍSTICA E
EPIDEMIOLOGIA 97
um agravo à saúde ou um agente infeccioso está constantemente presente, em uma prevalência Endemia: nível
constante de
(lembra do item 4.3?) também constante dentro de uma população, dentro de uma área geográfica uma doença em
uma população
definida. Um exemplo comum é o da febre amarela na região amazônica ou a malária em algumas
regiões da África, onde um número quase constante de infectados pode ser encontrado ao longo
de muitos anos.
Há outro conceito importante para caracterizar a distribuição espacial e temporal de uma

doença, que é o surto. O surto ocorre quando se verifica o início de uma determinada doença
em uma região específica. Essa doença não ocorria normalmente nessa região ou já ocorreu no
passado, mas há muito tempo não se registravam novos casos. Por exemplo, após muito tempo
sem casos de meningite, a Secretaria de Saúde de Balneário Camboriú registrou vários alunos Surto: início de
uma doença em
de uma escola com a doença. Esse início da dispersão da doença representou um surto de uma população
meningite em nossa cidade. Se esse surto não tivesse sido devidamente controlado e a meningite
se espalhasse por toda a cidade e região durante um período de tempo, falaríamos em epidemia
de meningite.
Quando o agente causador da doença atinge um número maior que o esperado ao acaso ou
maior que o nível endêmico dessa doença, ocorre a epidemia. O comportamento epidêmico de
um agravo à saúde representa uma elevação brusca do número de casos, ou seja, um excesso
em relação ao número normalmente esperado. Esse número de casos que indicam a presença
de uma epidemia poderá variar em função do agente, tipo e tamanho da população exposta,
experiência prévia ou ausência de exposição. Há diversas metodologias para o cálculo do valor
que determinará se a dinâmica da doença se transformou em epidemia. Para estabelecer os níveis
normais de enfermidades específicas, os gestores de saúde pública no Brasil e nos principais Epidemia: nível
da doença
países utilizam a média de doentes para o local e a época do ano. A partir desse valor, são somados acima do
esperado em
dois desvios-padrão (para ser mais preciso, 1,96; porém, como comentamos na Unidade 1, é uma população
frequente encontrarmos esse valor arredondado) e diminuídos dois desvios-padrão (você lembra
das medidas de variação e da curva normal, estudadas na Unidade 1?). Esse intervalo indica
que é esperado ao acaso essa variação para mais ou para menos. Se uma determinada doença
apresentar incidência ou prevalência que ultrapasse o valor estabelecido de dois desvios-padrão
acima da média para o local e a época, será considerada uma epidemia.
Vamos a um exemplo. No Nordeste do Brasil, em setembro de 2014, 500 casos de microcefalia

foram registrados (os valores reais foram alterados para facilitar os cálculos). A média para a
região, no mesmo mês era de 200 casos (nível endêmico da doença), com um desvio-padrão de
50 casos. Considerando a metodologia utilizada pelo Ministério da Saúde, a média (200 casos)
somada a dois desvios-padrão (2 X 50 = 100) é igual a 300 casos. Como o número de crianças
nascidas com microcefalia registrado foi maior que 300, essa patologia foi considerada uma
epidemia no Nordeste.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 98
É importante ressaltar que a epidemia não apresenta obrigatoriamente um grande número de
casos, mas um claro excesso de casos quando comparada à frequência habitual de uma doença
em uma localidade. Quando estudamos doenças muito raras, poucos casos já são suficientes para
ultrapassar o valor esperado e, portanto, para ser considerada uma epidemia. Você acha que se
fossem registrados 5 casos de ebola no Brasil, essa doença seria considerada epidêmica por aqui?
Provavelmente, sim. Talvez os dois primeiros casos representassem um surto, enquanto os casos
seguintes caracterizariam a epidemia.
Como vimos, um desequilíbrio entre o agente, o ambiente e o suscetível gera o aumento de

casos acima do esperado. Isso ocorre por um ou mais dos motivos a seguir:
GG aumento recente na virulência do agente causador da doença;
GG introdução do agente em uma população que não tinha contato com ele;
GG uma alteração no modo de transmissão, fazendo com que mais hospedeiros tenham contato
com o agente;
GG mudança na suscetibilidade do hospedeiro ao agente ou
GG fatores que aumentam a exposição e novas vias de entrada.
Você consegue pensar em um exemplo para cada motivo? No Ambiente

Virtual de Aprendizagem há exemplos para cada tipo.
Quando uma epidemia se espalha por vários países ou continentes, geralmente afetando um
grande número de pessoas, podemos falar em pandemia. Inicialmente, apenas agentes infecciosos
eram responsáveis por endemias, surtos, epidemias e pandemias. Atualmente, porém, doenças
não-transmissíveis também são responsáveis por esses eventos. Como exemplo, podemos citar Pandemia:
epidemia que
a epidemia de diabetes nos Estados Unidos ou a pandemia de obesidade em vários países (hoje atinge vários
países ou
em dia, mais pessoas morrem pelo excesso de ingestão calórica do que pela escassez). Uma das continentes
principais características determinantes da dinâmica de variação de casos de uma doença é
seu modo de transmissão e outros fatores relacionados à permanência do agente causador em
indivíduos e populações. Essas características, por sua vez, são dependentes do agente causador
dessas doenças, que estudaremos um pouco mais detalhadamente a seguir.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 99
7.2 EPIDEMIOLOGIA DAS DOENÇAS INFECCIOSAS
O modelo tradicional da tríade epidemiológica considera que as doenças infecciosas resultam

da interação entre agente, hospedeiro e ambiente. Mais especificamente, a transmissão ocorre
quando o agente causador da doença deixa o seu reservatório ou hospedeiro através de uma
via de saída, é transportado através de algum modo de transmissão (estudaremos alguns tipos
a seguir) e entra através de uma via apropriada para infectar um hospedeiro susceptível. Esta
sequência pode ser chamada de cadeia de infecção.
7.2.1 Reservatórios de agentes infecciosos
O reservatório de um agente infeccioso é o habitat em que o agente normalmente vive,

cresce e se multiplica. Os reservatórios incluem seres humanos, animais e meio ambiente. O
reservatório pode ou não ser a fonte a partir da qual um agente é transferido para um hospedeiro.
Por exemplo, o reservatório de Clostridium botulinum é o solo, mas a fonte da maioria das
infecções por botulismo é o alimento enlatado de forma imprópria que contém esporos de C.
botulinum. Muitas doenças infecciosas comuns têm reservatórios humanos, tais como aquelas
que são transmitidas de pessoa para pessoa, sem intermediários como, por exemplo as doenças
sexualmente transmissíveis, sarampo, caxumba, muitos patógenos respiratórios, entre outros.
Um caso interessante é o da varíola natural: como os seres humanos eram o único reservatório
para o vírus da varíola, a doença foi erradicada depois que o último caso humano foi identificado
e isolado.
Os reservatórios humanos podem ou não apresentar os efeitos da doença, pois podem

conviver com uma infecção assintomática, ou sem sintomas, mas que é capaz de transmitir o
patógeno a outras pessoas. Podemos relacionar alguns tipos de portadores humanos. Portadores
assintomáticos, passivos ou saudáveis são aqueles que nunca experimentaram sintomas, apesar
Portadores
de estarem infectados. Os portadores de incubação são aqueles que podem transmitir o agente humanos:
assintomáticos,
durante o período de incubação antes do início da doença clínica. Os portadores convalescentes de incubação,
convalescentes
são aqueles que se recuperaram de sua doença, mas permanecem capazes de transmitir para e crônicos
os outros. Os portadores crônicos são aqueles que continuam a abrigar um patógeno, como o
vírus da hepatite B ou Salmonella Typhi, o agente causador da febre tifóide, durante meses ou
BIOESTATÍSTICA E
EPIDEMIOLOGIA 100
mesmo anos após a infecção inicial. Esses portadores geralmente transmitem doenças porque
não percebem que estão infectados e, consequentemente, não tomarem precauções especiais
para prevenir a transmissão. As pessoas sintomáticas e que estão conscientes da sua doença, por
outro lado, são menos propensas a transmitir infecção, por uma série de motivos, tais como estar
muito doentes para circular e entrar em contato com muitos indivíduos, tomar precauções para
reduzir a transmissão, ou receber tratamento que limita a ação do agente da doença.
Os seres humanos também estão sujeitos a doenças que têm reservatórios de agentes
infecciosos em animais. Muitas destas doenças são transmitidas de animal para animal, com seres
humanos como hospedeiros acidentais. O termo zoonose refere-se a uma doença infecciosa que
é transmissível sob condições naturais de animais vertebrados a seres humanos. Muitas doenças
zoonóticas são conhecidas, como a brucelose (originada em vacas e porcos), antraz (ovelhas),
peste (roedores) e raiva (morcegos, guaxinins, cães e outros mamíferos). Outras enfermidades
recentemente identificadas em seres humanos, incluindo AIDS, infecção por ebola e SARS
(acrônimo inglês para Síndrome Respiratória Aguda Grave) provavelmente se originaram em
animais, embora esses hospedeiros ainda não tenham sido identificados.
Plantas, solo e água no ambiente também são reservatórios para alguns agentes infecciosos.
Muitos agentes fúngicos, como os que causam histoplasmose, vivem e se multiplicam no solo.
Os surtos de legionelose (forma grave de pneumonia) são muitas vezes rastreados através
do abastecimento de água em torres de resfriamento e condensadores evaporativos, que são
reservatórios Legionella pneumophila, o organismo causador.
7.2.2 Saída do agente infeccioso e modos de transmissão
Portal de saída é o caminho pelo qual um patógeno deixa seu hospedeiro e, normalmente,
corresponde ao local onde o patógeno está localizado. Por exemplo, os vírus influenza e
Mycobacterium tuberculosis saem do trato respiratório, o Schistosoma mansoni (esquistossomose)
acessa o ambiente através da urina, os vibriões da cólera a partir das fezes, o Sarcoptes scabiei
das lesões cutâneas da escabiose e um enterovírus causador de conjuntivite hemorrágica das
secreções conjuntivais. Alguns agentes sanguíneos podem sair atravessando a placenta da mãe
para o feto (rubéola, sífilis, toxoplasmose), enquanto outros saem através de cortes ou agulhas na
pele (hepatite B) ou transportados por artrópodes sugadores de sangue (malária).
Um agente infeccioso pode ser transmitido a partir do seu reservatório natural para um
BIOESTATÍSTICA E
EPIDEMIOLOGIA 101
hospedeiro susceptível de diferentes maneiras. Apesar de haver diferentes classificações para os
modos de transmissão, em geral elas se dividem em transmissão direta (por contato direto ou
propagação de gotículas) e indireta (transportada pelo ar, por veículos ou vetores mecânicos e
biológicos).
Na transmissão direta, um agente infeccioso é transferido de um reservatório para um

hospedeiro susceptível por contato direto ou propagação de gotículas. O contato direto ocorre
através do contato de pele com pele, beijo ou relações sexuais. O contato direto também se
refere ao contato com o solo ou vegetação que abrigam organismos infecciosos. Por exemplo,
a mononucleose infecciosa (conhecida como doença do beijo) e a gonorreia são disseminadas
de pessoa para pessoa por contato direto, enquanto a ancilostomíase (vermes) é espalhada pelo
contato direto com solo contaminado. Outra forma de transmissão direta é a dissipação de
gotículas ou aerossóis de curto alcance, produzidos por espirros, tosse ou até mesmo conversação.
A coqueluche e a infecção meningocócica são exemplos de doenças transmitidas de um doente
infeccioso a um hospedeiro susceptível por disseminação de gotículas.
A transmissão indireta ocorre quando há transferência de um agente infeccioso de um

reservatório para um hospedeiro por partículas de ar suspensas (diferentemente da transmissão
direta por gotículas de curto alcance), veículos (objetos inanimados) ou vetores (intermediários
vivos). A transmissão pelo ar ocorre quando os agentes infecciosos são transportados por núcleos
de pó ou gotículas suspensas no ar. A poeira transportada pelo ar inclui material que se assentou
em superfícies e novamente se tornou suspenso por correntes de ar, bem como partículas
Fômite: objeto
contendo agente transmissor sopradas pelo vento. Pequenas gotículas, de tamanho inferior a inanimado capaz
de absorver
5 micrômetros, podem permanecer suspensas no ar por longos períodos, bem como podem ser e transportar
agentes
sopradas a longas distância, em contraste com as gotículas de curto alcance (transmissão direta). infecciosos.
Os veículos que podem transmitir indiretamente um agente infeccioso incluem alimentos, água,
produtos biológicos (sangue) e fômites (objetos inanimados, como lenços, cama ou bisturis
cirúrgicos). Um veículo pode transportar passivamente um patógeno, como acontece com o
vírus da Hepatite A, ou o veículo pode propiciar um ambiente adequado para o crescimento e
multiplicação do agente que produz toxina, como acontece em produtos enlatados contaminados
com Clostridium botulinum (toxina botulínica).
Vetores são organismos vivos, tais como mosquitos e artrópodes, que podem transportar um
agente infeccioso através de meios puramente mecânicos ou podem permitir a manutenção e
reprodução desse agente. São exemplos de transmissão mecânica moscas carregando Shigella
em seus apêndices e pulgas de ratos carregando Yersinia pestis (peste) em seu intestino. Na
transmissão biológica, o agente causador geralmente sofre maturação em um hospedeiro
intermediário, antes de ser transmitido ao homem, como ocorre com a malária.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 102
7.2.3 Entrada do agente no hospedeiro
O portal de entrada refere-se à maneira pela qual um patógeno entra num hospedeiro
susceptível. Esse portal deve permitir acesso aos tecidos nos quais o patógeno irá se multiplicar
ou onde a toxina poderá agir. Os agentes infecciosos podem se utilizar do mesmo portal de
entrada e saída, como por exemplo o vírus da gripe, que sai do trato respiratório do hospedeiro de
origem e entra no trato respiratório de um novo hospedeiro, ou utilizar portais diferentes, como
por exemplo os muitos patógenos que causam gastroenterite seguem a chamada rota “fecal-oral”
porque saem do hospedeiro-fonte nas fezes, são levados em mãos inadequadamente lavadas para
um veículo, como comida, água ou utensílios, e entram em um novo hospedeiro através da boca.
Outros portais de entrada incluem a pele (ancilostomíase), mucosas (sífilis) e sangue (Hepatite B,
vírus da AIDS).
7.2.4 Hospedeiro suscetível
A ligação final na cadeia de infecção é um hospedeiro susceptível. A susceptibilidade de

um hospedeiro depende de fatores genéticos ou estruturais do indivíduo, assim como da sua
imunidade específica e outros fatores que afetam a capacidade do hospedeiro definitivo em
resistir à infecção ou limitar a patogenicidade. A composição genética de um indivíduo pode
aumentar ou diminuir a suscetibilidade. Um exemplo clássico é o de pessoas com traço de
anemia falciforme, que estão protegidas contra um determinado tipo de malária. Já a imunidade
específica refere-se a anticorpos protetores que são direcionados contra um agente específico.
Esses anticorpos podem se desenvolver em resposta a infecção prévia, a uma vacina ou a uma
toxina que foi desativada, mas mantém a sua capacidade para estimular a produção de anticorpos
ou ainda por transferência da placenta da mãe para o feto. Outros fatores não específicos que
defendem contra infecção incluem a pele, membranas mucosas, acidez gástrica, cílios no trato
respiratório, o reflexo da tosse e resposta imune inespecífica. Por outro lado, alguns fatores
podem aumentar a suscetibilidade à infecção por perturbar as defesas do hospedeiro, tais como
desnutrição, alcoolismo e doença ou terapia que prejudica a resposta imunológica inespecífica,
como a quimioterapia.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 103
7.2.5 Implicações para a saúde pública
O conhecimento das vias de saída e entrada dos patógenos, bem como dos seus modos de
transmissão fornece uma base para a determinação de medidas de controle apropriadas. Essas
intervenções dependem da dinâmica da infecção e são direcionadas para controlar ou eliminar o
agente na fonte de transmissão, proteger vias de entrada ou aumentar as defesas do hospedeiro.
Para algumas doenças, a intervenção mais adequada pode ser dirigida para controlar ou
eliminar o agente na sua fonte, como por exemplo, quando um paciente com doença transmissível
é tratado com antibióticos ou quando o solo é descontaminado ou isolado para evitar a dispersão
do agente.
Outras intervenções são direcionadas para o modo de transmissão, como acontece quando
um paciente infectado é isolado ou há a recomendação de evitar um tipo específico de contato
associado ao modo de transmissão, como aconteceu há alguns anos com a água benta que
transmitia H1N1 em igrejas católicas. A transmissão de agentes por veículos inanimados pode
ser interrompida pela eliminação ou descontaminação do objeto, enquanto que, para evitar a
transmissão fecal-oral, os esforços às vezes se concentram em reorganizar o ambiente para reduzir
o risco de contaminação no futuro e em mudar comportamentos, como o incentivo para que os
indivíduos lavem as mãos. Para doenças cujos agentes são transportados pelo ar, as estratégias
podem ser direcionadas para modificação da ventilação ou da pressão do ar, além de filtragem
e tratamento do ar. Por fim, para interromper a transmissão por vetores, as medidas podem ser
dirigidas para o controle da população desses vetores, tal como a pulverização de inseticidas para
reduzir a população de mosquitos.
Algumas estratégias que protegem os portais de entrada são simples e eficazes. Por exemplo,
mosqueteiros, repelentes e utilização de blusas e calças compridas para evitar picadas de
mosquitos que transmitem doenças ou uso de máscara e luvas, que se destinam a proteger o
dentista do sangue e outras secreções de um paciente, bem como para proteger o paciente do
dentista.
Outras intervenções priorizam o aumento das defesas do hospedeiro, como o uso profilático
de medicamentos antimaláricos, recomendado para visitantes de áreas endêmicas de malária,
que não previne a exposição por picadas de mosquito, mas evita que a infecção se estabeleça,
ou o uso de vacinas, que promovem o desenvolvimento de anticorpos específicos que protegem
contra a infecção. Em relação às vacinas, um conceito importante é o da imunidade de rebanho,
o qual sugere que, se uma proporção suficientemente alta de indivíduos em uma população é
BIOESTATÍSTICA E
EPIDEMIOLOGIA 104
resistente a um agente, então os poucos suscetíveis serão protegidos pela maioria resistente,
uma vez que o patógeno dificilmente encontrará um hospedeiro suscetível. A porcentagem
da população necessária para adquirir a imunidade de rebanho com a finalidade de prevenir
ou interromper um surto ou epidemia varia de acordo com a doença. Um perigo associado a
esse conceito é que, em populações altamente imunizadas, as poucas pessoas suscetíveis são
frequentemente agrupadas em subgrupos definidos por fatores socioeconômicos ou culturais.
Se o patógeno for introduzido em um desses subgrupos, pode ocorrer um surto ou epidemia. Na
prática, a imunidade de rebanho não impediu surtos de sarampo e rubéola em populações com
níveis de imunização tão elevados como 85% e 90% nos Estados Unidos nas últimas décadas.
7.3 – EPIDEMIOLOGIA DAS DOENÇAS NÃO-INFECCIOSAS
No início da Epidemiologia, o único foco de investigação eram as doenças infecciosas,

que eram a causa de elevadas taxas de morbidade e mortalidade. Contudo, após a revolução
científica nas Ciências da Saúde, ocorreu o controle desse tipo de doença. Essa revolução inclui
o uso generalizado de antibióticos e vacinas, o controle eficiente de vetores, a descontaminação
eficiente de veículos, entre outras medidas que promoveram o aumento da expectativa de
vida no mundo inteiro. Por outro lado, houve um incremento na incidência e prevalência de Transição
epidemiológica:
doenças não-infecciosas, tais como diabetes, obesidade e traumas, a ponto de transformar essas mudança no
perfil de morbi-
doenças em causa principal de mortalidade em quase todos os países, com raras exceções na mortalidade
África subsaariana. No Brasil, o aumento da violência e de acidentes de trânsito contribuiu ainda
mais para que houvesse a transição epidemiológica, que é a substituição da principal causa de
mortalidade, que antes era relacionada às doenças infecciosas, para doenças não-infecciosas.
Para termos uma ideia da dimensão dessa alteração, em 1930, 45,6% das mortes nas capitais dos
estados brasileiros foram em decorrência de doenças infecciosas e parasitárias; em 2010, esse
número foi de apenas 4,6%.
7.3.1 Características das doenças não-infecciosas
Como vimos, as doenças e agravos não-transmissíveis (DANT) ou não-infecciosas
BIOESTATÍSTICA E
EPIDEMIOLOGIA 105
compreendem todas aquelas que não são adquiridas por contato com um agente infeccioso
causador de doenças, nem por vetores ou veículos que o carregam, tampouco por contato com
pessoas infectadas. Esse grupo inclui uma variedade de agravos à saúde e tem grande repercussão
nos índices de saúde de qualquer país, inclusive no Brasil. Entre as características das DANT,
podemos citar um longo período de latência, com poucos ou nenhum sintoma. Além disso, a
evolução da doença é lenta, prolongada e permanente, com manifestações clínicas acontecendo
nos períodos de exacerbação e remissão. Em geral, as lesões celulares são irreversíveis, com
evolução para variados graus de incapacidade e morte. A seguir, vamos abordar alguns preceitos
básicos das principais DANT.
7.3.2 Doenças cardiovasculares
As doenças cardiovasculares, tais como infarto agudo do miocárdio (1º lugar) e acidente
vascular cerebral (2º lugar) são, de longe, a principal causa de morte nos países ocidentais,
incluindo o Brasil. Para esse grupo de doenças, o gênero é um fator preditivo bastante importante,
pois as taxas de mortalidade são maiores em homens do que em mulheres em todas as faixas
etárias.
Os principais fatores de risco para essas doenças são relacionados ao estilo de vida e incluem
a pressão arterial e o colesterol elevados, uso de tabaco e obesidade. Indivíduos que apresentam
em conjunto os três fatores, têm uma probabilidade 20 vezes maior de ser acometido por uma
doença cardiovascular.
7.3.3 Câncer
O que comumente chamamos de câncer, é representado por um conjunto de mais de 50

doenças relacionadas, que são responsáveis pela segunda causa de morte no planeta. A difusão
do teste de Papanicolau, aliado à redução no uso de cigarro e à vacinação contra o vírus do
papiloma humano (HPV) são fatores responsáveis pela redução do número de diagnósticos
de câncer no mundo todo. Contudo, o aumento da idade tem contribuído para uma maior
BIOESTATÍSTICA E
EPIDEMIOLOGIA 106
prevalência, principalmente entre os indivíduos mais idosos. Aproximadamente metade dos
homens e um terço das mulheres terão câncer ao longo da vida. Outro aspecto epidemiológico
importante é a redução de mortalidade para alguns tipos de doença, como o câncer de estômago
(- 35%) e o câncer cervical (- 29%); alguns tipos, como o câncer de pulmão em mulheres, não tem
apresentado nenhuma redução. Já os tipos que mais causam mortes são, em ordem decrescente:
câncer de pulmão, de estômago e de fígado.
Os fatores de risco para a doença são evitáveis, o que torna a prevenção uma ótima estratégia
para redução dos danos relacionados. Entre esses fatores estão o uso de cigarro e álcool, prática
sexual sem proteção, poluição, dieta (assim como obesidade) e infecções. Em relação às infecções,
18% dos cânceres no mundo são decorrentes da exposição a vírus, como o HPV, a bactérias, como
o H. pylori, e a parasitas.
7.3.4 Causas externas
Um grupo de ameaças à saúde da população tem se destacado, principalmente em países em

desenvolvimento, como o Brasil. Entre causas externas estão incluídas aquelas relacionadas à
violência e aos acidentes de trânsito (ambos os fatores são endêmicos no Brasil). Enquanto
agravos à saúde desse tipo têm diminuído sua prevalência em países desenvolvidos, como
a Suécia e o Japão, países em desenvolvimento sofrem com epidemias de violência. No Brasil,
aproximadamente 100.000 pessoas por ano morrem em decorrência apenas de acidentes
de trânsito e crimes violentos (valor que provavelmente está subvalorizado devido à falta de
estatísticas adequadas).
Os fatores de risco para crimes violentos não são específicos e, às vezes, difíceis de serem
identificados. Em geral, são considerados fatores de risco a desigualdade social, a baixa
escolaridade e a cultura (das 100 cidades mais violentas do mundo, aproximadamente 90 estão
na América Latina). Já para os agravos decorrentes de acidentes de trânsito, os fatores de risco são:
infraestrutura de trânsito deficiente, baixa tecnologia dos veículos mais vendidos (populares),
excesso de velocidade, uso de celulares e ingestão de álcool e outras drogas antes de dirigir.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 107
Neste último capítulo do nosso caderno estudamos o processo epidêmico que ocorre a partir
da interação entre os fatores que causam a doença e determina, entre outras coisas, a distribuição
e a frequência dos agravos à saúde. Em relação a essa distribuição, vimos que uma enfermidade
constantemente presente em uma determinada prevalência e região caracteriza uma endemia. Já
o início de uma doença em uma população, é chamado de surto. Quando a enfermidade atinge
um número maior que o esperado ao acaso para uma população específica, temos a epidemia
(que, quando se espalha para vários países ou continentes, torna-se uma pandemia).
Outro fator que determina a dinâmica do processo epidêmico é o tipo de agente causador
da doença. Por isso, também estudamos no capítulo 7 as características das doenças infecciosas
e não-infecciosas. Em relação às doenças infecciosas, aprendemos que a transmissão ocorre
quando o agente causador deixa o reservatório por meio de uma via de saída, é transportado
através de um meio de transmissão e entra no hospedeiro suscetível para infectá-lo. Os
reservatórios incluem animais não humanos (zoonoses), o meio ambiente (plantas, solo e
água) ou portadores humanos (que podem ser assintomáticos, de incubação, convalescentes ou
crônicos). A transmissão do agente infeccioso a partir do reservatório pode ser direta (contato
direto ou propagação de gotículas) ou indireta (vetores mecânicos ou biológicos, transportados
pelo ar ou outros veículos). Ao alcançar o hospedeiro suscetível, o patógeno pode entrar por
uma via que o possibilite acessar tecidos onde ele irá se multiplicar ou agir e provocar a doença,
dependo das condições de imunidade, genética e estrutural do indivíduo. O conhecimento da
cadeia de infecção é a base para a adoção de medidas de controle, que podem ser direcionadas
para controlar ou eliminar o agente na fonte de transmissão (e.g. descontaminação de solo, uso
de antibióticos), proteger vias de entrada (e.g. uso de máscaras e luvas) ou aumentar as defesas
do hospedeiro (e.g. uso de vacinas).
Nas últimas décadas, quase todos os países experimentaram uma transição epidemiológica
pois, com algumas raras exceções na África subsaariana, todos os países têm doenças não-
infecciosas como causas principais de mortalidade, ao contrário do que ocorria no início da
Epidemiologia. Essas doenças têm como características longos períodos de latência, com poucos
sintomas e evolução lenta, em geral. Contudo, as doenças não-infecciosas representam um
grupo variado de agravos à saúde e, por esta razão, decidimos abordar algumas características
específicas das principais enfermidades desse tipo. Isoladamente, a primeira causa de morte
na maior parte das populações, incluindo a brasileira, é a doença cardiovascular (infarto agudo
do miocárdio, acidente vascular cerebral, entre outras), que acomete mais os homens do que
as mulheres e tem como fatores de risco colesterol e pressão arterial elevados, uso de tabaco e
BIOESTATÍSTICA E
EPIDEMIOLOGIA 108
obesidade. Os cânceres também estão entre as principais causas de morte no mundo inteiro e
acometem mais idosos do que jovens e têm como fatores de risco o uso do tabaco e do álcool,
infecções (parasitas, HPV, H. pylori e outras bactérias), prática sexual sem proteção, poluição e má
alimentação. Por fim, discutimos um grupo de agravos à saúde que tem acometido principalmente
países em desenvolvimento, consumindo uma parcela significativa dos recursos da saúde, que
são as causas externas, representadas por acidentes (como os de trânsito, cujos fatores de risco
são infraestrutura ineficiente, excesso de velocidade, entre outros) e violência (como homicídios,
cujos fatores de risco podem ser desigualdade social, baixa escolaridade e cultura).
Chegamos ao final do nosso caderno de estudos e eu gostaria de parabenizar sua dedicação,

que é um atributo essencial para que seja alcançada uma aprendizagem significativa. Essa
aprendizagem certamente contribuirá para que você se torne um profissional de Saúde apto a ser
um agente transformador da nossa sociedade.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 109
REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA FILHO, N.; ROUQUAYROL, M.Z. Introdução à epidemiologia. 4.ed.,rev. e ampliada.

Rio de Janeiro: Guanabara Koogan, 2013.
BEAGLEHOLE, R. et al. Epidemiologia básica. São Paulo: Santos, 2010.
BUSSAB, W.O.; MORETTIN, P.A. Métodos quantitativos: estatística básica. São Paulo: Editora
Atual, 1987.
CALLEGARI-JACQUES, S.M. Bioestatística: princípios e aplicações. Porto Alegre: Artemed,

2003.
GREENLAND, S.; LASH, T.L.; ROTHMAN, K.J. Epidemiologia moderna. Porto Alegre: Artmed,
2011.
KATZ, D.L.; ELMORE, J.G.; JEKEL, J.F. Epidemiologia, bioestatística e medicina. Porto Alegre:
Artmed, 2005.
LEAVELL, H.; CLARK, E.G. Medicina preventiva. São Paulo: McGraw–Hill do Brasil, 1976.
RODRIGUES, V.P. et al. Conceitos e ferramentas de epidemiologia. São Luís: UFMA –

UNASUS, 2014. Disponível em < https://ares.unasus.gov.br/acervo/handle/ARES/1109>, acesso
em: 02 fev 2017.
ZAR, J.H. Biostatistical analysis. 5 ed. New Jersey: Prentice Hall, 2010.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 110
IPCC. Climate Change 2001: The Scientific Basis. Contribution of Working Group I to the Third
Assessment Report of the Intergovernmental Panel on Climate Change. Cambridge, United
Kingdom, and New York, United States, Cambridge University Press ISDR (1999), 2001.
PCC. Future Work of the IPCC: Chairman’s Vision Paper on the Future of the IPCC. IPCC, 2015.
LIMA, G. F. C. Educação ambiental e mudança climática: convivendo em contextos de incerteza e

complexidade. Ambiente & Educação . v. 18, 2013.
LOURENÇO-DE-OLIVEIRA R.; et al. Aedes aegypti in Brazil: Genetically differentiated populations with
high susceptibility to dengue and yellow fever viruses. Trans R Soc Trop Med Hyg. v. 98, n.1, p.43–54,
2004.
MARCELINO, E. V. Desastres naturais e geotecnologias: conceitos básicos. Santa Maria, RS: INPE,
2007.
MARENGO, J. A. Mudanças climáticas globais e seus efeitos sobre a biodiversidade: caracterização

do clima atual e definição das alterações climáticas para o território brasileiro ao longo do século
XXI. Brasília: MMA, 2006.
MELLO, L. L. Charges e cartuns sobre aquecimento global. 2014. Disponível em: <https://
pucsustentabilidade.wordpress.com/2014/10/02/charges-e-cartuns-sobre-aquecimento-global/>
Acesso em: 09, jan. 2017.
MENDONÇA, F. Aspectos da interação clima-ambiente-saúde humana: da relação sociedade-natureza

à (in) sustentabilidade ambiental. RA’E GA–O espaço geográfico em análise, v.4, n.4, p.85-100, 2000.
MILLER, B R.; BALLINGER, M. E. Aedes albopictus mosquitoes introduced into Brazil: vector competence
for yellow fever and dengue viruses. Trans R Soc Trop Med Hyg. v.82, n.3, p. 476–7, 1988.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 111
MONTEIRO, A. L.; BERTAGNI, R. F. S. Acidentes do Trabalho e Doenças Ocupacionais. Saraiva: São
Paulo, ed. 7, 2012.
MONTERO, R. 2007. Poluição, Cubatão - SP. Disponível em: <http://www.pbase.com/rickmoon/

image/157229622/original> Acesso em: 09, jan. 2017.
MORAIS, C. R. Dicionário de Saúde e Segurança no trabalho e Meio Ambiente. São Caetano do Sul:
Yendis, 2011.
MOUSINHO, P. Glossário. In: Trigueiro, A. (Coord.) Meio ambiente no século 21. Rio de Janeiro: Sextante.
2003.
NARDOCCI, A. C.; et al. Poluição do ar e doenças respiratórias e cardiovasculares: estudo de séries

temporais em Cubatão, São Paulo, Brasil. Cadernos de Saúde Pública, v. 29, n. 9, p. 1867-1876, 2013.
NICOLUSSI, F. H.; et al. Poluição do ar e doenças respiratórias alérgicas em escolares. Revista de Saúde
Pública, v. 48, n. 2, p. 326-330, 2014.
NOGUEIRA, D. P. Incorporação da saúde ocupacional à rede primária de saúde. Revista de saúde

pública, v. 18, n. 6, p. 495-509, 1984.
NUNES, T. Como a dengue é transmitida. 2016. Disponível em: <http://pontobiologia.com.br/como-a-

dengue-e-transmitida/> Acesso em: 09 jan. 2017.
O DIA. Polipílula combate hipertensão e colesterol. 2011. Disponível em: <http://odia.ig.com.br/

portal/cienciaesaude/polip%C3%ADlula-combate-hipertens%C3%A3o-e-colesterol-1.60707> Acesso
em: 09 jan. 2017.
O GLOBO. Entenda o acidente. 2015. Disponível em: < http://infograficos.oglobo.globo.com/brasil/

entenda-o-acidente.html> Acesso em: 09, jan. 2017.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 112
ODUM, E. P. Ecologia. Rio de Janeiro: Editora Guanabara, 1986.
OLIVEIRA, M. V. C.; CARVALHO, A. R. Princípios Básicos do Saneamento do Meio. São Paulo: SENAC,

2010.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Constituição da Organização Mundial da Saúde.

Nova Iorque, 1946. Disponível em: <http://www.direitoshumanos.usp.br/index.php/OMS-
Organiza%C3%A7%C3%A3o-Mundial-da-Sa%C3%BAde/constituicao-da-organizacao-mundial-da-
saude-omswho.html> Acesso em: 09 jan. 2017.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Dengue hemorrágica: diagnóstico, tratamento, prevenção e

controle. ed. 2, São Paulo; 2001.
ORGANIZAÇÃO MUNDIAL DA SAÚDE. Substâncias químicas perigosas à saúde e ao ambiente. São

Paulo: Cultura Acadêmica, 2008.
ORGANIZACIÓN PANAMERICANA DE LA SALUD. Dengue y dengue hemorrágico em las Américas,

guias para su prevención y controle. Publicacion Cientíﬁca nº 548, Washington; 2002.
PATZ, J. A., et al. Impact of regional climate change on human health. Nature, v. 438, n.7066, p. 310-317,
2005.
PEGORIM, J. O que é El Niño? 2016. Disponível em: < http://www.climatempo.com.br/noticia/2016/01/11/

o-que-e-o-el-nino--4068> Acesso em: 09 jan. 2017.
PEREIRA, S. D. Conceitos e definições da Saúde e Epidemiologia usados na Vigilância Sanitária.

Governo do estado de São Paulo, março de 2007.
RAU, K. (2012). Ocorrência de Equilíbrio Sustentável. Disponível em: <http://sustentabilidade-
BIOESTATÍSTICA E
EPIDEMIOLOGIA 113
tecnologica.blogspot.com.br/> Acesso em: 08, jan. 2017.
RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 1). Rev Perú
MedExp Salud Publica, v. 25, n.4, p.403-409, 2008.
RENGIFO CUELLER H. Conceptualización de la saludambiental: teoría y práctica (parte 2). Rev Perú
MedExp Salud Publica, v.26, n.1, p.66-73, 2009.
RIBAS, P. P., MATSUMURA, A. T. S. A química dos agrotóxicos: impacto sobre a saúde e meio ambiente.
Revista Liberato, v. 10, n. 14, p. 149-158, 2009.
RIBEIRO, M. D., et al. Estudo descritivo da ocorrência de dengue e suas relações com o clima e a ação da
vigilância em saúde no município de Franca, São Paulo, Brasil, 2007 a 2011. Investigação, v.14, n. 1, 2015.
RICKLEFS, R. E. A Economia da Natureza. Rio de Janeiro: Guanabara-Koogan, 5 ed., 2003.
ROCHA, H. Natal inicia Campanha de Vacinação contra raiva em cães e gatos.

2016. Disponível em: <http://hdviu.blogspot.com.br/2016/08/natal-inicia-campanha-de-
vacinacao.html> Acesso em: 09 jan.,2017.
ROUQUAYROL, Maria Zélia; ALMEIDA FILHO, Naomar de. Epidemiologia e Saúde.
7. ed. Rio de Janeiro: MedBook, 2013.
SCHLICKMANN, F. Fotos antigas de Balneário Camboriú. 2011. Disponível em:
<http://praiadecamboriu.blogspot.com.br/2011/04/fotos-antigas-de-balneario-
camboriu-11.html> Acesso em: 08 jan. 2017.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 114
SEMA. Secretaria do Meio Ambiente. O que são políticas públicas. Disponível em:
<http://www.meioambiente.pr.gov.br/arquivos/File/coea/pncpr/O_que_sao_
PoliticasPublicas.pdf >. Acesso em: 07 jan. 2017.
SILVA JÚNIOR, J. L. R.; et al. Efeito da sazonalidade climática na ocorrência de sintomas
respiratórios em uma cidade de clima tropical. Jornal Brasileiro de Pneumologia,
v. 37, n.6, p. 759-767, 2011.
SILVA, I. Fenômeno La Niña pode trazer chuvas ao sertão do Nordeste. 2016.
Disponível em: <http://radiojornal.ne10.uol.com.br/noticia/2016/06/08/fenomeno-
la-nina-pode-trazer-chuvas-ao-sertao-do-nordeste-47042> Acesso em: 09 jan. 2017.
SULEIDE. Governo de Goiás. Goiânia, Césio, 137. 2012. Disponível em:
<http://www.cesio137goiania.go.gov.br/index.php> Acesso em: 09 jan. 2017.
SUPERINTERESSANTE. As grandes epidemias ao longo da história. 2004.
Disponível em: < http://super.abril.com.br/saude/as-grandes-epidemias-ao-longo-
da-historia/ > Acesso em: 09 jan. 2017.
TAUIL, P. L. Urbanização e ecologia da dengue. Cadernos de Saúde Pública, n.17, p.99-

102, 2001.
TEIXEIRA, J. C., et al. Estudo do impacto das deficiências de saneamento básico sobre a saúde
publica no Brasil no período de 2001 a 2009. Eng. sanit. ambient, v. 19, n. 1, p. 87-96, 2014.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 115
TOLEDO, K. Quinto relatório do IPCC mostra intensificação das mudanças
climáticas. Agência FAPESP. 2013. Disponível em: <http://agencia.fapesp.br/quinto_
relatorio_do_ipcc_mostra_intensificacao_das_mudancas_climaticas/17944/> Acesso em:
09 jan. 2017.
UNITED NATIONS DEPARTMENT OF ECONOMIC SOCIAL AFFAIRS/POPULATION

DIVISION. World Urbanization Prospects: The 2007 revision. New York: UN; 2008.
VOGES, M. O clima está louco?. 2012. Disponível em: <http://formulageo.blogspot.com.

br/2012/07/o-clima-ta-louco-charge.html> Acesso em: 09 jan. 2017.
WEIHS, M.; MERTENS, F. Os desafios da geração do conhecimento em saúde ambiental: uma

perspectiva ecossistêmica. Cien Saude Colet, v. 18, n. 5, p. 1501-1510, 2013.
XAVIER, M. P.; ARAÚJO, J. S. O conceito de saúde e os modelos de assistência: considerações

e perspectivas em mudança / the concept of health and models of assistance: considerations
and prospects in change. Revista Saúde em Foco, Teresina, v. 1, n. 1, 2014.
BIOESTATÍSTICA E
EPIDEMIOLOGIA 116
DUARTE, A.; SANTOS, T.R.; CASTRO, A. G. O Ambiente e a Saúde. Porto Alegre: Instituto Piaget, 2003.
EZZATI M.; et al. Comparative Risk Assessment Collaborating Group. Selected major risk factors and
global and regional burden of disease. Lancet. v. 360, n. 9343, p.1347-60, 2002.
FIALA, N. Efeito Estufa do Hambúrguer. Scientific American Brasil. 2009. Disponível em: http://www2.
uol.com.br/sciam/noticias/efeito_estufa_dos_hamburgueres.html>Acesso em: 3 jan. 2017.
FIOCRUZ. Glossário de Doenças da Fiocruz. 2013. Disponível em: <https://agencia.fiocruz.br/

leishmaniose>. Acesso em: 9 jan. 2017.
FOGAÇA, J. R. V. Tipos de tratamento de efluentes. Brasil Escola. Disponível em: <http://brasilescola.

uol.com.br/quimica/tipos-tratamento-efluentes.htm>. Acesso em: 28 dez. 2016.
GAZETA RURAL. Agricultores obrigados a ter formação para usarem pesticidas. 2016. Disponível em:
<http://gazetarural.com/2016/01/26/agricultores-obrigados-a-ter-formacao-para-usarem-pesticidas/>
Acesso em: 10, jan. 2017.
GECOM-TJAC. TJAC oferece atividades de ginástica laboral aos servidores. 2015. Disponível em:
<http://www.tjac.jus.br/noticias/tjac-oferece-atividades-de-ginastica-laboral-aos-servidores/> Acesso
em: 10, jan. 2017.
GIODA, A., DE AQUINO NETO, F. R. Comments on studies of industrial and non-industrial environments
in Brazil: a comparative. Cad Saude Pública. v. 19, n. 5, p.1389-97, 2003.
GLOBAL PARTNERSHIP TO ROLL BACK MALARIA. Using climate to predict infectious disease
outbreaks: a review. Geneva: World Health Organization; 2004.
HERZLICH, C. Health and illness on the eve of 21st century: from private experience to the public sphere
and back. Physis: Revista de Saúde Coletiva, v. 14, n. 2, p. 383-394, 2004.
Av. Marginal Leste, n. 3.600, Bairro dos Estados | CEP: 88.339-125 - Balneário Camboriú (SC)
Telefone: (47) 3363-0631 | avantis@avantis.edu.br | www.avantis.edu,br
BIOESTATÍSTICA E
EPIDEMIOLOGIA 117

Bioestatistica e Epidemologia

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Bioestatistica e Epidemologia

Enviado por

Direitos autorais:

Formatos disponíveis

C A D E R N O

1.Bioestatística. 2. Epidemiologia. I. Faculdade Avantis.

CDD 21ª ed.

PROJETO GRÁFICO E DIAGRAMAÇÃO

3.3 TESTE “T” DE STUDENT PARA UMA AMOSTRA..............................................................................54

7.2.5 Implicações para a saúde pública.......................................................................................104

REFERÊNCIAS BIBLIOGRÁFICAS................................................... 110

O caderno de estudos de Bioestatística e Epidemiologia acompanhará sua aprendizagem

A primeira unidade está dividida em 3 capítulos. O capítulo 1 traz os conceitos básicos de

Os conceitos e técnicas com os quais entraremos em contato a partir de agora, apesar de

Boa sorte e até breve.

1 – CONCEITOS BÁSICOS DE BIOESTATÍSTICA

1.1 TIPOS DE DADOS COMUNS NAS CIÊNCIAS DA SAÚDE

As variáveis qualitativas são representadas pelos dados que se encontram em categorias

As variáveis quantitativas são mais comuns em Bioestatística, possibilitam resultados mais

tipo de variável se chama quantitativa contínua. discretas

Figura 1. Modelo ilustrativo de acurácia e precisão.

1.3 COLETA DE DADOS EM POPULAÇÕES E AMOSTRAS

Já comentamos que o tamanho da amostra é importante para a qualidade do resultado da

Amostragem aleatória simples – todos os membros da população são computados e têm a

Amostragem estratificada – a população é dividida em subpopulações relevantes para o

Amostragem por conglomerado – assim como na amostragem estratificada, a população

Outra consideração importante a fazer sobre variáveis coletadas de populações é que,

P(a) = probabilidade de ocorrer o evento “a”;

a = número de vezes que ocorre o evento “a”;

S = nº total de possíveis resultados para aquele experimento ou espaço amostral.

1.4.2 Contando os resultados possíveis

k = número de resultados possíveis de cada fase;

Você encontrará exercícios e mais exemplos no

Ambiente Virtual de Aprendizagem.

P(♀) = 0,5 P(♀) = 0,5

P(♂) = 0,5 P(♂) = 0,5

O mesmo pode ser feito para determinar a probabilidade de dois meninos:

Já para uma menina e um menino, devemos levar em consideração duas possibilidades: um

Você encontrará exercícios e mais exemplos no Ambiente Virtual de

1.4.4 Modelos probabilísticos

1.4.4.1 Modelos para variáveis aleatórias discretas

1 menina 50% ou graficamente:

A mais importante distribuição contínua de probabilidade é a Distribuição Normal ou

Neste capítulo aprendemos que Bioestatística compreende a coleta ordenada, a análise e a

Neste primeiro capítulo você também trilhou os primeiros passos na probabilidade e já

No próximo capítulo aprenderemos as principais técnicas para apresentação de dados

Se tiver dificuldade, experimente o nivelamento no Ambiente Virtual de

Como já citamos, a Bioestatística descritiva é responsável por descrever nossas variáveis ou

2.1 MEDIDAS DE TENDÊNCIA CENTRAL

Você encontrará exercícios e mais exemplos no Ambiente Virtual de

A mediana é definida com a variável que se encontra no centro de um conjunto ordenado de

(109, 112, 123, 144 e 156)

Já para o segundo exemplo:

temos que calcular o valor médio entre X2 e X3 (X2,5), ou seja, 4.

Suponha que um pesquisador mediu o nível de serotonina no lobo frontal de 3 presidiários

Exemplo 2 – mortes devidas a acidentes em 9 cidades (1, 3, 3, 4, 1, 1, 3, 8, 9, 17, 11). Nesse

2.1.4 Ponto médio

Xmáximo é o maior valor do conjunto de dados e

Xmínimo é o menor valor do conjunto de dados.

Você encontrará exercícios e mais exemplos no Ambiente Virtual de

2.2 MEDIDAS DE VARIAÇÃO E DISPERSÃO

Uma maneira de calcular a dispersão utilizando todas as observações é através da medição

120 – 130 = – 10 após, calcule a soma das diferenças

Você encontrará exercícios e mais exemplos no Ambiente Virtual de

Você encontrará exercícios e mais exemplos no Ambiente Virtual de

2.2.4 Coeficiente de variação

Outro detalhe importante refere-se à unidade do coeficiente de variação. Como o desvio-