BIOESTATISTICA - Unidade I - UNIP

Bioestatística
Autora: Profa. Mara Cynthia Ferreira de Carvalho

Colaboradores: Profa. Valdice Neves Polvora
Profa. Najla Mahmoud Kamel
Professora conteudista: Mara Cynthia Ferreira de Carvalho
Possui pós‑graduação em Formação em EaD pela Universidade Paulista (UNIP), mestrado em Engenharia de
Produção pela Universidade Paulista (UNIP), licenciatura em Matemática pela Universidade Santa Cecília (UNISANTA)
e licenciatura e bacharelado em Psicologia pela Universidade Católica de Santos (UNISANTOS). Participante do grupo
de pesquisas da Universidade Paulista – UNIP, autora de quatro artigos apresentados em congressos internacionais
com temas relativos à educação presencial utilizando ferramentas de ensino a distância e projetos para motivar alunos
nativos digitais. É professora na UNIP, nos cursos de Ciências da Computação, Engenharia, Matemática, Enfermagem,
Nutrição, Educação Física e Gestão Hospitalar em diversas áreas como: Estatística Descritiva, Estatística Indutiva,
Bioestatística, Tópicos de Informática, Trabalho de Conclusão de Curso, Metodologia do Trabalho Acadêmico. Professora
tutora de ensino a distância e elaboradora do conteúdo de Bioestatística do curso de Farmacologia Aplicada a Prática
Clínica da AVM Faculdade Integrada EaD.
Dados Internacionais de Catalogação na Publicação (CIP)
C331b Carvalho, Mara Cynthia Ferreira de.
Bioestatística. / Mara Cynthia Ferreira de Carvalho. – São Paulo:

Editora Sol, 2021.
144 p., il.
Nota: este volume está publicado nos Cadernos de Estudos e

Pesquisas da UNIP, Série Didática, ISSN 1517-9230
1. Bioestatística. 2. Coleta de dados. 3. Amostragem. I. Título.
CDU 57.087
U512.50 – 21
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Prof. Dr. João Carlos Di Genio
Reitor
Profa. Dra. Marilia Ancona Lopez

Vice-Reitora de Graduação
Vice-Reitora de Pós-Graduação e Pesquisa
Prof. Fábio Romeu de Carvalho

Vice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla Torre

Vice-Reitora de Unidades Universitárias
Unip Interativa
Profa. Dra. Cláudia Andreatini

Profa. Elisabete Brihy
Prof. Marcelo Vannini
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
Material Didático
Comissão editorial:
Profa. Dra. Christiane Mazur Doi
Profa. Dra. Angélica L. Carlini
Profa. Dra. Ronilda Ribeiro
Apoio:
Profa. Cláudia Regina Baptista
Profa. Deise Alcantara Carreiro
Projeto gráfico:
Prof. Alexandre Ponzetto
Revisão:
Rose Castilho
Virgínia Bilatto
Sumário
Bioestatística
APRESENTAÇÃO.......................................................................................................................................................9
INTRODUÇÃO............................................................................................................................................................9
Unidade I
1 CONCEITOS GERAIS DE ESTATÍSTICA E BIOESTATÍSTICA................................................................... 11
2 POPULAÇÃO, AMOSTRA, AMOSTRAGEM, VARIÁVEIS, COLETA DE DADOS E
CRÍTICA DOS DADOS........................................................................................................................................... 12
2.1 População estatística ou universo estatístico........................................................................... 12
2.2 Amostra..................................................................................................................................................... 12
2.3 Amostragem............................................................................................................................................ 13
2.4 Técnicas de amostragem.................................................................................................................... 14
2.4.1 Amostragem aleatória simples (probabilística)........................................................................... 15
2.4.2 Amostragem sistemática (probabilística)....................................................................................... 18
2.4.3 Amostragem aleatória estratificada (probabilística)................................................................. 24
2.4.4 Amostragem por conglomerado (probabilística)........................................................................ 26
2.4.5 Amostragem acidental (não probabilística).................................................................................. 27
2.4.6 Amostragem intencional (não probabilística).............................................................................. 27
2.4.7 Amostragem por quotas (não probabilística)............................................................................... 27
2.4.8 Amostragem por voluntários (não probabilística)...................................................................... 27
2.5 Variáveis.................................................................................................................................................... 28
2.5.1 Tipos de variáveis..................................................................................................................................... 28
2.5.2 Variáveis qualitativas ou categorizadas......................................................................................... 28
2.5.3 Variável quantitativa.............................................................................................................................. 30
2.6 Coleta de dados..................................................................................................................................... 32
2.7 Crítica dos dados................................................................................................................................... 34
3 TABELAS E GRÁFICOS..................................................................................................................................... 34
3.1 Tabela primitiva...................................................................................................................................... 35
3.2 Rol............................................................................................................................................................... 36
3.3 Distribuição de frequências sem intervalos de classe............................................................ 37
3.4 Distribuição de frequências com intervalos de classe........................................................... 42
3.5 Elementos de uma distribuição de frequência.......................................................................... 46
3.6 Tipos de frequências............................................................................................................................. 47
3.7 Gráficos estatísticos............................................................................................................................. 49
3.8 Tipos de gráficos.................................................................................................................................... 49
3.8.1 Gráfico em linha ou em curva – polígonos de frequências................................................... 49
3.8.2 Histogramas............................................................................................................................................... 54
3.8.3 Gráfico em colunas ou em barras..................................................................................................... 55
3.8.4 Gráfico em colunas ou em barras múltiplas................................................................................. 56
3.8.5 Gráfico em setores.................................................................................................................................. 58
4 MEDIDAS DE TENDÊNCIA CENTRAL E DE VARIABILIDADE.............................................................. 60
4.1 Média aritmética (X)............................................................................................................................ 60
4.1.1 Média aritmética para dados não agrupados.............................................................................. 60
4.1.2 Média aritmética para dados agrupados....................................................................................... 62
4.2 Mediana (Md).......................................................................................................................................... 65
4.2.1 Mediana para dados não agrupados............................................................................................... 65
4.2.2 Mediana para dados agrupados........................................................................................................ 67
4.3 Moda (Mo)................................................................................................................................................ 70
4.3.1 Moda para dados não agrupados..................................................................................................... 70
4.3.2 Moda para dados agrupados.............................................................................................................. 71
4.4 Emprego da média, da mediana e da moda............................................................................... 74
4.5 Medidas de dispersão: variância, desvio padrão para dados agrupados e
não agrupados............................................................................................................................................... 74
4.5.1 Variância (S²)............................................................................................................................................. 75
4.5.2 Desvio padrão (S)..................................................................................................................................... 76
4.6 Coeficiente de variação (Cv)............................................................................................................. 83
Unidade II
5 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADE................................................................................... 90
5.1 Introdução à probabilidade............................................................................................................... 90
5.1.1 Experimento aleatório........................................................................................................................... 90
5.1.2 Probabilidade da ocorrência de um evento P(A)........................................................................ 91
5.1.3 Eventos complementares..................................................................................................................... 92
5.1.4 Eventos independentes (e)................................................................................................................... 93
5.1.5 Eventos mutuamente exclusivos (ou)............................................................................................. 93
5.2 Distribuições teóricas de probabilidade....................................................................................... 94
5.2.1 Distribuição normal de probabilidade............................................................................................. 96
6 INTRODUÇÃO AO TESTE DE HIPÓTESES.................................................................................................101
6.1 Conceito de hipótese.........................................................................................................................101
6.2 Aplicação do teste...............................................................................................................................103
6.3 Nível de significância.........................................................................................................................103
6.4 Teste para amostras com a média de uma população.........................................................104
6.4.1 Amostras grandes (n>30)...................................................................................................................104
6.4.2 Teste T de Student, para amostras pequenas (n<30)..............................................................107
6.4.3 Teste de hipóteses para média de duas populações.................................................................111
7 TESTE DE HIPÓTESES QUI‑QUADRADO..................................................................................................115
7.1 Teste de associação qui‑quadrado clássico..............................................................................115
8 CORRELAÇÃO E REGRESSÃO.....................................................................................................................122
8.1 Diagrama de dispersão......................................................................................................................122
8.2 Coeficiente de correlação de Pearson (R)..................................................................................124
8.3 Coeficiente de determinação (R²).................................................................................................129
8.4 Regressão linear simples..................................................................................................................129
APRESENTAÇÃO
A bioestatística se faz presente no dia a dia da área da saúde. Ela se manifesta em várias áreas da
saúde, em hospitais, por meio de uma planilha de utilização de medicamentos para ser apresentada
a um plano de saúde, que se não for feita corretamente pode ser glosada, por exemplo. Existem
planilhas e gráficos de apresentação de desempenho de funcionários, de atendimentos e diversos
outros tipos.
Em nosso curso, as ferramentas da bioestatística serão apresentadas de forma sequencial, para que
você possa aprender noções de amostragem e técnicas de análise utilizando princípios da estatística
descritiva e esteja apto a calcular estimativas intervalares, entendendo, assim, a sua relevância em
pesquisas e trabalhos científicos de todo o tipo, principalmente na área da saúde.
Ainda, será incluso neste curso, a título de curiosidade, o modo como utilizar a ferramenta Microsoft
Excel, passo a passo, para todos os itens, demonstrando, assim, os recursos disponíveis de estatística do
software, para que você possa aproveitar todos os momentos do curso. Assim, ao final você será capaz
de distinguir as limitações e vantagens do uso de amostras e os métodos de sua obtenção, descrever e
interpretar dados por meio de tabelas e gráficos, fazer estimativas pontuais e de variabilidade, calcular
intervalos de confiança da proporção e média e ainda identificar sua aplicação, além de fazer todos
esses cálculos no Microsoft Excel.
INTRODUÇÃO
Como saberíamos mais sobre comportamentos, preferências, doenças e medicamentos que podem
promover melhorias à população se não fosse a estatística?
De acordo com Arango (2009), Florence Nightingale (1820‑1910), fundadora da enfermagem

moderna, talvez tenha sido a pioneira na confecção de gráficos na estatística social. Durante a Guerra
da Crimeia (no sul da Rússia, que durou de 1853 a 1856), ela demonstrou, por meio de gráficos originais,
pois apenas a sua palavra não bastava, que morriam mais soldados em consequência de precárias
condições sanitárias do que em combate.
Toda pesquisa tem propostas e objetivos e deve ser planejada de acordo com eles. Para tanto, é
necessário que haja configuração da população‑alvo, delineamento de amostra, elaboração de
questionário (caso seja uma pesquisa de campo) para coleta dos dados e análise dos resultados, para
assim poder chegar a conclusões e até tomadas de decisões.
A bioestatística é a aplicação das ferramentas da estatística à saúde, utilizando as técnicas estatísticas

para se cumprir todas as etapas da pesquisa.
O conteúdo deste curso percorrerá o caminho entre a coleta de dados, o cálculo e a interpretação dos
resultados de uma pesquisa, e, com isso, você perceberá que a bioestatística está muito mais presente no
seu dia a dia do que você pode imaginar.
9
A pesquisa em bioestatística segue o cronograma da figura a seguir:
Propostas e objetivos
Planejamento de pesquisa
Delineamento de amostra
Elaboração de questionário
Coleta de dados
Crítica dos dados
Apuração dos dados
Construção Construção
de tabelas de gráficos
Análise de interpretação
dos dados
Conclusões e
tomadas de decisão
Figura 1 – Diagrama do cronograma da pesquisa
O objetivo maior da bioestatística é a tomada de decisões, quando se refere a registros de doenças,

surtos, epidemias, endemias, registros de qualidade de vida, condições de alimentação, sanitárias e
habitacionais, prevenção de doenças, educação, enfim, tudo que se refere à saúde pública e que é de
interesse, também, da OMS (Organização Mundial da Saúde). Ainda, na área da saúde, é utilizada
quando da elaboração de experiências e pesquisa científica, tais como testes de vacinas, avaliação de
terapêuticas e tratamentos, testes de medicamentos etc.
Portanto, a bioestatística se relaciona com a área da saúde, incluindo farmácia, gestão hospitalar,
enfermagem, nutrição e muitas outras, e essa é a razão de se tornar uma disciplina importante
nesses cursos.
10
BIOESTATÍSTICA
Unidade I
1 CONCEITOS GERAIS DE ESTATÍSTICA E BIOESTATÍSTICA
Estatística é a parte da matemática que trata da coleta, organização, tabulação e análise de dados
colhidos em um levantamento de dados (popularmente chamado de pesquisa). Pode ser dividida em dois
grandes grupos, a estatística descritiva e a Inferencial ou Indutiva. A descritiva é empregada para caracterizar
a amostra em estudo, já a inferencial ou indutiva permite elaborar hipóteses em relação à amostra estudada
para que possamos transferir essas conclusões à população que deu origem a essa amostra.
Bioestatística são conceitos da Estatística aplicados às Ciências Biológicas, como Medicina, Biologia,
Biomedicina, Farmácia, Odontologia, Medicina Veterinária, Enfermagem e outras (ARANGO, 2009).
Por definição, a Bioestatística é um conjunto de métodos utilizados para planejar e executar um trabalho
científico, que envolve a obtenção, a organização, a análise, e a interpretação dos dados, e ainda possibilita
a obtenção das conclusões (TRIOLA, 1999), como demonstrado no cronograma da figura anterior.
Lembrete
Podemos dizer, então, que a Bioestatística se utiliza das ferramentas da

Estatística que são consideradas mais importantes para a área da Saúde.
Saiba mais
Segundo Arango (1993), Gauss (1777‑1855), considerado o maior

matemático dos séculos XVIII e XIX, idealizou e deduziu a Curva Normal de
Probabilidades.
Você pode obter mais informações sobre o tema na obra:
VIEIRA, S. Introdução à bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008.
Exemplos:
1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais comuns
utilizados em pacientes internados com idade acima de 60 anos, sorteia, então, o prontuário de
30 desses pacientes, e anota as suas idades e os remédios que estão utilizando.
11
Unidade I
Com a utilização das ferramentas da Bioestatística, pode‑se chegar a muitas conclusões sobre os
remédios utilizados, tais como: quais as idades dos pacientes que utilizam esses remédios, com
que frequências eles são utilizados, e ainda, controlar os seus estoques para que não haja falta
desses medicamentos.
2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes

para o pré‑natal. Sendo uma maternidade que opera em uma cidade grande, deseja saber quais as
cidades vizinhas que estão encaminhando suas pacientes e por quê. Para tanto, apronta uma ficha
que deve ser preenchida assim que a gestante chega ao hospital pela primeira vez, para colher as
informações necessárias do seu encaminhamento.
Essa pesquisa pode ser de muita utilidade, pois pode‑se saber quais pacientes são da cidade e
quais estão sendo enviadas de outras cidades, podendo inclusive levantar dados suficientes que
provem a necessidade de mais maternidades na região.
2 POPULAÇÃO, AMOSTRA, AMOSTRAGEM, VARIÁVEIS, COLETA DE DADOS E

CRÍTICA DOS DADOS
2.1 População estatística ou universo estatístico
Chamamos população todos os elementos portadores de, pelo menos, uma característica comum, e
que desejamos analisar, isto é, todos os entes que possuem a característica que estaremos estudando.
2.2 Amostra
É um subconjunto finito da população estatística, ou seja, uma parte da população que queremos
investigar.
Amostras são utilizadas para que se possa chegar a uma conclusão a respeito do todo sem a
necessidade de utilizar todos os entes da população. Uma das poucas pesquisas que utilizam toda a
população é o Censo, realizado, normalmente de 10 em 10 anos.
Portanto, uma amostra não deve ser escolhida de qualquer maneira. A principal característica da
amostra é que ela deve ser probabilística, isto é, todos os entes da população devem ter a chance de
participar da amostra, se não, ela pode se tornar tendenciosa e colocar toda a pesquisa a perder.
A escolha da amostra é a parte mais importante da pesquisa. Para que não se cometam erros nesta
escolha, existe a amostragem.
Lembrete
População estatística são os entes que apresentam a característica a ser

estudada e amostra é uma parte representativa dessa população.
12
BIOESTATÍSTICA
Observação
Sempre que nos referimos ao número de elementos da população

utilizamos N (maiúsculo) e sempre que nos referimos ao número de
elementos da amostra utilizamos n (minúsculo).
Exemplos:
1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais comuns
utilizados em pacientes internados com idade acima de 60 anos, sorteia, então, o prontuário de
30 desses pacientes, e anota as suas idades e os remédios que estão utilizando.
Neste caso, a população será constituída de todos os pacientes internados com idade acima de 60
anos e a amostra serão os 30 sorteados por meio dos seus prontuários.

que deve ser preenchida assim que a gestante chega ao Hospital pela primeira vez, para colher as
informações necessárias do seu encaminhamento.
Neste caso, a população será todas as gestantes do pré‑natal e a amostra, apenas as pacientes
encaminhadas por outras maternidades.
2.3 Amostragem
A amostra não pode ser escolhida de qualquer forma, para isso existem técnicas de amostragem
que garantem, principalmente, o acaso na escolha, portanto ela deve ser probabilística, isso é, todos
os participantes da população estatística devem ter a chance de ser escolhidos. Caso isso não ocorra, a
amostra pode não demonstrar a realidade da população.
Existem ainda técnicas não probabilísticas de amostragem que são empregadas quando não há
possibilidade de se obter amostras probabilísticas, isto é, ao invés de se sortear os elementos da amostra,
estes são selecionados por algum critério escolhido pelo pesquisador.
Em muitos casos, os efeitos de uma amostragem não probabilística podem ser considerados
equivalentes aos de uma amostragem probabilística, porém é um tipo de amostragem que deve ser feita
com reservas e com a convicção de que não se introduza vício.
As amostragens não probabilísticas normalmente são utilizadas quando não existe acesso à
população, quando é escolhida sem norma, quando o pesquisador deliberadamente escolhe certos
elementos da amostra por julgá‑los bem representativos da população ou ainda por voluntários.
13
Unidade I
Pelo fato da estatística ser uma estimativa, quanto melhor for a amostra, melhor se poderá inferir
sobre a população que ela representa.
Lembrete
Amostragem são técnicas especiais para recolher amostras, que

garantem, tanto quanto possível, caráter de representatividade, pois serão
inferidas conclusões relativas à população com base nesses resultados.
Observação
Não podemos confundir amostra com amostragem. Amostra é uma

parte da população, amostragem são técnicas para se escolher a amostra.
2.4 Técnicas de amostragem
Quando achamos que, ao utilizar todos os elementos da população para uma pesquisa, seremos
mais precisos, estamos incorrendo em um erro, pois a manipulação de grande quantidade de dados
pode gerar erros maiores do que os erros que poderíamos ter, por meio da inferência estatística, nas
conclusões de uma amostra bem selecionada.
Portanto, nossa preocupação central é na escolha de uma amostra realmente representativa.
Quando finalmente decidimos quais informações queremos obter de um levantamento amostral,

devemos, em primeiro lugar, definir a população de interesse e selecionar a característica que
queremos pesquisar, pois todos os elementos da população devem ter essa característica. Depois
devemos escolher a amostra utilizando, como já mencionamos, as técnicas de amostragem, que
podem ser probabilísticas ou não. As técnicas de amostragem probabilísticas são: amostragem
aleatória simples, amostragem sistemática, amostragem estratificada e amostragem por
conglomerado.
Os métodos de extração das amostras não probabilísticas são: amostragem acidental, amostragem
intencional, amostragem por quotas e amostragem por voluntários.
Lembrete
Técnicas de amostragem são procedimentos utilizados para escolher

uma amostra representativa da população, elas podem ser probabilísticas
ou não probabilísticas.
14
BIOESTATÍSTICA
Observação
Se não utilizarmos técnicas probabilísticas para amostragem, nossa

pesquisa corre o risco de não ser fidedigna.
2.4.1 Amostragem aleatória simples (probabilística)
É um processo para selecionar amostras de tamanho “n” entre as “N” unidades em que foi dividida a
população. Sendo a amostragem feita sem reposição, que é o caso mais comum, existem (N, n) possíveis
amostras, todas igualmente prováveis (CRESPO, 1993). Na prática, a amostra aleatória simples é escolhida
unidade por unidade. As unidades da população são numeradas de 1 a N. Em seguida, escolhe‑se por
sorteio ou em uma Tabela de Números Aleatórios (TNA), encontra‑se n números compreendidos entre 1
e N. Esse processo é equivalente a um sorteio no qual se colocam todos os números misturados dentro
de uma urna. As unidades correspondentes aos números escolhidos formarão a amostra.
Figura 2 – Tabela de Números Aleatório (TNA) gerada no Excel com o comando =ALEATÓRIOENTRE(0;9)
15
Unidade I
Exemplos:
1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais
comuns utilizados em pacientes internados com idade acima de 60 anos. Vamos supor que foram
internados 200 pacientes e que queremos uma amostra de 30 desses pacientes.
Neste caso, poderemos utilizar a TNA da figura. Vamos sortear apenas 30 desses pacientes; para
tanto, devemos numerar os prontuários de 001 a 200 e sortear 30 deles.
Temos que encontrar números de três dígitos, caso contrário, os prontuários acima de 100 nunca
seriam sorteados.
Resolução:
Se utilizarmos a TNA da direita para a esquerda, a partir da 1ª linha temos sorteados os prontuários:
175, 119, 052, 057, 129, 004, 110, 186, 072, 171, 130, 169, 180, 076, 036, 199, 034, 005, 069, 152, 096,
038, 018, 072, 125, 041, 056, 047, 103, 001, conforme figura a seguir.
Figura 3 – TNA com os números sorteados
16
BIOESTATÍSTICA
Portanto, serão utilizados esses prontuários para anotar os remédios mais comuns utilizados por
esses 30 pacientes. A partir daí, poderemos chegar a conclusões a respeito da população de pessoas
acima de 60 anos que foram internadas no Hospital Baruch de Toulouse.

para o pré‑natal. Sendo uma maternidade que opera em uma cidade grande, deseja saber quais
as cidades vizinhas que estão encaminhando suas pacientes e por quê. Para tanto, apronta uma
ficha (prontuário) que deve ser preenchida assim que a gestante chega ao Hospital pela primeira
vez, para colher as informações necessárias do seu encaminhamento. Tendo sido atendidas 200
pacientes, apenas 80 são de cidades vizinhas, destas, iremos escolher uma amostra de 20 pacientes.
Neste caso, o procedimento é o mesmo do exemplo anterior, se não levarmos em conta as cidades
de procedência, sortearemos 20 pacientes ao acaso. Para isso teremos que separar os prontuários
das cidades vizinhas e numerá‑los de 01 a 80. Agora utilizaremos apenas dois dígitos, pois os
elementos acima de 10 devem ter a chance de ser sorteados.
Resolução:
Figura 4 – TNA com os números sorteados coloridos
17
Unidade I
Se utilizarmos a TNA a partir da 1ª coluna, de cima para baixo, teremos sorteados os prontuários: 44,
36, 19, 05, 53, 39, 20, 11, 08, 50, 42, 62, 77, 30, 76, 65, 56, 67, 37 e 35.
Portanto, serão utilizados esses prontuários para anotar os municípios de procedência das gestantes e
o motivo do encaminhamento e, a partir daí, poderemos chegar a conclusões a respeito da população de
gestantes encaminhadas e qual o motivo do encaminhamento para a maternidade Baruch de Toulouse.
Lembrete
Amostragem aleatória simples é uma maneira de se escolher uma

amostra da população, basicamente, por sorteio.
Observação
O sorteio dos elementos para amostra não necessariamente deve ser

feito pela TNA, desde que todos os elementos da população tenham a
chance de ser escolhidos.
2.4.2 Amostragem sistemática (probabilística)
Uma amostragem obtida selecionando‑se aleatoriamente um elemento entre os K primeiros

elementos de um sistema de referência, e, após esse, cada “k‑ésimo” elemento, é chamada sistemática.
Em geral, para se obter uma amostra sistemática de n elementos de uma população de tamanho N,
K deve ser menor ou igual a N/n. Não é possível determinar K precisamente quando o tamanho da
população é desconhecido, mas pode‑se supor um valor de k de tal modo que seja possível obter uma
amostra de tamanho n. Em vez da amostragem aleatória simples, pode‑se empregar a amostragem
sistemática, porque é mais fácil de executar e, por isso, está menos sujeita a erros de entrevistador do
que a aleatória simples e frequentemente proporciona mais informações por custo unitário do que a
aleatória simples.
O 1º passo é determinar o intervalo de amostragem (K):
N
K=
n
Onde:
N = número de elementos da população.
n = número de elementos da amostra.
18
BIOESTATÍSTICA
Se o resultado for decimal, devemos arredondar para o valor inteiro menor.
O 2º passo é iniciar aleatoriamente a composição da amostra:
b → início: nº de ordem inicial sorteado na TNA, que deve ser entre 1 e K (0<b<K).
O 3º passo é a composição da amostra:
1º item →b
2º item →b + K
3º item →(b + K) + K ou (b + 2K)
4º item →(b + K + K) + K ou (b + 3K)
E assim por diante, até encontrar todos os elementos desejados para a amostra.
Lembrete
A amostragem sistemática também é feita por sorteio, porém, será

sorteado apenas o primeiro elemento da amostra, e os outros serão
sorteados a partir dele.
Exemplos:
1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais
comuns utilizados em pacientes internados com idade acima de 60 anos. Vamos supor que foram
internados 200 pacientes, e queremos uma amostra de 30 desses pacientes.
Resolução:
N 200
K= ⇒K = ⇒ K = 6, 67
n 30
Devemos arredondar para o valor menor: K = 6.
O valor de b será um número sorteado na TNA (figura 2) entre 1 e 6.
19
Unidade I
Utilizando a primeira linha da TNA, da esquerda para direita, temos o número 2 (é o primeiro que
aparece entre 1 e 6), confira na tabela.
1º item → 2
2º item → 2 + 6 = 8
3º item → 8 + 6 = 14
4º item → 14 + 6 = 20
5º item → 20 + 6 = 26
6º item → 26 + 6 = 32
7º item → 32 + 6 = 38
8º item → 38 + 6 = 44
9º item → 44 + 6 = 50
10º item → 50 + 6 = 56
11º item → 56 + 6 = 62
12º item → 62 + 6 = 68
13º item → 68 + 6 = 74
14º item → 74 + 6 = 80
15º item → 80 + 6 = 86
16º item → 86 + 6 = 92
17º item → 92 + 6 = 98
18º item → 98 + 6 = 104
19º item → 104 + 6 = 110
20º item → 110 + 6 = 116

20
BIOESTATÍSTICA
21º item → 116 + 6 = 122
22º item → 122 + 6 = 128
23º item → 128 + 6 = 134
24º item → 134 + 6 = 140
25º item → 140 + 6 = 146
26º item → 146 + 6 = 152
27º item → 152 + 6 = 158
28º item → 158 + 6 = 164
29º item → 164 + 6 = 170
30º item → 170 + 6 = 176
A amostra será composta pelos pacientes de prontuários: 2, 8, 14, 20, 26, 32, 38, 44, 50, 56, 62, 68,
74, 80, 86, 92, 98, 104, 110, 116, 122, 128, 134, 140, 146, 152, 158, 164, 170, 176.
Portanto, serão utilizados esses prontuários para anotar os remédios mais comuns utilizados por
esses 30 pacientes, a partir daí, poderemos chegar a conclusões a respeito da população de pessoas
acima de 60 anos que foram internados no Hospital Baruch de Toulouse.

(prontuário) que deve ser preenchida assim que a gestante chega ao Hospital pela primeira vez, para
colher as informações necessárias do seu encaminhamento. Tendo sido atendidas 200 pacientes,
apenas 80 são de cidades vizinhas, destas 80 iremos escolher uma amostra de 20 pacientes.
Resolução:
Neste caso, o procedimento é o mesmo do exemplo anterior, se não levarmos em conta as cidades
de procedência, sortearemos 20 pacientes ao acaso, porém, agora utilizaremos a amostra sistemática.
N 80
K= ⇒K = ⇒K = 4
n 20
21
Unidade I
O valor de b será então um número sorteado na TNA entre 1 e 4.
Utilizando a segunda coluna da TNA (figura 2), de cima para baixo, temos o número 1 (é o
primeiro que aparece entre 1 e 4), confira na tabela.
1º item → 1
2º item → 1 + 4 = 5
3º item → 5 + 4 = 9
4º item → 9 + 4 = 13
5º item → 13 + 4 = 17
6º item → 17 + 4 = 21
7º item → 21 +4 = 25
8º item → 25 + 4 = 29
9º item → 29 + 4 = 33
10º item → 33 + 4 = 37
11º item → 37 + 4 = 41
12º item → 41 + 4 = 45
13º item → 45 + 4 = 49
14º item → 49 + 4 = 53
15º item → 53 + 4 = 57
16º item → 57 + 4 = 61
17º item → 61 + 4 = 65
18º item → 65 + 4 = 69
22
BIOESTATÍSTICA
19º item → 69 + 4 = 73
20º item → 73 + 4 = 77
A amostra será composta pelos pacientes de prontuários: 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45,
49, 53, 57, 61, 65, 69, 73, 77.
Portanto, serão utilizados esses prontuários para anotar os municípios de procedência das gestantes e
o motivo do encaminhamento e, a partir daí, poderemos chegar a conclusões a respeito da população de
gestantes encaminhadas e qual o motivo do encaminhamento para a maternidade Baruch de Toulouse.
Observação
Estes números podem ser encontrados facilmente utilizando‑se o

programa Microsoft Excel.
Para encontrar os números correspondentes aos elementos para a amostra no Microsoft Excel, siga
os passos:
1. Inserimos o número de elementos da população em uma célula (B1) e o número de elementos

da amostra em outra célula (D1), na célula B2, inserimos a conta que está indicada na barra de
fórmulas (=B1/D1), será feita a conta 80/20, com resultado 4.
Figura 5 – Cópia da planilha do Excel
2. Após a divisão escolhemos o primeiro elemento na TNA e colocamos em outra célula, depois
inserimos a conta para que ele obtenha a soma e copiamos a fórmula.
23
Unidade I
O número 1 inserido na célula A3 foi o sorteado no exemplo. A célula B2 está entre o símbolo $
($B$2) para que possamos copiar (replicar) a fórmula, utilizando o cursor em destaque na figura.
3. Arrastamos a fórmula até a célula 22, assim obtendo os 20 elementos da amostra.
A vantagem de utilizar o Microsoft Excel é a rapidez, certeza de que o resultado estará correto
(desde que você insira corretamente a conta) e, principalmente, o tamanho da amostra, porque a
fórmula pode ser replicada para o tamanho da amostra desejada, caso ela seja grande, não haverá
problemas. Além de que, uma vez feita a planilha, basta modificar o número de elementos da
população, o número de elementos da amostra e o novo número sorteado (b), que o resultado
será imediato, tente.
2.4.3 Amostragem aleatória estratificada (probabilística)
Uma amostra estratificada é obtida separando‑se as unidades da população em estratos (camadas),

que são divisões da população de acordo com algum critério, e selecionando‑se independentemente
uma amostra aleatória simples de cada estrato.
Os critérios de divisão são feitos de acordo com o que se quer saber na pesquisa, como: idade
(criança, adolescente, adulto e idoso), tipo sanguíneo (A, B, AB e O), área da empresa em que trabalha
(A1, A2, A3, etc.), entre outros.
Existem dois tipos de amostragem estratificada: de igual tamanho e proporcional.
24
BIOESTATÍSTICA
Quando é de igual tamanho, sorteia‑se igual número de elementos em cada estrato. Esse processo é
utilizado quando o número de elementos por estrato for aproximadamente o mesmo.
Quando é proporcional, utiliza‑se a amostragem estratificada proporcional, em que há o critério de

proporcionalidade. Assim, em uma população de N indivíduos, se K1 é o coeficiente de proporcionalidade
do estrato 1, K2 é o coeficiente de proporcionalidade 2 e K3, o coeficiente de proporcionalidade 3, a
participação de cada estrato na amostra deverá ser: n1= K1 x N; n2 = K2 x N; n3 = K3 x N, e assim por
diante. De modo geral, ni = Kj x N. Vale afirmar que este tipo de amostragem é a que consegue menor
margem de erro.
Lembrete
A amostragem estratificada divide a população em estratos e sorteamos

os elementos da amostra. No caso da estratificada proporcional, escolhemos
a amostra de forma proporcional a cada estrato.
Exemplos:
1. Será realizada uma pesquisa a partir de uma amostra composta por 20 pessoas. Essas
pessoas compõem um grupo de 100 funcionários de Hospitais que atendem seu Plano de
Saúde em outras cidades, sendo que 20 são da cidade de Santos, 13 da cidade de Jacareí, 23
da cidade de São Paulo, 14 de São Bernardo do Campo, 22 de São José dos Campos e 8 de
São Vicente. Vamos determinar a quantidade de pessoas de cada Hospital que responderá
a pesquisa.
Resolução:
Para sabermos o percentual da amostra, devemos utilizar a fórmula:
n
%n = X100 , onde:
N
%n = percentual da amostra.
n= nº de elementos da amostra.
N= nº de elementos da população.
Assim, temos: n = 20 e N = 100.
20
%n = X100 = 20%
100
25
Unidade I
Então, a mostra será composta por 20% da população.
Agora, vamos descobrir quantos elementos escolheremos de cada estrato. Para facilitar, as contas
foram colocadas na figura a seguir:
Figura 8 – Cálculos da proporção de cada estrato
Portanto, serão sorteados, por meio da técnica de amostragem aleatória simples, utilizando a
TNA, para compor a amostra de 20 funcionários: 4 funcionários do Hospital de Santos, 3 funcionários
do Hospital de Jacareí, 5 funcionários do Hospital de São Paulo, 3 funcionários do Hospital de São
Bernardo do Campo, 4 funcionários do Hospital de São José dos Campos e um funcionário do Hospital
de São Vicente.
Lembrete
Após determinação da quantidade de indivíduos por estrato, será

utilizado o sorteio (simples ou TNA) para determinarmos quais serão os
elementos componentes da amostra.
2.4.4 Amostragem por conglomerado (probabilística)
Consiste em efetuar subdivisões da população total (conglomerados) em áreas geográficas, como

quarteirões, ruas ou bairros, e compor a amostra tomando a totalidade dos indivíduos de alguns desses
conglomerados (ARANGO, 2009). Pode também ser denominada de amostragem por área. Assim, temos
n unidades tomadas de alguns conglomerados.
São exemplos de populações divididas em estratos: setores de um hospital (administração, compras,

tesouraria, recursos humanos, enfermagem etc.), sexo (homem e mulher), classificação de acordo com a
idade (criança, adolescente, adulto, terceira idade), entre outras.
26
BIOESTATÍSTICA
Saiba mais
Você pode obter mais informações sobre população, amostra e amostragem

no livro:
ARANGO, H. G. Bioestatística teórica e computacional. 3. ed. Rio de Janeiro:

Guanabara Koogan S.A., 2009.
2.4.5 Amostragem acidental (não probabilística)
É formada por elementos que vão aparecendo, que são possíveis de se obter até completar o número
de elementos da amostra. Um exemplo da utilização desse tipo de amostragem é a pesquisa de opinião,
em que os entrevistados são acidentalmente escolhidos.
2.4.6 Amostragem intencional (não probabilística)
Normalmente, nesse tipo de amostragem, o pesquisador usa seu julgamento para selecionar os
membros da população que ele acredita que são boas fontes de informação, portanto, é formada por
elementos escolhidos intencionalmente. Obviamente, o perigo desse tipo de amostragem é grande, pois
depende do critério do pesquisador.
2.4.7 Amostragem por quotas (não probabilística)
O pesquisador entrevista um número predefinido de pessoas em cada uma das várias categorias.
O pesquisador classifica para entrevistar um número predefinido de pessoas em cada uma das várias
categorias, em termos de propriedades relevantes para a característica que deseja estudar.
2.4.8 Amostragem por voluntários (não probabilística)
É aquela em que o pesquisador aceita voluntários para amostra da população quando a ética obriga
que haja concordância dos escolhidos, é uma técnica muito utilizada no caso de experimentação de
alguma nova droga ou vacina em pacientes.
Saiba mais
Você pode obter mais informações sobre população, amostra e

amostragem no livro:
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002.
27
Unidade I
• Aleatória simples
• Sistemática
Probalística • Estratificada
• Por conglomerado
Amostragem
• Acidental
• Intencional
Não probalística
• Por quotas
• Por conglomerado
Figura 9 – Técnicas de amostragem
2.5 Variáveis
É o conjunto de resultados de um possível fenômeno. É qualquer característica de um indivíduo de

uma população, que caracterizará ou descreverá um fenômeno ou fato de uma população. Uma variável
assumira valores no espaço e no tempo (MENESES; MARIANO, 2010).
A cada fenômeno corresponde um número de resultados possíveis. Assim, para o fenômeno “sexo”, são
dois resultados possíveis: sexo masculino e sexo feminino; para o fenômeno “número de funcionários”,
“quantidade de gestantes”, “número de idosos” há um número de resultados possíveis expressos por
números naturais (0, 1, 2, 3, ..., n), pois, não se pode dizer que foram contadas 25,3 gestantes, não é
mesmo? Assim sendo, onde estariam as 0,7 partes da 26ª gestante?
No caso de fenômenos como “pressão arterial”, “estatura” e “peso” os resultados podem tomar um
número infinito de valores dentro de um determinado intervalo. Nesse caso podemos admitir uma
estatura de 1,68 metros de altura, ou ainda um peso de 73,5 kg.
2.5.1 Tipos de variáveis
A variável, então, é um conjunto de resultados possíveis de um fenômeno, esse fenômeno pode ser
de qualidade (sexo, cor dos olhos,) ou de quantidade (pressão arterial, estatura). Por isso, as variáveis são
classificadas em: qualitativas ou categorizadas, e quantitativas.
2.5.2 Variáveis qualitativas ou categorizadas
Quando os possíveis resultados são atributos, qualidades. Exemplos: sexo (masculino‑feminino), cor da
pele (branca, preta...), cidade onde nasceu etc. As variáveis qualitativas podem ser divididas em duas categorias:
Qualitativa nominal
Quando os valores são classificados em categoria ou classes não ordenadas, em que números são
utilizados para representar categorias. Isto é, a variável é associada a um número, porém este número é
apenas um rótulo para a variável.
28
BIOESTATÍSTICA
Exemplos:
1. O agrupamento de pessoas de acordo com seu tipo sanguíneo, como na figura a seguir: o
número 1 representa o Tipo A, o número 2 representa o tipo B, o número 3 representa o tipo AB
e o número 4 representa o tipo O.
Figura 10 – Variável qualitativa nominal tipo sanguíneo
Os números associados às variáveis são meros rótulos, pois poderíamos facilmente trocar esses
rótulos para que 1 represente o tipo O, 2 é o tipo A, 3 é o tipo B e 4 é o tipo AB. Essa alteração não
implica na magnitude da variável.
2. O agrupamento de pessoas por sexo (masculino e feminino), como na figura a seguir:
Figura 11 – Variável qualitativa nominal Sexo
Os números associados às variáveis continuam sendo rótulos, pois poderíamos facilmente trocar
esses rótulos para que 0 represente o sexo Feminino e 1 represente o sexo Masculino.
Qualitativa ordinal
Quando a ordem entre a categoria é importante, as observações são referenciadas como dados
ordenados. Isto é, agora, o número associado à variável lhe dá uma magnitude ou uma ordem que não
pode ser trocada.
Exemplos:
1. Agrupamento de pessoas pelo nível socioeconômico a que pertencem, como apresentado na

figura a seguir:
29
Unidade I
Figura 12 – Variável qualitativa ordinal nível socioeconômico
Os números associados às variáveis não são mais rótulos porque agora eles determinam a magnitude
do Nível Socioeconômico, pois não poderíamos trocar esses rótulos porque mudaríamos o Nível
Socioeconômico do elemento em questão.
2. Podemos classificar a variável Lesão, em vários tipos:
Figura 13 – Variável qualitativa ordinal tipos de lesão
Neste caso, as lesões são classificadas de acordo com o seu nível de severidade, de modo que
1 representa uma lesão moderada; 2 é severa e 3 é fatal. Aqui existe uma ordem natural entre os
agrupamentos, um número maior representa uma lesão mais séria.
Lembrete
Quando a variável é qualitativa nominal, a sequência dos valores não é

importante. Já quando é qualitativa ordinal, está associada a uma ordem
no agrupamento em que essa se encontra.
2.5.3 Variável quantitativa
Representa quantidades mensuráveis que não estão restritas a assumir valores especificados
(inteiros), isto é, os possíveis resultados são números de uma escala. Exemplos: estatura, peso, pressão
arterial, pressão atmosférica, salários de funcionários etc. As variáveis quantitativas podem divididas em
duas categorias:
Quantitativa discreta
É a variável que só pode assumir valores pertencentes a um conjunto enumerável e tanto a ordenação
quanto na magnitude são importantes. Neste caso, os números representam quantidades mensuráveis
30
BIOESTATÍSTICA
reais, em vez de meros rótulos, e os dados discretos estão restritos a terem somente valores específicos,
frequentemente inteiros ou contagens.
Exemplos:
1. A figura a seguir apresenta uma tabela com o número de pacientes internados em algumas alas
do Hospital Baruch de Toulouse. Como sabemos, a função da ala de um hospital é manter juntos
pacientes com problemas parecidos.
Figura 14 – Tabela de pacientes de algumas alas do Hospital Baruch de Toulouse
O número de pacientes em determinada ala de um hospital só pode assumir valores inteiros e

nunca valores como 2,5 ou 3,78 ou 4,325.
2. O número de acidentes com veículos em determinada estrada, também não pode assumir valores
que não sejam inteiros.
Quantitativa contínua
É a variável que não precisa ser número inteiro, não estão restritos a assumir certos valores específicos,
pois diferença entre quaisquer dois valores de dados possíveis pode ser arbitrariamente pequena.
Exemplos:
1. A variável peso pode ser tanto de um número inteiro, como decimal (72kg ou 72,5 kg), dependendo
do grau de precisão com que esse valor foi medido.
2. O nível sérico de colesterol de um paciente (13,2 mg/dl ou 15,4 mg/dl).
Lembrete
Quando a variável é quantitativa discreta, exige número inteiro e

quando ela é quantitativa contínua utiliza números decimais.
31
Unidade I
Observação
É importante definir, exatamente, a variável que se vai utilizar na

pesquisa, pois a cada tipo de variável está associado um tipo de tabela de
dados.
2.6 Coleta de dados
Já sabemos que para fazer uma pesquisa devemos percorrer por um cronograma. Até agora já
aprendemos o que é uma amostra e como escolher essa amostra, o que é variável e como classificá‑la,
precisamos agora colher os dados da nossa pesquisa.
Após planejarmos a pesquisa, devemos iniciar o levantamento dos dados que desejamos mensurar e
que irão determinar as características do fenômeno que queremos pesquisar. Para tanto, dá‑se início a
coleta de dados numéricos necessários à sua descrição.
A coleta de dados é feita sobre elementos informativos de registro obrigatório, ou ainda por meio de
inquéritos e questionários aplicados aos elementos da amostra pelo próprio pesquisador ou, dependendo
da pesquisa, por uma equipe por ele treinada.
Exemplos:
1. Coleta feita por elementos informativos podem ser: prontuários, nascimentos, casamentos,
óbitos ou ainda qualquer tipo de informação que se possa colher de registros obrigatórios, como
os prontuários dos 30 pacientes acima de 60 anos, escolhidos por amostra aleatória simples,
internados no Hospital Baruch de Toulouse.
2. Dados colhidos pelo próprio entrevistador por meio de questionários. A seguir, um exemplo de
questionário para colher informações sobre o perfil do aluno de um curso em ensino a distância
oferecido pelo Hospital e Maternidade Athena de Toulouse, e como ele acha que foi seu aprendizado
nesse tipo de curso.
Q.1: Você nasceu:
a) Antes de 1955 – considerada geração Baby Boomers.
b) Entre 1956 e 1970 – considerada geração X.
c) Entre 1971 e 1990 – considerada geração Y.
d) Após 1990 – considerada geração Z.
32
BIOESTATÍSTICA
Q.2: Você usa o computador para:
a) Estudar e pesquisar na internet.
b) Apenas para me relacionar com outras pessoas.
c) Para estudar, trabalhar, fazer pesquisas e me relacionar com outras pessoas.
Q.3: Como você acha que foi seu aprendizado neste curso em EaD?
a) Ótimo.
b) Bom.
c) Regular.
d) Péssimo.
e) Acho que aprenderia mais em um curso presencial.
O questionário está com ênfase na geração digital a que pertence o aluno, com o objetivo de
classificar, dentro das gerações digitais, qual a que mais utiliza o EaD, pois cada geração tem um tipo de
relação com o computador, algumas têm mais e outras menos intimidade com o computador, e ainda
se o aluno acha que está aprendendo no curso em ensino a distância.
Lembrete
A coleta de dados é o passo mais importante para o pesquisador, pois a

partir daí ele iniciará a apuração dos dados que o levará às conclusões do
seu trabalho.
Observação
O questionário deve estar de acordo com os objetivos da pesquisa e

não deixar perguntas ou alternativas. Não é necessário pedir o nome do
respondente.
33
Unidade I
Saiba mais
Você pode encontrar mais informações sobre questionários para

pesquisa em saúde em:
CENTRAL de questionários de saúde. Survey Monkey, Califórnia,

1999‑2015. Disponível em: <https://pt.surveymonkey.com/mp/
healthcare‑surveys/>. Acesso em: 26 maio 2015.
2.7 Crítica dos dados
Após colher os dados, devemos criticá‑los, ou seja, fazer uma observação minuciosa das respostas para
ter certeza de que não houve nenhuma intercorrência que possa ter interferido nas respostas ou ainda
algum erro na transferência de dados provenientes de prontuários, pois toda a nossa análise da pesquisa
dependerá desses dados. Uma vez que haja algo errado com eles, toda a nossa pesquisa ficará inutilizada.
3 TABELAS E GRÁFICOS
Distribuição de frequências é o nome dado à tabela gerada a partir dos dados. Segundo dados do
IBGE (1993, p. 9) tabela é a “forma não discursiva de apresentar informações, das quais o dado numérico
se destaca como informação central. Na sua forma identificam‑se espaços e elementos”.
Chamamos de classes as linhas de dados da tabela. Assim, a classe 1 é relativa à primeira linha
de dados da tabela e assim por diante. A definição de classes, pelas normas tabulares é “cada um dos
intervalos não superpostos em que se divide uma distribuição de frequências” (IBGE, 1993, p. 11).
Portanto, as distribuições de frequências devem ser construídas de acordo com as normas técnicas
ditadas pelo Instituto Brasileiro de Geografia e Estatística (IBGE). As tabelas devem ser colocadas logo abaixo
do texto em que são mencionadas pela primeira vez e inseridas na ordem em que aparecem no texto.
De acordo com as normas técnicas, uma tabela deve ter título, corpo, cabeçalho e coluna indicadora.
Toda tabela deve ser delimitada por traços (moldura) horizontais, mas não deve ser delimitada por traços
verticais. O cabeçalho deve ser separado do corpo da tabela por um traço horizontal.
Com relação às molduras, segundo as normas de apresentação tabular, temos:
A estruturação dos dados numéricos e dos termos necessários à

compreensão de uma tabela deve ser feita com, no mínimo, três traços
horizontais paralelos. O primeiro para separar o topo. O segundo para
separar o espaço do cabeçalho. O terceiro para separar o rodapé [...] A
moldura de uma tabela não deve ter traços verticais que delimitem à
esquerda e à direita (IBGE, 1993, p. 15).
34
BIOESTATÍSTICA
Saiba mais
Para visualizar as normas de apresentação tabular do IBGE, acesse:
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Normas

de apresentação tabular. 3. ed. Rio de Janeiro: IBGE, 1993. Disponível em:
<http://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf>. Acesso em:
26 maio 2015.
3.1 Tabela primitiva
A tabela primitiva é uma tabela que contém dados brutos, ou seja, colhidos e simplesmente anotados.
Exemplos:
1. Em uma pesquisa para se determinar o nível de escolaridade de uma amostra de 30 funcionários do

Hospital Baruch de Toulouse, a partir dos prontuários sorteados anotamos o nível de escolaridade
de cada um dos funcionários, obtendo uma tabela primitiva, como mostra a figura a seguir:
Figura 15 – Exemplo de tabela primitiva de dados variável qualitativa
2. Uma pesquisa para se determinar a idade de 30 idosos que residem na Casa de Repouso Cayro
apresenta a tabela primitiva a seguir:
Figura 16 – Exemplo de tabela primitiva de dados variável quantitativa
35
Unidade I
Lembrete
O primeiro exemplo trata de dados de uma variável qualitativa ordinal e

o segundo exemplo são dados de uma variável quantitativa contínua.
Observação
Note que os dados estão desorganizados, apenas foram colocados da

forma como foram colhidos nos prontuários dos funcionários e residentes.
3.2 Rol
Chamamos de rol a tabela que apresenta os dados organizados em uma determinada ordem, que
pode ser crescente ou decrescente, para que fique mais fácil a sua contagem, pois o resultado da pesquisa
é feito por meio da contagem dos dados.
Quando a variável em questão é quantitativa, normalmente optamos pela sua organização em ordem
crescente, quando é qualitativa devemos optar por uma sequência lógica para que possamos contá‑las.
Exemplos:

de cada um dos funcionários, obtendo uma tabela primitiva, como mostra a figura a seguir:
Figura 17 – Rol de dados variável qualitativa
2. Uma pesquisa para se determinar a idade de 30 idosos que residem na Casa de Repouso Cayro
apresenta a tabela primitiva a seguir:
36
BIOESTATÍSTICA
Figura 18 – Rol de dados, variável quantitativa
Lembrete
Rol são os dados organizados em uma determinada ordem, crescente

ou decrescente.
Observação
Tanto a tabela primitiva quanto o rol não são considerados tabelas, pois
simplesmente fazem parte da organização dos dados.
Quando trabalhamos com o Microsoft Excel, não é necessário fazer o rol, pois o programa faz a
contagem dos dados brutos, basta colocá‑los na planilha de dados e utilizar a função CONT.SE para
dados qualitativos e CONT.SES para dados quantitativos contínuos.
3.3 Distribuição de frequências sem intervalos de classe
Para dados qualitativos devemos gerar uma tabela de dados chamada distribuição de frequências
sem intervalos de classe, pois as classes são geradas pelas próprias variáveis (respostas) da questão.
Exemplos:

de cada um dos funcionários.
Resolução:
Anteriormente já organizamos os dados para a contagem (Figura 17), agora basta criarmos a tabela
de acordo com as normas do IBGE, como mostra a figura a seguir:
37
Unidade I
Figura 19 – Tabela de distribuição de frequências de nível de escolaridade
2. Foi feita uma pesquisa, com uma amostra de 60 alunos, para avaliar a qualidade do EaD de
determinada universidade. A tabela a seguir apresenta o resultado dessa pesquisa, após ter sido
feita a contagem dos dados.
Figura 20 – Tabela de distribuição de frequências de avaliação do curso de EaD
Lembrete
A apuração de dados de variáveis qualitativas gera uma distribuição de

frequências sem intervalos de classe.
Observação
O Microsoft Excel faz as contagens automaticamente.
Contagem no Microsoft Excel:
No primeiro exemplo, criada a tabela, vamos contar a quantidade de pessoas que não são alfabetizadas,
a quantidade de pessoas que têm Ensino Fundamental incompleto, a quantidade de pessoas que têm
Ensino Fundamental completo e a quantidade de pessoas que têm Ensino Médio.
38
BIOESTATÍSTICA
Para tanto, basta seguir os passos:
1. Criamos a tabela com as variáveis em questão, como mostra a figura a seguir.
Figura 21 – Criação da tabela com as variáveis em estudo
2. Para se inserir qualquer fórmula no Excel, devemos primeiro utilizar o sinal de igual, pois assim ele
identifica que estamos com intenção de fazer uma conta ou utilizar uma função, a figura a seguir
nos mostra o cursor posicionado na célula B10, em que escrevemos o sinal de igual. E em seguida
clicamos na palavra fx, que se encontra na barra de fórmulas. Note que logo abaixo da palavra,
aparece escrito “inserir função”.
Figura 22 – Colocamos o sinal de igual na célula em que desejamos fazer a conta
3. Ao clicar na palavra fx da barra de fórmulas, uma janela se abrirá com todas as funções do Excel,
como na figura a seguir:
39
Unidade I
Figura 23 – Demonstrativo de janela de funções do Excel
4. Clique em OK e aparecerá outra janela, agora do argumento da função CONT.SE, que deve
ser preenchida em primeiro lugar com as células do intervalo em que se quer contar e qual o
critério de contagem, no nosso caso, a contagem será dos não alfabetizados, então, escolhemos
a célula C4, que é o local onde se encontra o primeiro não alfabetizado dos nossos dados, como
na figura a seguir:
Figura 24 – Argumentos da função CONT.SE
Com a janela aberta, em intervalo, selecionamos o intervalo de A2 até E7, como mostra a figura:
Figura 25 – Seleção de intervalo para contagem dos dados
40
BIOESTATÍSTICA
Com a janela aberta, em critério, selecionamos a célula C4 (Não Alfabetizados), como mostra a figura
a seguir.
Figura 26 – Seleção do critério para a contagem de dados
Note que, ao terminar de preencher o intervalo e o critério, o Microsoft Excel já apresenta o resultado
da fórmula em dois momentos: abaixo do “Não Alfabetizados” e, ao final, no canto direito: Resultado da
fórmula= 4 (veja figura 24).
Não é necessário escrever as células no item intervalo na janela, pois, enquanto a janela está ativa,
basta você selecionar, com o mouse, todo o intervalo de dados e ele já escreve A2:E7, que quer dizer que
ele procurará de A2 até E7, incluindo essas duas células, como na figura 25.
Para inserir o critério o procedimento é o mesmo, nesse caso, como critério você escolhera a célula
C4, como mostra a figura 26, onde está escrito “Não Alfabetizado”. Note que na janela de argumentos
da função (figura 24), ao lado do campo de critério, ele escreve “Não Alfabetizado”.
Clique em OK e, a partir daí, devemos proceder da mesma maneira para todas as outras variáveis,
como mostra a figura a seguir.
Figura 27 – Fórmulas para a contagem de dados no Microsoft Excel
Como podemos observar, na 2ª coluna temos as fórmulas de contagem e, ao final, a soma dos
valores. Para obter a soma, basta clicar no botão S, que se apresenta na barra de menus, e aceitar o
intervalo que ele oferece, como mostra a figura a seguir.
41
Unidade I
Figura 28 – Efetuando a soma dos dados
E então, no formato do IBGE, temos:
Figura 29 – Tabela de distribuição de frequências feita em Microsoft Excel
Saiba mais
Você pode obter mais informações a esse respeito, bem como mais
exemplos sobre essas tabelas no livro:
VIEIRA, S. Estatística básica. São Paulo: Cengage Learning, 2012.
3.4 Distribuição de frequências com intervalos de classe
Para dados quantitativos contínuos, devemos gerar uma tabela de dados chamada distribuição de
frequências com intervalos de classe. Para que possamos distribuir dados contínuos em linhas e colunas,
devemos, ao contrário da distribuição sem intervalos de classes, determinar quantas linhas e como
os dados estarão dispostos nessas linhas. Para tanto, devemos utilizar algumas fórmulas que serão
colocadas a seguir.
42
BIOESTATÍSTICA
Exemplo: uma pesquisa para se determinar a idade de 30 idosos que residem na Casa de Repouso
Cayro apresenta o rol da figura a seguir:
Figura 30 – Rol de dados variável quantitativa
Para criarmos a distribuição de frequências desses dados, vamos seguir os seguintes passos:
1. Primeiro temos que saber quantas linhas terá a tabela. Para isso, devemos utilizar a fórmula:
i= n
Onde:
i = número de linhas que a tabela deve ter.
n = número de pessoas entrevistadas.
O nosso exemplo tem uma amostra n de 30 idosos, portanto, faremos:
i = 30 = 5, 48 ≅ 5
Logo, nossa tabela terá 5 linhas.
Então, devemos distribuir as 30 idades em 5 linhas.
2. Para descobrirmos qual deve ser o intervalo de classes devemos escolher a menor idade do rol
(chamada de limite máximo dos dados (Lmin = 65) e a maior idade do rol (chamada de limite
máximo dos dados (Lmáx = 89).
A amplitude do intervalo de classe será dada por
L m á x − L min
h=
i
43
Unidade I
No nosso exemplo temos:
maior idade − menor idade

h=
i
89 − 65 24
h= = = 4, 8 ≅ 5
5 5
Portanto, devemos ter uma tabela com 5 linhas e amplitude de 5 anos.
Temos então que criar a tabela inicial, com 5 linhas, e colocar os intervalos de classes, como na figura a seguir.
Figura 31 – Como criar a distribuição de frequências para dados contínuos
As idades iniciam em 65 (menor idade), acrescentamos 5 (amplitude), levamos o último número para
a próxima linha e acrescentamos 5, e assim por diante.
O símbolo que separa os números (├) representa um intervalo fechado à esquerda e aberto à direita
(significa que incluímos o número da esquerda e não incluímos o número da direita), então, contamos todas
as idades 65 anos, inclusive, a 69, pois a idade 70 será contada na próxima linha, e assim sucessivamente.
A tabela a seguir apresenta o resultado final:
Figura 32 –Tabela de exemplo de distribuição de frequências de uma variável contínua
44
BIOESTATÍSTICA
Lembrete
Dados contínuos devem estar dispostos em uma distribuição de

frequências com intervalos de classe.
Contagem das frequências no Microsoft Excel:
Para a contagem das frequências de cada classe, lembremos que agora temos um intervalo numérico,
por isso, a função é CONT.SES e não CONT.SE, pois é um intervalo de números. Por isso, temos que
contar os números do intervalo maiores ou iguais ao primeiro e menores do que o último número,
representados pelo símbolo ├.
O Excel não entende o símbolo (├), portanto temos que colocar as idades em células diferentes para
que possamos contar os números do intervalo, observe a figura a seguir:
Figura 33 – Tabela do Excel
As fórmulas para a obtenção dos resultados estão na figura:
Figura 34 – Exemplos da fórmula CONT.SES para contagem de dados
45
Unidade I
O resultado será a tabela a seguir, já formatada pelas regras do IBGE.
Figura 35 – Tabela: resultado das fórmulas, na tabela já formatada
3.5 Elementos de uma distribuição de frequência
Classes: são intervalos de variação da variável. As classes são representadas simbolicamente por i.
Limites de classe: são os extremos de uma classe. O menor número é o limite inferior da classe (Li)
e o maior número, o limite superior da classe (Ls).
Amplitude de intervalo de classe: é a medida do intervalo que define a classe. É obtida pela
diferença entre os limites superior e inferior dessa classe e indicada por Hi:
Hi = Ls – Li.
Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe (limite
superior máximo) e o limite inferior da primeira classe (limite inferior mínimo):
AT = Ls(máx.) – Li(mín.)
Amplitude amostral (AA): É a diferença entre o valor máximo e o valor mínimo da amostra:
AA = L(máx.) – L(mín.)
Ponto médio de uma classe (xi): É o ponto que divide o intervalo de classe em duas partes iguais
(média aritmética).
Li + Ls
xi =
2
46
BIOESTATÍSTICA
3.6 Tipos de frequências
Frequência simples ou absoluta (Fi): são os valores que realmente representam o número de
dados de cada classe. A soma das frequências simples sempre tem como resultado n, isto é, o número
de entrevistados.
Frequências relativas (Fri): são os valores das razões entre as frequências simples e a frequência
total.
Fi
Fri =
∑ Fi
Frequência percentual (Fri%): é a frequência relativa multiplicada por 100.
Fri%=Fri x 100
Frequência acumulada (Fa): é o total das frequências de todos os valores inferiores ao limite
superior do intervalo de uma dada classe. Para completar a coluna, devemos copiar a primeira frequência,
F1 e somar sucessivamente as outras frequências.
Frequência acumulada relativa (Fra) de uma classe: é a frequência acumulada da classe, dividida
pela frequência total da distribuição:
Fa
Fra =
∑ Fi
Frequência percentual (Fra%): é a frequência relativa acumulada multiplicada por 100.
Fra% = Fra x 100
Exemplos:
1. A tabela a seguir é a distribuição de frequências completa, com todas as frequências, da pesquisa

sobre o nível de escolaridade de 30 funcionários do Hospital Baruch de Toulouse.
Figura 36 – Tabela com as frequências acumulada, relativa e percentual
47
Unidade I
2. A tabela a seguir é a distribuição de frequências completa, com todas as frequências, da pesquisa

de idades da Casa de Repouso Cayro.
Figura 37 – Tabela de distribuição de frequências completa
Agora, com a tabela completa, já podemos fazer observações importantes, tais como:
A maioria dos idosos residentes na Casa de Repouso Cayro tem idade acima de 75 anos, ou melhor,
de 77,5 anos, perfazendo 30% dos idosos, seguidos de 27% de idosos com média de 82,5 anos.
Após a organização dos dados na tabela, podemos fazer as inferências necessárias aos nossos estudos.
Lembrete
Os resultados da tabela foram calculados com as fórmulas de suas

respectivas frequências.
Observação
Note que o ponto médio da classe só é feito no caso de tabelas com

intervalos de classe.
Se você quiser, poderá fazer complementar a tabela do Microsoft Excel, com as fórmulas demonstradas
na figura a seguir. As frequências absolutas já foram demonstradas com mais clareza na figura anterior.
Figura 38 – Tabela completa com as fórmulas no Microsoft Excel
48
BIOESTATÍSTICA
3.7 Gráficos estatísticos
A apresentação dos resultados da pesquisa em gráficos é utilizada para tornar a leitura dos resultados
mais simples, representando com mais clareza os resultados da pesquisa, não só para o pesquisador, mas
também para o público em geral.
Os gráficos estatísticos são construídos em um sistema de coordenadas cartesianas, porém, temos

que lembrar que os resultados apresentados representam apenas um dos eixos do gráfico, o outro eixo
apresenta a variável em estudo.
Portanto, utiliza‑se apenas um dos eixos para os resultados. Assim, será utilizado, sempre,
um eixo abscissas ou ordenadas, dependendo do tipo de gráfico, para as ocorrências da variável
(resultado da pesquisa), e o outro eixo será apenas para o nome ou valor da variável: qualitativa
(“sim”, “não”, “concordo totalmente”, “parcialmente” etc.) ou quantitativa (estatura média da classe,
idade média etc.).
3.8 Tipos de gráficos
Os gráficos mais comuns são: gráfico de setores ou pizza; gráfico de barras; gráfico em colunas;
gráfico de linhas; e histograma de frequências. O Microsoft Excel apresenta uma grande variedade de
gráficos estatísticos disponíveis para utilização.
Em geral, utilizam‑se gráficos em setores, barras e colunas para variáveis qualitativas e gráfico em
linhas e histograma de frequências para variáveis quantitativas.
Lembrete
Gráfico estatístico é a maneira como apresentamos os resultados da

pesquisa de forma mais inteligível a todos.
3.8.1 Gráfico em linha ou em curva – polígonos de frequências
Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística, que também
serve para mostrar as frequências absolutas e as frequências acumuladas.
Normalmente é utilizado para variáveis quantitativas, quando se quer visualizar a evolução temporal
de uma variável. Pode ser feito com linhas retas ou por curvas. Esse, em geral, é o gráfico utilizado para
mostrar a evolução dos candidatos em época de eleição, por exemplo.
Quando a variável é quantitativa contínua gera distribuições com intervalos de classe, no eixo x são
colocados os pontos médios das classes.
49
Unidade I
Exemplos:
1. O gráfico a seguir compara a quantidade de gestantes que foram encaminhadas ao Hospital

Maternidade Baruch de Toulouse e a quantidade que foi recusada pelo hospital.
Figura 39 – Exemplo de gráfico em linha
2. O gráfico a seguir apresenta o resultado da pesquisa feita com as idades dos idosos da Casa de
Repouso Cayro.
Figura 40 – Exemplo de gráfico em linhas utilizando os dados da Casa de Repouso Cayro
Lembrete
O gráfico em linhas normalmente é utilizado para variáveis quantitativas

contínuas, quando desejamos apresentá‑las em evoluções temporais ou
quando desejamos compará‑las.
50
BIOESTATÍSTICA
Observação
A construção de gráficos no Microsoft Excel é extremamente simples e,

com certeza, o seu gráfico ficará muito mais apresentável.
Vamos seguir os passos para fazer o gráfico que se encontra no segundo exemplo, utilizando dados
da Casa de Repouso Cayro (figura 40).
1. Selecione, na tabela, apenas a coluna das frequências, e clique em “Inserir”, como mostra a figura
a seguir. Note que o menu de gráficos aparece à sua direita, logo após o menu de ilustrações.
Figura 41 – Gráficos no Excel
Atenção: se selecionarmos duas colunas numéricas, o Excel entenderá que se quer fazer um gráfico
comparando duas variáveis.
2. Na barra de gráficos, clicamos na opção “Linhas” e um menu suspenso aparecerá, possibilitando

a escolha do tipo de gráfico de linhas que desejamos. No nosso exemplo será utilizada a primeira,
como na figura a seguir:
Figura 42 – Escolha do tipo de gráfico
51
Unidade I
3. Ao clicar, o gráfico aparecerá na tela, mas de forma rústica, como na figura a seguir. Você pode
utilizar o layout e o formato que desejar nas opções de menu do Excel. Quando o gráfico está
selecionado, aparecem as opções “Designs”, “Layout” e “Formatar”, para que se possa escolher a
formatação que desejar.
Figura 43 – Gráfico estatístico no Microsoft Excel
Note que o eixo das abscissas (x) está composto por números sequenciais. Devemos, então, modificar
esses dados e colocar a média das idades no eixo.
4. Para modificar os dados do eixo x, devemos proceder da seguinte maneira: selecione os valores
do eixo x, clique com o botão direito do mouse e escolha a opção “Selecionar Dados...”, como
na figura:
Figura 44 – Como modificar dados de um eixo, no Microsoft Excel
5. Uma nova janela se abrirá. Então devemos, na opção “Rótulos do Eixo Horizontal”, escolher a
opção “Editar”, como na figura a seguir:
52
BIOESTATÍSTICA
Figura 45 – Editar dados do eixo das abscissas
6. Abre‑se outra janela, selecionamos os dados, na tabela, com os valores que desejamos inserir no
eixo e clicamos em “OK”, na próxima janela, como na figura a seguir, e “OK” outa vez para sair da
janela.
Figura 46 – Alteração dos dados do eixo das abscissas
Pronto, os dados foram anexados ao eixo, como mostra o gráfico a seguir:
Figura 47 – Média das idades dos idosos (xi), no eixo horizontal
Vimos o gráfico em linhas e aproveitamos para aprender a fazê‑lo no Excel. O procedimento é o

mesmo para todos os tipos de gráficos que o software oferece, menos os gráficos de dispersão, que são a
melhor opção quando for necessário utilizar dados para o eixo horizontal e vertical, isto é, um ponto de
coordenadas (x, y). Em estatística, esse gráfico é utilizado apenas em correlação e regressão, e a própria
Curva de Gauss.
53
Unidade I
O gráfico em linhas não é de tão fácil visualização, a não ser que realmente tenhamos várias séries
para apresentar, como no exemplo do Hospital Maternidade Baruch de Toulouse.
3.8.2 Histogramas
Os histogramas são gráficos formados por retângulos justapostos (sem espaço entre eles), em que
o eixo vertical apresenta a frequência absoluta ou relativa das observações dentro de cada intervalo e
o eixo horizontal apresenta a variável em estudo, que normalmente deve ser uma variável quantitativa
contínua representada em seu ponto médio (xi).
Exemplos:
1. O gráfico a seguir apresenta o resultado da pesquisa feita com as idades dos idosos da Casa de
Repouso Cayro.
Figura 48 – Histograma representando a idade média dos idosos da Casa de Repouso Cayro
2. Feita uma pesquisa a respeito da estatura de 40 alunos de uma classe do curso de Gestão Hospitalar,
os resultados estão apresentados no gráfico a seguir.
Figura 49 – Histograma representando a estatura de 40 alunos do curso de Gestão Hospitalar
54
BIOESTATÍSTICA
Lembrete
Os histogramas são comumente utilizados para variáveis quantitativas

contínuas em seus pontos médios.
Observação
O histograma é um gráfico de mais fácil leitura, por isso, muitas vezes,

ele passa a ser a melhor opção para variáveis contínuas.
Para fazer um histograma no Microsoft Excel, siga os passos para a construção de gráficos, apresentados
anteriormente (escolha colunas, e a opção de layout 8), e depois a formatação do gráfico pode ser a seu gosto, tente.
3.8.3 Gráfico em colunas ou em barras
O gráfico em colunas é a representação dos dados da tabela por meio de retângulos dispostos
verticalmente, o de barras é a representação dos dados dispostos horizontalmente. Esses gráficos são
muito populares e muito utilizados nas apresentações por serem de fácil leitura.
Em geral, são utilizados para variáveis qualitativas, ou seja, dados nominais ou ordinais, e
frequentemente apresentando frequências percentuais.
O gráfico em colunas apresenta retângulos com mesma base e as alturas proporcionais aos valores
de contagem das variáveis, já em barras, apresenta retângulos de mesma largura e os comprimentos
proporcionais aos valores de contagem das variáveis.
Exemplos:
1. O gráfico a seguir apresenta o resultado da pesquisa para se determinar o nível de escolaridade de

uma amostra de 30 funcionários do Hospital Baruch de Toulouse (figura 36).
Figura 50 – Gráfico em colunas relativo aos dados da tabela da figura 36
55
Unidade I
2. O gráfico 7 apresenta o resultado da pesquisa para avaliar a qualidade do EaD de determinada

universidade (figura 20), pela frequência percentual.
Figura 51 – Gráfico em barras relativo aos dados da tabela da figura 20, em porcentagem
Lembrete
Gráficos em colunas ou barras normalmente são utilizados para

apresentar variáveis qualitativas.
Observação
No Microsoft Excel, quando a variável é qualitativa, pode‑se selecionar

a coluna da variável e dos dados ao mesmo tempo, porque uma delas é
texto e a outra é número.
O Microsoft Excel assume os números como valores da variável e as letras como legenda dos dados.
3.8.4 Gráfico em colunas ou em barras múltiplas
Utilizamos o gráfico em colunas ou barras múltiplas para comparar o desempenho de duas ou mais
variáveis.
Exemplos:
1. O gráfico a seguir apresenta o resultado da comparação entre a idade gestacional de gestantes de

triagem do hospital maternidade Baruch de Toulouse de setembro de 2012 a setembro de 2013.
56
BIOESTATÍSTICA
Figura 52 – Exemplo 1 de gráfico de colunas múltiplas
2. O gráfico a seguir apresenta o resultado do motivo da recusa de gestantes de triagem do Hospital

Maternidade Baruch de Toulouse, em Guaxupé, de setembro de 2012 a setembro de 2013.
Figura 53 – Exemplo 2 de gráfico de colunas múltiplas
Lembrete
Gráfico em colunas ou barras múltiplas é utilizado para comparar o

desempenho de variáveis.
Observação
No Microsoft Excel podemos selecionar todas as variáveis ao mesmo

tempo e escolher inserir gráfico em colunas ou barras.
Para selecionar colunas que não sejam seguidas basta segurar a tecla Ctrl enquanto seleciona as
colunas desejadas.
57
Unidade I
3.8.5 Gráfico em setores
Comumente conhecido como gráfico em pizza, é construído com base em um círculo e é muito
utilizado para demonstrar o desempenho de uma variável em relação ao total. Por isso, em geral, utiliza‑se
a frequência percentual para expor os dados. É indicado para apresentar variáveis qualitativas, mas não
fica muito bom se tivermos muitas categorias, pois ficariam pequenos espaços da circunferência para
cada variável.
Para construirmos esse gráfico a mão, devemos ter um compasso e um transferidor, pois temos que
levar em conta que os valores percentuais estarão representando partes da circunferência, que tem por
total representados 360º. Logo, as porcentagens devem ser transformadas em graus, de forma que essa
circunferência ficará dividida em tantos setores quantas são suas partes e esses setores são medidos em graus.
Em primeiro lugar, devemos fazer a transformação das partes, em geral em porcentagem, para graus.
Para essa transformação, devemos utilizar uma regra de três simples, que terá a correspondência 100%
para 360º.
Exemplo:
1. Para uma porcentagem de 52%, temos:
360º 100%
X 52%
X = (360* 52)/100
X = 187,2º
Então fazemos a circunferência com o compasso e medimos, com o transferidor, 187,2º, sempre no
sentido anti‑horário, marcamos a parte e pintamos.
2. Para uma porcentagem de 8%, temos:
360º 100%
X 8%
X = (360* 8)/100
X = 28,8º
Fazemos a circunferência com o compasso e medimos, com o transferidor, 28,8º a partir do anterior
e assim sucessivamente.
58
BIOESTATÍSTICA
Exemplos:
1. O gráfico a seguir apresenta o resultado da pesquisa para se determinar o nível de escolaridade

(figura 36) de uma amostra de 30 funcionários do Hospital Baruch de Toulouse.
Figura 54 – Exemplo 1 de gráfico em setores
2. O gráfico a seguir apresenta o resultado da pesquisa para avaliar a qualidade do EaD de determinada
universidade (figura 20), pela frequência percentual.
Figura 55 – Exemplo 2 de gráfico em setores
Lembrete
O gráfico em setores é comumente conhecido por gráfico de pizza, é

utilizado para variáveis qualitativas e utiliza porcentagem para apresentar
os dados.
59
Unidade I
Observação
O Microsoft Excel faz automaticamente a transformação de porcentagem

para graus.
4 MEDIDAS DE TENDÊNCIA CENTRAL E DE VARIABILIDADE
Medidas de tendência central são utilizadas para avaliar a tendência dos dados em se agrupar em
torno de valores centrais nas tabelas ou em sequências numéricas chamadas de dados não agrupados.
As medidas de tendência central são: a média aritmética, a mediana, a moda e podem ser calculadas
para dados qualitativos e quantitativos.
Observação
Dados não agrupados são aqueles que não se encontram em tabelas de

distribuição de frequências.
4.1 Média aritmética (X)
A média aritmética é empregada quando desejamos obter a medida de posição que possui maior
estabilidade. Como é uma medida de tendência central, normalmente ela tem como resultado um
número que está no centro ou perto do centro da distribuição, porém, dependendo da variabilidade dos
dados, ela também pode tender à maior concentração de dados.
4.1.1 Média aritmética para dados não agrupados
Quando desejamos conhecer a média dos dados não agrupados, isto é, números que não se encontram
agrupados em tabelas, determinamos a média aritmética simples, dada pela fórmula:
x=
∑ xi
n
Onde:
x = média aritmética.
∑ xi = soma de todos os elementos da sequência numérica.

n = número de elementos da sequência numérica.
60
BIOESTATÍSTICA
Observação
A letra grega Σ (sigma, maiúscula) é o sinal de somatório, utilizado para

apresentar a soma de todos os elementos da sequência.
Exemplos:
1. Para testar a qualidade do atendimento, o gestor do Hospital e Maternidade Baruch de Toulouse

está anotando o tempo que 15 pacientes aguardam na recepção para serem atendidos. Os dados
estão na tabela a seguir:
Figura 56 – Tempos de espera em minutos
Resolução:
x=
∑ xi
n
n = 15 (15 tempos anotados)
217, 60
x= = 14, 51 minutos
15
Portanto, o tempo de espera médio para o atendimento dos pacientes do hospital na recepção é de
14,51 minutos.
61
Unidade I
2. Um professor deseja saber a nota média de seus alunos na prova, para tanto separa as notas:
5,5 7,0 10,0 3,0 4,0 8,0 2,0 3,5 6,7 9,2 6,6 7,8
Resolução:
x=
∑ xi
n
n = 12 (são 12 notas)
5, 5 + 7 + 10 + 3 + 4 + 8 + 2 + 3, 5 + 6, 7 + 9, 2 + 6, 6 + 7, 8
x=
12
73, 3
x= = 6,108 ≅ 6,1
12
Portanto, a nota média dos alunos foi de 6,1.
Lembrete
Média aritmética para dados não agrupados é a soma de todos os

valores dividida pela quantidade de valores.
Observação
A média aritmética de dados não agrupados pode ser feita facilmente

no Microsoft Excel, basta selecionar os dados e utilizar a função média.
4.1.2 Média aritmética para dados agrupados
Dados agrupados são aqueles resultantes de uma ordenação, isto é, tabulação de dados. Portanto,
apresentam‑se em tabelas e podem ser variáveis quantitativas contínuas ou discretas.
Para efetuarmos a média aritmética desse tipo de dados, devemos utilizar, na verdade, a média
aritmética ponderada, sendo o fator de ponderação a própria variável em estudo.
x=
∑ Xi × Fi
∑ Fi
62
BIOESTATÍSTICA
Onde:
ΣXi × Fi = soma dos produtos de todas as frequências pelo ponto médio da classe.
ΣFi = soma de todas as frequências (nº de entrevistados).
Observação
Se os dados agrupados são de variáveis qualitativas, não existe

ponderação, então a fórmula deverá ser a mesma apresentada para dados
não agrupados.
Exemplos:
1. Vamos fazer a média das idades dos idosos residentes na Casa de Repouso Cayro.
Resolução:
Devemos utilizar a tabela que já foi criada em distribuição de frequências, acrescida da multiplicação
e total de Xi por Fi. Assim, temos a tabela a seguir.
Figura 57 – Tabela para cálculo da média aritmética de dados contínuos
A fórmula para determinar a média aritmética é:
x=
∑ Xi × Fi
∑ Fi
63
Unidade I
Pela tabela, temos:
ΣXi × Fi = 2390,0 e ΣFi = 30
Então, temos:
2390, 0
x= = 79, 7 anos
30
Portanto, a idade média dos residentes na casa de repouso é de 79,7 anos.
Observação
Note que a média está praticamente no meio da tabela, por isso é

chamada de medida de tendência central, não esquecendo que também é
o local de maior frequência.
2. A maternidade Athena de Toulouse pretende saber a quantidade de filhos que suas pacientes já
tiveram em suas instalações, vai aos seus arquivos, colhe os dados e os apresenta na seguinte
tabela:
Figura 58 – Tabela para cálculo da média aritmética de dados discretos
Resolução:
Temos:
∑ Xi × Fi = 110 = 2, 2 filhos
∑ Xi × Fi = 110, ∑ Fi = 50, entª o : x =
∑ Fi 50
64
BIOESTATÍSTICA
Para responder a esta questão, devemos considerar que a variável em estudo é quantitativa discreta,
pois não podemos admitir separar crianças em partes, logo a resposta correta é que a média de filhos
que as pacientes tiveram na maternidade é de 2 filhos, com uma leve tendência a três.
Lembrete
Para dados quantitativos devem ponderar a média.
Observação
Note que a média aparece um pouco acima do centro, onde temos a

maior concentração de valores das frequências.
4.2 Mediana (Md)
A mediana também é uma medida de tendência central, mas, diferente da média, é o valor que
se encontra exatamente no centro da distribuição, porém, para que possamos encontrá‑la, devemos
ordenar os números segundo uma ordem de grandeza, ou seja, crescente ou decrescente. Como a média,
também é tratada de forma diferente para dados agrupados e não agrupados.
4.2.1 Mediana para dados não agrupados
Para determinarmos a mediana de dados não agrupados, devemos ordená‑los em ordem crescente
ou decrescente e separar ao meio, o valor que estiver no centro da sequência será a mediana, em caso de
sequências com número par de elementos, devemos achar a média aritmética dos dois valores centrais
e esta será a mediana.
Exemplos:
1. O gestor do Hospital Baruch de Toulouse tem intenção de saber qual a idade mediana dos pacientes
que gastam acima de R$ 300,00 em exames de sangue. Para tanto, separa as idades de 11 desses
pacientes: 65, 60, 45, 32, 55, 55, 65, 78, 92, 94, 50.
Resolução:
Devemos, em primeiro lugar, colocar as idades em ordem crescente, como na figura a seguir.
32 45 50 55 55 60 65 65 78 92 94
Figura 59 – Valores em ordem crescente
Então, escolhemos o valor central para mediana, como mostra a seguinte figura.
65
Unidade I
32 45 50 55 55 60 65 65 78 92 94
Valor central é 60
Figura 60 – Mediana para sequência com quantidade ímpar de valores
Então, Md = 60 anos.
Portanto, a idade média dos pacientes que gastam acima de R$ 300,00 em exames de sangue é de
60 anos.
que gastam acima de R$ 300,00 em exames de sangue. Para tanto, separa as idades 10 desses
pacientes: 65, 60, 45, 32, 55, 55, 65, 78, 92, 94.
Resolução:
Devemos, em primeiro lugar, colocar as idades em ordem crescente:
32 45 55 55 60 65 65 78 92 94
Figura 61 – Dados organizados
Como não temos um valor central definido, devemos fazer a média dos dois valores centrais, como
mostra a figura a seguir:
32 45 55 55 60 65 65 78 92 94
60 + 65 125
Md = = = 62, 5
2 2
Figura 62 – Mediana para sequência com quantidade par de valores
Lembrete
Não se esqueça de organizar os dados.
Observação
No Microsoft Excel, a mediana para dados não agrupados é dada pela

fórmula: =MED(intervalo de células desejado).
66
BIOESTATÍSTICA
4.2.2 Mediana para dados agrupados
Para determinamos a mediana, temos que ordenar os dados, quando tratamos dados agrupados, o
conceito de mediana é o mesmo, porém, para dispormos dados agrupados em ordem crescente, a única
maneira é utilizarmos a frequência acumulada (Fa).
Quando a distribuição é sem intervalos de classe, basta identificar a frequência acumulada

imediatamente superior à metade da soma das frequências.
 ∑ Fi 
 2 
 
A mediana será o valor da variável que corresponde a tal frequência acumulada.
Exemplo:
1. Utilizando os dados da pesquisa da Maternidade Athena de Toulouse, em primeiro lugar, devemos

determinar as frequências acumuladas (Fa), como mostra a tabela a seguir, e depois calcular o
valor da metade da soma das frequências:
 ∑ Fi 
 2 
 
Figura 63 – Tabela de cálculo das frequências acumuladas
∑ Fi = 50 = 25
2 2
Portanto, o valor mediano do número de filhos é o número de filhos que se encontra na classe da Fa
maior mais próxima de 25, no caso a classe de Fa = 34, o que remete à 2 filhos:
67
Unidade I
Figura 64 – Valor da mediana
Portanto, o número mediano de filhos que as pacientes da Maternidade Athena de Toulouse

têm é 2.
Se a distribuição é com intervalos de classes, devemos descobrir qual o número, dentro do intervalo
de classe, da classe mediana, que corresponde à mediana, para isso, temos a fórmula:
 ∑ fi 
 − Fa(ant ) Xh
 2 
Md = Li + 
Fi
Onde:
Md = mediana.
Li = limite inferior da classe mediana.
Fa (ant) = frequência acumulada da classe anterior à classe mediana.
Fi = frequência simples da classe mediana.
H = amplitude do intervalo da classe mediana.
2. Vamos fazer a mediana das idades dos idosos residentes na Casa de Repouso Cayro.
Resolução:
Devemos, em primeiro lugar, fazer a Fa:
68
BIOESTATÍSTICA
Figura 65 – Tabela com as frequências acumuladas
Temos:
∑ Fi = 30 = 15
2 2
Portanto, a classe mediana é a 3ª, então os dados da fórmula estão nessa classe:
 ∑ fi 
 − Fa(ant ) Xh
 2 
Md = Li + 
Fi
Md = 75 +
(15 − 6) × 5
9
9
Md = 75 + × 5
9
Md = 75 + 5
Md = 80
Portanto, a mediana das idades é 80 anos.
Lembrete
Para determinar a mediana de dados agrupados, devemos fazer a

frequência acumulada (Fa).
69
Unidade I
Observação
O Microsoft Excel não apresenta funções automáticas para dados

agrupados, portanto, devemos inserir a fórmula para que ele execute as
operações e apresente o resultado correto.
4.3 Moda (Mo)
Denominamos moda o valor que ocorre com maior frequência em uma série de valores.
4.3.1 Moda para dados não agrupados
Quando os dados não estão agrupados, a moda é, de acordo com a definição, o valor que mais se
repetir na sequência.
Uma série de dados pode não ter nenhum elemento que se repete, não apresentando moda.
Portanto, será chamada de amodal. Ela pode ainda possuir mais de um elemento que se repete na
mesma quantidade. Se forem dois, por exemplo, terá duas modas e será chamada de Bimodal, e assim
por diante.
Exemplos:
que gastam acima de R$ 300,00 em exames de sangue. Para tanto, separa as idades de 11 desses
pacientes: 65, 60, 45, 32, 55, 55, 65, 78, 92, 94, 50.
Resolução:
A moda será o valor que mais repete, nesse caso, podemos notar que a idade 55 anos aparece duas
vezes e 65 anos também, logo, temos duas modas: Mo = 55 anos e Mo = 65 anos.
Essa distribuição é chamada de bimodal.
Lembrete
No caso de sequências numéricas, pode haver mais de uma moda ou

nenhuma moda (amodal).

está anotando o tempo que 15 pacientes aguardam para ser atendidos ao chegarem na recepção.
Os dados estão na tabela a seguir. Vamos determinar qual é o tempo modal de espera dos pacientes.
70
BIOESTATÍSTICA
Figura 66 – Tempos de espera em minutos
Resolução:
O valor que mais repete é o tempo 14,5, logo, esse é o tempo modal:
Mo = 15 minutos.
Observação
No Excel, a moda para dados não agrupados é dada pela fórmula:

=MODO.MULT, quando temos mais de uma moda, como no primeiro
exemplo, pressionamos CTRL+SHIFT+ENTER, em vez de OK.
4.3.2 Moda para dados agrupados
Se os dados estão agrupados sem intervalos de classes, determinamos a moda pela definição, isto
é, basta escolher o valor da variável de maior frequência.
Exemplos:
1. Em uma pesquisa para se determinar o nível de escolaridade de uma amostra de 30 funcionários

do Hospital Baruch de Toulouse, foram obtidos os dados da tabela a seguir. Vamos determinar
qual a escolaridade modal dos funcionários do hospital:
71
Unidade I
Figura 67 – Dados do Hospital Baruch de Toulouse
Resolução:
Para determinarmos a moda, basta observar a coluna das frequências absolutas e encontrar a maior
frequência, esta será a classe modal e a moda será o grau de escolaridade que se encontra nessa classe.
Assim, podemos observar que, na tabela, temos como moda o grau de escolaridade Fundamental
incompleto, pois a sua frequência é 17, a maior frequência de todas.
Portanto:
Mo = Fundamental incompleto
2. A seguinte tabela apresenta os dados que demonstram a quantidade de filhos que as pacientes da
maternidade Athena de Toulouse já tiveram em suas instalações. Vamos determinar o valor modal
da quantidade de filhos dessas pacientes.
Resolução:
Figura 68 – Tabela de dados da maternidade Athena de Toulouse
72
BIOESTATÍSTICA
A observação da coluna das frequências absolutas nos mostra que a maior frequência é 18, portanto,
a classe modal é a segunda, o que nos permite dizer que a moda da quantidade de filhos das pacientes
da maternidade Athena de Toulouse é de 2 filhos.
Então:
Mo = 2 filhos.
Se os dados estão agrupados com intervalos de classes, determinamos a classe modal pela
definição, isto é, a classe que apresenta maior frequência, e utilizamos como resposta o ponto médio da
classe (xi). Esse valor é chamado moda bruta.
Exemplo:
1. Vamos fazer a moda das idades dos idosos residentes na Casa de Repouso Cayro.
Resolução:
Temos que utilizar o ponto médio da classe para responder qual é a moda, para tanto, temos a tabela
a seguir, que apresenta a distribuição com os valores dos respectivos pontos médios das classes:
Figura 69 – Tabela de idade dos idosos da casa de repouso
Como podemos perceber, já está demonstrada a classe modal, pois a maior frequência absoluta é 9, então
podemos dizer que a classe modal é a 3ª e a moda da distribuição é o ponto médio dessa classe, que é 77,5 anos.
Logo: Mo = 77,5 anos
Lembrete
Para determinar a moda de uma sequência ou distribuição, basta

escolher o valor que mais se repete.
73
Unidade I
Observação
Dados agrupados só admitem uma moda, o valor que mais repete. O

Microsoft Excel não tem função de moda para dados agrupados.
4.4 Emprego da média, da mediana e da moda
A média aritmética é empregada quando desejamos obter a medida de posição que possui maior
estabilidade.
A mediana é empregada quando se deseja obter o ponto que divide a distribuição em partes iguais;
quando há valores extremos que afetam a média de maneira acentuada.
A moda é utilizada quando se deseja obter uma medida rápida e aproximada de posição ou quando
a medida de posição deve ser o valor mais típico da distribuição.
4.5 Medidas de dispersão: variância, desvio padrão para dados agrupados

e não agrupados
A média, a mediana e a moda descrevem bem um conjunto de dados, desde que a sua variabilidade
(inconstância) não seja muito grande. Para que possamos dar sustentação à média aritmética, devemos
calcular a sua dispersão, ou seja, verificar como os dados estão espalhados em relação à média. Para
calcular essa variabilidade, temos as medidas de dispersão, variância e desvio padrão.
Exemplos:
1. No Hospital Baruch de Toulouse, as idades dos 10 colaboradores são: 30, 30, 30, 32, 30, 30, 33, 29,
33 e 30
A média dessas idades é:
(30+30+30+32+30+30+33+29+33+30)/10 = 30,7 @ 31 anos.
O que descreve bem as idades, pois não são muito dispersas, variam entre 29 e 33 anos, logo, 31 é o
centro das idades.
2. Em uma unidade de saúde da Maternidade Athena de Toulouse, localizada na cidade de Guaxupé,

as idades dos 10 colaboradores são: 16, 30, 28, 28, 65, 30, 32, 26, 25 e 25.
A média dessas idades é:
(16+30+28+28+65+30+32+26+25+25)/10 = 30,5 @ 31 anos.
74
BIOESTATÍSTICA
Nesse caso, temos como resultado a mesma média do exemplo anterior, 31 anos, porém, a variação
das idades (variabilidade) é muito diferente do primeiro exemplo, pois a menor idade é 16 anos e a
maior é 65.
Esses dois extremos (16 e 65) são chamados, em estatística, de outliers.
Observação
Outliers são valores que apresentam grande afastamento dos demais

da série.
Por meio desses dois exemplos podemos notar que as duas médias apresentam o mesmo resultado,
porém, 31 anos descreve muito bem os dados do Hospital Baruch de Toulouse, mas não tão bem as
idades de sua filial.
Esses dados mostram que, quando apresentamos uma medida de tendência central, devemos
apresentar também uma medida de variabilidade ou dispersão para podermos demostrar como os dados
estão variando com relação a essas medidas.
4.5.1 Variância (S²)
A variância de um conjunto qualquer de dados (uma sequência numérica), ou seja, dados não
agrupados, é determinada pela fórmula:
Variância populacional:
σ2 =
∑ (x − µ)
N
Variância amostral:
∑ (x − x )
2
2
S =
n −1
Onde:
σ2 = variância populacional
S² = variância amostral
x = elemento qualquer do conjunto considerado.
75
Unidade I
µ ( ou x) = a média do conjunto de dados.
N (ou n) = total de elementos computados (da população ou da amostra).
Observação
As letras gregas s (sigma) e m (mi) são utilizadas para a fórmula da

variância populacional. Utilizaremos a fórmula para variância amostral,
pois normalmente tratamos amostras em nossas pesquisas.
Para dados agrupados, a fórmula para amostra é:
S2 =
∑ ( xi − x )2.Fi
n −1
Onde:
S² = variância amostral.
x = a média do conjunto de dados.
n = total de elementos computados da amostra.
Observação
Existem outras fórmulas para calcular a variância de dados não

agrupados, em Bioestatística, normalmente utilizamos a fórmula anterior.
4.5.2 Desvio padrão (S)
A variância é uma medida que não faz parte dos dados, apenas nos diz o quanto eles estão
dispersos em relação à média. Para que possa ser comparável com os dados, devemos expressá‑la na
mesma magnitude em que os dados se encontram, para tanto, devemos calcular o desvio padrão.
Nesse caso para dados não agrupados, que é obtido por meio da raiz quadrada da variância, como
nas fórmulas:
76
BIOESTATÍSTICA
Desvio padrão populacional:
∑ ( x − u)
2
σ=
N
Desvio padrão amostral:
2
s=
∑ (x − x )
n −1
Onde:
µ ( ou x) = a média do conjunto de dados.
N (ou n) = total de elementos computados (da população ou da amostra).
Observação
A fórmula utilizada para o desvio padrão é a mesma da variância, só

que agora dentro do sinal de radical, portanto, o desvio padrão é a raiz
quadrada da variância.
Para dados agrupados, a fórmula para o desvio padrão é dada por:
∑ ( xi − x )
2
.Fi
s=
n −1
Onde:
x = a média do conjunto de dados.
n = total de elementos computados (da população ou da amostra).
Fi= frequência da classe.
77
Unidade I
Observação
Existem outras fórmulas para calcular o desvio padrão de dados
agrupados, a opção foi utilizar a fórmula que tem referência à escolhida
para variância.
Exemplos:
1. No Hospital Baruch de Toulouse, as idades de 10 colaboradores são: 30, 30, 30, 32, 30, 30, 33, 29,
33 e 30, vamos calcular qual é a variância e o desvio padrão dessas idades:
Resolução:
Para calcularmos a variância de dados não agrupados, utilizamos a fórmula:
s2 =
∑ (x − x )2
n −1
Devemos, em primeiro lugar, fazer a média aritmética dos valores:
x=
∑ xi
n
307
x= = 30, 7
10
Então, devemos determinar Σ(x-x)2, como mostra a tabela a seguir:
X (X - X)2 Resultado
30 (30 - 30,7)2 0,49
30 (30 - 30,7) 2
0,49
30 (30 - 30,7) 2
0,49
32 (32 - 30,7) 2
1,69
30 (30 - 30,7) 2
0,49
30 (30 - 30,7) 2
0,49
33 (33 - 30,7) 2
5,29
29 (29 - 30,7) 2
2,89
33 (33 - 30,7)2 5,29
30 (30 - 30,7)2 0,49
Total 18,1
Figura 70 – Cálculo do somatório de (x menos a média) ao quadrado
78
BIOESTATÍSTICA
Portanto, temos:
(x-x)2= 18,1
2
s 2
=
∑ (x − x )
n −1
18,1
s2 =
10 − 1
18,1
s2 =
9
s2 = 2,01
Logo, a variância é de 2,01, isso significa que a idade média dos clientes é de 30,7 anos, com variação
de 2,01 para mais ou para menos.
Para colocarmos dentro das nossas idades devemos fazer o desvio padrão. Como ele é definido pela
a raiz quadrada da variância, temos:
s = 2, 01
s = 1,42
O desvio padrão das idades é de 1,42 anos.
Então, podemos afirmar que a idade média dos colaboradores do Hospital Baruch de Toulouse
é de 30,7 anos com desvio de 1,42 anos para mais ou para menos, ou seja, a idade varia de 29,28
anos a 32,12 anos.

está anotando o tempo de espera para atendimento de 15 pacientes que chegam na recepção.
Os dados estão na tabela a seguir. Vamos determinar o desvio padrão do tempo de espera dos
pacientes.
79
Unidade I
Resolução:
Figura 71 – Cálculo do somatório de (x menos a média) ao quadrado
Cálculo da variância:
∑ (x − x )
2
2
s =
n −1
319, 63
s2 =
15 − 1
319, 63
s2 =
14
s2 = 22,83
Logo, a variância é de 22,83, isso significa que o tempo médio de espera para o atendimento na
recepção do hospital é de 14,5 minutos, com variação de 22,83 para mais ou para menos.
Para avaliarmos a nossa variável, devemos calcular o desvio padrão:
Cálculo do desvio padrão:
s = 22, 83
s = 4,78
Então, podemos afirmar que o tempo de espera para o atendimento na recepção do Hospital Baruch
de Toulouse é de 14,5 minutos com desvio padrão de 4,78 anos para mais ou para menos, ou seja, o
tempo varia de 9,72 minutos a 19,28 minutos.
80
BIOESTATÍSTICA
Nesse caso, há uma grande variação no tempo de espera, o que denota que o gestor do hospital deva
tomar alguma providência.
Observação
No Microsoft Excel, para amostras com dados não agrupados, a variância

é dada pela fórmula: =VAR.A(R3:R17)
No caso, R3:R17 é o intervalo das células de que você deseja obter a variância.
O desvio padrão é dado pela fórmula: =DESVPADA(R3:R17).
Com dados agrupados temos os exemplos:
1. Vamos determinar a variância e o desvio padrão da quantidade de filhos que as pacientes da

maternidade Athena de Toulouse já tiveram em suas instalações.
Resolução:
Em primeiro lugar, calculamos a média aritmética para dados agrupados, que já foi feita anteriormente,
tendo como resultado: x = 2,2
Devemos calcular, agora, Σ(xi-x)2 . Fi = 64, como na tabela a seguir:
Número de Fi Xi.Fi
Filhos (X - X)2 (X - X)2.Fi
1 16 16 (1-2,2)2 = 1,44 1,44 . 16 = 23,04

2 18 36 (2-2,2)2 = 0,04 0,04 . 18 = 0,72
3 8 24 (3-2,2)2 = 0,64 0,64 . 8 = 5,12
4 6 24 (4-2,2)2 = 3,24 3,24 . 6 = 19,44
5 2 10 2
(5-2,2) = 7,84 7,84 . 2 = 15,68
Total 50 110 64
Figura 72 – Dados para o cálculo da variância de dados agrupados
Cálculos:
∑ ( xi − x )
2
2 .Fi
s =
n −1
81
Unidade I
64
s2 =
50 − 1
64
s2 =
49
s2 = 1,31
Isso significa que a média da quantidade de filhos que as pacientes da Maternidade Athena de
Toulouse já tiveram em suas instalações é de 2,2, com variação de 1,31.

s = 1, 31
s = 1,14
Isso significa que a média da quantidade de filhos que as pacientes da Maternidade Athena de
Toulouse já tiveram em suas instalações é 2, variando de 1 a 3 filhos.
2. Vamos determinar a variância e o desvio padrão na pesquisa das idades de 30 idosos que residem
na casa de repouso Cayro.
Resolução:
Em primeiro lugar, calculamos a média aritmética para dados agrupados, que já foi feita anteriormente
e teve como resultado:
x = 79,67
Agora, devemos calcular Σ(xi – x)2 . Fi – 1134,17, como na tabela a seguir:
Figura 73 – Cálculos para a variância dos idosos da casa de repouso
82
BIOESTATÍSTICA
Cálculos:
∑ ( xi − x )
2
2 .Fi
s =
n −1
1134,17
s2 =
29
s2 = 39,11
Isso significa que a média das idades de 30 idosos que residem na Casa de Repouso Cayro é de 79,67
anos, com variação de 39,11.
s = 39,11
s = 6,25
Isso significa que a média das idades de 30 idosos que residem na Casa de Repouso Cayro é de 79,67
anos, variando de 73,41 a 85,92 anos.
Lembrete
As fórmulas para cálculo de variância e desvio padrão são diferentes

para dados não agrupados e dados agrupados.
Observação
Note que os valores do intervalo de desvio padrão se encontram, nas

tabelas, sempre onde há maior concentração de valores.
O Microsoft Excel não tem fórmula para cálculo de variância e desvio padrão para dados agrupados.
4.6 Coeficiente de variação (Cv)
O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por
100 para que o coeficiente de variação seja dado em porcentagem.
83
Unidade I
s
cv = ×100
x
Onde:
Cv= coeficiente de variação.
S= desvio padrão.
Exemplos:
1. Para testar a qualidade do atendimento do Hospital e Maternidade Baruch de Toulouse, vamos

utilizar os dados obtidos de sua média e desvio padrão:
s 4, 78
cv = × 100 → cv = × 100 → cv = 0, 33 × 100 = 33%
x 14, 5
2. Para as idades dos 30 idosos que residem na Casa de Repouso Cayro, temos:
s 6, 25
cv = × 100 → cv = × 100 → cv = 0, 0784 × 100 = 7, 84%
x 79, 67
Como podemos perceber, a primeira sequência tem 33% de variação, pois os dados estão muito
dispersos, enquanto que no segundo exemplo, a variação é de apenas 7,84%, pois as idades estão
menos dispersas.
Lembrete
O coeficiente de variação é utilizado para apresentar os valores de

dispersão em torno da média em porcentagem.
Observação
Quanto maior o valor da dispersão dos dados, maior será o coeficiente

de variação.
84
BIOESTATÍSTICA
Saiba mais
Você pode achar mais exemplos, com o tema saúde, de medidas de

posição e dispersão no livro:
BARBETTA, A. P. Estatística aplicada às ciências sociais. 6. ed.

Florianópolis: UFSC, 2006.
Resumo
Bioestatística se utiliza das ferramentas da Estatística que são

consideradas mais importantes para a área da Saúde.
População estatística são todos os elementos portadores de pelo

menos uma característica comum que desejamos analisar, isto é, todos os
entes que possuem a característica que estaremos estudando. Amostra da
população é uma parte dessa população. Para se escolher esta amostra
existem métodos chamados amostragem.
A amostragem pode ser probabilística ou não probabilística. Sempre que

possível, devemos utilizar técnicas probabilísticas para que possamos manter o
máximo possível a chance de um elemento da população participar da amostra.
Variáveis são, então, os possíveis resultados do fenômeno a ser estudado,

elas podem ser qualitativas, que estão divididas em qualitativas nominais e
qualitativas ordinais, ou quantitativas, que estão divididas em quantitativas
discretas ou contínuas, como mostra o esquema a seguir.
Qualitativa
nominal
Qualitativa ou
categorizada
Qualitativa
ordinal
Variável
Quantitativa
discreta
Quantitativa
Quantitativa
contínua
Figura 74 – Resumo de variáveis
85
Unidade I
Coleta de dados é o levantamento dos dados que queremos pesquisar, ela

pode ser feita por meio de elementos informativos de registro obrigatório, ou não,
ou por meio de inquéritos ou questionários formulados pelo próprio pesquisador,
tomando o cuidado de que este questionário venha a suprir seus objetivos.
Temos dois tipos de variáveis, que geram dados: qualitativas ou

quantitativas. Em ambos os casos, para facilitar a contagem manual,
devemos utilizar o Rol, que é a tabela que apresenta os dados organizados.
Variáveis qualitativas são as de contagem. Em alguns exemplos ao longo
do livro‑texto, contamos quantos se encaixavam em cada item e quantos
respondentes escolheram cada alternativa.
Para organizarmos os dados colhidos em uma pesquisa, devemos dispor

esses dados em tabelas, ou distribuições de frequências, estas tabelas
seguem as regras ditadas pelo IBGE.
Se a pesquisa trata uma variável qualitativa, essa distribuição de

frequências é sem intervalos de classes e, se a variável for quantitativa
contínua, os dados serão apresentados em uma distribuição de frequências
com intervalos de classes.
O gráfico estatístico tem a função de mostrar os resultados da pesquisa

com maior clareza. Os gráficos mais comuns são os de linhas, histogramas,
colunas ou barras e o em setores, comumente chamado de gráfico em pizza.
Para cada tipo de variável cabe um tipo de gráfico. Não é uma regra
geral, mas é o usual. Gráficos em linha e histogramas normalmente utilizam
variáveis contínuas, gráficos em colunas ou barras e setores utilizam
variáveis qualitativas. O gráfico em setores, deve ser uma opção apenas
quando o número de variáveis não é muito grande.
Após construirmos tabelas e gráficos, de acordo com as normas, dos

nossos dados, podemos calcular as medidas de tendência central que são:
moda, média e mediana, de acordo com o que desejamos inferir a respeito
desses dados.
Média aritmética, moda e mediana devem ser calculadas de forma

diferente para dados agrupados e não agrupados.
Não podemos esquecer que para fazer a mediana de dados não agrupados,
devemos colocar os dados em ordem crescente ou decrescente e, quando os
dados são agrupados, devemos abrir uma coluna na tabela de dados para a
frequência acumulada (Fa), pois é ela que nos apresentará a classe mediana,
de onde colheremos os dados para substituirmos na fórmula.
86
BIOESTATÍSTICA
As medidas de dispersão são utilizadas para verificar como os dados

estão espalhados em torno da média. Para calcular essa variabilidade,
temos a variância e o desvio padrão, lembrando que o desvio padrão é a
raiz quadrada da variância, com fórmulas diferentes para dados agrupados
e não agrupados.
Após calcularmos o desvio padrão, calculamos o coeficiente de variação

que nos indica a dispersão dos dados na tabela, quanto maior, mais dispersos
estarão os dados.
Exercícios
Questão 1. Um pesquisador elaborou um estudo sobre agressividade, que visava avaliar o “grau médio
de agressividade” de um grupo de pacientes mentais de diversos tipos, todos do sexo masculino. Para
tanto, elaborou escalas de medida adequadas aos seus objetivos. Compareceu ao Hospital Psiquiátrico
de Franco da Rocha que contava com 3000 pacientes, de ambos os sexos, e efetuou um sorteio de 40
pacientes masculinos. Num primeiro levantamento fez uma classificação de doenças mentais. Num
segundo levantamento mediu os graus de agressividade (baixa, média, alta) dos pacientes de sua
amostra. A partir do enunciado, qual é a população, a amostra, a classificação da variável do primeiro
levantamento e a classificação da variável do segundo levantamento, respectivamente?
A) 3000 pacientes; 40 pacientes do sexo masculino; variável qualitativa nominal; variável quantitativa.
B) 3000 pacientes; 40 pacientes do sexo masculino; variável qualitativa nominal; variável qualitativa
ordinal.
C) 40 pacientes do sexo masculino; 3000 pacientes; variável qualitativa ordinal; variável quantitativa.
D) 40 pacientes do sexo masculino; 3000 pacientes; variável quantitativa; variável qualitativa

nominal.
E) 3000 pacientes; 40 pacientes do sexo masculino; variável qualitativa ordinal; variável qualitativa
nominal.
Resposta correta: alternativa B.
Análise das alternativas
A) Alternativa incorreta.
Justificativa: o erro diz respeito à classificação da variável do segundo levantamento. A variável

grau de agressividade é do tipo qualitativa ordinal, pois apresenta uma hierarquia entre as categorias
de agressividade: baixa, média e alta. Desta forma, é incorreto classificá‑la como variável quantitativa.
87
Unidade I
B) Alternativa correta.
Justificativa: esta alternativa apresenta todos os conceitos estatísticos corretos. A população diz
respeito ao total de pacientes do hospital, ou seja, 3000 pacientes. A amostra, que é uma parte da
população, diz respeito aos 40 pacientes do sexo masculino. A variável do primeiro levantamento, tipos
de doenças mentais, é classificada como variável qualitativa nominal, pois há uma nomeação dos tipos
de doenças e, finalmente, a variável do segundo levantamento, graus de agressividade (baixa, média,
alta), é classificada como variável qualitativa ordinal, pois entre as categorias há uma hierarquia entre
os graus de agressividade.
C) Alternativa incorreta.
Justificativa: houve uma inversão entre o que seria população e amostra: 40 pacientes não
caracterizam a população, mas sim a amostra, e 3000 pacientes não se referem à amostra, mas sim
à população. A classificação das variáveis também está incorreta: no primeiro levantamento deve ser
qualitativa nominal e a do segundo levantamento, qualitativa ordinal.
D) Alternativa incorreta.
Justificativa: novamente ocorre uma inversão dos conceitos de população e amostra e as classificações
das variáveis estão incorretas.
E) Alternativa incorreta.
Justificativa: nesta alternativa ocorreu uma inversão na classificação das variáveis estudadas. A do
primeiro levantamento deve ser qualitativa nominal e a do segundo levantamento, qualitativa ordinal,
e não o inverso, como foi apresentado na alternativa.
Questão 2. Analise a seguinte situação: um profissional da área de Saúde realizou uma pesquisa
com 50 pacientes internados em um hospital público para averiguar o nível de ansiedade apresentado
por eles. Construiu uma escala subjetiva para a variável ansiedade, que ia de 1 a 5, como demonstrado
pela tabela a seguir:
Tabela 1
Nível de Ansiedade Fi (número de pacientes)

1 12
2 09
3 18
4 08
5 03
TOTAL 50
88
BIOESTATÍSTICA
A partir dos resultados encontrados, qual o valor médio da ansiedade destes 50 pacientes?
A) 1,3.
B) 4,2.
C) 2,62.
D) 3,22.
E) 1,92.
Resolução desta questão na plataforma.
89

BIOESTATISTICA - Unidade I - UNIP

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

BIOESTATISTICA - Unidade I - UNIP

Enviado por

Direitos autorais:

Formatos disponíveis

Bioestatística

Autora: Profa. Mara Cynthia Ferreira de Carvalho

Dados Internacionais de Catalogação na Publicação (CIP)

C331b Carvalho, Mara Cynthia Ferreira de.

Bioestatística. / Mara Cynthia Ferreira de Carvalho. – São Paulo:

144 p., il.

Nota: este volume está publicado nos Cadernos de Estudos e

1. Bioestatística. 2. Coleta de dados. 3. Amostragem. I. Título.

Profa. Dra. Marilia Ancona Lopez

Prof. Fábio Romeu de Carvalho

Profa. Melânia Dalla Torre

Profa. Dra. Cláudia Andreatini

De acordo com Arango (2009), Florence Nightingale (1820‑1910), fundadora da enfermagem

A bioestatística é a aplicação das ferramentas da estatística à saúde, utilizando as técnicas estatísticas

Crítica dos dados

Apuração dos dados

Figura 1 – Diagrama do cronograma da pesquisa

O objetivo maior da bioestatística é a tomada de decisões, quando se refere a registros de doenças,

Podemos dizer, então, que a Bioestatística se utiliza das ferramentas da

Segundo Arango (1993), Gauss (1777‑1855), considerado o maior

Você pode obter mais informações sobre o tema na obra:

VIEIRA, S. Introdução à bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008.

2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes

2 POPULAÇÃO, AMOSTRA, AMOSTRAGEM, VARIÁVEIS, COLETA DE DADOS E

2.1 População estatística ou universo estatístico

População estatística são os entes que apresentam a característica a ser

Sempre que nos referimos ao número de elementos da população

2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes

Amostragem são técnicas especiais para recolher amostras, que

Não podemos confundir amostra com amostragem. Amostra é uma

2.4 Técnicas de amostragem

Portanto, nossa preocupação central é na escolha de uma amostra realmente representativa.

Quando finalmente decidimos quais informações queremos obter de um levantamento amostral,

Técnicas de amostragem são procedimentos utilizados para escolher

Se não utilizarmos técnicas probabilísticas para amostragem, nossa

2.4.1 Amostragem aleatória simples (probabilística)

Figura 3 – TNA com os números sorteados

2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes

Figura 4 – TNA com os números sorteados coloridos

Amostragem aleatória simples é uma maneira de se escolher uma

O sorteio dos elementos para amostra não necessariamente deve ser

2.4.2 Amostragem sistemática (probabilística)

Uma amostragem obtida selecionando‑se aleatoriamente um elemento entre os K primeiros

O 1º passo é determinar o intervalo de amostragem (K):

N = número de elementos da população.

n = número de elementos da amostra.

Se o resultado for decimal, devemos arredondar para o valor inteiro menor.

O 2º passo é iniciar aleatoriamente a composição da amostra:

O 3º passo é a composição da amostra:

3º item →(b + K) + K ou (b + 2K)

4º item →(b + K + K) + K ou (b + 3K)

A amostragem sistemática também é feita por sorteio, porém, será

O 1º passo é determinar o intervalo de amostragem (K):

Devemos arredondar para o valor menor: K = 6.

O 2º passo é iniciar aleatoriamente a composição da amostra:

O valor de b será um número sorteado na TNA (figura 2) entre 1 e 6.

O 3º passo é a composição da amostra:

18º item → 98 + 6 = 104

19º item → 104 + 6 = 110

20º item → 110 + 6 = 116

21º item → 116 + 6 = 122

22º item → 122 + 6 = 128

23º item → 128 + 6 = 134

24º item → 134 + 6 = 140