Você está na página 1de 89

Bioestatística

Autora: Profa. Mara Cynthia Ferreira de Carvalho


Colaboradores: Profa. Valdice Neves Polvora
Profa. Najla Mahmoud Kamel
Professora conteudista: Mara Cynthia Ferreira de Carvalho

Possui pós‑graduação em Formação em EaD pela Universidade Paulista (UNIP), mestrado em Engenharia de
Produção pela Universidade Paulista (UNIP), licenciatura em Matemática pela Universidade Santa Cecília (UNISANTA)
e licenciatura e bacharelado em Psicologia pela Universidade Católica de Santos (UNISANTOS). Participante do grupo
de pesquisas da Universidade Paulista – UNIP, autora de quatro artigos apresentados em congressos internacionais
com temas relativos à educação presencial utilizando ferramentas de ensino a distância e projetos para motivar alunos
nativos digitais. É professora na UNIP, nos cursos de Ciências da Computação, Engenharia, Matemática, Enfermagem,
Nutrição, Educação Física e Gestão Hospitalar em diversas áreas como: Estatística Descritiva, Estatística Indutiva,
Bioestatística, Tópicos de Informática, Trabalho de Conclusão de Curso, Metodologia do Trabalho Acadêmico. Professora
tutora de ensino a distância e elaboradora do conteúdo de Bioestatística do curso de Farmacologia Aplicada a Prática
Clínica da AVM Faculdade Integrada EaD.

Dados Internacionais de Catalogação na Publicação (CIP)

C331b Carvalho, Mara Cynthia Ferreira de.

Bioestatística. / Mara Cynthia Ferreira de Carvalho. – São Paulo:


Editora Sol, 2021.

144 p., il.

Nota: este volume está publicado nos Cadernos de Estudos e


Pesquisas da UNIP, Série Didática, ISSN 1517-9230

1. Bioestatística. 2. Coleta de dados. 3. Amostragem. I. Título.

CDU 57.087

U512.50 – 21

© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Prof. Dr. João Carlos Di Genio
Reitor

Profa. Dra. Marilia Ancona Lopez


Vice-Reitora de Graduação
Vice-Reitora de Pós-Graduação e Pesquisa

Prof. Fábio Romeu de Carvalho


Vice-Reitor de Planejamento, Administração e Finanças

Profa. Melânia Dalla Torre


Vice-Reitora de Unidades Universitárias

Unip Interativa

Profa. Dra. Cláudia Andreatini


Profa. Elisabete Brihy
Prof. Marcelo Vannini
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli

Material Didático

Comissão editorial:
Profa. Dra. Christiane Mazur Doi
Profa. Dra. Angélica L. Carlini
Profa. Dra. Ronilda Ribeiro

Apoio:
Profa. Cláudia Regina Baptista
Profa. Deise Alcantara Carreiro

Projeto gráfico:
Prof. Alexandre Ponzetto

Revisão:
Rose Castilho
Virgínia Bilatto
Sumário
Bioestatística

APRESENTAÇÃO.......................................................................................................................................................9
INTRODUÇÃO............................................................................................................................................................9

Unidade I
1 CONCEITOS GERAIS DE ESTATÍSTICA E BIOESTATÍSTICA................................................................... 11
2 POPULAÇÃO, AMOSTRA, AMOSTRAGEM, VARIÁVEIS, COLETA DE DADOS E
CRÍTICA DOS DADOS........................................................................................................................................... 12
2.1 População estatística ou universo estatístico........................................................................... 12
2.2 Amostra..................................................................................................................................................... 12
2.3 Amostragem............................................................................................................................................ 13
2.4 Técnicas de amostragem.................................................................................................................... 14
2.4.1 Amostragem aleatória simples (probabilística)........................................................................... 15
2.4.2 Amostragem sistemática (probabilística)....................................................................................... 18
2.4.3 Amostragem aleatória estratificada (probabilística)................................................................. 24
2.4.4 Amostragem por conglomerado (probabilística)........................................................................ 26
2.4.5 Amostragem acidental (não probabilística).................................................................................. 27
2.4.6 Amostragem intencional (não probabilística).............................................................................. 27
2.4.7 Amostragem por quotas (não probabilística)............................................................................... 27
2.4.8 Amostragem por voluntários (não probabilística)...................................................................... 27
2.5 Variáveis.................................................................................................................................................... 28
2.5.1 Tipos de variáveis..................................................................................................................................... 28
2.5.2 Variáveis qualitativas ou categorizadas......................................................................................... 28
2.5.3 Variável quantitativa.............................................................................................................................. 30
2.6 Coleta de dados..................................................................................................................................... 32
2.7 Crítica dos dados................................................................................................................................... 34
3 TABELAS E GRÁFICOS..................................................................................................................................... 34
3.1 Tabela primitiva...................................................................................................................................... 35
3.2 Rol............................................................................................................................................................... 36
3.3 Distribuição de frequências sem intervalos de classe............................................................ 37
3.4 Distribuição de frequências com intervalos de classe........................................................... 42
3.5 Elementos de uma distribuição de frequência.......................................................................... 46
3.6 Tipos de frequências............................................................................................................................. 47
3.7 Gráficos estatísticos............................................................................................................................. 49
3.8 Tipos de gráficos.................................................................................................................................... 49
3.8.1 Gráfico em linha ou em curva – polígonos de frequências................................................... 49
3.8.2 Histogramas............................................................................................................................................... 54
3.8.3 Gráfico em colunas ou em barras..................................................................................................... 55
3.8.4 Gráfico em colunas ou em barras múltiplas................................................................................. 56
3.8.5 Gráfico em setores.................................................................................................................................. 58
4 MEDIDAS DE TENDÊNCIA CENTRAL E DE VARIABILIDADE.............................................................. 60
4.1 Média aritmética (X)............................................................................................................................ 60
4.1.1 Média aritmética para dados não agrupados.............................................................................. 60
4.1.2 Média aritmética para dados agrupados....................................................................................... 62
4.2 Mediana (Md).......................................................................................................................................... 65
4.2.1 Mediana para dados não agrupados............................................................................................... 65
4.2.2 Mediana para dados agrupados........................................................................................................ 67
4.3 Moda (Mo)................................................................................................................................................ 70
4.3.1 Moda para dados não agrupados..................................................................................................... 70
4.3.2 Moda para dados agrupados.............................................................................................................. 71
4.4 Emprego da média, da mediana e da moda............................................................................... 74
4.5 Medidas de dispersão: variância, desvio padrão para dados agrupados e
não agrupados............................................................................................................................................... 74
4.5.1 Variância (S²)............................................................................................................................................. 75
4.5.2 Desvio padrão (S)..................................................................................................................................... 76
4.6 Coeficiente de variação (Cv)............................................................................................................. 83

Unidade II
5 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADE................................................................................... 90
5.1 Introdução à probabilidade............................................................................................................... 90
5.1.1 Experimento aleatório........................................................................................................................... 90
5.1.2 Probabilidade da ocorrência de um evento P(A)........................................................................ 91
5.1.3 Eventos complementares..................................................................................................................... 92
5.1.4 Eventos independentes (e)................................................................................................................... 93
5.1.5 Eventos mutuamente exclusivos (ou)............................................................................................. 93
5.2 Distribuições teóricas de probabilidade....................................................................................... 94
5.2.1 Distribuição normal de probabilidade............................................................................................. 96
6 INTRODUÇÃO AO TESTE DE HIPÓTESES.................................................................................................101
6.1 Conceito de hipótese.........................................................................................................................101
6.2 Aplicação do teste...............................................................................................................................103
6.3 Nível de significância.........................................................................................................................103
6.4 Teste para amostras com a média de uma população.........................................................104
6.4.1 Amostras grandes (n>30)...................................................................................................................104
6.4.2 Teste T de Student, para amostras pequenas (n<30)..............................................................107
6.4.3 Teste de hipóteses para média de duas populações.................................................................111
7 TESTE DE HIPÓTESES QUI‑QUADRADO..................................................................................................115
7.1 Teste de associação qui‑quadrado clássico..............................................................................115
8 CORRELAÇÃO E REGRESSÃO.....................................................................................................................122
8.1 Diagrama de dispersão......................................................................................................................122
8.2 Coeficiente de correlação de Pearson (R)..................................................................................124
8.3 Coeficiente de determinação (R²).................................................................................................129
8.4 Regressão linear simples..................................................................................................................129
APRESENTAÇÃO

A bioestatística se faz presente no dia a dia da área da saúde. Ela se manifesta em várias áreas da
saúde, em hospitais, por meio de uma planilha de utilização de medicamentos para ser apresentada
a um plano de saúde, que se não for feita corretamente pode ser glosada, por exemplo. Existem
planilhas e gráficos de apresentação de desempenho de funcionários, de atendimentos e diversos
outros tipos.

Em nosso curso, as ferramentas da bioestatística serão apresentadas de forma sequencial, para que
você possa aprender noções de amostragem e técnicas de análise utilizando princípios da estatística
descritiva e esteja apto a calcular estimativas intervalares, entendendo, assim, a sua relevância em
pesquisas e trabalhos científicos de todo o tipo, principalmente na área da saúde.

Ainda, será incluso neste curso, a título de curiosidade, o modo como utilizar a ferramenta Microsoft
Excel, passo a passo, para todos os itens, demonstrando, assim, os recursos disponíveis de estatística do
software, para que você possa aproveitar todos os momentos do curso. Assim, ao final você será capaz
de distinguir as limitações e vantagens do uso de amostras e os métodos de sua obtenção, descrever e
interpretar dados por meio de tabelas e gráficos, fazer estimativas pontuais e de variabilidade, calcular
intervalos de confiança da proporção e média e ainda identificar sua aplicação, além de fazer todos
esses cálculos no Microsoft Excel.

INTRODUÇÃO

Como saberíamos mais sobre comportamentos, preferências, doenças e medicamentos que podem
promover melhorias à população se não fosse a estatística?

De acordo com Arango (2009), Florence Nightingale (1820‑1910), fundadora da enfermagem


moderna, talvez tenha sido a pioneira na confecção de gráficos na estatística social. Durante a Guerra
da Crimeia (no sul da Rússia, que durou de 1853 a 1856), ela demonstrou, por meio de gráficos originais,
pois apenas a sua palavra não bastava, que morriam mais soldados em consequência de precárias
condições sanitárias do que em combate.

Toda pesquisa tem propostas e objetivos e deve ser planejada de acordo com eles. Para tanto, é
necessário que haja configuração da população‑alvo, delineamento de amostra, elaboração de
questionário (caso seja uma pesquisa de campo) para coleta dos dados e análise dos resultados, para
assim poder chegar a conclusões e até tomadas de decisões.

A bioestatística é a aplicação das ferramentas da estatística à saúde, utilizando as técnicas estatísticas


para se cumprir todas as etapas da pesquisa.

O conteúdo deste curso percorrerá o caminho entre a coleta de dados, o cálculo e a interpretação dos
resultados de uma pesquisa, e, com isso, você perceberá que a bioestatística está muito mais presente no
seu dia a dia do que você pode imaginar.

9
A pesquisa em bioestatística segue o cronograma da figura a seguir:

Propostas e objetivos

Planejamento de pesquisa

Delineamento de amostra

Elaboração de questionário

Coleta de dados

Crítica dos dados

Apuração dos dados

Construção Construção
de tabelas de gráficos

Análise de interpretação
dos dados

Conclusões e
tomadas de decisão

Figura 1 – Diagrama do cronograma da pesquisa

O objetivo maior da bioestatística é a tomada de decisões, quando se refere a registros de doenças,


surtos, epidemias, endemias, registros de qualidade de vida, condições de alimentação, sanitárias e
habitacionais, prevenção de doenças, educação, enfim, tudo que se refere à saúde pública e que é de
interesse, também, da OMS (Organização Mundial da Saúde). Ainda, na área da saúde, é utilizada
quando da elaboração de experiências e pesquisa científica, tais como testes de vacinas, avaliação de
terapêuticas e tratamentos, testes de medicamentos etc.

Portanto, a bioestatística se relaciona com a área da saúde, incluindo farmácia, gestão hospitalar,
enfermagem, nutrição e muitas outras, e essa é a razão de se tornar uma disciplina importante
nesses cursos.

10
BIOESTATÍSTICA

Unidade I
1 CONCEITOS GERAIS DE ESTATÍSTICA E BIOESTATÍSTICA

Estatística é a parte da matemática que trata da coleta, organização, tabulação e análise de dados
colhidos em um levantamento de dados (popularmente chamado de pesquisa). Pode ser dividida em dois
grandes grupos, a estatística descritiva e a Inferencial ou Indutiva. A descritiva é empregada para caracterizar
a amostra em estudo, já a inferencial ou indutiva permite elaborar hipóteses em relação à amostra estudada
para que possamos transferir essas conclusões à população que deu origem a essa amostra.

Bioestatística são conceitos da Estatística aplicados às Ciências Biológicas, como Medicina, Biologia,
Biomedicina, Farmácia, Odontologia, Medicina Veterinária, Enfermagem e outras (ARANGO, 2009).

Por definição, a Bioestatística é um conjunto de métodos utilizados para planejar e executar um trabalho
científico, que envolve a obtenção, a organização, a análise, e a interpretação dos dados, e ainda possibilita
a obtenção das conclusões (TRIOLA, 1999), como demonstrado no cronograma da figura anterior.

Lembrete

Podemos dizer, então, que a Bioestatística se utiliza das ferramentas da


Estatística que são consideradas mais importantes para a área da Saúde.

Saiba mais

Segundo Arango (1993), Gauss (1777‑1855), considerado o maior


matemático dos séculos XVIII e XIX, idealizou e deduziu a Curva Normal de
Probabilidades.

Você pode obter mais informações sobre o tema na obra:

VIEIRA, S. Introdução à bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008.

Exemplos:

1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais comuns
utilizados em pacientes internados com idade acima de 60 anos, sorteia, então, o prontuário de
30 desses pacientes, e anota as suas idades e os remédios que estão utilizando.

11
Unidade I

Com a utilização das ferramentas da Bioestatística, pode‑se chegar a muitas conclusões sobre os
remédios utilizados, tais como: quais as idades dos pacientes que utilizam esses remédios, com
que frequências eles são utilizados, e ainda, controlar os seus estoques para que não haja falta
desses medicamentos.

2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes


para o pré‑natal. Sendo uma maternidade que opera em uma cidade grande, deseja saber quais as
cidades vizinhas que estão encaminhando suas pacientes e por quê. Para tanto, apronta uma ficha
que deve ser preenchida assim que a gestante chega ao hospital pela primeira vez, para colher as
informações necessárias do seu encaminhamento.

Essa pesquisa pode ser de muita utilidade, pois pode‑se saber quais pacientes são da cidade e
quais estão sendo enviadas de outras cidades, podendo inclusive levantar dados suficientes que
provem a necessidade de mais maternidades na região.

2 POPULAÇÃO, AMOSTRA, AMOSTRAGEM, VARIÁVEIS, COLETA DE DADOS E


CRÍTICA DOS DADOS

2.1 População estatística ou universo estatístico

Chamamos população todos os elementos portadores de, pelo menos, uma característica comum, e
que desejamos analisar, isto é, todos os entes que possuem a característica que estaremos estudando.

2.2 Amostra

É um subconjunto finito da população estatística, ou seja, uma parte da população que queremos
investigar.

Amostras são utilizadas para que se possa chegar a uma conclusão a respeito do todo sem a
necessidade de utilizar todos os entes da população. Uma das poucas pesquisas que utilizam toda a
população é o Censo, realizado, normalmente de 10 em 10 anos.

Portanto, uma amostra não deve ser escolhida de qualquer maneira. A principal característica da
amostra é que ela deve ser probabilística, isto é, todos os entes da população devem ter a chance de
participar da amostra, se não, ela pode se tornar tendenciosa e colocar toda a pesquisa a perder.

A escolha da amostra é a parte mais importante da pesquisa. Para que não se cometam erros nesta
escolha, existe a amostragem.

Lembrete

População estatística são os entes que apresentam a característica a ser


estudada e amostra é uma parte representativa dessa população.
12
BIOESTATÍSTICA

Observação

Sempre que nos referimos ao número de elementos da população


utilizamos N (maiúsculo) e sempre que nos referimos ao número de
elementos da amostra utilizamos n (minúsculo).

Exemplos:

1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais comuns
utilizados em pacientes internados com idade acima de 60 anos, sorteia, então, o prontuário de
30 desses pacientes, e anota as suas idades e os remédios que estão utilizando.

Neste caso, a população será constituída de todos os pacientes internados com idade acima de 60
anos e a amostra serão os 30 sorteados por meio dos seus prontuários.

2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes


para o pré‑natal. Sendo uma maternidade que opera em uma cidade grande, deseja saber quais as
cidades vizinhas que estão encaminhando suas pacientes e por quê. Para tanto, apronta uma ficha
que deve ser preenchida assim que a gestante chega ao Hospital pela primeira vez, para colher as
informações necessárias do seu encaminhamento.

Neste caso, a população será todas as gestantes do pré‑natal e a amostra, apenas as pacientes
encaminhadas por outras maternidades.

2.3 Amostragem

A amostra não pode ser escolhida de qualquer forma, para isso existem técnicas de amostragem
que garantem, principalmente, o acaso na escolha, portanto ela deve ser probabilística, isso é, todos
os participantes da população estatística devem ter a chance de ser escolhidos. Caso isso não ocorra, a
amostra pode não demonstrar a realidade da população.

Existem ainda técnicas não probabilísticas de amostragem que são empregadas quando não há
possibilidade de se obter amostras probabilísticas, isto é, ao invés de se sortear os elementos da amostra,
estes são selecionados por algum critério escolhido pelo pesquisador.

Em muitos casos, os efeitos de uma amostragem não probabilística podem ser considerados
equivalentes aos de uma amostragem probabilística, porém é um tipo de amostragem que deve ser feita
com reservas e com a convicção de que não se introduza vício.

As amostragens não probabilísticas normalmente são utilizadas quando não existe acesso à
população, quando é escolhida sem norma, quando o pesquisador deliberadamente escolhe certos
elementos da amostra por julgá‑los bem representativos da população ou ainda por voluntários.

13
Unidade I

Pelo fato da estatística ser uma estimativa, quanto melhor for a amostra, melhor se poderá inferir
sobre a população que ela representa.

Lembrete

Amostragem são técnicas especiais para recolher amostras, que


garantem, tanto quanto possível, caráter de representatividade, pois serão
inferidas conclusões relativas à população com base nesses resultados.

Observação

Não podemos confundir amostra com amostragem. Amostra é uma


parte da população, amostragem são técnicas para se escolher a amostra.

2.4 Técnicas de amostragem

Quando achamos que, ao utilizar todos os elementos da população para uma pesquisa, seremos
mais precisos, estamos incorrendo em um erro, pois a manipulação de grande quantidade de dados
pode gerar erros maiores do que os erros que poderíamos ter, por meio da inferência estatística, nas
conclusões de uma amostra bem selecionada.

Portanto, nossa preocupação central é na escolha de uma amostra realmente representativa.

Quando finalmente decidimos quais informações queremos obter de um levantamento amostral,


devemos, em primeiro lugar, definir a população de interesse e selecionar a característica que
queremos pesquisar, pois todos os elementos da população devem ter essa característica. Depois
devemos escolher a amostra utilizando, como já mencionamos, as técnicas de amostragem, que
podem ser probabilísticas ou não. As técnicas de amostragem probabilísticas são: amostragem
aleatória simples, amostragem sistemática, amostragem estratificada e amostragem por
conglomerado.

Os métodos de extração das amostras não probabilísticas são: amostragem acidental, amostragem
intencional, amostragem por quotas e amostragem por voluntários.

Lembrete

Técnicas de amostragem são procedimentos utilizados para escolher


uma amostra representativa da população, elas podem ser probabilísticas
ou não probabilísticas.

14
BIOESTATÍSTICA

Observação

Se não utilizarmos técnicas probabilísticas para amostragem, nossa


pesquisa corre o risco de não ser fidedigna.

2.4.1 Amostragem aleatória simples (probabilística)

É um processo para selecionar amostras de tamanho “n” entre as “N” unidades em que foi dividida a
população. Sendo a amostragem feita sem reposição, que é o caso mais comum, existem (N, n) possíveis
amostras, todas igualmente prováveis (CRESPO, 1993). Na prática, a amostra aleatória simples é escolhida
unidade por unidade. As unidades da população são numeradas de 1 a N. Em seguida, escolhe‑se por
sorteio ou em uma Tabela de Números Aleatórios (TNA), encontra‑se n números compreendidos entre 1
e N. Esse processo é equivalente a um sorteio no qual se colocam todos os números misturados dentro
de uma urna. As unidades correspondentes aos números escolhidos formarão a amostra.

Figura 2 – Tabela de Números Aleatório (TNA) gerada no Excel com o comando =ALEATÓRIOENTRE(0;9)

15
Unidade I

Exemplos:

1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais
comuns utilizados em pacientes internados com idade acima de 60 anos. Vamos supor que foram
internados 200 pacientes e que queremos uma amostra de 30 desses pacientes.

Neste caso, poderemos utilizar a TNA da figura. Vamos sortear apenas 30 desses pacientes; para
tanto, devemos numerar os prontuários de 001 a 200 e sortear 30 deles.

Temos que encontrar números de três dígitos, caso contrário, os prontuários acima de 100 nunca
seriam sorteados.

Resolução:

Se utilizarmos a TNA da direita para a esquerda, a partir da 1ª linha temos sorteados os prontuários:
175, 119, 052, 057, 129, 004, 110, 186, 072, 171, 130, 169, 180, 076, 036, 199, 034, 005, 069, 152, 096,
038, 018, 072, 125, 041, 056, 047, 103, 001, conforme figura a seguir.

Figura 3 – TNA com os números sorteados

16
BIOESTATÍSTICA

Portanto, serão utilizados esses prontuários para anotar os remédios mais comuns utilizados por
esses 30 pacientes. A partir daí, poderemos chegar a conclusões a respeito da população de pessoas
acima de 60 anos que foram internadas no Hospital Baruch de Toulouse.

2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes


para o pré‑natal. Sendo uma maternidade que opera em uma cidade grande, deseja saber quais
as cidades vizinhas que estão encaminhando suas pacientes e por quê. Para tanto, apronta uma
ficha (prontuário) que deve ser preenchida assim que a gestante chega ao Hospital pela primeira
vez, para colher as informações necessárias do seu encaminhamento. Tendo sido atendidas 200
pacientes, apenas 80 são de cidades vizinhas, destas, iremos escolher uma amostra de 20 pacientes.

Neste caso, o procedimento é o mesmo do exemplo anterior, se não levarmos em conta as cidades
de procedência, sortearemos 20 pacientes ao acaso. Para isso teremos que separar os prontuários
das cidades vizinhas e numerá‑los de 01 a 80. Agora utilizaremos apenas dois dígitos, pois os
elementos acima de 10 devem ter a chance de ser sorteados.

Resolução:

Figura 4 – TNA com os números sorteados coloridos

17
Unidade I

Se utilizarmos a TNA a partir da 1ª coluna, de cima para baixo, teremos sorteados os prontuários: 44,
36, 19, 05, 53, 39, 20, 11, 08, 50, 42, 62, 77, 30, 76, 65, 56, 67, 37 e 35.

Portanto, serão utilizados esses prontuários para anotar os municípios de procedência das gestantes e
o motivo do encaminhamento e, a partir daí, poderemos chegar a conclusões a respeito da população de
gestantes encaminhadas e qual o motivo do encaminhamento para a maternidade Baruch de Toulouse.

Lembrete

Amostragem aleatória simples é uma maneira de se escolher uma


amostra da população, basicamente, por sorteio.

Observação

O sorteio dos elementos para amostra não necessariamente deve ser


feito pela TNA, desde que todos os elementos da população tenham a
chance de ser escolhidos.

2.4.2 Amostragem sistemática (probabilística)

Uma amostragem obtida selecionando‑se aleatoriamente um elemento entre os K primeiros


elementos de um sistema de referência, e, após esse, cada “k‑ésimo” elemento, é chamada sistemática.
Em geral, para se obter uma amostra sistemática de n elementos de uma população de tamanho N,
K deve ser menor ou igual a N/n. Não é possível determinar K precisamente quando o tamanho da
população é desconhecido, mas pode‑se supor um valor de k de tal modo que seja possível obter uma
amostra de tamanho n. Em vez da amostragem aleatória simples, pode‑se empregar a amostragem
sistemática, porque é mais fácil de executar e, por isso, está menos sujeita a erros de entrevistador do
que a aleatória simples e frequentemente proporciona mais informações por custo unitário do que a
aleatória simples.

O 1º passo é determinar o intervalo de amostragem (K):

N
K=
n

Onde:

N = número de elementos da população.

n = número de elementos da amostra.

18
BIOESTATÍSTICA

Se o resultado for decimal, devemos arredondar para o valor inteiro menor.

O 2º passo é iniciar aleatoriamente a composição da amostra:

b → início: nº de ordem inicial sorteado na TNA, que deve ser entre 1 e K (0<b<K).

O 3º passo é a composição da amostra:

1º item →b

2º item →b + K

3º item →(b + K) + K ou (b + 2K)

4º item →(b + K + K) + K ou (b + 3K)

E assim por diante, até encontrar todos os elementos desejados para a amostra.

Lembrete

A amostragem sistemática também é feita por sorteio, porém, será


sorteado apenas o primeiro elemento da amostra, e os outros serão
sorteados a partir dele.

Exemplos:

1. A farmácia do Hospital Baruch de Toulouse tem intenção de saber quais os remédios mais
comuns utilizados em pacientes internados com idade acima de 60 anos. Vamos supor que foram
internados 200 pacientes, e queremos uma amostra de 30 desses pacientes.

Resolução:

O 1º passo é determinar o intervalo de amostragem (K):

N 200
K= ⇒K = ⇒ K = 6, 67
n 30

Devemos arredondar para o valor menor: K = 6.

O 2º passo é iniciar aleatoriamente a composição da amostra:

O valor de b será um número sorteado na TNA (figura 2) entre 1 e 6.

19
Unidade I

Utilizando a primeira linha da TNA, da esquerda para direita, temos o número 2 (é o primeiro que
aparece entre 1 e 6), confira na tabela.

O 3º passo é a composição da amostra:

1º item → 2

2º item → 2 + 6 = 8

3º item → 8 + 6 = 14

4º item → 14 + 6 = 20

5º item → 20 + 6 = 26

6º item → 26 + 6 = 32

7º item → 32 + 6 = 38

8º item → 38 + 6 = 44

9º item → 44 + 6 = 50

10º item → 50 + 6 = 56

11º item → 56 + 6 = 62

12º item → 62 + 6 = 68

13º item → 68 + 6 = 74

14º item → 74 + 6 = 80

15º item → 80 + 6 = 86

16º item → 86 + 6 = 92

17º item → 92 + 6 = 98

18º item → 98 + 6 = 104

19º item → 104 + 6 = 110

20º item → 110 + 6 = 116


20
BIOESTATÍSTICA

21º item → 116 + 6 = 122

22º item → 122 + 6 = 128

23º item → 128 + 6 = 134

24º item → 134 + 6 = 140

25º item → 140 + 6 = 146

26º item → 146 + 6 = 152

27º item → 152 + 6 = 158

28º item → 158 + 6 = 164

29º item → 164 + 6 = 170

30º item → 170 + 6 = 176

A amostra será composta pelos pacientes de prontuários: 2, 8, 14, 20, 26, 32, 38, 44, 50, 56, 62, 68,
74, 80, 86, 92, 98, 104, 110, 116, 122, 128, 134, 140, 146, 152, 158, 164, 170, 176.

Portanto, serão utilizados esses prontuários para anotar os remédios mais comuns utilizados por
esses 30 pacientes, a partir daí, poderemos chegar a conclusões a respeito da população de pessoas
acima de 60 anos que foram internados no Hospital Baruch de Toulouse.

2. A maternidade do Hospital Baruch de Toulouse deseja avaliar o encaminhamento de pacientes


para o pré‑natal. Sendo uma maternidade que opera em uma cidade grande, deseja saber quais as
cidades vizinhas que estão encaminhando suas pacientes e por quê. Para tanto, apronta uma ficha
(prontuário) que deve ser preenchida assim que a gestante chega ao Hospital pela primeira vez, para
colher as informações necessárias do seu encaminhamento. Tendo sido atendidas 200 pacientes,
apenas 80 são de cidades vizinhas, destas 80 iremos escolher uma amostra de 20 pacientes.

Resolução:

Neste caso, o procedimento é o mesmo do exemplo anterior, se não levarmos em conta as cidades
de procedência, sortearemos 20 pacientes ao acaso, porém, agora utilizaremos a amostra sistemática.

O 1º passo é determinar o intervalo de amostragem (K):

N 80
K= ⇒K = ⇒K = 4
n 20

21
Unidade I

O 2º passo é iniciar aleatoriamente a composição da amostra:

O valor de b será então um número sorteado na TNA entre 1 e 4.

Utilizando a segunda coluna da TNA (figura 2), de cima para baixo, temos o número 1 (é o
primeiro que aparece entre 1 e 4), confira na tabela.

O 3º passo é a composição da amostra:

1º item → 1

2º item → 1 + 4 = 5

3º item → 5 + 4 = 9

4º item → 9 + 4 = 13

5º item → 13 + 4 = 17

6º item → 17 + 4 = 21

7º item → 21 +4 = 25

8º item → 25 + 4 = 29

9º item → 29 + 4 = 33

10º item → 33 + 4 = 37

11º item → 37 + 4 = 41

12º item → 41 + 4 = 45

13º item → 45 + 4 = 49

14º item → 49 + 4 = 53

15º item → 53 + 4 = 57

16º item → 57 + 4 = 61

17º item → 61 + 4 = 65

18º item → 65 + 4 = 69
22
BIOESTATÍSTICA

19º item → 69 + 4 = 73

20º item → 73 + 4 = 77

A amostra será composta pelos pacientes de prontuários: 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45,
49, 53, 57, 61, 65, 69, 73, 77.

Portanto, serão utilizados esses prontuários para anotar os municípios de procedência das gestantes e
o motivo do encaminhamento e, a partir daí, poderemos chegar a conclusões a respeito da população de
gestantes encaminhadas e qual o motivo do encaminhamento para a maternidade Baruch de Toulouse.

Observação

Estes números podem ser encontrados facilmente utilizando‑se o


programa Microsoft Excel.

Para encontrar os números correspondentes aos elementos para a amostra no Microsoft Excel, siga
os passos:

1. Inserimos o número de elementos da população em uma célula (B1) e o número de elementos


da amostra em outra célula (D1), na célula B2, inserimos a conta que está indicada na barra de
fórmulas (=B1/D1), será feita a conta 80/20, com resultado 4.

Figura 5 – Cópia da planilha do Excel

2. Após a divisão escolhemos o primeiro elemento na TNA e colocamos em outra célula, depois
inserimos a conta para que ele obtenha a soma e copiamos a fórmula.

Figura 6 – Cópia da planilha do Excel

23
Unidade I

O número 1 inserido na célula A3 foi o sorteado no exemplo. A célula B2 está entre o símbolo $
($B$2) para que possamos copiar (replicar) a fórmula, utilizando o cursor em destaque na figura.

3. Arrastamos a fórmula até a célula 22, assim obtendo os 20 elementos da amostra.

Figura 7 – Cópia da planilha do Excel

A vantagem de utilizar o Microsoft Excel é a rapidez, certeza de que o resultado estará correto
(desde que você insira corretamente a conta) e, principalmente, o tamanho da amostra, porque a
fórmula pode ser replicada para o tamanho da amostra desejada, caso ela seja grande, não haverá
problemas. Além de que, uma vez feita a planilha, basta modificar o número de elementos da
população, o número de elementos da amostra e o novo número sorteado (b), que o resultado
será imediato, tente.

2.4.3 Amostragem aleatória estratificada (probabilística)

Uma amostra estratificada é obtida separando‑se as unidades da população em estratos (camadas),


que são divisões da população de acordo com algum critério, e selecionando‑se independentemente
uma amostra aleatória simples de cada estrato.

Os critérios de divisão são feitos de acordo com o que se quer saber na pesquisa, como: idade
(criança, adolescente, adulto e idoso), tipo sanguíneo (A, B, AB e O), área da empresa em que trabalha
(A1, A2, A3, etc.), entre outros.

Existem dois tipos de amostragem estratificada: de igual tamanho e proporcional.

24
BIOESTATÍSTICA

Quando é de igual tamanho, sorteia‑se igual número de elementos em cada estrato. Esse processo é
utilizado quando o número de elementos por estrato for aproximadamente o mesmo.

Quando é proporcional, utiliza‑se a amostragem estratificada proporcional, em que há o critério de


proporcionalidade. Assim, em uma população de N indivíduos, se K1 é o coeficiente de proporcionalidade
do estrato 1, K2 é o coeficiente de proporcionalidade 2 e K3, o coeficiente de proporcionalidade 3, a
participação de cada estrato na amostra deverá ser: n1= K1 x N; n2 = K2 x N; n3 = K3 x N, e assim por
diante. De modo geral, ni = Kj x N. Vale afirmar que este tipo de amostragem é a que consegue menor
margem de erro.

Lembrete

A amostragem estratificada divide a população em estratos e sorteamos


os elementos da amostra. No caso da estratificada proporcional, escolhemos
a amostra de forma proporcional a cada estrato.

Exemplos:

1. Será realizada uma pesquisa a partir de uma amostra composta por 20 pessoas. Essas
pessoas compõem um grupo de 100 funcionários de Hospitais que atendem seu Plano de
Saúde em outras cidades, sendo que 20 são da cidade de Santos, 13 da cidade de Jacareí, 23
da cidade de São Paulo, 14 de São Bernardo do Campo, 22 de São José dos Campos e 8 de
São Vicente. Vamos determinar a quantidade de pessoas de cada Hospital que responderá
a pesquisa.

Resolução:

Para sabermos o percentual da amostra, devemos utilizar a fórmula:

n
%n = X100 , onde:
N
%n = percentual da amostra.

n= nº de elementos da amostra.

N= nº de elementos da população.

Assim, temos: n = 20 e N = 100.

20
%n = X100 = 20%
100

25
Unidade I

Então, a mostra será composta por 20% da população.

Agora, vamos descobrir quantos elementos escolheremos de cada estrato. Para facilitar, as contas
foram colocadas na figura a seguir:

Figura 8 – Cálculos da proporção de cada estrato

Portanto, serão sorteados, por meio da técnica de amostragem aleatória simples, utilizando a
TNA, para compor a amostra de 20 funcionários: 4 funcionários do Hospital de Santos, 3 funcionários
do Hospital de Jacareí, 5 funcionários do Hospital de São Paulo, 3 funcionários do Hospital de São
Bernardo do Campo, 4 funcionários do Hospital de São José dos Campos e um funcionário do Hospital
de São Vicente.

Lembrete

Após determinação da quantidade de indivíduos por estrato, será


utilizado o sorteio (simples ou TNA) para determinarmos quais serão os
elementos componentes da amostra.

2.4.4 Amostragem por conglomerado (probabilística)

Consiste em efetuar subdivisões da população total (conglomerados) em áreas geográficas, como


quarteirões, ruas ou bairros, e compor a amostra tomando a totalidade dos indivíduos de alguns desses
conglomerados (ARANGO, 2009). Pode também ser denominada de amostragem por área. Assim, temos
n unidades tomadas de alguns conglomerados.

São exemplos de populações divididas em estratos: setores de um hospital (administração, compras,


tesouraria, recursos humanos, enfermagem etc.), sexo (homem e mulher), classificação de acordo com a
idade (criança, adolescente, adulto, terceira idade), entre outras.

26
BIOESTATÍSTICA

Saiba mais

Você pode obter mais informações sobre população, amostra e amostragem


no livro:

ARANGO, H. G. Bioestatística teórica e computacional. 3. ed. Rio de Janeiro:


Guanabara Koogan S.A., 2009.

2.4.5 Amostragem acidental (não probabilística)

É formada por elementos que vão aparecendo, que são possíveis de se obter até completar o número
de elementos da amostra. Um exemplo da utilização desse tipo de amostragem é a pesquisa de opinião,
em que os entrevistados são acidentalmente escolhidos.

2.4.6 Amostragem intencional (não probabilística)

Normalmente, nesse tipo de amostragem, o pesquisador usa seu julgamento para selecionar os
membros da população que ele acredita que são boas fontes de informação, portanto, é formada por
elementos escolhidos intencionalmente. Obviamente, o perigo desse tipo de amostragem é grande, pois
depende do critério do pesquisador.

2.4.7 Amostragem por quotas (não probabilística)

O pesquisador entrevista um número predefinido de pessoas em cada uma das várias categorias.

O pesquisador classifica para entrevistar um número predefinido de pessoas em cada uma das várias
categorias, em termos de propriedades relevantes para a característica que deseja estudar.

2.4.8 Amostragem por voluntários (não probabilística)

É aquela em que o pesquisador aceita voluntários para amostra da população quando a ética obriga
que haja concordância dos escolhidos, é uma técnica muito utilizada no caso de experimentação de
alguma nova droga ou vacina em pacientes.

Saiba mais

Você pode obter mais informações sobre população, amostra e


amostragem no livro:

COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002.

27
Unidade I

• Aleatória simples
• Sistemática
Probalística • Estratificada
• Por conglomerado
Amostragem
• Acidental
• Intencional
Não probalística
• Por quotas
• Por conglomerado

Figura 9 – Técnicas de amostragem

2.5 Variáveis

É o conjunto de resultados de um possível fenômeno. É qualquer característica de um indivíduo de


uma população, que caracterizará ou descreverá um fenômeno ou fato de uma população. Uma variável
assumira valores no espaço e no tempo (MENESES; MARIANO, 2010).

A cada fenômeno corresponde um número de resultados possíveis. Assim, para o fenômeno “sexo”, são
dois resultados possíveis: sexo masculino e sexo feminino; para o fenômeno “número de funcionários”,
“quantidade de gestantes”, “número de idosos” há um número de resultados possíveis expressos por
números naturais (0, 1, 2, 3, ..., n), pois, não se pode dizer que foram contadas 25,3 gestantes, não é
mesmo? Assim sendo, onde estariam as 0,7 partes da 26ª gestante?

No caso de fenômenos como “pressão arterial”, “estatura” e “peso” os resultados podem tomar um
número infinito de valores dentro de um determinado intervalo. Nesse caso podemos admitir uma
estatura de 1,68 metros de altura, ou ainda um peso de 73,5 kg.

2.5.1 Tipos de variáveis

A variável, então, é um conjunto de resultados possíveis de um fenômeno, esse fenômeno pode ser
de qualidade (sexo, cor dos olhos,) ou de quantidade (pressão arterial, estatura). Por isso, as variáveis são
classificadas em: qualitativas ou categorizadas, e quantitativas.

2.5.2 Variáveis qualitativas ou categorizadas

Quando os possíveis resultados são atributos, qualidades. Exemplos: sexo (masculino‑feminino), cor da
pele (branca, preta...), cidade onde nasceu etc. As variáveis qualitativas podem ser divididas em duas categorias:

Qualitativa nominal

Quando os valores são classificados em categoria ou classes não ordenadas, em que números são
utilizados para representar categorias. Isto é, a variável é associada a um número, porém este número é
apenas um rótulo para a variável.
28
BIOESTATÍSTICA

Exemplos:

1. O agrupamento de pessoas de acordo com seu tipo sanguíneo, como na figura a seguir: o
número 1 representa o Tipo A, o número 2 representa o tipo B, o número 3 representa o tipo AB
e o número 4 representa o tipo O.

Figura 10 – Variável qualitativa nominal tipo sanguíneo

Os números associados às variáveis são meros rótulos, pois poderíamos facilmente trocar esses
rótulos para que 1 represente o tipo O, 2 é o tipo A, 3 é o tipo B e 4 é o tipo AB. Essa alteração não
implica na magnitude da variável.

2. O agrupamento de pessoas por sexo (masculino e feminino), como na figura a seguir:

Figura 11 – Variável qualitativa nominal Sexo

Os números associados às variáveis continuam sendo rótulos, pois poderíamos facilmente trocar
esses rótulos para que 0 represente o sexo Feminino e 1 represente o sexo Masculino.

Qualitativa ordinal

Quando a ordem entre a categoria é importante, as observações são referenciadas como dados
ordenados. Isto é, agora, o número associado à variável lhe dá uma magnitude ou uma ordem que não
pode ser trocada.

Exemplos:

1. Agrupamento de pessoas pelo nível socioeconômico a que pertencem, como apresentado na


figura a seguir:

29
Unidade I

Figura 12 – Variável qualitativa ordinal nível socioeconômico

Os números associados às variáveis não são mais rótulos porque agora eles determinam a magnitude
do Nível Socioeconômico, pois não poderíamos trocar esses rótulos porque mudaríamos o Nível
Socioeconômico do elemento em questão.

2. Podemos classificar a variável Lesão, em vários tipos:

Figura 13 – Variável qualitativa ordinal tipos de lesão

Neste caso, as lesões são classificadas de acordo com o seu nível de severidade, de modo que
1 representa uma lesão moderada; 2 é severa e 3 é fatal. Aqui existe uma ordem natural entre os
agrupamentos, um número maior representa uma lesão mais séria.

Lembrete

Quando a variável é qualitativa nominal, a sequência dos valores não é


importante. Já quando é qualitativa ordinal, está associada a uma ordem
no agrupamento em que essa se encontra.

2.5.3 Variável quantitativa

Representa quantidades mensuráveis que não estão restritas a assumir valores especificados
(inteiros), isto é, os possíveis resultados são números de uma escala. Exemplos: estatura, peso, pressão
arterial, pressão atmosférica, salários de funcionários etc. As variáveis quantitativas podem divididas em
duas categorias:

Quantitativa discreta

É a variável que só pode assumir valores pertencentes a um conjunto enumerável e tanto a ordenação
quanto na magnitude são importantes. Neste caso, os números representam quantidades mensuráveis
30
BIOESTATÍSTICA

reais, em vez de meros rótulos, e os dados discretos estão restritos a terem somente valores específicos,
frequentemente inteiros ou contagens.

Exemplos:

1. A figura a seguir apresenta uma tabela com o número de pacientes internados em algumas alas
do Hospital Baruch de Toulouse. Como sabemos, a função da ala de um hospital é manter juntos
pacientes com problemas parecidos.

Figura 14 – Tabela de pacientes de algumas alas do Hospital Baruch de Toulouse

O número de pacientes em determinada ala de um hospital só pode assumir valores inteiros e


nunca valores como 2,5 ou 3,78 ou 4,325.

2. O número de acidentes com veículos em determinada estrada, também não pode assumir valores
que não sejam inteiros.

Quantitativa contínua

É a variável que não precisa ser número inteiro, não estão restritos a assumir certos valores específicos,
pois diferença entre quaisquer dois valores de dados possíveis pode ser arbitrariamente pequena.

Exemplos:

1. A variável peso pode ser tanto de um número inteiro, como decimal (72kg ou 72,5 kg), dependendo
do grau de precisão com que esse valor foi medido.

2. O nível sérico de colesterol de um paciente (13,2 mg/dl ou 15,4 mg/dl).

Lembrete

Quando a variável é quantitativa discreta, exige número inteiro e


quando ela é quantitativa contínua utiliza números decimais.

31
Unidade I

Observação

É importante definir, exatamente, a variável que se vai utilizar na


pesquisa, pois a cada tipo de variável está associado um tipo de tabela de
dados.

2.6 Coleta de dados

Já sabemos que para fazer uma pesquisa devemos percorrer por um cronograma. Até agora já
aprendemos o que é uma amostra e como escolher essa amostra, o que é variável e como classificá‑la,
precisamos agora colher os dados da nossa pesquisa.

Após planejarmos a pesquisa, devemos iniciar o levantamento dos dados que desejamos mensurar e
que irão determinar as características do fenômeno que queremos pesquisar. Para tanto, dá‑se início a
coleta de dados numéricos necessários à sua descrição.

A coleta de dados é feita sobre elementos informativos de registro obrigatório, ou ainda por meio de
inquéritos e questionários aplicados aos elementos da amostra pelo próprio pesquisador ou, dependendo
da pesquisa, por uma equipe por ele treinada.

Exemplos:

1. Coleta feita por elementos informativos podem ser: prontuários, nascimentos, casamentos,
óbitos ou ainda qualquer tipo de informação que se possa colher de registros obrigatórios, como
os prontuários dos 30 pacientes acima de 60 anos, escolhidos por amostra aleatória simples,
internados no Hospital Baruch de Toulouse.

2. Dados colhidos pelo próprio entrevistador por meio de questionários. A seguir, um exemplo de
questionário para colher informações sobre o perfil do aluno de um curso em ensino a distância
oferecido pelo Hospital e Maternidade Athena de Toulouse, e como ele acha que foi seu aprendizado
nesse tipo de curso.

Q.1: Você nasceu:

a) Antes de 1955 – considerada geração Baby Boomers.

b) Entre 1956 e 1970 – considerada geração X.

c) Entre 1971 e 1990 – considerada geração Y.

d) Após 1990 – considerada geração Z.

32
BIOESTATÍSTICA

Q.2: Você usa o computador para:

a) Estudar e pesquisar na internet.

b) Apenas para me relacionar com outras pessoas.

c) Para estudar, trabalhar, fazer pesquisas e me relacionar com outras pessoas.

Q.3: Como você acha que foi seu aprendizado neste curso em EaD?

a) Ótimo.

b) Bom.

c) Regular.

d) Péssimo.

e) Acho que aprenderia mais em um curso presencial.

O questionário está com ênfase na geração digital a que pertence o aluno, com o objetivo de
classificar, dentro das gerações digitais, qual a que mais utiliza o EaD, pois cada geração tem um tipo de
relação com o computador, algumas têm mais e outras menos intimidade com o computador, e ainda
se o aluno acha que está aprendendo no curso em ensino a distância.

Lembrete

A coleta de dados é o passo mais importante para o pesquisador, pois a


partir daí ele iniciará a apuração dos dados que o levará às conclusões do
seu trabalho.

Observação

O questionário deve estar de acordo com os objetivos da pesquisa e


não deixar perguntas ou alternativas. Não é necessário pedir o nome do
respondente.

33
Unidade I

Saiba mais

Você pode encontrar mais informações sobre questionários para


pesquisa em saúde em:

CENTRAL de questionários de saúde. Survey Monkey, Califórnia,


1999‑2015. Disponível em: <https://pt.surveymonkey.com/mp/
healthcare‑surveys/>. Acesso em: 26 maio 2015.

2.7 Crítica dos dados

Após colher os dados, devemos criticá‑los, ou seja, fazer uma observação minuciosa das respostas para
ter certeza de que não houve nenhuma intercorrência que possa ter interferido nas respostas ou ainda
algum erro na transferência de dados provenientes de prontuários, pois toda a nossa análise da pesquisa
dependerá desses dados. Uma vez que haja algo errado com eles, toda a nossa pesquisa ficará inutilizada.

3 TABELAS E GRÁFICOS

Distribuição de frequências é o nome dado à tabela gerada a partir dos dados. Segundo dados do
IBGE (1993, p. 9) tabela é a “forma não discursiva de apresentar informações, das quais o dado numérico
se destaca como informação central. Na sua forma identificam‑se espaços e elementos”.

Chamamos de classes as linhas de dados da tabela. Assim, a classe 1 é relativa à primeira linha
de dados da tabela e assim por diante. A definição de classes, pelas normas tabulares é “cada um dos
intervalos não superpostos em que se divide uma distribuição de frequências” (IBGE, 1993, p. 11).

Portanto, as distribuições de frequências devem ser construídas de acordo com as normas técnicas
ditadas pelo Instituto Brasileiro de Geografia e Estatística (IBGE). As tabelas devem ser colocadas logo abaixo
do texto em que são mencionadas pela primeira vez e inseridas na ordem em que aparecem no texto.

De acordo com as normas técnicas, uma tabela deve ter título, corpo, cabeçalho e coluna indicadora.
Toda tabela deve ser delimitada por traços (moldura) horizontais, mas não deve ser delimitada por traços
verticais. O cabeçalho deve ser separado do corpo da tabela por um traço horizontal.

Com relação às molduras, segundo as normas de apresentação tabular, temos:

A estruturação dos dados numéricos e dos termos necessários à


compreensão de uma tabela deve ser feita com, no mínimo, três traços
horizontais paralelos. O primeiro para separar o topo. O segundo para
separar o espaço do cabeçalho. O terceiro para separar o rodapé [...] A
moldura de uma tabela não deve ter traços verticais que delimitem à
esquerda e à direita (IBGE, 1993, p. 15).

34
BIOESTATÍSTICA

Saiba mais

Para visualizar as normas de apresentação tabular do IBGE, acesse:

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Normas


de apresentação tabular. 3. ed. Rio de Janeiro: IBGE, 1993. Disponível em:
<http://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf>. Acesso em:
26 maio 2015.

3.1 Tabela primitiva

A tabela primitiva é uma tabela que contém dados brutos, ou seja, colhidos e simplesmente anotados.

Exemplos:

1. Em uma pesquisa para se determinar o nível de escolaridade de uma amostra de 30 funcionários do


Hospital Baruch de Toulouse, a partir dos prontuários sorteados anotamos o nível de escolaridade
de cada um dos funcionários, obtendo uma tabela primitiva, como mostra a figura a seguir:

Figura 15 – Exemplo de tabela primitiva de dados variável qualitativa

2. Uma pesquisa para se determinar a idade de 30 idosos que residem na Casa de Repouso Cayro
apresenta a tabela primitiva a seguir:

Figura 16 – Exemplo de tabela primitiva de dados variável quantitativa

35
Unidade I

Lembrete

O primeiro exemplo trata de dados de uma variável qualitativa ordinal e


o segundo exemplo são dados de uma variável quantitativa contínua.

Observação

Note que os dados estão desorganizados, apenas foram colocados da


forma como foram colhidos nos prontuários dos funcionários e residentes.

3.2 Rol

Chamamos de rol a tabela que apresenta os dados organizados em uma determinada ordem, que
pode ser crescente ou decrescente, para que fique mais fácil a sua contagem, pois o resultado da pesquisa
é feito por meio da contagem dos dados.

Quando a variável em questão é quantitativa, normalmente optamos pela sua organização em ordem
crescente, quando é qualitativa devemos optar por uma sequência lógica para que possamos contá‑las.

Exemplos:

1. Em uma pesquisa para se determinar o nível de escolaridade de uma amostra de 30 funcionários do


Hospital Baruch de Toulouse, a partir dos prontuários sorteados anotamos o nível de escolaridade
de cada um dos funcionários, obtendo uma tabela primitiva, como mostra a figura a seguir:

Figura 17 – Rol de dados variável qualitativa

2. Uma pesquisa para se determinar a idade de 30 idosos que residem na Casa de Repouso Cayro
apresenta a tabela primitiva a seguir:

36
BIOESTATÍSTICA

Figura 18 – Rol de dados, variável quantitativa

Lembrete

Rol são os dados organizados em uma determinada ordem, crescente


ou decrescente.

Observação

Tanto a tabela primitiva quanto o rol não são considerados tabelas, pois
simplesmente fazem parte da organização dos dados.

Quando trabalhamos com o Microsoft Excel, não é necessário fazer o rol, pois o programa faz a
contagem dos dados brutos, basta colocá‑los na planilha de dados e utilizar a função CONT.SE para
dados qualitativos e CONT.SES para dados quantitativos contínuos.

3.3 Distribuição de frequências sem intervalos de classe

Para dados qualitativos devemos gerar uma tabela de dados chamada distribuição de frequências
sem intervalos de classe, pois as classes são geradas pelas próprias variáveis (respostas) da questão.

Exemplos:

1. Em uma pesquisa para se determinar o nível de escolaridade de uma amostra de 30 funcionários do


Hospital Baruch de Toulouse, a partir dos prontuários sorteados anotamos o nível de escolaridade
de cada um dos funcionários.

Resolução:

Anteriormente já organizamos os dados para a contagem (Figura 17), agora basta criarmos a tabela
de acordo com as normas do IBGE, como mostra a figura a seguir:

37
Unidade I

Figura 19 – Tabela de distribuição de frequências de nível de escolaridade

2. Foi feita uma pesquisa, com uma amostra de 60 alunos, para avaliar a qualidade do EaD de
determinada universidade. A tabela a seguir apresenta o resultado dessa pesquisa, após ter sido
feita a contagem dos dados.

Figura 20 – Tabela de distribuição de frequências de avaliação do curso de EaD

Lembrete

A apuração de dados de variáveis qualitativas gera uma distribuição de


frequências sem intervalos de classe.

Observação

O Microsoft Excel faz as contagens automaticamente.

Contagem no Microsoft Excel:

No primeiro exemplo, criada a tabela, vamos contar a quantidade de pessoas que não são alfabetizadas,
a quantidade de pessoas que têm Ensino Fundamental incompleto, a quantidade de pessoas que têm
Ensino Fundamental completo e a quantidade de pessoas que têm Ensino Médio.

38
BIOESTATÍSTICA

Para tanto, basta seguir os passos:

1. Criamos a tabela com as variáveis em questão, como mostra a figura a seguir.

Figura 21 – Criação da tabela com as variáveis em estudo

2. Para se inserir qualquer fórmula no Excel, devemos primeiro utilizar o sinal de igual, pois assim ele
identifica que estamos com intenção de fazer uma conta ou utilizar uma função, a figura a seguir
nos mostra o cursor posicionado na célula B10, em que escrevemos o sinal de igual. E em seguida
clicamos na palavra fx, que se encontra na barra de fórmulas. Note que logo abaixo da palavra,
aparece escrito “inserir função”.

Figura 22 – Colocamos o sinal de igual na célula em que desejamos fazer a conta

3. Ao clicar na palavra fx da barra de fórmulas, uma janela se abrirá com todas as funções do Excel,
como na figura a seguir:

39
Unidade I

Figura 23 – Demonstrativo de janela de funções do Excel

4. Clique em OK e aparecerá outra janela, agora do argumento da função CONT.SE, que deve
ser preenchida em primeiro lugar com as células do intervalo em que se quer contar e qual o
critério de contagem, no nosso caso, a contagem será dos não alfabetizados, então, escolhemos
a célula C4, que é o local onde se encontra o primeiro não alfabetizado dos nossos dados, como
na figura a seguir:

Figura 24 – Argumentos da função CONT.SE

Com a janela aberta, em intervalo, selecionamos o intervalo de A2 até E7, como mostra a figura:

Figura 25 – Seleção de intervalo para contagem dos dados

40
BIOESTATÍSTICA

Com a janela aberta, em critério, selecionamos a célula C4 (Não Alfabetizados), como mostra a figura
a seguir.

Figura 26 – Seleção do critério para a contagem de dados

Note que, ao terminar de preencher o intervalo e o critério, o Microsoft Excel já apresenta o resultado
da fórmula em dois momentos: abaixo do “Não Alfabetizados” e, ao final, no canto direito: Resultado da
fórmula= 4 (veja figura 24).

Não é necessário escrever as células no item intervalo na janela, pois, enquanto a janela está ativa,
basta você selecionar, com o mouse, todo o intervalo de dados e ele já escreve A2:E7, que quer dizer que
ele procurará de A2 até E7, incluindo essas duas células, como na figura 25.

Para inserir o critério o procedimento é o mesmo, nesse caso, como critério você escolhera a célula
C4, como mostra a figura 26, onde está escrito “Não Alfabetizado”. Note que na janela de argumentos
da função (figura 24), ao lado do campo de critério, ele escreve “Não Alfabetizado”.

Clique em OK e, a partir daí, devemos proceder da mesma maneira para todas as outras variáveis,
como mostra a figura a seguir.

Figura 27 – Fórmulas para a contagem de dados no Microsoft Excel

Como podemos observar, na 2ª coluna temos as fórmulas de contagem e, ao final, a soma dos
valores. Para obter a soma, basta clicar no botão S, que se apresenta na barra de menus, e aceitar o
intervalo que ele oferece, como mostra a figura a seguir.

41
Unidade I

Figura 28 – Efetuando a soma dos dados

E então, no formato do IBGE, temos:

Figura 29 – Tabela de distribuição de frequências feita em Microsoft Excel

Saiba mais

Você pode obter mais informações a esse respeito, bem como mais
exemplos sobre essas tabelas no livro:

VIEIRA, S. Estatística básica. São Paulo: Cengage Learning, 2012.

3.4 Distribuição de frequências com intervalos de classe

Para dados quantitativos contínuos, devemos gerar uma tabela de dados chamada distribuição de
frequências com intervalos de classe. Para que possamos distribuir dados contínuos em linhas e colunas,
devemos, ao contrário da distribuição sem intervalos de classes, determinar quantas linhas e como
os dados estarão dispostos nessas linhas. Para tanto, devemos utilizar algumas fórmulas que serão
colocadas a seguir.

42
BIOESTATÍSTICA

Exemplo: uma pesquisa para se determinar a idade de 30 idosos que residem na Casa de Repouso
Cayro apresenta o rol da figura a seguir:

Figura 30 – Rol de dados variável quantitativa

Para criarmos a distribuição de frequências desses dados, vamos seguir os seguintes passos:

1. Primeiro temos que saber quantas linhas terá a tabela. Para isso, devemos utilizar a fórmula:

i= n

Onde:

i = número de linhas que a tabela deve ter.

n = número de pessoas entrevistadas.

O nosso exemplo tem uma amostra n de 30 idosos, portanto, faremos:

i = 30 = 5, 48 ≅ 5

Logo, nossa tabela terá 5 linhas.

Então, devemos distribuir as 30 idades em 5 linhas.

2. Para descobrirmos qual deve ser o intervalo de classes devemos escolher a menor idade do rol
(chamada de limite máximo dos dados (Lmin = 65) e a maior idade do rol (chamada de limite
máximo dos dados (Lmáx = 89).

A amplitude do intervalo de classe será dada por

L m á x − L min
h=
i

43
Unidade I

No nosso exemplo temos:

maior idade − menor idade


h=
i
89 − 65 24
h= = = 4, 8 ≅ 5
5 5
Portanto, devemos ter uma tabela com 5 linhas e amplitude de 5 anos.

Temos então que criar a tabela inicial, com 5 linhas, e colocar os intervalos de classes, como na figura a seguir.

Figura 31 – Como criar a distribuição de frequências para dados contínuos

As idades iniciam em 65 (menor idade), acrescentamos 5 (amplitude), levamos o último número para
a próxima linha e acrescentamos 5, e assim por diante.

O símbolo que separa os números (├) representa um intervalo fechado à esquerda e aberto à direita
(significa que incluímos o número da esquerda e não incluímos o número da direita), então, contamos todas
as idades 65 anos, inclusive, a 69, pois a idade 70 será contada na próxima linha, e assim sucessivamente.

A tabela a seguir apresenta o resultado final:

Figura 32 –Tabela de exemplo de distribuição de frequências de uma variável contínua

44
BIOESTATÍSTICA

Lembrete

Dados contínuos devem estar dispostos em uma distribuição de


frequências com intervalos de classe.

Contagem das frequências no Microsoft Excel:

Para a contagem das frequências de cada classe, lembremos que agora temos um intervalo numérico,
por isso, a função é CONT.SES e não CONT.SE, pois é um intervalo de números. Por isso, temos que
contar os números do intervalo maiores ou iguais ao primeiro e menores do que o último número,
representados pelo símbolo ├.

O Excel não entende o símbolo (├), portanto temos que colocar as idades em células diferentes para
que possamos contar os números do intervalo, observe a figura a seguir:

Figura 33 – Tabela do Excel

As fórmulas para a obtenção dos resultados estão na figura:

Figura 34 – Exemplos da fórmula CONT.SES para contagem de dados

45
Unidade I

O resultado será a tabela a seguir, já formatada pelas regras do IBGE.

Figura 35 – Tabela: resultado das fórmulas, na tabela já formatada

3.5 Elementos de uma distribuição de frequência

Classes: são intervalos de variação da variável. As classes são representadas simbolicamente por i.

Limites de classe: são os extremos de uma classe. O menor número é o limite inferior da classe (Li)
e o maior número, o limite superior da classe (Ls).

Amplitude de intervalo de classe: é a medida do intervalo que define a classe. É obtida pela
diferença entre os limites superior e inferior dessa classe e indicada por Hi:

Hi = Ls – Li.

Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe (limite
superior máximo) e o limite inferior da primeira classe (limite inferior mínimo):

AT = Ls(máx.) – Li(mín.)

Amplitude amostral (AA): É a diferença entre o valor máximo e o valor mínimo da amostra:

AA = L(máx.) – L(mín.)

Ponto médio de uma classe (xi): É o ponto que divide o intervalo de classe em duas partes iguais
(média aritmética).

Li + Ls
xi =
2

46
BIOESTATÍSTICA

3.6 Tipos de frequências

Frequência simples ou absoluta (Fi): são os valores que realmente representam o número de
dados de cada classe. A soma das frequências simples sempre tem como resultado n, isto é, o número
de entrevistados.

Frequências relativas (Fri): são os valores das razões entre as frequências simples e a frequência
total.

Fi
Fri =
∑ Fi
Frequência percentual (Fri%): é a frequência relativa multiplicada por 100.

Fri%=Fri x 100

Frequência acumulada (Fa): é o total das frequências de todos os valores inferiores ao limite
superior do intervalo de uma dada classe. Para completar a coluna, devemos copiar a primeira frequência,
F1 e somar sucessivamente as outras frequências.

Frequência acumulada relativa (Fra) de uma classe: é a frequência acumulada da classe, dividida
pela frequência total da distribuição:

Fa
Fra =
∑ Fi
Frequência percentual (Fra%): é a frequência relativa acumulada multiplicada por 100.

Fra% = Fra x 100

Exemplos:

1. A tabela a seguir é a distribuição de frequências completa, com todas as frequências, da pesquisa


sobre o nível de escolaridade de 30 funcionários do Hospital Baruch de Toulouse.

Figura 36 – Tabela com as frequências acumulada, relativa e percentual

47
Unidade I

2. A tabela a seguir é a distribuição de frequências completa, com todas as frequências, da pesquisa


de idades da Casa de Repouso Cayro.

Figura 37 – Tabela de distribuição de frequências completa

Agora, com a tabela completa, já podemos fazer observações importantes, tais como:

A maioria dos idosos residentes na Casa de Repouso Cayro tem idade acima de 75 anos, ou melhor,
de 77,5 anos, perfazendo 30% dos idosos, seguidos de 27% de idosos com média de 82,5 anos.

Após a organização dos dados na tabela, podemos fazer as inferências necessárias aos nossos estudos.

Lembrete

Os resultados da tabela foram calculados com as fórmulas de suas


respectivas frequências.

Observação

Note que o ponto médio da classe só é feito no caso de tabelas com


intervalos de classe.

Se você quiser, poderá fazer complementar a tabela do Microsoft Excel, com as fórmulas demonstradas
na figura a seguir. As frequências absolutas já foram demonstradas com mais clareza na figura anterior.

Figura 38 – Tabela completa com as fórmulas no Microsoft Excel

48
BIOESTATÍSTICA

3.7 Gráficos estatísticos

A apresentação dos resultados da pesquisa em gráficos é utilizada para tornar a leitura dos resultados
mais simples, representando com mais clareza os resultados da pesquisa, não só para o pesquisador, mas
também para o público em geral.

Os gráficos estatísticos são construídos em um sistema de coordenadas cartesianas, porém, temos


que lembrar que os resultados apresentados representam apenas um dos eixos do gráfico, o outro eixo
apresenta a variável em estudo.

Portanto, utiliza‑se apenas um dos eixos para os resultados. Assim, será utilizado, sempre,
um eixo abscissas ou ordenadas, dependendo do tipo de gráfico, para as ocorrências da variável
(resultado da pesquisa), e o outro eixo será apenas para o nome ou valor da variável: qualitativa
(“sim”, “não”, “concordo totalmente”, “parcialmente” etc.) ou quantitativa (estatura média da classe,
idade média etc.).

3.8 Tipos de gráficos

Os gráficos mais comuns são: gráfico de setores ou pizza; gráfico de barras; gráfico em colunas;
gráfico de linhas; e histograma de frequências. O Microsoft Excel apresenta uma grande variedade de
gráficos estatísticos disponíveis para utilização.

Em geral, utilizam‑se gráficos em setores, barras e colunas para variáveis qualitativas e gráfico em
linhas e histograma de frequências para variáveis quantitativas.

Lembrete

Gráfico estatístico é a maneira como apresentamos os resultados da


pesquisa de forma mais inteligível a todos.

3.8.1 Gráfico em linha ou em curva – polígonos de frequências

Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística, que também
serve para mostrar as frequências absolutas e as frequências acumuladas.

Normalmente é utilizado para variáveis quantitativas, quando se quer visualizar a evolução temporal
de uma variável. Pode ser feito com linhas retas ou por curvas. Esse, em geral, é o gráfico utilizado para
mostrar a evolução dos candidatos em época de eleição, por exemplo.

Quando a variável é quantitativa contínua gera distribuições com intervalos de classe, no eixo x são
colocados os pontos médios das classes.

49
Unidade I

Exemplos:

1. O gráfico a seguir compara a quantidade de gestantes que foram encaminhadas ao Hospital


Maternidade Baruch de Toulouse e a quantidade que foi recusada pelo hospital.

Figura 39 – Exemplo de gráfico em linha

2. O gráfico a seguir apresenta o resultado da pesquisa feita com as idades dos idosos da Casa de
Repouso Cayro.

Figura 40 – Exemplo de gráfico em linhas utilizando os dados da Casa de Repouso Cayro

Lembrete

O gráfico em linhas normalmente é utilizado para variáveis quantitativas


contínuas, quando desejamos apresentá‑las em evoluções temporais ou
quando desejamos compará‑las.

50
BIOESTATÍSTICA

Observação

A construção de gráficos no Microsoft Excel é extremamente simples e,


com certeza, o seu gráfico ficará muito mais apresentável.

Vamos seguir os passos para fazer o gráfico que se encontra no segundo exemplo, utilizando dados
da Casa de Repouso Cayro (figura 40).

1. Selecione, na tabela, apenas a coluna das frequências, e clique em “Inserir”, como mostra a figura
a seguir. Note que o menu de gráficos aparece à sua direita, logo após o menu de ilustrações.

Figura 41 – Gráficos no Excel

Atenção: se selecionarmos duas colunas numéricas, o Excel entenderá que se quer fazer um gráfico
comparando duas variáveis.

2. Na barra de gráficos, clicamos na opção “Linhas” e um menu suspenso aparecerá, possibilitando


a escolha do tipo de gráfico de linhas que desejamos. No nosso exemplo será utilizada a primeira,
como na figura a seguir:

Figura 42 – Escolha do tipo de gráfico

51
Unidade I

3. Ao clicar, o gráfico aparecerá na tela, mas de forma rústica, como na figura a seguir. Você pode
utilizar o layout e o formato que desejar nas opções de menu do Excel. Quando o gráfico está
selecionado, aparecem as opções “Designs”, “Layout” e “Formatar”, para que se possa escolher a
formatação que desejar.

Figura 43 – Gráfico estatístico no Microsoft Excel

Note que o eixo das abscissas (x) está composto por números sequenciais. Devemos, então, modificar
esses dados e colocar a média das idades no eixo.

4. Para modificar os dados do eixo x, devemos proceder da seguinte maneira: selecione os valores
do eixo x, clique com o botão direito do mouse e escolha a opção “Selecionar Dados...”, como
na figura:

Figura 44 – Como modificar dados de um eixo, no Microsoft Excel

5. Uma nova janela se abrirá. Então devemos, na opção “Rótulos do Eixo Horizontal”, escolher a
opção “Editar”, como na figura a seguir:

52
BIOESTATÍSTICA

Figura 45 – Editar dados do eixo das abscissas

6. Abre‑se outra janela, selecionamos os dados, na tabela, com os valores que desejamos inserir no
eixo e clicamos em “OK”, na próxima janela, como na figura a seguir, e “OK” outa vez para sair da
janela.

Figura 46 – Alteração dos dados do eixo das abscissas

Pronto, os dados foram anexados ao eixo, como mostra o gráfico a seguir:

Figura 47 – Média das idades dos idosos (xi), no eixo horizontal

Vimos o gráfico em linhas e aproveitamos para aprender a fazê‑lo no Excel. O procedimento é o


mesmo para todos os tipos de gráficos que o software oferece, menos os gráficos de dispersão, que são a
melhor opção quando for necessário utilizar dados para o eixo horizontal e vertical, isto é, um ponto de
coordenadas (x, y). Em estatística, esse gráfico é utilizado apenas em correlação e regressão, e a própria
Curva de Gauss.

53
Unidade I

O gráfico em linhas não é de tão fácil visualização, a não ser que realmente tenhamos várias séries
para apresentar, como no exemplo do Hospital Maternidade Baruch de Toulouse.

3.8.2 Histogramas

Os histogramas são gráficos formados por retângulos justapostos (sem espaço entre eles), em que
o eixo vertical apresenta a frequência absoluta ou relativa das observações dentro de cada intervalo e
o eixo horizontal apresenta a variável em estudo, que normalmente deve ser uma variável quantitativa
contínua representada em seu ponto médio (xi).

Exemplos:

1. O gráfico a seguir apresenta o resultado da pesquisa feita com as idades dos idosos da Casa de
Repouso Cayro.

Figura 48 – Histograma representando a idade média dos idosos da Casa de Repouso Cayro

2. Feita uma pesquisa a respeito da estatura de 40 alunos de uma classe do curso de Gestão Hospitalar,
os resultados estão apresentados no gráfico a seguir.

Figura 49 – Histograma representando a estatura de 40 alunos do curso de Gestão Hospitalar

54
BIOESTATÍSTICA

Lembrete

Os histogramas são comumente utilizados para variáveis quantitativas


contínuas em seus pontos médios.

Observação

O histograma é um gráfico de mais fácil leitura, por isso, muitas vezes,


ele passa a ser a melhor opção para variáveis contínuas.

Para fazer um histograma no Microsoft Excel, siga os passos para a construção de gráficos, apresentados
anteriormente (escolha colunas, e a opção de layout 8), e depois a formatação do gráfico pode ser a seu gosto, tente.

3.8.3 Gráfico em colunas ou em barras

O gráfico em colunas é a representação dos dados da tabela por meio de retângulos dispostos
verticalmente, o de barras é a representação dos dados dispostos horizontalmente. Esses gráficos são
muito populares e muito utilizados nas apresentações por serem de fácil leitura.

Em geral, são utilizados para variáveis qualitativas, ou seja, dados nominais ou ordinais, e
frequentemente apresentando frequências percentuais.

O gráfico em colunas apresenta retângulos com mesma base e as alturas proporcionais aos valores
de contagem das variáveis, já em barras, apresenta retângulos de mesma largura e os comprimentos
proporcionais aos valores de contagem das variáveis.

Exemplos:

1. O gráfico a seguir apresenta o resultado da pesquisa para se determinar o nível de escolaridade de


uma amostra de 30 funcionários do Hospital Baruch de Toulouse (figura 36).

Figura 50 – Gráfico em colunas relativo aos dados da tabela da figura 36

55
Unidade I

2. O gráfico 7 apresenta o resultado da pesquisa para avaliar a qualidade do EaD de determinada


universidade (figura 20), pela frequência percentual.

Figura 51 – Gráfico em barras relativo aos dados da tabela da figura 20, em porcentagem

Lembrete

Gráficos em colunas ou barras normalmente são utilizados para


apresentar variáveis qualitativas.

Observação

No Microsoft Excel, quando a variável é qualitativa, pode‑se selecionar


a coluna da variável e dos dados ao mesmo tempo, porque uma delas é
texto e a outra é número.

O Microsoft Excel assume os números como valores da variável e as letras como legenda dos dados.

3.8.4 Gráfico em colunas ou em barras múltiplas

Utilizamos o gráfico em colunas ou barras múltiplas para comparar o desempenho de duas ou mais
variáveis.

Exemplos:

1. O gráfico a seguir apresenta o resultado da comparação entre a idade gestacional de gestantes de


triagem do hospital maternidade Baruch de Toulouse de setembro de 2012 a setembro de 2013.

56
BIOESTATÍSTICA

Figura 52 – Exemplo 1 de gráfico de colunas múltiplas

2. O gráfico a seguir apresenta o resultado do motivo da recusa de gestantes de triagem do Hospital


Maternidade Baruch de Toulouse, em Guaxupé, de setembro de 2012 a setembro de 2013.

Figura 53 – Exemplo 2 de gráfico de colunas múltiplas

Lembrete

Gráfico em colunas ou barras múltiplas é utilizado para comparar o


desempenho de variáveis.

Observação

No Microsoft Excel podemos selecionar todas as variáveis ao mesmo


tempo e escolher inserir gráfico em colunas ou barras.

Para selecionar colunas que não sejam seguidas basta segurar a tecla Ctrl enquanto seleciona as
colunas desejadas.

57
Unidade I

3.8.5 Gráfico em setores

Comumente conhecido como gráfico em pizza, é construído com base em um círculo e é muito
utilizado para demonstrar o desempenho de uma variável em relação ao total. Por isso, em geral, utiliza‑se
a frequência percentual para expor os dados. É indicado para apresentar variáveis qualitativas, mas não
fica muito bom se tivermos muitas categorias, pois ficariam pequenos espaços da circunferência para
cada variável.

Para construirmos esse gráfico a mão, devemos ter um compasso e um transferidor, pois temos que
levar em conta que os valores percentuais estarão representando partes da circunferência, que tem por
total representados 360º. Logo, as porcentagens devem ser transformadas em graus, de forma que essa
circunferência ficará dividida em tantos setores quantas são suas partes e esses setores são medidos em graus.

Em primeiro lugar, devemos fazer a transformação das partes, em geral em porcentagem, para graus.
Para essa transformação, devemos utilizar uma regra de três simples, que terá a correspondência 100%
para 360º.

Exemplo:

1. Para uma porcentagem de 52%, temos:

360º 100%

X 52%

X = (360* 52)/100

X = 187,2º

Então fazemos a circunferência com o compasso e medimos, com o transferidor, 187,2º, sempre no
sentido anti‑horário, marcamos a parte e pintamos.

2. Para uma porcentagem de 8%, temos:

360º 100%

X 8%

X = (360* 8)/100

X = 28,8º

Fazemos a circunferência com o compasso e medimos, com o transferidor, 28,8º a partir do anterior
e assim sucessivamente.
58
BIOESTATÍSTICA

Exemplos:

1. O gráfico a seguir apresenta o resultado da pesquisa para se determinar o nível de escolaridade


(figura 36) de uma amostra de 30 funcionários do Hospital Baruch de Toulouse.

Figura 54 – Exemplo 1 de gráfico em setores

2. O gráfico a seguir apresenta o resultado da pesquisa para avaliar a qualidade do EaD de determinada
universidade (figura 20), pela frequência percentual.

Figura 55 – Exemplo 2 de gráfico em setores

Lembrete

O gráfico em setores é comumente conhecido por gráfico de pizza, é


utilizado para variáveis qualitativas e utiliza porcentagem para apresentar
os dados.

59
Unidade I

Observação

O Microsoft Excel faz automaticamente a transformação de porcentagem


para graus.

4 MEDIDAS DE TENDÊNCIA CENTRAL E DE VARIABILIDADE

Medidas de tendência central são utilizadas para avaliar a tendência dos dados em se agrupar em
torno de valores centrais nas tabelas ou em sequências numéricas chamadas de dados não agrupados.

As medidas de tendência central são: a média aritmética, a mediana, a moda e podem ser calculadas
para dados qualitativos e quantitativos.

Observação

Dados não agrupados são aqueles que não se encontram em tabelas de


distribuição de frequências.

4.1 Média aritmética (X)

A média aritmética é empregada quando desejamos obter a medida de posição que possui maior
estabilidade. Como é uma medida de tendência central, normalmente ela tem como resultado um
número que está no centro ou perto do centro da distribuição, porém, dependendo da variabilidade dos
dados, ela também pode tender à maior concentração de dados.

4.1.1 Média aritmética para dados não agrupados

Quando desejamos conhecer a média dos dados não agrupados, isto é, números que não se encontram
agrupados em tabelas, determinamos a média aritmética simples, dada pela fórmula:

x=
∑ xi
n

Onde:

x = média aritmética.

∑ xi = soma de todos os elementos da sequência numérica.


n = número de elementos da sequência numérica.

60
BIOESTATÍSTICA

Observação

A letra grega Σ (sigma, maiúscula) é o sinal de somatório, utilizado para


apresentar a soma de todos os elementos da sequência.

Exemplos:

1. Para testar a qualidade do atendimento, o gestor do Hospital e Maternidade Baruch de Toulouse


está anotando o tempo que 15 pacientes aguardam na recepção para serem atendidos. Os dados
estão na tabela a seguir:

Figura 56 – Tempos de espera em minutos

Resolução:

x=
∑ xi
n

n = 15 (15 tempos anotados)

217, 60
x= = 14, 51 minutos
15

Portanto, o tempo de espera médio para o atendimento dos pacientes do hospital na recepção é de
14,51 minutos.

61
Unidade I

2. Um professor deseja saber a nota média de seus alunos na prova, para tanto separa as notas:

5,5 7,0 10,0 3,0 4,0 8,0 2,0 3,5 6,7 9,2 6,6 7,8

Resolução:

x=
∑ xi
n

n = 12 (são 12 notas)

5, 5 + 7 + 10 + 3 + 4 + 8 + 2 + 3, 5 + 6, 7 + 9, 2 + 6, 6 + 7, 8
x=
12

73, 3
x= = 6,108 ≅ 6,1
12

Portanto, a nota média dos alunos foi de 6,1.

Lembrete

Média aritmética para dados não agrupados é a soma de todos os


valores dividida pela quantidade de valores.

Observação

A média aritmética de dados não agrupados pode ser feita facilmente


no Microsoft Excel, basta selecionar os dados e utilizar a função média.

4.1.2 Média aritmética para dados agrupados

Dados agrupados são aqueles resultantes de uma ordenação, isto é, tabulação de dados. Portanto,
apresentam‑se em tabelas e podem ser variáveis quantitativas contínuas ou discretas.

Para efetuarmos a média aritmética desse tipo de dados, devemos utilizar, na verdade, a média
aritmética ponderada, sendo o fator de ponderação a própria variável em estudo.

x=
∑ Xi × Fi
∑ Fi
62
BIOESTATÍSTICA

Onde:

x = média aritmética.

ΣXi × Fi = soma dos produtos de todas as frequências pelo ponto médio da classe.

ΣFi = soma de todas as frequências (nº de entrevistados).

Observação

Se os dados agrupados são de variáveis qualitativas, não existe


ponderação, então a fórmula deverá ser a mesma apresentada para dados
não agrupados.

Exemplos:

1. Vamos fazer a média das idades dos idosos residentes na Casa de Repouso Cayro.

Resolução:

Devemos utilizar a tabela que já foi criada em distribuição de frequências, acrescida da multiplicação
e total de Xi por Fi. Assim, temos a tabela a seguir.

Figura 57 – Tabela para cálculo da média aritmética de dados contínuos

A fórmula para determinar a média aritmética é:

x=
∑ Xi × Fi
∑ Fi

63
Unidade I

Pela tabela, temos:

ΣXi × Fi = 2390,0 e ΣFi = 30

Então, temos:

2390, 0
x= = 79, 7 anos
30

Portanto, a idade média dos residentes na casa de repouso é de 79,7 anos.

Observação

Note que a média está praticamente no meio da tabela, por isso é


chamada de medida de tendência central, não esquecendo que também é
o local de maior frequência.

2. A maternidade Athena de Toulouse pretende saber a quantidade de filhos que suas pacientes já
tiveram em suas instalações, vai aos seus arquivos, colhe os dados e os apresenta na seguinte
tabela:

Figura 58 – Tabela para cálculo da média aritmética de dados discretos

Resolução:

Temos:

∑ Xi × Fi = 110 = 2, 2 filhos
∑ Xi × Fi = 110, ∑ Fi = 50, entª o : x =
∑ Fi 50

64
BIOESTATÍSTICA

Para responder a esta questão, devemos considerar que a variável em estudo é quantitativa discreta,
pois não podemos admitir separar crianças em partes, logo a resposta correta é que a média de filhos
que as pacientes tiveram na maternidade é de 2 filhos, com uma leve tendência a três.

Lembrete

Para dados quantitativos devem ponderar a média.

Observação

Note que a média aparece um pouco acima do centro, onde temos a


maior concentração de valores das frequências.

4.2 Mediana (Md)

A mediana também é uma medida de tendência central, mas, diferente da média, é o valor que
se encontra exatamente no centro da distribuição, porém, para que possamos encontrá‑la, devemos
ordenar os números segundo uma ordem de grandeza, ou seja, crescente ou decrescente. Como a média,
também é tratada de forma diferente para dados agrupados e não agrupados.

4.2.1 Mediana para dados não agrupados

Para determinarmos a mediana de dados não agrupados, devemos ordená‑los em ordem crescente
ou decrescente e separar ao meio, o valor que estiver no centro da sequência será a mediana, em caso de
sequências com número par de elementos, devemos achar a média aritmética dos dois valores centrais
e esta será a mediana.

Exemplos:

1. O gestor do Hospital Baruch de Toulouse tem intenção de saber qual a idade mediana dos pacientes
que gastam acima de R$ 300,00 em exames de sangue. Para tanto, separa as idades de 11 desses
pacientes: 65, 60, 45, 32, 55, 55, 65, 78, 92, 94, 50.

Resolução:

Devemos, em primeiro lugar, colocar as idades em ordem crescente, como na figura a seguir.

32 45 50 55 55 60 65 65 78 92 94

Figura 59 – Valores em ordem crescente

Então, escolhemos o valor central para mediana, como mostra a seguinte figura.
65
Unidade I

32 45 50 55 55 60 65 65 78 92 94

Valor central é 60

Figura 60 – Mediana para sequência com quantidade ímpar de valores

Então, Md = 60 anos.

Portanto, a idade média dos pacientes que gastam acima de R$ 300,00 em exames de sangue é de
60 anos.

2. O gestor do Hospital Baruch de Toulouse tem intenção de saber qual a idade mediana dos pacientes
que gastam acima de R$ 300,00 em exames de sangue. Para tanto, separa as idades 10 desses
pacientes: 65, 60, 45, 32, 55, 55, 65, 78, 92, 94.

Resolução:

Devemos, em primeiro lugar, colocar as idades em ordem crescente:

32 45 55 55 60 65 65 78 92 94

Figura 61 – Dados organizados

Como não temos um valor central definido, devemos fazer a média dos dois valores centrais, como
mostra a figura a seguir:

32 45 55 55 60 65 65 78 92 94

60 + 65 125
Md = = = 62, 5
2 2

Figura 62 – Mediana para sequência com quantidade par de valores

Lembrete

Não se esqueça de organizar os dados.

Observação

No Microsoft Excel, a mediana para dados não agrupados é dada pela


fórmula: =MED(intervalo de células desejado).
66
BIOESTATÍSTICA

4.2.2 Mediana para dados agrupados

Para determinamos a mediana, temos que ordenar os dados, quando tratamos dados agrupados, o
conceito de mediana é o mesmo, porém, para dispormos dados agrupados em ordem crescente, a única
maneira é utilizarmos a frequência acumulada (Fa).

Quando a distribuição é sem intervalos de classe, basta identificar a frequência acumulada


imediatamente superior à metade da soma das frequências.

 ∑ Fi 
 2 
 

A mediana será o valor da variável que corresponde a tal frequência acumulada.

Exemplo:

1. Utilizando os dados da pesquisa da Maternidade Athena de Toulouse, em primeiro lugar, devemos


determinar as frequências acumuladas (Fa), como mostra a tabela a seguir, e depois calcular o
valor da metade da soma das frequências:

 ∑ Fi 
 2 
 

Figura 63 – Tabela de cálculo das frequências acumuladas

∑ Fi = 50 = 25
2 2

Portanto, o valor mediano do número de filhos é o número de filhos que se encontra na classe da Fa
maior mais próxima de 25, no caso a classe de Fa = 34, o que remete à 2 filhos:

67
Unidade I

Figura 64 – Valor da mediana

Portanto, o número mediano de filhos que as pacientes da Maternidade Athena de Toulouse


têm é 2.

Se a distribuição é com intervalos de classes, devemos descobrir qual o número, dentro do intervalo
de classe, da classe mediana, que corresponde à mediana, para isso, temos a fórmula:

 ∑ fi 
 − Fa(ant ) Xh
 2 
Md = Li + 
Fi

Onde:

Md = mediana.

Li = limite inferior da classe mediana.

Fa (ant) = frequência acumulada da classe anterior à classe mediana.

Fi = frequência simples da classe mediana.

H = amplitude do intervalo da classe mediana.

2. Vamos fazer a mediana das idades dos idosos residentes na Casa de Repouso Cayro.

Resolução:

Devemos, em primeiro lugar, fazer a Fa:

68
BIOESTATÍSTICA

Figura 65 – Tabela com as frequências acumuladas

Temos:

∑ Fi = 30 = 15
2 2

Portanto, a classe mediana é a 3ª, então os dados da fórmula estão nessa classe:

 ∑ fi 
 − Fa(ant ) Xh
 2 
Md = Li + 
Fi

Md = 75 +
(15 − 6) × 5
9

9
Md = 75 + × 5
9

Md = 75 + 5

Md = 80

Portanto, a mediana das idades é 80 anos.

Lembrete

Para determinar a mediana de dados agrupados, devemos fazer a


frequência acumulada (Fa).

69
Unidade I

Observação

O Microsoft Excel não apresenta funções automáticas para dados


agrupados, portanto, devemos inserir a fórmula para que ele execute as
operações e apresente o resultado correto.

4.3 Moda (Mo)

Denominamos moda o valor que ocorre com maior frequência em uma série de valores.

4.3.1 Moda para dados não agrupados

Quando os dados não estão agrupados, a moda é, de acordo com a definição, o valor que mais se
repetir na sequência.

Uma série de dados pode não ter nenhum elemento que se repete, não apresentando moda.
Portanto, será chamada de amodal. Ela pode ainda possuir mais de um elemento que se repete na
mesma quantidade. Se forem dois, por exemplo, terá duas modas e será chamada de Bimodal, e assim
por diante.

Exemplos:

1. O gestor do Hospital Baruch de Toulouse tem intenção de saber qual a idade mediana dos pacientes
que gastam acima de R$ 300,00 em exames de sangue. Para tanto, separa as idades de 11 desses
pacientes: 65, 60, 45, 32, 55, 55, 65, 78, 92, 94, 50.

Resolução:

A moda será o valor que mais repete, nesse caso, podemos notar que a idade 55 anos aparece duas
vezes e 65 anos também, logo, temos duas modas: Mo = 55 anos e Mo = 65 anos.

Essa distribuição é chamada de bimodal.

Lembrete

No caso de sequências numéricas, pode haver mais de uma moda ou


nenhuma moda (amodal).

2. Para testar a qualidade do atendimento, o gestor do Hospital e Maternidade Baruch de Toulouse


está anotando o tempo que 15 pacientes aguardam para ser atendidos ao chegarem na recepção.
Os dados estão na tabela a seguir. Vamos determinar qual é o tempo modal de espera dos pacientes.

70
BIOESTATÍSTICA

Figura 66 – Tempos de espera em minutos

Resolução:

O valor que mais repete é o tempo 14,5, logo, esse é o tempo modal:

Mo = 15 minutos.

Observação

No Excel, a moda para dados não agrupados é dada pela fórmula:


=MODO.MULT, quando temos mais de uma moda, como no primeiro
exemplo, pressionamos CTRL+SHIFT+ENTER, em vez de OK.

4.3.2 Moda para dados agrupados

Se os dados estão agrupados sem intervalos de classes, determinamos a moda pela definição, isto
é, basta escolher o valor da variável de maior frequência.

Exemplos:

1. Em uma pesquisa para se determinar o nível de escolaridade de uma amostra de 30 funcionários


do Hospital Baruch de Toulouse, foram obtidos os dados da tabela a seguir. Vamos determinar
qual a escolaridade modal dos funcionários do hospital:

71
Unidade I

Figura 67 – Dados do Hospital Baruch de Toulouse

Resolução:

Para determinarmos a moda, basta observar a coluna das frequências absolutas e encontrar a maior
frequência, esta será a classe modal e a moda será o grau de escolaridade que se encontra nessa classe.

Assim, podemos observar que, na tabela, temos como moda o grau de escolaridade Fundamental
incompleto, pois a sua frequência é 17, a maior frequência de todas.

Portanto:

Mo = Fundamental incompleto

2. A seguinte tabela apresenta os dados que demonstram a quantidade de filhos que as pacientes da
maternidade Athena de Toulouse já tiveram em suas instalações. Vamos determinar o valor modal
da quantidade de filhos dessas pacientes.

Resolução:

Figura 68 – Tabela de dados da maternidade Athena de Toulouse

72
BIOESTATÍSTICA

A observação da coluna das frequências absolutas nos mostra que a maior frequência é 18, portanto,
a classe modal é a segunda, o que nos permite dizer que a moda da quantidade de filhos das pacientes
da maternidade Athena de Toulouse é de 2 filhos.

Então:

Mo = 2 filhos.

Se os dados estão agrupados com intervalos de classes, determinamos a classe modal pela
definição, isto é, a classe que apresenta maior frequência, e utilizamos como resposta o ponto médio da
classe (xi). Esse valor é chamado moda bruta.

Exemplo:

1. Vamos fazer a moda das idades dos idosos residentes na Casa de Repouso Cayro.

Resolução:

Temos que utilizar o ponto médio da classe para responder qual é a moda, para tanto, temos a tabela
a seguir, que apresenta a distribuição com os valores dos respectivos pontos médios das classes:

Figura 69 – Tabela de idade dos idosos da casa de repouso

Como podemos perceber, já está demonstrada a classe modal, pois a maior frequência absoluta é 9, então
podemos dizer que a classe modal é a 3ª e a moda da distribuição é o ponto médio dessa classe, que é 77,5 anos.

Logo: Mo = 77,5 anos

Lembrete

Para determinar a moda de uma sequência ou distribuição, basta


escolher o valor que mais se repete.

73
Unidade I

Observação

Dados agrupados só admitem uma moda, o valor que mais repete. O


Microsoft Excel não tem função de moda para dados agrupados.

4.4 Emprego da média, da mediana e da moda

A média aritmética é empregada quando desejamos obter a medida de posição que possui maior
estabilidade.

A mediana é empregada quando se deseja obter o ponto que divide a distribuição em partes iguais;
quando há valores extremos que afetam a média de maneira acentuada.

A moda é utilizada quando se deseja obter uma medida rápida e aproximada de posição ou quando
a medida de posição deve ser o valor mais típico da distribuição.

4.5 Medidas de dispersão: variância, desvio padrão para dados agrupados


e não agrupados

A média, a mediana e a moda descrevem bem um conjunto de dados, desde que a sua variabilidade
(inconstância) não seja muito grande. Para que possamos dar sustentação à média aritmética, devemos
calcular a sua dispersão, ou seja, verificar como os dados estão espalhados em relação à média. Para
calcular essa variabilidade, temos as medidas de dispersão, variância e desvio padrão.

Exemplos:

1. No Hospital Baruch de Toulouse, as idades dos 10 colaboradores são: 30, 30, 30, 32, 30, 30, 33, 29,
33 e 30

A média dessas idades é:

(30+30+30+32+30+30+33+29+33+30)/10 = 30,7 @ 31 anos.

O que descreve bem as idades, pois não são muito dispersas, variam entre 29 e 33 anos, logo, 31 é o
centro das idades.

2. Em uma unidade de saúde da Maternidade Athena de Toulouse, localizada na cidade de Guaxupé,


as idades dos 10 colaboradores são: 16, 30, 28, 28, 65, 30, 32, 26, 25 e 25.

A média dessas idades é:

(16+30+28+28+65+30+32+26+25+25)/10 = 30,5 @ 31 anos.

74
BIOESTATÍSTICA

Nesse caso, temos como resultado a mesma média do exemplo anterior, 31 anos, porém, a variação
das idades (variabilidade) é muito diferente do primeiro exemplo, pois a menor idade é 16 anos e a
maior é 65.

Esses dois extremos (16 e 65) são chamados, em estatística, de outliers.

Observação

Outliers são valores que apresentam grande afastamento dos demais


da série.

Por meio desses dois exemplos podemos notar que as duas médias apresentam o mesmo resultado,
porém, 31 anos descreve muito bem os dados do Hospital Baruch de Toulouse, mas não tão bem as
idades de sua filial.

Esses dados mostram que, quando apresentamos uma medida de tendência central, devemos
apresentar também uma medida de variabilidade ou dispersão para podermos demostrar como os dados
estão variando com relação a essas medidas.

4.5.1 Variância (S²)

A variância de um conjunto qualquer de dados (uma sequência numérica), ou seja, dados não
agrupados, é determinada pela fórmula:

Variância populacional:

σ2 =
∑ (x − µ)
N

Variância amostral:

∑ (x − x )
2
2
S =
n −1

Onde:

σ2 = variância populacional

S² = variância amostral

x = elemento qualquer do conjunto considerado.

75
Unidade I

µ ( ou x) = a média do conjunto de dados.

N (ou n) = total de elementos computados (da população ou da amostra).

Observação

As letras gregas s (sigma) e m (mi) são utilizadas para a fórmula da


variância populacional. Utilizaremos a fórmula para variância amostral,
pois normalmente tratamos amostras em nossas pesquisas.

Para dados agrupados, a fórmula para amostra é:

S2 =
∑ ( xi − x )2.Fi
n −1

Onde:

S² = variância amostral.

x = elemento qualquer do conjunto considerado.

x = a média do conjunto de dados.

n = total de elementos computados da amostra.

Observação

Existem outras fórmulas para calcular a variância de dados não


agrupados, em Bioestatística, normalmente utilizamos a fórmula anterior.

4.5.2 Desvio padrão (S)

A variância é uma medida que não faz parte dos dados, apenas nos diz o quanto eles estão
dispersos em relação à média. Para que possa ser comparável com os dados, devemos expressá‑la na
mesma magnitude em que os dados se encontram, para tanto, devemos calcular o desvio padrão.
Nesse caso para dados não agrupados, que é obtido por meio da raiz quadrada da variância, como
nas fórmulas:

76
BIOESTATÍSTICA

Desvio padrão populacional:

∑ ( x − u)
2
σ=
N

Desvio padrão amostral:

2
s=
∑ (x − x )
n −1

Onde:

x = elemento qualquer do conjunto considerado.

µ ( ou x) = a média do conjunto de dados.

N (ou n) = total de elementos computados (da população ou da amostra).

Observação

A fórmula utilizada para o desvio padrão é a mesma da variância, só


que agora dentro do sinal de radical, portanto, o desvio padrão é a raiz
quadrada da variância.

Para dados agrupados, a fórmula para o desvio padrão é dada por:

∑ ( xi − x )
2
.Fi
s=
n −1

Onde:

x = elemento qualquer do conjunto considerado.

x = a média do conjunto de dados.

n = total de elementos computados (da população ou da amostra).

Fi= frequência da classe.

77
Unidade I

Observação
Existem outras fórmulas para calcular o desvio padrão de dados
agrupados, a opção foi utilizar a fórmula que tem referência à escolhida
para variância.

Exemplos:

1. No Hospital Baruch de Toulouse, as idades de 10 colaboradores são: 30, 30, 30, 32, 30, 30, 33, 29,
33 e 30, vamos calcular qual é a variância e o desvio padrão dessas idades:

Resolução:

Para calcularmos a variância de dados não agrupados, utilizamos a fórmula:

s2 =
∑ (x − x )2
n −1
Devemos, em primeiro lugar, fazer a média aritmética dos valores:

x=
∑ xi
n
307
x= = 30, 7
10
Então, devemos determinar Σ(x-x)2, como mostra a tabela a seguir:

X (X - X)2 Resultado
30 (30 - 30,7)2 0,49
30 (30 - 30,7) 2
0,49
30 (30 - 30,7) 2
0,49
32 (32 - 30,7) 2
1,69
30 (30 - 30,7) 2
0,49
30 (30 - 30,7) 2
0,49
33 (33 - 30,7) 2
5,29
29 (29 - 30,7) 2
2,89
33 (33 - 30,7)2 5,29
30 (30 - 30,7)2 0,49
Total 18,1

Figura 70 – Cálculo do somatório de (x menos a média) ao quadrado

78
BIOESTATÍSTICA

Portanto, temos:

(x-x)2= 18,1

2
s 2
=
∑ (x − x )
n −1

18,1
s2 =
10 − 1

18,1
s2 =
9

s2 = 2,01

Logo, a variância é de 2,01, isso significa que a idade média dos clientes é de 30,7 anos, com variação
de 2,01 para mais ou para menos.

Para colocarmos dentro das nossas idades devemos fazer o desvio padrão. Como ele é definido pela
a raiz quadrada da variância, temos:

s = 2, 01

s = 1,42

O desvio padrão das idades é de 1,42 anos.

Então, podemos afirmar que a idade média dos colaboradores do Hospital Baruch de Toulouse
é de 30,7 anos com desvio de 1,42 anos para mais ou para menos, ou seja, a idade varia de 29,28
anos a 32,12 anos.

2. Para testar a qualidade do atendimento, o gestor do Hospital e Maternidade Baruch de Toulouse


está anotando o tempo de espera para atendimento de 15 pacientes que chegam na recepção.
Os dados estão na tabela a seguir. Vamos determinar o desvio padrão do tempo de espera dos
pacientes.

79
Unidade I

Resolução:

Figura 71 – Cálculo do somatório de (x menos a média) ao quadrado

Cálculo da variância:

∑ (x − x )
2
2
s =
n −1
319, 63
s2 =
15 − 1
319, 63
s2 =
14
s2 = 22,83

Logo, a variância é de 22,83, isso significa que o tempo médio de espera para o atendimento na
recepção do hospital é de 14,5 minutos, com variação de 22,83 para mais ou para menos.

Para avaliarmos a nossa variável, devemos calcular o desvio padrão:

Cálculo do desvio padrão:

s = 22, 83

s = 4,78

Então, podemos afirmar que o tempo de espera para o atendimento na recepção do Hospital Baruch
de Toulouse é de 14,5 minutos com desvio padrão de 4,78 anos para mais ou para menos, ou seja, o
tempo varia de 9,72 minutos a 19,28 minutos.

80
BIOESTATÍSTICA

Nesse caso, há uma grande variação no tempo de espera, o que denota que o gestor do hospital deva
tomar alguma providência.

Observação

No Microsoft Excel, para amostras com dados não agrupados, a variância


é dada pela fórmula: =VAR.A(R3:R17)

No caso, R3:R17 é o intervalo das células de que você deseja obter a variância.

O desvio padrão é dado pela fórmula: =DESVPADA(R3:R17).

Com dados agrupados temos os exemplos:

1. Vamos determinar a variância e o desvio padrão da quantidade de filhos que as pacientes da


maternidade Athena de Toulouse já tiveram em suas instalações.

Resolução:

Cálculo da variância:

Em primeiro lugar, calculamos a média aritmética para dados agrupados, que já foi feita anteriormente,
tendo como resultado: x = 2,2

Devemos calcular, agora, Σ(xi-x)2 . Fi = 64, como na tabela a seguir:

Número de Fi Xi.Fi
Filhos (X - X)2 (X - X)2.Fi

1 16 16 (1-2,2)2 = 1,44 1,44 . 16 = 23,04


2 18 36 (2-2,2)2 = 0,04 0,04 . 18 = 0,72
3 8 24 (3-2,2)2 = 0,64 0,64 . 8 = 5,12
4 6 24 (4-2,2)2 = 3,24 3,24 . 6 = 19,44
5 2 10 2
(5-2,2) = 7,84 7,84 . 2 = 15,68
Total 50 110 64

Figura 72 – Dados para o cálculo da variância de dados agrupados

Cálculos:

∑ ( xi − x )
2
2 .Fi
s =
n −1

81
Unidade I

64
s2 =
50 − 1

64
s2 =
49

s2 = 1,31

Isso significa que a média da quantidade de filhos que as pacientes da Maternidade Athena de
Toulouse já tiveram em suas instalações é de 2,2, com variação de 1,31.

Cálculo do desvio padrão:


s = 1, 31

s = 1,14

Isso significa que a média da quantidade de filhos que as pacientes da Maternidade Athena de
Toulouse já tiveram em suas instalações é 2, variando de 1 a 3 filhos.

2. Vamos determinar a variância e o desvio padrão na pesquisa das idades de 30 idosos que residem
na casa de repouso Cayro.

Resolução:
Cálculo da variância:
Em primeiro lugar, calculamos a média aritmética para dados agrupados, que já foi feita anteriormente
e teve como resultado:

x = 79,67

Agora, devemos calcular Σ(xi – x)2 . Fi – 1134,17, como na tabela a seguir:

Figura 73 – Cálculos para a variância dos idosos da casa de repouso

82
BIOESTATÍSTICA

Cálculos:

∑ ( xi − x )
2
2 .Fi
s =
n −1

1134,17
s2 =
29

s2 = 39,11

Isso significa que a média das idades de 30 idosos que residem na Casa de Repouso Cayro é de 79,67
anos, com variação de 39,11.

Cálculo do desvio padrão:

s = 39,11

s = 6,25

Isso significa que a média das idades de 30 idosos que residem na Casa de Repouso Cayro é de 79,67
anos, variando de 73,41 a 85,92 anos.

Lembrete

As fórmulas para cálculo de variância e desvio padrão são diferentes


para dados não agrupados e dados agrupados.

Observação

Note que os valores do intervalo de desvio padrão se encontram, nas


tabelas, sempre onde há maior concentração de valores.

O Microsoft Excel não tem fórmula para cálculo de variância e desvio padrão para dados agrupados.

4.6 Coeficiente de variação (Cv)

O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por
100 para que o coeficiente de variação seja dado em porcentagem.

83
Unidade I

s
cv = ×100
x

Onde:

Cv= coeficiente de variação.

S= desvio padrão.

x = média aritmética.

Exemplos:

1. Para testar a qualidade do atendimento do Hospital e Maternidade Baruch de Toulouse, vamos


utilizar os dados obtidos de sua média e desvio padrão:

s 4, 78
cv = × 100 → cv = × 100 → cv = 0, 33 × 100 = 33%
x 14, 5

2. Para as idades dos 30 idosos que residem na Casa de Repouso Cayro, temos:

s 6, 25
cv = × 100 → cv = × 100 → cv = 0, 0784 × 100 = 7, 84%
x 79, 67

Como podemos perceber, a primeira sequência tem 33% de variação, pois os dados estão muito
dispersos, enquanto que no segundo exemplo, a variação é de apenas 7,84%, pois as idades estão
menos dispersas.

Lembrete

O coeficiente de variação é utilizado para apresentar os valores de


dispersão em torno da média em porcentagem.

Observação

Quanto maior o valor da dispersão dos dados, maior será o coeficiente


de variação.

84
BIOESTATÍSTICA

Saiba mais

Você pode achar mais exemplos, com o tema saúde, de medidas de


posição e dispersão no livro:

BARBETTA, A. P. Estatística aplicada às ciências sociais. 6. ed.


Florianópolis: UFSC, 2006.

Resumo

Bioestatística se utiliza das ferramentas da Estatística que são


consideradas mais importantes para a área da Saúde.

População estatística são todos os elementos portadores de pelo


menos uma característica comum que desejamos analisar, isto é, todos os
entes que possuem a característica que estaremos estudando. Amostra da
população é uma parte dessa população. Para se escolher esta amostra
existem métodos chamados amostragem.

A amostragem pode ser probabilística ou não probabilística. Sempre que


possível, devemos utilizar técnicas probabilísticas para que possamos manter o
máximo possível a chance de um elemento da população participar da amostra.

Variáveis são, então, os possíveis resultados do fenômeno a ser estudado,


elas podem ser qualitativas, que estão divididas em qualitativas nominais e
qualitativas ordinais, ou quantitativas, que estão divididas em quantitativas
discretas ou contínuas, como mostra o esquema a seguir.

Qualitativa
nominal
Qualitativa ou
categorizada
Qualitativa
ordinal

Variável

Quantitativa
discreta
Quantitativa
Quantitativa
contínua

Figura 74 – Resumo de variáveis

85
Unidade I

Coleta de dados é o levantamento dos dados que queremos pesquisar, ela


pode ser feita por meio de elementos informativos de registro obrigatório, ou não,
ou por meio de inquéritos ou questionários formulados pelo próprio pesquisador,
tomando o cuidado de que este questionário venha a suprir seus objetivos.

Temos dois tipos de variáveis, que geram dados: qualitativas ou


quantitativas. Em ambos os casos, para facilitar a contagem manual,
devemos utilizar o Rol, que é a tabela que apresenta os dados organizados.
Variáveis qualitativas são as de contagem. Em alguns exemplos ao longo
do livro‑texto, contamos quantos se encaixavam em cada item e quantos
respondentes escolheram cada alternativa.

Para organizarmos os dados colhidos em uma pesquisa, devemos dispor


esses dados em tabelas, ou distribuições de frequências, estas tabelas
seguem as regras ditadas pelo IBGE.

Se a pesquisa trata uma variável qualitativa, essa distribuição de


frequências é sem intervalos de classes e, se a variável for quantitativa
contínua, os dados serão apresentados em uma distribuição de frequências
com intervalos de classes.

O gráfico estatístico tem a função de mostrar os resultados da pesquisa


com maior clareza. Os gráficos mais comuns são os de linhas, histogramas,
colunas ou barras e o em setores, comumente chamado de gráfico em pizza.

Para cada tipo de variável cabe um tipo de gráfico. Não é uma regra
geral, mas é o usual. Gráficos em linha e histogramas normalmente utilizam
variáveis contínuas, gráficos em colunas ou barras e setores utilizam
variáveis qualitativas. O gráfico em setores, deve ser uma opção apenas
quando o número de variáveis não é muito grande.

Após construirmos tabelas e gráficos, de acordo com as normas, dos


nossos dados, podemos calcular as medidas de tendência central que são:
moda, média e mediana, de acordo com o que desejamos inferir a respeito
desses dados.

Média aritmética, moda e mediana devem ser calculadas de forma


diferente para dados agrupados e não agrupados.

Não podemos esquecer que para fazer a mediana de dados não agrupados,
devemos colocar os dados em ordem crescente ou decrescente e, quando os
dados são agrupados, devemos abrir uma coluna na tabela de dados para a
frequência acumulada (Fa), pois é ela que nos apresentará a classe mediana,
de onde colheremos os dados para substituirmos na fórmula.
86
BIOESTATÍSTICA

As medidas de dispersão são utilizadas para verificar como os dados


estão espalhados em torno da média. Para calcular essa variabilidade,
temos a variância e o desvio padrão, lembrando que o desvio padrão é a
raiz quadrada da variância, com fórmulas diferentes para dados agrupados
e não agrupados.

Após calcularmos o desvio padrão, calculamos o coeficiente de variação


que nos indica a dispersão dos dados na tabela, quanto maior, mais dispersos
estarão os dados.

Exercícios

Questão 1. Um pesquisador elaborou um estudo sobre agressividade, que visava avaliar o “grau médio
de agressividade” de um grupo de pacientes mentais de diversos tipos, todos do sexo masculino. Para
tanto, elaborou escalas de medida adequadas aos seus objetivos. Compareceu ao Hospital Psiquiátrico
de Franco da Rocha que contava com 3000 pacientes, de ambos os sexos, e efetuou um sorteio de 40
pacientes masculinos. Num primeiro levantamento fez uma classificação de doenças mentais. Num
segundo levantamento mediu os graus de agressividade (baixa, média, alta) dos pacientes de sua
amostra. A partir do enunciado, qual é a população, a amostra, a classificação da variável do primeiro
levantamento e a classificação da variável do segundo levantamento, respectivamente?

A) 3000 pacientes; 40 pacientes do sexo masculino; variável qualitativa nominal; variável quantitativa.

B) 3000 pacientes; 40 pacientes do sexo masculino; variável qualitativa nominal; variável qualitativa
ordinal.

C) 40 pacientes do sexo masculino; 3000 pacientes; variável qualitativa ordinal; variável quantitativa.

D) 40 pacientes do sexo masculino; 3000 pacientes; variável quantitativa; variável qualitativa


nominal.

E) 3000 pacientes; 40 pacientes do sexo masculino; variável qualitativa ordinal; variável qualitativa
nominal.

Resposta correta: alternativa B.

Análise das alternativas

A) Alternativa incorreta.

Justificativa: o erro diz respeito à classificação da variável do segundo levantamento. A variável


grau de agressividade é do tipo qualitativa ordinal, pois apresenta uma hierarquia entre as categorias
de agressividade: baixa, média e alta. Desta forma, é incorreto classificá‑la como variável quantitativa.
87
Unidade I

B) Alternativa correta.

Justificativa: esta alternativa apresenta todos os conceitos estatísticos corretos. A população diz
respeito ao total de pacientes do hospital, ou seja, 3000 pacientes. A amostra, que é uma parte da
população, diz respeito aos 40 pacientes do sexo masculino. A variável do primeiro levantamento, tipos
de doenças mentais, é classificada como variável qualitativa nominal, pois há uma nomeação dos tipos
de doenças e, finalmente, a variável do segundo levantamento, graus de agressividade (baixa, média,
alta), é classificada como variável qualitativa ordinal, pois entre as categorias há uma hierarquia entre
os graus de agressividade.

C) Alternativa incorreta.

Justificativa: houve uma inversão entre o que seria população e amostra: 40 pacientes não
caracterizam a população, mas sim a amostra, e 3000 pacientes não se referem à amostra, mas sim
à população. A classificação das variáveis também está incorreta: no primeiro levantamento deve ser
qualitativa nominal e a do segundo levantamento, qualitativa ordinal.

D) Alternativa incorreta.

Justificativa: novamente ocorre uma inversão dos conceitos de população e amostra e as classificações
das variáveis estão incorretas.

E) Alternativa incorreta.

Justificativa: nesta alternativa ocorreu uma inversão na classificação das variáveis estudadas. A do
primeiro levantamento deve ser qualitativa nominal e a do segundo levantamento, qualitativa ordinal,
e não o inverso, como foi apresentado na alternativa.

Questão 2. Analise a seguinte situação: um profissional da área de Saúde realizou uma pesquisa
com 50 pacientes internados em um hospital público para averiguar o nível de ansiedade apresentado
por eles. Construiu uma escala subjetiva para a variável ansiedade, que ia de 1 a 5, como demonstrado
pela tabela a seguir:

Tabela 1

Nível de Ansiedade Fi (número de pacientes)


1 12
2 09
3 18
4 08
5 03
TOTAL 50

88
BIOESTATÍSTICA

A partir dos resultados encontrados, qual o valor médio da ansiedade destes 50 pacientes?

A) 1,3.

B) 4,2.

C) 2,62.

D) 3,22.

E) 1,92.

Resolução desta questão na plataforma.

89

Você também pode gostar