Você está na página 1de 44

2a edição | Nead - UPE 2013

Dados Internacionais de Catalogação-na-Publicação (CIP)


Núcleo de Educação à Distância - Universidade de Pernambuco - Recife

Santos, Ernani Martins dos


S237b Biologia: Bioestatística /Ernani Martins dos Santos. – Recife: UPE/NEAD, 2011.

44 p.

1. Bioestatística 2. Estatística 3. Educação à Distância I. Universidade de


Pernambuco, Núcleo de Educação à Distância II. Título

CDD – 17ed. – 310


Claudia Henriques – CRB4/1600
BFOP-103/2011
UNIVERSIDADE DE PERNAMBUCO - UPE
Reitor
Prof. Carlos Fernando de Araújo Calado

Vice-Reitor
Prof. Rivaldo Mendes de Albuquerque

Pró-Reitor Administrativo
Prof. Maria Rozangela Ferreira Silva

Pró-Reitor de Planejamento
Prof. Béda Barkokébas Jr.

Pró-Reitor de Graduação
Profa. Izabel Christina de Avelar Silva

Pró-Reitora de Pós-Graduação e Pesquisa


Profa. Viviane Colares Soares de Andrade Amorim

Pró-Reitor de Desenvolvimento Institucional e Extensão


Prof. Rivaldo Mendes de Albuquerque

NEAD - NÚCLEO DE ESTUDO EM EDUCAÇÃO A DISTÂNCIA


Coordenador Geral
Prof. Renato Medeiros de Moraes

Coordenador Adjunto
Prof. Walmir Soares da Silva Júnior

Assessora da Coordenação Geral


Profa. Waldete Arantes

Coordenação de Curso
Prof. José Souza Barros

Coordenação Pedagógica
Profa. Maria Vitória Ribas de Oliveira Lima

Coordenação de Revisão Gramatical


Profa. Angela Maria Borges Cavalcanti
Profa. Eveline Mendes Costa Lopes
Profa. Geruza Viana da Silva

Gerente de Projetos
Profa. Patrícia Lídia do Couto Soares Lopes

Administração do Ambiente
José Alexandro Viana Fonseca

Coordenação de Design e Produção


Prof. Marcos Leite

Equipe de Design
Anita Sousa/ Gabriela Castro/Renata Moraes/ Rodrigo Sotero

Coordenação de Suporte
Afonso Bione/ Wilma Sali
Prof. José Lopes Ferreira Júnior/ Valquíria de Oliveira Leal

Edição 2013
Impresso no Brasil

Av. Agamenon Magalhães, s/n - Santo Amaro


Recife / PE - CEP. 50103-010
Fone: (81) 3183.3691 - Fax: (81) 3183.3664
5

capítulo 1
Bioestatística

prof. Ernani Martins dos Santos | carga horária: 10 horas

OBJETIVOS ESPECÍFICOS
• Compreender a natureza do trabalho esta-
tístico e sua origem como forma de apro-
priar-se da linguagem estatística;

• Compreender os conceitos fundamentais


da estatística, as fases do trabalho estatís-
tico e as aplicações/apurações de dados da
estatística em fatos vitais, como forma de
desenvolver a capacidade de utilizar a ma-
temática na interpretação e intervenção
do real.

A Significância e a
Abrangência da
Estatística
Os métodos estatísticos são usados hoje, em
quase todos os campos de investigação cientí-
fica, já que eles capacitam-nos para responder
a um vasto número de questões, tais como as
listadas abaixo:

• Como os cientistas avaliam a validade de


novas teorias?

• Como os pesquisadores médicos testam a


eficiência de novas drogas?

• Como os demógrafos prevêem o tama-


nho da população do mundo em qualquer
tempo futuro?
6
capítulo 1

• Como pode um economista verificar se que se constituiu como a função tradicional


a mudança atual no Índice de Preços ao de governos centrais no sentido de armazenar
Consumidor é a continuação de uma ten- registros da população, nascimentos e mortes,
dência secular ou simplesmente um desvio produção das lavouras, taxas e muitas outras
aleatório? espécies de informação e atividades. A conta-
gem e a mensuração dessas quantidades ge-
• Como é possível para alguém predizer o ram todos os tipos de dados numéricos que
resultado de uma eleição, entrevistando, são úteis para o desenvolvimento de muitos ti-
apenas, algumas centenas de eleitores? pos de funções governamentais e formulação
de políticas públicas.
Estes são poucos exemplos nos quais à aplica-
ção da estatística é necessária. Podemos presu- Dados numéricos são, de fato, uma parte da
mir que a matemática é uma das rainhas das Estatística, mas são apenas a matéria-prima
ciências porque ela fornece a estrutura teórica que precisa ser transformada pelos “métodos
a quase todas as outras ciências. Se você já fez estatísticos” para posterior análise. A Estatís-
um curso básico de física, já está familiarizado tica, como um método científico, refere-se
com algumas das leis matemáticas que gover- ao projeto de experimentos e à descrição e à
nam temas tão diversificados, como gravida- interpretação de observações que são feitas.
de, energia, luz, eletricidade, etc mas também Do ponto de vista moderno, a Estatística é fre-
devemos considerar o fato de que as teorias qüentemente definida como um método de
matemáticas estão sendo desenvolvidas todos tomada de decisão em face da aleatoriedade
os dias, em muitas áreas, por estatísticos teó- dos fenômenos. Em uma mais vasta perspec-
ricos - pessoas treinadas em teoria estatística e tiva, o escopo da estatística pode ser pensado
probabilidade. Para citar alguns poucos casos em termos de três áreas diferentes de estudos:
ilustrativos, elas são desenvolvidas para teoria (1) a Estatística Descritiva; (2) A Estatística In-
a dos vôos espaciais em física; para teorias do dutiva e (3) A Teoria da Decisão Estatística.
conhecimento do comportamento animal e hu-
mano em psicologia; para teorias da migração Estatística Descritiva
e dos diferenciais de raça em sociologia; para
teorias de epidemias em saúde pública, etc. A Estatística Descritiva refere-se ao corpo de
métodos desenvolvidos para coletar, organizar,
De fato, a estatística tornou-se uma ferramen- apresentar e descrever dados numéricos. Essa
ta cotidiana para todos os tipos de profissio- área da Estatística refere-se às seguintes tarefas:
nais que entram em contato com dados quan-
titativos ou tiram conclusões a partir destes. • Encontrar um método apropriado de co-
letar dados numéricos eficiente e acurada-
mente para um dado problema.
O que é Estatística?
• Determinar um formato eficiente, tal como
A estatística é tão antiga quanto o homem, uma apresentação tabular, para a organi-
pois a necessidade de enumerar as coisas sur- zação dos dados de uma forma sistemática
giu com ele. e ordenada, de maneira que a informação
fornecida pelos dados possa ser observada
Nascida como simples compilação de núme- com grande facilidade e precisão.
ros, a estatística tem evoluído até nossos dias
de forma surpreendente, configurando-se • Apresentar dados numéricos, sejam orga-
como uma ferramenta de apoio para quase nizados ou, sejam de forma que as caracte-
todos os campos da atividade humana, assu- rísticas e o comportamento dos dados clara
mindo o status de ciência apenas no início do e facilmente revelados. Tais apresentações
século passado. são feitas por meio de métodos gráficos.

A noção de “Estatística” foi originalmente de- • Sumarizar ou descrever cada característica


rivada da mesma raiz da palavra “Estado”, já ou propriedade dos dados por um simples
7

capítulo 1
número, tal como uma média, uma por- de cada amostra de 1.000 bolas escolhidas da
centagem ou alguma outra medida apro- população. Pode ser que por uma grande casu-
priada, é calculada a partir dos dados, por alidade, o resultado daquela amostra que es-
meio de uma fórmula derivada, a partir de colhemos coincida exatamente com o valor da
algum princípio válido. proporção de bolas brancas em toda a popu-
lação. Mas as chances de que isso não ocorra
Estatística indutiva são muito grandes. Uma forma de contornar-
mos esse problema é afirmarmos que as chan-
A Estatística Indutiva, que é também freqüen- ces são de 95 em 100 (ou de 95 %) e de que
temente chamada de inferência estatística ou o intervalo formado pela proporção amostral
estatística inferencial, em contraste com a es- acrescida e diminuída de três pontos percentu-
tatística descritiva, é essencialmente analítica ais contenha o verdadeiro valor da proporção
em sua natureza. Consiste de um conjunto populacional desconhecido. Ou seja, construí-
de princípios ou teoremas que nos permitem mos um intervalo com limites 35 + 0,03 x 35
generalizar acerca de alguma característica de = 36,05 e 35 - 0,03 x 35 = 33,95 e afirmamos
uma “população” a partir das características (com base em algum princípio obtido a par-
observadas de uma “amostra”. Se uma me- tir da teoria estatística) que as chances são de
dida descritiva é calculada a partir dos dados 95 em 100 de que o verdadeiro valor da pro-
da população ela é chamada de parâmetro porção populacional esteja localizado dentro
populacional ou, simplesmente, parâmetro; se desse intervalo. Quando uma afirmativa dessa
é calculada a partir dos dados da amostra, é natureza é feita, estamos realizando o que se
chamada de estatística amostral ou, simples- chama de estimativa por intervalo.
mente, estatística. Considerando esses concei-
tos, podemos definir estatística indutiva como Quanto ao segundo procedimento da estatís-
o processo de generalizar acerca do valor de tica inferencial, deixaremos para comentá-lo,
um parâmetro a partir do valor de uma estatís- quando for abordado em sua íntegra. E o ter-
tica. Existem dois procedimentos de inferência ceiro campo de estudos da Estatística, a Teo-
distintos, mas relacionados: estimação e teste ria da Decisão Estatística, não será discutido
de hipóteses. Estimação é o processo de usar neste trabalho, voltado especificamente para
o valor de uma estatística amostral, para esti- abordagens em bioestatística. Por falar em
mar o valor de um parâmetro que é desconhe- bioestatística, temos que, nas áreas médicas
cido, mas é uma constante. Como exemplo, e biológicas, coletam-se dados de pessoas, de
suponhamos que temos uma população de animais experimentais e de fenômenos físicos
100.000 bolas de gude em um saco as quais e químicos, interessando aos pesquisadores
são idênticas exceto pela cor e que não pode- dessas áreas dados sobre mortalidade infantil,
mos vê-las, embora saibamos que uma parte eficiência de medicamentos, incidência de do-
delas é branca, e o restante, preto. Suponha enças, causas de morte etc. e, para isso, utili-
que desejamos ter uma idéia da proporção de, zamos a bioestatística, ou seja, a aplicação da
digamos, bolas brancas nessa população. Ima- estatística nas áreas de ciências biológicas e
gine que, para conseguir isso, selecionamos ciências da saúde.
1.000 bolas aleatoriamente do saco e verifica-
mos que 350 são brancas. Isso significa que Conceitos Fundamentais
nossa proporção amostral de bolas brancas é em Estatística e
35 %. A partir disso, concluímos que a propor- Bioestatística
ção populacional de bolas brancas é também
35 %. Fazendo isso, nós realizamos o que é Como toda ciência, a estatística e/ou a bio-
chamado de estatística pontual. estatística tem sua linguagem própria. E esta
linguagem deve ser absorvida pelo estudante
Mas afirmar que a proporção de bolas bran- como forma de melhorar a compreensão e as
cas em toda a população é exatamente igual à habilidades necessárias ao desenvolvimento da
proporção daquela amostra particular é como aprendizagem dessa disciplina. Esses conceitos
dar um tiro no escuro: o valor da proporção fundamentais referem-se à parte da estatística
amostral é um resultado aleatório e depende descritiva.
8
capítulo 1

População: conjunto de elementos que têm, procedimento: Como 900/50 = 18, escolhe-
em comum, determinada característica. As po- mos por sorteio casual um número de 01 a 18
pulações podem ser finitas, como o conjunto (inclusive), o qual indicaria o primeiro elemen-
de alunos de uma escola em determinado ano, to sorteado para a amostra; os demais elemen-
ou infinitas, como o número de vezes que se tos seriam periodicamente considerados de 18
pode jogar um dado. em 18. Assim, se o número sorteado fosse o
quatro, tomaríamos, pelo lado direito da rua,
Amostra: subconjunto finito de uma popula- o 4º prédio, o 22º, o 40º etc., até voltarmos ao
ção. O número de elementos de uma amostra início da rua, pelo lado esquerdo.
é menor que o da população.
Amostra estratificada - composta de elementos
Por ser uma amostra parte de uma população, provenientes de todos os estratos (subgrupos)
é fundamental que ela seja representativa, pois da população, utilizada sempre que a popu-
as conclusões dessas amostras serão, também, lação estiver dividida em subgrupos ou estra-
da população. Para seleção de uma amostra, tos, uma vez que a variável em estudo pode
existe uma técnica denominada de amostra- apresentar um comportamento diferente de
gem, que, mediante ela, é possível garantir o estrato para estrato. Exemplo: voltemos para
acaso na escola e assegurar à amostra a repre- o exemplo de uma amostra representativa de
sentatividade da população. 10% para a pesquisa da estatura de noventa
alunos de uma escola. Supondo que 54 sejam
Técnicas de amostragem: procedimento que meninos e 36 sejam meninas, vamos obter a
será adotado para escolher os elementos que amostra proporcional estratificada. São, por-
irão compor uma amostra. tanto, dois estratos (sexo masculino e sexo fe-
minino) e desejamos uma amostra de 10% da
Amostra casual simples (aleatória simples; ran- população. Logo, temos:
dômica; acidental) - por esse tipo de amostra-
gem, todos os elementos da população têm
SEXO POPULAÇÃO 10% AMOSTRA
igual possibilidade de serem selecionados para
constituir a amostra. Os elementos são retira- Masculino 54 10x54/100 = 5,4 5
dos ao acaso da população, através de sorteio.
Exemplo: Vamos obter uma amostra represen- Feminino 36 10x36/100 = 3,6 4
tativa de 10% para a pesquisa da estatura de
TOTAL 90 10x90/100 = 9,0 9
noventa alunos de uma escola:

a) Numeramos os alunos de 01 a 90.


OBSERVAÇÃO: Percebam que os valores deci-
b) Escrevemos os números de 01 a 90 em mais foram arredondados. De acordo com a
pedaços iguais de um mesmo papel, colo- resolução 886/66 da Fundação IBGE, o arre-
cando-os dentro de uma caixa. Agitamos dondamento é feito da seguinte maneira:
sempre a caixa para misturar bem os peda-
ços de papel e retiramos, um a um, nove • Quando o primeiro algarismo a ser aban-
números que formarão a mostra (neste donado é 0, 1, 2, 3 ou 4, fica inalterado o
caso, 10% da população). último algarismo a permanecer. Por exem-
plo, 78,24 passa a 78,2.
Amostra sistemática - ocorre quando os ele-
mentos da amostra são selecionados por um • Quando o primeiro algarismo a ser aban-
critério preestabelecido pelo pesquisador. Essa donado é 6, 7, 8 ou 9, aumenta-se em
estratégia normalmente é usada, quando os uma unidade o algarismo a permanecer.
elementos já se acham ordenados de alguma Por exemplo, 42,87 passa a 42,9.
forma. Exemplo: suponhamos uma rua, con-
tendo novecentos prédios, dos quais deseja- Amostra de conveniência - elementos reunidos
mos obter uma amostra formada de cinqüenta simplesmente, porque dispunha deles, sem
prédios. Podemos, neste caso, usar o seguinte nenhum critério específico.
9

capítulo 1
Variáveis - característica ou propriedade que gime particular de radioterapia. Identifique
será estudada ou observada na população. a população que interessa. É possível per-
ceber algum problema para amostrar essa
As variáveis podem ser de dois tipos: população?

1. quantitativas - quando exprimem conta-
gens, ou seja, quando os valores tomados
4. Para você, o que é coletar dados?

são numéricos. Exemplos: idade, altura,
temperatura, massa, número de filhos, nú- 5. Cite três atividades em que um biólogo faz
mero de irmãos etc. Podem ser classifica- uso da estatística.
das em:
6. Classifique as variáveis em qualitativas ou
1.1 discretas - variáveis, cujos valores po- quantitativas (contínuas ou descontínuas):
dem ser ordenados, de modo que, entre
dois valores consecutivos, não pode existir a) População: alunos de uma escola
nenhum outro, ou seja, essas variáveis só Variável: cor dos cabelos
podem assumir valores pertencentes a um
conjunto enumerável de elementos. Exem- b) População: casais residentes em uma
plos: gols de um jogo de futebol, idade em cidade
anos etc. Variável: número de filhos

1.2 Contínuas - variáveis que podem as- c) População: estação meteorológica de


sumir qualquer valor num certo intervalo. uma cidade
Exemplos: idade de uma pessoa em ano, Variável: precipitação pluviométrica duran-
meses e dias ao longo de dois anos, tempo te um ano
que um atleta leva para correr 100 metros,
peso de um indivíduo etc d) População: propriedades agrícolas do
Brasil
2. qualitativas - quando exprimem um atri- Variável: produção de algodão
buto ou qualidade. Neste caso, os valores
tomados não são numéricos. Exemplos: e) População: ratos para estudo num la-
sexo, cor da pele, cor dos olhos, nacionali- boratório
dade etc. Variável: sexo dos animais

7. Uma escola de Ensino Fundamental abri-
EXERCÍCIO ga 124 alunos. Obtenha uma amostra re-
presentativa, correspondendo a 15% da
1. De que maneira a estatística ajuda a resol- população. Explique como você faria para
ver certos problemas práticos? Justifique selecionar os indivíduos da amostra dentro
sua resposta com um exemplo. da população.

2. Suponha que você seja chamado para pre- 8. O diretor de uma escola, na qual estão
ver a média das notas dos alunos de Ensi- matriculados 280 meninos e 320 meni-
no Médio de sua escola, da primeira série, nas, desejoso de conhecer as condições
da disciplina biologia. Que variáveis você de vida extra-escolar de seus alunos e
julga serem necessárias? Justifique-as. não dispondo de tempo para entrevistar
todas as famílias, resolveu fazer um le-
vantamento, por amostragem, em 10%
3. Uma pesquisa médica visa obter uma esti- dessa clientela. Obtenha, para esse di-
mativa do tempo de vida de um paciente retor, os elementos componentes da
após este ter sido acometido de um tipo amostra.
específico de câncer e submetido a um re-
10
capítulo 1

9. Os prontuários dos pacientes de um hospi- Referência


tal estão organizados em um arquivo, por
ordem alfabética. Qual é a maneira mais MILONE, G. e ANGELINI, F. Estatística Geral. SP:
rápida e eficiente de amostrar 1/3 do total Atlas, 1993.
dos prontuários? Este livro é dirigido, em sua especificidade, à
Estatística. O seu forte é uma linguagem clara
10. Um pesquisador tem dez gaiolas, cada dos conceitos trabalhados em Estatística.
uma contedo seis ratos. Como o pesqui-
sador pode selecionar dez ratos para sua CRESPO, A. A. Estatística Fácil. 17ª. Edição. SP:
amostra? Saraiva, 1999.
Apesar de técnico, este livro trabalha uma lin-
guagem bem didática para todos aqueles que
Sites nos quais o aluno pode buscar textos necessitam ter domínio no trabalho com a Es-
complementares, exercícios e aprofundar o es- tatística. Apresenta exemplos e exercícios bem
tudo dos temas abordados interessantes.

• http://www.hsr.com.br/bio02.html VIEIRA, S. M. Introdução à Bioestatística. 3ª.


Esse site do Centro Virtual de Epidemiolo- Edição. SP: Campus, 1998.
gia Clínica do Hospital São Rafael é interes- Um livro de linguagem clara e acessível, dedi-
sante para o estudante se familiarizar com cado aos alunos e profissionais que se iniciam
os termos da bioestatística, sob o ponto de na aprendizagem da Estatística. O texto, de
vista da Bioestatística Clínica. grande flexibilidade, inclui, em alguns capítu-
los, exercícios e exemplos de aplicação.
• http://www.ufpa.br/dicas/biome/bioni.htm
Nesse material da Universidade Federal do
Pará, o estudante encontra dicas e notas
interessantes para todo estudo da bioesta-
tística, tendo, inclusive, abordagem sobre
o tema deste capítulo.

• http://www.ai.com.br/pessoal/indices/2A3.
HTM
Nesse site da Faculdade de Ciências Eco-
nômicas de Vitória, é possível rever os con-
ceitos estudados neste capítulo e realizar
outros exercícios propostos pelo próprio
site.

• http://www.unb.br/ib/cfs/cg/Apostila%20I/
introducao.doc
Esse material da UNB é um curso de Bio-
estatística com linguagem voltada para a
área de Saúde e Biometria. Contém tópicos
desde os conceitos básicos até os conte-
údos mais avançados, incluindo exemplo
e citando bibliografias importantes. Inte-
ressante para os estudantes que querem
aprofundar seus conhecimentos.
11

capítulo 2
Coleta e Organização
de Dados

prof. Ernani Martins dos Santos | carga horária: 10 horas

OBJETIVOS ESPECÍFICOS
• Conhecer os elementos constituintes de
uma tabela;

• Interpretar e construir tabelas estatísticas;

• Compreender o gráfico como uma forma


de linguagem matemática necessária ao
estudo estatístico;

• Entender o gráfico como uma das formas


de melhor visualizar os dados construídos
e tabelados numa pesquisa.

Introdução
Após um planejamento cuidadoso e a determi-
nação da população e/ou amostra a ser estu-
dada com suas variáveis, damos início à coleta
dos dados numéricos necessários a sua des-
crição. Esta coleta pode ser direta ou indireta.

A coleta é direta, quando feita sobre elementos


informativos de registro obrigatório (nascimen-
to, casamento, óbitos, elementos pertinentes
ao prontuário dos alunos de uma escola, etc.)
ou, ainda, quando os dados são coletados
pelo próprio pesquisador, através de inquéri-
tos e questionários, como é o caso das notas
de uma avaliação, do censo demográfico, etc.

A coleta é indireta, quando é inferida de ele-


mentos conhecidos (coleta direta) e/ou do
conhecimento de outros fenômenos rela-
12
capítulo 2

cionados com o fenômeno estudado. Como Na tabela anterior, tivemos:


exemplo, podemos citar as pesquisas sobre
mortalidade infantil, realizadas através de da- TÍTULO
dos colhidos por uma coleta direta.
Casos registrados de intoxicação humana, se-
Um dos objetivos da Estatística é sintetizar os gundo a causa determinante. Brasil, 1993.
valores que uma ou mais variáveis podem as-
sumir, para que tenhamos uma visão global CABEÇALHO
da variação dessa ou dessas variáveis. Isso ela
consegue, inicialmente, apresentando esses Causa Frequência
valores em tabelas e gráficos, que irão nos for-
necer rápidas e seguras informações a respeito
das variáveis em estudo, permitindo-nos deter- COLUNA INDICADORA
minações administrativas e pedagógicas mais
Acidente
coerentes e científicas.
Abuso
Suicídio

Apresentação de Profissional
Outras
dados em tabelas
Ignorada
A tabela é um quadro, que resume um conjun-
to de observações. CORPO
29.601
As tabelas são compostas por: título; cabeça-
lho; corpo; colunas indicadoras e fonte. 2.604
7.965
• Título - explica o que a tabela contém ou 3.735
simplesmente indica o assunto da tabela. 1.959

1.103
• Cabeçalho - especifica o que cada coluna
contém.
FONTE
• Corpo - são os dados contidos nas linhas e
colunas da tabela. Fonte: MS/FIOCRUZ/SINITOX

• Colunas indicadoras - especificam os con- Toda tabela deve ser delimitada por traços ho-
teúdos das linhas. rizontais. Podem ser feitos traços verticais ape-
nas para separar as colunas, e não para delimi-
• Fonte - mostra de onde foram recolhidos tar a tabela. O cabeçalho é separado do corpo
os dados para organizar a tabela. Aparece, por um traço horizontal.
sempre, no rodapé da tabela.
Exemplo:
Exemplo: Casos registra- Causa Frequência
Casos registra- dos de intoxi-
Causa Frequência
dos de intoxi- cação humana, Acidente 29.601
Acidente 29.601
cação humana, segundo a cau- Abuso 2.604
segundo a cau- Abuso 2.604
sa determinan- Suicídio 7.965
sa determinan- Suicídio 7.965
te. Brasil, 1993. Profissional 3.735
te. Brasil, 1993 Profissional 3.735
Outras 1.959
Outras 1.959
Ignorada 1.103
Ignorada 1.103 Fonte: MS/FIOCRUZ/SINITOX
Fonte: MS/FIOCRUZ/SINITOX
13

capítulo 2
As tabelas podem apresentar, além das frequ- Ano de Sexo
ências, as frequências relativas ao total. Para Registro Masculino Feminino Total
obter a frequência relativa de uma dada catego-
1984 1.307.758 1.251.280 2.559.038
ria, divide-se a frequência dessa categoria pela
1985 1.339.059 1.280.545 2.619.604
soma das frequências. O resultado, que multi-
plicado por 100, é uma percentagem. O total 1986 1.418.050 1.351.203 2.779.253
da coluna é escrito entre dois traços horizontais. Fonte: IBGE (1988). Nota: Nascimentos ocorridos no ano de registro

As tabelas de contingência podem apresentar


Exemplo: frequências relativas além de frequências. Nes-
Casos registrados de intoxicação humana, se- se caso, as frequências relativas dão estimati-
gundo a causa determinante. Brasil, 1993. vas de risco, isto é, dão estimativas da proba-
bilidade do dano.
Causa Frequência Frequência Relativa (%)

Exemplo:
Acidente 29.601 63,29
Recém-nascidos, segundo a época do ataque
Abuso 2.604 5,69
de rubéola na gestante e a condição de normal
Suicídio 7.965 16,37 ou defeituoso.
Profissional 3.735 8,15
Época de Condição Total Frequência
Outras 1.959 4,2
Ataque Normal Defeituoso Relativa
Ignorada 1.103 2,3 Até o 3o mês de 36 14 50 28%
Total 45.974 100 Gestação
Fonte: MS/FIOCRUZ/SINITOX Depois do 3o 51 3 54 5,60%
As tabelas podem conter fontes e notas. A mês de Gestação
fonte indica a entidade do pesquisador ou dos Fonte: HILL (1958)

pesquisadores que publicaram ou forneceram


os dados. As notas devem esclarecer aspectos EXERCÍCIO
relevantes dos levantamentos dos dados ou da
apuração.
1. De acordo com o IBGE (1988), a distribui-
Exemplo: ção dos suicídios ocorridos no Brasil em
Nascidos vivos registrados, segundo o ano de 1986, segundo a causa atribuída, foi a se-
registro. guinte: 263 por alcoolismo, 198 por difi-
culdade financeira, 700 por doença men-
Ano de Registro Frequência
tal, 189 por outro tipo de doença, 416 por
1984 2.559.038 desilusão amorosa e 217 por outras causas.
1985 2.619.604 Apresente essa distribuição em tabelas.
1986 2.779.253
Fonte: IBGE (1988). Nota: Nascimentos ocorri-
dos no ano de registro
2. De acordo com o IBGE (1988), em 1986,
ocorreram, em acidentes de trânsito,
27.306 casos de vítimas fatais, assim distri-
TABELA DE buídos: 11.712 pedestres, 7.116 passagei-
CONTIGÊNCIA ros e 8.478 condutores. Faça uma tabela
para representar esses dados. Apresente,
também, as frequências relativas e o total.
Este tipo de tabela é utilizado para represen-
tar elementos de uma amostra ou população,
classificados de acordo com dois fatores. Sen- 3. Em 1988, foi publicado pelo IBGE que os
do assim, uma tabela de dupla entrada, cada estabelecimentos de saúde no Brasil, no
uma representando um dos fatores. ano de 1985, eram distribuídos por es-
pécies, da seguinte forma: 1002 hospitais
Exemplo: públicos e 5132 particulares; 150 pronto-
Nascidos vivos registrados, segundo o ano de -socorros públicos e 156 particulares; poli-
registro e o sexo. clínicas no total de 1531 e 6136 respecti-
14
capítulo 2

vamente públicas e particulares; e outros (inclui postos de saúde, centros de saúde e unidades
mistas), sendo 14393 públicos e 472 particulares. Represente essas informações em uma
tabela.

Apresentação de dados em gráficos


Existem normas nacionais para a construção de gráficos ditados pela fundação IBGE. Assim, todo
gráfico deve apresentar título e escala. O título deve ser colocado tanto acima quanto abaixo do
gráfico. As escalas devem crescer da esquerda para a direita e de baixo para cima. As legendas
explicativas devem ser colocadas, de preferência, à direita do gráfico. A seguir, apresentaremos os
gráficos mais comuns nas apresentações em bioestatísitca.

GRÁFICO DE BARRAS
Utilizado para apresentar variáveis qualitativas ou ordinais. Para fazer um gráfico de barras, pri-
meiro se traça o sistema de eixos cartesianos, depois se colocam, no eixo das abscissas, as cate-
gorias da variável em estudo. Em seguida, constroem-se barras retangulares, com base no eixo
das abscissas e altura igual à frequência ou a frequência relativa da respectiva categoria. As barras
devem ser desenhadas para ficar evidente que a variável é qualitativa ou ordinal.

Exemplo:
Internações em estabelecimentos de saúde, por espécie de clínica no Brasil - 1992.

Espécie Frequência Frequência


Clínica Relativa
(%)
Médica 6.457.923 32,51
Ginecológia 3.918.308 119,73
e Obstetrícia
Cirúrgia 3.031.075 15,26
Pediatria 2.943.393 14,82
Outras 3.513.186 17,69

Fonte: IBGE, Diretoria de Pesquisa,


Pesquisa de Assistência Médico-Sanitária.

Observação:
Atualmente os gráficos
de barra também podem
ser feitos na horizontal,
mantendo-se o nome de
gráfico de barras.

Internações em estabelecimentos
de saúde, por espécie de clínica
no Brasil - 1992
15

capítulo 2
Gráfico de setores
O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais. Para fazer
um gráfico de setores, a princípio, traça-se uma circunferência que possui uma divisão angular in-
terna de 360º. Essa circunferência representa o total, ou seja, 100%. Dentro dessa circunferência,
devem ser representadas as categorias da variável em estudo. Para isso, toma-se a frequência re-
lativa a cada categoria e calcula-se o ângulo central da seguinte maneira: se 100% correspondem
a 360º, uma categoria com frequência relativa de f%terá um ângulo central x, tal que:
100 360o
f Xo

Esse procedimento se repete para cada uma das categorias da variável em estudo. Para fazer o
gráfico de setores, marcam-se, na circunferência, os ângulos calculados, separando-os com o
traçado dos raios.

Exemplo:
Internações em estabelecimentos de saúde, por espécie de clínica no Brasil - 1992.

Observação:
ao se por rótulos de identificação em quadro, não se faz necessário repeti-los no gráfico.

EXERCÍCIO
1. Faça um gráfico de barras e um gráfico de setores para apresentar os dados da tabela seguinte:
Suicidas, segundo o sexo, Brasil, 1986.
16
capítulo 2

Sexo Freqüência Percentual Referência


Masculino 3562 74,93
Feminino 1192 25,07 MILONE, G. e ANGELINI, F. Estatística Geral. SP:
Fonte: IBGE (1988) Atlas, 1993.
Este livro é dirigido, em sua especificidade, à
Estatística. O seu forte é uma linguagem clara
2. Procure em jornais e revistas especializa- dos conceitos trabalhados em Estatística.
das, dois exemplos de cada um dos gráfi-
cos estudados. Em seguida, faça uma ta- CRESPO, A. A. Estatística Fácil. 17ª. Edição. SP:
bela a partir dos gráficos, apresentando os Saraiva, 1999.
dados estatísticos nela presentes. Apesar de técnico, este livro trabalha uma lin-
guagem bem didática para todos aqueles que
necessitam ter domínio no trabalho com a Es-
Sites nos quais o aluno pode buscar textos tatística. Tem exemplos exercícios bem interes-
complementares, exercícios e aprofundar o es- santes.
tudo dos temas abordados
VIEIRA, S. M. Introdução à Bioestatística. 3ª.
• http://www.del.ufms.br/tutoriais/excel7/ Edição. SP: Campus, 1998.
apresentacao.htm#sumario Um livro de linguagem clara e acessível, dedi-
Esse site do Departamento de Engenharia cado aos alunos e profissionais que se iniciam
Elétrica da Universidade Federal do Mato- na aprendizagem da Estatística. O texto, de
grosso do Sul contém um curso completo grande flexibilidade, inclui em alguns capítulos
sobre Excel. Nele, os alunos podem aliar os exercícios e exemplos de aplicação.
conceitos estatísticos de tabelas e gráficos
à prática da informática, construindo pla- DORIA FILHO, U. Introdução à Bioestatística
nilhas e gráficos a partir do computador. para Simples Mortais. 1ª. Edição. SP: Negócio
Editora, 1999.
• http://www.ufpa.br/dicas/biome/bioni.htm O livro oferece aos estudantes e profissio-
Nesse material da Universidade Federal do nais de saúde uma excelente oportunidade
Pará, o estudante encontra dicas e notas de aprender estatística por meio de exemplos
interessantes para todo estudo da bioes- práticos.
tatística, contendo inclusive abordagem
sobre o tema deste capítulo.

• http://www.ai.com.br/pessoal/indices/2A3.
HTM
Esse site contém material completo para
um curso de estatística. Conceitos, exem-
plos, exercícios, biblioteca virtual da área,
inclusive glossário dos temas abordados e
calculadora on-line. Bastante interessante
para o estudante se aprofundar e exercitar
o tema deste capítulo.
17

capítulo 3
Percentagens, Índices,
Coeficientes e Taxas

prof. Ernani Martins dos Santos | carga horária: 10 horas

OBJETIVOS ESPECÍFICOS
• Compreender o significado de percenta-
gem;

• Entender o significado de dados relativos;



• Conhecer a utilidade na construção de nú-
meros-índices, coeficientes e taxas.

INTRODUÇÃO
Os dados estatísticos resultantes da coleta di-
reta da fonte, sem outra manipulação se não
a contagem ou medida, são chamados da-
dos absolutos. A leitura dos dados absolutos
é sempre enfadonha e inexpressiva; embora
esses dados traduzam um resultado exato e
fiel, não tem a virtude de ressaltar de imediato
as suas conclusões numéricas. Daí o uso im-
prescindível que faz a estatística dos dados
relativos. Dados esses, que são resultados de
comparação por quociente (razões) que se
estabelecem entre dados absolutos e tem por
finalidade realçar ou facilitar as comparações
entre quantidades. Traduzem-se os dados re-
lativos, em geral, por meio de percentagens,
índices, coeficientes e taxas.

1. PERCENTAGENS
São razões que consistem em considerar um
total qualquer igual a 100% e, através de uma
18
regra de três, estabelecer qualquer relação b) o número inteiro máximo de quilos da
capítulo 3


com as parcelas que compõem o total assim: nova mistura que poderiam ser compra-
dos com a economia obtida em um dia e,
Total - 100% com esse número de quilos, quantos pães
Parcela - X% a mais poderiam ser fabricados por dia.

O que nos leva a:


3. No mês de agosto, Pedro observou que o
percentagem = parcela 100 valor da sua conta de energia elétrica foi
Total de 50% superior ao valor da sua conta de
água. Em setembro, tanto o consumo de
Onde o x na regra de três está representado energia elétrica, quanto o de água, na re-
na equação logo a seguir pela palavra percen- sidência de Pedro, foram iguais aos con-
tagem. Isto significa que o valor de x, encon- sumos do mês de agosto. Porém, como as
trado na regra de três, expressa um valor na tarifas de água é energia elétrica foram re-
forma de percentagem (daí a multiplicação ajustadas em 10% e 20%, respectivamen-
por 100% que tem o significado de total). Por te, Pedro desembolsou R$ 20,00 a mais do
exemplo, encontrando-se x = 32 se expressa que em agosto para quitar as duas contas.
esse valor na forma de percentagem 32%. Quanto Pedro pagou de energia elétrica no
mês de setembro?

EXERCÍCIO 3.1 4. No mês de janeiro de determinado ano,
uma categoria profissional tem direito
a um aumento salarial de 75%. Como a
1. Em 1995 o Banco do Brasil (BB) renego- categoria já havia recebido uma antecipa-
ciou a dívida de R$ 7,1 bilhões dos agricul- ção de 25% em novembro, qual deve ser
tores, que foi dividida em parcelas a serem a porcentagem de acréscimo adicional do
pagas até o final de cada ano. O valor da salário para compensar a antecipação con-
primeira parcela era R$ 700 milhões, mas cedida?
somente metade foi pago; da segunda
parcela (totalizando R$ 1,1 bilhão) vencida
em 1997 somente foi pago 26% do devi- 5. Um comerciante compra uma peça de te-
do. Em 1997 o lucro líquido do BB foi de cido de 50m. Se ele vender 20m com um
R$ 646,4 milhões. Quantas vezes a dívida lucro de 50%, outros 20m com um lucro
restante dos agricultores no início de 1998 de 30% e os restantes pelo preço de custo,
vale o lucro líquido do BB em 1997? calcule seu percentual de lucro na venda
da peça.

2. Uma empresa agropecuária desenvolveu
uma mistura, composta de fécula de ba- 6. Sabendo-se que o Índice Geral de Preços (
tata e farinha, para substituir a farinha de IGP ) de junho de 2002 foi de 1,74% e no
trigo comum. O preço da mistura é 10% mês de julho do mesmo ano foi de 2,05%,
inferior ao da farinha de trigo comum. qual o percentual de aumento de um mês
Uma padaria fabrica e vende 5.000 pães para o outro?
por dia. Admitindo-se que o kg da farinha
comum custa R$ 1,00 e que com 1kg de
farinha ou da nova mistura a padaria fabri- Um outro fato também importante, é que as
ca 50 pães, determine: percentagens podem ser utilizadas de inúme-
ras formas, segundo a circunstância que quei-
a) a economia, em reais, obtida em um ramos estudar. Vejamos dois casos:
dia, se a padaria usar a mistura em vez da
farinha de trigo comum; Primeiro: Quando quisermos analisar a estru-
tura de um fato, deveremos ratear as porcen-
tagens entre os itens que compõem esse fato.
19
Consideremos a série: Vamos agora fazer uma interpretação dos da-

capítulo 3
dos obtidos nesta nova coluna. Esses valores
Matrículados nas Intituições de Ensino
da Cidade Z ano 2000 nos dizem que, cada 100 alunos da cidade Z,
91 estão matriculados no Ensino Fundamen-
Categorias Número de Alunos tal, 8, aproximadamente, no Ensino Médio e
(Dados Absolutos) 1 no Ensino Superior. Com isto, podemos ob-
Ensino servar que o emprego da percentagem é de
Fundamental 19286 grande valia quando é nosso intuito destacar
Ensino Médio 1681 a participação da parte no todo. Este estudo
Ensino Superior 234 comparativo pode ser muito útil na análise de
Total 21201
dados numa série estatística, como podemos
Fonte: Dados Fictícios
ver a seguir.

Calculemos as percentagens dos alunos de Consideremos, agora, a série:


cada nível de ensino:
Número de Alunos
Ensino Fundamental Categorias
Cidade Z Cidade T

19286 x 100 = 90,96 Ensino


21201 Fundamental 19286 38660
Ensino Médio 1681 3399
Isto nos leva a 91,0% Ensino Superior 234 424
Total 21201 42483
Ensino Médio
Fonte: Dados Fictícios

1681 x 100 = 7,92


21201 Qual das cidades tem, comparativamente, maior
número de alunos em cada nível de ensino?
Isto nos leva a 7,9%
Como o número total de alunos é diferente
Ensino Superior nas duas cidades, não é fácil concluir a respei-
to usando os dados absolutos. Porém, usando
234 x 100 = 1,10 as percentagens, tal tarefa apresenta-se como
21201 a forma ideal para a resposta ao questiona-
mento. Para tal, vamos acrescentar na tabela
Isto nos leva a 1,10% anterior as colunas correspondentes às percen-
tagens, relativa a cada nível de ensino, para
Observe a soma: cada cidade.

91,0% + 7,9% + 1,1% = 100%


Matrículas nas Instituições de Ensino
Com esses dados podemos formar uma nova das cidades Z e T no ano 2000
coluna na série em estudo: Cidade Z Cidade T
Matrículados nas Intituições de No de % No de %
Ensino da Cidade Z ano 2000 Categorias
Alunos Alunos
Categorias Número % (Dados
de Alunos Absolutos) Ensino
Fundamental 19286 91,0 38660 91,0
Ensino
Fundamental 19286 91,0 Ensino Médio 1681 7,9 3399 8,0
Ensino Médio 1681 7,9 Ensino Superior 234 1,1 424 1,0
Ensino Superior 234 1,1 Total 21201 100 42483 100
Fonte: Dados Fictícios
Total 21201 100
Fonte: Dados Fictícios
20
A análise. A resposta com os dados brutos não Vejamos os cálculos:
capítulo 3

seria tão bem posta, como a que se apresen-


ta com os dados relativos. Pois, num primeiro
olhar poderíamos fazer um julgamento errô-
neo do fato, uma vez que a cidade T, aos olhos
Ano 95
( )
3200
3200
X100 = 100%

dos dados brutos, apresenta mais estudantes


em todos os níveis de ensino, se comparada
com a cidade Z. Mas, quando vamos dar uma
Ano 96
( )
3600
3200
X100 = 112,5%

olhada nos dados relativos, isto nos permite


dizer que, comparativamente, contam, prati-
camente, com a mesma taxa de estudante em
Ano 97
( )
3360
3200
X100 = 105,0%

cada nível de ensino. Ou, com o mesmo nú-


mero de estudantes para cada deles tomados EXERCÍCIO 3.2
como referência 100. E, poderíamos informar
que, para cada 100 estudantes, as cidades Z
e T apresentam as mesmas taxas para os três 1. Faça (continue) os cálculos para os anos:
níveis de ensino. 1998; 1999; 2000 e 2001.

Observação: Comentários:
Do mesmo modo que tomamos 100 para a Os valores dessa nova coluna mostram como
base de comparação, também podemos to- evoluíram a produção em termos percentuais
mar outro número qualquer, como por exem- em relação ao ano1995 (base escolhida). Por
plo, 1 ou 1000 (base decimal). exemplo:

Segundo: Quando quisermos estudar a dinâ- • De 1995 para 1996 a produção cresceu
mica de um fato, ou seja, acompanhar a evolu- 12,5%.
ção de um fato ao longo do tempo, deveremos
estabelecer um período seja ano, mês, dia etc. • De 1995 para 1997 a produção cresceu
-, uma produção, uma renda etc. como sendo 5,0%.
a base, considerando-a como 100%.
• De 1995 para 1998 a produção também
Base Fixa cresceu 5,0%.

Anos Produção (t) Ano-base Variação • De 1995 para 1999 a produção foi a mes-
1995 Porcentual ma, ou seja, não evoluiu.
(%) com Relação
à Base (%)
• De 1995 para 2000 a produção decresceu
95 3200 100,0 - em -12,5%.
96 3600 112,5 + 12,5
97 3360 105,0 + 5,0
98 3360 105,0 + 5,0 • De 1995 para 2001 a produção cresceu
99 3200 100,0 0,0 7,5%
00 2800 87,0 - 12,5
01 3440 107,5 + 7,5
Base Móvel

Base - 100% Este caso difere do anterior, pois a base se mo-


Valores - X% difica para cada dado. Onde, cada novo dado
sempre será relacionado com o dado anterior.
Com isto: Apenas as duas primeiras colunas Vejamos, o exemplo a seguir:
fazem parte do enunciado
Exemplo: Produção em toneladas da Metalúr-
percentagem =
( )
Valores
Base
X 100 gica “ABC” Base Móvel.
21
• De 1999 para 2000 a produção também

capítulo 3
Anos Produção (t) Base Móvel Variações %
(%) com Relação decaiu em -12,5%
à Base
95 3200 - - • De 2000 para 2001 a produção evoluiu em
96 3600 112,5 + 12,5 22,9%.
97 3360 93,3 - 6,7
98 3360 100,0 0,0
99 3200 95,2 - 4,8
00
01
2800
3440
87,5
122,9
- 12,5
+ 22,9
2. Índices
De forma similar ao caso da base fixa, temos: “Em termos gerais, um número-índice pode
ser concebido como uma medida estatística
destinada a comparar, através de uma expres-
Base - 100%
são quantitativa global, grupos de variáveis
Valores - X%
relacionadas e com diferentes graus de im-
portância. Através dele obtém-se um quadro
Com isto:
resumido das mudanças ocorridas em áreas

( )
afins (TOLEDO e OVALLE, 1985, p. 311)”. Este
percentagem = Valores X 100
resumo dá uma visão geral do referido tema,
Base
que aqui será exposto apenas através das ex-
pressões quantitativas para um exercício de
Vejamos os cálculos:
configuração deste conteúdo.
95 Não existe dado anterior, por tanto
Uma definição deste tema é dizer que, índices
esse percentual é inexistente.
são razões entre duas grandezas tais que uma
96
( )3600
3200
X 100 = 112,5%
não inclui a outra (grandezas independentes).

São exemplos de índices:


97
( )3360
3200
X 100 = 93,3%
• ÍNDICE CEFÁLICO

EXERCÍCIO 3.3
IC
()
DT
DL
X 100

Onde:
1. Faça (continue) os cálculos para os anos: IC = Índice Cefálico
1998; 1999; 2000 e 2001. DT = Diâmetro Transverso do Crânio
DL = Diâmetro Longitudinal do Crânio
Comentários:
Os valores dessa nova coluna mostram como • QUOCIENTE INTELECTUAL
evoluem a produção de um ano para o outro.
Por exemplo:

• De 1995 para 1996 tivemos um acréscimo


QI
()
IM
IC
X 100

na produção de 12,5% Onde:


QI = Quociente Intelectual
• De 1996 para 1997 a produção decaiu em IM = Idade Metal
-6,7%. IC = Idade Cronológica

• De 1997 para 1998 não houve alteração • DENSIDADE DEMOGRÁFICA


na produção.

• De 1998 para 1999 a produção decaiu em


-4,8%
DD
()
PT
ST
X 100
22
Onde: rificar se sua situação por atendido melhorou
capítulo 3

DD = Densidade Demográfica ou piorou, considerando que no período de 93


PT = População Total a 96 houve um acréscimo de 120% (isto é uma
ST = Superfície Total suposição!) no custo de vida.

Índices Econômicos Logo:

• PRODUÇÃO PER CAPITA 1993


( )
Receita Per Capita = 200000 = 50
4000
PPC
()
VP
P 1996
( )
Receita Per Capita = 800000 = 100
8000
Onde:
PPC = Produção “Per Capita” Porém:
Vp = Valor da Produção Houve um acréscimo de 120% aumento
P = População de um fator de 220 (120 +100).

Daí:
• CONSUMO PER CAPITA
Para manter o mesmo padrão a instituição ne-

()
cessitaria de:
CPC CB
P 100 - 30
220 - X
Onde:
CPC = Consumo “Per Capita” Resolvendo:
CB = Consumo do Bem X = 110 a instituição piorou, pois necessitaria
P = População de $10 a mais do que é hoje (1996) a sua ren-
da per capita.
• RENDA PER CAPITA

RDPC
()
Rd
P
3. Coeficientes
É a comparação entre duas grandezas em que
Onde: uma está contida na outra.
RDPC = Renda “Per Capita” São exemplos de coeficientes:
Rd = Renda
• COEFICIENTE DE NATALIDADE
P = População

• RECEITA PER CAPITA


()
CN = NN
PT
RCPC
()
Rc
P
Onde:
CN = Coeficiente de Natalidade
NN = Número de Nascimento
Onde:
PT = População Total
RCPC = Receita “Per Capita”
Rc = Receita • COEFICIENTE DE MORTALIDADE
P = População

Exemplo:
Uma instituição beneficente possuía em 1993
a quantia de $ 200.000 diários para atender a
()
CM = NO
PT

Onde:
4000 pessoas. Em 1996 a receita da instituição CM = Coeficiente de Mortalidade
é de $ 800.000 para atender a 8000 pessoas. NO = Número de Óbitos
Calcular a receita per capita da instituição e ve- PT = População Total
23
coeficientes educacionais • TAXA DE EVASÃO ESCOLAR - TEE

capítulo 3
• COEFICIENTE DE EVASÃO ESCOLAR TEE = CEE X 102

()
CEE = NE (ver o CEE na parte de Coeficientes)
NIM
Onde: • TAXA DE MORBIDADE - TMB
CEE = Coeficiente de Evasão Escolar
NE= Número de Alunos Evadidos Calculada para cada doença em particular,
NIM = Número Inicial de Matrícula aqui a tuberculose. Numa determinada cida-
de, relativa a um certo período (meses, ano,
• COEFICIENTE DE APROVAÇÃO ESCOLAR decênio, etc) Y.
Temos:

Onde:
()
CAE = NA
NFM TMB = CMB X 103

CAE = Coeficiente de Aprovação Escolar Onde:


NA= Número de Alunos Aprovados CMB = n
NFM = Número Final de Matrícula Pn
Sendo:
• COEFICIENTE DE RECUPERAÇÃO ESCOLAR CMB = Coeficiente de Morbidade
n = número de acometidos por tuberculose

()
CRE = NR no município X, no ano Y
NAR PN = População do município X, no ano Y.
Onde:
CRE = Coeficiente de Recuperação Escolar • TAXA DE ACIDENTES DE TRABALHO
NR= Número de Alunos Recuperados
NAR = Número de Alunos em Recuperação Neste caso, ela se divide em duas partes:
I. Frequência da Taxa de Acidentes de Traba-
lho;
II. Gravidade da Taxa de Acidentes de Trabalho.
4. Taxas
Vejamos a primeira:
É a mesma coisa que coeficiente, apenas apre-
sentando-se multiplicada por uma potência de Onde: TfAT = CEE X 102
10 (dez) (10, 100, 1000 etc...) para tornar o
resultado mais inteligível, uma vez que sempre CfAT = Nac
especificamos os dados em formas relativas. NOH
Desse modo temos a expressão: Sendo:
CfAT = Coeficiente de Frequência dos Acidentes
Taxa = Coeficiente X 10n de Trabalho
com n = 1, 2, 3, ... Nac = Número de Acidentes
Exemplos de taxas: NOH = Número de Operários Hora
• TAXA DE MORTALIDADE - TM
Vejamos a segunda:
TM = CM X 103
TgAT = Cgat X 106
Onde:
(ver o CM na parte de Coeficientes)
CgAT = NHPA
NOH
• TAXA DE NATALIDADE - TN
Sendo:
CgAT = Coeficiente da Gravidade dos Acidentes
TN = CN X 103
de Trabalho
(ver o CN na parte de Coeficientes)
24
NHPA = Número de Horas Perdidas em razão onde:
capítulo 3

dos Acidentes NE = Número de Alunos Evadidos


NOH = Número de Operários Hora
Logo: NE = 12793 - 10347 = 2446
Convém salientar que o n° de horas perdidas
por acidente se conhece tendo em conta, além e que NIM = 12793 com isto CEE = 0,191
das horas que o acidentado deixou de traba-
lhar, a utilização de uma tabela específica que Daí:
proporciona uma equivalência entre os tipos TEE = 0,191 x 102 = 0,191 x 100 = 19,1%
de incapacidade e o número de horas debi-
tadas à empresa em virtude do acidente. Por Cidade Y
exemplo: perda de uma mão equivale a 3000 Como: TEE = CEE X 102
horas perdidas, surdez em um ouvido equivale
a 600 horas perdidas, etc. mas: CEE = NE
NIM
onde:
EXERCÍCIOS NE = Número de Alunos Evadidos

RESOLVIDOS Logo: NF = 8349 - 6649 = 1700

1. Calcular a taxa frequência e de gravidade e que NIM = 8349 com isto CEE = 0,204
em uma empresa em que, operando com
50 operários, trabalhando 500 horas cada Daí:
um, ocorreram 5 acidentes com uma per- TEE = 0,204 x 102 = 0,204 x 100 = 20,4%
da de 200 horas.
Conclusão: a cidade que apresentou a
TfAT = 5 x 106 = 200 maior evasão escolar foi a cidade Y. Obser-
50 x 500 ve que o valor do coeficiente já diz esta
O que significa que nesta empresa a, em realidade, porém, a informação em termos
cada 1000000 de operários-hora, ocorre- percentuais dá uma realidade maior ao
ram 200 acidentes. fato, um vez que podemos compreendê-lo
na formação de um todo (100%).
TgAT = 200 X 106 = 8000
50x500 3. Em uma cidade cuja população é 520000
habitantes, o números de óbitos registrados
O que significa que, nesta empresa, em é de 80080. Calcular a taxa de mortalidade.
cada 1000000 de operários-hora, 8000
horas são perdidas em virtude de acidentes. Resolução:
Temos: Números de Óbitos: NO = 80080
2. A cidade X apresentou 12793 matrículas
nas séries iniciais, no início do semestre e que a População Total: PT = 520000
2000 e, 10347 no fim do ano 2000. A ci-
dade Y apresentou os seguintes números: Como:
8349 no início de 2000 e 6649 matrícu- CM = NO
las no final de 2000. Qual e a cidade que PT
apresentou mais evasão escolar?
logo: CM = 80080 = 0,154
Cidade X 520000
Como: TFF = CEE X 102
Mas: TM = CM x 103
mas: CEE = NE
NIM logo: TM=0,154x103=0,154x1000=154%

25
Ou seja:

capítulo 3
Série e Turma 1OB 1OC 1OE 1OF Total
Tivemos 154 óbitos para cada 1000 habi- N de Alunos 30/03
o
49 49 47 47 192
tantes. No de Alunos 30/11 44 42 35 40 161
Promovidos sem
35 42 27 33 137
recuperação

EXERCÍCIO 3.4 Retidos sem


recuperação
03 00 00 06 09

Em recuperação 06 00 08 01 15
1. Considere a série estatística: Recuperados 05 00 03 00 08
Não recuperados 01 00 05 01 07
Séries Alunos Matriculados %
Total Promovidos 40 42 30 33 145
1a 546
Geral retidos 04 00 05 07 16
2a 328
3a 280 Calcule:
4 a
120 a) A taxa de evasão, por classe;
Total 1274 b) A taxa de evasão total;
Fonte: Dados Fictícios
c) A taxa de aprovação, por classe;
Complete-a, determinado as percentagens d) A taxa de aprovação geral;
com uma casa decimal e fazendo a com- e) A taxa de recuperação, por classe;
pensação (arredondamento), se necessá- f) A taxa de recuperação geral:
rio. Exemplos: g) A taxa de reprovação na recuperação
geral;
a) 32,4823% fica 32,5; h) A taxa de aprovação, sem recuperação;
b) 12,237% fica 12,2%; i) A taxa de retidos, sem recuperação.
c) 6,971% fica 7,0%;
d) 8,3452% fica 8,3%. 4. Cosiderando que em uma região temos os
seguintes dados:
2. Considere a tabela abaixo: População = 1784327 habitantes
Evolução das receitas do Café industrializa- Superfície = 137420 Km2
do de Janeiro até Abril do ano de 2002 Nascimentos em 1 ano = 42327 nascidos
vivos
Meses Valor (US$ milhões) %
Mortes em 1 ano = 16230 óbitos

janeiro 33,3
Calcular:
fevereiro 54,1
a) Coeficiente de natalidade e taxa de na-
março 44,5 talidade (por 1.000 hab.)
abril 52,9 b) Coeficiente de mortalidade e taxa de
Total 184,8 mortalidade (por 10.000 hab.)
Fonte: Dados Fictícios
c) Índice de densidade demográfica.

a) Complete-a com uma coluna de taxas 5. Uma cidade de 320000 habitantes apre-
percentuais. senta uma taxa de natalidade de 3,2% ao
b) Como se distribuem as receitas em re- ano e uma taxa de mortalidade de 27% ao
lação ao total? ano. Calcular o aumento da população em
c) Qual o desenvolvimento das receitas um ano.
de um mês para o outro?
d) Qual o desenvolvimento das receitas 6. Uma entidade assistencial em 1998 aten-
em relação ao mês de janeiro? dia 500 internos com uma verba de R$
200.000,00. Em 2003, os internos au-
3. Um professor preencheu um quadro, en- mentaram em 20%, enquanto que a verba
viado pela D.E, com os seguintes dados: aumentou 50%. Sabendo-se que o custo
26
de vida, pela desvalorização da moeda,
capítulo 3

aumentous em 40% no mesmo período,


indaga-se se a situação financeira da enti-
dade, por interno atendido, melhorou ou
piorou?

7. Em uma empresa que possui 250 operá-


rios, trabalhando durante 60 dias de 8 ho-
ras cada um, verificaram-se 32 acidentes
de trabalho, ocasionando uma perda de
146 horas. Calcular a taxa de frequência e
de gravidade de acidente do trabalho.

Referência
CRESPO, Antônio Arnot. Estatística Fácil. 17a
edição, São PAulo, SP; Ed. Saraiva, 1999.

MARTINS, G. A., Dornaire, D. Princípio de Es-


tatística. 4a edição. São PAulo, SP; Ed. Atlas,
1990.

NAZARETH, Helenalda. Curso Básico de Estatís-


tica. 12a edição. São Paulo, SP; Ed. Ática, 2000.

SPIEGEL, MR. Estatística. 2a edição. São PAulo,


SP; Ed. Mcgranw Hill, 1985.
27

capítulo 4
DISTRIBUIÇÃO DE
FREQUÊNCIA

prof. Ernani Martins dos Santos | carga horária: 10 horas

OBJETIVOS ESPECÍFICOS
• Conhecer os elementos constituintes de
uma tabela de frequência;

• Interpretar e construir tabelas de frequência;

• Compreender e construir o gráfico de fre-


quência (histograma e gráfico de frequên-
cia acumulada);

• Entender o gráfico como uma das formas de


melhor interpretar os dados tabelados numa
pesquisa em que a frequência é relevante.

Introdução
A análise estatística se inicia quando um con-
junto de dados torna-se disponível de acordo
com a definição do problema da pesquisa. Um
conjunto de dados, seja de uma população ou
de uma amostra, contém, muitas vezes, um
número muito grande de valores. Além disso,
esses valores, na sua forma bruta, encontram-
se muito desorganizados. Eles variam de um
valor para outro, sem qualquer ordem ou pa-
drão. Os dados precisam, então, ser organiza-
dos e apresentados em uma forma sistemática
e seqüencial por meio de uma tabela ou gráfi-
co. Quando fazemos isso, as propriedades dos
dados tornam-se mais aparentes e tornamo-
nos capazes de determinar os métodos esta-
tísticos mais apropriados para serem aplicados
no seu estudo.
28
capítulo 4

Suponhamos o seguinte conjunto de dados: Variável Frequência Frequência


absoluta relativa
11 2 2/26 = 0,0769
14 12 13 11 12 13
12 5 5/26 = 0,1923
16 14 14 15 17 14
13 6 6/26 = 0,2308
11 13 14 15 13 12
14 7 7/26 = 0,2692
14 13 14 13 15 16
15 3 3/26 = 0,1154
12 12
16 2 2/26 = 0,0769
17 1 1/26 = 0,0385
Para montarmos uma distribuição de frequ- TOTAL 26 1,0000
ências desses dados, verificamos quais são os
valores não repetidos que existem e, em uma
primeira coluna de uma tabela, colocamos es- Podemos também calcular as frequências acu-
ses valores e, na segunda coluna, o número de muladas. Nesse caso, existem as frequências
repetições de cada um desses valores. Para o absolutas acumuladas e as frequências relati-
exemplo acima, a distribuição de frequências vas acumuladas.1
será:
Variável Frequência Frequência Frequência Frequência
Variável Frequência absoluta relativa absoluta relativa
acumulada acumulada
11 2
11 2 2/26 = 0,0769 2 2/26 = 0,0769
12 5
12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1
17 1 1/26 = 0,0385 26 26/26 = 1,0000
TOTAL 26 1,0000
A frequência de uma observação é o número
de repetições dessa observação no conjunto
de observações. A distribuição de frequência
é uma função formada por pares de valores, 2. Histogramas
sendo que o primeiro é o valor da observação
(ou valor da variável) e o segundo, o número Histograma é uma representação gráfica de
de repetições desse valor. uma tabela de distribuição de frequências.
Desenhamos um par de eixos cartesianos, e,
no eixo horizontal (abscissas) colocamos os va-
1. Frequências lores da variável em estudo e no eixo vertical
(ordenadas), colocamos os valores das frequ-
Relativas e ências. O histograma tanto pode ser represen-
Acumuladas tado para as frequências absolutas como para
as frequências relativas. No caso do exemplo
Para o exemplo acima, também podemos cal- anterior, o histograma seria:
cular a frequência relativa referente a cada va-
lor observado da variável. A frequência relativa
é o valor da frequência absoluta dividido pelo
número total de observações.

1
Observe que os valores da última coluna (frequência relativa acumulada) podem ser calculados de duas maneiras. Na primeira, tal como é feito na tabela
a seguir, dividimos o valor da frequência absoluta acumulada pelo total de observações. Na segunda maneira, acumulamos o valor da frequência relativa.
Este último método pode levar a acúmulos de erros, de forma que o último valor de frequência relativa acumulado se distancie consideravelmente de 1.
29

capítulo 4
Histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento
da frequência acumulada. Na figura abaixo, a ogiva é mostrada em sobreposição ao histograma.

3. Tabulação de Ano Safra (1000 t) Ano Safra (1000 t)

Frequência e 1 280 10 365

Histograma para 2 305 11 280

Variáveis 3 320 12 375

Contínuas 4 330 13 380

5 310 14 400
Até agora, vimos como são calculadas as fre-
6 340 15 371
quências (relativas e acumuladas) para variá-
veis quantitativas discretas. Nesse caso, a ta- 7 310 16 390
bulação dos resultados é mais simples. Mas, 8 340 17 400
quando tratamos de variáveis quantitativas
9 369 18 370
contínuas, os valores observados devem ser ta-
bulados em intervalos de classes. Para a deter-
minação dessas classes, não existe uma regra
pré-estabelecida, sendo necessário um pouco
de tentativa e erro para a solução mais ade- Devem ser seguidos alguns passos para a tabu-
quada. Suponhamos que as safras agrícolas de lação de frequências de dados que se referem
um determinado produto, em uma determina- a uma variável quantitativa contínua, como é o
da região, sejam dadas pela tabela a seguir: caso do nosso exemplo.
30
capítulo 4

1. Definir o número de classes. O número de do limite de classe, deve-se estabelecer um


classes não deve ser muito baixo nem mui- critério de inclusão. Para evitar esse tipo
to alto. Um número de classes pequeno de dificuldade, normalmente se estabelece
gera amplitudes de classes grandes, o que que o limite superior de cada classe é aber-
pode causar distorções na visualização do to (e conseqüentemente, o limite inferior
histograma. Um número de classes grande de cada classe é fechado), ou seja, cada
gera amplitude de classes muito reduzidas. intervalo de classe não inclui o valor de
Foram definidas regras práticas para a de- seu limite superior, com exceção da última
terminação do número de classes, sendo classe.
que este deve variar entre 5 e 20 (5 para
um número muito reduzido de observa- 4. Tabular os dados por classe de frequência.
ções e 20 para um número muito elevado). A partir da listagem de dados, seleciona-se
Se n representa o número de observações para cada um deles qual é a sua classe de
(na amostra ou na população, conforme frequência e acumula-se o total de frequ-
for o caso), o número aproximado de clas- ência de cada classe. De acordo com nosso
ses pode ser calculado por Número de exemplo, teremos:
Classes = , arredondando os resultados.
No caso do exemplo anterior, temos n = Frequência Frequência
e podemos adotar um número Classe Absoluta Relativa
de 5 classes que será razoável. Simples Simples
280 - 310 3 0,12 (12 %)
2. Calcular a amplitude das classes. Essa será 310 - 340 4 0,16 (16 %)
obtida, conhecendo-se o número de clas- 340 - 370 6 0,24 (24 %)
ses e amplitude total dos dados. A am-
370 - 400 7 0,28 (28 %)
plitude total dos dados é o resultado da
400 - 430 5 0,20 (20%)
subtração valor máximo - valor mínimo da
série de dados. A amplitude de classe será: Total 25 1,00 (100 %)

Amplitude de classe = Valor Máximo - Valor Mínimo


número de classes
Veremos adiante, quando discutirmos as medi-
Em geral, o valor do resultado é também das de posição (medidas de tendência central)
arredondado para um número inteiro mais e de dispersão, que, quando agrupamos dados
adequado. No nosso exemplo, temos: numéricos em intervalos de classe, ocorre per-
Amplitude de classe = 430 - 280 = 30 da de informação, o que leva a resultados não
5
tão precisos que aqueles que seriam obtidos a
3. Preparar a tabela de seleção com os limites partir dos dados originais sem agrupamento.
de cada classe. Na tabela abaixo, apresen-
tamos para os dados do nosso exemplo os
limites inferior e superior de cada uma das
EXERCÍCIOS
5 classes de frequência.
1. Conhecidas as notas de 50 candidatos
Classe Limite Inferior Limite Superior após uma avaliação para concurso de Pro-
1 280 310 fessor na área de Biologia:
2 310 340
3 340 370 84 68 33 52 47 73 68 61 73 77
4 370 400 74 71 81 91 65 55 57 35 85 88
59 80 41 50 53 65 76 85 73 60
5 400 430
67 41 78 56 94 35 45 55 64 74
Observa-se, na tabela acima, que o limite 65 94 66 48 39 69 89 98 42 54
superior de cada classe coincide com o li-
mite inferior da classe seguinte. Prevendo- Obtenha a distribuição de frequência, ten-
se que pode ocorrer que o valor de uma do 30 para limite inferior da primeira clas-
observação seja exatamente igual ao valor se e 10 para intervalo de classe.
31
2. ARAÚJO e HOSSNE, ao pesquisarem a pres-

capítulo 4
• http://www.unb.br/ib/cfs/cg/Apostila%20I/
são arterial, em milímetros de mercúrio, de introducao.doc
cães adultos anestesiados e após laparato- Esse material da UNB é um curso de Bio-
mia, encontraram os seguintes dados: estatística com linguagem voltada para a
130; 107,5; 135; 100; 134,5; 121,5; 107,5; área de Saúde e Biometria. Contém tópicos
105; 125; 130; 145; 158,5; 135; 140; 120; desde os conceitos básicos até os conte-
100; 135; 125; 110; 102; 121,5; 111,5; údos mais avançados, incluindo exemplo
107,5; 127,5; 104,5; 102,5; 119,5; 107,5; e citações de bibliografia importantes. In-
99; 120; 90,5; 101,5; 90,5; 115,5; 113; teressante para os estudantes que preten-
116; 143; 104,5; 102,5; 107,5; 125,5; 93; dem aprofundar seus conhecimentos.
82,5; 115; 136; 101,5; 124; 117,5; 103,5.
De posse desses dados, construa uma ta-
bela de distribuição de frequência. Referência
3. Faça um histograma e um polígono de fre- MILONE, G. e ANGELINI, F. Estatística Geral. SP:
Atlas, 1993.
quências para apresentar as informações
da tabela seguinte. Este livro é dirigido, em sua especificidade à
Estatística. O seu forte é uma linguagem clara
Cães adultos anestesiados e após dos conceitos trabalhados em Estatística.
laparotomia, segundo a pressão
arterial, em milímetros de mercúrio. CRESPO, A. A. Estatística Fácil. 17ª. Edição. SP:
Classe Ponto médio Frequência
Saraiva, 1999.
Apesar de técnico, este livro trabalha uma lin-
80 |--- 90 85 1
guagem bem didática para todos aqueles que
90 |---100 95 4
necessitam de domínio no trabalho com a Es-
100 |---110 105 16 tatística. Apresenta exemplos e exercícios bem
110 |---120 115 8 interessantes.
120 |---130 125 9
130 |---140 135 7 VIEIRA, S. Introdução à Bioestatística. 3ª. Edi-
140 |---150 145 3 ção. SP: Campus, 1980.
150 |---160 155 1
Um livro que pode ser consultado por você no
estudo deste capítulo e durante o referido curso.

Sites nos quais o aluno pode buscar textos


complementares, exercícios e aprofundar o es-
tudo dos temas abordados.

• http://www.ufpa.br/dicas/biome/bioni.htm
Nesse material da Universidade Federal do
Pará, o estudante encontra dicas e notas
interessantes para todo estudo da bioes-
tatística, contendo inclusive, abordagem
sobre o tema deste capítulo.

• http://www.ai.com.br/pessoal/indices/2A3.
HTM
Esse site contém material completo para
um curso de estatística. Conceitos, exem-
plos, exercícios, biblioteca virtual da área,
inclusive glossário dos temas abordados e
calculadora on-line. Bastante interessante
para o estudante se aprofundar e exercitar
o tema deste capítulo.
33

capítulo 5
MEDIDAS DE TENDÊNCIA
CENTRAL E MEDIDAS DE
DISPERSÃO

prof. Ernani Martins dos Santos | carga horária: 20 horas

OBJETIVOS ESPECÍFICOS
• Compreender o significado de medidas de
posição ou de tendência central;

• Trabalhar estas medidas de posição em


situações-problema;

• Conhecer a utilidade, vantagens e desvan-


tagens dessas medidas;

• Definir o objetivo das medidas de dispersão;

• Explicar o que são medidas de dispersão e


como elas podem ser usadas;

• Identificar as vantagens importantes de


cada medida de dispersão.

INTRODUÇÃO
Em estatística, é comum analisarmos as ten-
dências que uma pesquisa revela. Para isso,
realizamos algumas medidas estatísticas.
Quando temos um conjunto de dados, pode-
mos identificar alguns de seus elementos, cuja
tendência é se posicionar em torno de valores
centrais desse conjunto. Por meio desses ele-
mentos, podemos analisar e interpretar dados.

Cada um desses elementos apresenta vanta-


gens e desvantagens, e a escolha de um ou de
outro vai depender do conjunto de dados e
dos fins desejados.
34
As medidas de tendência central mais utiliza- Para encontrarmos a mediana, colocamos em
capítulo 5

das são a moda, a mediana e a média (aritmé- ordem crescente ou decrescente e tomamos os
tica e ponderada). termos centrais, obtendo a média aritmética
deles.
Moda (Mo) 1,85 1,85 1,95 1,98 1,98 1,98 2,01 2,01
Moda de um conjunto de valores é o elemento 2,04 2,07 2,07 2,07 2,07 2,10 2,13
que ocorre mais freqüentemente, dentro des- 2,18
se conjunto. A moda pode ser calculada para
qualquer tipo de variável. Sua função é possi- Neste caso, a mediana é 2,01 + 2,04 = 2,025
bilitar a percepção de uma forte tendência, de 2
uma preferência ou de uma rejeição evidente.
A mediana pode ser calculada para variáveis
Exemplo: qualitativas ordenáveis e para variáveis quan-
Em uma pesquisa para se saber o tipo sangüí- titativas. Uma das funções mais importantes
neo de uma certa população, obtiveram-se os da mediana é auxiliar a entender a razão pela
seguintes dados: 547 tipo O; 441 tipo A; 123 qual a média sofre variações acentuadas. Isso
tipo B; e 25 tipo AB. Neste caso, a moda é o porque uma discrepância na mediana interfere
tipo O. na média, fazendo com que ela aumente ou
diminua muito.
Mediana (Me)
Média aritmética ( X )
Mediana de um conjunto finito de valores, dis-
postos em ordem crescente ou decrescente de A média pode ser calculada apenas, se a va-
grandeza, é o valor central, se o conjunto tiver riável envolvida na pesquisa for quantitativa.
um número ímpar de elementos ou a média Utilizamos a média para observar o valor em
aritmética dos dois valores centrais, se o con- torno do qual os dados se distribuem. Ela é
junto tiver um número par de elementos. tanto mais representativa quanto menor for a
variação dos dados.
Exemplos:
1ª situação (número de termos ímpar) - Ao pes- Para obtermos a média aritmética de um con-
quisar o desenvolvimento da altura em atletas junto de dados numéricos, dividimos o so-
que praticam basquetebol, encontramos as se- matório de todos os termos e dividimos pelo
guintes medidas em centímetros: 2,07 ; 2,01; quantitativo dos termos.
1,85; 1,85; 1,98; 1,95; 1,98; 2,07; 2,07; 2,10;
2,13; 2,01; 2,18; 1,98; 2,07. Exemplo:
Em determinada pesquisa com ratos machos
Para encontrarmos a mediana, colocamos em da raça Wistar, foi verificado o peso deles em
ordem crescente ou decrescente e tomamos o gramas ao 30º dia de nascido, obtendo os se-
termo central. guintes valores: 50; 62; 70; 86; 60; 64; 66; 77;
58; 55; 82; e 74. Assim, para obtermos a mé-
1,85 1,85 1,95 1,98 1,98 1,98 2,01 dia aritmética, procedemos da seguinte forma:
2,01 2,07 2,07 2,07 2,07 2,10 2,13 X=50+62+70+86+60+64+66+77+58+55+82+74= 804=67
2,18 12 12

Neste caso, a mediana é 2,01. Observação: A média aritmética é usada como


medida de tendência central, ou seja, como
2ª situação (número de termos par) - Ao pes- forma de, por meio de um único número, dar
quisar o desenvolvimento da altura em atletas uma idéia das características de determinado
que praticam basquetebol, encontramos as se- grupo de números. No entanto, é importante
guintes medidas em centímetros: 2,07 ; 2,01; ressaltar que, em algumas situações, a presen-
1,85; 1,85; 1,98; 1,95; 1,98; 2,07; 2,07; 2,10; ça de um valor bem maior ou bem menor que
2,13; 2,01; 2,18; 1,98; 2,07; 2,04. as demais faz com que a média aritmética não
35
consiga traçar o perfil correto do grupo. Con- 107,5; 125,5; 93; 82,5; 115; 136; 101,5;

capítulo 5
sideremos, por exemplo, um grupo de pessoas 124; 117,5; 103,5.
com idades 2, 3, 2, 1, 2 e 50 anos. A média Determine a moda, a mediana e a média
de idade, que é 10 anos, não demonstra as ca- aritmética da pressão arterial, com os da-
racterísticas desse grupo em termos de idade. dos citados acima.

Média Aritmética 2. Determine a média aritmética ponderada
Ponderada das pressões arteriais, em milímetros de
mercúrio, representados na tabela a seguir.
Essa média é utilizada para representar classes, Cães adultos anestesiados e após laparotomia, segun-
como é o caso da distribuição de frequência. do a pressão arterial, em milímetros de mercúrio.
Tal média é obtida através do somatório dos Classe Ponto médio Frequência
produtos de cada termo pelas referidas frequ- 80 |--- 90 85 1
ências e dividido pelo total da frequência.
90 |---100 95 4

Exemplo: 100 |---110 105 16


110 |---120 115 8
Nascidos vivos, segundo o peso ao 120 |---130 125 9
nascer, em quilogramas
130 |---140 135 7
Classe Ponto médio Frequência
140 |---150 145 3
1,5 |--- 2,0 1,75 3
150 |---160 155 1
2,0 |---2,5 2,25 16
2,5 |---3,0 2,75 31
3,0 |---3,5 3,25 34
3. As notas de um candidato, em seis pro-
vas de um concurso, foram: 8,4; 9,1; 7,2;
3,5 |---4,0 3,75 11
6,8; 8,7; e 7,2. Determine: A nota média,
4,0 |---4,5 4,25 4 a nota mediana e a nota modal.
4,5 |---5,0 4,75 1

O número de nascidos vivos em nossa amostra


é Medidas de Dispersão
n = 3 + 16 + 31 + 34 + 11 + 4 + 1 = 100 para uma amostra
Para obter a média dos pesos ao nascer dos As medidas de tendência centrais, vistas ante-
nascidos vivos da amostra, multiplica-se o riormente, são a abscissa do ponto em torno
ponto médio de cada classe pela respectiva do qual os dados se distribuem, sendo mais
frequência, somam-se os produtos e divide-se apropriadas quanto menor for a dispersão dos
a soma por n. Então a média é: dados, em que a dispersão é o des-
X =1,75 x 3+2,25 x 16+2,75 x 31+3,25 x 34+3,75 x 11+4,25 x 4+4,75 x 1=300=3 locamento de dados em relação às
100 100 médias.

EXERCÍCIOS Para compreendermos melhor o que é dis-


persão, imagine quatro cobaias humanas em
1. ARAÚJO e HOSSNE, ao pesquisarem a pesquisa para teste de quatro substâncias de
pressão arterial, em milímetros de mercú- emagrecimento, levando-se em consideração
rio, de cães adultos anestesiados e após o emagrecimento mensal por quilograma e a
laparatomia, encontraram os seguin- média de emagrecimento mensal.
tes dados: 130; 107,5; 135; 100; 134,5;
Cobaia Emagrecimento mensal Média mensal
121,5; 107,5; 105; 125; 130; 145; 158,5;
A 5 5 5 5 5 5
135; 140; 120; 100; 135; 125; 110; 102;
121,5; 111,5; 107,5; 127,5; 104,5; 102,5; B 5 3 5 6 6 5
119,5; 107,5; 99; 120; 90,5; 101,5; 90,5; C 10 5 5 5 0 5
115,5; 113; 116; 143; 104,5; 102,5; D 10 10 5 0 0 5
36
Todos tiveram média de emagrecimento men- vios. O conjunto desses desvios mostra o grau
capítulo 5

sal de 5 kg, mas a dispersão em torno da mé- de dispersão dos dados em torno da média.
dia não é a mesma para todas as cobaias. A
tabela anterior nos mostra que: Exemplo:
Considerando os dados da cobaia B, temos:
a) O emagrecimento da cobaia A não possui
variação mensal (dispersão nula). Média = 5 + 3 + 5 + 6 + 6 = 25 = 5
5 5
b) A dispersão mensal de emagrecimento da
cobaia B é menor que da cobaia C. Os desvios são os seguintes:

c) O processo de emagrecimento da cobaia 5–5=0


D possui uma maior variação que todas as 3–5=-2
outras. 5–5=0
6–5=1
Para observarmos esse processo, utilizamos as 6–5=1
seguintes medidas de dispersão: amplitude,
variância e desvio-padrão. Qualquer que seja o conjunto de dados, a
soma dos desvios é sempre igual a zero, por-
Amplitude que os valores positivos e negativos se anulam.
Então, para medir a dispersão dos dados em
Amplitude é a diferença entre o maior e o me- torna da média, os estatísticos usam a soma
nor dado observado. dos quadrados dos desvios.
Cálculo da soma de quadrados dos desvios
Amplitude da cobaia A:
Dados (x) Desvios (x – x) Quadrado dos desvios (x – x)2
5–5=0
5 0 0
Amplitude da cobaia B: 3 -2 4
6–3=3 5 0 0
6 1 1
Amplitude da cobaia C: 6 1 1
10 – 0 = 10 x=5 ∑(x – x) = 0 ∑(x – x)2 = 6

Amplitude da cobaia D: Para medir a dispersão dos dados em torno da


10 – 0 = 10 média, usa-se, então, a variância, que leva em
consideração o tamanho da amostra. A variân-
A amplitude não mede bem a dispersão dos cia que é representada por s2 pode ser defini-
dados, porque em seu cálculo, se utilizam, da pela fórmula:
apenas, os extremos (valores) dos dados e não,
todos os dados. ∑ x2 - ∑ (x)2
S =
2
n
Variância n–1

Os dados de uma amostra se distribuem em Tomemos como exemplo os dados da cobaia


torno da média. Então o grau de dispersão B.
de um conjunto de dados pode ser medido
pelo desvio em relação à média, sendo esse 131 - ( 25 )2
desvio a diferença entre cada dado e a média s2 = 5
do conjunto. 5-1

Como cada dado possui um desvio em relação 131- 625


à média, para termos o grau de dispersão de s =
2
5
uma amostra, é preciso observar todos os des- 4
37
s = 131 - 125
2
a) Calcule a média e a mediana das mar-

capítulo 5
4 cas de cada atleta. A partir desses dados,
que conselhos você daria ao coordenador
s2 = 6 = 1,5 para a escolha de um deles?
4
b) Qual dos atletas tem maior chance de
Desvio-padrão conseguir uma boa marca na competição?
Como medida de dispersão, a variância tem a c) A média é suficiente para apreciar as
desvantagem de apresentar unidade de medi- diferenças entre os atletas?
da igual ao quadrado da unidade de medida
dos dados. Por esse motivo, surgiu o desvio- d) Qual a diferença entre a melhor e a
padrão, definido como a raiz quadrada da va- pior marca do atleta A? E do atleta B?
riância, com sinal positivo, representado por s.

Como exemplo, podemos tomar os dados da e) A amplitude das marcas de cada um


cobaia B. pode auxiliar a tomada de decisão do co-
ordenador? Por quê?

S = √ 1,5
S ~ 1,224 2. Considere as notas de quatro alunos em
quatro testes, sabendo que 20 é a nota
máxima em cada teste:
Coeficiente de
Variação Aluno T1 T2 T3 T4
A 10 10 10 10
O coeficiente de variação é a razão entre o des- B 8 12 8 12
vio-padrão e a média. O resultado é multiplica-
C 0 8 12 20
do por 100, para que o coeficiente de variação
D 0 0 20 20
seja dado em porcentagem. Levando em con-
sideração o exemplo da cobaia B, teremos:

CV = s x 100 a) Calcule a média que cada um deles obteve.


x
CV = 1,224 x 100 b) Calcule a amplitude, a variância e o des-
5 vio-padrão das notas de cada um deles.
CV = 0,2248 x 100
c) Comparando os valores obtidos, o que
CV = 22,48 % você conclui?

3. Numa turma de 18 estudantes, os acertos
EXERCÍCIOS de cada uma das 8 alunas em um teste de
Biologia foram os seguintes:
1. O comitê de esportes de uma cidade ne- 2 6 10 10 14 16 18 20
cessita selecionar uma equipe para uma
competição. O coordenador tem dúvidas a) Calcule a média e o desvio-padrão dessa
sobre o atleta que deve representar a ci- distribuição;
dade nos 400 metros rasos. Ele resolveu
analisar as marcas de dois atletas nas últi- b) A nota dos 10 alunos dessa turma na
mas competições e organizou as informa- mesma prova constitui uma distribuição
ções com os tempos dados em décimos com a mesma média e com desvio-padrão
de segundos: 2. Que comparação pode-se fazer entre as
Atleta A : 464; 467; 469; 474; 476 duas distribuições?
Atleta B: 467; 469; 472; 473
38
4. Ao pesquisar os “pesos” de seus alunos de Diagramas de dispersão
capítulo 5

5ª série, um professor obteve os seguintes


resultados:

38 40 45 42 45 40 43 38
45 45 40 41 41 38 46 32
48 46 42 43 44 50 38 40

a) Organize esses dados numa tabela de
classes de amplitude 4 kg.

b) Qual é a média e a variância dessa dis-


tribuição? Correlação linear positiva

c) Qual é o desvio-padrão?

Correlação
Freqüentemente procura-se verificar se existe
relação entre duas ou mais variáveis. O peso
pode estar relacionado com a idade das pes- Correlação linear negativa
soas; o consumo das famílias pode estar re-
lacionado com sua renda, as vendas de uma
empresa, e os gastos promocionais podem
relacionar-se bem como a demanda de um de-
terminado produto e seu preço. A verificação
da existência e do grau de relação entre variá-
veis é objeto do estudo da correlação.

Uma vez caracterizada, procura-se descrever


uma relação sob forma matemática, através de Nenhuma correlação
uma função. A estimativa dos parâmetros des-
sa função matemática é o objeto da regressão.

Correlação linear Exemplos:


1. Comprimento em centímetros e peso, em
Se um sistema de coordenadas retangulares quilograma, de cães.
mostra a localização dos pontos (x,y) e se, to-
dos os pontos desse diagrama parecem cair
Comprimento Peso Comprimento Peso
nas proximidades de uma reta, tem-se uma
correlação denominada linear. 104 23,5 98 15
107 22,7 95 14,9
Pelo fato de possuirmos uma correlação linear, 103 21,1 92 15,1
temos, então, uma função de 1º grau do tipo 105 21,5 104 22,2
Y = aX + b, onde X é a variável independen- 100 17 94 13,6
te, e Y, a variável dependente, sendo uma cor- 104 28,5 99 16,1
relação positiva, quando Y tende a aumentar,
108 19 98 18
quando o X cresce, e negativa, quando Y ten-
91 14,5 98 16
de a diminuir, quando X aumenta.
102 19 104 20
99 19,5 100 18,3
39
Representação em diagrama de dispersão.

capítulo 5
2. Consumo individual diário de proteína de origem animal, em gramas, e coeficiente de natali-
dade, em 10 países.
País Consumo individual diário de proteínas Coeficiente de natalidade
Formosa 4,7 45,6
Malásia 7,5 39,7
Índia 8,7 33
Japão 9,7 27
Iugoslávia 11,2 25,9
Grécia 15,2 23,5
Itália 15,2 23,4
Bulgária 16,8 22,2
Alemanha 37,3 20
Irlanda 46,7 19,1

Coeficiente de Correlação
∑xy - (∑x) (∑y)
Existe uma medida para o grau de correlação r= n
entre duas variáveis. O instrumento de medi- ∑x2 - (∑x)2 ∑y2 – (∑y)2
da, no caso da correlação linear, é dado pelo √ n n
coeficiente de Pearson, que se representa por r
e é definido pela fórmula:
40
Exemplos:
capítulo 5

X Y X.2 Y2 X.Y
1. Calcular o coeficiente de correlação dos 1 7 1 49 7
dados da tabela seguinte: 2 4 4 16 8

X Y 3 4 9 16 12
4 3 16 9 12
1 1
5 1 25 1 5
2 2
15 19 55 91 44
3 4
4 5
∑xy - (∑x) (∑y) 44 - (15) (19)
5 8
r= n = 5
∑x2 - (∑x)2 ∑y2 - (∑y)2 55 - (15)2 91 - (19)2
Neste caso, temos uma correlação positiva, √ n n √ 5 5
pois, ao aumentar o valor de X, Y tende a au-
mentar. Assim, para a utilização da fórmula, 44 - 285
r= 5 = 44 - 57
fazem-se necessários os seguintes cálculos in- 55 - 225 91 - 361 √ (55 - 45) (91 - 72,5)
termediários: √ 5 5

X Y X.2 Y2 X.Y r= 44 - 57 = - 13 = - 0,95


1 1 1 1 1 √ 10 . 18,5 √ 185
2 2 4 4 4
3 4 9 19 12 O coeficiente de correlação varia entre –1 e
4 5 16 25 20 +1, inclusive, isto é, -1 ≤ r ≤ +1. Se r as-
5 8 25 64 40 sume o valor 1, diz-se que as duas variáveis
15 20 55 110 77
têm correlação perfeita positiva e, se assume
o valor de –1, diz-se que as duas variáveis têm
correlação perfeita negativa. Se r assume o
∑xy - (∑x) (∑y) 77 - (15) (20)
r= n = 5
valor zero, não existe correlação entre as duas
∑x2 - (∑x)2 ∑y2 - (∑y)2 55 - (15)2 110 - (20)2 variáveis (a correlação é nula).
√ n n √ 5 5

77 - 300
r= 5 = 77 - 60 EXERCÍCIOS
55 - 225 110 - 400 √ 55 - 45 110 - 80
√ 5 5
1. Com os dados da tabela abaixo, que repre-
r = 77 - 60 = 17 = 0,98 senta o peso úmido e o peso seco, em gra-
√ 10 30 √ 300
mas, de lóbulos hepáticos de ratos, calcule
o coeficiente de correlação entre os dois
2. Dada a tabela ao lado, calcular o coeficien- pesos.
te de correlação entre as variáveis X e Y.
Peso úmido Peso seco
6,7 2
X Y
7,7 2,2
1 7
6,5 2
2 4
7,4 2,2
3 4
6,1 1,9
4 3
7,4 2,3
5 1

Neste caso, temos uma correlação negativa,


pois, ao aumentar o valor de X, Y tende a di-
2. Calcule o coeficiente de correlação para os
dados apresentados na tabela seguinte:
minuir. Assim, para a utilização da fórmula, Idade gestacional, em semanas, e peso ao
fazem-se necessários os seguintes cálculos nascer, em quilogramas de recém-nascidos.
intermediários:
41
3. Monte um diagrama de dispersão para as

capítulo 5
Idade gestacional Peso ao nascer
28 1,25 tabelas das questões anteriores.
32 1,25
35 1,75
38 2,25
39 3,25
41 3,25
42 4,25

Regressão
Gráfico de linhas
É possível observar a variação de uma variável em função da outra através do gráfico de linhas.
Para fazer o gráfico de linhas, primeiro se traça o sistema de eixos cartesianos. Depois se represen-
ta a variável explanatória no eixo das abscissas e a variável dependente no eixo das ordenadas.
Finalmente, considerando a ordem crescente de X, unem-se os pontos por segmentos de retas.

Exemplo: Idade Peso médio


Peso médio, em quilogramas, de indivíduos 3 14,6
de sexo masculino, segundo idade, no Dis- 4 16,3
trito Federal 5 17,8
6 19,8
7 21,6
8 23,8
9 26,3
10 28,4
11 30,9
12 34,2
13 38,7
14 43,4
15 49,7
16 52,7
17 57,3
18 58,1
19 59,4
42
Reta de Regressão
capítulo 5

Para expor a idéia de regressão, utilizaremos um exemplo apresentado na tabela seguinte, que
trata da quantidade de procaína hidrolisada, em 10 moles/litro, no plasma humano, em função
do tempo decorrido após sua administração.

Tempo Quantidade
(minutos) hidrolisada
2 3,5
3 5,7
5 9,9
8 16,3
10 19,3
12 25,7
14 28,2
15 32,6

Quantidade de procaína hidrolisada, em 10 moles/litro, no plasma humano, em função do tempo


decorrido após sua administração.

Perceba que os pontos estão praticamente so- ∑xy - (∑x) (∑y)


bre uma reta. Logo, esta correlação pode ser a = n
descrita através de uma reta, que, em estatísti- ∑x2 (∑x)2
ca, recebe o nome de reta de regressão. n
O coeficiente linear – que é a ordenada do
Para ajustar uma regressão linear simples (isto ponto onde a reta corta o eixo das ordenadas
é, a equação da reta), é preciso obter os co- – é obtido através da fórmula:
eficientes angular e linear da reta, sendo a b = y – ax
reta determinada por uma função de primeiro
grau, do tipo Y = aX + b, onde a é o coefi- onde y e x são as médias de Y e X, respectiva-
ciente angular, e b, o coeficiente linear. mente.

O coeficiente angular – que dá a inclinação da Tomemos como exemplo o caso da quantida-


reta – é obtido através da fórmula: de de procaína hidrolisada, em 10 moles/litro,
no plasma humano, em função do tempo de-
corrido após sua administração.
43
Os dois pares de valores (X=5 e Y=9,82) e

capítulo 5
Tempo (minutos) Quantidade hidrolisada
2 3,5 (X=15 e Y = 31,42) permitem traçar a reta
de regressão da correlação entre x e y. Tal reta
3 5,7
permite calcular os valores de Y para quais-
5 9,9
quer valores de X dentro do intervalo estuda-
8 16,3 do, mesmo que esses valores não entrem na
10 19,3 amostra.
12 25,7
14 28,2
15 32,6

Cálculos intermediários para obtenção de a e b.

x Y xy x.x
2 3,5 70 4
3 5,7 17,1 9
5 9,9 49,5 25
8 16,3 130,4 64
10 19,3 193 100
12 25,7 308,4 144
14 28,2 394,8 196
15 32,6 498 225
69 141,2 1589,2 767

Aplicando a fórmula, obtém-se:


EXERCÍCIOS
∑xy-(∑x)(∑y) 1589,2- 69 .141,2 1589,2- 9742,8
a= n =
∑x2 - (∑x)2 767 - (69)2
8 = 8
767 - 4761
1. Pesquise a altura e o peso de dez pesso-
n 8 8 as da sua convivência. Monte uma tabela
para o peso e outra para a altura dessas
a = 1589,2 - 1217,85 = 371,35 = 2,16 pessoas a partir de suas idades.
767 - 595 171,85

b = 141,2 - 2,16 . 69 = - 0,98 2. A partir da utilização da fórmula posta aci-


8 8 ma, descubra a equação da reta de regres-
são dos dados pesquisados.
Passando a ter a seguinte equação da reta:

Y = 2,16X – 0,98 3. Monte o gráfico de linha para cada equa-


ção montada.
Para traçar uma reta de regressão, é preciso
dar valores arbitrários para X e depois calcular
os valores de Y, por exemplo: Sites nos quais o aluno pode buscar textos
complementares, exercícios e aprofundar o es-
Para X = 5, temos: Y = 2,16 . 5 – 0,98 tudo dos temas abordados.
Y = 10,80 – 0,98
Y = 9,82 • http://ltodi.est.ips.pt/sardinha/siteBIOEST/
index.htm
Para X = 15, temos: Y = 2,16 . 15 – 0,98 Neste material, da Escola Superior de Saú-
Y = 32,4 – 0,98 de, o estudante encontra dicas e notas in-
Y = 31,42 teressantes para o estudo da bioestatística,
com apontamentos, exercícios, indicação
44
de bibliografia, sugestões de avaliações
capítulo 5

e trabalhos práticos, contendo, inclusive,


abordagem sobre o tema deste capítulo.

• http://www.ai.com.br/pessoal/indices/2A3.
HTM
Este site contém material completo para
todo um curso de estatística. Conceitos,
exemplos, exercícios, biblioteca virtual da
área, inclusive glossário dos temas abor-
dados e calculadora on-line. Bastante inte-
ressante para o estudante se aprofundar e
exercitar o tema deste capítulo.

• http://www.unb.br/ib/cfs/cg/Apostila%20I/
introducao.doc
Este material da UNB é um curso de Bio-
estatística, com linguagem voltada para a
área de Saúde e Biometria. Contém tópicos
desde os conceitos básicos até os conteú-
dos mais avançados, incluindo exemplo e
citando bibliografias importantes. Interes-
sante para os estudantes que pretendem
aprofundar seus conhecimentos.

Referências
IEZZI, G. et al. Fundamentos da Matemática.
Vol. 11. SP: Atual, 2004 .
Este é um livro técnico, porém traz boas di-
cas e exercícios para os temas abordados neste
capítulo. Muito bom para os estudantes apro-
fundarem seus conhecimentos.

CRESPO, A. A. Estatística Fácil. 17ª. Edição. SP:


Saraiva, 1999.
Apesar de técnico, este livro trabalha uma lin-
guagem bem didática para todos aqueles que
necessitam de domínio no trabalho com a Es-
tatística. Apresenta exemplos e exercícios bem
interessantes.

VIEIRA, S. Introdução à Bioestatística. 3ª. Edi-


ção. SP: Campus, 1980.
Um livro que pode ser consultado por você no
estudo deste capítulo e durante o referido curso.

PEREIRA, W. Estatística: Conceitos Básicos. 2ª.


Edição. SP: MC Graw Hill, 1990.
Esta obra ajuda o estudante a compreender
melhor os conceitos abordados neste capítulo
bem como se exercitar um pouco mais.

Você também pode gostar