Escolar Documentos
Profissional Documentos
Cultura Documentos
44 p.
Vice-Reitor
Prof. Rivaldo Mendes de Albuquerque
Pró-Reitor Administrativo
Prof. Maria Rozangela Ferreira Silva
Pró-Reitor de Planejamento
Prof. Béda Barkokébas Jr.
Pró-Reitor de Graduação
Profa. Izabel Christina de Avelar Silva
Coordenador Adjunto
Prof. Walmir Soares da Silva Júnior
Coordenação de Curso
Prof. José Souza Barros
Coordenação Pedagógica
Profa. Maria Vitória Ribas de Oliveira Lima
Gerente de Projetos
Profa. Patrícia Lídia do Couto Soares Lopes
Administração do Ambiente
José Alexandro Viana Fonseca
Equipe de Design
Anita Sousa/ Gabriela Castro/Renata Moraes/ Rodrigo Sotero
Coordenação de Suporte
Afonso Bione/ Wilma Sali
Prof. José Lopes Ferreira Júnior/ Valquíria de Oliveira Leal
Edição 2013
Impresso no Brasil
capítulo 1
Bioestatística
OBJETIVOS ESPECÍFICOS
• Compreender a natureza do trabalho esta-
tístico e sua origem como forma de apro-
priar-se da linguagem estatística;
A Significância e a
Abrangência da
Estatística
Os métodos estatísticos são usados hoje, em
quase todos os campos de investigação cientí-
fica, já que eles capacitam-nos para responder
a um vasto número de questões, tais como as
listadas abaixo:
capítulo 1
número, tal como uma média, uma por- de cada amostra de 1.000 bolas escolhidas da
centagem ou alguma outra medida apro- população. Pode ser que por uma grande casu-
priada, é calculada a partir dos dados, por alidade, o resultado daquela amostra que es-
meio de uma fórmula derivada, a partir de colhemos coincida exatamente com o valor da
algum princípio válido. proporção de bolas brancas em toda a popu-
lação. Mas as chances de que isso não ocorra
Estatística indutiva são muito grandes. Uma forma de contornar-
mos esse problema é afirmarmos que as chan-
A Estatística Indutiva, que é também freqüen- ces são de 95 em 100 (ou de 95 %) e de que
temente chamada de inferência estatística ou o intervalo formado pela proporção amostral
estatística inferencial, em contraste com a es- acrescida e diminuída de três pontos percentu-
tatística descritiva, é essencialmente analítica ais contenha o verdadeiro valor da proporção
em sua natureza. Consiste de um conjunto populacional desconhecido. Ou seja, construí-
de princípios ou teoremas que nos permitem mos um intervalo com limites 35 + 0,03 x 35
generalizar acerca de alguma característica de = 36,05 e 35 - 0,03 x 35 = 33,95 e afirmamos
uma “população” a partir das características (com base em algum princípio obtido a par-
observadas de uma “amostra”. Se uma me- tir da teoria estatística) que as chances são de
dida descritiva é calculada a partir dos dados 95 em 100 de que o verdadeiro valor da pro-
da população ela é chamada de parâmetro porção populacional esteja localizado dentro
populacional ou, simplesmente, parâmetro; se desse intervalo. Quando uma afirmativa dessa
é calculada a partir dos dados da amostra, é natureza é feita, estamos realizando o que se
chamada de estatística amostral ou, simples- chama de estimativa por intervalo.
mente, estatística. Considerando esses concei-
tos, podemos definir estatística indutiva como Quanto ao segundo procedimento da estatís-
o processo de generalizar acerca do valor de tica inferencial, deixaremos para comentá-lo,
um parâmetro a partir do valor de uma estatís- quando for abordado em sua íntegra. E o ter-
tica. Existem dois procedimentos de inferência ceiro campo de estudos da Estatística, a Teo-
distintos, mas relacionados: estimação e teste ria da Decisão Estatística, não será discutido
de hipóteses. Estimação é o processo de usar neste trabalho, voltado especificamente para
o valor de uma estatística amostral, para esti- abordagens em bioestatística. Por falar em
mar o valor de um parâmetro que é desconhe- bioestatística, temos que, nas áreas médicas
cido, mas é uma constante. Como exemplo, e biológicas, coletam-se dados de pessoas, de
suponhamos que temos uma população de animais experimentais e de fenômenos físicos
100.000 bolas de gude em um saco as quais e químicos, interessando aos pesquisadores
são idênticas exceto pela cor e que não pode- dessas áreas dados sobre mortalidade infantil,
mos vê-las, embora saibamos que uma parte eficiência de medicamentos, incidência de do-
delas é branca, e o restante, preto. Suponha enças, causas de morte etc. e, para isso, utili-
que desejamos ter uma idéia da proporção de, zamos a bioestatística, ou seja, a aplicação da
digamos, bolas brancas nessa população. Ima- estatística nas áreas de ciências biológicas e
gine que, para conseguir isso, selecionamos ciências da saúde.
1.000 bolas aleatoriamente do saco e verifica-
mos que 350 são brancas. Isso significa que Conceitos Fundamentais
nossa proporção amostral de bolas brancas é em Estatística e
35 %. A partir disso, concluímos que a propor- Bioestatística
ção populacional de bolas brancas é também
35 %. Fazendo isso, nós realizamos o que é Como toda ciência, a estatística e/ou a bio-
chamado de estatística pontual. estatística tem sua linguagem própria. E esta
linguagem deve ser absorvida pelo estudante
Mas afirmar que a proporção de bolas bran- como forma de melhorar a compreensão e as
cas em toda a população é exatamente igual à habilidades necessárias ao desenvolvimento da
proporção daquela amostra particular é como aprendizagem dessa disciplina. Esses conceitos
dar um tiro no escuro: o valor da proporção fundamentais referem-se à parte da estatística
amostral é um resultado aleatório e depende descritiva.
8
capítulo 1
População: conjunto de elementos que têm, procedimento: Como 900/50 = 18, escolhe-
em comum, determinada característica. As po- mos por sorteio casual um número de 01 a 18
pulações podem ser finitas, como o conjunto (inclusive), o qual indicaria o primeiro elemen-
de alunos de uma escola em determinado ano, to sorteado para a amostra; os demais elemen-
ou infinitas, como o número de vezes que se tos seriam periodicamente considerados de 18
pode jogar um dado. em 18. Assim, se o número sorteado fosse o
quatro, tomaríamos, pelo lado direito da rua,
Amostra: subconjunto finito de uma popula- o 4º prédio, o 22º, o 40º etc., até voltarmos ao
ção. O número de elementos de uma amostra início da rua, pelo lado esquerdo.
é menor que o da população.
Amostra estratificada - composta de elementos
Por ser uma amostra parte de uma população, provenientes de todos os estratos (subgrupos)
é fundamental que ela seja representativa, pois da população, utilizada sempre que a popu-
as conclusões dessas amostras serão, também, lação estiver dividida em subgrupos ou estra-
da população. Para seleção de uma amostra, tos, uma vez que a variável em estudo pode
existe uma técnica denominada de amostra- apresentar um comportamento diferente de
gem, que, mediante ela, é possível garantir o estrato para estrato. Exemplo: voltemos para
acaso na escola e assegurar à amostra a repre- o exemplo de uma amostra representativa de
sentatividade da população. 10% para a pesquisa da estatura de noventa
alunos de uma escola. Supondo que 54 sejam
Técnicas de amostragem: procedimento que meninos e 36 sejam meninas, vamos obter a
será adotado para escolher os elementos que amostra proporcional estratificada. São, por-
irão compor uma amostra. tanto, dois estratos (sexo masculino e sexo fe-
minino) e desejamos uma amostra de 10% da
Amostra casual simples (aleatória simples; ran- população. Logo, temos:
dômica; acidental) - por esse tipo de amostra-
gem, todos os elementos da população têm
SEXO POPULAÇÃO 10% AMOSTRA
igual possibilidade de serem selecionados para
constituir a amostra. Os elementos são retira- Masculino 54 10x54/100 = 5,4 5
dos ao acaso da população, através de sorteio.
Exemplo: Vamos obter uma amostra represen- Feminino 36 10x36/100 = 3,6 4
tativa de 10% para a pesquisa da estatura de
TOTAL 90 10x90/100 = 9,0 9
noventa alunos de uma escola:
capítulo 1
Variáveis - característica ou propriedade que gime particular de radioterapia. Identifique
será estudada ou observada na população. a população que interessa. É possível per-
ceber algum problema para amostrar essa
As variáveis podem ser de dois tipos: população?
1. quantitativas - quando exprimem conta-
gens, ou seja, quando os valores tomados
4. Para você, o que é coletar dados?
são numéricos. Exemplos: idade, altura,
temperatura, massa, número de filhos, nú- 5. Cite três atividades em que um biólogo faz
mero de irmãos etc. Podem ser classifica- uso da estatística.
das em:
6. Classifique as variáveis em qualitativas ou
1.1 discretas - variáveis, cujos valores po- quantitativas (contínuas ou descontínuas):
dem ser ordenados, de modo que, entre
dois valores consecutivos, não pode existir a) População: alunos de uma escola
nenhum outro, ou seja, essas variáveis só Variável: cor dos cabelos
podem assumir valores pertencentes a um
conjunto enumerável de elementos. Exem- b) População: casais residentes em uma
plos: gols de um jogo de futebol, idade em cidade
anos etc. Variável: número de filhos
capítulo 2
Coleta e Organização
de Dados
OBJETIVOS ESPECÍFICOS
• Conhecer os elementos constituintes de
uma tabela;
Introdução
Após um planejamento cuidadoso e a determi-
nação da população e/ou amostra a ser estu-
dada com suas variáveis, damos início à coleta
dos dados numéricos necessários a sua des-
crição. Esta coleta pode ser direta ou indireta.
Apresentação de Profissional
Outras
dados em tabelas
Ignorada
A tabela é um quadro, que resume um conjun-
to de observações. CORPO
29.601
As tabelas são compostas por: título; cabeça-
lho; corpo; colunas indicadoras e fonte. 2.604
7.965
• Título - explica o que a tabela contém ou 3.735
simplesmente indica o assunto da tabela. 1.959
1.103
• Cabeçalho - especifica o que cada coluna
contém.
FONTE
• Corpo - são os dados contidos nas linhas e
colunas da tabela. Fonte: MS/FIOCRUZ/SINITOX
• Colunas indicadoras - especificam os con- Toda tabela deve ser delimitada por traços ho-
teúdos das linhas. rizontais. Podem ser feitos traços verticais ape-
nas para separar as colunas, e não para delimi-
• Fonte - mostra de onde foram recolhidos tar a tabela. O cabeçalho é separado do corpo
os dados para organizar a tabela. Aparece, por um traço horizontal.
sempre, no rodapé da tabela.
Exemplo:
Exemplo: Casos registra- Causa Frequência
Casos registra- dos de intoxi-
Causa Frequência
dos de intoxi- cação humana, Acidente 29.601
Acidente 29.601
cação humana, segundo a cau- Abuso 2.604
segundo a cau- Abuso 2.604
sa determinan- Suicídio 7.965
sa determinan- Suicídio 7.965
te. Brasil, 1993. Profissional 3.735
te. Brasil, 1993 Profissional 3.735
Outras 1.959
Outras 1.959
Ignorada 1.103
Ignorada 1.103 Fonte: MS/FIOCRUZ/SINITOX
Fonte: MS/FIOCRUZ/SINITOX
13
capítulo 2
As tabelas podem apresentar, além das frequ- Ano de Sexo
ências, as frequências relativas ao total. Para Registro Masculino Feminino Total
obter a frequência relativa de uma dada catego-
1984 1.307.758 1.251.280 2.559.038
ria, divide-se a frequência dessa categoria pela
1985 1.339.059 1.280.545 2.619.604
soma das frequências. O resultado, que multi-
plicado por 100, é uma percentagem. O total 1986 1.418.050 1.351.203 2.779.253
da coluna é escrito entre dois traços horizontais. Fonte: IBGE (1988). Nota: Nascimentos ocorridos no ano de registro
Exemplo:
Acidente 29.601 63,29
Recém-nascidos, segundo a época do ataque
Abuso 2.604 5,69
de rubéola na gestante e a condição de normal
Suicídio 7.965 16,37 ou defeituoso.
Profissional 3.735 8,15
Época de Condição Total Frequência
Outras 1.959 4,2
Ataque Normal Defeituoso Relativa
Ignorada 1.103 2,3 Até o 3o mês de 36 14 50 28%
Total 45.974 100 Gestação
Fonte: MS/FIOCRUZ/SINITOX Depois do 3o 51 3 54 5,60%
As tabelas podem conter fontes e notas. A mês de Gestação
fonte indica a entidade do pesquisador ou dos Fonte: HILL (1958)
vamente públicas e particulares; e outros (inclui postos de saúde, centros de saúde e unidades
mistas), sendo 14393 públicos e 472 particulares. Represente essas informações em uma
tabela.
GRÁFICO DE BARRAS
Utilizado para apresentar variáveis qualitativas ou ordinais. Para fazer um gráfico de barras, pri-
meiro se traça o sistema de eixos cartesianos, depois se colocam, no eixo das abscissas, as cate-
gorias da variável em estudo. Em seguida, constroem-se barras retangulares, com base no eixo
das abscissas e altura igual à frequência ou a frequência relativa da respectiva categoria. As barras
devem ser desenhadas para ficar evidente que a variável é qualitativa ou ordinal.
Exemplo:
Internações em estabelecimentos de saúde, por espécie de clínica no Brasil - 1992.
Observação:
Atualmente os gráficos
de barra também podem
ser feitos na horizontal,
mantendo-se o nome de
gráfico de barras.
Internações em estabelecimentos
de saúde, por espécie de clínica
no Brasil - 1992
15
capítulo 2
Gráfico de setores
O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais. Para fazer
um gráfico de setores, a princípio, traça-se uma circunferência que possui uma divisão angular in-
terna de 360º. Essa circunferência representa o total, ou seja, 100%. Dentro dessa circunferência,
devem ser representadas as categorias da variável em estudo. Para isso, toma-se a frequência re-
lativa a cada categoria e calcula-se o ângulo central da seguinte maneira: se 100% correspondem
a 360º, uma categoria com frequência relativa de f%terá um ângulo central x, tal que:
100 360o
f Xo
Esse procedimento se repete para cada uma das categorias da variável em estudo. Para fazer o
gráfico de setores, marcam-se, na circunferência, os ângulos calculados, separando-os com o
traçado dos raios.
Exemplo:
Internações em estabelecimentos de saúde, por espécie de clínica no Brasil - 1992.
Observação:
ao se por rótulos de identificação em quadro, não se faz necessário repeti-los no gráfico.
EXERCÍCIO
1. Faça um gráfico de barras e um gráfico de setores para apresentar os dados da tabela seguinte:
Suicidas, segundo o sexo, Brasil, 1986.
16
capítulo 2
capítulo 3
Percentagens, Índices,
Coeficientes e Taxas
OBJETIVOS ESPECÍFICOS
• Compreender o significado de percenta-
gem;
INTRODUÇÃO
Os dados estatísticos resultantes da coleta di-
reta da fonte, sem outra manipulação se não
a contagem ou medida, são chamados da-
dos absolutos. A leitura dos dados absolutos
é sempre enfadonha e inexpressiva; embora
esses dados traduzam um resultado exato e
fiel, não tem a virtude de ressaltar de imediato
as suas conclusões numéricas. Daí o uso im-
prescindível que faz a estatística dos dados
relativos. Dados esses, que são resultados de
comparação por quociente (razões) que se
estabelecem entre dados absolutos e tem por
finalidade realçar ou facilitar as comparações
entre quantidades. Traduzem-se os dados re-
lativos, em geral, por meio de percentagens,
índices, coeficientes e taxas.
1. PERCENTAGENS
São razões que consistem em considerar um
total qualquer igual a 100% e, através de uma
18
regra de três, estabelecer qualquer relação b) o número inteiro máximo de quilos da
capítulo 3
com as parcelas que compõem o total assim: nova mistura que poderiam ser compra-
dos com a economia obtida em um dia e,
Total - 100% com esse número de quilos, quantos pães
Parcela - X% a mais poderiam ser fabricados por dia.
capítulo 3
dos obtidos nesta nova coluna. Esses valores
Matrículados nas Intituições de Ensino
da Cidade Z ano 2000 nos dizem que, cada 100 alunos da cidade Z,
91 estão matriculados no Ensino Fundamen-
Categorias Número de Alunos tal, 8, aproximadamente, no Ensino Médio e
(Dados Absolutos) 1 no Ensino Superior. Com isto, podemos ob-
Ensino servar que o emprego da percentagem é de
Fundamental 19286 grande valia quando é nosso intuito destacar
Ensino Médio 1681 a participação da parte no todo. Este estudo
Ensino Superior 234 comparativo pode ser muito útil na análise de
Total 21201
dados numa série estatística, como podemos
Fonte: Dados Fictícios
ver a seguir.
Observação: Comentários:
Do mesmo modo que tomamos 100 para a Os valores dessa nova coluna mostram como
base de comparação, também podemos to- evoluíram a produção em termos percentuais
mar outro número qualquer, como por exem- em relação ao ano1995 (base escolhida). Por
plo, 1 ou 1000 (base decimal). exemplo:
Segundo: Quando quisermos estudar a dinâ- • De 1995 para 1996 a produção cresceu
mica de um fato, ou seja, acompanhar a evolu- 12,5%.
ção de um fato ao longo do tempo, deveremos
estabelecer um período seja ano, mês, dia etc. • De 1995 para 1997 a produção cresceu
-, uma produção, uma renda etc. como sendo 5,0%.
a base, considerando-a como 100%.
• De 1995 para 1998 a produção também
Base Fixa cresceu 5,0%.
Anos Produção (t) Ano-base Variação • De 1995 para 1999 a produção foi a mes-
1995 Porcentual ma, ou seja, não evoluiu.
(%) com Relação
à Base (%)
• De 1995 para 2000 a produção decresceu
95 3200 100,0 - em -12,5%.
96 3600 112,5 + 12,5
97 3360 105,0 + 5,0
98 3360 105,0 + 5,0 • De 1995 para 2001 a produção cresceu
99 3200 100,0 0,0 7,5%
00 2800 87,0 - 12,5
01 3440 107,5 + 7,5
Base Móvel
capítulo 3
Anos Produção (t) Base Móvel Variações %
(%) com Relação decaiu em -12,5%
à Base
95 3200 - - • De 2000 para 2001 a produção evoluiu em
96 3600 112,5 + 12,5 22,9%.
97 3360 93,3 - 6,7
98 3360 100,0 0,0
99 3200 95,2 - 4,8
00
01
2800
3440
87,5
122,9
- 12,5
+ 22,9
2. Índices
De forma similar ao caso da base fixa, temos: “Em termos gerais, um número-índice pode
ser concebido como uma medida estatística
destinada a comparar, através de uma expres-
Base - 100%
são quantitativa global, grupos de variáveis
Valores - X%
relacionadas e com diferentes graus de im-
portância. Através dele obtém-se um quadro
Com isto:
resumido das mudanças ocorridas em áreas
( )
afins (TOLEDO e OVALLE, 1985, p. 311)”. Este
percentagem = Valores X 100
resumo dá uma visão geral do referido tema,
Base
que aqui será exposto apenas através das ex-
pressões quantitativas para um exercício de
Vejamos os cálculos:
configuração deste conteúdo.
95 Não existe dado anterior, por tanto
Uma definição deste tema é dizer que, índices
esse percentual é inexistente.
são razões entre duas grandezas tais que uma
96
( )3600
3200
X 100 = 112,5%
não inclui a outra (grandezas independentes).
EXERCÍCIO 3.3
IC
()
DT
DL
X 100
Onde:
1. Faça (continue) os cálculos para os anos: IC = Índice Cefálico
1998; 1999; 2000 e 2001. DT = Diâmetro Transverso do Crânio
DL = Diâmetro Longitudinal do Crânio
Comentários:
Os valores dessa nova coluna mostram como • QUOCIENTE INTELECTUAL
evoluem a produção de um ano para o outro.
Por exemplo:
Daí:
• CONSUMO PER CAPITA
Para manter o mesmo padrão a instituição ne-
()
cessitaria de:
CPC CB
P 100 - 30
220 - X
Onde:
CPC = Consumo “Per Capita” Resolvendo:
CB = Consumo do Bem X = 110 a instituição piorou, pois necessitaria
P = População de $10 a mais do que é hoje (1996) a sua ren-
da per capita.
• RENDA PER CAPITA
RDPC
()
Rd
P
3. Coeficientes
É a comparação entre duas grandezas em que
Onde: uma está contida na outra.
RDPC = Renda “Per Capita” São exemplos de coeficientes:
Rd = Renda
• COEFICIENTE DE NATALIDADE
P = População
Exemplo:
Uma instituição beneficente possuía em 1993
a quantia de $ 200.000 diários para atender a
()
CM = NO
PT
Onde:
4000 pessoas. Em 1996 a receita da instituição CM = Coeficiente de Mortalidade
é de $ 800.000 para atender a 8000 pessoas. NO = Número de Óbitos
Calcular a receita per capita da instituição e ve- PT = População Total
23
coeficientes educacionais • TAXA DE EVASÃO ESCOLAR - TEE
capítulo 3
• COEFICIENTE DE EVASÃO ESCOLAR TEE = CEE X 102
()
CEE = NE (ver o CEE na parte de Coeficientes)
NIM
Onde: • TAXA DE MORBIDADE - TMB
CEE = Coeficiente de Evasão Escolar
NE= Número de Alunos Evadidos Calculada para cada doença em particular,
NIM = Número Inicial de Matrícula aqui a tuberculose. Numa determinada cida-
de, relativa a um certo período (meses, ano,
• COEFICIENTE DE APROVAÇÃO ESCOLAR decênio, etc) Y.
Temos:
Onde:
()
CAE = NA
NFM TMB = CMB X 103
()
CRE = NR no município X, no ano Y
NAR PN = População do município X, no ano Y.
Onde:
CRE = Coeficiente de Recuperação Escolar • TAXA DE ACIDENTES DE TRABALHO
NR= Número de Alunos Recuperados
NAR = Número de Alunos em Recuperação Neste caso, ela se divide em duas partes:
I. Frequência da Taxa de Acidentes de Traba-
lho;
II. Gravidade da Taxa de Acidentes de Trabalho.
4. Taxas
Vejamos a primeira:
É a mesma coisa que coeficiente, apenas apre-
sentando-se multiplicada por uma potência de Onde: TfAT = CEE X 102
10 (dez) (10, 100, 1000 etc...) para tornar o
resultado mais inteligível, uma vez que sempre CfAT = Nac
especificamos os dados em formas relativas. NOH
Desse modo temos a expressão: Sendo:
CfAT = Coeficiente de Frequência dos Acidentes
Taxa = Coeficiente X 10n de Trabalho
com n = 1, 2, 3, ... Nac = Número de Acidentes
Exemplos de taxas: NOH = Número de Operários Hora
• TAXA DE MORTALIDADE - TM
Vejamos a segunda:
TM = CM X 103
TgAT = Cgat X 106
Onde:
(ver o CM na parte de Coeficientes)
CgAT = NHPA
NOH
• TAXA DE NATALIDADE - TN
Sendo:
CgAT = Coeficiente da Gravidade dos Acidentes
TN = CN X 103
de Trabalho
(ver o CN na parte de Coeficientes)
24
NHPA = Número de Horas Perdidas em razão onde:
capítulo 3
capítulo 3
Série e Turma 1OB 1OC 1OE 1OF Total
Tivemos 154 óbitos para cada 1000 habi- N de Alunos 30/03
o
49 49 47 47 192
tantes. No de Alunos 30/11 44 42 35 40 161
Promovidos sem
35 42 27 33 137
recuperação
Em recuperação 06 00 08 01 15
1. Considere a série estatística: Recuperados 05 00 03 00 08
Não recuperados 01 00 05 01 07
Séries Alunos Matriculados %
Total Promovidos 40 42 30 33 145
1a 546
Geral retidos 04 00 05 07 16
2a 328
3a 280 Calcule:
4 a
120 a) A taxa de evasão, por classe;
Total 1274 b) A taxa de evasão total;
Fonte: Dados Fictícios
c) A taxa de aprovação, por classe;
Complete-a, determinado as percentagens d) A taxa de aprovação geral;
com uma casa decimal e fazendo a com- e) A taxa de recuperação, por classe;
pensação (arredondamento), se necessá- f) A taxa de recuperação geral:
rio. Exemplos: g) A taxa de reprovação na recuperação
geral;
a) 32,4823% fica 32,5; h) A taxa de aprovação, sem recuperação;
b) 12,237% fica 12,2%; i) A taxa de retidos, sem recuperação.
c) 6,971% fica 7,0%;
d) 8,3452% fica 8,3%. 4. Cosiderando que em uma região temos os
seguintes dados:
2. Considere a tabela abaixo: População = 1784327 habitantes
Evolução das receitas do Café industrializa- Superfície = 137420 Km2
do de Janeiro até Abril do ano de 2002 Nascimentos em 1 ano = 42327 nascidos
vivos
Meses Valor (US$ milhões) %
Mortes em 1 ano = 16230 óbitos
janeiro 33,3
Calcular:
fevereiro 54,1
a) Coeficiente de natalidade e taxa de na-
março 44,5 talidade (por 1.000 hab.)
abril 52,9 b) Coeficiente de mortalidade e taxa de
Total 184,8 mortalidade (por 10.000 hab.)
Fonte: Dados Fictícios
c) Índice de densidade demográfica.
a) Complete-a com uma coluna de taxas 5. Uma cidade de 320000 habitantes apre-
percentuais. senta uma taxa de natalidade de 3,2% ao
b) Como se distribuem as receitas em re- ano e uma taxa de mortalidade de 27% ao
lação ao total? ano. Calcular o aumento da população em
c) Qual o desenvolvimento das receitas um ano.
de um mês para o outro?
d) Qual o desenvolvimento das receitas 6. Uma entidade assistencial em 1998 aten-
em relação ao mês de janeiro? dia 500 internos com uma verba de R$
200.000,00. Em 2003, os internos au-
3. Um professor preencheu um quadro, en- mentaram em 20%, enquanto que a verba
viado pela D.E, com os seguintes dados: aumentou 50%. Sabendo-se que o custo
26
de vida, pela desvalorização da moeda,
capítulo 3
Referência
CRESPO, Antônio Arnot. Estatística Fácil. 17a
edição, São PAulo, SP; Ed. Saraiva, 1999.
capítulo 4
DISTRIBUIÇÃO DE
FREQUÊNCIA
OBJETIVOS ESPECÍFICOS
• Conhecer os elementos constituintes de
uma tabela de frequência;
Introdução
A análise estatística se inicia quando um con-
junto de dados torna-se disponível de acordo
com a definição do problema da pesquisa. Um
conjunto de dados, seja de uma população ou
de uma amostra, contém, muitas vezes, um
número muito grande de valores. Além disso,
esses valores, na sua forma bruta, encontram-
se muito desorganizados. Eles variam de um
valor para outro, sem qualquer ordem ou pa-
drão. Os dados precisam, então, ser organiza-
dos e apresentados em uma forma sistemática
e seqüencial por meio de uma tabela ou gráfi-
co. Quando fazemos isso, as propriedades dos
dados tornam-se mais aparentes e tornamo-
nos capazes de determinar os métodos esta-
tísticos mais apropriados para serem aplicados
no seu estudo.
28
capítulo 4
1
Observe que os valores da última coluna (frequência relativa acumulada) podem ser calculados de duas maneiras. Na primeira, tal como é feito na tabela
a seguir, dividimos o valor da frequência absoluta acumulada pelo total de observações. Na segunda maneira, acumulamos o valor da frequência relativa.
Este último método pode levar a acúmulos de erros, de forma que o último valor de frequência relativa acumulado se distancie consideravelmente de 1.
29
capítulo 4
Histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento
da frequência acumulada. Na figura abaixo, a ogiva é mostrada em sobreposição ao histograma.
5 310 14 400
Até agora, vimos como são calculadas as fre-
6 340 15 371
quências (relativas e acumuladas) para variá-
veis quantitativas discretas. Nesse caso, a ta- 7 310 16 390
bulação dos resultados é mais simples. Mas, 8 340 17 400
quando tratamos de variáveis quantitativas
9 369 18 370
contínuas, os valores observados devem ser ta-
bulados em intervalos de classes. Para a deter-
minação dessas classes, não existe uma regra
pré-estabelecida, sendo necessário um pouco
de tentativa e erro para a solução mais ade- Devem ser seguidos alguns passos para a tabu-
quada. Suponhamos que as safras agrícolas de lação de frequências de dados que se referem
um determinado produto, em uma determina- a uma variável quantitativa contínua, como é o
da região, sejam dadas pela tabela a seguir: caso do nosso exemplo.
30
capítulo 4
capítulo 4
• http://www.unb.br/ib/cfs/cg/Apostila%20I/
são arterial, em milímetros de mercúrio, de introducao.doc
cães adultos anestesiados e após laparato- Esse material da UNB é um curso de Bio-
mia, encontraram os seguintes dados: estatística com linguagem voltada para a
130; 107,5; 135; 100; 134,5; 121,5; 107,5; área de Saúde e Biometria. Contém tópicos
105; 125; 130; 145; 158,5; 135; 140; 120; desde os conceitos básicos até os conte-
100; 135; 125; 110; 102; 121,5; 111,5; údos mais avançados, incluindo exemplo
107,5; 127,5; 104,5; 102,5; 119,5; 107,5; e citações de bibliografia importantes. In-
99; 120; 90,5; 101,5; 90,5; 115,5; 113; teressante para os estudantes que preten-
116; 143; 104,5; 102,5; 107,5; 125,5; 93; dem aprofundar seus conhecimentos.
82,5; 115; 136; 101,5; 124; 117,5; 103,5.
De posse desses dados, construa uma ta-
bela de distribuição de frequência. Referência
3. Faça um histograma e um polígono de fre- MILONE, G. e ANGELINI, F. Estatística Geral. SP:
Atlas, 1993.
quências para apresentar as informações
da tabela seguinte. Este livro é dirigido, em sua especificidade à
Estatística. O seu forte é uma linguagem clara
Cães adultos anestesiados e após dos conceitos trabalhados em Estatística.
laparotomia, segundo a pressão
arterial, em milímetros de mercúrio. CRESPO, A. A. Estatística Fácil. 17ª. Edição. SP:
Classe Ponto médio Frequência
Saraiva, 1999.
Apesar de técnico, este livro trabalha uma lin-
80 |--- 90 85 1
guagem bem didática para todos aqueles que
90 |---100 95 4
necessitam de domínio no trabalho com a Es-
100 |---110 105 16 tatística. Apresenta exemplos e exercícios bem
110 |---120 115 8 interessantes.
120 |---130 125 9
130 |---140 135 7 VIEIRA, S. Introdução à Bioestatística. 3ª. Edi-
140 |---150 145 3 ção. SP: Campus, 1980.
150 |---160 155 1
Um livro que pode ser consultado por você no
estudo deste capítulo e durante o referido curso.
• http://www.ufpa.br/dicas/biome/bioni.htm
Nesse material da Universidade Federal do
Pará, o estudante encontra dicas e notas
interessantes para todo estudo da bioes-
tatística, contendo inclusive, abordagem
sobre o tema deste capítulo.
• http://www.ai.com.br/pessoal/indices/2A3.
HTM
Esse site contém material completo para
um curso de estatística. Conceitos, exem-
plos, exercícios, biblioteca virtual da área,
inclusive glossário dos temas abordados e
calculadora on-line. Bastante interessante
para o estudante se aprofundar e exercitar
o tema deste capítulo.
33
capítulo 5
MEDIDAS DE TENDÊNCIA
CENTRAL E MEDIDAS DE
DISPERSÃO
OBJETIVOS ESPECÍFICOS
• Compreender o significado de medidas de
posição ou de tendência central;
INTRODUÇÃO
Em estatística, é comum analisarmos as ten-
dências que uma pesquisa revela. Para isso,
realizamos algumas medidas estatísticas.
Quando temos um conjunto de dados, pode-
mos identificar alguns de seus elementos, cuja
tendência é se posicionar em torno de valores
centrais desse conjunto. Por meio desses ele-
mentos, podemos analisar e interpretar dados.
das são a moda, a mediana e a média (aritmé- ordem crescente ou decrescente e tomamos os
tica e ponderada). termos centrais, obtendo a média aritmética
deles.
Moda (Mo) 1,85 1,85 1,95 1,98 1,98 1,98 2,01 2,01
Moda de um conjunto de valores é o elemento 2,04 2,07 2,07 2,07 2,07 2,10 2,13
que ocorre mais freqüentemente, dentro des- 2,18
se conjunto. A moda pode ser calculada para
qualquer tipo de variável. Sua função é possi- Neste caso, a mediana é 2,01 + 2,04 = 2,025
bilitar a percepção de uma forte tendência, de 2
uma preferência ou de uma rejeição evidente.
A mediana pode ser calculada para variáveis
Exemplo: qualitativas ordenáveis e para variáveis quan-
Em uma pesquisa para se saber o tipo sangüí- titativas. Uma das funções mais importantes
neo de uma certa população, obtiveram-se os da mediana é auxiliar a entender a razão pela
seguintes dados: 547 tipo O; 441 tipo A; 123 qual a média sofre variações acentuadas. Isso
tipo B; e 25 tipo AB. Neste caso, a moda é o porque uma discrepância na mediana interfere
tipo O. na média, fazendo com que ela aumente ou
diminua muito.
Mediana (Me)
Média aritmética ( X )
Mediana de um conjunto finito de valores, dis-
postos em ordem crescente ou decrescente de A média pode ser calculada apenas, se a va-
grandeza, é o valor central, se o conjunto tiver riável envolvida na pesquisa for quantitativa.
um número ímpar de elementos ou a média Utilizamos a média para observar o valor em
aritmética dos dois valores centrais, se o con- torno do qual os dados se distribuem. Ela é
junto tiver um número par de elementos. tanto mais representativa quanto menor for a
variação dos dados.
Exemplos:
1ª situação (número de termos ímpar) - Ao pes- Para obtermos a média aritmética de um con-
quisar o desenvolvimento da altura em atletas junto de dados numéricos, dividimos o so-
que praticam basquetebol, encontramos as se- matório de todos os termos e dividimos pelo
guintes medidas em centímetros: 2,07 ; 2,01; quantitativo dos termos.
1,85; 1,85; 1,98; 1,95; 1,98; 2,07; 2,07; 2,10;
2,13; 2,01; 2,18; 1,98; 2,07. Exemplo:
Em determinada pesquisa com ratos machos
Para encontrarmos a mediana, colocamos em da raça Wistar, foi verificado o peso deles em
ordem crescente ou decrescente e tomamos o gramas ao 30º dia de nascido, obtendo os se-
termo central. guintes valores: 50; 62; 70; 86; 60; 64; 66; 77;
58; 55; 82; e 74. Assim, para obtermos a mé-
1,85 1,85 1,95 1,98 1,98 1,98 2,01 dia aritmética, procedemos da seguinte forma:
2,01 2,07 2,07 2,07 2,07 2,10 2,13 X=50+62+70+86+60+64+66+77+58+55+82+74= 804=67
2,18 12 12
capítulo 5
sideremos, por exemplo, um grupo de pessoas 124; 117,5; 103,5.
com idades 2, 3, 2, 1, 2 e 50 anos. A média Determine a moda, a mediana e a média
de idade, que é 10 anos, não demonstra as ca- aritmética da pressão arterial, com os da-
racterísticas desse grupo em termos de idade. dos citados acima.
Média Aritmética 2. Determine a média aritmética ponderada
Ponderada das pressões arteriais, em milímetros de
mercúrio, representados na tabela a seguir.
Essa média é utilizada para representar classes, Cães adultos anestesiados e após laparotomia, segun-
como é o caso da distribuição de frequência. do a pressão arterial, em milímetros de mercúrio.
Tal média é obtida através do somatório dos Classe Ponto médio Frequência
produtos de cada termo pelas referidas frequ- 80 |--- 90 85 1
ências e dividido pelo total da frequência.
90 |---100 95 4
sal de 5 kg, mas a dispersão em torno da mé- de dispersão dos dados em torno da média.
dia não é a mesma para todas as cobaias. A
tabela anterior nos mostra que: Exemplo:
Considerando os dados da cobaia B, temos:
a) O emagrecimento da cobaia A não possui
variação mensal (dispersão nula). Média = 5 + 3 + 5 + 6 + 6 = 25 = 5
5 5
b) A dispersão mensal de emagrecimento da
cobaia B é menor que da cobaia C. Os desvios são os seguintes:
capítulo 5
4 cas de cada atleta. A partir desses dados,
que conselhos você daria ao coordenador
s2 = 6 = 1,5 para a escolha de um deles?
4
b) Qual dos atletas tem maior chance de
Desvio-padrão conseguir uma boa marca na competição?
Como medida de dispersão, a variância tem a c) A média é suficiente para apreciar as
desvantagem de apresentar unidade de medi- diferenças entre os atletas?
da igual ao quadrado da unidade de medida
dos dados. Por esse motivo, surgiu o desvio- d) Qual a diferença entre a melhor e a
padrão, definido como a raiz quadrada da va- pior marca do atleta A? E do atleta B?
riância, com sinal positivo, representado por s.
38 40 45 42 45 40 43 38
45 45 40 41 41 38 46 32
48 46 42 43 44 50 38 40
a) Organize esses dados numa tabela de
classes de amplitude 4 kg.
c) Qual é o desvio-padrão?
Correlação
Freqüentemente procura-se verificar se existe
relação entre duas ou mais variáveis. O peso
pode estar relacionado com a idade das pes- Correlação linear negativa
soas; o consumo das famílias pode estar re-
lacionado com sua renda, as vendas de uma
empresa, e os gastos promocionais podem
relacionar-se bem como a demanda de um de-
terminado produto e seu preço. A verificação
da existência e do grau de relação entre variá-
veis é objeto do estudo da correlação.
capítulo 5
2. Consumo individual diário de proteína de origem animal, em gramas, e coeficiente de natali-
dade, em 10 países.
País Consumo individual diário de proteínas Coeficiente de natalidade
Formosa 4,7 45,6
Malásia 7,5 39,7
Índia 8,7 33
Japão 9,7 27
Iugoslávia 11,2 25,9
Grécia 15,2 23,5
Itália 15,2 23,4
Bulgária 16,8 22,2
Alemanha 37,3 20
Irlanda 46,7 19,1
Coeficiente de Correlação
∑xy - (∑x) (∑y)
Existe uma medida para o grau de correlação r= n
entre duas variáveis. O instrumento de medi- ∑x2 - (∑x)2 ∑y2 – (∑y)2
da, no caso da correlação linear, é dado pelo √ n n
coeficiente de Pearson, que se representa por r
e é definido pela fórmula:
40
Exemplos:
capítulo 5
X Y X.2 Y2 X.Y
1. Calcular o coeficiente de correlação dos 1 7 1 49 7
dados da tabela seguinte: 2 4 4 16 8
X Y 3 4 9 16 12
4 3 16 9 12
1 1
5 1 25 1 5
2 2
15 19 55 91 44
3 4
4 5
∑xy - (∑x) (∑y) 44 - (15) (19)
5 8
r= n = 5
∑x2 - (∑x)2 ∑y2 - (∑y)2 55 - (15)2 91 - (19)2
Neste caso, temos uma correlação positiva, √ n n √ 5 5
pois, ao aumentar o valor de X, Y tende a au-
mentar. Assim, para a utilização da fórmula, 44 - 285
r= 5 = 44 - 57
fazem-se necessários os seguintes cálculos in- 55 - 225 91 - 361 √ (55 - 45) (91 - 72,5)
termediários: √ 5 5
77 - 300
r= 5 = 77 - 60 EXERCÍCIOS
55 - 225 110 - 400 √ 55 - 45 110 - 80
√ 5 5
1. Com os dados da tabela abaixo, que repre-
r = 77 - 60 = 17 = 0,98 senta o peso úmido e o peso seco, em gra-
√ 10 30 √ 300
mas, de lóbulos hepáticos de ratos, calcule
o coeficiente de correlação entre os dois
2. Dada a tabela ao lado, calcular o coeficien- pesos.
te de correlação entre as variáveis X e Y.
Peso úmido Peso seco
6,7 2
X Y
7,7 2,2
1 7
6,5 2
2 4
7,4 2,2
3 4
6,1 1,9
4 3
7,4 2,3
5 1
capítulo 5
Idade gestacional Peso ao nascer
28 1,25 tabelas das questões anteriores.
32 1,25
35 1,75
38 2,25
39 3,25
41 3,25
42 4,25
Regressão
Gráfico de linhas
É possível observar a variação de uma variável em função da outra através do gráfico de linhas.
Para fazer o gráfico de linhas, primeiro se traça o sistema de eixos cartesianos. Depois se represen-
ta a variável explanatória no eixo das abscissas e a variável dependente no eixo das ordenadas.
Finalmente, considerando a ordem crescente de X, unem-se os pontos por segmentos de retas.
Para expor a idéia de regressão, utilizaremos um exemplo apresentado na tabela seguinte, que
trata da quantidade de procaína hidrolisada, em 10 moles/litro, no plasma humano, em função
do tempo decorrido após sua administração.
Tempo Quantidade
(minutos) hidrolisada
2 3,5
3 5,7
5 9,9
8 16,3
10 19,3
12 25,7
14 28,2
15 32,6
capítulo 5
Tempo (minutos) Quantidade hidrolisada
2 3,5 (X=15 e Y = 31,42) permitem traçar a reta
de regressão da correlação entre x e y. Tal reta
3 5,7
permite calcular os valores de Y para quais-
5 9,9
quer valores de X dentro do intervalo estuda-
8 16,3 do, mesmo que esses valores não entrem na
10 19,3 amostra.
12 25,7
14 28,2
15 32,6
x Y xy x.x
2 3,5 70 4
3 5,7 17,1 9
5 9,9 49,5 25
8 16,3 130,4 64
10 19,3 193 100
12 25,7 308,4 144
14 28,2 394,8 196
15 32,6 498 225
69 141,2 1589,2 767
• http://www.unb.br/ib/cfs/cg/Apostila%20I/
introducao.doc
Este material da UNB é um curso de Bio-
estatística, com linguagem voltada para a
área de Saúde e Biometria. Contém tópicos
desde os conceitos básicos até os conteú-
dos mais avançados, incluindo exemplo e
citando bibliografias importantes. Interes-
sante para os estudantes que pretendem
aprofundar seus conhecimentos.
Referências
IEZZI, G. et al. Fundamentos da Matemática.
Vol. 11. SP: Atual, 2004 .
Este é um livro técnico, porém traz boas di-
cas e exercícios para os temas abordados neste
capítulo. Muito bom para os estudantes apro-
fundarem seus conhecimentos.