Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução à Estatística
1.1. Entendendo a importância da Estatística
Jornais, televisão, rádio, revistas e outros meios de comunicação nos bombardeiam, diariamente, com notícias,
baseadas em estatísticas, como se fossem verdades absolutas. Nessa hora, provavelmente, você sente a importância
de ser capaz de avaliar corretamente o que lhe dizem. Todavia, será que os números apresentados resultam de uma
análise estatística cuidadosa? O perigo está no fato de que, se não consegue distinguir as afirmações falsas das
verdadeiras, então você está vulnerável à manipulação por outras pessoas, cujas conclusões podem conduzir você
para decidir contra os interesses seus e, depois, arrepender-se. Por estas razões, conhecer Estatística é um grande
passo no sentido de você tomar controle da sua vida (embora não seja, obviamente, a única maneira necessária para
esta finalidade).
Observe os seguintes exemplos de afirmações recentemente publicadas em dez meios de comunicação (não
estou dizendo que cada uma delas seja verdadeira).
Sua expectativa é de que a inflação feche o ano entre 6% e 7%. (Folha de São Paulo, Dinheiro, 16 de maio de
2005)
Atualmente, a taxa de pacientes com câncer de pulmão que não apresentam reincidência depois de cinco anos
de tratamento é de 17% – um avanço de 70% em relação à década de 70. (Revista Veja, edição 1905, 18 de
maio de 2005)
As projeções de mercado para o IPCA de 2005 subiram de 6,30% para 6,39% em pesquisa semanal feita pelo
Banco Central e divulgada hoje. (O Estado de São Paulo, 16 de maio de 2005)
Um estudo da Corporate Executive Board mostrou que a produtividade de um funcionário brilhante chega a ser
até 12 vezes superior à do colega mediano. (Revista Exame, edição 841, 27 de abril de 2005)
De acordo com a Embratur (Empresa Brasileira de Turismo), a companhia aérea trouxe 1.473.183 dos
6.138.000 passageiros que entraram no país no ano passado, o equivalente a 24% desses passageiros.
(Revista Aeromagazine, Notícias, 16 de maio de 2005)
IBGE: Emprego industrial cai 0,2% em março. (JB Online, 16 de maio de 2005)
Os investidores que colocam todo seu dinheiro em uma única ação estão elevando em mais de 50% a chance
de queda do poder de compra de seu investimento em um período de 20 anos, aponta o estudo. (JB Online, 17
de abril de 2005)
Nordestinos já são 52,6% dos migrantes. (Jornal O Globo, 16 de maio de 2005)
Comércio varejista cresce 1,75% em volume de vendas e 2,44% em receita nominal. (IBGE, 12 de maio de
2005)
Se a vítima não fosse o prefeito de Santo André, o impacto não seria o mesmo e o caso teria sido tratado
como mera estatística. (Márcio Coimbra em http://www.ambito-juridico.com.br/aj/cron0237.htm)
Todas essas notícias são, na sua essência, Estatística. Elas parecem familiares, embora os exemplos sejam
de áreas bastante distintas: economia, medicina, gestão, turismo, social, investimentos, comércio e até política. Em
resumo, os números (também expressos por meio de tabelas e gráficos) e a interpretação deles surgem nos discursos
de praticamente todo aspecto da vida contemporânea.
Desse modo, as estatísticas são, freqüentemente, apresentadas como um testemunho de credibilidade a um
argumento ou a uma recomendação, fato que você pode comprovar ouvindo o veiculado nos meios de comunicação: o
primeiro pensamento é acreditar na notícia como se fosse verdade absoluta. Recorde-se, então, do ex-primeiro-ministro
britânico Benjamin Disraeli (1804-1881), quando afirmou que “Há três espécies de mentiras: mentiras, mentiras
deslavadas e estatísticas”.
No entanto, Estatística é método, ciência e arte. É método quando, na Física, na Biologia, na Medicina ou na
Pedagogia, aplica-se a populações específicas, isto é, serve a uma ciência particular, da qual se torna instrumento. É
ciência quando, graças às suas teorias, estuda grandes conjuntos, independentemente da natureza destes, sendo
autônoma e universal. Finalmente, é arte na construção de modelos para representar a realidade.
Assim sendo, nem tudo está perdido, porque a Estatística pode ajudar você a reagir de modo inteligente às
informações que lê ou escuta e, neste sentido, torna-se um dos mais importantes assuntos que provavelmente estudou.
O presente artigo tem o objetivo de motivar você a ser mais um dos consumidores inteligentes de estatísticas e, para
ser um deles, o primeiro passo é refletir e começar a questionar aquelas que encontrar. Por esta razão, convido você a
reformar os seus hábitos estatísticos a partir de agora. Simplesmente, não mais aceite números, tabelas, gráficos e
conclusões. Ao invés disso, comece a pensar nas fontes de informação e, mais importante, nos procedimentos usados
para gerar essa informação. Defenda-se contra afirmações falsas, embrulhadas como se fossem estatísticas. Aprenda a
reconhecer se uma evidência estatística apóia, realmente, uma conclusão apresentada.
A Estatística está toda ela em volta de você, algumas vezes usada de modo adequado, outras vezes não.
Como o objetivo da Estatística é auxiliar a sua tomada de decisões em situações de incerteza, distinguir as boas das
más estatísticas é mais do que nunca, um dever, uma obrigação.
Exemplo:
Ao chegarmos a uma churrascaria, não precisamos comer todos os tipos de saladas, de sobremesas e de
carnes disponíveis, para conseguirmos chegar a conclusão de que a comida é de boa qualidade. Basta que seja
provado um tipo de cada opção para concluirmos que estamos sendo bem servidos e que a comida está dentro dos
padrões.
Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.
O método estatístico, diante da impossibilidade de manter as causas constantes, adimite todas essas
causas presentes variando-as, registrando esses variações e procurando determinar, no resultado final, que
influências cabem a cada uma delas.
1.3. A Estatística
Exprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma
característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados
referentes a esses elementos.
Podemos dizer, então, que:
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a
análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.
Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição
dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.), desconhecendo que o
aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que
transcedam os dados obtidos inicialmente.
Assim, a análise e interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por
exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a
formulação de soluções apropriadas e um planejamento objetivo de ação.
c) ocasional – quando feita exporadicamente, a fim de atender a uma conjuntura ou a uma emergência,
como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de
outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a
mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.
Como os próprios pais é que decidiram se seriam incluídos na pesquisa, temos um exemplo de pesquisa auto-
selecionada, ou seja, uma pesquisa em que os próprios entrevistados decidem se serão incluídos.
Outros exemplos:
1. Para determinar a reação do público à continuação de certo programa governamental, o pesquisador pergunta: “Acha
que este programa dispendioso deve ser interrompido?” Explique por que esta pergunta provavelmente não
proporcionará a informação desejada.
Resposta: Ao formular a questão, o entrevistador está de fato, sugerindo que o programa é dispendioso.
2. Para estudar a reação do consumidor a um novo tipo de alimento enlatado, faz-se uma pesquisa de casa em casa
durante as manhãs dos dias úteis, sem plano de voltar no caso de não ser encontrado ninguém em casa. Explique por
que esta abordagem pode conduzir a uma informação enganadora.
Resposta: Esta pesquisa não atinge os que têm maior probabilidade de usar o produto, pessoas solteiras ou casais em
que ambos trabalham fora.
3. Uma estatística enganosa pode resultar, também da formulação de perguntas no lugar errado ou no momento
errado. Explique por que, no caso seguinte, poderemos obter dados inúteis. Para predizer uma eleição, um pesquisar
entrevista pessoas que saem do edifício onde está a sede nacional de um partido político.
Resposta: As pessoas que saem de um edifício onde está a sede de um partido político provavelmente são filiadas ao
partido.
4. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo contactar por telefone 1500
consumidores. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra?
Resposta: Excluem-se as pessoas com números não listados e pessoas sem telefone.
5. A revista Glamour publicou o seguinte resultado de uma pesquisa: “79% dos que responderam à nossa pesquisa de
agosto afirmaram crer que os americanos se tornaram demasiadamente propensos a apelar para a justiça em casos
corriqueiros”. A questão foi publicada na revista e os leitores podiam responder por correio, fax ou e-mail
(tellus@galamour.com). Até que ponto é válido o resultado de 79%.
Resposta: Como os pesquisados são auto-selecionados, os resultados da pesquisa não são válidos.
6. “De acordo com uma pesquisa de âmbito nacional feita por 250 agências de empregos, os sapatos gastos constituem
o motivo mais comum para que um homem que procura emprego não cause boa impressão à primeira vista.” Os jornais
apresentaram essa alegação com base em uma pesquisa encomendada pela Kiwi Brands, produtores de graxa para
sapatos. Faça um comentário sobre a razão por que os resultados de tal pesquisa podem ser questionados.
Resposta: Um fabricante de graxa para sapatos obviamente tem interesse na importância do seu produto, e há muitas
maneiras de este fato afetar os resultados da pesquisa.
7. O jornal Newport Chronicle afirma que as mães grávidas podem aumentar suas chances de ter uma criança sadia
comendo lagostas. A alegação se baseia em um estudo mostrando que as crianças nascidas de mães que comem
lagostas têm menos problemas de saúde do que as nascidas de mães que não comem lagostas.
Resposta: Mães que comem lagostas tendem a ser mais ricas e portanto podem pagar por melhor atendimento médico.
2. População e Amostra
2.1. Variáveis
A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:
para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino;
para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números
naturais: 0, 1, 2, 3, ..., n;
para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito
de valores numéricos dentro de um determinado intervalo.
Todos os elementos do grupo a ser estudado constituem a população. A parte da população efetivamente
examinada é a amostra.
Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de 800 (oitocentas) pessoas. Nesse
caso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar os
oitocentos elementos, podemos recorrer a amostragem, ou seja, podemos examinar alguns desses elementos.
É claro que se escolhermos apenas dois desses oitocentos elementos, corremos o risco de selecionar
exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemos
concluir que todos elementos da população também o são.
Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a conclusões erradas, mas
este risco diminui à medida qua aumenta a quantidade de elementos a serem examinados.
Devemos estabelecer um número mínimo de elementos para compor a amostra. Essa quantidade não deve
ser menor que 10% do total de elementos da população. Assim, estaremos minimizando as chances das
informações da amostra se afastarem demasiadamente daquelas que obteríamos se examinássemos toda a população.
No exemplo citado anteriormente, como a população tem 800 elementos, devemos escolher uma amostra com,
no mínimo, 80 pessoas (10% de 800).
Podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemática
e amostragem estratificada proporcional.
× 36 = 3,6
10
F 36 4
100
× 90 = 9,0
10
Total 90 9
100
EXERCÍCIOS:
Série Aula:
1) Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas):
a) Universo: alunos de uma escola.
Variável: cor dos cabelos – ....................................
b) Universo: casais residentes em uma cidade.
Variável: número de filhos – ....................................
c) Universo: as jogadas de um dado.
Variável: o ponto obtido em cada jogada – ....................................
d) Universo: peças produzidas por certa máquina.
Variável: nº de peças produzidas por hora – ....................................
e) Universo: peças produzidas por certa máquina.
Variável: diâmetro externo – ....................................
f) População: alunos de uma escola.
Variável: cor dos olhos – ....................................
g) P.: casais residentes em uma cidade.
V.: sexo dos filhos – ....................................
3) Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 150 estudantes, entre
os 1.000 matriculados. Responda:
a) Qual é a população envolvida na pesquisa?
b) Que tipo de amostragem foi utilizada e qual é a amostra considerada?
4) A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da cidade de Morro
Grande é apresentada abaixo. Baseando-se nesses dados, estratifique uma amostra com 200 elementos.
Escola População
A 500
B 250
C 440
D 360
Total 1.550
5) Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª série, 30 na 3ª série, 28 na 4ª série, 35 na 5ª
série, 32 na 6ª série, 31 na 7ª série e 27 na 8ª série. Obtenha uma amostra de 40 alunos preenchendo a tabela abaixo.
3ª __ = __
4ª 28 = __
5ª __ = 6
6ª __ = __
7ª __ = __
8ª __ = __
Total 250 40
6) Uma cidade X apresenta o seguinte quadro relativo às escolas de Ensino Fundamental. Obtenha uma amostra
estratificada proporcional de 120 estudantes.
Nº de Estudantes
Escolas
Masculino Feminino
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total 876 955
Série Casa:
1) População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer;
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de indivíduo de mesmo município, estado ou país.
3) A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem
tirar conclusões sobre um grupo maior denomina-se:
a) Estatística de População;
b) Estatística de Amostra;
c) Estatística Inferencial;
d) Estatística Descritiva;
e) Estatística Grupal.
c) Peso de um indivíduo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
d) Altura de um indivíduo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
f) Tipo sanguíneo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
6) Na Escola São Miguel, as classes têm 20, 40, 25 e 15 alunos. Determine uma amostra estratificada com 20
elementos.
7) Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por tipo de lazer entre
pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a) Qual a população envolvida na pesquisa?
b) Supondo que na cidade haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200
pessoas.
8) Quer fazer-se um estudo que estabeleça a relação entre faixa salarial e interesse por teatro, tomando-se um grupo
de 1.550 pessoas. A tabela abaixo indica o número de pessoas de determinadas faixas salariais. Determine uma
amostra com 200 elementos.
3. Séries Estatísticas
3.1. Tabelas
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que
tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando
esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em
estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.
Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: o
tempo, o espaço e a espécie.
Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica.
Exemplo:
Exemplo:
Exemplo:
Exemplo:
A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico-
histórica ou geográfico-temporal.
Podem existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três ou
mais entradas.
Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados
absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades.
Traduzem-se os dados relativos, em geral, por meio de porcentagens, índices, coeficientes e taxas.
3.3.1. As Porcentagens
Considere a série:
Com esses dados, podemos formar uma nova coluna na série em estudo:
Os valores dessa nova coluna nos diz que, de cada 100 alunos da cidade A, 91 estão matriculados no 1º grau,
8, aproximadamente, no 2º grau e 1 no 3º grau.
O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo.
Considere, agora, a série:
Qual das cidades tem, comparativamente, maior número de alunos em cada grau?
Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados
absolutos. Porém, usando as porcentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterior
as colunas correspondentes às poscentagens, obtemos:
o que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo número de alunos em cada grau.
3.3.2. Os Índices
Os índices são razões entre duas grandezas tais que uma não inclui a outra.
× 100
diâmetro transverso do crânio
Índice cefálico =
diâmetro longitudinal do crânio
× 100
idade mental
Quociente intelectual =
idade crônica
população
Densidade demográfica =
superfície
Índices econômicos:
valor total da produção
Produção per capita =
população
consumo do bem
Consumo per capita =
população
renda
Renda per capita =
população
receita
Receita per capita =
população
3.3.3. Os Coeficientes
Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e número
de não-ocorrências).
número de nascimentos
Coeficiente de natalidade =
população total
número de óbitos
Coeficiente de mortalidade =
população total
Coeficiente educacionais:
número de alunos evadidos
Coeficiente de evasão escolar =
número inicial de matrículas
número de alunos aprovados
Coeficiente de aproveitamento escolar =
número final de matrículas
número de alunos recuperados
Coeficiente de recuperação escolar =
número de alunos em recuparação
3.3.4. As Taxas
As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc.) para tornar o
resultado mais inteligível.
EXERCÍCIOS:
Série Aula:
1) Clasifique as séries:
a)
PRODUÇÃO DE BORRACHA NATURAL – 1991-93
Anos Toneladas
1991 29.543
1992 30.712
1993 40.663
FONTE: IBGE.
b)
AVICULTURA BRASILEIRA – 1992
Número
Espécies
(1.000 cabeças)
Galinhas 204.160
Galos, frangos, frangas e pintos 435.465
Codornas 2.488
FONTE: IBGE.
c)
VACINAÇÃO CONTRA A POLIOMIELITE – 1993
Regiões Quantidade
Norte 211.209
Nordeste 631.040
Sudeste 1.119.708
Sul 418.785
Centro-Oeste 185.823
FONTE: Ministério da Saúde.
d)
2) A tabela seguinte foi elaborada a partir da leitura do texto de Philip M. Fearnsinde, do Instituto Nacional da Amazônia.
DESMATAMENTO EM RONDÔNIA
Regiões 1975 1978 1980 1983
Área (km2) 1.216,5 4.184,5 7.579,3 13.955,2
% 0,5 1,72 3,12 5,74
FONTE: Revista Ciência Hoje, nº 19.
a) Que tipo de fonte (primária ou secundária) foi consultada para a elaboração da tabela?
b) Que tipo de série está representada na tabela?
7) Uma escola registrou em março, na 1ª série, a matrícula de 40 alunos e a matrícula efetiva, em dezembro, de 35
alunos. A taxa de evasão foi de:
Dados Relativos
Escolas Nº de Alunos
Por 1 Por 100
A 175 0,098 9,8 Cálculos:
A→ × 1 = 0,098
B 222 _____ _____ 175
C 202 _____ _____ 1.781
D 362 _____ _____
E 280 _____ _____
F 540 _____ _____
Total 1.781 1,000 100,0
9) São Paulo tinha, em 1992, uma população de 32.182,7 mil habitantes. Sabendo que sua área terrestre é de
248.256 km2, calcule a sua densidade demográfica.
10) Um professor preencheu um quadro, enviado pela D.E., com os seguintes dados:
Nº de Nº de Promovidos Em Total Geral
Retidos sem Não-
Série Alunos Alunos sem recuperaçã Recuperados Promovido
recuperação recuperados Retidos
30/03 30/11 recuperação o s
1º A 49 44 35 03 06 05 01 40 04
1º B 49 42 42 00 00 00 00 42 00
1º C 47 35 27 00 08 03 05 30 05
1º D 47 40 33 06 01 00 01 33 07
Total 192 161 137 09 15 08 07 145 16
Calcule:
a) a taxa de evasão, por classe.
b) a taxa de evasão total.
c) a taxa de aprovação, por classe.
d) a taxa de aprovação geral.
e) a taxa de recuperação, por classe.
f) a taxa de recuperação geral.
g) a taxa de reprovação na recuperação geral.
h) a taxa de aprovação, sem a recuperação.
i) a taxa de retidos, sem a recuperação.
Série Casa:
1) Calcule a taxa de aprovação de um professor de uma classe de 45 alunos, sabendo que obtiveram aprovação de 36
alunos.
2) Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):
população: 15.957,6 mil habitantes;
superfície: 586.624 km2;
nascimentos: 292.036;
óbitos: 99.281.
Calcule:
a) o índice de densidade demográfica;
b) a taxa de natalidade;
c) a taxa de mortalidade.
4. Distribuição de Frequência
Praticamente se resume na maneira de ordenar os dados estatísticos em linhas ou colunas, tornando possível
sua leitura, tanto no sentido horizontal quanto no vertical.
A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela
primitiva.
A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente).
A tabela obtida após a ordenação dos dados recebe o nome de rol.
Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a
amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no
conjunto. Com um exame mais acurado, vemos qua há uma concentração das estaturas em algum valor entre 160 cm e
165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm.
Este tipo de tabela não é aconselhavel quando estamos trabalhando com amostragens grandes, sendo que
poderá ficar muito extensa, dificultando, além de sua elaboração, as análises e conclusões dos dados pesquisados.
Sendo possível, a solução mais aceitável é o agrupamento dos valores em vários intervalos.
Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da
tabela acima, podem ser dispostos como na tabela abaixo, denominada distribuição de frequência com intervalo de
classe:
h = Lf – Li
n = 1 + 3,3 . log N
onde,
n = número de classes
N = número de dados (observações) a distribuir
Outra maneira de estipular o número de classes é empregando a seguinte relação (conhecendo a amplitude):
At
n=
h
∑Fi = N
cada classe. Assim, a soma das freqüências simples é igual ao número total dos dados:
Freqüências simples relativas (fi) são os valores das razões entre freqüências simples e a freqüência total:
fi =
Fi
∑ Fi
Freqüência acumulada (Fa) é o total das freqüências de todos os valores inferiores ao limite superior do
intervalo de uma dada classe:
Fa = ∑ Fi (i = 1, 2, ..., k)
Freqüência acumulada relativa (fa) são os valores das razões entre freqüências simples e a freqüência total:
fa =
Fa
∑ Fi
Considerando a tabela do exemplo anterior (item 4.2), podemos montar a seguinte tabela com as frequências
estudadas:
ESTATURA DE 40 ALUNOS DO COLÉGIO A
Estaturas
i Fi Pm fi Fa fa
(cm)
1 150 |–– 154 4 152 0,100 4 0,100
2 154 |–– 158 9 156 0,225 13 0,325
3 158 |–– 162 11 160 0,275 24 0,600
4 162 |–– 166 8 164 0,200 32 0,800
5 166 |–– 170 5 168 0,125 37 0,925
∑ = 40 ∑ = 1,000
6 170 |–– 174 3 172 0,075 40 1,000
Total
xi Fi
x1 F1
x2 F2
x3 F3
F4
…
Σ Fi = N
xN F5
Exemplo:
Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:
i xi Fi
1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
Σ = 20
6 7 1
∑ = 20 ∑ = 1,00
6 7 1 20 0,05 1,00
EXERCÍCIOS:
Série Aula:
1) As notas obtidas por 50 alunos de uma classe foram:
1 2 3 4 5 6 6 7 7 8
2 3 3 4 5 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9
i Notas Pm Fi
1 0 |–– 2 1 1
2 2 |–– 4 ___ ___
3 4 |–– 6 ___ ___
4 6 |–– 8 ___ ___
∑ = 50
5 8 |–– 10 ___ ___
∑ = 40 ∑ = 100 %
5 32 |–– 40 3 ___ ___ ___
i xi Fi Fa fi (%) fa (%)
1 0 1 ___ 5,0 ___
2 1 ___ 4 15,0 ___
3 2 4 ___ ___ ___
4 3 ___ 13 25,0 ___
5 4 3 ___ 15,0 ___
6 5 2 18 ___ ___
7 6 ___ 19 ___ ___
∑ = 20 ∑ = 100 %
8 7 ___ ___ ___ ___
4) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes:
Áreas
300 |–– 400 |–– 500 |–– 600 |–– 700 |–– 800 |–– 900 |–– 1.000 |–– 1.100 |–– 1.200
(m2)
Nº de
14 46 58 76 68 62 48 22 6
Lotes
Série Casa:
1) Complete a distribuição abaixo, determinando as frequências absolutas:
i xi Fi Fa
1 2 ___ 2
2 3 ___ 9
3 4 ___ 21
4 5 ___ 29
∑ = 34
5 6 ___ 34
2) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus:
Nº de acidentes 0 1 2 3 4 5 6 7
Nº de motoristas 20 10 16 9 6 5 3 1
Determine:
a) o número de motoristas que não sofreram nenhum acidente;
b) o número de motoristas que sofreram pelo menos 4 acidentes;
∑ = ___ ∑ = ___
8 14 |–– 16 ___ ___ ___ 7,0 ___
obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.
5) As notas obtidas em Matemática por 80 estudantes de uma escola X estão relacionadas abaixo:
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
a) Organize o rol colocando os dados em ordem crescente.
b) Qual é a menor nota? Qual é a maior nota?
c) Qual é a amplitude total?
d) Qual é a nota do estudante classificado em 10º lugar?
e) Organize os dados em classes considerando 5 como amplitude.
f) Faça a distribuição de freqüências.
g) Quantos estudantes receberam nota superior ou igual a 85? Qual a porcentagem?
7) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição de freqüência abaixo:
Duração Nº de
(em horas) lâmpadas
300 |–– 400 14
400 |–– 500 46
500 |–– 600 58
600 |–– 700 76
700 |–– 800 68
800 |–– 900 62
900 |–– 1.000 48
1.000 |–– 1.100 22
∑ = 400
1.100 |–– 1.200 6
Total
5. Gráficos Estatísticos
5.1. Representação Gráfica
Os gráficos constituem um poderoso instrumento de análise e interpretação de um conjunto de dados. Eles
aparecem nos mais variados veículos de comunicação. Pesquisas de opinião pública, pesquisas eleitorais, economia,
agricultura, saúde são apenas alguns exemplos de assuntos em que as representações gráficas assumem um papel
fundamental para explicar o comportamento do objeto de estudo. Os mais importantes recursos fornecidos pelos
gráficos são a facilidade e a rapidez na absorção e interpretação dos resultados, por parte do leitor.
Exemplo:
Na cidade de São Joaquim (SC), foi anotada a temperatura registrada às 8 horas, durante sete dias
consecutivos, conforme a seguinte tabela:
TEMPERATURA NA CIDADE
DE SÃO JOAQUIM – SC
Dia Temperatura (ºC)
1º 1
2º –2
3º –3
4º 4
5º 5
6º 6
7º 7
Solução:
8
7
6
5
Temperatura (ºC)
4
3
2
1
0
-1 1º 2º 3º 4º 5º 6º 7º
-2
-3
-4
Dia
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos
dados.
Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos.
Exemplo:
a) Gráfico em colunas
PRODUÇÃO BRASILEIRA DE
CARVÃO MINERAL BRUTO
1989-92
Quant. Produzida
Anos
(1.000 t)
1989 18.196
1990 11.168
1991 10.468
1992 9.241
Fonte: Ministério da Agricultura
20.000
Mil toneladas
15.000
10.000
5.000
0
1989 1990 1991 1992
Anos
b) Gráfico em barras
EXPORTAÇÕES BRASILEIRAS
MARÇO – 1995
Valor
Estados
(US$ milhões)
São Paulo 1.344
Minas Gerais 542
Rio Grande do Sul 332
Espírito Santo 285
Paraná 250
Santa Catarina 202
Fonte: SECEX
São Paulo
Minas Gerais
Rio Grande do Sul
Espírito Santo
Paraná
Santa Catarina
40.000
30.000
US$ milhão
20.000
10.000
0
1989 1990 1991 1992 1993
De 7 a 15 Mais de 15
salários salários
% Graus
De 3 a 7 67,1 241,6
salários 22,4 80,6
7,7 27,7
2,8 10,1
Até 3 salários
5.2.1. Histograma
O histograma é um gráfico constituído no plano cartesiano por retângulos em número igual ao número de
classes da distribuição. Cada classe é representada por uma coluna de altura correspondente a sua frequência.
Trata-se também de um gráfico de área. É utilizado para variáveis contínuas; por isso, o gráfico também é
contínuo: as colunas são justapostas. A área de cada coluna é proporcional à frequência da classe representada. Logo,
a área de todo o histograma é proporcional à soma total das frequências.
Exemplo:
i Classes Pm Fi Fa fi (%) fa (%)
1 150 |--- 155 152,5 6 6 15,0 15,0
2 155 |--- 160 157,5 10 16 25,0 40,0
3 160 |--- 165 162,5 15 31 38,0 78,0
4 165 |--- 170 167,5 5 36 12,0 90,0
5 170 |--- 175 172,5 3 39 8,0 98,0
6 175 |--- 180 177,5 1 40 2,0 100,0
Total 40 100,0
15
10
Fi
0
150 155 160 165 170 175 180
12
9
Fi
0
150 155 160 165 170 175 180
5.2.3. Ogiva
A ogiva é um gráfico de frequências acumuladas, o que justifica ser também denominada curva de
caumulação de frequências.
Retomando o exemplo do item 5.2.1., podemos construir um gráfico de ogiva com os valores de frequência
acumulada (Fa).
40
Fa 30
20
10
0
150 155 160 165 170 175 180
EXERCÍCIOS:
Série Aula:
1)
Retrato do Orçamento Familiar
Itens que mais pesam (%)
Saúde e cuidados
Educação, leitura e
pessoais (12,01)
recreação (9,23) Transportes (13,95)
Vestuário (5,08)
Alimentação
Despesas div ersas (25,12)
(inclui bebidas,
cigarros e jogos
H abitação (31,15)
eletrônicos) (3,46)
Considerando que, nos primeiros meses de 2002, o salário mínimo era de R$ 200,00, aproximadamente, analise as
informações seguintes, classificando-as em V ou F, justificando:
I. Em Belém, uma família gastava, em média, R$ 468,00 por mês em moradia.
Não
96%
Total de participantes: 1.061
4) O histograma abaixo representa o tempo de espera (em minutos) na fila de um banco, em certa manhã, no centro de
Belo Horizonte. Que porcentagem do total de pessoas esperou até 20 minutos na fila?
Fi
16
12
6
4
2
Tempo
8 12 16 20 24 28
5) Considere os resultados abaixo de medição de temperatura, obtidos durante 10 dias, no mesmo horário, e construa
um gráfico de linha.
Dia 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Temperatura (ºC) 32 35 34 30 28 31 32 33 30 29
6) A tabela abaixo representa, em termos percentuais, a distribuição da população brasileira por cor. Construa:
a) um gráfico de setores;
b) um gráfico de colunas.
Cor %
Branca 54,23
Preta 5,92
Amarela 0,56
Parda 38,85
Sem declaração 0,44
Total 100,00
Fonte: IBGE.
7) Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um
grupo de alunos, responda?
a) Qual é o intervalo de classe que tem maior freqüência?
b) Qual a amplitude total da distribuição?
c) Qual o número total de alunos?
d) Qual é a freqüência do intervalo de classe 110 |–– 120?
e) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110?
f) Quantos alunos receberam notas de teste não inferiores a 100?
30
25
20
15
10
0
20 40 60 80 100 120 140 160
Série Casa:
1) Construa um gráfico de linha a partir da seguinte tabela:
COMÉRCIO EXTERIOR
BRASIL – 1984-93
Quantidade (1.000 t)
Anos
Exportação Importação
1984 141.737 53.988
1985 146.351 48.870
1986 133.832 60.597
1987 142.378 61.975
1988 169.666 58.085
1989 177.033 57.293
1990 168.095 57.184
1991 165.974 63.278
1992 167.295 68.059
1993 182.561 77.813
6) A tabela a seguir mostra as áreas, em milhões de km2, dos oceanos. Representar graficamente os dados, usando: a)
um gráfico de colunas; b) um gráfico de setores.
Espécie Quantidade
Auxílio-natalidade 901.000
Auxílio-doença 467.000
Auxílio-funeral 88.000
Aposentadoria por Invalidez 40.000
Aposentadoria por Tempo de Serviço 39.000
Abono Permanente em Serviço 30.000
Pensão por Morte 73.000
Outras Espécies 44.000
9) De um exame final de Estatística, aplicado em 54 alunos da Faculdade FESAV, resultaram as seguintes notas:
Pede-se:
a) Construir uma tabela de distribuição de freqüência, iniciando com 1,6 e adotando amplitude do intervalo de
classe igual a 1,4, fechado à esquerda.
b) Os pontos médios.
c) Elaborar uma distribuição de freqüência acumulada e percentual (absoluta e acumulada).
d) Quantos alunos obtiveram notas inferiores a 5,0?
e) Quantos alunos obtiveram notas entre 5,0 e 8,0?
f) Que porcentagem de alunos obteve notas acima ou igual a 7,0?
g) Construa o gráfico de setores para as classes.
11) Represente num gráfico de setores as faixas de renda observadas no Brasil, em 1971, de acordo com a tabela
observada no exercício 14 acima. Para isso, utilize as freqüências relativas absolutas.
12) A tabela abaixo no fornece as principais altas de preço verificadas no Brasil, no período de setembro a 11 de
novembro de 1984. Construa um gráfico de colunas, com estes dados.
Carne 2,5
Leite 10,7
Frutas 18,7
Vestuário 14,5
Fonte: IBGE.
Σ = 30
5 174 |–– 180 3
III.
i Salários (R$) Fi
1 500 |–– 700 8
2 700 |–– 900 20
3 900 |–– 1.100 7
4 1.100 |–– 1.300 5
5 1.300 |–– 1.500 2
6 1.500 |–– 1.700 1
Σ = 44
7 1.700 |–– 1.900 1
15) Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo:
Nebulosidade 0 |–– 0,5 |–– 1,5 |–– 2,5 |–– 3,5 |–– 4,5 |–– 5,5 |–– 6,5 |–– 7,5 |–– 8,5 |–– 9,5 |–– 10,0
Fi 320 125 75 65 45 45 55 65 90 145 676
Construa o histograma correspondente.
Exemplo:
Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kg,
temos, para venda média diária na semana de:
Σ x i 10 + 14 + 13 + 15 + 16 + 18 + 12
x= = = 14
n 7
Logo: x = 14 kg
∑di = 0
k
i=1
No exemplo anterior:
i=1 i =1
2ª propriedade:
Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica
aumentada (ou diminuída) dessa constante:
yi = xi ± c ⇒ y = x ± c
Daí:
∑ y i = 12 + 16 + 15 + 17 + 18 + 20 + 14 = 112
k
i=1
Logo:
y= = 16 ⇒ y = 16 = 14 + 2 ⇒ y = x + 2
112
7
3ª propriedade:
Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto
fica multiplicada (ou dividida) por essa constante:
yi = xi × c ⇒ y = x × c yi = ⇒y=
xi x
ou
c c
Daí:
∑ y i = 30 + 42 + 39 + 45 + 48 + 54 + 36 = 294
k
i=1
Logo:
y= = 42 ⇒ y = 42 = 14 × 3 ⇒ y = x × 3
294
7
Nº de meninos Fi
0 2
1 6
2 10
3 12
Σ = 34
4 4
Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como
fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:
Σ x i ⋅ Fi
x=
Σ Fi
produtos x i ⋅ Fi :
O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos
Nº de
Fi x i ⋅ Fi
meninos
0 2 0
1 6 6
2 10 20
3 12 36
Σ = 34 Σ = 78
4 4 16
Temos, então:
Σ xi ⋅ Fi 78
x= = = 2,29 ⇒ x = 2,3
Σ Fi 34
Exemplo: Calcular a estatura média dos alunos de uma escola conforme a tabela abaixo.
i Estaturas (cm) Fi
1 150 |–– 154 4
2 154 |–– 158 9
3 158 |–– 162 11
4 162 |–– 166 8
5 166 |–– 170 5
Σ = 40
6 170 |–– 174 3
Vamos abrir uma coluna para os pontos médios e outra para os produtos x i ⋅ Fi :
Estatística Aplicada
i Estaturas (cm) Fi xi x i ⋅ Fi
1 150 |–– 154 4 152 608
2 154 |–– 158 9 156 1.404
3 158 |–– 162 11 160 1.760
4 162 |–– 166 8 164 1.312
5 166 |–– 170 5 168 840
Σ = 40 Σ = 6.440
6 170 |–– 174 3 172 516
Temos, então:
Σ x i ⋅ Fi 6.440
x= = = 161 ⇒ x = 161
Σ Fi 40
EXERCÍCIOS:
Série Aula:
1) Calcule a média aritmética da série:
a) X: 1, 2, 8, 10, 12, 16, 21, 30.
b) Y: 5, 6, 6, 10, 11, 11, 20.
c) Z: 3,4; 7,8; 9,23; 12,15.
2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um
peso superior a 40 quilos. Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5; 3,5; 4; 5; 5,5; 4; 5, este
lote será aprovado? Qual o peso médio do produto?
3) Um produto é vendido em três supermecados por R$ 13,00/kg, R$ 13,20/kg e R$ 13,50/kg. Determine quantos R$/kg
se paga em média pelo produto.
8 +1
2
- Para n = 8, temos P = = 4,5 . Logo, a mediana é a média aritmética do 4º e 5º termos da série,
10 + 12
2
isto é: Md = = 11 ⇒ Md = 11.
2
Notas:
• Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos
• Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um
elementos da série.
• Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série.
• A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das
diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos).
Vejamos:
5, 7, 10, 13, 15 ⇒ x = 10 e Md = 10
5, 7, 10, 13, 65 ⇒ x = 20 e Md = 10
Estatística Aplicada
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores
extremos, ao passo que a mediana permanece a mesma.
n+1
P=
2
Σ = 34
4 4 34
34 + 1
Sendo: P = = 17,5
2
a menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo esse o valor
mediano. Logo, Md = 2.
Nota:
No caso de existir uma freqüência acumulada (Fa), tal que: P – Fa = 0,5, a mediana será dada pela média
aritmética dos valores das variáveis correspondentes às freqüências acumuladas imediatamente inferior e superior a P.
Exemplo:
xi Fi Fa
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
Σ=8
20 1 8
8 +1 15 + 16 31
Temos: P = = 4,5 Logo: Md = = = 15,5
2 2 2
n+1
2º) Calculamos P = ;
2
3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à P. Tal classe será a classe
mediana;
4º) Calculamos a Mediana pela seguinte fórmula:
(P − Fa * ) ⋅ h
Md = Li +
Fi
Li = é o limite inferior da classe mediana.
Fa* = é a freqüência acumulada da classe anterior à classe mediana.
Fi = é a freqüência simples da classe mediana.
h = é a amplitude do intervalo da classe mediana.
Exemplo:
i Estaturas (cm) Fi Fa
1 50 |–– 54 4 4
2 54 |–– 58 9 13
3 58 |–– 62 11 24
4 62 |–– 66 8 32
5 66 |–– 70 5 37
Σ = 40
6 70 |–– 74 3 40
40 + 1
Temos: P = = 20,5 Logo,.a classe mediana será a terceira (i = 3).
2
Li = 58 Fa* = 13 Fi = 11 h=4
•
Quando há valores extremos que afetam de maneira acentuada a média aritmética.
Quando a variável em estudo é salário.
EXERCÍCIOS:
Série Aula:
1) Calcule a mediana da sequência:
a) X: 2, 5, 8, 10, 12, 15, 8, 5, 12.
b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8.
2) Calcule a mediana da distribuição:
Estatística Aplicada
xi Fi
2 5
4 20
5 32
6 40
8 2
3) Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o quadro abaixo.
Determine o valor mediano da série.
Consumo por nota
i Nº de notas
(R$)
1 0 |––– 50,00 10
2 50,00 |––– 100,00 28
3 100,00 |––– 150,00 12
4 150,00 |––– 200,00 2
5 200,00 |––– 250,00 1
6 250,00 |––– 300,00 1
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros.
Exemplo: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal.
Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou
mais valores modais.
Exemplo: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série é bimodal.
Σ = 30
3 6
Na distribuição acima a freqüência máxima é 12, correspondente ao valor 2 da variável. Logo, a temperatura
mais comum é 2 ºC.
Estatística Aplicada
i Estaturas (cm) Fi
1 50 |–– 54 4
2 54 |–– 58 9
3 58 |–– 62 11
4 62 |–– 66 8
5 66 |–– 70 5
Σ = 40
6 70 |–– 74 3
Ls + Li 62 + 58
Como: Mo = = = 60
2 2
Logo: Mo = 60 cm
Para determinar a moda de uma variável contínua (com intervalos de classe), podemos optar por vários
processos. Daremos destaque para a moda de Pearson, a moda de King e a moda de Czuber.
Mo = 3Md − 2 x
Mo = L i + ⋅h
Fpost
Fant + Fpost
onde:
Li = limite inferior da classe modal.
Fpost = freqüência absoluta da classe posterior à classe modal.
Fant = freqüência absoluta da classe anterior à classe modal.
h = amplitude do intervalo de classe.
Fi − Fant
Mo = L i + ⋅h
2Fi − (Fant + Fpost )
onde:
Li = limite inferior da classe modal.
Fi = freqüência absoluta da classe modal.
Fpost = freqüência absoluta da classe posterior à classe modal.
Fant = freqüência absoluta da classe anterior à classe modal.
h = amplitude do intervalo de classe.
Comentários:
A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana da
distribuição, a fórmula de Pearson é a mais trabalhosa.
A fórmula de King é a mais simples delas, mas não é a mais precisa.
A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a freqüência da
classe modal.
Normalmente o processo mais confiável é o valor de Czuber.
EXERCÍCIOS:
Série Aula:
1) Calcule a moda das séries abaixo:
a) X: 2, 3, 5, 4, 5, 2, 5, 7
b) Y: 4, 12, 5, 9, 12, 4, 3
c) Z: 7, 7, 7, 7 7
d) J: 4, 5, 6, 6, 6, 7, 8, 8, 8, 9, 10, 10, 10, 11
e) T: 2, 5, 9, 8, 10, 12
3) Calcule a moda de Czuber para a distribuição representativa dos salários de 25 funcionários de uma empresa.
Salários Nº de
i
(R$) funcionários
1 1.000,00 |––– 1.200,00 2
2 1.200,00 |––– 1.400,00 6
3 1.400,00 |––– 1.600,00 10
4 1.600,00 |––– 1.800,00 5
5 1.800,00 |––– 2.000,00 2
Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá
representar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação
ao valor da medida não serão bem representados por ela. Assim:
- Devemos optar pela média, quando houver forte concentração de dados na área central da série;
- Devemos optar pela mediana, quando houver forte concentração de dados no início ou no final da série; e
- Devemos optar pela moda apenas em séries que apresentam um elemento típico, isto é, um valor cuja
freqüência é muito superior à freqüência dos outros elementos da série.
EXERCÍCIOS:
Série Aula:
1) Uma loja vende cinco produtos básicos, A, B, C, D e E. O lucro por unidade cormecializada destes produtos vale
respectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 1.000,00 e R$ 5.000,00. A loja vendeu em determinado mês 20,
30, 20, 10 e 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja?
2) Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada,
500 caixa de 4 kg cada e 800 caixas de 5 kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga
pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que sá permite passagens a caminhões com peso
máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no
caminhão?
3) Num quartel, constatou-se que o peso médio de 40 soldados era de 69 quilos. Posteriormente, verificou-se que a
balança estava desregulada, ocasionando um peso indicado superior em 15 gramas ao peso verdadeiro. Qual era a
média verdadeira dos pesos dos soldados?
Série Casa:
1) Considerando os conjuntos de dados:
I. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
II. 20, 9, 7, 2, 12, 7, 20, 15, 7
III. 51,6; 48,7; 50,3; 49,5; 48,9
IV. 15, 18, 20, 13, 10, 16, 14
Calcule:
a) a média aritmética
b) a mediana
c) a moda
3) As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine:
a) a nota média
b) a nota mediana
c) a nota modal
Calcule:
a) a nota média
b) a nota mediana
c) a nota modal
Σ = 70
5 182 |–– 190 8
III. IV.
i Salários (R$) Fi i Pesos (kg) Fi
1 500 |–– 700 18 1 145 |–– 151 10
2 700 |–– 900 31 2 151 |–– 157 9
3 900 |–– 1.100 15 3 157 |–– 163 8
4 1.100 |–– 1.300 3 4 163 |–– 169 6
5 1.300 |–– 1.500 1 5 169 |–– 175 3
6 1.500 |–– 1.700 1 6 175 |–– 181 3
Σ = 70 Σ = 40
7 1.700 |–– 1.900 1 7 181 |–– 187 1
7) Calcule a idade média e a idade mediana dos alunos de uma classe de primeiro ano de determinada Faculdade, em
anos.
Idade (anos) Nº de alunos
xi Fi
17 3
18 18
19 17
20 8
21 4
8) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule a salário médio
destes funcionários.
Salário Nº de funcionários
i
(R$) Fi
1 400,00 |––– 500,00 12
2 500,00 |––– 600,00 15
3 600,00 |––– 700,00 8
4 700,00 |––– 800,00 3
5 800,00 |––– 900,00 1
6 900,00 |––– 1.000,00 1
9) Determine o valor mediano da distribuição a seguir que representa os salários de 25 funcionários selecionados de
uma empresa.
Salário Nº de funcionários
i
(R$) Fi
1 1.000,00 |––– 1.200,00 2
2 1.200,00 |––– 1.400,00 6
3 1.400,00 |––– 1.600,00 10
4 1.600,00 |––– 1.800,00 5
5 1.800,00 |––– 2.000,00 2
10) Calcule a moda de Czuber para a distribuição de valores de 54 notas fiscais, emitidas na mesma dada,
selecionadas em uma loja de departamentos:
Consumo por nota
i Nº de notas
(R$)
1 0 |––– 50,00 10
2 50,00 |––– 100,00 28
3 100,00 |––– 150,00 12
4 150,00 |––– 200,00 2
5 200,00 |––– 250,00 1
6 250,00 |––– 300,00 1
11) Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60 alunos em uma prova de
matemática:
i Notas Nº de alunos
1 0 |––– 2 5
2 2 |––– 4 20
3 4 |––– 6 12
4 6 |––– 8 20
5 8 |––– 10 3
7. Medidas de Posição: Separatrizes
Dados que produzem histogramas simétricos são adequadamente descritos pela média e pelo desvio-padrão.
Quando os dados são assimétricos, a mediana identifica mais adequadamente o centro de um conjunto de dados. Para
entender bem uma distribuição, precisamos conhecer valores acima ou abaixo dos quais se encontra uma determinada
porcentagem dos dados: as separatrizes.
Separatriz de uma série de n termos colocados em ordem crescente de valor, é o termo da série que a divide
em duas partes quaisquer. As principais separatrizes são a mediana, os quartis, os decis e os percentis (ou centis).
Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por Q1 , Q2 e Q3,
dividem as observações ordenadas em quatro partes iguais. O primeiro quartil separa os 25% inferiores dos 75%
superiores dos valores ordenados; o segundo quartil é a mediana e o terceiro quartil separa os 75% inferiores dos 25%
superiores dos dados.
Analogamente, há nove decis, denotados por D1 , D2, D3 , ..., D9 que dividem os dados em 10 grupos com
cerca de 10% deles em cada grupo. Há finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de
1% em cada grupo.
Exemplo: O nível de albumina no sangue, um indicador do estado nutricional, foi medido em um grupo de 60 pacientes,
obtendo-se os resultados (g/dl) apresentados na Tabela 9.1 em forma ordenada. Obtenha o primeiro quartil e o percentil
de ordem 80.
O primeiro quartil deixa pelo menos 25% dos dados abaixo e pelo menos 75% dos dados acima dele. Como
25% de 60 é igual a 15, Q1 tem pelo menos 15 valores abaixo de si e pelo menos 45 acima. Contando-se 15 valores do
menor para o maior, teremos o paciente com valor de albumina igual a 4,76 g/dl. Começando do maior para o menor e
contando 45 valores, encontramos também 4,76 g/dl. Assim, a dosagem 4,76 g/dl é o valor do primeiro quartil.
Podemos dizer que pelo menos 25% dos pacientes da amostra apresentam nível de albumina inferior ou igual
a 4,76 g/dl.
O percentil de ordem 80 deixa pelo menos 80%, ou seja, 48 valores abaixo de si e pelo menos 12 acima.
Contando 48 valores a partir, chegamos ao valor de 5,18 g/dl. E contando 12 valores do maior para o menor obtemos
5,19 g/dl. Por convenção, usa-se a média destes dois valores, ou seja, o valor 5,185 g/dl.
7.1. Os Quartis
Há três quartis:
a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados
é menor que ele e as três quartas partes restantes (75%) são maiores.
b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md).
c) O terceiro quartil (Q3) – valor situado de tal modo na série que as três quartas partes (75%) dos
dados são menores que ele e uma quarta parte restante (25%) é maior.
∑ Fi + 1
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da
mediana, bastando substituir, na fórmula da mediana, P = por:
2
k ⋅ (∑ Fi + 1)
4
Assim, temos:
∑ Fi + 1 ∑ Fi + 1 3 ⋅ (∑ Fi + 1)
PQ1 = PQ 2 = P = PQ 3 =
4 2 4
(P )
Logo,
− Fa * ⋅ h
Q1 = L i + Q1
Fi
Q 2 = Md = L i +
(P
Q2 )
− Fa * ⋅ h
Fi
Q3 = Li +
(P
Q3 )
− Fa * ⋅ h
Fi
sendo,
Li = é o limite inferior da classe que contém a separatriz.
Fa* = é a freqüência acumulada da classe anterior à classe que contém a separatriz.
Fi = é a freqüência simples da classe que contém a separatriz.
h = é a amplitude do intervalo da classe que contém a separatriz.
Exemplo:
A partir da tabela abaixo, determine o primeiro, o segundo e o terceiro quartis.
Estaturas (cm) Fi Fa
150 |–– 154 4 4
154 |–– 158 9 13 ← Q1
158 |–– 162 11 24 ← Q2
162 |–– 166 8 32 ← Q3
166 |–– 170 5 37
Σ = 40
170 |–– 174 3 40
40 + 1
Primeiro Quartil: Segundo Quartil (Mediana): Terceiro Quartil:
PQ1 = = 10,25
4
Q 1 = 154 +
(10,25 − 4 ) ⋅ 4
9 Q1 = 160,7 cm Q1 = 165,4 cm
Q1 = 156,8 cm
7.2. Os Decis
O cálculo de um decil segue a mesma técnica do cálculo dos quartis, onde utilizamos:
k ⋅ (∑ Fi + 1)
10
Assim, temos:
∑ Fi + 1 ∑ Fi + 1 9 ⋅ (∑ Fi + 1)
PD1 = , PD2 = , ... , PD9 =
10 5 10
(P )
Logo, para o 7º decil, temos:
− Fa * ⋅ h
D7 = L i + D7
Fi
Exemplo:
7 ⋅ (∑ Fi + 1) 7 ⋅ (40 + 1)
Considerando a tabela do exemplo anterior, temos, para o 7º decil:
PD7 = = = 28,7
10 10
Logo,
D 7 = 162 +
(28,7 − 24 ) ⋅ 4
∴ D7 = 164,4 cm
8
7.3. Os Percentis
O cálculo de um percentil segue a mesma técnica do cálculo dos quartis, onde utilizamos:
k ⋅ (∑ Fi + 1)
100
Assim, temos:
∑ Fi + 1 ∑ Fi + 1 99 ⋅ (∑ Fi + 1)
P1 = , P2 = , ... , P99 =
100 50 100
É evidente que:
(P )
Logo, para o 27º percentil, temos:
− Fa * ⋅ h
P27 = L i + 27
Fi
Exemplo:
27 ⋅ (∑ Fi + 1) 27 ⋅ (40 + 1)
P27 = = = 11,07
100 100
Logo,
P27 = 154 +
(11,07 − 4 ) ⋅ 4
∴ P27 = 157,1 cm
9
EXERCÍCIOS:
Série Aula:
1) Para a distribuição abaixo calcular: D2, P40 e Q3.
Classes 20 |–– 30 30 |–– 40 40 |–– 50 50 |–– 60 60 |–– 70
Fi 3 8 18 22 24
Série Casa:
1) Determine o valor da medida que deixa 45% dos elementos da distribuição é:
Renda 10 |–– 20 20 |–– 30 30 |–– 40 40 |–– 50 50 |–– 60 60 |–– 70 70 |–– 80 80 |–– 90 90 |–– 100
Nº de
50 100 150 250 150 100 80 70 50
famílias
3) O departamento pessoal de uma certa empresa fez um levantamento dos salários dos 120 funcionários do setor
administrativo, obtendo os resultados (em salários mínimos) da tabela abaixo. Calcule o primeiro quartil e a mediana.
Faixa salarial fi (%)
0 |–– 2 25,0
2 |–– 4 40,0
4 |–– 6 20,0
6 |–– 8 15,0
dispersão
xi
Sejam as séries:
a) 20, 20, 20
b) 15, 10, 20, 25, 30 x
Tem-se: x a = 20 e x b = 20
Apesar de as séries terem médias iguais, na série “a” não se tem dispersão, enquanto que os valores da série
“b” apresentam dispersões em torno da média 20. Assim, a média é muito mais representativa para a série “a” do que
para a série “b”.
Portanto, para qualificar os valores de uma variável, ressaltando a maior ou menor dispersão ou variabilidade
entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de variação.
Exemplo: Para os valores: 40, 45, 48, 52, 54, 62 e 70, temos,
AT = 70 – 40 = 30
Logo: AT = 30
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua
concentração. É evidente que, quanto maior a amplitude total, maior a dispersão dos valores da variável.
A amplitude total tem o incoveniente de só levar em conta os dois valores extremos da série, descuidando do
conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma
indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia ou no ano, no
controle da qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que
a exatidão e a estabilidade.
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em
relação à variável em questão, o que, sob o ponto de vista prático, é um incoveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio
padrão, definida como a raiz quadrada da variância e representada por s.
Assim:
s=
∑ (x i − x )2
n
( xi )
Podemos simplificar os cãlculos fazendo uso da igualdade:
∑
∑ (x i − x ) =∑ −
2
2
x i2
n
( x i ) ⎞⎟ 1
Assim:
⎛
∑
∑ − n ⎟⎟ ⋅ n
⎜
s= ⎜
2
⎜
x i2
⎝ ⎠
Logo:
∑ x i2 − ⎛⎜ ∑ x i ⎞⎟
2
s=
⎜ ⎟
⎝ ⎠
n n
∑ Fi x i2 − ⎛⎜ ∑ Fi x i ⎞⎟
∑ Fi ⎜⎝ ∑ Fi ⎟⎠
2
s=
2ª) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio
padrão fica multiplicado (ou dividido) por essa constante:
yi = xi × c ⇒ sy = sx × c
yi = xi ÷ c ⇒ sy = sx ÷ c
CV = ⋅ 100
s
x
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:
x s
Estaturas 175 cm 5,0 cm
Pesos 68 kg 2,0 kg
Temos:
CVE = ⋅ 100 = 2,85%
5
175
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as alturas.
EXERCÍCIOS:
Série Aula:
1) Calcule os desvios padrões dos conjuntos de dados:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
d) –10, –6, 2, 3, 7, 9, 10
b)
Classes 1,5 |–– 1,6 |–– 1,7 |–– 1,8 |–– 1,9 |–– 2,0 |–– 2,1 |–– 2,2
Fi 4 8 12 15 12 8 4
2) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 125
moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação
de cada um dos grupos? Qual o grupo mais homogêneo?
3) Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão de
R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00.
Então, calcule os coeficientes de variações e diga qual o grupo mais homogêneo.
a) 1,36 c) 4,54
b) 18,35 d) 20,66
REFERÊNCIAS
- SILVA, E. M., GONÇALVES, V., MUROLO, A. C. Estatística para os cursos de: Economia, Administração
e Ciências Contábeis. Ed. Atlas. 3ª edição. 1999.
1. INTRODUÇÃO À ESTATÍSTICA...............................................................................................................................3
1.1. ENTENDENDO A IMPORTÂNCIA DA ESTATÍSTICA..................................................................................................................3
1.2. OBJETO DA ESTATÍSTICA................................................................................................................................................4
1.2. MÉTODO ESTATÍSTICO...................................................................................................................................................4
1.2.1. O Método Científico.........................................................................................................................................4
1.2.2. O Método Experimental....................................................................................................................................4
1.2.3. O Método Estatístico........................................................................................................................................5
1.3. A ESTATÍSTICA.............................................................................................................................................................5
1.4. FASES DO MÉTODO ESTATÍSTICO.....................................................................................................................................5
1.4.1. Coleta de Dados...............................................................................................................................................5
1.4.2. Apuração dos Dados........................................................................................................................................6
1.4.3. Apresentação dos Dados..................................................................................................................................6
1.4.4. Análise dos Resultados.....................................................................................................................................6
1.5. ABUSOS DA ESTATÍSTICA................................................................................................................................................6
1.5.1. Más Amostras...................................................................................................................................................6
1.5.2. Pequenas Amostras...........................................................................................................................................6
1.5.3. Estimativas por Suposição................................................................................................................................6
1.5.4. Porcentagens Distorcidas:...............................................................................................................................7
1.5.5. Perguntas Tendenciosas...................................................................................................................................7
1.5.6. Pressão do Pesquisador...................................................................................................................................7
2. POPULAÇÃO E AMOSTRA........................................................................................................................................9
2.1. VARIÁVEIS...................................................................................................................................................................9
2.2. POPULAÇÃO E AMOSTRA................................................................................................................................................9
2.2.1. Amostragem Aleatória Simples......................................................................................................................10
2.2.2. Amostragem Sistemática.................................................................................................................................10
2.2.3. Amostragem Estratificada Proporcional........................................................................................................10
3. SÉRIES ESTATÍSTICAS............................................................................................................................................15
3.1. TABELAS....................................................................................................................................................................15
3.2. SÉRIES ESTATÍSTICAS...................................................................................................................................................15
3.2.1. Séries Históricas, Cronológicas ou Temporais..............................................................................................15
3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização.....................................................................15
3.2.3. Séries Específicas ou Categórica...................................................................................................................16
3.2.4. Séries Conjugadas – Tabela de Dupla Entrada.............................................................................................16
3.3. DADOS ABSOLUTOS E DADOS RELATIVOS.......................................................................................................................16
3.3.1. As Porcentagens.............................................................................................................................................17
3.3.2. Os Índices.......................................................................................................................................................18
3.3.3. Os Coeficientes...............................................................................................................................................18
3.3.4. As Taxas..........................................................................................................................................................19
4. DISTRIBUIÇÃO DE FREQUÊNCIA........................................................................................................................23
4.1. TABELA PRIMITIVA / ROL.............................................................................................................................................23
4.2. DISTRIBUIÇÃO DE FREQÜÊNCIA......................................................................................................................................23
4.3. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA.........................................................................................................24
4.3.1. Classe..............................................................................................................................................................24
4.3.2. Limites de Classe............................................................................................................................................24
4.3.3. Amplitude de um Intervalo de Classe.............................................................................................................24
4.3.4. Amplitude Total da Distribuição....................................................................................................................24
4.3.5. Ponto Médio de uma Classe...........................................................................................................................24
4.4. DETERMINAÇÃO DO NÚMERO DE CLASSES.......................................................................................................................24
4.5. TIPOS DE FREQÜÊNCIAS................................................................................................................................................25
4.6. DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALOS DE CLASSE.............................................................................................25
5. GRÁFICOS ESTATÍSTICOS.....................................................................................................................................30
5.1. REPRESENTAÇÃO GRÁFICA............................................................................................................................................30
5.1.1. Gráfico de Linha.............................................................................................................................................30
5.1.2. Gráfico de Colunas ou de Barras...................................................................................................................30
5.1.3. Gráfico de Colunas ou de Barras Múltiplas..................................................................................................32
5.1.4. Gráfico de Setores..........................................................................................................................................32
5.2. REPRESENTAÇÃO GRÁFICA DE DISTRIBUIÇÃO DE FREQUÊNCIA............................................................................................33
5.2.1. Histograma.....................................................................................................................................................33
5.2.2. Polígono de Frequência.................................................................................................................................33
5.2.3. Ogiva..............................................................................................................................................................34
6. MEDIDAS DE POSIÇÃO: MEDIDAS DE TENDÊNCIA CENTRAL..................................................................40
6.1. MÉDIA ARITMÉTICA ().................................................................................................................................................40
6.1.1. Dados não-agupados......................................................................................................................................40
6.1.2. Desvio em relação à média............................................................................................................................40
6.1.3. Propriedades da média...................................................................................................................................41
6.1.4. Dados agrupados............................................................................................................................................41
6.1.4.1. Sem intervalos de classe..........................................................................................................................................41
6.1.4.2. Com intervalos de classe..........................................................................................................................................42
6.1.5. Emprego da média..........................................................................................................................................43
6.2. MEDIANA (MD)..........................................................................................................................................................44
6.2.1. Dados não-agrupados....................................................................................................................................44
6.2.2. Dados agrupados............................................................................................................................................45
6.2.2.1. Sem intervalos de classe..........................................................................................................................................45
6.2.2.2. Com intervalos de classe..........................................................................................................................................45
6.2.3. Emprego da Mediana.....................................................................................................................................46
6.3. MODA (MO)..............................................................................................................................................................47
6.3.1. Dados não-agrupados....................................................................................................................................47
6.3.2. Dados agrupados............................................................................................................................................47
6.3.2.1. Sem intervalos de classe..........................................................................................................................................47
6.3.2.2. Com intervalos de classe..........................................................................................................................................48
6.4. UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL.......................................................................................................49
7. MEDIDAS DE POSIÇÃO: SEPARATRIZES...........................................................................................................54
7.1. OS QUARTIS...............................................................................................................................................................54
7.2. OS DECIS..................................................................................................................................................................56
7.3. OS PERCENTIS............................................................................................................................................................56
8. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE.......................................................................................58
8.1. AMPLITUDE TOTAL......................................................................................................................................................58
8.2. VARIÂNCIA / DESVIO PADRÃO......................................................................................................................................58
8.3. COEFICIENTE DE VARIAÇÃO..........................................................................................................................................59
REFERÊNCIAS................................................................................................................................................................62
ESTATÍSTICA APLICADA