Você está na página 1de 64

Estatística Aplicada

1. Introdução à Estatística
1.1. Entendendo a importância da Estatística
Jornais, televisão, rádio, revistas e outros meios de comunicação nos bombardeiam, diariamente, com notícias,
baseadas em estatísticas, como se fossem verdades absolutas. Nessa hora, provavelmente, você sente a importância
de ser capaz de avaliar corretamente o que lhe dizem. Todavia, será que os números apresentados resultam de uma
análise estatística cuidadosa? O perigo está no fato de que, se não consegue distinguir as afirmações falsas das
verdadeiras, então você está vulnerável à manipulação por outras pessoas, cujas conclusões podem conduzir você
para decidir contra os interesses seus e, depois, arrepender-se. Por estas razões, conhecer Estatística é um grande
passo no sentido de você tomar controle da sua vida (embora não seja, obviamente, a única maneira necessária para
esta finalidade).
Observe os seguintes exemplos de afirmações recentemente publicadas em dez meios de comunicação (não
estou dizendo que cada uma delas seja verdadeira).
ƒ Sua expectativa é de que a inflação feche o ano entre 6% e 7%. (Folha de São Paulo, Dinheiro, 16 de maio de
2005)
ƒ Atualmente, a taxa de pacientes com câncer de pulmão que não apresentam reincidência depois de cinco anos
de tratamento é de 17% – um avanço de 70% em relação à década de 70. (Revista Veja, edição 1905, 18 de
maio de 2005)
ƒ As projeções de mercado para o IPCA de 2005 subiram de 6,30% para 6,39% em pesquisa semanal feita pelo

ƒ
Banco Central e divulgada hoje. (O Estado de São Paulo, 16 de maio de 2005)
Um estudo da Corporate Executive Board mostrou que a produtividade de um funcionário brilhante chega a ser

ƒ
até 12 vezes superior à do colega mediano. (Revista Exame, edição 841, 27 de abril de 2005)
De acordo com a Embratur (Empresa Brasileira de Turismo), a companhia aérea trouxe 1.473.183 dos
6.138.000 passageiros que entraram no país no ano passado, o equivalente a 24% desses passageiros.

ƒ
(Revista Aeromagazine, Notícias, 16 de maio de 2005)
IBGE: Emprego industrial cai 0,2% em março. (JB Online, 16 de maio de 2005)
ƒ Os investidores que colocam todo seu dinheiro em uma única ação estão elevando em mais de 50% a chance
de queda do poder de compra de seu investimento em um período de 20 anos, aponta o estudo. (JB Online, 17

ƒ
de abril de 2005)

ƒ
Nordestinos já são 52,6% dos migrantes. (Jornal O Globo, 16 de maio de 2005)
Comércio varejista cresce 1,75% em volume de vendas e 2,44% em receita nominal. (IBGE, 12 de maio de
2005)
ƒ Se a vítima não fosse o prefeito de Santo André, o impacto não seria o mesmo e o caso teria sido tratado
como mera estatística. (Márcio Coimbra em http://www.ambito-juridico.com.br/aj/cron0237.htm)

Todas essas notícias são, na sua essência, Estatística. Elas parecem familiares, embora os exemplos sejam
de áreas bastante distintas: economia, medicina, gestão, turismo, social, investimentos, comércio e até política. Em
resumo, os números (também expressos por meio de tabelas e gráficos) e a interpretação deles surgem nos discursos
de praticamente todo aspecto da vida contemporânea.
Desse modo, as estatísticas são, freqüentemente, apresentadas como um testemunho de credibilidade a um
argumento ou a uma recomendação, fato que você pode comprovar ouvindo o veiculado nos meios de comunicação: o
primeiro pensamento é acreditar na notícia como se fosse verdade absoluta. Recorde-se, então, do ex-primeiro-ministro
britânico Benjamin Disraeli (1804-1881), quando afirmou que “Há três espécies de mentiras: mentiras, mentiras
deslavadas e estatísticas”.
No entanto, Estatística é método, ciência e arte. É método quando, na Física, na Biologia, na Medicina ou na
Pedagogia, aplica-se a populações específicas, isto é, serve a uma ciência particular, da qual se torna instrumento. É
ciência quando, graças às suas teorias, estuda grandes conjuntos, independentemente da natureza destes, sendo
autônoma e universal. Finalmente, é arte na construção de modelos para representar a realidade.
Assim sendo, nem tudo está perdido, porque a Estatística pode ajudar você a reagir de modo inteligente às
informações que lê ou escuta e, neste sentido, torna-se um dos mais importantes assuntos que provavelmente estudou.
O presente artigo tem o objetivo de motivar você a ser mais um dos consumidores inteligentes de estatísticas e, para
ser um deles, o primeiro passo é refletir e começar a questionar aquelas que encontrar. Por esta razão, convido você a
reformar os seus hábitos estatísticos a partir de agora. Simplesmente, não mais aceite números, tabelas, gráficos e
conclusões. Ao invés disso, comece a pensar nas fontes de informação e, mais importante, nos procedimentos usados

Prof. Carlos Alexandre Santório 3


Estatística Aplicada

para gerar essa informação. Defenda-se contra afirmações falsas, embrulhadas como se fossem estatísticas. Aprenda a
reconhecer se uma evidência estatística apóia, realmente, uma conclusão apresentada.
A Estatística está toda ela em volta de você, algumas vezes usada de modo adequado, outras vezes não.
Como o objetivo da Estatística é auxiliar a sua tomada de decisões em situações de incerteza, distinguir as boas das
más estatísticas é mais do que nunca, um dever, uma obrigação.

1.2. Objeto da Estatística


Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir,
analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão.
A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos,
na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrair
informação dos dados para obter uma melhor compreensão das situações que representam.
Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser utilizados mesmo
antes de se recolher a amostra, isto é, deve-se planejar a experiência que nos vai permitir recolher os dados, de modo
que, posteriormente, se possa extrair o máximo de informação relevante para o problema em estudo, ou seja para a
população de onde os dados provêm.
Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de amostra, deixando de lado a
aleatoriedade presente.
Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou testar uma hipótese,
utilizando-se técnicas estatísticas convenientes, as quais realçam toda a potencialidade da Estatística, na medida em
que vão permitir tirar conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos ainda
uma medida do erro cometido.

Exemplo:
Ao chegarmos a uma churrascaria, não precisamos comer todos os tipos de saladas, de sobremesas e de
carnes disponíveis, para conseguirmos chegar a conclusão de que a comida é de boa qualidade. Basta que seja
provado um tipo de cada opção para concluirmos que estamos sendo bem servidos e que a comida está dentro dos
padrões.

1.2. Método Estatístico

1.2.1. O Método Científico


Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e, outros, por necessidades
práticas, sem aplicação de um método.
Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo.
Podemos dizer, então, que:

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.

Dos métodos científicos, vamos destacar o método experimental e o estatístico.

1.2.2. O Método Experimental


O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta
causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.

É o método preferido no estudo da Física, da Química, etc.

Prof. Carlos Alexandre Santório 4


Estatística Aplicada

1.2.3. O Método Estatístico


Muitas vezes temos a necessidade de descobrir fatos em um campo em que o método experimental não se
aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer
constantes enquanto fazemos variar a causa que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para
aplicarmos o método experimental, teríamos que fazer variar a quantidade da mercadoria e verificar se tal fato iria
influenciar seu preço.
Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento da
pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a
fixação do nível geral dos preços das outras necessidades etc. Mas isso tudo é impossível.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado método
estatístico.

O método estatístico, diante da impossibilidade de manter as causas constantes, adimite todas essas
causas presentes variando-as, registrando esses variações e procurando determinar, no resultado final, que
influências cabem a cada uma delas.

1.3. A Estatística
Exprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma
característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados
referentes a esses elementos.
Podemos dizer, então, que:

A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a
análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.
Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição
dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.), desconhecendo que o
aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que
transcedam os dados obtidos inicialmente.
Assim, a análise e interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por
exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a
formulação de soluções apropriadas e um planejamento objetivo de ação.

1.4. Fases do Método Estatístico


Podemos distinguir no método estatístico as seguintes fases:

1.4.1. Coleta de Dados


A coleta de dados pode ser direta e indireta.
A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos
e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola
ou, ainda, quando os dados são coletados pelo prórpio pesquisador através de inquéritos e questionários, como é o
caso das notas de verificação e de exames, do censo demográfico, etc.
A coleta direta de dados pode ser classificada relativamente ao fator tempo em:
a) contínua (registro) – quando feita continuamente, tal como a de nescimentos e óbitos e a de frequencia
dos alunos às aulas;
b) periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as
avaliações mensais dos alunos;

Prof. Carlos Alexandre Santório 5


Estatística Aplicada

c) ocasional – quando feita exporadicamente, a fim de atender a uma conjuntura ou a uma emergência,
como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de
outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a
mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.

1.4.2. Apuração dos Dados


Após a coleta dos dados, torna-se necessária sua apuração, ou contagem, denominando-a Tabulação. Para
tanto, de posse dos dados, devemos ordená-los mediante critérios de classificação. Pode ser manual, eletromecânica
ou eletrônica.

1.4.3. Apresentação dos Dados


Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma
adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo estudado.

1.4.4. Análise dos Resultados


O objetivo último da estatística é tirar conlusões sobre o todo (população) a partir de informações fornecidas
por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos
uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a
indução ou inferência, e tiramos desses resultados conclusões e previsões.

1.5. Abusos da Estatística

1.5.1. Más Amostras


Outra fonte de estatística enganosa são os métodos inadequados de coleta de dados. É comum um
pesquisador analisar dados e formular conclusões errôneas porque o método de coleta de dados foi deficiente.
Considere o seguinte exemplo:
Um jornal fez a seguinte pergunta: “Se você tivesse que começar novamente, você teria filhos? Escreva-nos.
Algumas semanas depois o jornal informava que 70% dos pais dizem que não vale a pena ter filhos. Será que
está amostra não era tendenciosa constituída dos pais que queriam desabafar.

Como os próprios pais é que decidiram se seriam incluídos na pesquisa, temos um exemplo de pesquisa auto-
selecionada, ou seja, uma pesquisa em que os próprios entrevistados decidem se serão incluídos.

1.5.2. Pequenas Amostras


Os resultados obtidos com pequenas amostras não são necessariamente más, entretanto, os resultados
obtidos com pequenas podem por vezes ser usados como uma forma de “mentira” estatística. As preferências de
apenas 10 dentistas por determinado creme dental não devem servir de base para uma afirmação generalizada como
“A pasta WW é recomendada por 8 em cada 10 dentistas.” Mesmo que a amostra seja grande, ela deve ser não
tendenciosa e representativa da população de onde provém.

1.5.3. Estimativas por Suposição


Outra fonte de engano estatístico envolve estimativas que são, na verdade, suposições (palpites), podendo
apresentar erros substanciais. É preciso considerar a fonte da estimativa e a maneira como foi estabelecida.

Prof. Carlos Alexandre Santório 6


Estatística Aplicada

1.5.4. Porcentagens Distorcidas:


Por vezes utilizam-se porcentagens confusas ou distorcidas. Em um anúncio de página inteira, a Continental
Airlines anuncia melhores serviços. No tocante ao caso de bagagem extraviada, o anúncio afirmava que se trata de
uma área em que já melhoramos 100% nos últimos seis meses”. Em um editorial criticando essa estatística, o New York
Times interpretou corretamente a melhora de 100% como significando que agora não se extravia mais qualquer
bagagem – o que ainda não foi conseguido pela Continental Airlines.

1.5.5. Perguntas Tendenciosas


As perguntas em uma pesquisa podem ser formuladas de modo a “sugerirem” uma resposta. Por exemplo,
Considere estas duas perguntas:
Que rádio você prefere? A pergunta não sugere a resposta enquanto que a pergunta:
A rádio Transamérica é a sua rádio preferida? Bom claro que é. Esta pergunta força a resposta.

1.5.6. Pressão do Pesquisador


Quando se formulam perguntas a indivíduos pesquisados, esses freqüentemente dão respostas favoráveis à
sua auto imagem. Em uma pesquisa telefônica, 94% dos que responderam disseram que lavam suas mãos após usar
um banheiro, mas a observação em lugares mostraram que o percentual efetivo é de apenas 68%.

Outros exemplos:
1. Para determinar a reação do público à continuação de certo programa governamental, o pesquisador pergunta: “Acha
que este programa dispendioso deve ser interrompido?” Explique por que esta pergunta provavelmente não
proporcionará a informação desejada.
Resposta: Ao formular a questão, o entrevistador está de fato, sugerindo que o programa é dispendioso.

2. Para estudar a reação do consumidor a um novo tipo de alimento enlatado, faz-se uma pesquisa de casa em casa
durante as manhãs dos dias úteis, sem plano de voltar no caso de não ser encontrado ninguém em casa. Explique por
que esta abordagem pode conduzir a uma informação enganadora.
Resposta: Esta pesquisa não atinge os que têm maior probabilidade de usar o produto, pessoas solteiras ou casais em
que ambos trabalham fora.

3. Uma estatística enganosa pode resultar, também da formulação de perguntas no lugar errado ou no momento
errado. Explique por que, no caso seguinte, poderemos obter dados inúteis. Para predizer uma eleição, um pesquisar
entrevista pessoas que saem do edifício onde está a sede nacional de um partido político.
Resposta: As pessoas que saem de um edifício onde está a sede de um partido político provavelmente são filiadas ao
partido.

4. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo contactar por telefone 1500
consumidores. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra?
Resposta: Excluem-se as pessoas com números não listados e pessoas sem telefone.

5. A revista Glamour publicou o seguinte resultado de uma pesquisa: “79% dos que responderam à nossa pesquisa de
agosto afirmaram crer que os americanos se tornaram demasiadamente propensos a apelar para a justiça em casos
corriqueiros”. A questão foi publicada na revista e os leitores podiam responder por correio, fax ou e-mail
(tellus@galamour.com). Até que ponto é válido o resultado de 79%.
Resposta: Como os pesquisados são auto-selecionados, os resultados da pesquisa não são válidos.

6. “De acordo com uma pesquisa de âmbito nacional feita por 250 agências de empregos, os sapatos gastos constituem
o motivo mais comum para que um homem que procura emprego não cause boa impressão à primeira vista.” Os jornais
apresentaram essa alegação com base em uma pesquisa encomendada pela Kiwi Brands, produtores de graxa para
sapatos. Faça um comentário sobre a razão por que os resultados de tal pesquisa podem ser questionados.

Prof. Carlos Alexandre Santório 7


Estatística Aplicada

Resposta: Um fabricante de graxa para sapatos obviamente tem interesse na importância do seu produto, e há muitas
maneiras de este fato afetar os resultados da pesquisa.

7. O jornal Newport Chronicle afirma que as mães grávidas podem aumentar suas chances de ter uma criança sadia
comendo lagostas. A alegação se baseia em um estudo mostrando que as crianças nascidas de mães que comem
lagostas têm menos problemas de saúde do que as nascidas de mães que não comem lagostas.
Resposta: Mães que comem lagostas tendem a ser mais ricas e portanto podem pagar por melhor atendimento médico.

Prof. Carlos Alexandre Santório 8


Estatística Aplicada

2. População e Amostra
2.1. Variáveis
A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:
ƒ para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino;
ƒ para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números
naturais: 0, 1, 2, 3, ..., n;
ƒ para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito
de valores numéricos dentro de um determinado intervalo.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Os exemplos acima nos dizem que uma variável pode ser:


a) qualitativa – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor
da pele (branca, preta, amarela, vermelha, parda), etc.;
b) quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos
alunos de uma escola, etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor
entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores
pertencentes a um conjunto enumerável recebe o nome de variável discreta.
Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = {1, 2, 3, ...,
58, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325, etc. Logo, é uma variável discreta. Já o peso desses alunos é
uma variável contínua, pois um dos alunos pode pesar 72 kg, como 72,5 kg, como 72,54 kg, etc., dependendo esse
valor da precisão da medida.

2.2. População e Amostra


A Estatística é uma ciência baseada na teoria das probabilidades, cujo principal objetivo é nos auxiliar a tirar
conclusões, em situações de incerteza, a partir de informações numéricas de uma amostra. É comum, por exemplo, às
vésperas de uma eleição, um jornal afirmar que um candidato A vencerá com uma certa margem de votos. Em geral,
esse tipo de afirmação está baseado numa pesquisa feita entre alguns eleitores, que constituem a amostra da
pesquisa, uma vez que é impossível fazer a pesquisa com todos os eleitores (população envolvida).
A primeira tarefa de um estatístico é definir clara e precisamente o problema a ser estudado, qual a população
envolvida e que amostra irá utilizar.
Exemplo 1: Queremos obter informações sobre a audiência de certo programa de TV, na Grande Vitória.
- População: conjunto de todos os domicílios da região da Grande Vitória que possuem TV.
- Amostra: conjunto de domicílios que serão visitados.

Exemplo 2: Estudar a procedência dos candidatos a uma certa universidade.


- População: conjunto de todos os candidatos à referida universidade.
- Amostra: conjunto dos candidatos que serão entrevistados.

Todos os elementos do grupo a ser estudado constituem a população. A parte da população efetivamente
examinada é a amostra.
Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de 800 (oitocentas) pessoas. Nesse
caso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar os
oitocentos elementos, podemos recorrer a amostragem, ou seja, podemos examinar alguns desses elementos.
É claro que se escolhermos apenas dois desses oitocentos elementos, corremos o risco de selecionar
exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemos
concluir que todos elementos da população também o são.
Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a conclusões erradas, mas
este risco diminui à medida qua aumenta a quantidade de elementos a serem examinados.
Devemos estabelecer um número mínimo de elementos para compor a amostra. Essa quantidade não deve

Prof. Carlos Alexandre Santório 9


Estatística Aplicada

ser menor que 10% do total de elementos da população. Assim, estaremos minimizando as chances das
informações da amostra se afastarem demasiadamente daquelas que obteríamos se examinássemos toda a população.
No exemplo citado anteriormente, como a população tem 800 elementos, devemos escolher uma amostra com,
no mínimo, 80 pessoas (10% de 800).
Podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemática
e amostragem estratificada proporcional.

2.2.1. Amostragem Aleatória Simples


Este tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem aleatória simples pode ser realizada numerando-se a população de 1 a n e
sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais
corresponderão aos elementos pertencentes à amostra.
Exemplo: Vamos obter uma amostra representativa para uma pesquisa da estatura de 90 (noventa) alunos de uma
escola:
a) Numeramos os alunos de 01 a 90.
b) Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma
caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, 9 (nove)
números que formarão a amostra. Neste caso, 10% da população.
Quando o número de elementos da população é grande, esse tipo de sorteio torna-se muito trabalhoso.

2.2.2. Amostragem Sistemática


Continuemos a considerar a população de 90 elementos de nossa lista numerada. Para organizar uma
amostragem sistemática, sorteamos um número de 1 a 10, ao acaso. Suponhamos que tenha sido obtido o número 6.
Ele será o primeiro elemento da amostra, e os demais serão determinados em intervalos de dez unidades. Assim,
nossa amostra será:
6 16 26 36 46 56 66 76 86
A amostragem sistemática é simples de ser realizada e, no caso de amostras muito grandes, acarreta
economia de tempo e dinheiro.

2.2.3. Amostragem Estratificada Proporcional


Muitas vezes a população se divide em subpopulações – estratos.
Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo
e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em
consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem estratificada proporcional, que, além de
considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos
mesmos.
Exemplo: Supondo, no exemplo anterior, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a
amostra estratificada proporcional.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população.
Logo, temos:

Sexo População 10% Amostra


× 54 = 5,4
10
M 54 5
100

× 36 = 3,6
10
F 36 4
100

Prof. Carlos Alexandre Santório 10


Estatística Aplicada

× 90 = 9,0
10
Total 90 9
100
EXERCÍCIOS:
Série Aula:
1) Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas):
a) Universo: alunos de uma escola.
Variável: cor dos cabelos – ....................................
b) Universo: casais residentes em uma cidade.
Variável: número de filhos – ....................................
c) Universo: as jogadas de um dado.
Variável: o ponto obtido em cada jogada – ....................................
d) Universo: peças produzidas por certa máquina.
Variável: nº de peças produzidas por hora – ....................................
e) Universo: peças produzidas por certa máquina.
Variável: diâmetro externo – ....................................
f) População: alunos de uma escola.
Variável: cor dos olhos – ....................................
g) P.: casais residentes em uma cidade.
V.: sexo dos filhos – ....................................

2) Diga quais variáveis abaixo são discretas e quais são contínuas:


a) P.: estação meteorológica de uma cidade.
V.: precipitação pluviométrica, durante um ano – ....................................
b) P.: Bolsa de Valores de São Paulo.
V.: nº de ações negociadas – ....................................
c) P.: funcionários de uma empresa.
V.: salários – ....................................
d) P.: pregos produzidos por uma máquina.
V.: comprimento – ....................................
e) P.: propriedades agrícolas do Brasil.
V.: produção de algodão – ....................................
f) P.: segmentos de reta.
V.: comprimento – ....................................
g) P.: bibliotecas da cidade de São Paulo.
V.: número de volumes – ....................................
h) P.: aparelhos produzidos em uma linha de montagem.
V.: nº de defeitos por unidade – ....................................
i) P.: indústrias de uma cidade.
V.: índice de liquidez – ....................................

3) Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 150 estudantes, entre
os 1.000 matriculados. Responda:
a) Qual é a população envolvida na pesquisa?
b) Que tipo de amostragem foi utilizada e qual é a amostra considerada?

4) A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da cidade de Morro
Grande é apresentada abaixo. Baseando-se nesses dados, estratifique uma amostra com 200 elementos.

Escola População
A 500
B 250
C 440
D 360
Total 1.550

Prof. Carlos Alexandre Santório 11


Estatística Aplicada

5) Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª série, 30 na 3ª série, 28 na 4ª série, 35 na 5ª
série, 32 na 6ª série, 31 na 7ª série e 27 na 8ª série. Obtenha uma amostra de 40 alunos preenchendo a tabela abaixo.

Séries População Cálculo Proporcional Amostra


35 ⋅ 40
1ª 35 = 5,6 6
250
2ª __ = __

3ª __ = __

4ª 28 = __

5ª __ = 6

6ª __ = __

7ª __ = __

8ª __ = __
Total 250 40

6) Uma cidade X apresenta o seguinte quadro relativo às escolas de Ensino Fundamental. Obtenha uma amostra
estratificada proporcional de 120 estudantes.

Nº de Estudantes
Escolas
Masculino Feminino
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total 876 955

Série Casa:
1) População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer;
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de indivíduo de mesmo município, estado ou país.

2) Uma parte da população retirada para analisá-la denomina-se:


a) Universo;
b) Parte;
c) Pedaço;
d) Dados brutos;
e) Amostra.

3) A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem
tirar conclusões sobre um grupo maior denomina-se:
a) Estatística de População;

Prof. Carlos Alexandre Santório 12


Estatística Aplicada

b) Estatística de Amostra;
c) Estatística Inferencial;
d) Estatística Descritiva;
e) Estatística Grupal.

4) Diga qual tipo de variável estamos trabalhando nos casos abaixo:


a) Número de inscrições no Seguro Social;
b) Número de passageiros no ônibus da linha Rio/São Paulo;
c) Escolaridade
d) Peso médio dos recém nascidos;
e) Altitude acima do nível do mar;
f) Uma pesquisa efetuada em 1.015 pessoas indica que 40 delas são assinantes de um serviço de computador on-line;
g) Cada cigarro Camel tem 16,13 mg de alcatrão;
h) O radar indica que Nolan Ryan rebateu a última bola a 82,3 km/h

5) Classifique as seguintes variáveis:


a) Cor dos olhos:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.

b) Número de filhos de um casal:


i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.

c) Peso de um indivíduo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.

d) Altura de um indivíduo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.

e) Número de alunos de uma escola:


i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.

f) Tipo sanguíneo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;

Prof. Carlos Alexandre Santório 13


Estatística Aplicada

iv) Quantitativa discreta;


v) Qualitativa contínua.

6) Na Escola São Miguel, as classes têm 20, 40, 25 e 15 alunos. Determine uma amostra estratificada com 20
elementos.

7) Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por tipo de lazer entre
pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a) Qual a população envolvida na pesquisa?
b) Supondo que na cidade haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200
pessoas.

8) Quer fazer-se um estudo que estabeleça a relação entre faixa salarial e interesse por teatro, tomando-se um grupo
de 1.550 pessoas. A tabela abaixo indica o número de pessoas de determinadas faixas salariais. Determine uma
amostra com 200 elementos.

Faixa salarial Nº de pessoas


Até 3 salários mínimos 776
De 3 a 6 salários mínimos 387
De 6 a 9 salários mínimos 232
Acima de 9 salários mínimos 155
Total 1.550

Prof. Carlos Alexandre Santório 14


Estatística Aplicada

3. Séries Estatísticas
3.1. Tabelas
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que
tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando
esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em
estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.

Tabela é um quadro que resume um conjunto de observações.

3.2. Séries Estatísticas


Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos
em função da época, do local ou da espécie.

Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: o
tempo, o espaço e a espécie.
Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica.

3.2.1. Séries Históricas, Cronológicas ou Temporais


Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis.

Exemplo:

PREÇO DO ACÉM NO VAREJO


SÃO PAULO – 1989-94
Anos Preço Médio (US$)
1989 2,24
1990 2,73
1991 2,12
1992 1,89
1993 2,04
1994 2,62
FONTE: APA.

3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização


Descrevem os valores da variável, em determinado instante, discriminados segundo regiões.

Exemplo:

DURAÇÃO MÉDIA DOS ESTUDOS


SUPERIORES – 1994
Número
Países
de Anos
Itália 7,5
Alemanha 7,0
França 7,0
Holanda 5,9
Inglaterra Menos de 4
FONTE: Revista Veja.

Prof. Carlos Alexandre Santório 15


Estatística Aplicada

3.2.3. Séries Específicas ou Categórica


Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou
categorias.

Exemplo:

REBANHOS BRASILEIROS – 1992


Quantidade
Espécies
(1.000 cabeças)
Bovinos 154.440,8
Bubalinos 1.423,3
Eqüinos 549,5
Asininos 47,1
Muares 208,5
Suínos 34.532,2
Ovinos 19.955,9
Caprinos 12.159,6
Coelhos 6,1
FONTE: IBGE.

3.2.4. Séries Conjugadas – Tabela de Dupla Entrada


Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma
variável, isto é, fazer uma conjugação de duas ou mais séries.
Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse
tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna).

Exemplo:

TERMINAIS TELEFÔNICOS EM SERVIÇO – 1991-93


Regiões 1991 1992 1993
Norte 342.938 375.658 403.494
Nordeste 1.287.813 1.379.101 1.486.649
Sudeste 6.234.501 6.729.467 7.231.634
Sul 1.497.315 1.608.989 1.746.232
Centro-Oeste 713.357 778.925 884.822
FONTE: Ministério das Comunicações.

A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico-
histórica ou geográfico-temporal.
Podem existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três ou
mais entradas.

3.3. Dados Absolutos e Dados Relativos


Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou
medida, são chamados dados absolutos.

Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados
absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades.

Traduzem-se os dados relativos, em geral, por meio de porcentagens, índices, coeficientes e taxas.

Prof. Carlos Alexandre Santório 16


Estatística Aplicada

3.3.1. As Porcentagens
Considere a série:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995


Categorias Número de Alunos
1º grau 19.286
2º grau 1.681
3º grau 234
Total 21.201
Dados fictícios.

Calculemos as porcentagens dos alunos de cada grau:

⋅ 100 = 90,96 = 91,0


19.286
1º grau:
21.201
⋅ 100 = 7,92 = 7,9
1.681
2º grau:
21.201
⋅ 100 = 1,10 = 1,1
234
3º grau:
21.201

Com esses dados, podemos formar uma nova coluna na série em estudo:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995


Categorias Número de Alunos %
1º grau 19.286 91,0
2º grau 1.681 7,9
3º grau 234 1,1
Total 21.201 100,0
Dados fictícios.

Os valores dessa nova coluna nos diz que, de cada 100 alunos da cidade A, 91 estão matriculados no 1º grau,
8, aproximadamente, no 2º grau e 1 no 3º grau.
O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo.
Considere, agora, a série:

MATRÍCULAS NAS ESCOLAS


DAS CIDADES A E B – 1995
Nº de Alunos
Categorias
Cidade A Cidade B
1º grau 19.286 38.660
2º grau 1.681 3.399
3º grau 234 424
Total 21.201 42.483
Dados fictícios.

Qual das cidades tem, comparativamente, maior número de alunos em cada grau?
Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados
absolutos. Porém, usando as porcentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterior
as colunas correspondentes às poscentagens, obtemos:

MATRÍCULAS NAS ESCOLAS

Prof. Carlos Alexandre Santório 17


Estatística Aplicada

DAS CIDADES A E B – 1995


Cidade A Cidade B
Categorias
Nº de Alunos % Nº de Alunos %
1º grau 19.286 91,0 38.660 91,0
2º grau 1.681 7,9 3.399 8,0
3º grau 234 1,1 424 1,0
Total 21.201 100,0 42.483 100,0
Dados fictícios.

o que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo número de alunos em cada grau.

3.3.2. Os Índices
Os índices são razões entre duas grandezas tais que uma não inclui a outra.

São exemplos de índices:

× 100
diâmetro transverso do crânio
Índice cefálico =
diâmetro longitudinal do crânio

× 100
idade mental
Quociente intelectual =
idade crônica

população
Densidade demográfica =
superfície

Índices econômicos:
valor total da produção
Produção per capita =
população
consumo do bem
Consumo per capita =
população
renda
Renda per capita =
população
receita
Receita per capita =
população

3.3.3. Os Coeficientes
Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e número
de não-ocorrências).

São exemplos de coeficientes:

número de nascimentos
Coeficiente de natalidade =
população total

número de óbitos
Coeficiente de mortalidade =
população total

Prof. Carlos Alexandre Santório 18


Estatística Aplicada

Coeficiente educacionais:
número de alunos evadidos
Coeficiente de evasão escolar =
número inicial de matrículas
número de alunos aprovados
Coeficiente de aproveitamento escolar =
número final de matrículas
número de alunos recuperados
Coeficiente de recuperação escolar =
número de alunos em recuparação

3.3.4. As Taxas
As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc.) para tornar o
resultado mais inteligível.

São exemplos de taxas:


Taxa de natalidade = coeficiente de natalidade x 1.000
Taxa de mortalidade = coeficiente de maortalidade x 1.000
Taxa de evasão escolar = coeficiente de evasão escolar x 100

EXERCÍCIOS:
Série Aula:
1) Clasifique as séries:
a)
PRODUÇÃO DE BORRACHA NATURAL – 1991-93
Anos Toneladas
1991 29.543
1992 30.712
1993 40.663
FONTE: IBGE.

b)
AVICULTURA BRASILEIRA – 1992
Número
Espécies
(1.000 cabeças)
Galinhas 204.160
Galos, frangos, frangas e pintos 435.465
Codornas 2.488
FONTE: IBGE.

c)
VACINAÇÃO CONTRA A POLIOMIELITE – 1993
Regiões Quantidade
Norte 211.209
Nordeste 631.040
Sudeste 1.119.708
Sul 418.785
Centro-Oeste 185.823
FONTE: Ministério da Saúde.
d)

Prof. Carlos Alexandre Santório 19


Estatística Aplicada

AQUECIMENTO DE UM MOTOR DE AVIÃO DE MARCA X


Minutos Temperatura (ºC)
0 20
1 27
2 34
3 41
4 49
5 56
6 63
Dados fictícios.

2) A tabela seguinte foi elaborada a partir da leitura do texto de Philip M. Fearnsinde, do Instituto Nacional da Amazônia.
DESMATAMENTO EM RONDÔNIA
Regiões 1975 1978 1980 1983
Área (km2) 1.216,5 4.184,5 7.579,3 13.955,2
% 0,5 1,72 3,12 5,74
FONTE: Revista Ciência Hoje, nº 19.

a) Que tipo de fonte (primária ou secundária) foi consultada para a elaboração da tabela?
b) Que tipo de série está representada na tabela?

3) Uma série estatística é denominada espacial quando?


a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

4) Uma série estatística é denominada cronológica quando?


a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

5) Uma série estatística é denominada composta quando?


a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

6) Construa a tabela e especifique o tipo de série em cada caso:


a) As capacidades dos estádios do Maracanã (Rio de Janeiro), do Morumbi (São Paulo) e do Mineirão (Belo Horizonte)
são, respectivamente: 220.000, 150.000, 110.000 pessoas. (Fonte: Brasil em dados)
b) A população do Brasil em 1962 era de 74.100.000 habitantes; em 1964, de 78.800.000; em 1966, de 83.900.000 e
em 1969, de 92.300.000. (Fonte: IBGE)

7) Uma escola registrou em março, na 1ª série, a matrícula de 40 alunos e a matrícula efetiva, em dezembro, de 35
alunos. A taxa de evasão foi de:

TEE = × 100 = × 100 = × 100 = 12,5%


nº de evadidos 40 - 35
nº matrícula inicial 40
8) Complete a tabela abaixo:

Prof. Carlos Alexandre Santório 20


Estatística Aplicada

Dados Relativos
Escolas Nº de Alunos
Por 1 Por 100
A 175 0,098 9,8 Cálculos:
A→ × 1 = 0,098
B 222 _____ _____ 175
C 202 _____ _____ 1.781
D 362 _____ _____
E 280 _____ _____
F 540 _____ _____
Total 1.781 1,000 100,0

9) São Paulo tinha, em 1992, uma população de 32.182,7 mil habitantes. Sabendo que sua área terrestre é de
248.256 km2, calcule a sua densidade demográfica.

10) Um professor preencheu um quadro, enviado pela D.E., com os seguintes dados:
Nº de Nº de Promovidos Em Total Geral
Retidos sem Não-
Série Alunos Alunos sem recuperaçã Recuperados Promovido
recuperação recuperados Retidos
30/03 30/11 recuperação o s
1º A 49 44 35 03 06 05 01 40 04
1º B 49 42 42 00 00 00 00 42 00
1º C 47 35 27 00 08 03 05 30 05
1º D 47 40 33 06 01 00 01 33 07
Total 192 161 137 09 15 08 07 145 16

Calcule:
a) a taxa de evasão, por classe.
b) a taxa de evasão total.
c) a taxa de aprovação, por classe.
d) a taxa de aprovação geral.
e) a taxa de recuperação, por classe.
f) a taxa de recuperação geral.
g) a taxa de reprovação na recuperação geral.
h) a taxa de aprovação, sem a recuperação.
i) a taxa de retidos, sem a recuperação.

Série Casa:
1) Calcule a taxa de aprovação de um professor de uma classe de 45 alunos, sabendo que obtiveram aprovação de 36
alunos.

2) Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):
ƒ
ƒ
população: 15.957,6 mil habitantes;
superfície: 586.624 km2;
ƒ nascimentos: 292.036;
ƒ óbitos: 99.281.

Calcule:
a) o índice de densidade demográfica;
b) a taxa de natalidade;
c) a taxa de mortalidade.

3) Uma série estatística é denominada categórica quando?


a) O elemento variável é o tempo;

Prof. Carlos Alexandre Santório 21


Estatística Aplicada

b) O elemento variável é o local;


c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

4) Uma série estatística é denominada geográfica quando?


a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

5) Uma série estatística é denominada específica quando?


a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

6) Uma série estatística é denominada mista quando?


a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

7) Uma série estatística é denominada temporal quando?


a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os resultados são agrupados em subintervalos do intervalo observado.

8) Uma escola apresentava, no final do ano, o seguinte quadro:


Matrículas
Séries
Março Novembro
1ª 480 475
2ª 458 456
3ª 436 430
4ª 420 420
Total 1.794 1.781

a) Calcule a taxa de evasão por série.


b) Calcule a taxa de evasão da escola.

Prof. Carlos Alexandre Santório 22


Estatística Aplicada

4. Distribuição de Frequência
Praticamente se resume na maneira de ordenar os dados estatísticos em linhas ou colunas, tornando possível
sua leitura, tanto no sentido horizontal quanto no vertical.

4.1. Tabela Primitiva / Rol


Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 (quarenta) alunos, que compõem
uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores:

ESTATURA DE 40 ALUNOS DO COLÉGIO A


166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela
primitiva.
A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente).
A tabela obtida após a ordenação dos dados recebe o nome de rol.

ESTATURA DE 40 ALUNOS DO COLÉGIO A


150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a
amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no
conjunto. Com um exame mais acurado, vemos qua há uma concentração das estaturas em algum valor entre 160 cm e
165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm.

4.2. Distribuição de Freqüência


Denominamos frequência o número de alunos que fica relacionado a um determinado valor da variável.
Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência:

ESTAT. ESTAT. ESTAT.


FREQ. FREQ. FREQ.
(cm) (cm) (cm)
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1
Total 40
157 1 166 1

Este tipo de tabela não é aconselhavel quando estamos trabalhando com amostragens grandes, sendo que
poderá ficar muito extensa, dificultando, além de sua elaboração, as análises e conclusões dos dados pesquisados.
Sendo possível, a solução mais aceitável é o agrupamento dos valores em vários intervalos.
Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da
tabela acima, podem ser dispostos como na tabela abaixo, denominada distribuição de frequência com intervalo de
classe:

Prof. Carlos Alexandre Santório 23


Estatística Aplicada

ESTATURA DE 40 ALUNOS DO COLÉGIO A


Estaturas
Frequência
(cm)
150 |–– 154 4
154 |–– 158 9
158 |–– 162 11
162 |–– 166 8
166 |–– 170 5
170 |–– 174 3
Total 40

4.3. Elementos de uma Distribuição de Freqüência


4.3.1. Classe
Classes são intervalos de variação da variável.

4.3.2. Limites de Classe


Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe (L i) e
o maior número, o limite superior da classe (Lf).

4.3.3. Amplitude de um Intervalo de Classe


Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a
classe.
Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por h. Assim:

h = Lf – Li

4.3.4. Amplitude Total da Distribuição


Amplitude total da distribuição (At) é a diferença entre o limite superior da última classe (limite superior
máximo) e o limite inferior da primenra classe (limite inferior mínimo):
At = Lf (máx.) – Li (mín.)

4.3.5. Ponto Médio de uma Classe


É o ponto que divide o intervalo de classe em duas partes iguais.
Li + Lf
Pm =
2

4.4. Determinação do número de Classes


Não existe regra fixa para se determinar o número de classes. Sturges sugere uma regra para a determinação
do número de classes (desde que se conheça o número de observações ou informações), que é a seguinte:

n = 1 + 3,3 . log N
onde,
n = número de classes
N = número de dados (observações) a distribuir

Prof. Carlos Alexandre Santório 24


Estatística Aplicada

Outra maneira de estipular o número de classes é empregando a seguinte relação (conhecendo a amplitude):

At
n=
h

4.5. Tipos de Freqüências


Freqüências simples ou absoluta (Fi) são os valores que realmente representam o número de dados de

∑Fi = N
cada classe. Assim, a soma das freqüências simples é igual ao número total dos dados:

Freqüências simples relativas (fi) são os valores das razões entre freqüências simples e a freqüência total:

fi =
Fi
∑ Fi

Freqüência acumulada (Fa) é o total das freqüências de todos os valores inferiores ao limite superior do
intervalo de uma dada classe:

Fa = ∑ Fi (i = 1, 2, ..., k)

Freqüência acumulada relativa (fa) são os valores das razões entre freqüências simples e a freqüência total:

fa =
Fa
∑ Fi

Considerando a tabela do exemplo anterior (item 4.2), podemos montar a seguinte tabela com as frequências
estudadas:
ESTATURA DE 40 ALUNOS DO COLÉGIO A
Estaturas
i Fi Pm fi Fa fa
(cm)
1 150 |–– 154 4 152 0,100 4 0,100
2 154 |–– 158 9 156 0,225 13 0,325
3 158 |–– 162 11 160 0,275 24 0,600
4 162 |–– 166 8 164 0,200 32 0,800
5 166 |–– 170 5 168 0,125 37 0,925

∑ = 40 ∑ = 1,000
6 170 |–– 174 3 172 0,075 40 1,000
Total

4.6. Distribuição de Freqüência sem Intervalos de Classe


Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado com um
intervalo de classe (intervalo degenerado) e, nesse caso, a distribuição é chamada distribuição sem intervalo de
classe, tomando a seguinte forma:

xi Fi
x1 F1
x2 F2
x3 F3
F4

Σ Fi = N
xN F5

Prof. Carlos Alexandre Santório 25


Estatística Aplicada

Exemplo:
Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:

i xi Fi
1 2 4
2 3 7
3 4 5
4 5 2
5 6 1

Σ = 20
6 7 1

Completada com os vários tipos de freqüências, temos:


i xi Fi Fa fi fa
1 2 4 4 0,20 0,20
2 3 7 11 0,35 0,55
3 4 5 16 0,25 0,80
4 5 2 18 0,10 0,90
5 6 1 19 0,05 0,95

∑ = 20 ∑ = 1,00
6 7 1 20 0,05 1,00

EXERCÍCIOS:
Série Aula:
1) As notas obtidas por 50 alunos de uma classe foram:
1 2 3 4 5 6 6 7 7 8
2 3 3 4 5 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9

Complete a distribuição de freqüência abaixo:

i Notas Pm Fi
1 0 |–– 2 1 1
2 2 |–– 4 ___ ___
3 4 |–– 6 ___ ___
4 6 |–– 8 ___ ___

∑ = 50
5 8 |–– 10 ___ ___

2) Complete a tabela abaixo:

i Classes Fi Fa fi (%) fa (%)


1 0 |–– 8 4 ___ ___ ___
2 8 |–– 16 10 ___ ___ ___
3 16 |–– 24 14 ___ ___ ___
4 24 |–– 32 9 ___ ___ ___

∑ = 40 ∑ = 100 %
5 32 |–– 40 3 ___ ___ ___

3) Complete os dados que faltam na distribuição de freqüência:

Prof. Carlos Alexandre Santório 26


Estatística Aplicada

i xi Fi Fa fi (%) fa (%)
1 0 1 ___ 5,0 ___
2 1 ___ 4 15,0 ___
3 2 4 ___ ___ ___
4 3 ___ 13 25,0 ___
5 4 3 ___ 15,0 ___
6 5 2 18 ___ ___
7 6 ___ 19 ___ ___

∑ = 20 ∑ = 100 %
8 7 ___ ___ ___ ___

4) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes:

Áreas
300 |–– 400 |–– 500 |–– 600 |–– 700 |–– 800 |–– 900 |–– 1.000 |–– 1.100 |–– 1.200
(m2)
Nº de
14 46 58 76 68 62 48 22 6
Lotes

Com referência a essa tabela, determine:


a) a amplitude total;
b) o limite superior da quinta classe;
c) o limite inferior da oitava classe;
d) o ponto médio da sétima classe;
e) a amplitude do intervalo da segunda classe;
f) a freqüência da quarta classe;
g) a freqüência relativa absoluta da sexta classe;
h) a freqüência acumulada da quinta classe;
i) o número de lotes cuja área não atinge 700 m2;
j) o número de lotes cuja área atinge e ultrapassa 800 m2;
k) a porcentagem de lotes cuja área não atinge 600 m2;
l) a porcentagem de lotes cuja área seja maior ou igual a 900 m2;
m) a porcentagem de lotes cuja área é de 500 m2, no mínimo, mas inferior a 1.000 m2;
n) a classe do 72º lote;
o) até que classe estão incluídos 60% dos lotes.

Série Casa:
1) Complete a distribuição abaixo, determinando as frequências absolutas:
i xi Fi Fa
1 2 ___ 2
2 3 ___ 9
3 4 ___ 21
4 5 ___ 29

∑ = 34
5 6 ___ 34

2) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus:
Nº de acidentes 0 1 2 3 4 5 6 7
Nº de motoristas 20 10 16 9 6 5 3 1

Determine:
a) o número de motoristas que não sofreram nenhum acidente;
b) o número de motoristas que sofreram pelo menos 4 acidentes;

Prof. Carlos Alexandre Santório 27


Estatística Aplicada

c) o número de motoristas que sofreram menos de 3 acidentes;


d) o número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes;
e) a porcentagem dos motoristas que sofreram no máximo 2 acidentes.

3) Complete os dados que faltam na distribuição de freqüência:


i Classes Pm Fi Fa fi (%) fa (%)
1 0 |–– 2 1 4 ___ 4,0 ___
2 2 |–– 4 ___ 8 ___ ___ ___
3 4 |–– 6 5 ___ 30 18,0 ___
4 __ |–– __ 7 27 ___ 27,0 ___
5 8 |–– 10 ___ 15 72 ___ ___
6 10 |–– 12 ___ ___ 83 ___ ___
7 __ |–– __ 13 10 93 10,0 ___

∑ = ___ ∑ = ___
8 14 |–– 16 ___ ___ ___ 7,0 ___

4) Conhecidas as notas de 50 alunos:


84 68 33 52 47 73 68 61 73 77
74 71 81 91 65 55 57 35 85 88
59 80 41 50 53 65 76 85 73 60
67 41 78 56 94 35 45 55 64 74
65 94 66 48 39 69 89 98 42 54

obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.

5) As notas obtidas em Matemática por 80 estudantes de uma escola X estão relacionadas abaixo:
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
a) Organize o rol colocando os dados em ordem crescente.
b) Qual é a menor nota? Qual é a maior nota?
c) Qual é a amplitude total?
d) Qual é a nota do estudante classificado em 10º lugar?
e) Organize os dados em classes considerando 5 como amplitude.
f) Faça a distribuição de freqüências.
g) Quantos estudantes receberam nota superior ou igual a 85? Qual a porcentagem?

6) Observando a tabela abaixo, responda:


Faixa de renda Habitações
Até 1 salário mínimo 224.740
De 1 a 3 salários mínimos 363.860
De 4 a 8 salários mínimos 155.700
Acima de 8 salários mínimos 47.500
Total 791.800

a) Qual é a porcentagem de domicílios onde a renda é superior a 8 salários mínimos?


b) Quantos são os domicílios onde a renda está entre 1 e 3 salários?
c) Quantos são os domicílios onde a renda está abaixo de 3 salários?

Prof. Carlos Alexandre Santório 28


Estatística Aplicada

7) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição de freqüência abaixo:

Duração Nº de
(em horas) lâmpadas
300 |–– 400 14
400 |–– 500 46
500 |–– 600 58
600 |–– 700 76
700 |–– 800 68
800 |–– 900 62
900 |–– 1.000 48
1.000 |–– 1.100 22

∑ = 400
1.100 |–– 1.200 6
Total

Observando a tabela, responda:


a) Qual a amplitude de cada classe?
b) Qual a amplitude total da distribuição?
c) Qual o ponto médio da quinta classe?
d) Qual a freqüência relativa absoluta da sexta classe?
e) Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas?
f) Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais?
g) Construir uma tabela de distribuição de freqüência, em que apareçam Pm, Fi, Fa, fi e fa.

Prof. Carlos Alexandre Santório 29


Estatística Aplicada

5. Gráficos Estatísticos
5.1. Representação Gráfica
Os gráficos constituem um poderoso instrumento de análise e interpretação de um conjunto de dados. Eles
aparecem nos mais variados veículos de comunicação. Pesquisas de opinião pública, pesquisas eleitorais, economia,
agricultura, saúde são apenas alguns exemplos de assuntos em que as representações gráficas assumem um papel
fundamental para explicar o comportamento do objeto de estudo. Os mais importantes recursos fornecidos pelos
gráficos são a facilidade e a rapidez na absorção e interpretação dos resultados, por parte do leitor.

5.1.1. Gráfico de Linha


Os gráficos de linhas são bastante utilizados na identificação de tendências de aumento ou diminuição dos
valores numéricos de uma dada informação. Assim, vamos encontrar com frequência esse tipo de representação em
análises tais como lucros de empresas, incidência de moléstias, índices de crescimento populacional ou de mortalidade
infantil, índices de custo de vida, etc. Seu traço é feito no plano cartesiano.

Exemplo:
Na cidade de São Joaquim (SC), foi anotada a temperatura registrada às 8 horas, durante sete dias
consecutivos, conforme a seguinte tabela:

TEMPERATURA NA CIDADE
DE SÃO JOAQUIM – SC
Dia Temperatura (ºC)
1º 1
2º –2
3º –3
4º 4
5º 5
6º 6
7º 7

Com base na tabela, façamos a representação gráfica da variação de temperatura.

Solução:

8
7
6
5
Temperatura (ºC)

4
3
2
1
0
-1 1º 2º 3º 4º 5º 6º 7º
-2
-3
-4
Dia

5.1.2. Gráfico de Colunas ou de Barras


É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou
horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados.

Prof. Carlos Alexandre Santório 30


Estatística Aplicada

Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos
dados.
Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos.

Exemplo:
a) Gráfico em colunas
PRODUÇÃO BRASILEIRA DE
CARVÃO MINERAL BRUTO
1989-92
Quant. Produzida
Anos
(1.000 t)
1989 18.196
1990 11.168
1991 10.468
1992 9.241
Fonte: Ministério da Agricultura

20.000
Mil toneladas

15.000

10.000

5.000

0
1989 1990 1991 1992
Anos

b) Gráfico em barras
EXPORTAÇÕES BRASILEIRAS
MARÇO – 1995
Valor
Estados
(US$ milhões)
São Paulo 1.344
Minas Gerais 542
Rio Grande do Sul 332
Espírito Santo 285
Paraná 250
Santa Catarina 202
Fonte: SECEX

São Paulo
Minas Gerais
Rio Grande do Sul
Espírito Santo
Paraná
Santa Catarina

0 500 1.000 1.500


Milhões de dólares

Prof. Carlos Alexandre Santório 31


Estatística Aplicada

5.1.3. Gráfico de Colunas ou de Barras Múltiplas


Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais
fenômenos estudados com o propósito de comparação.
Exemplo:

BALANÇA COMERCIAL DO BRASIL – 1989-93


Valor (US$ 1.000.000)
Especificações
1989 1990 1991 1992 1993
Exportação (FOB) 34.383 31.414 31.620 35.793 38.783
Importação 18.263 20.661 21.041 20.554 25.711
Fonte: Ministério da Fazenda

40.000

30.000
US$ milhão

20.000

10.000

0
1989 1990 1991 1992 1993

Ex portação (FOB) Importação

5.1.4. Gráfico de Setores


A estatística recorre com frequência a esse tipo de gráfico, que consiste em distribuir num círculo setores
proporcionais aos dados do problema. O gráfico de setores, ou setograma, é utilizado principalmente quando as
quantidades a serem comparadas são muito diferentes umas das outras, caso em que uma ou mais delas se salientam
em relação ao conjunto.
Exemplo:
DISTRIBUIÇÃO DE REMUNERAÇÕES MENSAIS NO BRASIL – 1983
Faixa Salarial
Nº de empregados %
(em salários mínimos)
Até 3 salários 11.770.000 67,1
De 3 a 7 salários 3.931.000 22,4
De 7 a 15 salários 1.355.000 7,7
Mais de 15 salários 483.000 2,8
Total 17.539.000 100,0

De 7 a 15 Mais de 15
salários salários

% Graus
De 3 a 7 67,1 241,6
salários 22,4 80,6
7,7 27,7
2,8 10,1

Até 3 salários

Prof. Carlos Alexandre Santório 32


Estatística Aplicada

5.2. Representação Gráfica de Distribuição de Frequência


Uma distribuição de frequência pode ser representada graficamente pelo histograma, pelo polígono de
frequência e pelo polígono de frequência acumulada.

5.2.1. Histograma
O histograma é um gráfico constituído no plano cartesiano por retângulos em número igual ao número de
classes da distribuição. Cada classe é representada por uma coluna de altura correspondente a sua frequência.
Trata-se também de um gráfico de área. É utilizado para variáveis contínuas; por isso, o gráfico também é
contínuo: as colunas são justapostas. A área de cada coluna é proporcional à frequência da classe representada. Logo,
a área de todo o histograma é proporcional à soma total das frequências.
Exemplo:
i Classes Pm Fi Fa fi (%) fa (%)
1 150 |--- 155 152,5 6 6 15,0 15,0
2 155 |--- 160 157,5 10 16 25,0 40,0
3 160 |--- 165 162,5 15 31 38,0 78,0
4 165 |--- 170 167,5 5 36 12,0 90,0
5 170 |--- 175 172,5 3 39 8,0 98,0
6 175 |--- 180 177,5 1 40 2,0 100,0
Total 40 100,0

15

10
Fi

0
150 155 160 165 170 175 180

5.2.2. Polígono de Frequência


Num sistema de coordenadas cartesianas ortogonais, tomamos sobre o eixo das abscissas segmentos
proporcionais aos valores dos pontos médios das classes, e sobre o eixo das ordenadas segmentos proporcionais às
frequências, determinando pontos no plano.
Unindo os pontos obtidos, determinamos um diagrama poligonal, que convencionalmente é fechado no eixo
das abscissas pelo ponto médio da classe imediatamente inferior à inicial e pelo ponto médio da classse imediatamente
superior à final. Desta forma, obtemos um polígono de frequência.
Vejamos agora como, a partir da tabela do item anterior, podemos construir um polígono de frequência.
15

12

9
Fi

0
150 155 160 165 170 175 180

Prof. Carlos Alexandre Santório 33


Estatística Aplicada

5.2.3. Ogiva
A ogiva é um gráfico de frequências acumuladas, o que justifica ser também denominada curva de
caumulação de frequências.
Retomando o exemplo do item 5.2.1., podemos construir um gráfico de ogiva com os valores de frequência
acumulada (Fa).

40

Fa 30

20

10

0
150 155 160 165 170 175 180

EXERCÍCIOS:
Série Aula:
1)
Retrato do Orçamento Familiar
Itens que mais pesam (%)
Saúde e cuidados
Educação, leitura e
pessoais (12,01)
recreação (9,23) Transportes (13,95)

Vestuário (5,08)
Alimentação
Despesas div ersas (25,12)
(inclui bebidas,
cigarros e jogos
H abitação (31,15)
eletrônicos) (3,46)

Renda média familiar Renda per capita


Capital
(em salários mínimos) (em salários mínimos)
Belém 7,52 1,95
Belo Horizonte 10,76 2,69
Brasília 23,83 6,40
Curitiba 12,59 3,57
Florianópolis 12,06 3,34
Fortaleza 9,34 2,24
Goiânia 7,42 1,86
Porto Alegre 12,73 3,88
Recife 9,08 2,26
Salvador 6,06 1,43
Rio de Janeiro* 17,20 5,60
São Paulo* 15,62 4,27
* Para o Rio e São Paulo, os dados são referentes à Pesquisa do Orçamento Familiar de 1997/98.
Fonte: O Estado de São Paulo, 15/03/2001.

Considerando que, nos primeiros meses de 2002, o salário mínimo era de R$ 200,00, aproximadamente, analise as
informações seguintes, classificando-as em V ou F, justificando:
I. Em Belém, uma família gastava, em média, R$ 468,00 por mês em moradia.

Prof. Carlos Alexandre Santório 34


Estatística Aplicada

II. No Recife, um indivíduo gastava menos de R$ 65,00 por mês em transporte.


III. Os gastos com saúde de uma família em Fortaleza superavam os gastos com transportes de uma
família em Goiânia.
IV. Descontados os gastos com habitação e alimentação, sobravam a uma família paulista menos de
R$ 1.300,00 por mês.

2) Analisando o gráfico de colunas ao lado, classifique Rádio


em V ou F cada sentença seguinte, justificando: Emissoras - 2000
1064
a) Se esse conjunto de dados fosse representado em um
gráfico de setores (pizza), o ângulo correspondente à
região Sul seria menor que 90º. 762
664
b) O número de emissoras da região Sudeste supera a
soma do número de emissoras das regiões Nordeste,
Centro-Oeste e Norte.
227
c) Supondo que Goiás concentre 60% das emissoras de 165
sua região, o percentual de emissoras do país
representado por este Estado é menor que 5%.
Sudeste Sul Nordeste Centro-Oeste Norte
3)

O pesadelo vai continuar a) Quais as medidas dos ângulos apresentados


Sim
4% no gráfico ao lado?
VEJA on-line perguntou
b) Quantos internautas responderam “sim”?
aos internautas:
“Capturando Bin Laden,
os EUA estarão livres de
novos atentados?”

Não
96%
Total de participantes: 1.061

4) O histograma abaixo representa o tempo de espera (em minutos) na fila de um banco, em certa manhã, no centro de
Belo Horizonte. Que porcentagem do total de pessoas esperou até 20 minutos na fila?
Fi
16

12

6
4
2
Tempo
8 12 16 20 24 28

5) Considere os resultados abaixo de medição de temperatura, obtidos durante 10 dias, no mesmo horário, e construa
um gráfico de linha.

Dia 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Temperatura (ºC) 32 35 34 30 28 31 32 33 30 29

Prof. Carlos Alexandre Santório 35


Estatística Aplicada

6) A tabela abaixo representa, em termos percentuais, a distribuição da população brasileira por cor. Construa:
a) um gráfico de setores;
b) um gráfico de colunas.

Cor %
Branca 54,23
Preta 5,92
Amarela 0,56
Parda 38,85
Sem declaração 0,44
Total 100,00
Fonte: IBGE.

7) Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um
grupo de alunos, responda?
a) Qual é o intervalo de classe que tem maior freqüência?
b) Qual a amplitude total da distribuição?
c) Qual o número total de alunos?
d) Qual é a freqüência do intervalo de classe 110 |–– 120?
e) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110?
f) Quantos alunos receberam notas de teste não inferiores a 100?

30

25

20

15

10

0
20 40 60 80 100 120 140 160

Série Casa:
1) Construa um gráfico de linha a partir da seguinte tabela:

COMÉRCIO EXTERIOR
BRASIL – 1984-93
Quantidade (1.000 t)
Anos
Exportação Importação
1984 141.737 53.988
1985 146.351 48.870
1986 133.832 60.597
1987 142.378 61.975
1988 169.666 58.085
1989 177.033 57.293
1990 168.095 57.184
1991 165.974 63.278
1992 167.295 68.059
1993 182.561 77.813

Prof. Carlos Alexandre Santório 36


Estatística Aplicada

2) Represente as tabelas usando o gráfico de colunas:


a) b)
PRODUÇÃO BRASILEIRA DE ENTREGA DE GASOLINA
PETRÓLEO BRUTO PARA CONSUMO
1991-93 BRASIL – 1988-91
Quantidade Volume
Anos Anos
(1.000 m3) (1.000 m3)
1991 36.180,4 1988 9.267,7
1992 36.410,5 1989 9.723,1
1993 37.164,3 1990 10.121,3
Fonte: Petrobrás 1991 12.345,4
Fonte: IBGE

3) Represente as tabelas usando o gráfico de barras:


a) Fonte: IBGE
PRODUÇÃO DE OVOS b)
DE GALINHA PRODUÇÃO DE VEÍCULOS
BRASIL – 1992 DE AUTOPROPULSÃO
Quantidade BRASIL – 1993
Regiões Tipos Quantidade
(1.000 dúzias)
Norte 57.297 Automóveis 1.100.278
Nordeste 414.804 Comerciais leves 224.387
Sudeste 984.659 Comerciais pesados 66.771
Sul 615.978 Fonte: ANFAVEA
Centro-Oeste 126.345

4) Construa um gráfico de colunas múltiplas a partir da seguinte tabela:


PROPORÇÃO DOS DOMICÍLIOS POR CONDIÇÃO DE OCUPAÇÃO
BRASIL – 1990-91
NATUREZA
Anos
Próprios (%) Alugados (%) Cedidos (%)
1990 62,7 22,9 14,4
1991 70,3 16,5 13,2

5) Represente as tabelas por meio de gráficos de setores:


a) b)
ÁREA TERRESTRE PRODUÇÃO DE FERRO-GUSA
BRASIL BRASIL – 1993
Regiões Relativa (%) Produção
Estados
Norte 45,25 (1.000 t)
Nordeste 18,28 Minas Gerais 12.888
Sudeste 10,85 Espírito Santo 3.174
Sul 6,76 Rio de Janeiro 5.008
Centro-Oeste 18,86 São Paulo 2.912
Total 100,0 Fonte: Instituto Brasileiro de Siderurgia
Fonte: IBGE

6) A tabela a seguir mostra as áreas, em milhões de km2, dos oceanos. Representar graficamente os dados, usando: a)
um gráfico de colunas; b) um gráfico de setores.

Oceano Antártico Ártico Atlântico Índico Pacífico


Área
36,8 23,2 199,4 137,9 342,7
(milhões de km2)

7) Construa um gráfico de setores a partir da seguinte tabela:

Prof. Carlos Alexandre Santório 37


Estatística Aplicada

Espécie Quantidade
Auxílio-natalidade 901.000
Auxílio-doença 467.000
Auxílio-funeral 88.000
Aposentadoria por Invalidez 40.000
Aposentadoria por Tempo de Serviço 39.000
Abono Permanente em Serviço 30.000
Pensão por Morte 73.000
Outras Espécies 44.000

8) Dada a amostra: 3, 4, 4, 5, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-se:


a) construir a distribuição das freqüências absolutas;
b) determinar as freqüências acumuladas, relativas absolutas e relativas acumuladas.
c) construir o gráfico das freqüências absolutas (faça o gráfico que preferir).

9) De um exame final de Estatística, aplicado em 54 alunos da Faculdade FESAV, resultaram as seguintes notas:

7,0 6,7 3,5 4,2 5,0 6,2 7,2 8,9 9,0


7,1 6,9 6,7 7,4 6,2 5,1 4,3 6,9 7,0
2,1 4,2 6,4 7,1 8,3 9,2 6,6 7,1 1,7
2,8 4,5 5,7 6,1 6,8 7,5 6,4 6,5 8,3
8,6 7,0 9,8 10,0 7,5 7,8 6,9 6,1 5,0
8,0 7,8 7,0 8,0 7,2 7,0 7,4 6,9 5,0

Pede-se:
a) Construir uma tabela de distribuição de freqüência, iniciando com 1,6 e adotando amplitude do intervalo de
classe igual a 1,4, fechado à esquerda.
b) Os pontos médios.
c) Elaborar uma distribuição de freqüência acumulada e percentual (absoluta e acumulada).
d) Quantos alunos obtiveram notas inferiores a 5,0?
e) Quantos alunos obtiveram notas entre 5,0 e 8,0?
f) Que porcentagem de alunos obteve notas acima ou igual a 7,0?
g) Construa o gráfico de setores para as classes.

10) Construa um gráfico de colunas considerando a tabela abaixo:

DISTRIBUIÇÃO DE RENDA NO BRASIL – 1971


Faixa de renda Habitações
Até 1 salário mínimo 224.740
De 1 a 3 salários mínimos 363.860
De 4 a 8 salários mínimos 155.700
Acima de 8 salários mínimos 47.500
Total 791.800

11) Represente num gráfico de setores as faixas de renda observadas no Brasil, em 1971, de acordo com a tabela
observada no exercício 14 acima. Para isso, utilize as freqüências relativas absolutas.

12) A tabela abaixo no fornece as principais altas de preço verificadas no Brasil, no período de setembro a 11 de
novembro de 1984. Construa um gráfico de colunas, com estes dados.

ELEVAÇÃO ACUMULADA DE SETEMBRO A


11 DE NOVEMBRO DE 1984
Produto % de alta

Prof. Carlos Alexandre Santório 38


Estatística Aplicada

Carne 2,5
Leite 10,7
Frutas 18,7
Vestuário 14,5
Fonte: IBGE.

13) Considerando as distribuições de freqüência seguintes, confeccione, para cada uma:


a) o histograma;
b) o polígono de freqüência;
c) a ogiva.
I.
i Pesos (kg) Fi II.
1 40 |–– 44 2 i Estaturas (cm) Fi
2 44 |–– 48 5 1 150 |–– 156 1
3 48 |–– 52 9 2 156 |–– 162 5
4 52 |–– 46 6 3 162 |–– 168 8
4 168 |–– 174 13
Σ = 26
5 56 |–– 60 4

Σ = 30
5 174 |–– 180 3

III.
i Salários (R$) Fi
1 500 |–– 700 8
2 700 |–– 900 20
3 900 |–– 1.100 7
4 1.100 |–– 1.300 5
5 1.300 |–– 1.500 2
6 1.500 |–– 1.700 1

Σ = 44
7 1.700 |–– 1.900 1

14) Conhecidas as notas de 50 alunos:


68 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
Determine:
a) a distribuição de freqüência começando por 30 e adotando o intervalo de classe de amplitude igual a 10;
b) as freqüências acumuladas;
c) as freqüências relativas;
d) o histograma, o polígono de freqüência e a ogiva.

15) Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo:
Nebulosidade 0 |–– 0,5 |–– 1,5 |–– 2,5 |–– 3,5 |–– 4,5 |–– 5,5 |–– 6,5 |–– 7,5 |–– 8,5 |–– 9,5 |–– 10,0
Fi 320 125 75 65 45 45 55 65 90 145 676
Construa o histograma correspondente.

Prof. Carlos Alexandre Santório 39


Estatística Aplicada

6. Medidas de Posição: Medidas de Tendência Central


As medidas de posição mais importantes são as medidas de tendência central, que recebem tal
denominação pelo fato dos dados observados tenderem, em geral, a se agrupar em torno de valores centrais. Dentre as
medidas de tendência central, destacamos:
- A média aritmética
- A mediana
- A moda

As outras medidas de posição são as separatrizes, que englobam:


- A própria média aritmética
- Os quartis
- Os percentis

6.1. Média Aritmética ( x )


Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos estudos iremos nos
limitar à mais importante: a média aritmética.
Média aritmética é o quociente da soma dos valores da variável pelo número deles:
Σ xi
x=
n
sendo:
x é a média aritmética;
x i os valores da variável;
n o número de valores.

6.1.1. Dados não-agupados


Quando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos a
média aritmética simples.

Exemplo:
Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kg,
temos, para venda média diária na semana de:
Σ x i 10 + 14 + 13 + 15 + 16 + 18 + 12
x= = = 14
n 7

Logo: x = 14 kg

6.1.2. Desvio em relação à média


É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:. d i = x i − x .
No exemplo anterior temos sete desvios:.
d1 = 10 – 14 = –4 d5 = 16 – 14 = 2
d2 = 14 – 14 = 0 d6 = 18 – 14 = 4
d3 = 13 – 14 = –1 d7 = 12 – 14 = –2
d4 = 15 – 14 = 1
Estatística Aplicada

6.1.3. Propriedades da média


1ª propriedade:
A soma algébrica dos desvios em relação à média é nula:

∑di = 0
k

i=1

No exemplo anterior:

∑ d i = ( −4) + 0 + ( −1) + 1 + 2 + 4 + ( −2) = ( −7) + 7 = 0 ⇒ ∑ d i = 0


7 7

i=1 i =1

2ª propriedade:
Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica
aumentada (ou diminuída) dessa constante:
yi = xi ± c ⇒ y = x ± c

Somando 2 a cada um dos valores da variável do exemplo dado, temos:


y1 = 12, y2 = 16, y3 = 15, y4 = 17, y5 = 18, y6 = 20 e y7 = 14,

Daí:
∑ y i = 12 + 16 + 15 + 17 + 18 + 20 + 14 = 112
k

i=1

Logo:
y= = 16 ⇒ y = 16 = 14 + 2 ⇒ y = x + 2
112
7

3ª propriedade:
Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto
fica multiplicada (ou dividida) por essa constante:

yi = xi × c ⇒ y = x × c yi = ⇒y=
xi x
ou
c c

Multiplicando por 3 cada um dos valores da variável do exemplo dado, temos:


y1 = 30, y2 = 42, y3 = 39, y4 = 45, y5 = 48, y6 = 54 e y7 = 36,

Daí:
∑ y i = 30 + 42 + 39 + 45 + 48 + 54 + 36 = 294
k

i=1

Logo:
y= = 42 ⇒ y = 42 = 14 × 3 ⇒ y = x × 3
294
7

6.1.4. Dados agrupados

6.1.4.1. Sem intervalos de classe


Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos
do sexo masculino:
Estatística Aplicada

Nº de meninos Fi
0 2
1 6
2 10
3 12

Σ = 34
4 4

Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como
fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:
Σ x i ⋅ Fi
x=
Σ Fi

produtos x i ⋅ Fi :
O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos

Nº de
Fi x i ⋅ Fi
meninos
0 2 0
1 6 6
2 10 20
3 12 36

Σ = 34 Σ = 78
4 4 16

Temos, então:
Σ xi ⋅ Fi 78
x= = = 2,29 ⇒ x = 2,3
Σ Fi 34

Logo: x = 2,3 meninos.

6.1.4.2. Com intervalos de classe


Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem
com o seu ponto médio (Pm), e determinamos a média aritmética ponderada por meio da fórmula:
Σ x i ⋅ Fi
x=
Σ Fi

onde xi é o ponto médio (Pm) da classe.

Exemplo: Calcular a estatura média dos alunos de uma escola conforme a tabela abaixo.
i Estaturas (cm) Fi
1 150 |–– 154 4
2 154 |–– 158 9
3 158 |–– 162 11
4 162 |–– 166 8
5 166 |–– 170 5

Σ = 40
6 170 |–– 174 3

Vamos abrir uma coluna para os pontos médios e outra para os produtos x i ⋅ Fi :
Estatística Aplicada

i Estaturas (cm) Fi xi x i ⋅ Fi
1 150 |–– 154 4 152 608
2 154 |–– 158 9 156 1.404
3 158 |–– 162 11 160 1.760
4 162 |–– 166 8 164 1.312
5 166 |–– 170 5 168 840

Σ = 40 Σ = 6.440
6 170 |–– 174 3 172 516

Temos, então:
Σ x i ⋅ Fi 6.440
x= = = 161 ⇒ x = 161
Σ Fi 40

Logo: x = 161 cm.

6.1.5. Emprego da média


A média é utilizada quando:
a) desejamos obter a medida de posição que possui a maior estabilidade;
b) houver necessidade de um tratamento algebrico posterior.

EXERCÍCIOS:
Série Aula:
1) Calcule a média aritmética da série:
a) X: 1, 2, 8, 10, 12, 16, 21, 30.
b) Y: 5, 6, 6, 10, 11, 11, 20.
c) Z: 3,4; 7,8; 9,23; 12,15.

2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um
peso superior a 40 quilos. Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5; 3,5; 4; 5; 5,5; 4; 5, este
lote será aprovado? Qual o peso médio do produto?

3) Um produto é vendido em três supermecados por R$ 13,00/kg, R$ 13,20/kg e R$ 13,50/kg. Determine quantos R$/kg
se paga em média pelo produto.

4) Calcule a média aritmética da série:


xi Fi
2 1
3 4
4 3
5 2

5) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo:


Aluguel Nº de casas
i
(R$) Fi
1 0 |––– 200,00 30
2 200,00 |––– 400,00 52
3 400,00 |––– 600,00 28
4 600,00 |––– 800,00 7
5 800,00 |––– 1.000,00 3
Estatística Aplicada

6.2. Mediana (Md)


A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de
números, estando dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, dispostos
segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois
subconjuntos de mesmo número de elementos.

6.2.1. Dados não-agrupados


Dada uma série de valores como, por exemplo:
5, 2, 6, 13, 9, 15, 10
de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos
valores:
2, 5, 6, 9, 10, 13, 15
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.
Se, porém, a série dada tiver um número par de termos, a mediana será a média aritmética dos valores
centrais da série.
Assim, a série de valores:
2, 6, 7, 10, 12, 13, 18, 21
tem para a mediana a média aritmética entre 10 e 12.
Logo:
10 + 12 22
Md = = = 11 ⇒ Md = 11
2 2
Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o
valor mediano (P) será:
n+1
P=
2
Para comprovar tal fato nas séries dadas:
7 +1
- Para n = 7, temos P = = 4 . Logo, a mediana é o 4º termo da série, isto é: Md = 9.

8 +1
2
- Para n = 8, temos P = = 4,5 . Logo, a mediana é a média aritmética do 4º e 5º termos da série,
10 + 12
2
isto é: Md = = 11 ⇒ Md = 11.
2

Notas:
• Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos

• Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um
elementos da série.

• Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série.

• A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das
diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos).
Vejamos:

5, 7, 10, 13, 15 ⇒ x = 10 e Md = 10
5, 7, 10, 13, 65 ⇒ x = 20 e Md = 10
Estatística Aplicada

isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores
extremos, ao passo que a mediana permanece a mesma.

6.2.2. Dados agrupados


Se os dados se agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito
semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das freqüências acumuladas.
Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por:

n+1
P=
2

6.2.2.1. Sem intervalos de classe


Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior ao valor de P. A mediana
será aquele valor da variável que corresponde a tal freqüência acumulada.
Tomemos a tabela do item 6.1.4.1., completando-a com a coluna correspondente à freqüência acumulada:
Nº de
Fi Fa
meninos
0 2 2
1 6 8
2 10 18
3 12 30

Σ = 34
4 4 34

34 + 1
Sendo: P = = 17,5
2
a menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo esse o valor
mediano. Logo, Md = 2.

Nota:
No caso de existir uma freqüência acumulada (Fa), tal que: P – Fa = 0,5, a mediana será dada pela média
aritmética dos valores das variáveis correspondentes às freqüências acumuladas imediatamente inferior e superior a P.

Exemplo:
xi Fi Fa
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7

Σ=8
20 1 8

8 +1 15 + 16 31
Temos: P = = 4,5 Logo: Md = = = 15,5
2 2 2

6.2.2.2. Com intervalos de classe


Devemos seguir os seguintes passos:
1º) Determinamos as freqüências acumuladas;
Estatística Aplicada

n+1
2º) Calculamos P = ;
2
3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à P. Tal classe será a classe
mediana;
4º) Calculamos a Mediana pela seguinte fórmula:

(P − Fa * ) ⋅ h
Md = Li +
Fi
Li = é o limite inferior da classe mediana.
Fa* = é a freqüência acumulada da classe anterior à classe mediana.
Fi = é a freqüência simples da classe mediana.
h = é a amplitude do intervalo da classe mediana.

Exemplo:

i Estaturas (cm) Fi Fa
1 50 |–– 54 4 4
2 54 |–– 58 9 13
3 58 |–– 62 11 24
4 62 |–– 66 8 32
5 66 |–– 70 5 37

Σ = 40
6 70 |–– 74 3 40

40 + 1
Temos: P = = 20,5 Logo,.a classe mediana será a terceira (i = 3).
2

Li = 58 Fa* = 13 Fi = 11 h=4

Substituindo esses valores na fórmula, obtemos:

(P − Fa* ) ⋅ h (20,5 − 13) ⋅ 4


Md = Li + ⇒ Md = 58 + = 60,73
Fi 11
Isto é: Md = 60,73.

OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição.

6.2.3. Emprego da Mediana




Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.


Quando há valores extremos que afetam de maneira acentuada a média aritmética.
Quando a variável em estudo é salário.

EXERCÍCIOS:
Série Aula:
1) Calcule a mediana da sequência:
a) X: 2, 5, 8, 10, 12, 15, 8, 5, 12.
b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8.
2) Calcule a mediana da distribuição:
Estatística Aplicada

xi Fi
2 5
4 20
5 32
6 40
8 2

3) Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o quadro abaixo.
Determine o valor mediano da série.
Consumo por nota
i Nº de notas
(R$)
1 0 |––– 50,00 10
2 50,00 |––– 100,00 28
3 100,00 |––– 150,00 12
4 150,00 |––– 200,00 2
5 200,00 |––– 250,00 1
6 250,00 |––– 300,00 1

6.3. Moda (Mo)


É o valor que ocorre com maior freqüência em uma série de valores.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa fábrica.

6.3.1. Dados não-agrupados


A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete.
Exemplo: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.

Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros.
Exemplo: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal.

Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou
mais valores modais.
Exemplo: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série é bimodal.

6.3.2. Dados agrupados


6.3.2.1. Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de
maior freqüência.
Exemplo: Qual a temperatura mais comum medida no mês abaixo:
Temperatura
Fi
(ºC)
0 3
1 9
2 12

Σ = 30
3 6

Na distribuição acima a freqüência máxima é 12, correspondente ao valor 2 da variável. Logo, a temperatura
mais comum é 2 ºC.
Estatística Aplicada

6.3.2.2. Com intervalos de classe


A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que
a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais
simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação
de moda bruta.
Ls + Li
Mo =
2
onde:
Li = é o limite inferior da classe modal.
Ls = é o limite superior da classe modal.

Exemplo: Calcule a estatura modal conforme a tabela abaixo.

i Estaturas (cm) Fi
1 50 |–– 54 4
2 54 |–– 58 9
3 58 |–– 62 11
4 62 |–– 66 8
5 66 |–– 70 5

Σ = 40
6 70 |–– 74 3

Temos que a classe modal é i = 3.

Ls + Li 62 + 58
Como: Mo = = = 60
2 2

Logo: Mo = 60 cm

Para determinar a moda de uma variável contínua (com intervalos de classe), podemos optar por vários
processos. Daremos destaque para a moda de Pearson, a moda de King e a moda de Czuber.

1º Processo: Moda de Pearson


Segundo Pearson, a moda de uma variável contínua pode ser obtida através do valor da média e da mediana:

Mo = 3Md − 2 x

2º Processo: Moda de King


King levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência absoluta
da classe posterior à classe modal.

Mo = L i + ⋅h
Fpost
Fant + Fpost

onde:
Li = limite inferior da classe modal.
Fpost = freqüência absoluta da classe posterior à classe modal.
Fant = freqüência absoluta da classe anterior à classe modal.
h = amplitude do intervalo de classe.

3º Processo: Moda de Czuber


Czuber levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência
absoluta da classe posterior, além da freqüência absoluta da classe modal.
Estatística Aplicada

Fi − Fant
Mo = L i + ⋅h
2Fi − (Fant + Fpost )

onde:
Li = limite inferior da classe modal.
Fi = freqüência absoluta da classe modal.
Fpost = freqüência absoluta da classe posterior à classe modal.
Fant = freqüência absoluta da classe anterior à classe modal.
h = amplitude do intervalo de classe.

Comentários:
A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana da
distribuição, a fórmula de Pearson é a mais trabalhosa.
A fórmula de King é a mais simples delas, mas não é a mais precisa.
A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a freqüência da
classe modal.
Normalmente o processo mais confiável é o valor de Czuber.

EXERCÍCIOS:
Série Aula:
1) Calcule a moda das séries abaixo:
a) X: 2, 3, 5, 4, 5, 2, 5, 7
b) Y: 4, 12, 5, 9, 12, 4, 3
c) Z: 7, 7, 7, 7 7
d) J: 4, 5, 6, 6, 6, 7, 8, 8, 8, 9, 10, 10, 10, 11
e) T: 2, 5, 9, 8, 10, 12

2) Calcule a moda da distribuição:


xi Fi
2 1
3 7
4 2
5 2

3) Calcule a moda de Czuber para a distribuição representativa dos salários de 25 funcionários de uma empresa.
Salários Nº de
i
(R$) funcionários
1 1.000,00 |––– 1.200,00 2
2 1.200,00 |––– 1.400,00 6
3 1.400,00 |––– 1.600,00 10
4 1.600,00 |––– 1.800,00 5
5 1.800,00 |––– 2.000,00 2

6.4. Utilização das Medidas de Tendência Central


Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente
precisamos de apenas uma das medidas para caracterizar o centro da série.
Surge, então, a questão: qual medida deve ser utilizada?
A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série.
Quando todos os dados de uma série são iguais, a média, a mediana e a moda coincidirão com este valor e,
portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática.
Estatística Aplicada

Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá
representar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação
ao valor da medida não serão bem representados por ela. Assim:
- Devemos optar pela média, quando houver forte concentração de dados na área central da série;
- Devemos optar pela mediana, quando houver forte concentração de dados no início ou no final da série; e
- Devemos optar pela moda apenas em séries que apresentam um elemento típico, isto é, um valor cuja
freqüência é muito superior à freqüência dos outros elementos da série.

EXERCÍCIOS:
Série Aula:
1) Uma loja vende cinco produtos básicos, A, B, C, D e E. O lucro por unidade cormecializada destes produtos vale
respectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 1.000,00 e R$ 5.000,00. A loja vendeu em determinado mês 20,
30, 20, 10 e 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja?

2) Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada,
500 caixa de 4 kg cada e 800 caixas de 5 kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga
pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que sá permite passagens a caminhões com peso
máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no
caminhão?

3) Num quartel, constatou-se que o peso médio de 40 soldados era de 69 quilos. Posteriormente, verificou-se que a
balança estava desregulada, ocasionando um peso indicado superior em 15 gramas ao peso verdadeiro. Qual era a
média verdadeira dos pesos dos soldados?

4) Calcule o número médio de acidentes por dia em uma determinada esquina.


Nº de acidentes Nº de dias
por dia: xi Fi
0 30
1 5
2 3
3 1
4 1

Série Casa:
1) Considerando os conjuntos de dados:
I. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
II. 20, 9, 7, 2, 12, 7, 20, 15, 7
III. 51,6; 48,7; 50,3; 49,5; 48,9
IV. 15, 18, 20, 13, 10, 16, 14
Calcule:
a) a média aritmética
b) a mediana
c) a moda

2) Os salários-hora de cinco funcionários de uma companhia são:


R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00; R$ 88,00
Determine:
Estatística Aplicada

a) a média dos salários-hora


b) o salário-hora mediano

3) As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine:
a) a nota média
b) a nota mediana
c) a nota modal

4) Considerando a distribuição abaixo:


xi 3 4 5 6 7 8
Fi 4 8 11 10 8 3
Calcule:
a) a média
b) a mediana
c) a moda

5) Em uma das classes de 50 alunos, as notas obtidas formaram a seguinte distribuição:


Notas 2 3 4 5 6 7 8 9 10
Nº de Alunos 1 3 6 10 13 8 5 3 1

Calcule:
a) a nota média
b) a nota mediana
c) a nota modal

6) Calcule a média, a mediana e a moda das distribuições de freqüência abaixo:


I.
i Notas Fi II.
1 0 |–– 2 5 i Estaturas (cm) Fi
2 2 |–– 4 8 1 150 |–– 158 5
3 4 |–– 6 14 2 158 |–– 166 12
4 6 |–– 8 10 3 166 |–– 174 18
4 174 |–– 182 27
Σ = 44
5 8 |–– 10 7

Σ = 70
5 182 |–– 190 8

III. IV.
i Salários (R$) Fi i Pesos (kg) Fi
1 500 |–– 700 18 1 145 |–– 151 10
2 700 |–– 900 31 2 151 |–– 157 9
3 900 |–– 1.100 15 3 157 |–– 163 8
4 1.100 |–– 1.300 3 4 163 |–– 169 6
5 1.300 |–– 1.500 1 5 169 |–– 175 3
6 1.500 |–– 1.700 1 6 175 |–– 181 3

Σ = 70 Σ = 40
7 1.700 |–– 1.900 1 7 181 |–– 187 1
7) Calcule a idade média e a idade mediana dos alunos de uma classe de primeiro ano de determinada Faculdade, em
anos.
Idade (anos) Nº de alunos
xi Fi
17 3
18 18
19 17
20 8
21 4

8) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule a salário médio
destes funcionários.
Salário Nº de funcionários
i
(R$) Fi
1 400,00 |––– 500,00 12
2 500,00 |––– 600,00 15
3 600,00 |––– 700,00 8
4 700,00 |––– 800,00 3
5 800,00 |––– 900,00 1
6 900,00 |––– 1.000,00 1

9) Determine o valor mediano da distribuição a seguir que representa os salários de 25 funcionários selecionados de
uma empresa.
Salário Nº de funcionários
i
(R$) Fi
1 1.000,00 |––– 1.200,00 2
2 1.200,00 |––– 1.400,00 6
3 1.400,00 |––– 1.600,00 10
4 1.600,00 |––– 1.800,00 5
5 1.800,00 |––– 2.000,00 2

10) Calcule a moda de Czuber para a distribuição de valores de 54 notas fiscais, emitidas na mesma dada,
selecionadas em uma loja de departamentos:
Consumo por nota
i Nº de notas
(R$)
1 0 |––– 50,00 10
2 50,00 |––– 100,00 28
3 100,00 |––– 150,00 12
4 150,00 |––– 200,00 2
5 200,00 |––– 250,00 1
6 250,00 |––– 300,00 1

11) Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60 alunos em uma prova de
matemática:
i Notas Nº de alunos
1 0 |––– 2 5
2 2 |––– 4 20
3 4 |––– 6 12
4 6 |––– 8 20
5 8 |––– 10 3
7. Medidas de Posição: Separatrizes
Dados que produzem histogramas simétricos são adequadamente descritos pela média e pelo desvio-padrão.
Quando os dados são assimétricos, a mediana identifica mais adequadamente o centro de um conjunto de dados. Para
entender bem uma distribuição, precisamos conhecer valores acima ou abaixo dos quais se encontra uma determinada
porcentagem dos dados: as separatrizes.
Separatriz de uma série de n termos colocados em ordem crescente de valor, é o termo da série que a divide
em duas partes quaisquer. As principais separatrizes são a mediana, os quartis, os decis e os percentis (ou centis).
Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por Q1 , Q2 e Q3,
dividem as observações ordenadas em quatro partes iguais. O primeiro quartil separa os 25% inferiores dos 75%
superiores dos valores ordenados; o segundo quartil é a mediana e o terceiro quartil separa os 75% inferiores dos 25%
superiores dos dados.
Analogamente, há nove decis, denotados por D1 , D2, D3 , ..., D9 que dividem os dados em 10 grupos com
cerca de 10% deles em cada grupo. Há finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de
1% em cada grupo.

Exemplo: O nível de albumina no sangue, um indicador do estado nutricional, foi medido em um grupo de 60 pacientes,
obtendo-se os resultados (g/dl) apresentados na Tabela 9.1 em forma ordenada. Obtenha o primeiro quartil e o percentil
de ordem 80.

Tabela 9.1: Nível de albumina no sangue.


4,44 4,47 4,48 4,51 4,54 4,54 4,61 4,64 4,66 4,68
4,68 4,69 4,71 4,73 4,76 4,76 4,76 4,81 4,86 4,86
4,87 4,88 4,90 4,90 4,95 4,95 4,96 4,97 4,98 4,98
4,99 5,00 5,01 5,01 5,01 5,02 5,04 5,05 5,08 5,09
5,09 5,10 5,11 5,11 5,16 5,17 5,18 5,18 5,19 5,24
5,24 5,26 5,27 5,27 5,29 5,32 5,35 5,46 5,50 5,85

O primeiro quartil deixa pelo menos 25% dos dados abaixo e pelo menos 75% dos dados acima dele. Como
25% de 60 é igual a 15, Q1 tem pelo menos 15 valores abaixo de si e pelo menos 45 acima. Contando-se 15 valores do
menor para o maior, teremos o paciente com valor de albumina igual a 4,76 g/dl. Começando do maior para o menor e
contando 45 valores, encontramos também 4,76 g/dl. Assim, a dosagem 4,76 g/dl é o valor do primeiro quartil.
Podemos dizer que pelo menos 25% dos pacientes da amostra apresentam nível de albumina inferior ou igual
a 4,76 g/dl.
O percentil de ordem 80 deixa pelo menos 80%, ou seja, 48 valores abaixo de si e pelo menos 12 acima.
Contando 48 valores a partir, chegamos ao valor de 5,18 g/dl. E contando 12 valores do maior para o menor obtemos
5,19 g/dl. Por convenção, usa-se a média destes dois valores, ou seja, o valor 5,185 g/dl.

7.1. Os Quartis
Há três quartis:

a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados
é menor que ele e as três quartas partes restantes (75%) são maiores.
b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md).
c) O terceiro quartil (Q3) – valor situado de tal modo na série que as três quartas partes (75%) dos
dados são menores que ele e uma quarta parte restante (25%) é maior.
∑ Fi + 1
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da
mediana, bastando substituir, na fórmula da mediana, P = por:
2

k ⋅ (∑ Fi + 1)
4

sendo k o número de ordem do quartil.

Assim, temos:

∑ Fi + 1 ∑ Fi + 1 3 ⋅ (∑ Fi + 1)
PQ1 = PQ 2 = P = PQ 3 =
4 2 4

(P )
Logo,

− Fa * ⋅ h
Q1 = L i + Q1
Fi

Q 2 = Md = L i +
(P
Q2 )
− Fa * ⋅ h
Fi

Q3 = Li +
(P
Q3 )
− Fa * ⋅ h
Fi

sendo,
Li = é o limite inferior da classe que contém a separatriz.
Fa* = é a freqüência acumulada da classe anterior à classe que contém a separatriz.
Fi = é a freqüência simples da classe que contém a separatriz.
h = é a amplitude do intervalo da classe que contém a separatriz.

Exemplo:
A partir da tabela abaixo, determine o primeiro, o segundo e o terceiro quartis.
Estaturas (cm) Fi Fa
150 |–– 154 4 4
154 |–– 158 9 13 ← Q1
158 |–– 162 11 24 ← Q2
162 |–– 166 8 32 ← Q3
166 |–– 170 5 37

Σ = 40
170 |–– 174 3 40

40 + 1
Primeiro Quartil: Segundo Quartil (Mediana): Terceiro Quartil:
PQ1 = = 10,25
4

Q 1 = 154 +
(10,25 − 4 ) ⋅ 4
9 Q1 = 160,7 cm Q1 = 165,4 cm

Q1 = 156,8 cm
7.2. Os Decis

O cálculo de um decil segue a mesma técnica do cálculo dos quartis, onde utilizamos:

k ⋅ (∑ Fi + 1)
10

sendo k o número de ordem do decil.

Assim, temos:

∑ Fi + 1 ∑ Fi + 1 9 ⋅ (∑ Fi + 1)
PD1 = , PD2 = , ... , PD9 =
10 5 10

(P )
Logo, para o 7º decil, temos:

− Fa * ⋅ h
D7 = L i + D7
Fi

Exemplo:

7 ⋅ (∑ Fi + 1) 7 ⋅ (40 + 1)
Considerando a tabela do exemplo anterior, temos, para o 7º decil:

PD7 = = = 28,7
10 10

Logo,

D 7 = 162 +
(28,7 − 24 ) ⋅ 4
∴ D7 = 164,4 cm
8

7.3. Os Percentis

O cálculo de um percentil segue a mesma técnica do cálculo dos quartis, onde utilizamos:

k ⋅ (∑ Fi + 1)
100

sendo k o número de ordem do percentil.

Assim, temos:

∑ Fi + 1 ∑ Fi + 1 99 ⋅ (∑ Fi + 1)
P1 = , P2 = , ... , P99 =
100 50 100
É evidente que:

P50 = Md, P25 = Q1 e P75 = Q3

(P )
Logo, para o 27º percentil, temos:

− Fa * ⋅ h
P27 = L i + 27
Fi

Exemplo:

Considerando a tabela do exemplo anterior, temos, para o 27º percentil:

27 ⋅ (∑ Fi + 1) 27 ⋅ (40 + 1)
P27 = = = 11,07
100 100
Logo,

P27 = 154 +
(11,07 − 4 ) ⋅ 4
∴ P27 = 157,1 cm
9

EXERCÍCIOS:
Série Aula:
1) Para a distribuição abaixo calcular: D2, P40 e Q3.
Classes 20 |–– 30 30 |–– 40 40 |–– 50 50 |–– 60 60 |–– 70
Fi 3 8 18 22 24

Série Casa:
1) Determine o valor da medida que deixa 45% dos elementos da distribuição é:
Renda 10 |–– 20 20 |–– 30 30 |–– 40 40 |–– 50 50 |–– 60 60 |–– 70 70 |–– 80 80 |–– 90 90 |–– 100
Nº de
50 100 150 250 150 100 80 70 50
famílias

2) Calcular o 5º decil da distribuição:


Classes 2 |–– 4 4 |–– 6 6 |–– 8 8 |–– 10 10 |–– 12
Fi 5 7 10 3 5

3) O departamento pessoal de uma certa empresa fez um levantamento dos salários dos 120 funcionários do setor
administrativo, obtendo os resultados (em salários mínimos) da tabela abaixo. Calcule o primeiro quartil e a mediana.
Faixa salarial fi (%)
0 |–– 2 25,0
2 |–– 4 40,0
4 |–– 6 20,0
6 |–– 8 15,0

4) Numa companhia A, a média dos salários é R$ 10.000,00 e o 3º quartil é R$ 5.000,00.


a) Se você se apresentasse como candidato a funcionário nessa empresa e se o seu salário fosse escolhido ao acaso
entre todos os possíveis salários, o que seria mais provável: ganhar mais ou menos que R$ 5.000,00?
b) Suponha que na companhia B a média dos salários seja R$ 7.000,00, a variância praticamente zero e o salário
também seja escolhido ao acaso. Em qual companhia você se apresentaria para procurar emprego?
8. Medidas de Dispersão ou de Variabilidade
São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da
média. Servem para medir a representatividade da média.

dispersão

xi

Sejam as séries:
a) 20, 20, 20
b) 15, 10, 20, 25, 30 x
Tem-se: x a = 20 e x b = 20

Apesar de as séries terem médias iguais, na série “a” não se tem dispersão, enquanto que os valores da série
“b” apresentam dispersões em torno da média 20. Assim, a média é muito mais representativa para a série “a” do que
para a série “b”.
Portanto, para qualificar os valores de uma variável, ressaltando a maior ou menor dispersão ou variabilidade
entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de variação.

8.1. Amplitude Total


A amplitude total é a diferença entre o maior e o menor valor observado.
AT = x máx − x mín

Exemplo: Para os valores: 40, 45, 48, 52, 54, 62 e 70, temos,

AT = 70 – 40 = 30

Logo: AT = 30

Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua
concentração. É evidente que, quanto maior a amplitude total, maior a dispersão dos valores da variável.
A amplitude total tem o incoveniente de só levar em conta os dois valores extremos da série, descuidando do
conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma
indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia ou no ano, no
controle da qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que
a exatidão e a estabilidade.

8.2. Variância / Desvio Padrão


Como vimos, a amplitude total é instável, por se deixar influenciar pelos extremos, que são, na sua maioria,
devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade
dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os
mais geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos
quadrados dos devios. Assim, representando a variância por s2, temos:
s 2
=
∑ (x i − x )2
n

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em
relação à variável em questão, o que, sob o ponto de vista prático, é um incoveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio
padrão, definida como a raiz quadrada da variância e representada por s.
Assim:

s=
∑ (x i − x )2
n

( xi )
Podemos simplificar os cãlculos fazendo uso da igualdade:


∑ (x i − x ) =∑ −
2
2
x i2
n

( x i ) ⎞⎟ 1
Assim:



∑ − n ⎟⎟ ⋅ n

s= ⎜
2


x i2
⎝ ⎠

Logo:

∑ x i2 − ⎛⎜ ∑ x i ⎞⎟
2

s=
⎜ ⎟
⎝ ⎠
n n

Para dados agrupado, temos:

∑ Fi x i2 − ⎛⎜ ∑ Fi x i ⎞⎟
∑ Fi ⎜⎝ ∑ Fi ⎟⎠
2

s=

O desvio padrão goza de algumas propriedades, dentre as quais destacamos:


1ª) Somando-se (ou subtraindo-se) uma constante a (de) todos os valores de uma variável, o desvio padrão não se
altera:
yi = xi ± c ⇒ sy = sx

2ª) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio
padrão fica multiplicado (ou dividido) por essa constante:
yi = xi × c ⇒ sy = sx × c
yi = xi ÷ c ⇒ sy = sx ÷ c

8.3. Coeficiente de Variação


O desvio padrão por si só não diz muita coisa. Assim, um desvio padrão de duas unidades pode ser
considerado pequeno para uma série de valores cujo valor médio é 200; no entando, se a média for 20, o mesmo não
pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego
quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando
expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados
em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV):

CV = ⋅ 100
s
x

Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:

x s
Estaturas 175 cm 5,0 cm
Pesos 68 kg 2,0 kg

Temos:
CVE = ⋅ 100 = 2,85%
5
175

CVP = ⋅ 100 = 2,94%


2
68

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as alturas.

EXERCÍCIOS:
Série Aula:
1) Calcule os desvios padrões dos conjuntos de dados:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
d) –10, –6, 2, 3, 7, 9, 10

2) Calcule os desvios padrões das distribuições:


a)
xi 2 3 4 5 6 7 8
Fi 1 3 5 8 5 4 2

b)
Classes 1,5 |–– 1,6 |–– 1,7 |–– 1,8 |–– 1,9 |–– 2,0 |–– 2,1 |–– 2,2
Fi 4 8 12 15 12 8 4

3) Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente:


Nº de caras 0 1 2 3 4 5
Frequências 4 14 34 29 16 3

calcule o desvio padrão.


4) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em
Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?
Série Casa:
1) Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos
indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou
em peso?

2) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 125
moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação
de cada um dos grupos? Qual o grupo mais homogêneo?

3) Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão de
R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00.
Então, calcule os coeficientes de variações e diga qual o grupo mais homogêneo.

4) O Desvio padrão de um conjunto de dados é 9. A variância é:


a) 3 c) 81
b) 36 d) 18

5) Na distribuição de valores iguais, o Desvio Padrão é:


a) negativo c) zero
b) a unidade d) positivo

6) O cálculo da variância supõe o conhecimento da:


a) FAC c) mediana
b) média d) moda

7) A variância do conjunto de dados tabelados abaixo é:


Classes Fi
03 |–– 08 5
08 |–– 13 15
13 |–– 18 20
18 |–– 23 10

a) 1,36 c) 4,54
b) 18,35 d) 20,66
REFERÊNCIAS

- BUSSAB, W. O., MORETTIN, P. A. Estatística Básica. Ed. Saraiva. 5ª edição. 2004.

- CRESPO, A. A. Estatística Fácil. Ed. Saraiva. 16ª edição. 1998.

- DOWNING, D., CLARK, J. Estatística Aplicada. Ed. Saraiva. 2ª edição. 2005.

- FONSECA, J. S., MARTINS, G. A. Curso de Estatística. Ed. Atlas. 6ª edição. 1996.

- LAPPONI, J. C. Estatírtico Usando Excel. Ed. Lapponi. 2000.

- MARTINS, G. A. Estatística Geral e Aplicada. Ed. Atlas. 2ª edição. 2002.

- MARTINS, G. A., DONAIRE, D. Princípios de Estatística. Ed. Atlas. 4ª edição. 1995.

- NAZARETH, H. Curso Básico de Estatística. Ed. Ática. 7ª edição. 1995.

- PEREIRA, W., TANAKA, O. K. Estatística – Conceitos Básicos. Ed. Makron Books.

- SILVA, E. M., GONÇALVES, V., MUROLO, A. C. Estatística para os cursos de: Economia, Administração
e Ciências Contábeis. Ed. Atlas. 3ª edição. 1999.

- TOLEDO, G. L., OVALLE, I. I. Estatística Básica. Ed. Atlas. 2ª edição. 1995.


SUMÁRIO

1. INTRODUÇÃO À ESTATÍSTICA...............................................................................................................................3
1.1. ENTENDENDO A IMPORTÂNCIA DA ESTATÍSTICA..................................................................................................................3
1.2. OBJETO DA ESTATÍSTICA................................................................................................................................................4
1.2. MÉTODO ESTATÍSTICO...................................................................................................................................................4
1.2.1. O Método Científico.........................................................................................................................................4
1.2.2. O Método Experimental....................................................................................................................................4
1.2.3. O Método Estatístico........................................................................................................................................5
1.3. A ESTATÍSTICA.............................................................................................................................................................5
1.4. FASES DO MÉTODO ESTATÍSTICO.....................................................................................................................................5
1.4.1. Coleta de Dados...............................................................................................................................................5
1.4.2. Apuração dos Dados........................................................................................................................................6
1.4.3. Apresentação dos Dados..................................................................................................................................6
1.4.4. Análise dos Resultados.....................................................................................................................................6
1.5. ABUSOS DA ESTATÍSTICA................................................................................................................................................6
1.5.1. Más Amostras...................................................................................................................................................6
1.5.2. Pequenas Amostras...........................................................................................................................................6
1.5.3. Estimativas por Suposição................................................................................................................................6
1.5.4. Porcentagens Distorcidas:...............................................................................................................................7
1.5.5. Perguntas Tendenciosas...................................................................................................................................7
1.5.6. Pressão do Pesquisador...................................................................................................................................7
2. POPULAÇÃO E AMOSTRA........................................................................................................................................9
2.1. VARIÁVEIS...................................................................................................................................................................9
2.2. POPULAÇÃO E AMOSTRA................................................................................................................................................9
2.2.1. Amostragem Aleatória Simples......................................................................................................................10
2.2.2. Amostragem Sistemática.................................................................................................................................10
2.2.3. Amostragem Estratificada Proporcional........................................................................................................10
3. SÉRIES ESTATÍSTICAS............................................................................................................................................15
3.1. TABELAS....................................................................................................................................................................15
3.2. SÉRIES ESTATÍSTICAS...................................................................................................................................................15
3.2.1. Séries Históricas, Cronológicas ou Temporais..............................................................................................15
3.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização.....................................................................15
3.2.3. Séries Específicas ou Categórica...................................................................................................................16
3.2.4. Séries Conjugadas – Tabela de Dupla Entrada.............................................................................................16
3.3. DADOS ABSOLUTOS E DADOS RELATIVOS.......................................................................................................................16
3.3.1. As Porcentagens.............................................................................................................................................17
3.3.2. Os Índices.......................................................................................................................................................18
3.3.3. Os Coeficientes...............................................................................................................................................18
3.3.4. As Taxas..........................................................................................................................................................19
4. DISTRIBUIÇÃO DE FREQUÊNCIA........................................................................................................................23
4.1. TABELA PRIMITIVA / ROL.............................................................................................................................................23
4.2. DISTRIBUIÇÃO DE FREQÜÊNCIA......................................................................................................................................23
4.3. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA.........................................................................................................24
4.3.1. Classe..............................................................................................................................................................24
4.3.2. Limites de Classe............................................................................................................................................24
4.3.3. Amplitude de um Intervalo de Classe.............................................................................................................24
4.3.4. Amplitude Total da Distribuição....................................................................................................................24
4.3.5. Ponto Médio de uma Classe...........................................................................................................................24
4.4. DETERMINAÇÃO DO NÚMERO DE CLASSES.......................................................................................................................24
4.5. TIPOS DE FREQÜÊNCIAS................................................................................................................................................25
4.6. DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALOS DE CLASSE.............................................................................................25
5. GRÁFICOS ESTATÍSTICOS.....................................................................................................................................30
5.1. REPRESENTAÇÃO GRÁFICA............................................................................................................................................30
5.1.1. Gráfico de Linha.............................................................................................................................................30
5.1.2. Gráfico de Colunas ou de Barras...................................................................................................................30
5.1.3. Gráfico de Colunas ou de Barras Múltiplas..................................................................................................32
5.1.4. Gráfico de Setores..........................................................................................................................................32
5.2. REPRESENTAÇÃO GRÁFICA DE DISTRIBUIÇÃO DE FREQUÊNCIA............................................................................................33
5.2.1. Histograma.....................................................................................................................................................33
5.2.2. Polígono de Frequência.................................................................................................................................33
5.2.3. Ogiva..............................................................................................................................................................34
6. MEDIDAS DE POSIÇÃO: MEDIDAS DE TENDÊNCIA CENTRAL..................................................................40
6.1. MÉDIA ARITMÉTICA ().................................................................................................................................................40
6.1.1. Dados não-agupados......................................................................................................................................40
6.1.2. Desvio em relação à média............................................................................................................................40
6.1.3. Propriedades da média...................................................................................................................................41
6.1.4. Dados agrupados............................................................................................................................................41
6.1.4.1. Sem intervalos de classe..........................................................................................................................................41
6.1.4.2. Com intervalos de classe..........................................................................................................................................42
6.1.5. Emprego da média..........................................................................................................................................43
6.2. MEDIANA (MD)..........................................................................................................................................................44
6.2.1. Dados não-agrupados....................................................................................................................................44
6.2.2. Dados agrupados............................................................................................................................................45
6.2.2.1. Sem intervalos de classe..........................................................................................................................................45
6.2.2.2. Com intervalos de classe..........................................................................................................................................45
6.2.3. Emprego da Mediana.....................................................................................................................................46
6.3. MODA (MO)..............................................................................................................................................................47
6.3.1. Dados não-agrupados....................................................................................................................................47
6.3.2. Dados agrupados............................................................................................................................................47
6.3.2.1. Sem intervalos de classe..........................................................................................................................................47
6.3.2.2. Com intervalos de classe..........................................................................................................................................48
6.4. UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL.......................................................................................................49
7. MEDIDAS DE POSIÇÃO: SEPARATRIZES...........................................................................................................54
7.1. OS QUARTIS...............................................................................................................................................................54
7.2. OS DECIS..................................................................................................................................................................56
7.3. OS PERCENTIS............................................................................................................................................................56
8. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE.......................................................................................58
8.1. AMPLITUDE TOTAL......................................................................................................................................................58
8.2. VARIÂNCIA / DESVIO PADRÃO......................................................................................................................................58
8.3. COEFICIENTE DE VARIAÇÃO..........................................................................................................................................59
REFERÊNCIAS................................................................................................................................................................62
ESTATÍSTICA APLICADA

Tecnologia em Petróleo e Gás Natural

Prof. Carlos Alexandre Santório

Serra (ES), 2007/2

Você também pode gostar