Você está na página 1de 51

APOSTILA DE ESTATSTICA DESCRITIVA

1. APRESENTAO DOS DADOS


1.1 - O que Estatstica e suas Divises
Para muitos a Estatstica no passa de conjuntos de tabelas de dados numricos. Mas ser
que a estatstica s isso? A Estatstica originou-se com a coleta e construo de tabelas de dados
para o governo. A situao evoluiu e esta coleta de dados representa somente um dos aspectos da
Estatstica. Hoje em dia podemos adotar a seguinte definio para a Estatstica: A Estatstica uma
cincia (ou mtodo) baseada na Teoria das Probabilidades, cujo objetivo principal nos
auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de
informaes numricas.

A coleta, o processamento, a interpretao e a apresentao de dados numricos pertencem


todos ao domnio da estatstica.
Essas atribuies compreendem o clculo de pontos num campeonato, a coleta de dados
sobre nascimentos e mortes, a avaliao da eficincia de produtos comerciais e a previso do tempo.
A informao estatstica apresentada constantemente no rdio e na televiso. Nosso interesse por
fatos estatsticos suscitado por jornais.
A palavra estatstica usada em vrios sentidos. Pode referir-se no s simples tabulao
de informaes numricas, como a relatrios de transaes na bolsa de valores, como ao corpo de
tcnicas utilizadas para processar ou analisar dados.
A palavra estatstico tambm empregada em vrios sentidos. O termo pode aplicar-se
tanto aos que apenas coletam informaes como aos que preparam anlises ou interpretaes;
designa, ainda, os estudiosos que elaboraram a teoria matemtica sobre a qual se fundamenta a
estatstica.

Divises da Estatstica

A Teoria Estatstica moderna se divide em dois grandes campos:


Estatstica Descritiva - consiste num conjunto de mtodos que ensinam a reduzir uma
quantidade de dados bastante numerosa por um nmero pequeno de medidas,
substitutas e representantes daquela massa de dados. A estatstica descritiva vai
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

resumi-los atravs do uso de certas medidas snteses, que tornem possvel a


interpretao de resultados, No sentido mais amplo, suas funes so:
coleta de dados;
organizao e classificao destes dados;
apresentao atravs de grficos e tabelas;
clculos de medidas (estatsticas), que permitem descrever resumidamente os
fenmenos.
Estatstica Indutiva - consiste em inferir (deduzir ou tirar concluses a respeito das)
propriedades de um universo a partir de uma amostra. O processo de generalizao,
que caracterstico do mtodo indutivo, est associado a uma margem de incerteza.
A medida da incerteza tratada mediante tcnicas e mtodos que se fundamentam na
Teoria das Probabilidades.

Exemplos de utilizao: Pesquisas na Educao, Pesquisa de Mercado, Pesquisa de


opinio pblica, Ensaios de medicamentos e em praticamente todo experimento.
A inferncia estatstica procura com base nos dados amostrais tirar concluses sobre a
populao.

O esquema a seguir tente sintetizar as etapas de uma pesquisa estatstica:

Fig. 1.1 Etapas de uma pesquisa estatstica

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

1.2 - Populao e Amostra

Populao - Conjunto de indivduos, objetos ou informaes que apresentam pelo menos


uma caracterstica comum, cujo comportamento interessa-nos analisar. Ou, em outras palavras,
conjunto de todas as medidas, observaes relativas ao estudo de determinado fenmeno.

i) Deseja-se conhecer o perfil scio-econmico dos pais dos alunos de uma escola.
Populao ou universo: todos os pais dos alunos
Caractersticas: perfil scio-econmico

ii) Deseja-se conhecer o consumo de energia eltrica em MWh nas residncias da cidade de Tefilo
Otoni no ano de 2011.
Populao ou universo: todos as residncias que estavam ligadas a rede eltrica em Tefilo
Otoni, em 2011.
Caractersticas: X = consumo anual de energia eltrica em MWh.

iii) Deseja-se saber se nas indstrias situadas no Estado de Minas Gerais, em 2012, existia algum
tipo de controle ambiental.
Populao ou universo: indstrias situadas no Estado de Minas Gerais em 2012.
Caracterstica: X = existncia ou no de algum tipo de controle ambiental na indstria.

iv) Estudo sobre a precipitao pluviomtrica na Regio Sudeste no ano 2010.


Populao ou universo: rea referente Regio Sudeste.
Caracterstica: X = precipitao pluviomtrica.

Populaes finitas e infinitas: Quanto ao nmero de elementos, as populaes podem ser


classificadas em finita ou infinita, dependendo do nmero de elementos que a compe.

Exemplos :
i) Populao finita: empresas do Plo Petroqumico de Camaari.
ii) Populao infinita: as presses atmosfricas ocorridas nos diversos pontos do Continente em
determinado momento.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

Em geral, como os universos so grandes, investigar todos os elementos populacionais para


determinarmos a caracterstica necessita muito tempo, e/ou o custo elevado, e/ou o processo de
investigao leva a destruio do elemento observado, ou, como no caso de populaes infinitas,
impossvel observar a totalidade da populao. Assim, estudar parte da populao constitui-se um
aspecto fundamental da Estatstica.

Amostra: qualquer subconjunto da populao.

A Estatstica ocupa-se fundamentalmente das propriedades das populaes cujas


caractersticas so passveis de representao numrica como resultado de medies e contagens.
Essas caractersticas da populao so normalmente chamadas de variveis.

1.3 - Tipos de Variveis

A caracterstica que nos interessa analisar recebe o nome de varivel. As caractersticas ou


variveis podem ser divididas em dois tipos: qualitativas e quantitativas.

NOMINAL (SEXO, COR DOS OLHOS...)


QUALITATIVA
ORDINAL (CLASSE SOCIAL, GRAU DE INSTRUO...)

CONTNUA (PESO, ALTURA...)


QUANTITATIVA
DISCRETA (NMERO DE FILHOS, NMERO DE CARROS...)

Variveis qualitativas - quando o resultado da observao apresentado na forma de


qualidade ou atributo. Exemplos: sexo; estado civil; grau de escolaridade; etc.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

Variveis quantitativas - quando o resultado da observao um nmero, decorrente de


um processo de mensurao ou contagem. Exemplos: nmero de filhos; salrio mensal; altura; peso;
idade; tamanho da famlia; etc. Para resumir as informaes levantadas durante uma pesquisa
usaremos a tcnica e a representao mais apropriada, a depender do tipo de varivel que estamos
analisando.
Natureza dos Dados
Variveis

Quantitativas

Qualitativas

Discreta

Contnua

Atributos / categorias

Contagens

Medidas

Ex: grau de escolaridade

Ex: nmero de habitantes de uma cidade

Ex: renda per capita de uma cidade

Fig. 1.2 Natureza dos dados

1.4 - A Estatstica em Pesquisas


A utilizao da Estatstica em pesquisas pode ser ilustrada pela equao:

Estatstica = Matemtica + Portugus

Os fatos sociais e humanos s podem ser estudados atravs da construo de conceitos


expressos em determinada lngua. O pesquisador dever estabelecer uma srie de variveis
aleatrias, definidas em Portugus, que devem ser adequadas a obteno de respostas aos seus
objetivos de estudo. Obtendo no campo os dados de uma amostra, o pesquisador dever realizar os
clculos da estatstica descritiva, que lhe traro concluses acerca desta, bem como os clculos da
estatstica indutiva, que lhe mostraro at que ponto tais concluses amostrais so vlidas tambm
para a populao pesquisada. As concluses estatsticas necessitaro de palavras em Portugus para
se transformarem em concluses acerca do objeto de estudo, no mbito da populao delimitada
pelo pesquisador e de acordo com o quadro conceptual anteriormente definido.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

O diagrama ao lado ilustra o


Objetos e
Objetivos de
Pesquisa
Populao

Definio, pelo pesquisador,


do objeto e dos objetivos de
pesquisa

processo de pesquisa estatstica, com

Delimitao, pelo pesquisador,


da populao a ser estudada

portugus.

suas interconexes matemtica x

A importncia da construo
de um quadro conceptual est em

Variveis
Aleatrias
Teoria da
Amostragem

Definio, pelo pesquisador,


das
variveis aleatrias
populacionais
Definio
do tamanho, do perfil e do
que sero
estudadas
processo
de escolha
dos elementos da
amostra

que o conhecimento terico do


pesquisador sobre o objeto de estudo
e seu mtodo filosfico de obteno
do conhecimento no pode ser
substitudo pela anlise estatstica.

Amostra

Estatstica
Descritiva
Concluses
sobre
a Amostra
Estatstica
Indutiva

Concluses sobre
a Populao

Obteno em campo de conjuntos de


valores amostrais para cada uma das
variveis aleatrios em estudo
Clculo
da
distribuio
de
frequncias e das estatsticas mdia,
mediana, moda, desvio padro e
desvio padro da mdia da amostra
para as variveis aleatrias, tanto as
que representam o perfil da amostra
como as que representam as
respostas s questes fechadas.
Para cada uma das variveis
aleatrias em estudo:
Estimao da mdia populacional.
Clculo da margem de erro
e nvel de confiana para a mdia
populacional.
Testes de Hipteses

Ao

contrrio,

tal

conhecimento deve servir para enquadrar a anlise estatstica dentro


de

uma

caracterizao

mais

abrangente da realidade, de forma a


que

esta

esclarea

situaes

reforce ou negue argumentaes


sobre as relaes de causalidade
intrnsecas ao objeto de estudo.
O perigo para o pesquisador
a substituio de seu mtodo
especfico

de

obteno

de

conhecimento por uma caricatura do


mtodo estatstico.
Quando isso ocorre em pesquisas ditas quantitativas, as variveis aleatrias so impostas
como sendo os conceitos em estudo e procura-se estabelecer concluses e relaes estatsticas
entre tais variveis como sendo as concluses e as relaes existentes acerca dos conceitos.
Ocorre que as variveis aleatrias no so os conceitos em si, mas representaes estatsticas de aspectos desses conceitos. Em conseqncia, todo processo de substituio de conceitos por
variveis definidas de modo mais ou menos arbitrrios retira a abrangncia do mtodo de pesquisa e
o reduz ao mtodo estrutural-funcionalista.
Justamente para evitar tais perigos que insistimos tanto em discutir a relao entre mtodo
filosfico, o mtodo cientfico e o mtodo estatstico. Justamente por isso, um dos principais
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

objetivos de nosso curso habilitar os futuros profissionais ao dialogo com os estatsticos,


necessrio para o projeto, realizao e anlise de pesquisas que envolvam tcnicas estatsticas.
Assim, uma vez definidos os principais conceitos de estatstica, voltemos a examinar agora
de uma forma mais aprofundada, como o mtodo dessa cincia se enquadra na teoria mais geral de
construo do conhecimento humano.
Seja X uma varivel aleatria que representa uma caracterstica em estudo de certa populao. Queremos estudar o comportamento dessa caracterstica, mas no podemos, por razes de
economia, obter os valores populacionais de X. Contornamos essa dificuldade retirando uma
amostra representativa da populao e obtemos um certo nmero de valores amostrais de X. Calculamos, atravs dos valores amostrais, as estatsticas descritivas de X.
O mtodo estatstico materialista, pois parte de fatos materiais (estatsticas descritivas da
amostra) para estabelecer teorias (modelos probabilsticos) e no ao contrrio. E dialtico, pois
trabalha com o movimento das idias, ao contrrio de supor que as idias so algo esttico. Uma
vez estabelecidas as idias que representam a realidade material (modelos probabilsticos), o
mtodo estatstico realiza transformaes nessas idias (clculos de probabilidade) que possibilitam
a previso de futuros comportamentos materiais. E se os comportamentos previstos no ocorrem, os
modelos so criticados e substitudos por outros mais adequados, permitindo a evoluo da cincia.
Permitindo que se chegue a concluses acerca do todo a partir do estudo de uma frao
desse todo, a Estatstica torna economicamente possvel uma srie de estudos que no o seriam sem
ela. Fundamentalmente nisso que reside sua importncia perante a construo do conhecimento
humano, como ferramenta disposio das diversas cincias.
importante o estudante compreender perfeitamente a metodologia estatstica pois tal
compreenso lhe servir no apenas para a realizao de estudos e pesquisas prprios, mas tambm
para desmascarar toda uma srie de manipulaes que se utilizam da Estatstica para impingir
populao, como verdadeiras, concluses falsas.
De fato, a importncia de qualquer cidado compreender o mtodo estatstico est na razo
direta da necessidade de explicarmos, com palavras simples e compreensveis grande maioria do
povo brasileiro, o quo mentirosas e a servio de quem tais pesquisas estatsticas esto.

1.5 - Usos e Abusos da Estatstica

As aplicaes da estatstica se desenvolveram de tal forma que, hoje, praticamente todo


campo de estudo se beneficia da utilizao de mtodos estatsticos. O estudo da estatstica torna o
leitor mais crtico em sua anlise de informaes, e menos sujeito a afirmaes enganosas, como as
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

que se acham comumente associadas a pesquisas, grficos e mdias. importante reconhecer dados
estatsticos distorcidos e interpretar inteligentemente dados que se apresentam sem distoro.
No de hoje que ocorrem abusos com a estatstica. Alguns dos que abusam da estatstica o
fazem simplesmente por descuido ou ignorncia; outros, porm, tm objetivos pessoais,
pretendendo suprimir dados desfavorveis enquanto do nfase aos dados que lhes so favorveis.
Existem diversas maneiras como os dados podem ser distorcidos:

pequenas amostras;

nmeros precisos;

estimativas por suposio;

porcentagens distorcidas;

cifras parciais;

distores deliberadas;

perguntas tendenciosas;

grficos enganosos;

presso do pesquisador;

ms amostras.

O Que Podemos Concluir desta Pesquisa?

O programa de televiso ABC-Nightline realizou uma pesquisa em que solicitava a opinio


dos espectadores sobre a permanncia, ou no, da sede das Naes Unidas nos EUA. Para
responder, os espectadores deviam pagar 50 centavos (americanos) para fazer uma chamada
telefnica. Dos 186.000 que responderam, 67% disseram que a sede da ONU devia sair dos EUA.
Com base nesses resultados amostrais, o que podemos concluir sobre a opinio da populao
americana, sobre a permanncia ou no da sede da ONU nos EUA?

1.6 - Planejamento de Experimentos

Os estudos que utilizam mtodos estatsticos vo desde os que so bem concebidos e


executados, dando resultados confiveis, aos que so concebidos deficientemente e mal executados,
levando a concluses enganosas e sem qualquer valor real.
Todo problema estatstico envolve:
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

Uma clara definio dos objetivos da experincia e da populao associada.


Projeto de experincia (procedimento amostral).
Coleta e anlise de dados.
Procedimento a tomar, a fim de realizar inferncias acerca da populao, tomando-se como
base as informaes contidas na amostra.
Proviso de uma medida da confiabilidade de uma inferncia a ser realizada.

extremamente importante notar que os passos que conduzem soluo de um problema


estatstico so seqenciais; isto , deve-se identificar a populao de interesse e planejar como
coletar os dados antes de obt-los e analis-los.
Dados coletados de forma descuidada podem ser to inteis que nenhum processamento
estatstico consegue salv-los.
As amostragens efetuadas a partir de projetos pouco significativos freqentemente produzem
dados de pouco ou nenhum valor. Por isso, aps realizada uma inferncia, deve-se analis-la com
olho crtico, nunca se esquecendo de obter uma medida acerca da sua confiabilidade.
Tcnicas de Amostragem
Populao
caractersticas

Amostra

Anlise
Descritiva

Concluses
sobre as
caractersticas
da populao

Inferncia
Estatstica
Informaes contidas
nos dados

Fig. 1.3 Divises da Estatstica e suas inter-relaes


1.7 - Amostragem
O conhecimento de fatos que afetam a convivncia scio-econmica numa comunidade
influi sempre na tomada de deciso de um indivduo em todos os aspectos de sua vida e de sua
famlia. Quando um indivduo escolhe um mecnico para fazer reviso de seu carro, um mdico
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

para uma consulta, um dentista para fazer um tratamento dentrio especfico ou mesmo um
restaurante para jantar, alguma informao ele utiliza para nortear sua escolha. Percebe-se, portanto
que as pessoas utilizam no dia a dia resultados de amostragens que so realizadas quase sempre,
imperceptivelmente.
Quando o comrcio e a indstria se baseiam em levantamentos por amostragem para decidir
sobre os investimentos a serem feitos e em seus empreendimentos geralmente obtm sucesso. A
pesquisa de mercado fundamental.
Para que um levantamento por amostragem tenha sucesso, importante que se conhea
profundamente a populao. A amostragem apresenta vrias vantagens em relao ao censo: custo
reduzido, maior rapidez, maior amplitude e maior exatido. O sucesso de um levantamento por
amostragem est na dependncia direta do seu adequado planejamento.
Um dos erros mais graves consiste em uma forma inadequada de coleta de dados. Vamos
descrever ento os mtodos mais comuns de amostragem:
1.7.1 - Amostragem Aleatria Simples: os elementos de uma populao so escolhidos de tal
forma que cada um deles tenha igual chance de figurar na amostra. Este tipo de amostragem
recomendado para estudo de populaes homogneas. As amostras aleatrias podem ser escolhidas
por diversos mtodos, inclusive a utilizao de tabelas de nmeros aleatrios e de computadores
para gerar nmeros aleatrios.

Fig. 1.4 Amostragem Aleatria Simples

1.7.2 - Amostragem Aleatria Estratificada: quando a populao for heterognea no se deve


usar a amostra aleatria simples devido baixa preciso das estimativas obtidas. Nesta situao,
deve-se subdividir a populao em, no mnimo, duas subpopulaes (ou estratos) que compartilham
das mesmas caractersticas (como sexo) e, em seguida, extrair uma amostra de cada estrato.
Costuma-se usar a amostragem estratificada para reduzir a variao nos resultados.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

10

Fig. 1.5 Amostragem Aleatria Estratificada

1.7.3 - Amostragem Sistemtica: uma variao da amostragem aleatria simples. Sua aplicao
exige que a populao esteja devidamente ordenada. Nesta situao, escolhe-se um ponto de
partida, e seleciona-se cada ksimo elemento (como por exemplo cada 10 elemento) da populao.
Apresenta as seguintes vantagens em relao a amostragem aleatria simples:

maior simplicidade no processo de seleo dos elementos, pois definido o primeiro elemento
da amostra, os demais j estaro definidos;

distribuio mais uniforme na populao podendo levar a uma maior representatividade.

Fig. 1.6 Amostragem Sistemtica

1.7.4 - Amostragem por Conglomerado: utilizada quando a populao muito dispersa. Neste
caso, divide-se a populao em sees (ou conglomerados); em seguida escolhe-se algumas sees
e, finalmente, toma-se todos os elementos das sees escolhidas. Este mtodo muito mais rpido e
menos dispendioso. extremamente usada pelo governo e por organizaes particulares de
pesquisa.

Fig. 1.7 Amostragem por Conglomerado


______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

11

1.7.5 - Amostragem por Convenincia: utiliza-se de resultados de fcil acesso ou que j esto
disponveis. Apresentam-se bastante tendenciosos.
No importa quo bem planejemos e executemos o processo de coleta de amostras, h
sempre a possibilidade de um erro nos resultados. Um erro amostral a diferena entre um
resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuaes
amostrais aleatrias.
Se extrairmos uma amostra cuidadosamente, de forma que ela represente a populao,
podemos aplicar os mtodos acima para analisar o erro amostral, mas devemos ter o mximo
cuidado em minimizar os erros no-amostrais.
1.8 - Apresentao Grfica de Dados
Aps a apurao, h a necessidade de dispor os dados e os resultados obtidos a partir deles
em uma forma ordenada e resumida, a fim de auxiliar o pesquisador na anlise e facilitar a
compreenso das concluses apresentadas ao leitor. Os dados e os resultados so ento apresentados
na forma de tabelas.
Uma tabela possui elementos essenciais, tais como:
Ttulo obrigatrio. Deve ser colocado na parte superior da tabela.
Corpo da tabela o conjunto de linhas e colunas onde se encontram as informaes sobre o fato
observado.
Cabealho a parte superior da tabela, onde se especifica o contedo de cada coluna.
Coluna indicadora a parte da tabela em que se especifica o contedo de cada linha.
Fonte a indicao da entidade responsvel pelo fornecimento ou elaborao dos dados.
colocado no fim da tabela.
Tab. 1.1: Ranking das torcidas no futebol brasileiro

Clubes

Porcentagem de torcedores (%)

15

11

2
Fonte: Rede Globo, 06 de jan. de 2011

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

12

Os dados estatsticos, apresentados em tabelas, tambm podem ser expostos em grficos.


Desde que no haja necessidade de grande preciso, os grficos do, melhor do que as tabelas, viso
de tendncias e ajudam a interpretar um fenmeno.
Tabelas, grficos e medidas podem ser utilizados para descrever ou explorar um conjunto de
dados, ou comparar dois ou mais conjuntos.
Grfico de Barras: usado para apresentar sries cronolgicas, geogrficas e categricas. mais
comum a apresentao das barras em posio vertical, conforme representado na Fig. 1.8.
No entanto, as barras em posio horizontal facilitam a identificao das categorias,
principalmente nos casos em que essas categorias tm nomes muito longos.
Grfico de Barras Vertical: facilidade de identificao das categorias, conforme representado na
Fig. 1.9.
Ranking das torcidas

Ranking das torcidas

Porcentagem de torcedores

Fonte: Rede Globo, 06 de jan. de 2011

Fonte: Rede Globo, 06 de jan. de 2011.

Fig. 1.8 Grfico de barras

Fig. 1.9 Grfico de barras vertical

Grfico de Setores: usado para comparar propores, conforme representado pela Fig. 1.10.
Grfico de Linhas: usado para apresentar sries cronolgicas, conforme representado pela Fig.
1.11.
Os brasileiros de frias no exterior

8%

Coca-Cola

10%
38%

Guaran
Antrtica
Fanta

18%

Sprite
Outros
26%

Fonte: no identificada

Fig. 1.10 Grfico de setor

Milhes de viajantes

Consumo de refrigerantes
5

4,2

4
3

2,9

2,9
2,3

1,9

1,7

1
0
1

Ano

Fonte: Revista Veja, 14 de jan. de 2008

Fig. 1.11 Grfico de linhas

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

13

Grficos Comparativos: so desenhados dois grficos, lado a lado, para melhor estabelecer a
comparao de um fenmeno, conforme representado na Fig. 1.12.

As universidades e o cumprimento da LDB


100,00%

Situaes das Instituies:

Porcentagem

90,00%
80,00%
70,00%
60,00%
50,00%
40,00%

Privadas

30,00%

Pblicas

20,00%
10,00%

Total

0,00%
1

1 Com ao menos 1/3 do corpo docente


trabalhando em regime integral.
2 - Com ao menos 1/3 do corpo docente
com ttulo de mestre ou doutor
3 Tm menos de trs cursos de psgraduao recomendados pela Capes

Situao das Instituies

Fonte: Folha de So Paulo, 12 de jan. de 2004

Fig. 1.12 Grfico comparativo

Atravs das tabelas e grficos, o educador est capacitado a entender o complexo


educacional (matrcula, escolarizao, aprovao, repetncia, evaso, ...), ver a evoluo dos
fenmenos relevantes, decidir sobre as prioridades, programar e executar seu planejamento.
Os dados tambm podem ser estudados pela distribuio de freqncia, histograma e
polgono de freqncia.

1.9 - Exerccios

1. Identifique cada nmero como discreto ou contnuo:


a) Cada cigarro tem 16,13 mg de alcatro.
b) O altmetro de um avio da VARIG indica uma altitude de 21.359 ps.
c) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas assinam a revista X.
d) De 1000 consumidores pesquisados, 930 reconheceram a marca da Coca-Cola.

2. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo


contactar por telefone 1500 consumidores. Por que razo incorreta a utilizao de listas
telefnicas como populao para fornecer a amostra?

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

14

3. Um relatrio patrocinado pela Florida Citrus Comission concluiu que os nveis de colesterol
podem ser reduzidos mediante ingesto de produtos ctricos. Por que razo a concluso
poderia ser suspeita?
4. Identifique o tipo de amostragem utilizado:
a) Um psiclogo de uma Universidade seleciona 12 homens e 12 mulheres de cada uma
das quatro turmas de ingls.
b) Um cabo eleitoral escreve o nome de cada vereador da cidade, em cartes separados,
mistura-se e extrai 3 nomes.
c) Um pesquisador mdico da USP entrevista todos os portadores de leucemia em cada
um dos 20 hospitais selecionados aleatoriamente.
d) A empresa Sony seleciona cada 200 CD de sua linha de produo e faz um teste de
qualidade rigoroso.
e) Um professor seleciona 15% de mulheres e 15% de homens de uma turma para
responder a uma pergunta.
f) A supervisora escolhe dentre os 28 professores, 3 para representar a escola em um
evento na cidade.

5. Uma populao se encontra dividida em trs estratos, com tamanhos, respectivamente, A =


80, B = 120 e C = 60. Ao se realizar uma amostragem estratificada proporcional, 12
elementos da amostra foram retirados do primeiro estrato. Qual o nmero de elementos da
amostra?
6. Uma amostragem entre os moradores de uma cidade realizada da seguinte forma: em cada
bairro, sorteia-se um certo nmero de quarteires proporcional rea do bairro; de cada
quarteiro, so sorteadas cinco residncias, cujos moradores so entrevistados.
a) Essa amostra ser representativa da populao ou poder apresentar algum vcio?
b) Que tipo de amostragem foram usados no procedimento? Justifique.
7. Discuta sobre o planejamento de um experimento enfatizando a importncia dos mtodos de
boa amostragem.

8. (ENEM/98) Uma pesquisa de opinio foi realizada para avaliar os nveis de audincia de
alguns canais de televiso, entre 20h e 21h, durante uma determinada noite. Os resultados
obtidos esto representados no grfico de barras abaixo.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

15

N de residncias

100
80
60

40
20

nenhum

Fig. 1.13 - N de residncias ligadas em um determinado canal de TV, entre 20h e 21h, durante uma noite.

I) O nmero de residncias atingidas nessa pesquisa foi aproximadamente de:


a) 100

b) 135

c) 150

d) 200

e) 220

II) A porcentagem de entrevistados que declararam estar assistindo ao canal B aproximadamente:


a) 15%

9.

b) 20%

c) 22%

d) 27%

e) 30%

O quadro abaixo apresenta o nmero de novos casos de AIDS notificados anualmente no


Brasil no perodo considerado:

20.000
18.000

16.000
14.000

12.000
10.000
1991 1992

1993 1994

1995 1996 1997

Fig. 1.14 - Nmero de novos casos de AIDS notificados anualmente no Brasil

As informaes contidas no grfico permitem concluir corretamente que, no perodo


considerado:
a) a partir de 1997, certamente caiu o nmero de novos casos de aidticos;
b) o nmero aproximado de aidticos no pas, em 1997, era de 112.000;
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

16

c) a maior taxa de variao no nmero de aidticos ocorreu em 1996;


d) a maior taxa de variao no nmero de aidticos ocorreu em 1992;
e) o nmero mximo de aidticos ocorreu em 1996.

10. No grfico de colunas dos resultados do Proeb 2000 e do SAEB 99 para o 1 Ano do Ciclo
Intermedirio (4 Srie) do Ensino Fundamental, CORRETO afirmar que:
a) O rendimento em Matemtica foi inferior ao de Portugus no Proeb 2000.
b) O rendimento em Portugus foi superior ao de Matemtica no SAEB 99 MG.
c) O rendimento em Matemtica foi superior ao de Portugus em todas as fases.
d) O rendimento em Portugus foi superior ao de Matemtica em todos os programas de
avaliaes.

Resultados do Proeb 2000 e do SAEB 99 para o 1 Ano do Ciclo Intermedirio (4


Srie) do Ensino Fundamental
205
200
195
190
185
180
175
170
165
160
155

Proeb 2000 - Regular


SAEB 99 - MG Estadual
SAEB 99 - MG
SAEB 99 - Brasil

Portugus

Matemtica

11. Os empregados na Eletronics Associates esto num sistema de horrio flexvel: eles podem
comear seu dia de trabalho s 7h, 7h30, 8h ou 9h. Os seguintes dados representam uma
amostra do horrio de incio escolhido pelos empregados:
7h

8h30 9h

8h

7h30 7h30 8h30 8h30 7h30 7h

8h30 8h30 8h

8h

7h30 8h30 7h

9h

8h30 8h

Construa uma tabela para representar os dados acima.


(Adaptado do livro Estatstica Aplicada Administrao e Economia, de David R. Anderson et al. Ed.
Pioneira, 2002).

12. Faa um grfico de barras e um de pizza para representar os dados do exerccio 11.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

17

13. Imagine que foi obtida a opinio de 1000 pessoas a respeito da liberao de determinado
filme para exibio em televiso. Dessas 1000 pessoas, 432 mostravam-se favorveis, 322
eram contrrias, 122 no quiseram declarar opinio e as restantes disseram no ter opinio
formada. Mostre esses dados numa tabela.

14. Faa um grfico de setores levando em conta os dados do exerccio 13.

15. Faa um grfico de barras para apresentar os valores de densidade demogrfica, segundo a
regio.
Tab. 1.2: Densidade Demogrfica no Brasil, segundo a regio,
de acordo com o censo de 1980
Regio

Densidade (hab./km2)

Norte

1,65

Nordeste

22,57

Sudeste

56,31

Sul

33,86

Centro-Oeste

4,01

FONTE: IBGE (1984)

16. Construa um grfico de linhas para mostrar que, na Escola de 1 Grau D. Pedro II, a taxa
de evaso escolar (porcentagem de alunos que abandonaram a escola) foi 12,1; 11,3; 10,7;
15,0; 14,7 e 10,1 em 1980, 1981, 1982, 1983, 1984 e 1985, respectivamente.
17. Os principais mercados emissores de turista para o Brasil em 1998 esto relacionados na
tabela abaixo. Obtenha o grfico em: a) barra;

b) barra vertical

Tab. 1.3: Principais mercados emissores de turistas para o Brasil (1998)


Pases

Turistas (%)

Argentina

31

Estados Unidos

11

Paraguai

Uruguai

Alemanha

Itlia

Chile

Bolvia

Frana

Portugal

Inglaterra

Outros

20

Fonte: Embratur
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

18

18. Aberta e fechada so dois tipos de questes de uma pesquisa. Uma questo aberta permite
uma resposta livre, enquanto uma questo fechada apenas uma resposta fixa. Quais so as
vantagens e desvantagens das questes abertas? E das fechadas? Que tipo mais fcil de
analisar com processos estatsticos formais?

19. Elaborar uma questo(es) aberta(s) ou fechada(s) sobre o tema: Importncia da Pesquisa de
Mercado.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

19

2. REPRESENTAO GRFICA E DISTRIBUIO DE FREQNCIA


2.1 Introduo
Ao estudarmos grandes conjuntos de dados, conveniente organiz-los e resumi-los,
construindo uma tabela de freqncias. A ttulo de ilustrao, considere o exemplo a seguir, de
dados brutos, relativo ao tempo de parada (em minutos) de uma mquina para manuteno (Tab.
2.1).
A construo de uma distribuio de freqncia consiste na elaborao de classes a partir de
intervalos, fixando um nmero adequado de classes.
Tab. 2.1 - Tempo de parada (em minutos) de uma mquina para manuteno
7

10

10

O primeiro procedimento a ser tomado para a elaborao de uma distribuio de freqncias


de uma varivel contnua consiste na ordenao dos dados (rol), para permitir uma melhor
manipulao (Tab. 2.2).
Tab. 2.2 - Tempo de parada (em minutos) de uma mquina para manuteno
1

10

10

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

20

2.2 Distribuio de Freqncias


A preciso de medida corresponde ao menor valor detectvel pelo instrumento ou
procedimento de medida empregado. No exemplo dos tempos de parada, a preciso de medida x
= 1. Deve-se atentar que os valores presentes no conjunto de dados no so exatos, mas carregam
alguma inexatido devido preciso de medida. Assim, um valor de 5 no representa
necessariamente uma nota de exatamente 5, mas sim uma nota que pode estar acontecendo em
qualquer ponto entre 4,5 e 5,5.
A elaborao de uma distribuio de freqncia para variveis contnuas requer a
apresentao de alguns conceitos:
1 Amplitude: corresponde diferena entre o maior e o menor valor de um conjunto de dados.
Em geral, simbolizada por A.

2 - Amplitude de Classe: consiste na diferena entre o limite superior e o limite inferior de uma
classe em uma distribuio de freqncia. Ser aqui simbolizada por c.

A seguir, temos o algoritmo para obteno de uma distribuio de freqncia relativa uma
varivel contnua.
Passo 1 Escolhe-se um nmero de classes k. importante que a distribuio conte com um
nmero adequado de classes. Se esse nmero for escasso, os dados originais ficaro to
comprimidos que pouca informao poder ser extrada desta tabela. Se, por outro lado, forem
utilizadas muitas classes, haver algumas com freqncia nula ou muito pequena, apresentando uma
distribuio irregular e prejudicial interpretao do fenmeno.
Para determinar o nmero de classes h diversos mtodos. Veremos dois deles:
(1) k = 5, para n 25 e

k n

para n > 25, utiliza-se a


(2) Frmula de Sturges: k = 1 + 3,3 log n, onde n o tamanho da amostra.
Ex: Se n = 49 teramos:
(1) k = 7
(2) k = 1 + 3,3 log 49 = 6,58 7
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

21

Mesmo tendo outros critrios de determinao do nmero de classes, o que se deve ter em
mente que a escolha depender, sobretudo da natureza dos dados e da unidade de medida em que
eles se encontram, e no somente de regras muitas vezes arbitrrias e pouco flexveis. Para facilitar
a anlise conveniente que se mantenham os intervalos de classe sempre constantes.
Passo 2 Calcula-se a amplitude total A dos dados: A = MVO mvo onde MVO: maior valor
observado e mvo: menor valor observado;
Passo 3 Calcula-se a amplitude de classe c, atravs de: fazendo o arredondamento igual ao
nmero de casas decimais dos dados.

A x
k

Passo 4 O limite inferior LI1 da 1 classe obtido por: LI1 = mvo - x/2
Passo 5 - O limite superior LS1 da 1 classe obtido por: LS1 = LI1 + c
sendo que LS1 = LI2 e assim, sucessivamente soma-se ao valor do limite inferior da primeira
classe a amplitude de classe e obtm-se o limite superior, sendo o limite superior da primeira classe
o inferior da segunda;
Passo 6 Construdas as classes, so contados quantos dados esto em cada classe (freqncias
absolutas de cada classe);
Obs: a frequncia absoluta (fa) o nmero de repeties de um valor individual ou de uma classe
de valores da varivel.
Passo 7 - So calculadas as freqncias relativas e percentuais de cada classe.
Obs: a frequncia relativa (fr) representa a proporo de observaes de um valor individual ou de
uma classe, em relao ao nmero total de observaes. Trata-se, portanto, de um nmero relativo.
Obs: a frequncia percentual (fp) o produto da freqncia relativa por 100, tendo como resultado
uma porcentagem.
Obs: a frequncia acumulada (fA) a soma da frequncia absoluta, sendo que a primeira fA a
frequncia absoluta da primeira classe. Somando a frequncia absoluta da primeira classe com a
segunda classe, temos como resultado a frequncia acumulada da segunda classe e assim
sucessivamente.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

22

2.3 Histograma e Polgono de Freqncias


Com o conceito de densidade de freqncia, pode-se apresentar as duas principais
representaes grficas: o histograma e o polgono de freqncia.
Histogramas so retngulos cujas bases so proporcionais as amplitudes de classes e as reas
proporcionais as freqncias das classes. Todas as classes devem ter a mesma amplitude.
Polgono de freqncia so grficos de linhas unindo os pontos mdios das classes no topo
dos retngulos.
Vamos exemplificar os processos acima descritos atravs do exemplo do tempo de parada
(em minutos) de uma mquina para manuteno.
No exemplo, temos:
Passo 1: Escolhe-se, por exemplo, k = 1 + 3,3 log 40 = 6,28 6 classes;
Passo 2: A = 10 1 = 9;
Passo 3: c = (9 + 1) / 6 = 1,67 => 2;
Passo 4: LI1 = 1 1 / 2 = 0,5;
Passo 5: LS1 = LI2 = 0,5 + 2 = 2,5
LS2 = LI3 = 2,5 + 2 = 4,5
LS3 = LI4 = 4,5 + 2 = 6,5
LS4 = LI5 = 6,5 + 2 = 8,5
LS5 = 8,5 + 2 = 10,5
Tab. 2.3 - Distribuio de freqncias relativas ao tempo de parada (em minutos) de uma mquina para

manuteno
Classes

FA

FR

FP

(0,5 2,5]

0,050

5,0%

(2,5 4,5]

0,175

17,5%

(4,5 6,5]

0,100

10,0%

(6,5 8,5]

17

0,425

42,5%

(8,510,5]

10

0,250

25,0%

Totais

40

1,000

100,0%

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

23

fr
0,425
Fig. 2.1 - Histograma e Polgono de Freqncia
0,250
0,175

0,100
0,050
0

0,5

2,5

4,5

6,5

8,5

10,5

tempo

2.4 - Exemplo de Dados com Tabelas de Freqncia


Considere o exemplo a seguir, relativo mdia da quantidade de cerveja vendida, em caixas
por dia, durante o carnaval, por 201 bares de uma determinada cidade (Tab. 2.4).
O primeiro procedimento a ser tomado para a elaborao de uma distribuio de freqncias
de uma varivel contnua consiste na ordenao dos dados, para permitir uma melhor manipulao
(Tab. 2.5).
A preciso de medida corresponde ao menor valor detectvel pelo instrumento ou
procedimento de medida empregado. No exemplo, a preciso de medida x = 0,1.
Tab. 2.4 Mdia da quantidade de cerveja vendida, em caixas por dia, durante o carnaval, por 201 bares de uma determinada cidade.
__________________________________________________________________________________________
24,7

25,8

23,6

18,6

20,7

22,4

22,4

21,4

19,2

18,2

21,2

20,0

17,8

17,5

19,7

23,7

15,3

13,6

20,7

17,0

15,7

15,1

13,8

11,1

14,7

17,6

16,2

13,4

13,2

14,1

13,1

20,1

19,8

16,8

12,0

11,9

15,0

14,1

14,4

6,9

26,6

24,6

22,2

22,8

24,0

30,6

33,0

23,0

20,9

19,5

21,2

20,4

23,3

27,1

21,6

20,4

25,5

19,6

26,2

21,6

14,3

17,9

15,4

12,6

13,2

13,3

12,8

10,4

11,5

10,3

10,6

14,1

13,8

27,5

25,4

26,6

28,5

25,9

25,2

26,3

24,7

24,1

23,3

22,7

19,0

22,8

22,3

23,7

21,0

19,3

21,2

19,7

16,7

19,3

18,9

19,7

22,6

25,2

30,4

22,6

15,3

17,9

21,6

21,0

25,1

21,3

26,2

23,8

24,6

27,3

18,9

18,8

14,6

14,1

21,0

23,7

17,3

24,4

17,3

18,6

19,9

19,5

15,3

20,8

18,9

20,3

18,0

16,9

20,5

19,7

12,8

21,1

21,0

22,7

15,0

15,1

13,3

17,7

5,3

14,5

19,3

15,8

16,7

9,7

14,1

19,5

14,3

17,0

27,5

19,0

22,9

18,0

16,7

18,5

12,9

18,2

14,3

18,6

17,2

18,6

16,4

18,8

12,6

13,7

10,7

17,5

16,2

15,1

13,9

11,8

17,8

17,0

15,7

15,3

22,4

14,1

20,4

19,6

20,1

26,6

33,8

20,0

22,2

20,4

25,8

17,7

15,0

19,2

12,7

22,7

19,0

13,5

15,4

14,5

18,5

21,0

32,7

21,8

23,6

16,8

14,1

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

24

Tab. 2.5 Dados ordenados, relativos mdia da quantidade de cerveja vendida, em caixas por dia, durante o carnaval,
por 201 bares de uma determinada cidade.
5,3

6,9

9,7

10,3

10,4

10,6

10,7

11,1

11,5

11,8

11,9

12,0

12,6

12,6

12,7

12,8

12,8

12,9

13,1

13,2

13,2

13,3

13,3

13,4

13,5

13,6

13,7

13,8

13,8

13,9

14,1

14,1

14,1

14,1

14,1

14,1

14,1

14,3

14,3

14,3

14,4

14,5

14,5

14,6

14,7

15,0

15,0

15,0

15,1

15,1

15,1

15,3

15,3

15,3

15,3

15,4

15,4

15,7

15,7

15,8

16,2

16,2

16,4

16,7

16,7

16,7

16,8

16,8

16,9

17,0

17,0

17,0

17,2

17,3

17,3

17,5

17,5

17,6

17,7

17,7

17,8

17,8

17,9

17,9

18,0

18,0

18,2

18,2

18,5

18,5

18,6

18,6

18,6

18,6

18,8

18,8

18,9

18,9

18,9

19,0

19,0

19,0

19,2

19,2

19,3

19,3

19,3

19,5

19,5

19,5

19,6

19,6

19,7

19,7

19,7

19,7

19,8

19,9

20,0

20,0

20,1

20,1

20,3

20,4

20,4

20,4

20,4

20,5

20,7

20,7

20,8

20,9

21,0

21,0

21,0

21,0

21,0

21,1

21,2

21,2

21,2

21,3

21,4

21,6

21,6

21,6

21,8

22,2

22,2

22,3

22,4

22,4

22,4

22,6

22,6

22,7

22,7

22,7

22,8

22,8

22,9

23,0

23,3

23,3

23,6

23,6

23,7

23,7

23,7

23,8

24,0

24,1

24,4

24,6

24,6

24,7

24,7

25,1

25,2

25,2

25,4

25,5

25,8

25,8

25,9

26,2

26,2

26,3

26,6

26,6

26,6

27,1

27,3

27,5

27,5

28,5

30,4

30,6

32,7

33,0

33,8

Para o exemplo, temos:


Passo 1: Escolhe-se, por exemplo, k = 1 + 3,3 log 201 = 8,60 10 classes;
Passo 2: A = 33,8 5,3 = 28,5;

Passo 3: c = (28,5 + 0,1) / 10 = 2,86 => 2,9;


Passo 4: LI1 = 5,3 0,1 / 2 = 5,25;
Passo 5: LS1 = LI2 = 5,25 + 2,9 = 8,15
LS2 = LI3 = 8,15 + 2,9 = 11,05 e assim por diante.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

25

Tab. 2.6 - Distribuio de freqncias, relativa mdia da quantidade de cerveja vendida, em caixas por dia, durante o
carnaval, por 201 bares de uma determinada cidade

CLASSES

fa

fr

fp

[5,25; 8,15)

0,0100

1,00

[8,15; 11,05)

0,0249

2,49

[11,05; 13,95)

23

0,1144

11,44

[13,95; 16,85)

38

0,1891

18,91

[16,85; 19,75)

48

0,2388

23,88

[19,75; 22,65)

37

0,1841

18,41

[22,65; 25,55)

29

0,1443

14,43

[25,55; 28,45)

13

0,0646

6,43

[28,45; 31,35)

0,0149

1,49

[31,35; 34,25)

0,0149

1,49

TOTAIS

201

1,0000

100,00

Na Fig. 2.2 est representado o histograma e o polgono de freqncia.

Figura 2.2 - Histograma e Polgono de Freqncia da distribuio de freqncia relativa, da


quantidade de cerveja vendida, em caixas por dia, durante o carnaval, por 201 bares de uma
determinada cidade.
fr
0,2500

0,2000

0,1500

0,1000

0,0500

0,0000

5,25

8,15

11,05

13,95

16,85

19,75

22,65

25,55

28,45

31,35

34,25

Quantidade de caixas de cerveja vendidas em mdia por dia


______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

26

2.5 - Exerccios:
1) Construa uma tabela de freqncias (pm, fa, fr, fp e fac), histograma e polgono de freqncia da
renda familiar (em reais) de 54 funcionrios de uma empresa. Os valores foram:
80
105
182
446

344
166
150
62

416
204
65
236

348
26
356
212

166
120
316
60

220
436
94
64

262
125
86
114

360
132
150
76

204
90
270
48

144
40
202
29

332
220
202
514

34
46
365
140

140
154
79

180
116
148

2) Construa uma tabela de freqncias (fa, fr e fp), uma tabela de densidade de freqncia relativa,
o histograma e o polgono de freqncia das 20 observaes relativas ao ndice pluviomtrico em
determinados municpios do Estado de Minas Gerais. Os ndices (em milmetros de chuva) so:
144

152

159

160

160

151

142

141

141

150

143

158

157

146

154

145

141

150

142

146

3) D-se abaixo a distribuio dos salrios mensais de 200 funcionrios da educao da prefeitura
de uma cidade.

Quantia (dlares)

faparente

( 0,00 200,00]

90

(200,00 400,00]

40

(400,00 600,00]

32

(600,00 800,00]

18

(800,00 1000,00]

15

(1000,00 1200,00]

Total

200

frelativa

fpercentual

facumulada

Complete a tabela acima. Construa o histograma e o polgono de freqncia correspondente.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

27

4) Complete a tabela de distribuio de freqncias abaixo. Faa o histograma e o polgono de


freqncia.
Classes

faparente

frelativa

1,5 3,2

0,08

3,2 4,9

4,9 6,6
7

8,3 10,0

8%

0,14

10,0 11,7

20%
7

0,14

13,4 15,1
Totais

facumulada

0,16

6,6 8,3

11,7 13,4

fpercentual

10%
1,00

100%

3. MEDIDAS DE POSIO E DISPERSO


As distribuies de freqncias e os grficos fornecem mais informaes sobre o
comportamento de uma varivel do que a prpria srie original de dados. Mas, queremos resumir
ainda mais esses dados. Com esse objetivo usaremos mtodos da Estatstica Descritiva que ensinam
a reduzir a informao contida em uma grande quantidade de dados a um pequeno nmero de
medidas, substitutas e representantes daquela massa de dados. Vamos agora estudar as principais
medidas da Estatstica Descritiva, agrupadas em medidas de posio (ou de locao ou de
localizao), medidas de disperso (ou de variabilidade).

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

28

Com base no polgono de freqncia pode-se classificar o tipo de distribuio dos dados
amostrais ou experimentais com que se est trabalhando. Esta classificao de suma importncia,
pois grande parte das anlises que sero abordadas posteriormente neste material depende da
natureza desta distribuio, sendo que a maioria requer distribuio do tipo simtrica ou
aproximadamente simtrica.

Fig. 3.1 Naturezas de uma distribuio.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

29

3.1 - Tcnicas de Somatrio


3.1.1 - ndices ou Notao por ndices
O smbolo Xj (leia X ndice j) representa qualquer um dos n valores, X1, X2, ..., Xn,
assumidos pela varivel X, na amostra ou no conjunto de dados. A letra j, usada como ndice, pode
representar qualquer um dos valores: 1, 2, ... n. Evidentemente pode ser usada qualquer outra letra
alm do j.

3.1.2 - Notao de Somatrio


n

X j usado para representar a soma de todos os valores X desde j = 1 at


O smbolo j
j
1
j = n, ou seja, por definio:
n

X j X1 X2 ... Xn

j1

O smbolo a letra grega sigma, que indica soma.

3.1.3 - Exerccio

Seja

Xj

j1

n 2
1
a mdia aritmtica e S 2
Xj
n 1 j1

X j
j1
n

a varincia.

Dado o conjunto de dados X = {2, 4, 5, 6, 1, 8}, calcule a sua mdia e varincia.

3.2 - Medidas de Posio ou de Tendncia Central


Uma medida de tendncia central procura sintetizar as informaes da amostra em um nico
e informativo valor. Ao examinar uma distribuio amostral simtrica ou aproximadamente
simtrica, nota-se que geralmente, eles so mais freqentes perto de um valor central e mais raro ao
afastar-se deste. A obteno deste valor central de suma importncia nos levantamentos amostrais,
seja na pesquisa ou na extenso.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

30

A medida de posio uma grandeza numrica que descreve um conjunto de dados, pela
indicao da posio do conjunto na escala de valores possveis que a varivel em questo pode
assumir. Dentre elas, sero abordadas a mdia, a mediana e a moda.

Exemplo de aplicao: (Notas)


Uma escola tinha duas turmas de mesma srie, mesmo contedo, mesmo professor, mas com
resultados diferentes. Em vista dessa situao, a escola decidiu formar um grupo de trabalho para
resolver esses problemas. Para avaliar se estavam ocorrendo problemas, o grupo decidiu retirar uma
amostra aleatria dos alunos, verificar as notas e comparar os resultados. Foi utilizada uma
estratificao, sendo ento retirada uma amostra de 80 notas da turma A e 80 da turma B. Os dados
coletados, j ordenados, esto na Tab. 3.1, a seguir.
Tab. 3.1 - Medidas das Notas de 160 alunos (dados ordenados)

TURMA A

TURMA B

2,3

3,1

3,8

4,5

4,9

5,6

5,8

6,2

2,4

3,1

3,9

4,5

4,9

5,6

5,8

6,2

2,4

3,3

3,9

4,5

5,0

5,6

5,8

6,3

2,4

3,3

3,9

4,5

5,1

5,7

5,8

6,3

2,6

3,4

4,0

4,5

5,1

5,7

5,9

6,4

2,7

3,4

4,0

4,6

5,1

5,7

5,9

6,4

2,7

3,5

4,0

4,6

5,3

5,7

5,9

6,4

2,8

3,5

4,0

4,7

5,3

5,7

5,9

6,4

2,8

3,5

4,0

4,7

5,3

5,7

5,9

6,4

2,8

3,5

4,1

4,9

5,3

5,7

5,9

6,5

2,9

3,5

4,1

4,9

5,3

5,7

6,0

6,5

2,9

3,5

4,1

5,1

5,3

5,7

6,0

6,5

2,9

3,6

4,2

5,2

5,3

5,7

6,0

6,5

3,0

3,6

4,2

5,4

5,4

5,7

6,1

6,6

3,0

3,7

4,2

5,4

5,4

5,7

6,1

6,7

3,0

3,7

4,3

5,5

5,4

5,7

6,1

6,7

3,1

3,7

4,3

5,6

5,4

5,8

6,1

6,7

3,1

3,7

4,3

5,6

5,4

5,8

6,1

6,8

3,1

3,8

4,4

5,7

5,5

5,8

6,2

6,9

3,1

3,8

4,4

5,9

5,5

5,8

6,2

7,0

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

31

Ao observarmos o conjunto de dados abaixo j fazemos alguma idia sobre o


comportamento das duas turmas. Entretanto, claramente necessitamos calcular algumas medidas
que resumam a informao contida nos dados. Vamos comear tentando responder: Qual o valor
tpico da turma A? E da turma B? A primeira idia para obter um valor tpico a de calcular uma
mdia. Vamos estudar um pouco sobre os diferentes tipos de mdia.

3.2.1 - Mdia Aritmtica


A mdia a principal medida de posio, sendo utilizada quando os dados apresentam
distribuio simtrica ou aproximadamente simtrica, como acontece com a maioria das situaes
prticas. A mdia , de modo geral, a mais importante de todas as mensuraes numricas
descritivas. A mdia aritmtica de um conjunto de valores o valor obtido somando-se todos eles e
dividindo-se o total pelo nmero de valores. Deve-se diferenciar, atravs de notao apropriada a
mdia populacional da amostral.
A mdia aritmtica simples de n nmeros x1, x 2 ,...,x n um valor x (mdia amostral) tal
que

x1 x 2 ... x n nx
logo temos que,
n
xi
x1 x 2 ... x n i

1
x

n
n

A mdia de todos os valores de uma populao dada por:

x
N

em que, n o tamanho da amostra, e N o tamanho da populao.

Resumindo em uma tabela as mdias aritmticas, temos:

Turma

Mdia Aritmtica

3,8575

5,8725

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

32

Observando as mdias aritmticas das amostras observadas, parece existir diferena, em


termos mdios, entre as notas das turmas A e B.
Podemos pensar na mdia aritmtica como o valor tpico do conjunto de dados e
considerada a principal medida de tendncia central. Algumas das razes que fazem com que seja a
medida de posio mais recomendada so:

definida rigorosamente e pode ser interpretada sem ambigidades;


Leva em considerao todas as observaes efetuadas;
Calcula-se com facilidade.
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensvel a
valores extremos, isto , a valores excessivamente pequenos ou excessivamente grandes, em relao
s demais observaes do conjunto de dados. Ex: Estamos interessados em conhecer o salrio
mdio mensal de certa empresa e delimitamos uma amostra mdia de cinco setores. Temos o
seguinte conjunto de salrios mensais, para os setores, em reais: 223 - 245 - 310 - 425 - 1.500.
Podemos observar que quatro dos cinco salrios apresentam valores entre 223 e 425 reais, porm a
mdia salarial de 540,6 reais bastante distinta desse conjunto pela influncia do salrio de 1.500
que puxou o valor mdio para cima.

Para dados agrupados em distribuio de freqncia:


k
Xi Fi
X i 1
n

em que Xi o ponto mdio da classe i e Fi a sua freqncia.


Como exemplo, vamos verificar os dados da Tab. 2.3, referente ao tempo de parada (em
minutos) de uma mquina para manuteno. Essa tabela foi modificada, de modo a ficar os itens
que nos interessam, conforme Tab. 3.2.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

33

Tab. 3.2: Distribuio de freqncias relativas tempo de parada (em minutos) de uma mquina para manuteno
Classes

Xi

Fi

(0,5 2,5]

1,5

(2,5 4,5]

3,5

(4,5 6,5]

5,5

(6,5 8,5]

7,5

17

(8,510,5]

9,5

10

Totais

40

Para o exemplo em questo:


k
X i Fi
1,5 2 3,5 7 5,5 4 7 ,5 17 9,5 10
x i 1

6,8
n
40

H uma diferena no clculo pelos dois processos. O resultado do ltimo apenas aproximado. No
entanto, o erro cometido mnimo, e, portanto deve ser desprezado.
Propriedades da mdia:
A soma algbrica dos desvios em relao mdia aritmtica nula.
A soma dos quadrados dos desvios de um conjunto de dados em relao a sua mdia um valor
mnimo.

X
n

i 1

X 0

D X i X
n

i 1

A mdia de um conjunto de dados acrescido (ou subtrado) em cada elemento por uma constante
igual mdia original mais (ou menos) essa constante.

X' X K
Em que X , a mdia do novo conjunto de dados.

Multiplicando todos os dados por uma constante a nova mdia ser igual ao produto da mdia
anterior pela constante

X' k X
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

34

A mdia influenciada por valores extremos.


No pode ser mensurada em distribuies com classes indeterminadas.

3.2.2 - Moda

A moda outra medida de posio, mas diferentemente das mdias, no utiliza em seu
clculo todos os valores do conjunto de dados analisado. A moda o valor que ocorre com maior
freqncia no conjunto de dados.
Notao: mo = moda
Ex:
a) X = {2, 3, 3, 5, 5, 5, 6, 7} mo = 5
b) Y = {10, 12, 17, 21, 32} mo = no existe, a distribuio amodal.
c) Z = {2, 2, 5, 5, 7, 7} mo = no existe
d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21} A distribuio apresenta dois valores modais:
12 e 18 (distribuio bimodal).
Quando o conjunto de dados apresenta mais de uma moda damos o nome de distribuio
plurimodal. A moda uma medida mais adequada ao caso de dados agrupados. Quando a
distribuio de freqncias est organizada por classes de valores, devemos identificar a classe
modal (classe em que observamos a maior freqncia). O ponto mdio da classe modal ser o valor
estimado para a moda que denominada moda bruta.

No caso de dados agrupados a moda pode ser calculada de acordo com a seguinte expresso:

m o LI mo

1
c mo
1 2

onde: LImo = limite inferior da classe modal;


cmo = amplitude da classe modal;
1 = diferena entre as freqncias da classe modal e a classe anterior;
2 = diferena entre as freqncias da classe modal e a classe posterior
Obs: No caso de dados no agrupados, a moda nem sempre tem utilidade com elemento
representativo ou sintetizador do conjunto.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

35

Resumindo em uma tabela as modas das notas, temos:


Turma

Moda

4,0

5,5

Para o exemplo da Tab. 3.3:


m o LI mo

1
13
c mo 6,5
2 7 ,8
1 2
13 7

Propriedades da moda:
mo = mo K (somando K a todos os dados)
mo = mo . K (multiplicando todos os dados por K)

3.2.3 - Mediana

Notao: md = mediana
Chamamos de mediana o elemento do conjunto que ocupa a posio central na distribuio
ordenada (crescente ou decrescente). Isto , divide a distribuio em duas partes iguais de modo
que 50% dos valores observados so inferiores ao valor mediano e 50% superiores a esse valor.

Notao: X(i)= elemento que ocupa a i-sima posio da srie ordenada.


n =nmero de elementos da srie.
X n X n

(1) md

1
2

, n par. Ex: No conjunto: 500 500 600 800 1000 50000, como o

nmero de valores 6 (par), a mediana a mdia de 600 e 800, valendo ento 700.
(2) md X n 1 , n mpar. Ex: No conjunto de dados: 10 15 26 28 29, como o nmero de

valores 5 (mpar), a mediana o 26.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

36

A mediana uma medida de posio resistente, pois pouco afetada por mudanas de
pequena poro dos dados, ao contrrio da mdia aritmtica que sensvel a valores atpicos.
Ex: Comparao entre a mdia aritmtica e a mediana para os conjuntos de salrios (em reais)
dados.
X = { 200, 250, 250, 300, 450, 460, 510} X = 345,7; md = 300.
Y = { 200, 250, 250, 300, 450, 460, 2.300} Y = 601,0; md = 300.

Podemos observar que no caso do conjunto Y a mdia no sintetiza adequadamente o conjunto de


dados, pois apenas um valor superior a ela.

Exemplo de aplicao: (Notas)


As mesmas comparaes feitas para a mdia faremos para a mediana para o nosso conjunto
de dados. Resumindo em uma mesma tabela as mdias e as medianas, temos:
Turma

Mdia Aritmtica

Mediana

3,8575

3,8

5,8725

5,8

Para ambas as turmas, a mdia aritmtica e a mediana apresentam valores semelhantes. Isso
indica que 50% das notas da turma A esto inferior a 3,8 e 50% da turma B apresentam superior a
5,8.
No caso de dados agrupados a mediana pode ser calculada de acordo com a seguinte
expresso:
n

2 FA
md LImd
. cmd
Fmd

em que, Fmd: freqncia da classe mediana,


cmd: amplitude da classe mediana,
FA: freqncia acumulada das classes anteriores classe mediana; e
LImd: limite inferior da classe mediana.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

37

A classe mediana a classe que contm a posio n/2 (posio mediana) da distribuio de
freqncia.
Para o exemplo da Tab. 4.3:
n

40

2 FA
2 13
md LImd
. cmd 6,5
2 7 ,32
Fmd
17

Propriedades da mediana:
md = md K (somando K a todos os dados)
md = md . K (multiplicando todos os dados por K)
i xi - md representa um valor mnimo
Vimos que as trs principais medidas de posio - a mdia aritmtica, a mediana e a moda tm o mesmo objetivo: determinar um valor tpico do conjunto de dados. Surge, ento, a seguinte
questo: quando deveremos utilizar cada uma dessas medidas?
De maneira geral, a moda a menos empregada e a mais difcil de calcular
satisfatoriamente. No entanto, adequada para caracterizar situaes onde estejam em causa os
casos ou valores mais usuais. Por exemplo, em resultados de uma avaliao, o professor pode estar
interessado nas notas que mais apareceram.
Correntemente a escolha feita entre a mdia e a mediana, dependendo da natureza do
problema a estudar e de outros fatores, muitos dos quais no podem abordar-se a nvel elementar.
A mediana tem vantagem: mais resistente do que a mdia, isto , a alterao drstica de
um s valor do conjunto de dados reflete-se substancialmente no valor da mdia e pode no refletirse, ou refletir-se muito pouco, no valor da mediana.
A mdia tem vantagens: quando a curva de freqncias tem forma de sino, mais ou menos
simtrica, com abas decaindo rapidamente (valores errticos muito improvveis), a mdia mais
eficiente do que a mediana; a mdia uma funo linear das observaes, propriedade que tambm
pode pesar na sua adoo.
Por fim, uma vantagem da mediana e da moda em relao mdia aritmtica que esta
ltima no pode ser calculada quando ocorrem classes de freqncias com limites indefinidos
(classes abertas). Entretanto, nesta situao, a moda e a mediana podem ser encontradas sem
qualquer dificuldade.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

38

Muitas vezes existem dvidas de qual medida utilizar para sintetizar os dados amostrais.
Como uma regra geral, pode-se definir qual medida mais conveniente para uma dada situao com
base na anlise do histograma ou do polgono de freqncias. Se a distribuio dos dados por
assimtrica, isto quando valores extremos predominam em uma das caudas da distribuio, deve
se preferir a mediana como medida sintetizadora. Isto se deve ao fato da mediana ser pouco sensvel
a presena de valores extremos, sendo considerada mais robusta que a mdia. O termo robusto o
termo tcnico usado para indicar esta propriedade da mediana em relao mdia aritmtica.

Relao entre mdia, mediana e moda:

= md = mo (distribuio simtrica; assimetria nula)

> md > mo (distribuio assimtrica direita ou positiva)

X < md < mo (distribuio assimtrica esquerda ou negativa)

3.3 - Medidas de Variao ou de Disperso

As medidas de posio no informam sobre a variabilidade dos dados e so insuficientes


para sintetizar as informaes amostrais. As medidas de disperso servem para avaliar o grau de
variabilidade dos valores de um conjunto de dados. Estas medidas permitem estabelecer
comparaes entre fenmenos de mesma natureza ou de natureza distinta e, em geral, essa
variabilidade observada em torno de uma medida de tendncia central. Essas medidas podem ser
absolutas ou relativas.

3.3.1 - Amplitude Total (medida de disperso absoluta)

Notao: A = Amplitude Total


Definio: A amplitude total de um conjunto de nmeros a diferena entre os valores extremos do
conjunto.
Observaes:
1) A amplitude total a medida mais simples de disperso.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

39

2) A desvantagem desta medida de disperso que leva em conta apenas os valores mnimo e
mximo do conjunto. Se ocorrer qualquer variao no interior do conjunto de dados, a
amplitude total no nos d qualquer indicao dessa mudana.
3) A amplitude total tambm sofre a influncia de um valor "atpico" (outlier) na distribuio
(um valor muito elevado ou muito baixo em relao ao conjunto).

Exemplo de aplicao: (Notas)

Vamos observar no nosso conjunto de dados as mdias aritmticas e as amplitudes totais


(ranges) para termos uma primeira idia sobre a variabilidade das notas para as diferentes turmas.

Turma

Mdia aritmtica Amplitude total

3,8575

3,6

5,8725

2,1

Podemos observar que a amplitude total para a turma B menor que a da turma A.

3.3.2 - Varincia e Desvio Padro

Poderia se pensar ento em utilizar a soma dos desvios em relao mdia como medida de
disperso ou de variabilidade. No entanto, esta medida no serve devido ao fato da soma de desvios
em relao mdia ser nula, e todos os conjuntos amostrais teriam variabilidade nula.
Uma medida da variabilidade que considera todas as observaes, e que a mais utilizada na
maioria das situaes na estatstica, devido s propriedades que possui a varincia ou a sua raiz
quadrada, o desvio padro. A varincia dada pela "mdia" da soma de quadrados de desvios em
relao mdia. Numa amostra de tamanho n , deveria ser utilizado este valor (n) como divisor,
desta soma de quadrados de desvios. No entanto, devido a motivos associados a propriedades dos
estimadores e inferncia estatstica, como divisor de varincia amostral usado n-1 em lugar de n
na expresso do clculo da varincia que ser apresentada a seguir.
Simbologia

Populao: Varincia 2 e
Desvio Padro
Amostra: Varincia S2 e Desvio Padro
______________________________________________________________________________________________________________
S
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica

Prof. MSc. Marcos Antnio Resende Miranda.

40

A varincia amostral dada por:

n
2
Xi X
2 i 1
S
n 1

em que, n 1 denominado graus de liberdade.


A unidade da varincia igual ao quadrado da unidade dos dados originais. O desvio
padro, por sua vez, expresso na mesma unidade do conjunto de dados, sendo obtido pela extrao
da raiz quadrada da varincia, fornecida pela expresso anterior.
Para o clculo da varincia ou desvio padro amostral a partir dos dados elaborados pode-se
usar a expresso acima. No entanto, devido a usar desvio em relao mdia ao quadrado, erros de
arredondamentos so comuns de ocorrer.
Por essa razo deve-se preferir as seguintes expresses (equivalentes):
2

n

Xi

1 n 2 i 1
S2
Xi

n 1 i 1
n

Para a obteno do desvio padro, basta extrair a raiz quadrada:


S S2

Fi X i
1 k
i 1

2
S2
F
X

i i

n 1 i 1
n

Clculo para dados agrupados em distribuies de freqncia:


Para o exemplo da Tab. 3.2:

1
1,5 2 3,5 7 5,5 4 7,5 17 9,5 102
2
2
2
2
2
S
2 1,5 7 3,5 4 5,5 17 7,5 10 9,5

40 1
40

S2 48,9205

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

41

Exemplo de aplicao: (Notas)

Da mesma maneira que trabalhamos com a amplitude total, vamos observar no nosso
conjunto de dados para as mdias aritmticas e os desvios padres (S) para termos uma primeira
idia sobre a variabilidade nas notas das turmas A e B.
Mdia

Turma

Aritmtica

Desvio Padro

3,8575

0,8706

5,8725

0,4802

Podemos observar que a Turma B apresenta maior mdia que a da turma A e alm disso a
sua variabilidade menor. Parece que esta turma atinge mais os objetivos, ou seja, uniformidade
nas notas (menor disperso) e notas maiores.

Observaes:
O desvio padro tem a unidade de medida igual a unidade de medida original da varivel, enquanto
que a varincia apresentar a unidade de medida elevada ao quadrado.
Ao trabalharmos com os dados de toda a populao calculamos a varincia e o desvio padro
populacional dividindo por N (tamanho da populao) e no por N-1.
Propriedades:
varincia
somando ou subtraindo uma constante aos dados a varincia no se altera;
multiplicando todos os dados por uma constante K a nova varincia ficar multiplicada por K2.

desvio padro
somando ou subtraindo uma constante aos dados o desvio padro no se altera;
multiplicando todos os dados por uma constante K o novo desvio padro ficar multiplicado por K.
A varincia e o desvio padro medem a variabilidade absoluta de uma amostra. Para
exemplificar este fato o exemplo a seguir bastante ilustrativo.
X = {1,2,3}; Y = {101,102,103} e Z = {1001,1002,1003}

Sx = 1,0

Sy = 1,0

Sz = 1,0

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

42

Os trs conjuntos possuem a mesma variabilidade absoluta, porm bastante intuitivo que
um desvio padro de uma unidade tem importncia diferente. fcil verificar que o desvio padro
de uma unidade mais importante no conjunto X, pois representa 50% do valor mdio.
Exemplo de Aplicao: mdia do tempo de espera dos clientes em um banco. Qual o desvio padro?
6,5

6,6

6,7

6,8

7,1

7,3

7,4

7,7

7,7

7,7

Soluo: Devemos seguir os seguintes passos:

achar a mdia dos valores;

subtrair a mdia de cada valor individual;

elevar ao quadrado cada uma das diferenas obtidas;

somar todos os quadrados obtidos;

dividir o resultado do passo 4 por (n 1);

extrair a raiz quadrada do resultado do passo 5.


Os resultados esto apresentados na Tab. 3.3.
Tab. 3.3 - Clculo do Desvio Padro do tempo de espera dos clientes em um banco

x mdia

(x mdia)2

6,5

- 0,65

0,4225

6,6

- 0,55

0,3025

6,7

- 0,45

0,2025

6,8

- 0,35

0,1225

7,1

- 0,05

0,0025

7,3

0,15

0,0225

7,4

0,25

0,0625

7,7

0,55

0,3025

7,7

0,55

0,3025

7,7

0,55

0,3025

71,5

2,0450

Mdia = 71,5 / 10 = 7,15

2,0450

10 1

0,2272 0,48

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

43

3.3.3 - Coeficiente de Variao de Pearson


O desvio padro ou varincia permitem a comparao da variabilidade entre conjuntos
numricos que possuam a mesma mdia e a mesma unidade ou grandeza. Diz-se que o desvio
padro uma medida de disperso absoluta. Nos casos em que os conjuntos referem-se a diferentes
unidades e possuam mdias amostrais diferentes, uma medida de disperso relativa, como o
coeficiente de variao (CV), necessria para se comparar variabilidade. O coeficiente de
variao refere-se a variabilidade dos dados em relao a mdia dos mesmos, sendo obtido pela
expresso seguinte.

CV

x 100%

No exemplo dos trs conjuntos apresentados anteriormente, tem-se: CVx = 50%; CVy = 1%
e CVz = 0,1%.
Portanto, o conjunto X apresentou uma maior variabilidade em relao aos demais.
3.4 Box-Plot
O box-plot um mtodo alternativo ao histograma para representar os dados. O box-plot
fornece informaes sobre as caractersticas de posio, assimetria, comprimento das caudas e
outliers de um conjunto de dados.
A construo de um box-plot exige que tenhamos o valor mnimo, o primeiro quartil, a
mediana, o terceiro quartil e o valor mximo. Como a mediana revela uma tendncia central, ao
passo que o quartis indicam a disperso dos dados, os box-plot tm a vantagem de no serem to
sensveis a valores extremos como outras medidas baseadas na mdia e no desvio padro.

Um

dos aspectos mais convenientes do uso dos box-plot a possibilidade de comparao entre dois ou
mais conjuntos de dados.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

44

Fig. 3.2 Box-plot

3.5 Exerccios
1) Dada amostra: 2, 3, 4, 5, 7, 10, 12.
a) Qual a amplitude?
b) Determine a mdia, a mediana e a moda.c) Calcule a varincia, o desvio-padro e o coeficiente
de variao.

2) Uma turma de 20 alunos apresentou o seguinte resultado numa prova de estatstica:


2,0
6,0

3,2
6,8

4,5
7,1

4,5
7,5

4,5
7,8

4,6
8,5

4,7
8,5

4,8
9,0

5,0
9,0

5,6
9,2

a) determinar a mdia, a mediana e a moda;


b) determinar a amplitude, a varincia, o desvio padro e o coeficiente de variao;
c) fazer uma anlise dos valores encontrados.

3) Na srie 60, 90, 80, 60, 50 a moda ser:


a) 50
b) 66
c) 60
d) 90
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

45

4) Quando queremos verificar a mquina que apresentou maior nmero de falhas, utilizamos:
a) moda
b) mediana
c) mdia
d) qualquer uma das anteriores.

5) O coeficiente de variao uma medida que expressa a razo entre:


a) desvio-padro e mdia
b) mdia e desvio-padro
c) amplitude e mediana
d) desvio-padro e moda.

6) O desvio-padro de um conjunto de dados 9. A varincia ser:


a) 3
b) 18
c) 36
d) 81

7) Numa distribuio de valores iguais, o desvio-padro :


a) igual a 1
b) positivo
c) zero
d) negativo

8) Os registros da biblioteca de uma grande universidade mostram que 14 alunos do ltimo ano do
curso de Administrao consultaram os seguintes nmeros de livros durante o ano acadmico:
62

73

40

72

79

88

51

48

42

75

65

69

72

47

a) determinar a mdia, a mediana e a moda;


b) determinar a amplitude, a varincia, o desvio padro e o coeficiente de variao;
c) fazer uma anlise dos valores encontrados.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

46

9) Em uma fbrica ou um escritrio, o tempo, no horrio de trabalho, durante o qual um mquina


no est funcionando em virtude de quebra ou falha chamado tempo parado (downtime). A
distribuio a seguir uma amostra da durao desses tempos parados de certa mquina:
tempo parado (min)

Fi

xi

(0 10]

(10 20]

15

15

(20 30]

17

25

(30 40]

13

35

(40 50]

45

Total

125

Fi . xi

Fi . xi2

Determine:
a) a mdia
b) a mediana
c) a moda
d) a varincia
e) o desvio padro
f) o coeficiente de variao
g) o primeiro e o terceiro quartil

4. MEDIDAS DE ASSIMETRIA E CURTOSE


Como foi visto vrias medidas que sintetizem a informao da amostra foram apresentadas,
destacando-se suas vantagens e desvantagens. Foi apresentado tambm, formas grficas para
avaliao da natureza da distribuio dos dados. Neste ltimo caso por uma inspeo emprica o
pesquisador podia inferir que tipo de distribuio os dados de sua pesquisa apresentavam. Naquele
instante deu-se nfase a simetria da distribuio, ou seja, se a forma da distribuio apresentava
uma concentrao maior dos valores em torno do valor central e se medida que se afastasse em
ambas as direes deste valor, o comportamento se mantinha semelhante, reduzindo-se as
freqncias. Uma forma de se estimar o grau de assimetria ou de simetria de uma distribuio, pode
ser dada pelo coeficiente de assimetria, cuja notao para represent-lo As.
As

x mo
s

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

47

O coeficiente de assimetria pode ser interpretado da seguinte forma:

As < 0 distribuio assimtrica esquerda;


Fig. 4.1 Distribuio assimtrica esquerda

As = 0 distribuio simtrica.
Fig. 4.2 Distribuio simtrica

As > 0 distribuio assimtrica direita.

Fig. .3 Distribuio assimtrica direita

Uma outra medida para verificar a natureza da distribuio, denominada de curtose. Esta
uma medida do grau de achatamento da distribuio quando comparada ao de uma distribuio
conhecida como distribuio normal, sendo denominada de distribuio mesocrtica. As
distribuies leptocrticas so mais pontudas que a distribuio normal e as distribuies
platicrticas so aquelas mais achatadas do que a normal.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

48

F
u
n

od
ed
e
n
s
id
a
d
ed
ep
ro
b
a
b
ilid
a
d
eN
o
rm
a
l
y
~n
o
rm
a
l(x
;0
;i), i=1
,2
,3
0
,6
0

0
,4
5

0
,3
0

0
,1
5

y
~n
o
rm
a
l(x
,1
)
y
~n
o
rm
a
l(x
,0
,2
)

0
,0
0
-3
,5
0

-1
,7
5

0
,0
0

1
,7
5

3
,5
0

y
~n
o
rm
a
l(x
,0
,3
)

Fig. 4.4 Classificao quanto curtose

(x, 1) leptocrtica;

(x, 0, 2) mesocrtica;

(x, 0, 3) platicrtica

4.1 Distribuio Normal


Uma varivel aleatria apresenta distribuio normal se essa distribuio simtrica e
apresenta a forma de sino. Ela depende de dois parmetros: a mdia e o desvio padro.

Regra Emprica (Adaptado do livro Estatstica Aplicada Administrao e Economia, Anderson,


David R. et al, Editora Pioneira, 2002)
Para dados que tm distribuio normal, em forma de sino:
Aproximadamente 68% dos valores de dados estaro dentro de um desvio padro da mdia;
Aproximadamente 95% dos valores de dados estaro dentro de dois desvios padres da mdia;

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

49

Quase todos os valores de dados estaro dentro de trs desvios padres da mdia.

Fig. 4.5 A regra emprica

Teorema de Chebyshev (Adaptado do livro Introduo Estatstica, Triola, Mario, Editora LTC,
1999)
A proporo (ou frao) de qualquer conjunto de dados a menos de k desvios padro a
contar da mdia sempre ao menos 1 1/k2, onde k um nmero positivo maior do que 1. Para k =
2 e k = 3, temos os seguintes resultados especficos:
ao menos 75% de todos os valores esto dentro de dois desvios padres da mdia;
ao menos 89% de todos os valores esto dentro de trs desvios padres da mdia.

O Teorema de Chebyshev se aplica a qualquer conjunto de dados, mas seus resultados so


aproximados.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

50

BIBLIOGRAFIA RECOMENDADA

ANDERSON, David R. & SWEENEY, Dennis J. & WILLIAMS , Thomas A. Estatstica Aplicada
Administrao e Economia. Traduo da 2 edio norte-americana Luiz Srgio de Castro
Paiva; reviso tcnica Petrnio Garcia Martins.. So Paulo: Pioneira Thomson Learning, 2002.

BUSSAB, Wilton de O. & MORETTIN, Pedro A. Estatstica Bsica. 5 ed. So Paulo: Saraiva,
2003.

FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade; TOLEDO, Geraldo Luciano.
Estatstica Aplicada. So Paulo: Atlas, 1995.

FREUND, John E. & SIMON, Gary A. Estatstica Aplicada: economia, administrao e


contabilidade. Traduo Alfredo Alves de Farias. 9 ed. Porto Alegre: Bookman, 2000.

MILONE, Giuseppe; ANGELINI, Flvio. Estatatstica aplicada. So Paulo: Atlas, 1995.

OLIVEIRA, Francisco Estevam Martins de. Estatstica e Probabilidade. 2 ed. So Paulo: Atlas,
1999.
SILVA, Ermes Medeiros da; SILVA, Elio Medeiros da; GONALVES, Valter. Estatstica: para
os cursos de economia, administrao e cincias contbeis. 3 ed. So Paulo: Atlas, 1997. V.1

STEVENSON, William J. Estatstica aplicada administrao. So Paulo: Harbra, 1986.

TRIOLA, Mario F. Introduo Estatstica. Traduo de Alfredo Alves de Faria. 7 ed. Rio de
Janeiro: LTC, 1999.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica
Prof. MSc. Marcos Antnio Resende Miranda.

51

Você também pode gostar