Escolar Documentos
Profissional Documentos
Cultura Documentos
CURSO DE ADMINISTRAO
APOSTILA DE ESTATSTICA I
I - A Natureza da Estatstica
1- Panorama Histrico
A origem da palavra Estatstica est associada palavra latina STATUS
(Estado). H indcios de que 3000 anos A.C. j se faziam censos na Babilnia, China
e Egito e at mesmo o 4o. livro do Velho Testamento faz referncia a uma instruo
dada a Moiss, para que fizesse um levantamento dos homens de Israel que
estivessem aptos para guerrear. Usualmente, estas informaes eram utilizadas para
a taxao de impostos ou para o alistamento militar. O Imperador Csar Augusto, por
exemplo, ordenou que se fizesse o Censo de todo o Imprio Romano.
Contudo, mesmo que a prtica de coletar dados sobre colheitas, composio da
populao humana ou de animais, impostos, etc., fosse conhecida pelos egpcios,
hebreus, caldeus e gregos, e se atribuam a Aristteles cento e oitenta descries de
Estados, apenas no sculo XVII a Estatstica passou a ser considerada disciplina
autnoma, tendo como objetivo bsico descrio dos BENS do Estado.
A palavra Estatstica foi cunhada pelo acadmico alemo Gottfried Achenwall
(1719-1772), que foi um notvel continuador dos estudos de Hermann Conrig (16061681). Gottfried determinou os objetivos da Estatstica e suas relaes com as demais
cincias.
Com a Escola Alem as tabelas tornaram-se mais completas, surgiram as
representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser
simples catalogao de dados numricos coletivos para se tornar o estudo de como
chegar a concluses sobre o todo (populao), partindo da observao de partes
desse todo (amostras).
Atualmente, os estudos estatsticos tm avanado rapidamente e, com seus
processos e tcnicas, Tm contribudo para a organizao dos negcios e recursos do
mundo moderno.
2- O que Estatstica?
A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para
coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao
dos mesmos na tomada de decises.
A utilizao de tcnicas, destinadas anlise de situaes complexas ou no,
tem aumentado e faz parte do nosso cotidiano. Tome-se, por exemplo, as
transmisses esportivas. Em um jogo de futebol, o nmero de escanteios, o nmero
de faltas cometidas e o tempo de posse de bola so dados fornecidos ao
telespectador e fazem com que a concluso sobre qual time foi melhor em campo se
torne objetiva (no que isso implique que tenha sido o vencedor...). O que tem levado
a essa qualificao de nossas vidas no dia a dia?
Um fator importante a popularizao dos computadores. No passado, tratar
uma grande massa de nmeros era uma tarefa custosa e cansativa, que exigia horas
de trabalho tedioso. Recentemente, no entanto, grandes quantidades de informaes
podem ser analisadas rapidamente com um computador pessoal e programas
adequados. Desta forma o computador contribui, positivamente, na difuso e uso de
mtodos estatsticos. Por outro lado, o computador possibilita uma automao que
pode levar um indivduo sem preparo especfico a utilizar tcnicas inadequadas para
resolver um dado problema. Assim, necessria a compreenso dos conceitos
bsicos da Estatstica, bem como as suposies necessrias para o seu uso de forma
criteriosa.
A grosso modo podemos dividir a Estatstica em trs reas:
Estatstica Descritiva
Probabilidade
Inferncia Estatstica
Vamos caracterizar estas trs reas
Estatstica Descritiva
A Estatstica Descritiva pode ser definida como um conjunto de tcnicas
destinadas a descrever e resumir dados, a fim de que possamos tirar concluses a
respeito de caractersticas de interesse. Em geral utilizamos a Estatstica Descritiva na
etapa inicial da anlise quando tomamos contato com os dados pela primeira vez.
Objetivando tirar concluses de modo informal e direto, a maneira mais simples seria a
observao dos valores colhidos. Entretanto ao depararmos com uma grande massa
de dados percebemos, imediatamente, que a tarefa pode no ser simples.Para tentar
retirar dos dados informaes a respeito do fenmeno sob estudo, preciso aplicar
algumas tcnicas que nos permitam simplificar a informao daquele particular
conjunto de valores. A finalidade da Estatstica Descritiva tornar as coisas mais
fceis de entender, de relatar e discutir.
A mdia industrial Dow-Jones, a taxa de desemprego, o custo de vida, o ndice
pluviomtrico, a quilometragem mdia por litro de combustvel, as mdias de
estudantes so exemplos de dados tratados pela Estatstica Descritiva.
Probabilidade
A Probabilidade pode ser pensada como o teoria matemtica utilizada para
estudar a incerteza oriunda de fenmenos que envolvem o acaso. Jogos de dados e
de cartas, ou o lanamento de uma moeda para o ar enquadram-se na categoria do
acaso. A maioria dos jogos esportivos tambm influenciada pelo acaso at certo
ponto. A deciso de um fabricante de cola de empreender uma grande campanha de
propaganda visando a aumentar sua participao no mercado, a deciso de parar de
imunizar pessoas com menos de vinte anos contra determinada doena, a deciso de
arriscar-se a atravessar uma rua no meio do quarteiro, todas utilizam a probabilidade
consciente ou inconscientemente.
Inferncia Estatstica
Inferncia Estatstica o estudo de tcnicas que possibilitam a extrapolao, a
um grande conjunto de dados, das informaes e concluses obtidas a partir de
subconjuntos de valores, usualmente de dimenses muito menores. Deve-se notar
que se tivermos acesso a todos os elementos que desejamos estudar, no
necessrio o uso das tcnicas de inferncia estatstica; entretanto, elas so
indispensveis quando existe a impossibilidade de acesso a todo o conjunto de dados,
por razes de natureza econmica, tica ou fsica.
Estudos complexos que envolvem o tratamento estatstico dos dados,
usualmente incluem as trs reas citadas acima.
3 - Fases do Trabalho Estatstico
O trabalho estatstico um mtodo cientfico, que consiste das cinco etapas
bsicas seguintes:
1- Coleta e crtica de dados
2- Tratamento dos dados
3- Apresentao dos dados
4- Anlise e interpretao dos resultados
5- Concluso
Amostragem
Coleta
Concluso
Censo
Tratamento
Apresentao
Anlise
II Amostragem
1- Populao e Amostras
Ao conjunto de entes portadores de, pelo menos, uma caracterstica comum
denominamos Populao estatstica ou universo estatstico.
Esse termo refere-se no somente a uma coleo de indivduos, mas tambm
ao alvo sobre o qual reside nosso interesse. Assim, nossa populao pode ser tanto
todos os habitantes de Vila Velha, como todas as lmpadas produzidas por uma
fbrica em um certo perodo de tempo, ou todo o sangue no corpo de uma pessoa.
Como em qualquer estudo estatstico temos em mente pesquisar uma ou mais
caractersticas dos elementos de alguma populao, esta caracterstica deve estar
perfeitamente definida. E isso se d quando, considerando um elemento qualquer,
podemos afirmar, sem ambigidade, se esse elemento pertence ou no populao.
Vamos entender que, em Estatstica, a palavra populao tem significado muito
mais amplo do que no vocabulrio leigo. Para o estatstico, todos os valores que uma
varivel pode assumir, nos elementos de um conjunto, constitui uma populao.
Algumas vezes podemos acessar toda a populao para estudarmos
caractersticas de interesse, mas em muitas situaes, tal procedimento no pode ser
realizado, por impossibilidade ou inviabilidade econmica ou temporal. Por exemplo,
uma empresa no dispe de verba suficiente para saber o que pensa todos os
consumidores de seus produtos. H ainda razes ticas, quando, por exemplo, os
experimentos de laboratrio envolvem o uso de seres vivos. Alm disso, existem
casos em que a impossibilidade de acessar toda a populao de interesse
incontornvel como no caso da anlise do sangue de uma pessoa ou em um
experimento para determinar o tempo de funcionamento das lmpadas produzidas por
uma indstria.
Tendo em vista as dificuldades de vrias naturezas para observar todos os
elementos da populao, tomaremos alguns deles para formar um grupo a ser
estudado. A essa parte proveniente da populao em estudo denominamos amostra.
Uma amostra um subconjunto finito de uma populao.
Populao
Estatstica descritiva
Consistncias dos dados
Interpretaes iniciais
Amostra
Inferncia Estatstica
Estimao de quantidades
desconhecidas
Extrapolao dos resultados
Teste de Hipteses
Exemplo: Imagine que 500 clientes esto cadastrados em sua empresa e voc
precisa obter uma amostra aleatria de 2% dos cadastros. O que voc faria?
Como queremos uma amostra de 2% dos cadastros, precisamos sortear 10
deles. Faremos isso seguindo os seguintes passos:
1 Numeramos os cadastros de 001 a 500.
2 - Para o sorteio exibiremos duas opes:
a) Escreva os nmeros de 001 a 500, em pedaos iguais de um mesmo papel,
colocando-os dentro de uma caixa. Agite sempre a caixa para misturar bem
os pedaos de papel e retire, um a um, dez nmeros que formaro a
amostra.
b) Coloque em uma urna, bolas numeradas de zero a nove, inclusive, misture
bem e retire uma. Anote o nmero dessa bola que ser o primeiro dgito do
nmero do cadastro que ser amostrado. Volte a bola retirada urna,
misture bem e retire outra. O nmero dessa segunda bola ser o segundo
dgito do nmero do cadastro que ser amostrado. O procedimento dever
ser repetido at completar os trs dgitos da numerao utilizada. Como a
populao constituda por 500 cadastros, devem ser desprezados os
nmeros maiores do que 500, bem como os nmeros que j foram sorteados
e o nmero 000. O sorteio dever ser repetido at se conseguir a amostra de
10 cadastros.
O processo de seleo exige que se atribuam nmeros consecutivos aos itens
listados escolhendo-se depois, aleatoriamente, os nmeros dos itens que comporo a
amostra. Conceitualmente, podemos usar cartas, dados, fichas numeradas ou bolas
numeradas para gerar nmeros aleatrios para gerar nmeros aleatrios
correspondentes aos nmeros de nossa listagem.
Na prtica, tais dispositivos so empregados raramente, por vrias razes.
Uma dela que cada dispositivo deixa algo a desejar; os mtodos no so
perfeitamente aleatrios. As cartas, por exemplo, podem aderir umas s outras,
impedindo um embaralhamento perfeito. As arestas de um dado podem estar
desgastadas. E sempre h o perigo de as bolas de uma urna no terem sido
convenientemente misturadas.Em vista disso, e porque a amostragem aleatria vital
para a inferncia estatstica, existem tabelas especialmente elaboradas, chamadas
Tabelas de Nmeros Aleatrios, construda de modo que os dez algarismos (0 a 9)
so distribudos ao acaso nas linhas e colunas.
Na tabela de nmeros aleatrios os dez algarismos 0,1,2,...,7,8,9, podem ser
lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem, como por
colunas, num sentido ou noutro, por linhas, diagonalmente etc., e podem ser
considerados aleatrios. A opo de leitura, porm, deve ser feita, antes de iniciado o
processo. Para usar uma tabela de nmeros aleatrios devemos:
1 Fazer uma lista dos nmeros da populao
2 Numerar consecutivamente os itens na lista, a comear do zero,
3 Ler os nmeros na tabela de nmeros aleatrios de modo que o nmero de
algarismos em cada um seja igual ao nmero de algarismos do ltimo nmero da
sua listagem.
4 Desprezar quaisquer nmeros que no correspondam a nmeros da lista ou que
sejam repeties de nmeros lidos anteriormente. Continue o processo at ter o
nmero desejado de observaes.
5 Usar os nmeros assim escolhidos para identificar os itens da lista a serem
includos na amostra.
10
11
Exemplo: Imagine que 500 clientes esto cadastrados em sua empresa e voc
precisa obter uma amostra aleatria de 2% dos cadastros. Como voc usaria a tabela
de nmeros aleatrios para extrair essa amostra?
Depois de numerar os cadastros podemos escolher, por exemplo, percorrer a
ltima coluna da tabela de cima para baixo lendo os trs primeiros algarismos de cada
linha. Os nmeros obtidos dessa forma so:
473, 828, 920, 923, 380, 272, 750, 488, 224,
764, 309, 192, 838, 466, 652, 344, 913, 412.
Desprezando os nmeros que so maiores do que 500 (e eventuais repeties)
devemos tomar para a amostra os cadastros de nmeros:
473, 380, 272, 488, 224, 309, 192, 466, 344, 412.
Dispondo-se de uma lista precisa dos itens da populao, relativamente
simples escolher uma amostra aleatria com o auxilio de uma tabela de nmeros
aleatrios. Na realidade, a lista no precisa conter todos os itens. As locaes dos
itens podem constituir uma alternativa, como por exemplo, os quarteires de uma
cidade, ou os arquivos de uma firma etc.
Amostragem Sistemtica
Quando os elementos da populao j se acham ordenados, no h
necessidade de construir um sistema de referncia. So exemplos os pronturios
mdicos de um hospital, os prdios de uma rua, as linhas de produo etc. Nestes
casos, a seleo dos elementos que constituiro a amostra pode ser feita por um
sistema imposto pelo pesquisador.
A Amostragem Sistemtica constituda de elementos retirados da populao
segundo um sistema preestabelecido.
Exemplo 1: Imagine que 500 clientes esto cadastrados em sua empresa e voc
precisa obter uma amostra aleatria de 2% dos cadastros. Como voc obteria uma
amostra sistemtica?
Precisamos obter uma amostra de tamanho 10. Para obter a amostra podemos
dividir 500 por 10, e obter 50. Sorteamos um nmero entre 1 e 50, inclusive, para ser o
primeiro cadastro da mostra e a partir desse nmero, contamos 50 cadastros e
retiramos o ltimo para fazer parte da amostra. Procedemos dessa forma at
completarmos os 10 cadastros da amostra.
Exemplo 2: No caso de uma linha de produo, podemos, a cada dez itens
produzidos, retirar um para pertencer a uma amostra da produo diria. Neste caso,
estaramos fixando o tamanho da amostra em 10% da populao.
preciso especial cuidado com o sistema de seleo. No forme uma amostra
com as primeiras pessoas de uma fila ou, se so atendidos 10 clientes por dia, no
escolha para a amostra, o dcimo de cada dez clientes. Estes procedimentos podem
determinar amostras tendenciosas. Recomenda-se sempre sortear o primeiro
elemento que ser selecionado para a mostra e, a partir da, usar o sistema de
seleo.
Amostragem Proporcional Estratificada
Muitas vezes a populao se divide em subpopulaes, denominadas de
Estratos. Como provvel que a caracterstica em estudo dessa populao apresente,
de estrato em estrato, um comportamento heterogneo e, dentro de cada estrato, um
comportamento homogneo, convm que o sorteio dos elementos da amostra leve em
considerao tais estratos.
A amostra proporcional estratificada composta por elementos proveniente de
todos os estratos.
Exemplo: Vamos obter uma amostra proporcional estratificada de 10% para a
pesquisa da estatura de 90 alunos de uma escola onde 54 so meninos e 36 so
meninas.
12
10 54
100
F 36
Total
90
10 36
100
10 90
100
,5
4
,36
9
Amostra
5
4
9
13
14
15
16
Nominal
Qualitativa
Ordinal
Varivel
Discreta
Quantitativa
Contnua
Qualitativas
Por perodo
Muito
dispendioso
3- Distribuio de Freqncia
Uma distribuio de freqncia um mtodo de grupamento de dados em
classes, ou intervalos, de tal forma que se possa determinar o nmero ou a
percentagem de observaes em cada classe. O nmero ou percentagem numa
classe chama-se freqncia de classe. Uma distribuio de freqncia pode ser
apresentada sob forma grfica ou tabular.
Tipos de freqncias
Freqncia simples ou absoluta (f):
So os valores que realmente
representam o nmero de dados de cada classe.
Freqncia relativa (fr): So os valores das razes entre as freqncias
simples e a freqncia total. Normalmente calcula-se a freqncia relativa para
efeito de comparao com outros grupos ou conjunto de dados. Convm notar
que, quando estivermos comparando dois grupos com relao s freqncias
de ocorrncia dos valores de uma dada varivel, grupos com um nmero total
de dados maior tendem a ter maiores freqncias de ocorrncia dos valores da
varivel. Dessa forma, o uso de freqncia relativa vem resolver este
problema.
Freqncia acumulada (F): o total das freqncias de todos os valores
inferiores ao limite superior do intervalo de uma dada classe. Normalmente
utilizamos esse tipo de freqncia quando tratamos de variveis qualitativas
ordinais ou quantitativas em geral.
Freqncia acumulada relativa (Fr): o total das freqncias relativas de
todos os valores inferiores ao limite superior do intervalo de uma dada classe.
Como no caso anterior utilizamos esse tipo de freqncia quando tratamos de
variveis qualitativas ordinais ou quantitativas em geral.
17
Titulo
Cabealho
Coluna
Indicadora
Valor em dlares
(em bilhes)
541
Corpo da
tabela
18
19
,29
6
,4
93 5
6
5 Intervalos de variao das classes:
1 classe: Limite inferior: 3
Limite superior: 3 + AC = 3 + 5 = 8
2 classe: Limite inferior = Limite superior da classe anterior: 8
Limite superior: 8 + 5 = 13
3 classe: Vai de 13 a 18
4 classe: Vai de 18 a 23
5 classe: Vai de 23 a 28
6 classe: Vai de 28 a 33
4 Amplitude da classe (AC) =
6 Construo da tabela
Safra Anual (em alqueire/rvore) para 40
Pessegueiros
Nmero de
Nmero de rvores
alqueires
3 8
8
8 13
10
13 18
9
18 23
7
23 28
4
28 33
2
40
Total
O histograma correspondente :
Safra Anual (em alqueire/rvore) para 40
Pessegueiros
15
s
e
rvo 10
r 5
e
d
N
0
8
6
4
5,5
2
0
5,5
10,5
15,5
20,5
Safra (em alqueires)
25,5
20
30,5
N de acidentes dirios
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
5
7
n de acidentes
21
b) Grfico de setores
700
600
500
400
300
200
Limo
20%
100
0
Cola
Limo
Laranja Uva
Tipo
Cereja
Cola
60%
Outros
22
b) Grfico de setores
Boa
Fraca
5% Razovel
10%
Boa
25%
Mdia
Razovel
Mdia
50%
Fraca
0
10 15
20 25 30 35
Percentagem
40 45 50 55
Diagrama de Pareto
usado na gesto de qualidade para estabelecer a ordem em que as causas
das perdas ou de outros tipos de fracasso devem ser sanadas.
O Diagrama de Pareto apresenta fracassos e insucessos em ordem de
freqncia. Tem-se, ento, a ordem em que devem ser sanados os erros, resolvidos
os problemas, atendidas as reclamaes, diminuindo o desperdcio. Diz-se, por isso,
que o Diagrama de Pareto estabelece prioridades. Mas o Diagrama de Pareto tambm
23
pode ser usado para identificar causas de sucesso como, por exemplo, as causas do
aumento de venda de um produto.
Exemplo: Consideremos a distribuio de freqncia das reclamaes feitas no
Procon por rea em 1999.
Reclamao do Procon por rea
rea fr Fr
Servios 40 40
Assuntos financeiros
23
63
Produtos 21 84
Habitao 8 92
Sade 7 99
Alimentos 1 100
Fonte: Procon, 1999.
100
99
90
92
84
80
70
63
60
50
40
40
30
40
23
20
21
10
0
Habitao
Sade
1
Servios
Assuntos financeiros
Produtos
Alimentos
rea
Note que a linha que est desenhada acima das colunas obtida com base na
doma dos valores das colunas.
O Diagrama de Pareto para essas reclamaes no Procon deve ser
interpretado da seguinte forma: Como a maior parte de reclamaes se concentram
nas areo de servios e assuntos financeiros, o Procon dever centralizar suas
investigaes nessas reas.
24
IV Sries Estatsticas
Denominamos Srie Estatstica toda tabela que apresenta a distribuio de
um conjunto de dados estatsticos em funo da poca, do tempo ou da espcie.
Da podemos inferir que numa srie estatstica observamos a existncia de trs
elementos ou fatores:
Tempo
Espao
Espcie
Basicamente existem trs tipos de sries estatsticas: Temporais ou
Cronolgicas, Geogrficas e Categricas.
1- Sries Temporais
So constitudas por dados produzidos e monitorados ao longo do tempo.
Tambm so chamadas de sries histricas ou cronolgicas.
Exemplos: So sries temporais:
Preo do Acm no varejo em
So Paulo segundo o ano
Anos Preo mdio
(US$)
1989 2,24
1990 2,73
1991 2,12
1992 1,89
1993 2,04
1994 2,62
Fonte: APA
2- Sries Geogrficas
So constitudas por dados provenientes de diferentes regies geogrficas.
Tambm so chamadas de sries espaciais, territoriais ou de localizao.
Exemplos: So sries geogrficas:
Durao mdia dos estudos
superiores 1994
Pases Nmero de
anos
Itlia 7,5
Alemanha 7,0
Frana 7,0
Holanda 5,9
Inglaterra
Menos de 4
Fonte: Revista Veja
Nmero de desempregados, em
milhes, nos dez pases com mais
desemprego em 1998.
N de
Pases
desempregados
(em Milhes)
ndia 38.960,1
Indonsia 10.625,7
Rssia 8.028,8
Brasil 6.649,9
EUA 6.173,4
China 6.125,1
Alemanha 4.075,7
Espanha 3.347,1
Japo 2.930,3
Itlia 2.896,2
Fonte: Pochmann (1999)
25
3 Sries Categricas
So constitudas por dados obtidos nas diferentes categorias de uma mesma
varivel. Tambm so chamadas de sries especficas.
Exemplos: So sries categricas:
Rebanhos brasileiros em 1992
Espcies Quantidade
(1000 cabeas)
Bovinos 154.440,8
Bufalinos 1.423,3
Eqinos 549,5
Asininos 47,1
Muares 208,5
Sunos 34.532,2
Ovinos 19.955,6
Caprinos 12.159,6
Coelhos 6,1
Fonte: IBGE
4 Sries Conjugadas
Muitas vezes temos necessidade de apresentar, em uma nica tabela, a
variao de valores de mais de uma varivel, isto , fazer uma conjugao de duas ou
mais sries.
Conjugando duas sries em uma nica tabela. Obtemos uma tabela de dupla
entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificao: uma
horizontal e uma vertical.
Exemplo: A srie conjugada abaixo uma srie geogrfico-temporal.
Terminais telefnicos em servio de 1991 a 1993
Regies 1991 1992 1993
Norte 342.938
375.658
403.494
Nordeste 1.287.813
1.379.101 1.486.649
Sudeste 6.234.501
6.729.467 7.231.634
Sul 1.497.315
1.608.989 1.746.232
Centro-oeste 713.357
778.925
884.822
Fonte: Ministrio das comunicaes
26
N de
filhos
Nmero
do quest.
N de
filhos
Nmero
do quest.
N de
filhos
0
40
27
Exemplo: Uma varivel qualitativa com trs valores (A, B, C) foi observada em cada
um dos vinte elementos de uma amostra. Obteve-se:
B AAC AB B B AA
C AB B AC B B B A
Podemos codificar os valores dessa varivel como: A = 0, B = 1 e C = 2.
Devemos prosseguir como na construo de tabelas para variveis
quantitativas discretas digitando o seguinte banco de dados no Excel:
1002011100
2011021110
A tabela fornecida pelo Excel ser:
0
1
2
8
9
3
0
Que para ser interpretada deve ser decodificada. O resultado deve ser
interpretado desta forma:
Varivel f
A8
B9
C3
outros 0
Total
20
Nmero
do quest.
Tempo
28
6
4
7
5
22
40
29
Ainda nesta janela escolha, no alto, legenda e desmarque a opo mostrar legenda
Avanar.
4) Escolher a opo Como nova planilha e concluir.
5) (opcional) Clique 2 vezes na parte colorida do grfico.
No alto, escolha o opo padres escolha variar cor por ponto.
O grfico ser apresentado da seguinte forma:
Nmero de filhos de 40 entrevistados
18
17
16
15
14
13
12
11
ia 10
nc
q 9
e
fr
8
7
6
5
4
3
2
1
0
0
Nmero de filhos
Obs: Quando o varivel quantitativa preciso digitar os valores da varivel com uma
aspa simples antes de cada valor (5 ENTER, por exemplo) para diferenciar para o
Excel quem a varivel e quem a freqncia.
5- Construo de Histogramas.
A Construo de um Histograma no Excel requer alguns detalhes. Acompanhe
a partir do exemplo.
Exemplo: Para a varivel Tempo de realizao de um dado exerccio , construmos
a seguinte tabela de freqncia:
Tempos f
o 1,45
1,45 2,90
2,90 4,35
4,35 5,80
Total
6
4
7
5
22
30
A
Pontos
mdios
0,725
2,125 4
3,625 7
5,175
3) Marcar as clulas A1 a B5
4) na barra de ferramentas: INSERIR GRFICO.
Tipo de grfico: Colunas Avanar Avanar
2
6
Colocar o ttulo do grfico:
3
Distribuio dos tempos de 22 pessoas para a
4
realizao de um exerccio.
5
5
Colocar nome no eixo X: Tempo
Colocar nome no eixo Y: f
Ainda nesta janela escolha, no alto, legenda e desmarque a opo mostrar legenda
Avanar.
5) Escolher a opo Como nova planilha e concluir.
6) (opcional) Clique 2 vezes na parte colorida do grfico.
No alto, escolha o opo padres escolha variar cor por ponto.
1
B
f
0
0,725
2,125
3,625
5,175
Tempos
Para que este grfico seja um histograma preciso fazer as seguintes alteraes:
1) Clique 2 vezes em alguma das barras. A janela Formatar seqncia de dados
ir aparecer.
2) Escolha, no alto, Opes.
Na opo: sobreposio, passe o nmero para 100
Na opo: largura do espaamento, passe para 0 OK
3) (Opcional) Clique 2 vezes na parte cinza do grfico.
Na parte rea escolha a opo nenhuma OK.
O grfico agora estar como o da esquerda:
31
s
oa
s
s 4
pe
de
N
3
0
0,725
2,175
3,625
5,075
Tempo
Observao: Para alterar o tipo e o tamanho das letras dos eixos, clique duas vezes
sobre o eixo vai aparecer uma janela Formatar eixos escolha fonte, altere o
tipo e OK.
6 - Construo de Polgonos de Freqncias.
Para se construir um polgono de freqncias, preciso entrar com os dados da
seguinte forma:
A
Pontos
mdios
0,725
2,125 4
3,625 7
5,175
1
2
3
4
5
B
f
6
5
Ainda nesta janela escolha, no alto, legenda e desmarque a opo mostrar legenda
Avanar
4) Escolher a opo Como nova planilha e concluir.
O grfico agora estar como o da esquerda:
Distribuio dos tempos de 22 pessoas para arealizao de um exerccio.
8
0
0,725
2,125
3,625
5,175
Tempos
32
33
14 14
d3
13 14
d4
15 14
d5
16 14
d6
18 14
d7
12 14
,2
6
xi c
x c.
ento
Exemplo: Somando-se 2 litros de leite a cada produo diria da Mimosa temos que:
y1
,12
y2
,16
y3
,15
y4
,17
y5
,18
y 6 20 e y 7 14
Da:
12 16 15 17 18 20 14 112
16
y
7
7
Lembrando que a mdia anterior era x 14 , temos que:
y 16 14 2 x 2 .
34
xi c
x c .
ento
3
3
4
10
Logo:
3 ,8
0 3 ,9
0 4,9
6
10
Isto , A mdia semestral desse aluno em Estatstica 8,94.
mdia ponderada
,89
4
10
,8
94
Peso
1
2
3
Logo:
1 ,8
5 2,9
6
3
Portanto sua mdia semestral em Estatstica 9,23.
mdia ponderada
,27
7
3
,9
23
35
30
102
30
,3
40
36
Xf
1 75
2 47
3 21
47
Total
150
75
94
63
28
260
,1
73
150
Pode ser de interesse estudar o gasto dos alunos associado com as despesas do
vestibular. Para simplificar um pouco a situao, vamos supor que se atribui, para
cada aluno, uma despesa fixa de R$ 1300,00, relativo preparao e mais R$ 50,00
para cada vestibular prestado. De posse dessas informaes, vamos calcular a mdia
da varivel D: Despesa com vestibular. Pela definio desta nova quantidade temos:
D 50 X 1300
Logo do clculo que fizemos imediato que:
D 50 ,1
73 1300
,1386
50 .
X
37
3 A Mediana.
Uma segunda medida de tendncia central de um conjunto de nmeros a
mediana. Mediana o valor que ocupa a posio central do conjunto dos dados
ordenados.
Da definio de mediana, segue-se que sua caracterstica principal dividir um
conjunto ordenado de dados em dois grupos iguais; a metade ter valores inferiores
mediana, a outra metade ter valores superiores mediana. A mediana de uma
amostra ser indicada por md.
Para calcular a mediana, necessrio primeiro ordenar os valores
(comumente) do mais baixo ao mais alto. Em seguida, conta-se at a metade dos
valores para achar a mediana.
n 1
Em geral, a mediana ocupa a posio
, onde n representa a quantidade
2
de valores do conjunto.
O processo para determinara a mediana o seguinte:
1 Ordenar os valores
2 Se o nmero de dados mpar, a mediana o valor que est no centro da srie.
3 Se o nmero de dados par, a mediana a mdia dos dois valores que esto no
centro da srie.
Exemplo 1: Calcule a mediana dos dados: 3,9,5,7,9,1,9.
Para obter a mediana, ordene os dados:
1,3,5,7,9,9,9.
A posio da mediana dada por:
7 1 8
4
2
2
Assim a mediana o elemento que ocupa a 4 posio na srie dos dados
ordenados. Isto , a mediana 7.
Note que antes do 7, existem trs nmeros menores: 1,3,5 e, depois do 7, trs
nmeros maiores: 9,9,9.
Exemplo 2: Calcule a mediana dos dados: 42,3,9,5,7,9,1,9.
Para obter a mediana, ordene os dados:
1,3,5,7,9,9,9,42.
A posio da mediana dada por:
8 1 9
,4
5
2
2
Como o nmero de dados par, a mediana a mdia aritmtica dos valores que
ocupam a 4 e a 5 posio na srie dos dados ordenados.
Assim, a mediana dada por:
7 9 16
8.
2
2
Logo temos quatro valores maiores do que 8 (1,3,5,7), e quatro valores menores do
que 8 (9,9,9,42).
Clculo da Mediana para Dados Agrupados
Se os dados se agrupam em uma distribuio de freqncia, o clculo da
mediana se processa de modo muito semelhante quele dos dados no agrupados,
implicando, porm, a determinao prvia das freqncias acumuladas. Ainda aqui,
temos que determinar um valor tal que divida a distribuio em dois grupos que
contenham o mesmo nmero de elementos. Tambm o processo e os resultados
diferem, dependendo de dispormos ou no dos dados originais.
Se dispusermos dos dados originais, o processo ser o seguinte:
1 Determine as freqncias acumuladas.
38
fF
33
33 1 34
17
2
2
A menor freqncia acumulada que supera esse valor 18, que corresponde ao valor
2 da varivel, sendo esse o valor mediano. Logo:
Md = 2 meninos.
Exemplo 2: Considere a distribuio relativa a 8 pessoas, tomando para varivel o
nmero de vezes que vo ao cinema por ms:
posio
N de idas ao
Cinema
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total
fF
8 1 9
,4
5
2
2
Devemos determinar os valores da varivel que esto na posio 4 e 5.
Para a posio 5 temos que a menor freqncia acumulada que supera esse valor 6,
que corresponde ao valor 16 da varivel, e para a posio 4 temos que o valor da
varivel correspondente 15. Logo:
15 16 31
Md
,15
5
2
2
posio
39
5 Identificar a mediana.
Exemplo 1: Considere a distribuio relativa a 40 pessoas, tomando para varivel
estatura de cada uma.
Estaturas f F
150154 4 4
154158 9 13
158162 11 24
162166 8 32
166170 5 37
170172 3 40
40
Total
Vamos calcular a mediana desses dados:
A posio da mediana dada por:
40 1 41
posio
,20
5
2
2
Devemos determinar os valores da varivel que esto na posio 20 e 21.
Esses dois valores esto na 3 classe que correspondem s estaturas de 158cm a
162cm.
Existem 11 valores nessa classe (24 13 = 11) e a mediana a mdia aritmtica dos
valores que esto nas posies 7 (20 13) e 8 (21 13) dessa classe.
A amplitude dessa classe :
162 158 4
Supondo que os valores se distribuem uniformemente pela classe devemos dividir a
amplitude da classe por 11 para determinar o suposto valor de cada elemento.
Graficamente temos:
158
14 posio
Mediana
20 posio
162
21 posio
Ou ainda:
Elemento 158 158,37 158,73 159,10 159,46 159,82 160,19 160,55 160,91 161,27 161,64
Posio
0 1 2 3 4 5 6 7 8 9 10
na classe
40
5 7 10 13 65
5
100
5
20
Graficamente temos:
5
10
13
Mediana
20
65
Mdia
Neste conjunto h um dado discrepante que o 65. Esse valor puxa a mdia para
cima, mas no afeta a mediana.
Por outro lado, para o conjunto 5,7,10,13,15, a mediana ainda o nmero 10, e sua
mdia dada por:
5 7 10 13 15 50
X
10
5
5
Neste conjunto no h discrepncia de valores.
Um exemplo clssico em que a mediana pode descrever melhor a tendncia
central dos dados do que a mdia dado pelos salrios de uma categoria profissional.
o caso dos salrios dos jogadores de futebol no Brasil. A existncia de alguns
salrios muito altos afeta mais a mdia do que a mediana. Ento, a mediana d,
melhor do que a mdia, idia do salrio tpico dessa categoria de profissionais.
De modo geral, a mdia possui certas propriedades matemticas que a tornam
atraente. Alm disso, a ordenao dos dados para determinar a mediana pode ser
enfadonha, e o clculo da mediana no pode ser feito com mquina de calcular, ao
contrrio do que ocorre com a mdia.
4 A Moda.
A moda o valor que ocorre com maior freqncia num conjunto. A moda de
uma amostra ser indicada por mo.
Exemplo: Determine a moda dos dados: 0,0,2,5,3,7,4,7,8,7,9,6.
A moda 7, porque o valor que ocorre o maior nmero de vezes.
Um conjunto de dados pode no ter moda porque nenhum valor se repete o
maior nmero de vezes o caso do conjunto:
3,5,8,10,12,13
Dizemos que esse conjunto amodal.
Em outros casos, ao contrrio, pode haver dois ou mais valores de
concentrao. Dizemos, ento, que o conjunto tem dois ou mais valores modais. No
conjunto:
2,3,4,4,4,5,6,7,7,7,8,9.
Temos duas modas: 4 e 7. Esse conjunto se diz bimodal.
A moda funciona como medida descritiva quando se trata de contar dados.
Essa medida no se presta a manipulaes matemticas. De um ponto de vista
puramente descritivo, a moda indica o valor tpico em termos de maior ocorrncia.
Alm disso, se as freqncias so razoavelmente uniformes, a moda perde muito de
sua importncia como medida descritiva. Por outro lado, a utilidade da moda se
acentua quando um ou dois valores, ou um grupo de valores, ocorre com muito mais
freqncia que os outros. Na maior parte das vezes, a mdia aritmtica e a mediana
fornecem melhor descrio da tendncia central dos dados.
41
42
Mdia
Soma de todos
os valores
dividido pelo total
de elementos do
conjunto.
Moda
Valor mais
freqente
1 Reflete cada
valor
2 Possui
propriedades
matemticas
atraentes
1 Menos
sensvel a
valores
extremos do
que a mdia.
1 Valor
tpico. Maior
quantidade de
valores
concentrados
neste ponto.
1 Deseja-se
obter a medida
de posio que
1 influenciada possui a maior
por valores
estabilidade.
extremos.
2 Houver
necessidade de
um tratamento
algbrico
posterior.
1 Deseja-se
obter o ponto
que divide o
conjunto em
1 Difcil de
partes iguais.
determinar para
2 H valores
grande quantidade extremos que
de dados.
afetam de uma
maneira
acentuada a
mdia.
3 A varivel
em estudo
salrio.
1 Deseja-se
obter uma
1 No se presta medida rpida e
anlise
aproximada de
matemtica.
posio.
2 Pode no
2 A medida de
haver moda para
posio deve
certos conjuntos
ser o valor mais
de dados.
tpico da
distribuio.
43
44
Referncias Bibliogrficas
STEVENSON, William J., Estatstica aplicada administrao, Ed. Harbra, So
Paulo, 1981.
CRESPO, Antnio Arnot, Estatstica Fcil, Ed. Saraiva, So Paulo, 1998.
MAGALHES, Marcos Nascimento; LIMA, Antnio Carlos Pedroso de, Noes de
Probabilidade e Estatstica, 5 ed., Editora da Universidade de So Paulo, So
Paulo, 2002.
VIEIRA, Snia, Princpios de Estatstica, Ed. Pioneira Thomson Learning, So
Paulo, 2003.
45
46
47
Turma
Sexo
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
F
F
F
F
M
F
F
F
M
F
F
F
F
F
F
F
F
F
F
F
F
F
M
F
F
M
F
M
M
F
M
F
F
M
F
F
F
F
F
M
M
Idade
17
18
18
25
19
19
20
18
18
17
18
18
21
19
18
19
17
18
20
18
21
18
18
20
20
19
23
18
18
25
18
17
17
17
18
18
17
21
18
18
17
23
24
18
18
19
19
18
17
18
Altura
1,60
1,69
1,85
1,85
1,58
1,76
1,60
1,64
1,62
1,64
1,72
1,66
1,70
1,78
1,65
1,63
1,82
1,80
1,60
1,68
1,70
1,65
1,57
1,55
1,69
1,54
1,60
1,62
1,57
1,65
1,61
1,71
1,65
1,67
1,73
1,60
1,70
1,85
1,70
1,73
1,70
1,45
1,76
1,68
1,55
1,70
1,55
1,60
1,80
1,83
Peso
50,5
55,0
72,8
80,9
55,0
60,0
58,0
47,0
57,8
58,0
70,0
54,0
58,0
68,5
63,5
47,4
60,0
85,2
54,5
52,5
60,0
58,5
49,2
48,0
51,6
57,0
63,0
52,0
49,0
59,0
52,0
73,0
56,0
58,0
97,0
47,0
95,0
84,0
60,0
73,0
55,0
44,0
75,0
55,0
49,0
50,0
54,5
50,0
71,0
86,0
Filhos
2
1
2
2
1
3
1
1
3
2
1
3
2
1
1
3
1
2
1
3
2
1
1
1
2
2
2
1
2
4
1
1
3
1
1
1
1
1
1
1
1
2
2
1
1
7
2
1
1
1
Fuma
NO
NO
NO
NO
NO
NO
NO
SIM
NO
NO
SIM
NO
NO
SIM
NO
NO
NO
NO
NO
NO
NO
NO
SIM
SIM
NO
NO
NO
NO
NO
NO
NO
NO
NO
NO
NO
NO
NO
SIM
NO
NO
NO
NO
NO
NO
NO
NO
NO
NO
NO
NO
Toler.
P
M
P
P
M
M
P
I
M
M
I
M
M
I
I
P
P
P
P
M
P
M
I
I
P
I
M
P
P
M
P
P
M
M
M
P
P
I
P
M
I
M
I
P
M
M
M
P
P
P
Exer.
0
0
5
5
2
2
3
2
3
2
10
0
6
5
4
0
3
3
3
7
8
0
5
0
8
6
8
1
3
1
2
1
2
4
7
5
10
6
5
4
5
2
7
5
0
0
4
2
7
7
Cine
1
1
2
2
2
1
1
2
3
2
2
2
1
1
1
1
1
4
2
2
2
3
4
1
5
2
2
1
1
2
2
1
1
2
1
1
2
4
2
1
4
2
0
1
1
1
3
1
0
0
OpCine
B
B
M
B
B
B
B
M
M
M
B
B
M
M
B
B
B
B
B
B
B
B
B
M
M
B
M
M
B
M
M
B
B
B
B
M
M
B
B
B
B
B
M
B
M
B
B
B
M
M
TV
16
7
15
20
5
2
7
10
12
10
8
0
30
2
10
18
10
10
5
14
5
5
10
28
4
5
5
10
12
2
6
20
14
10
25
14
12
10
12
2
10
25
14
8
10
8
3
5
14
20
OpTV
R
R
R
R
R
R
R
R
R
R
N
R
R
N
R
R
N
R
R
M
R
R
R
R
N
R
R
R
R
R
N
R
R
R
B
R
N
R
R
R
B
R
N
R
R
R
R
R
R
B
48
Sexo F fr
Masculino
Feminino
Total
FONTE: Secretaria da Faculdade UNIVILA
Grau de interesse
MUITO
RAZOVEL
POUCO
NADA
Total
fr
Nmero de irmos
0
1
2
3
Total
e) Variveis quantitativas contnuas
Distribuio dos alunos do 3 perodo de administrao 2004/1 segundo a altura
49
fr
50
fr
4
10
14
9
3
40
9 A tabela abaixo apresenta uma distribuio de freqncia das reas de 400 lotes:
2
REAS (m )
N de lotes
300 400 500 600 700 800 900 1000 1100 1200
14
46 58 76 68 62 48
22
6
01234567
20 10 16 9 6 5 3 1
Determine:
a) O nmero de motoristas que no sofreram nenhum acidente.
b) O nmero de motoristas que sofreram pelo menos 4 acidentes.
c) O nmero de motoristas que sofreram menos de 3 acidentes.
d) O nmero de motoristas que sofreram no mnimo 3 e no mximo 5 acidentes.
e) A percentagem dos motoristas que sofreram no mximo 2 acidentes.
11 Represente graficamente cada uma das tabelas abaixo:
a)
Produo Brasileira de Petrleo Bruto 1991 1993
3
Anos
Quantidade (1.000 m )
1991 36.180,4
1992 36.410,5
1993 37.164,3
Fonte: Petrobrs
b)
Entrega de Gasolina para Consumo 1988 1991
2
Anos
Volume (1.000 m )
1988 9.267,7
1989 9.723,1
1990 10.121,3
1991 12.345,4
Fonte: IBGE
51
c)
d)
e)
f)
Produo de Ferro Gusa
Brasil - 1993
Unidade de
Produo (1.000t)
Federao
Minas gerais
12.888
Esprito Santo
3.174
Rio de Janeiro
5.008
So Paulo
2.912
Fonte: Instituto Brasileiro de Siderurgia
g)
h)
Sugesto: Para as letras a), b), c) e d) use grfico de barras. Para as letras e) e f)
use grfico de setores e para as demais letras use um histograma.
12 Uma varivel qualitativa com trs valores (A, B, C) foi observada em cada um dos
vinte elementos de uma amostra. Obteve-se:
B AAC AB B B AA
CAB BAC B B BA
52
14
28
27
11
4
84
a) Construa um histograma
b) Se a nota mnima para passar 5, qual ser a porcentagem de aprovao?
15 Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo
indagou sobre os diferentes tipos usados nas suas locaes dirias. Dentre nibus,
metr e trem, o nmero de diferentes meios de transporte utilizados foi o seguinte:
2321212311
1231111211
2212123123
Salrio (R$)
Anos de Empresa
53
9 fundamental 21 450,00
10 fundamental 26 450,00
3
3
143
6,7
7,6
8,2
7,5
6,5
7,4
8,3
7,6
6,9
7,2
8,1
7,4
54
45
83
52
15
4
1
200
Especializados
Empregos f
1 210
2 342
3 109
4 91
5 35
Total
787
25 Como parte de uma avaliao mdica em uma certa universidade, foi medida a
freqncia cardaca dos alunos do primeiro ano. Os dados so apresentados em
seguida.
a) Obtenha o histograma.
b) Freqncias cardacas que estejam abaixo de 62 ou acima de 92 requerem
acompanhamento mdico. Qual a porcentagem de alunos nessas condies?
c) Uma freqncia ao redor de 72 batidas por minuto considerada padro. Voc
acha que de modo geral esses alunos se encaixam nesse caso?
Freqncia Cardaca
60 65
65 70
70 75
75 80
11
35
68
20
55
80 85
85 90
90 95
95 100
Total
12
10
1
3
160
27 Vinte baterias para automveis de uma certa marca foram testadas quanto sua
vida til. O teste simula a utilizao da bateria, acelerando seu desgaste de modo a
criar uma rplica da situao real. Os resultados da durabilidade, em meses, so
apresentados a seguir:
a) Construa o histograma
b) Se a amostra acima for considerada representativa do desempenho dessa marca
de bateria, quantas, em 1000 fabricadas, sero repostas pelo fabricante, se ele
oferece uma garantia de 6 meses?
c) Se o fabricante vende cada bateria por 20% acima do preo e custo, em 1000
baterias fabricadas, descartadas as que repe, quanto ser seu lucro por bateria em
funo do preo de custo?
Durabilidade f
0 3
3 6
6 9
9 12
12 15
15 20
Total
0,02
0,05
0,15
0,25
0,30
0,23
1,00
56
N DE ESTUDANTES
MASCULINO FEMININO
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total
876 955
57
8 Pretende-se obter uma amostra dos alunos de uma universidade para estimar a
proporo que tem trabalho remunerado. Qual a populao em estudo? Qual o
parmetro que se quer estimar? Voc acha que se obteria uma boa amostra dos
alunos no restaurante universitrio? No ponto de nibus mais prximo? Nas portas das
salas de aula? Ou voc tem outra alternativa melhor?
9 Para estimar o nmero mdio de pessoas em um domicilio, um pesquisador
obteve uma amostra sistemtica de 1000 domiclios. No entanto, mesmo fazendo
varias visitas, o entrevistador no encontrou pessoas em 147 deles. O pesquisador
obteve ento uma segunda amostra e quando o entrevistador completou a visita aos
147 domiclios que compunham a amostra de 1000, analisou os dados. Haviam sido
contadas 3087 pessoas. O pesquisador considerou ento que o numero mdio de
pessoas em domicilio 3,1. O que voc acha?
10 Um fiscal da Vigilncia Sanitria precisa verificar se as farmcias da cidade esto
cumprindo um novo regulamento. A cidade tem 33 farmcias, mas como a fiscalizao
demanda muito tempo, o fiscal resolveu optar por uma amostragem. Para escolher a
amostra, o fiscal estratificou a populao de farmcias de acordo com o volume de
vendas. Existem 3 farmcias de uma grande cadeia, 10 de cadeias menores e 20
farmcias pequenas, de proprietrios locais. O fiscal decide visitar as trs farmcias da
grande cadeia, quatro das cadeias menores e trs farmcias pequenas. O
cumprimento do regulamento, evidentemente desconhecido do fiscal, esta
apresentado na tabela a seguir. Com base nessa tabela,
a) Sorteie uma amostra estratificada para o local, de acordo com o que ele planejou;
b) Estime, com base na amostra, a proporo de farmcias que esto cumprindo o
regulamento;
c) Com base nos dados da populao, estime o parmetro;
d) Voc obteve uma boa estimativa?
Distribuio dos dados sobre cumprimento a um regulamento,
segundo o estrato.
Estrato A
Estrato B
Estrato C
1. sim
1. no
1. sim
11. sim
2. sim
2. sim
2. sim
12. sim
3. no
3. no
3. no
13. no
4. no
4. sim
14.sim
5. sim
5. no
15. sim
6. no
6. no
16. no
7. sim
7. no
17. no
8. no
8. sim
18. no
9. no
9. no
19. sim
10. sim
10. no
20. sim
58
59