Você está na página 1de 150

ESTATSTICA APLICADA

autor do original
VALRIA APARECIDA FERREIRA

1 edio
SESES
rio de janeiro 2015
Conselho editorial durval corra meirelles, ronald castro paschoal,
otvia travenolo muniz sala

Autor do original valria aparecida ferreira

Projeto editorial roberto paes

Coordenao de produo rodrigo azevedo de oliveira

Projeto grfico paulo vitor bastos

Diagramao fabrico

Reviso lingustica aderbal torres bezerra

Imagem de capa nome do autor shutterstock

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida
por quaisquer meios (eletrnico ou mecnico, incluindo fotocpia e gravao) ou arquivada em
qualquer sistema ou banco de dados sem permisso escrita da Editora. Copyright seses, 2015.

Diretoria de Ensino Fbrica de Conhecimento


Rua do Bispo, 83, bloco F, Campus Joo Ucha
Rio Comprido Rio de Janeiro rj cep 20261-063
Sumrio

Prefcio 5

1. Conceitos Introdutrios e Tcnicas


de Amostragem 7

Breve histrico 8
Definio de Estatstica 9
Amostragem 12
Exemplo Prtico Envolvendo Tcnicas de Amostragem Probabilstica 16

2. Distribuio de Frequncias e
Medidas de Posio Central 27

Distribuio de Frequncias 29
Medidas de posio 34

3. Medidas de Ordenamento e Forma,


Medidas de Disperso e Grficos 51

Medidas de ordenamento 53
Medidas de Disperso 63
Grficos 79
4. Distribuies Amostrais e Estimao 99

Conceitos Bsicos 100


Estimador de uma Mdia Populacional 102
Estimador de uma Proporo Populacional 104
Propriedades da Distribuio Normal 106
Distribuies Amostrais 107
Erro Padro de um Estimador 109
Intervalos de Confiana para a Mdia Populacional 112
Intervalos de Confiana para a Proporo Populacional 114

5. Distribuio Normal e Teste de Hiptese 121

Varivel Aleatria 122


Funo Densidade de Probabilidade 123
Modelo Probabilstico para Variveis Aleatrias Contnuas 123
Teste de Hiptese 130
Prefcio
Prezados(as) alunos (as)

Estatstica uma palavra de origem latina, que significou por muito tempo
cincia dos negcios do Estado. Ela pode ser vista como uma Matemtica Aplicada,
uma disciplina da rea das cincias exatas que tem aplicao em praticamente
todas as reas de estudo. Esse fato serve para desmistificar o temor vivido pelos
alunos com relao ao ensino da matemtica em si (aquela que ns aprendemos
at o ensino mdio). As dificuldades enfrentadas e a falta de conexo com a prti-
ca so talvez os fatores que mais contribuem para que este temor ocorra.
No entanto, o ensino da Estatstica, mesmo provocando sentimentos seme-
lhantes aos estudantes, proporciona a esses uma viso prtica do contedo que
est sendo abordado. Mais que isso, ele possibilita, a quem o est aplicando, a
obteno de importantes informaes do fato que est sendo estudado. O co-
nhecimento mnimo em Estatstica se tornou pr-requisito para ler um jornal
ou uma revista conceituada, pois muitas informaes se encontram resumidas
em tabelas ou grficos que grande parte da populao no tem condies de in-
terpretar e por isso ignoram (ou no entendem) reportagens importantes para a
formao de uma pessoa esclarecida social, econmica e politicamente.
Procuramos, aqui, apresentar a Estatstica de forma clara e prtica. No
com o intuito de formar especialistas nessa rea, mas sim de proporcionar a
voc, futuro gestor, uma compreenso dos elementos bsicos que compem
essa cincia, visando a aplicao na sua rea de atuao. No tivemos a inten-
o de esgotar o assunto, mas sim de apresentar os elementos necessrios para
que voc realize uma leitura satisfatria da realidade que o cerca e das informa-
es que tm a sua volta.
Muitos dos exemplos aqui apresentados so hipotticos. So exemplos de
situaes que ocorrem de forma semelhante na realidade, mas os dados apre-
sentados no so reais, foram criados apenas para ilustrar a aplicao do con-
tedo apresentado.

7
1
Conceitos
Introdutrios
e Tcnicas de
Amostragem
1 Conceitos Introdutrios e Tcnicas de
Amostragem

Nesse primeiro captulo, apresentaremos conceitos bsicos da Estatstica e as


principais tcnicas de amostragens probabilsticas e no probabilsticas.
Em qualquer estudo e/ou pesquisa que envolve a coleta e anlise de dados,
imprescindvel o conhecimento dos conceitos que sero abordados neste cap-
tulo, para que os resultados obtidos na anlise sejam um instrumento confivel
para tomadas de deciso.

OBJETIVOS
Identificar os diferentes tipos de variveis que podem estar presentes em uma pesquisa,
compreender a que se destina cada uma das reas da Estatstica e entender as caractersti-
cas dos vrios tipos de amostragens utilizados para coleta de dados.

REFLEXO
Voc se lembra de j ter visto nos meios de comunicao informaes de pesquisas, por
exemplo, eleitorais ou de avaliao de um governo, obtidas atravs de amostras? Neste ca-
ptulo, apresentaremos o conceito de populao e amostra e estudaremos como (e por que),
na maioria das vezes, fazemos levantamento de dados atravs de amostras.

1.1 Breve histrico

O interesse por levantamento de dados no algo que surgiu somente nos dias
atuais. H indcios de que 3000 anos a.C. j se faziam censos na Babilnia, Chi-
na e Egito. Havia interesse dos governantes das grandes civilizaes antigas
por informaes sobre suas populaes e riquezas. Usualmente estas informa-
es eram utilizadas para taxao de impostos e alistamento militar.
A palavra Estatstica surgiu, pela primeira vez, no sc. XVIII. Alguns autores
atribuem esta origem ao alemo Gottfried Achemmel (1719-1772), que teria uti-
lizado pela primeira vez o vocbulo Estatstica, em 1746.

10 captulo 1
Na sua origem, a Estatstica estava ligada ao Estado. Na atualidade, a Esta-
tstica no se limita apenas ao estudo de dados demogrficos e econmicos.
Ela empregada em praticamente todas as reas do conhecimento, sempre
que estiverem envolvidas coleta e anlise de dados.

CONEXO
Para saber um pouco sobre a evoluo histrica da Estatstica, assista o vdeo Histria da
Estatstica produzido pela Fundao Universidade de Tocantins, disponvel em:<http://www.
youtube.com/watch?v=jCzMPL7Ub2k&feature=related>.

1.2 Definio de Estatstica

A Estatstica uma cincia que trata de mtodos cientficos para a coleta, or-
ganizao, descrio, anlise e interpretao (concluso) de um conjunto de
dados, visando a tomada de decises.
Podemos dividir a aplicao da Estatstica basicamente em trs etapas, que
so descritas resumidamente a seguir:
1. Refere-se coleta de dados, na qual devemos utilizar tcnicas estatsti-
cas que garantiro uma amostra representativa da populao.
2. Depois dos dados coletados, devemos resumi-los em tabelas de frequ-
ncias e/ou grficos e, posteriormente, encontrar as medidas de po-
sio e variabilidade (quantidades). Esta etapa tambm conhecida
como Estatstica Descritiva ou Dedutiva.
3. Esta etapa envolve a escolha de um possvel modelo que explique o
comportamento dos dados para posteriormente se fazer a inferncia
dos dados para a populao de interesse. Esta etapa tambm chama-
da de Estatstica Inferencial ou Indutiva. Nesta etapa, se faz necessrio
um conhecimento mais aprofundado, principalmente no que se refere
aos tpicos de probabilidades. A probabilidade fornece mtodos para
quantificar a incerteza existente em determinada situao, usando ora
um nmero ora uma funo matemtica.

captulo 1 11
Podemos citar inmeros exemplos da Estatstica em vrias reas do conhe-
cimento, mas s para convenc-lo da importncia das tcnicas estatsticas, va-
mos enumerar alguns deles:
1. Se estamos interessados em abrir um supermercado em um determinado
local precisamos saber se fatores como sexo, grau de escolaridade, idade,
estado civil, renda familiar, entre outros, interferem na abertura deste su-
permercado e os tipos de produtos que devem ser priorizados nesse esta-
belecimento, alm de definir as estratgias de marketing mais eficientes.
2. Uma empresa, quando est interessada em lanar um novo produto no
mercado, precisa saber as preferncias dos consumidores. Para isso,
necessrio realizar uma pesquisa de mercado.
3. O gestor precisa saber escolher uma amostra representativa de uma po-
pulao de interesse para no perder muito tempo e, consequentemen-
te, dinheiro da empresa em que trabalha.
4. Para se lanar um novo medicamento no mercado farmacutico, ne-
cessrio a realizao de vrias experincias. O medicamento deve ser
testado estatisticamente quanto sua eficincia no tratamento a que
se destina e quanto aos efeitos colaterais que pode causar, antes de ser
lanado no mercado.
5. Para uma empresa, muito importante fazer previses de demanda de
seus produtos. Para isto existem vrias tcnicas estatsticas como re-
gresso linear, regresso logstica, anlise de sries temporais, etc.
6. Controles estatsticos de qualidade (ou controles estatsticos do proces-
so) so indispensveis em todos os tipos de empresas. Eles so realizados
atravs de um conjunto de tcnicas estatsticas, geralmente aplicadas
por engenheiros de produo e administradores, para garantir o nvel de
qualidade exigido para a produo (ou servio) dentro de uma indstria.

So inmeras e diversificadas as aplicaes de tcnicas estatsticas que um


gestor pode utilizar. No conseguiremos falar sobre todas elas, mas apresenta-
remos os principais conceitos e tcnicas que quando utilizados podem auxiliar
na tomada de decises.
Comearemos por apresentar alguns conceitos elementares bastante utili-
zados no processo estatstico.

12 captulo 1
Unidade experimental ou de observao um objeto (isto , pessoa, objeto,
transao ou evento) a partir do qual coletamos os dados. Vamos analisar os
exemplos a seguir para entender o conceito dos possveis tipos de objeto:
Os eleitores da cidade de So Paulo so pessoas;
Os carros produzidos em determinado ano por uma montadora so objetos;
As vendas realizadas durante um ms numa loja de departamento so
transaes;
Os acidentes ocorridos em determinada extenso de uma rodovia duran-
te um feriado so eventos.

Populao o conjunto total de unidades experimentais que tm determina-


da caracterstica que se deseja estudar. Uma populao pode ser finita ou infinita.
Populaes finitas permitem que seus elementos sejam contados. Por
exemplo: todas as lojas existentes em determinado shopping, todos os alunos
matriculados em determinada universidade, todos os veculos licenciados pelo
departamento de trnsito em um ano. Indicamos o tamanho de uma popula-
o finita por N.
Na prtica, uma populao que est sendo estudada usualmente considera-
da infinita se ela envolve um processo contnuo que torna impossvel a listagem
ou contagem de cada elemento na populao. Por exemplo: quantidades de por-
es que se pode extrair da gua do mar para anlise.
Vale ressaltar que, em alguns estudos, a populao de interesse to grande
que s pode ser estudada por meio de amostras. Por exemplo: quantos peixes
existem no mar? Esse nmero matematicamente finito, mas to grande que
pode ser considerado infinito para qualquer finalidade prtica.
Amostra uma parte da populao de interesse que se tem acesso para de-
senvolver o estudo estatstico. Se a amostra no for fornecida no estudo, deve-
mos retir-la da populao atravs de tcnicas de amostragem adequadas, para
que os resultados fornecidos sejam confiveis.
Estatstica Descritiva a parte da estatstica que trata da organizao e do
resumo do conjunto de dados por meio de grficos, tabelas e medidas descri-
tivas (quantidades).
Estatstica Indutiva a parte que se destina a encontrar mtodos para tirar
concluses (ou tomar decises) sobre a populao de interesse, geralmente, ba-
seado em informaes retiradas de uma amostra desta populao.

captulo 1 13
Varivel uma caracterstica da unidade experimental. Vamos estudar dois
tipos de variveis: quantitativas e qualitativas.
Variveis quantitativas so aquelas cujas respostas da varivel so expressas
por nmeros (quantidades). Podemos distinguir dois tipos de variveis quanti-
tativas: quantitativa contnua e discreta.
Variveis quantitativas contnuas so aquelas que podem assumir, teorica-
mente, infinitos valores entre dois limites (num intervalo), ou seja, podem as-
sumir valores no inteiros. Por exemplo: altura (em metros) de alunos de uma
determinada faixa etria, peso (em kg), salrio, etc.
Variveis quantitativas discretas so aquelas que s podem assumir valores
inteiros. Por exemplo: nmero de filhos por casal, nmero de livros em uma
biblioteca, nmero de carros vendidos, etc.
Variveis qualitativas so as variveis cujas respostas so expressas por um atri-
buto. Podemos distinguir dois tipos de variveis qualitativas: nominal e ordinal.
Variveis qualitativas nominais definem-se como aquelas em que as respos-
tas so expressas por um atributo (nome) e esse atributo no pode ser ordenado.
Por exemplo: tipo sanguneo, religio, estado civil, etc.
Variveis qualitativas ordinais tm suas respostas expressas por um atribu-
to (nome) e esse atributo pode ser ordenado. Por exemplo: grau de instruo,
classe social, etc.

1.3 Amostragem

Em qualquer estudo que envolva coleta de dados, sabemos que dificilmente po-
demos estudar a populao de interesse como um todo. Para isso, utilizamos
tcnicas de amostragem para selecionar amostras que sejam representativas
da populao de interesse. No prximo item estudaremos algumas tcnicas de
amostragem muito utilizadas em estudos e/ou pesquisas.

1.3.1 Tcnicas de Amostragem

Quando selecionamos uma amostra devemos garantir que esta amostra seja
representativa da populao, ou seja, no processo de amostragem, a amostra
selecionada dever possuir as mesmas caractersticas bsicas da populao.
Temos dois tipos de amostragem, a que chamamos de probabilstica (ou ale-
atria) e a no probabilstica (ou no aleatria).

14 captulo 1
A amostragem ser probabilstica se todos os elementos da populao tive-
rem probabilidade conhecida, e diferente de zero, de pertencer amostra. Caso
contrrio, a amostragem ser no probabilstica.
Indenpendente do tipo de amostragem, podemos trabalhar com amostra-
gem com reposio ou sem reposio. Na amostragem com reposio permitido
que uma unidade experimental seja sorteada mais de uma vez, e na amostragem
sem reposio, a unidade experimental sorteada removida da populao. Quan-
do pensamos na quantidade de informao contida na amostra, amostrar sem
reposio mais adequado. Mas, amostragem com reposio implica que tenha-
mos independncia entre as unidades experimentais selecionadas, o que facilita
o desenvolvimento de propriedades de estimadores que sero abordados mais
adiante. Na prtica, comum considerarmos a selao das unidades experimen-
tais como independentes quando pequenas amostras so retiradas de grandes
populaes. De acordo com (TRIOLA, 2008), uma diretriz comum a ser seguida :
Se o tamanho da amostra no maior que 5% do tamanho da populao,
tratamos a seleo das unidades experimentais como sendo independentes
(mesmo que as selees sejam feitas sem reposio, pois tecnicamente elas
so dependentes).
Agora, vamos estudar alguns tipos de tcnicas de amostragens probabilsti-
cas e no probabilsticas.

1.3.1.1 Definies das Tcnicas de Amostragem Probabilstica (ou Aleatria)


Sempre que possvel, devemos escolher trabalhar com amostragem probabilsti-
ca. Este tipo de amostragem nos garante, com alto grau de confiana, a represen-
tatividade da amostra com relao populao que se tem interesse em estudar.
Usaremos N para denotar o tamanho da populao e n indicando o tama-
nho da amostra.

1.3.1.1.1 Amostragem Aleatria Simples


utilizada quando todos os elementos da populao tm a mesma chance (ou
probabilidade igual) de pertencer amostra.
Para trabalhar com a amostragem casual simples devemos conseguir listar
a populao de 1 a N. Os elementos da populao que iro pertencer a amostra
sero sorteados de forma aleatria. Sortearemos n nmeros dessa sequncia,
os quais correspondero aos elementos sorteados para a amostra.

captulo 1 15
Exemplo 1.1: Se desejamos, por exemplo, selecionar 50 elementos de uma
populao de 500 elementos, ento numeramos a populao de 1 a 500 e sor-
teamos, dessa forma, cada um dos 50 que iro compor a amostra.

1.3.1.1.2 Amostragem Sistemtica


Utilizamos amostragem sistemtica quando os elementos da populao se
apresentam ordenados (ou em filas) e a retirada dos elementos da amostra
feita periodicamente.

ATENO
Cuidado com ciclos de variao. s vezes, podem ocorrer ciclos de variao e os elementos
sorteados para a amostra tero sempre a mesma caracterstica. Se isto for detectado, o salto
poder ser diversificado, podendo ento selecionar, por exemplo, o 3, o 5 e o 9 elementos,
depois novamente conto 3, 5 e 9 e assim por diante at obter a amostra desejada.

Exemplo 1.2: Usando o exemplo anterior, onde a populao composta de


500 elementos ordenados, poderamos utilizar a amostragem sistemtica pri-
meiramente determinando qual o salto que dever ser dado. Para isto, faze-
mos a diviso do tamanho da populao pelo tamanho da amostra desejada:

N 500
= = 10
n 50

Em seguida, podemos iniciar a amostragem com qualquer indivduo esco-


lhido (de forma aleatria) entre os 10 primeiros. A partir desse elemento, sele-
cionamos os demais sempre saltando de 10 em 10.

1.3.1.1.3 Amostragem por Conglomerados (Clusters)


Em algumas vezes a populao se apresenta numa subdiviso em pequenos
grupos, chamados conglomerados. Neste caso possvel, e at conveniente, fa-
zermos uma amostragem por meio desses conglomerados. Este tipo de amos-
tragem consiste em sortear um nmero suficiente de conglomerados, cujos
elementos constituiro a amostra. Quando um conglomerado sorteado, todos
os elementos dentro dele so selecionados para a amostra. Este tipo de amos-
tragem muitas vezes utilizado por motivos de ordem prtica e econmica.

16 captulo 1
Exemplo 1.3: Suponhamos que desejamos estudar alguma caracterstica
dos indivduos que moram num determinado bairro de sua cidade. A popula-
o de interesse constituda, portanto, por todos os indivduos que moram
nesse bairro e cada residncia constitui um conglomerado. Podemos sortear
alguns conglomerados (residncias) e cada morador da unidade sorteada far
parte da nossa amostra.

1.3.1.1.4 Amostragem Estratificada


Esta tcnica muito utilizada quando a populao heterognea ou quando se
consegue dividi-la em subpopulaes ou estratos. A amostragem estratificada
consiste em especificar quantos elementos da amostra sero retirados em cada
estrato. O nmero de elementos sorteados em cada estrato deve ser proporcio-
nal ao nmero de elementos existente no estrato.

Exemplo 1.4: Vamos supor que uma pesquisa tem como objetivo estudar
uma determinada caracterstica do povo brasileiro, como por exemplo, a renda
familiar. Nesse caso, a populao de interesse constituda por todo cidado
que mora no Brasil. Podemos considerar cada estrato como sendo cada um dos
estados brasileiros. Em cada um deles ser selecionado um nmero x de ele-
mentos, proporcional populao de cada estado.

1.3.1.2 Tcnicas de Amostragem No Probabilstica (ou No Aleatria)

Somente recomendamos o uso de mtodos de amostragem no probabilstica nos


casos em que impossvel ou invivel a utilizao de mtodos probabilsticos.

1.3.1.2.1 Amostragem a Esmo ou Sem Norma


a amostragem em que o pesquisador, para simplificar o processo, procura ser
aleatrio sem, no entanto, usar algum dispositivo aleatrio confivel.

Exemplo 1.5: Suponha que desejamos retirar uma amostra de 50 parafu-


sos de uma caixa contendo 5.000. Nesse caso, poderamos, ao invs de sortear
os parafusos, escolher a esmo aqueles que fariam parte da amostra. No um
procedimento totalmente aleatrio porque, mesmo sem percebermos, pode-
ramos estar privilegiando alguma parte da caixa, no dando, dessa forma, a
mesma chance de participao a qualquer um dos parafusos.

captulo 1 17
1.3.1.2.2 Amostragem Intencional
Neste caso, o amostrador escolhe deliberadamente os elementos que iro com-
por a amostra, muitas vezes, por julgar tais elementos bem representativos
da populao.

Exemplo 1.6: Um diretor de uma instituio de ensino deseja avaliar o quan-


to determinada disciplina est sendo bem ministrada por seu professor. Para
isso, seleciona, para uma entrevista, alguns dos alunos com melhor desempe-
nho nessa disciplina.

1.4 Exemplo Prtico Envolvendo Tcnicas de Amostragem


Probabilstica

Exemplo 1.7: O quadro 1.1 lista a idade e a opinio de 50 profissionais de


empresas pblicas e privadas que esto sendo entrevistados para responder se
so contra ou a favor da incluso de deficientes visuais e auditivos em suas
empresas e em que tipo de empresa trabalha: pblica ou privada.

TIPO DE
PROFISSIONAIS IDADE OPINIO
EMPRESA
1 52 contra Pblica

2 22 a favor pblica

3 36 a favor privada

4 35 a favor privada

5 35 a favor privada

6 50 contra pblica

7 44 contra pblica

8 42 contra pblica

9 40 contra pblica

10 45 contra pblica

18 captulo 1
TIPO DE
PROFISSIONAIS IDADE OPINIO
EMPRESA
11 36 a favor privada

12 34 a favor privada

13 23 contra pblica

14 26 a favor pblica

15 28 a favor pblica

16 28 a favor pblica

17 29 a favor privada

18 30 a favor privada

19 30 a favor privada

20 34 a favor privada

21 38 a favor privada

22 41 contra pblica

23 42 contra pblica

24 50 contra pblica

25 49 contra pblica

26 38 contra privada

27 26 a favor privada

28 29 a favor privada

29 26 a favor privada

30 36 a favor privada

31 27 a favor privada

captulo 1 19
TIPO DE
PROFISSIONAIS IDADE OPINIO
EMPRESA
32 32 a favor privada

33 31 a favor privada

34 33 a favor privada

35 33 a favor privada

36 36 contra pblica

37 34 a favor pblica

38 46 contra privada

39 44 contra pblica

40 65 contra pblica

41 56 contra pblica

42 52 contra pblica

43 35 a favor pblica

44 24 a favor privada

45 23 a favor privada

46 28 a favor privada

47 30 a favor privada

48 34 a favor privada

49 46 contra pblica

50 26 a favor privada

Quadro 1.1 Idade e a opinio de profissionais de empresas pblicas e privadas com relao a
incluso de deficientes visuais e auditivos

20 captulo 1
a) Utilizando o quadro acima, retire uma amostra sistemtica de 10 profis-
sionais, iniciando pelo 3 profissional, e liste o n do profissional sortea-
do, a idade, a opinio e o tipo de empresa que ele trabalha.

Resoluo:
Dividindo 50 por 10, temos grupos com 5 elementos cada. Se sortearmos o
terceiro elemento do primeiro grupo, por exemplo, os participantes da amostra
sero os listados abaixo:

TIPO DE
PROFISSIONAIS IDADE OPINIO
EMPRESA
3 36 a favor privada

8 42 contra pblica

13 23 contra pblica

18 30 a favor privada

23 42 contra pblica

28 29 a favor privada

33 31 a favor privada

38 46 contra privada

43 35 a favor pblica

48 34 a favor privada

b) Com a amostra selecionada no item a), calcule:


a idade mdia dos profissionais;

Resoluo:

348
x= = 34, 8 anos
10

captulo 1 21
a porcentagem de profissionais contra a incluso;

Resoluo:

n o de profissionais contra a incluso na amostra 4


o
= = 0, 4
n total de profissionais na amostra 10

ou seja, 40% dos profissionais so contra a incluso de deficientes visuais ou


auditivos nas empresas em que trabalham.

a porcentagem de profissionais que so da rede pblica.

Resoluo:

n o de profissionais de empresas na amostra 4


o
= = 0, 4
n total de profissionais na amostra 10

ou seja, 40% dos profissionais trabalham em empresas pblicas.

c) possvel retirar uma amostra estratificada dos profissionais conside-


rando a varivel tipo de empresa? Diga, em poucas palavras, como voc
procederia neste caso?

Resoluo:
Sim, pois possvel identificar dois estratos: empresa pblica e privada. O
procedimento deve ser: retirar uma amostra proporcional de profissionais de
empresas pblicas e privadas e depois fazer as anlises devidas.

ATIVIDADE
1. Classifique as variveis abaixo em quantitativas (discretas ou contnuas) ou qualitativas
(nominal ou ordinal).
a) cor dos olhos
b) nmero de peas produzidas por hora
c) dimetro externo
d) nmero de pontos em uma partida de futebol

22 captulo 1
e) produo de algodo
f) salrios dos executivos de uma empresa
g) nmero de aes negociadas na bolsa de valores
h) sexo dos filhos
i) tamanho de pregos produzidos por uma mquina
j) quantidade de gua consumida por uma famlia em um ms
k) grau de escolaridade
l) nvel social
m) tipo sanguneo
n) estado civil

2. A guerra das Colas o termo popular para a intensa competio entre Coca-Cola e
Pepsi mostrada em suas campanhas de marketing. As campanhas tm estrelas de
cinema e televiso, vdeos de rock, apoio de atletas e afirmaes das preferncias dos
consumidores com base em testes de sabor. Como uma parte de uma campanha de
marketing da Pepsi, suponha que 1 000 consumidores de refrigerante sabor cola sub-
metam-se a um teste cego de sabor (isto , as marcas esto encobertas). Cada consu-
midor questionado quanto sua preferncia em relao marca A ou B.
a) Descreva a populao.
b) Descreva a varivel de interesse.
c) Descreva a amostra
d) Descreva a inferncia.

3. Suponha que voc tenha determinado conjunto de dados e classifique cada unidade da
amostra em quatro categorias: A, B, C ou D. Voc planeja criar um banco de dados no
computador com esses dados e decide codific-los como A = 1, B = 2, C = 3 e D = 4.
Os dados A, B, C e D so qualitativos ou quantitativos? Depois de introduzidos no banco de
dados como 1, 2, 3 e 4, os dados so qualitativos ou quantitativos? Explique sua resposta.

4. Os institutos de pesquisa de opinio regularmente fazem pesquisas para determinar o


ndice de popularidade do presidente em exerccio. Suponha que uma pesquisa ser
conduzida com 2.500 indivduos, que sero questionados se o presidente est fazendo
um bom ou um mau governo. Os 2.500 indivduos sero selecionados por nmeros de
telefone aleatrios e sero entrevistados por telefone.
a) Qual a populao relevante?
b) Qual a varivel de interesse? qualitativa ou quantitativa?

captulo 1 23
c) Qual a amostra?
d) Qual o interesse da inferncia para o pesquisador?
e) Qual o mtodo de coleta de dados que foi empregado?
f) A amostra em estudo representativa?

5. Uma populao se encontra dividida em quatro estratos. O tamanho de cada estrato ,


N1 = 80, N2 = 120, N3 = 60 e N4 = 60 Sabe-se que uma amostragem proporcional
foi realizada e dezoito elementos da amostra foram retirados do segundo estrato. Qual
o nmero total de elementos da amostra?

6. Uma pesquisa precisa ser realizada em uma determinada cidade. A amostragem propos-
ta para este problema a seguinte: dividir a cidade em bairros (pelo prprio mapa da
cidade): em cada bairro, sorteia-se certo nmero de quarteires proporcional rea do
bairro; de cada quarteiro, so sorteadas quatro residncias, destas quatro residncias,
todos os moradores so entrevistados.
a) Essa amostra ser representativa da populao ou poder apresentar algum vcio
(no confivel)?
b) Quais tipos de amostragem foram utilizados no procedimento?

7. Uma empresa de seguros mostra que, entre 4000 sinistros reportados empresa duran-
te um ms, 2700 so sinistros pequenos (inferiores a R$400,00), enquanto os outros
1300 so sinistros grandes (R$400,00 ou mais). Foi extrada uma amostra propor-
cional de 1% para estimar o valor mdio desses sinistros, Os dados esto a seguir,
separados por tipo de sinistro.

SINISTROS PEQUENOS SINISTROS GRANDES


84 330 126 156 90 296
492 710 1744 1298 506
390 132 36 73 55 178
676 982 1720 1510 976 1004
340 82 184 206 44 276
2600 2420
98 124 176 226 58 144
58 166 228

a) Determine a mdia de cada uma das amostras (sinistros pequenos e sinistros grandes),
b) Determine sua mdia ponderada, tomando como pesos os dois tamanhos de estratos
N1 = 2700 e N2 = 1300.

24 captulo 1
8. Consideremos um estudo realizado em empresas de pequeno e mdio porte de uma deter-
minada regio composto por 1000 empresas, distribudas, quanto ao nmero de funcio-
nrios, como mostra a tabela abaixo, e que nesta regio sejam amostrados 50 empresas.

Distribuio do n de empresas de uma regio qualquer,


quanto ao n de funcionrios.

AMOSTRA ESTRATIFICADA
N DE N DE (N = 50)
FUNCIONRIOS PROPRIEDADES
UNIFORME PROPORCIONAL
0 20 500
20 50 320
50 100 100
100 200 50
200 400 30

Total 1000 50 50

a) Qual dever ser o tamanho da amostra dentro de cada estrato no caso uniforme e
no proporcional?
b) Determine a mdia amostral obtida para a amostragem estratificada uniforme e para
a amostragem estratificada proporcional. Comente os resultados.

Observao: Amostragem estratificada uniforme quando retiramos o mesmo nmero de


elementos de cada estrato, independente do tamanho do estrato.

REFLEXO
Estamos encerrando nosso primeiro captulo. Vimos, aqui, alguns conceitos que sero funda-
mentais na compreenso dos outros contedos abordados no livro. J deve ter dado para
perceber que, mesmo estando no incio da disciplina, as aplicaes prticas que voc poder
fazer na sua rea de atuao sero muitas. A compreenso e interpretao das mais variadas
informaes, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do co-
nhecimento de certos elementos estatsticos.

captulo 1 25
Estamos apenas no comeo. Muitas tcnicas (muito interessantes!) ainda sero abordadas.
E lembre-se que o conhecimento e o domnio da Estatstica certamente levaro voc, futuro
gestor, s decises mais acertadas.

LEITURA
Sugerimos que voc oua os udios que esto no seguinte endereo: <http://m3.ime.unicamp.
br/recursos/1252>. No primeiro mdulo voc conhecer um pouco da histria da Estatstica
e, no segundo mdulo, a histria da Probabilidade.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.

COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.

DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.

FONSECA, Jairo Simon; MARTINS, Gilberto de Andrade; TOLEDO, Geraldo Luciano.


Estatstica Aplicada. So Paulo: Atlas, 1985.

LEVIN, Jack; FOX, James Alan. Estatstica para cincias humanas. So Paulo: Prentice Hall, 2004.

LEVINE, David M.; BERENSON, Mark L.; STEPHAN David. Estatstica: teoria e aplicaes.
Rio de Janeiro: LTC, 2000.

MARTINS, Gilberto de Andrade. Estatstica geral e aplicada. So Paulo: Atlas, 2002.

26 captulo 1
McClave, James T.; BENSON P. George.; SINCICH, Terry. Estatstica para adminstrao e
economia. So Paulo: Pearson Prentice Hall, 2009.

MEMRIA, Jos M. P. Breve Histria da Estatstica. Disponvel em: <http://www.im.ufrj.


br/~lpbraga/prob1/historia_estatistica.pdf>. Acesso em: 25 setembro 2014.

MILONE, Giuseppe. Estatstica geral e aplicada. So Paulo: Pioneira Thomson Learning,


2004.

TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.

VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003. Disponvel em: <http://
www.ufrgs.br/mat/graduacao/estatistica/historia-da-estatistica>. Acesso em: 25 set. 2014

NO PRXIMO CAPTULO
Agora que j sabemos como coletar dados, aprenderemos no prximo captulo como organi-
zar, resumir e apresentar os dados coletados em distribuies de frequncias. Estudaremos,
tambm, como resumir informaes de conjuntos de dados numricos em alguns valores que
sejam representativos de todo o conjunto.

captulo 1 27
2
Distribuio de
Frequncias e
Medidas de Posio
Central
2 Distribuio de Frequncias e Medidas de
Posio Central

Nesse captulo, estudaremos como organizar os dados numa distribuio de


frequncias e aprenderemos a resumir conjuntos de dados numricos em al-
guns valores representativos de todo conjunto.
Quando realizamos uma coleta de dados, geralmente estamos lidando com
uma quantidade muito grande de informaes. Portanto, torna-se imprescin-
dvel a utilizao de certas tcnicas visando simplificar a leitura de tais informa-
es. Para que se tenha uma viso do todo (sobre o fenmeno que est sendo
estudado) precisamos, por exemplo, dispor as informaes em tabelas ou apre-
sent-las em grficos. o que estaremos abordando num primeiro momento.
Logicamente, h mais tcnicas que podem ser aplicadas, mas elas sero vistas
nos prximos captulos.

OBJETIVOS
Organizar, resumir e apresentar, atravs de distribuio de frequncias, as informaes con-
tidas em grandes conjuntos de dados. Calcular e interpretar as medidas de posio central.

REFLEXO
Voc se lembra de j ter visto tabelas em jornais, livros ou revistas, em que eram utilizados per-
centuais para indicar as frequncias de ocorrncias de respostas em uma pesquisa? Ou com
os percentuais referentes avaliao de um governo? E informaes como mdia salarial de
determinada categoria de profissionais, ou ainda, idade mdia dos estudantes do primeiro ciclo
de determinada universidade? Neste captulo, veremos como (e para qu) construimos tabelas
dessa natureza e como calculamos medidas descritivas como a mdia aritmtica.

30 captulo 2
2.1 Distribuio de Frequncias

Para entendermos a ideia de distribuio de frequncias, vamos analisar a se-


guinte situao: quando um pesquisador termina de coletar os dados para sua
pesquisa, geralmente fica com muitos questionrios em mos (respondidos
pelas pessoas que foram sorteadas para pertencer a sua amostra) ou com os
dados digitados em alguma planilha eletrnica. O fato que os dados brutos
(sem tratamento) no trazem as informaes de forma clara, por isso devemos
tabular esses dados. Quando tabulamos os dados estamos resumindo as infor-
maes para melhor compreenso da varivel em estudo. A esta tabulao da-
mos o nome de distribuio de frequncias (ou tabela de frequncias).
Distribuio de frequncias uma tabela em que se resumem grandes
quantidades de dados, determinando o nmero de vezes que cada dado ocorre
(frequncia) e a porcentagem com que aparece (frequncia relativa).
Para facilitar a contagem do nmero de vezes que cada dado ocorre, pode-
mos ordenar os dados. A uma sequncia ordenada (crescente ou decrescente)
de dados brutos damos o nome de Rol.
Os tipos de frequncias com os quais iremos trabalhar so:

Frequncia absoluta ou simplesmente frequncia (f): o n de vezes que cada


dado aparece na pesquisa.
Frequncia relativa ou percentual (fr): o quociente da frequncia absoluta
pelo nmero total de dados. Esta frequncia pode ser expressa em porcenta-
gem. O valor de (fr x100) definido como fr (%).
Frequncia acumulada (fa): a soma de cada frequncia com as que lhe so
anteriores na distribuio.
Frequncia relativa acumulada (fra): o quociente da frequncia acumulada
pelo nmero total de dados. Esta frequncia tambm pode ser expressa em
porcentagem. O valor de (fra x100) definido como fra (%).

Exemplo 2.1: Com as informaes fornecidas na tabela 2.1, vamos indicar


e classificar a varivel em estudo. Depois, completaremos a distribuio de fre-
quncias encontrando a frequncia relativa (%).

captulo 2 31
FAIXA DE RENDA
NMERO DE
(EM SALRIOS fr (%)
OPERRIOS (f )
MNIMOS)
02 43 39,09
24 39 35,45
46 16 14,55
68 8 7,27
8 10 4 3,64

Total 110 100

Tabela 2.1 Distribuio de renda de operrios de uma determinada empresa.

Resoluo:
A varivel em estudo a renda dos operrios de uma determinada empre-
sa. Esta varivel classificada como quantitativa contnua, pois pode assumir
qualquer valor dentro de um intervalo numrico.

ATENO
Em todos os nossos exemplos, na distribuio de frequncias construda com intervalos de clas-
ses, vamos considerar que o intervalo de classe fechado esquerda e aberto direita. Por
exemplo, no caso dessa tabela, considerando a terceira classe de frequncia, podemos dizer que
os 16 operrios que esto nesta classe recebem de 4 a menos que 6 salrios mnimos por ms.

As frequncias absolutas (f) so fonecidas no problema. As frequncias rela-


tivas (fr(%)) so encontradas dividindo cada frequncia absoluta (de cada classe
de frequncia) pelo total de operrios (110) e multiplicando por 100.
Uma distribuio de frequncias apresenta, basicamente, as 3 colunas
apresentadas na tabela 2.1. Desta maneira, conseguimos organizar de forma
resumida um conjunto de dados.

32 captulo 2
Em alguns estudos podemos ter interesse em outras quantidades relaciona-
das tabela, como, por exemplo, a frequncia acumulada ou a frequncia acu-
mulada (%). Veremos mais adiante que a frequncia acumulada utilizada na
construo de um grfico denominado Ogiva. A tabela 2.2 apresenta a frequncia
acumulada e a frequncia relativa acumulada (%).

FAIXA DE
NMERO DE FREQUNCIA
RENDA (EM
OPERRIOS fr (%) ACUMULADA fra (%)
SALRIOS
(f ) (fa )
MNIMOS)
02 43 39,09 43 39,09
24 39 35,45 82 75,55
46 16 14,55 98 89,09
68 8 7,27 106 96,36
8 10 4 3,64 110 100,00

Total 110 100

Tabela 2.2 Distribuio das frequncias acumuladas da varivel faixa de renda.

A coluna frequncia acumulada (fa) decada classe obtida somando a fre-


quncia da respectiva classe com as que lhe so anteriores e a fra(%) obtida
dividindo a fa pelo nmero total de dados e multiplicando por 100.
Para organizar dados de variveis qualitativas ou quantitativas discretas
(cujos valores no esto agrupados em classes) seguimos o mesmo procedi-
mento que foi utilizado na construo da tabela 2.1.

Exemplo 2.2: Uma determinada empresa resolveu traar o perfil socioeco-


nmico de seus empregados. Uma das variveis estudadas foi o nmero de fi-
lhos, com idade inferior a 18 anos, de cada um dos empregados. A tabela 2.3
fornece a frequncia e a frequncia relativa (%) para cada valor obtido.

captulo 2 33
NMERO DE NMERO DE
fr (%)
FILHOS OPERRIOS (f )
0 0 13,33
1 1 24,44
2 2 28,89
3 3 15,56
4 4 11,11
5 5 2,22
6 6 4,44

Total 45 100,00

Tabela 2.3 Distribuio de frequncias dos empregrados, segundo o nmero de filhos.

Para encontrarmos a fa e a fra (%) seguimos o mesmo procedimento que foi


utilizado na tabela 2.2.

2.1.1 Agrupamento em Classes

Como vimos no exemplo 2.1, para representar a varivel contnua renda, or-
ganizamos os dados em classes. Portanto, podemos dizer que a varivel renda
foi dividida em 5 classes de frequncias.
Quando agrupamos em classes de frequncias perdemos informaes, pois
no sabemos exatamente quais so os valores que esto contidos em cada uma
das classes (a no ser que seja possvel pesquisar esta informao no conjunto
de dados brutos). Na anlise das distribuies de frequncias com intervalos de
classes podemos identificar os seguintes valores:

Limite inferior (Li): o menor valor que a varivel pode assumir em uma
classe de frequncia;

Limite superior (Ls): serve de limite para estabelecer qual o maior valor que a
varivel pode assumir em uma classe de frequncia, mas, geralmente, os valores
iguais ao limite superior no so computados naquela classe e sim na seguinte;

34 captulo 2
Ponto mdio (Pm): a mdia aritmtica entre o Li e o Ls da mesma classe,

Li + Ls
ou seja, Pm =
2
Amplitude (h): a diferena entre o Ls e o Li da classe, ou seja, h = Ls Li;

Amplitude total (ht): a diferena entre o Ls da ltima classe de frequncia e


o Li da primeira classe, ou seja: ht = Ls Li.

Na construo de uma distribuio de frequncias com intervalos de clas-


ses devemos determinar o nmero de classes que uma tabela deve ter e qual o
tamanho (ou a amplitude) destas classes. Podemos usar o bom senso e escolher
arbitrariamente quantas classes e qual a amplitude que estas classes devem ter.
Quando no tivermos nenhuma referncia sobre qual deve ser o nmero de
classes a se trabalhar, podemos utilizar o critrio que sugerido por vrios au-
tores. Chama-se regra da raiz e ser apresentado a seguir.
Considere:

k (2.1)
k@ n e h=
k'

onde k o nmero de classes que vamos construir na distribuio de frequ-


ncias; n o tamanho da amostra que estamos trabalhando; h a amplitude de
cada uma das classes e R a amplitude total dos dados.

Os valores de k e h devem ser arredondados sempre para o maior valor. Por exem-
plo, para uma amostra de tamanho n = 50 cujo menor valor 4 e o maior valor 445
temos que R = 441 (maior valor menor valor). O nmero de classes seria dado por
k n= 50 = 7, 07106... 8 (maior inteiro depois de 7) e a amplitude (tamanho) de
R 441
cada uma das 8 classes acima dever ser h = = = 55,125 56 (maior inteiro
k 8
depois de 55). Ou seja, deveramos, para este exemplo, montar uma tabela com 8 classes
e de amplitude 56. A tabela pode ser iniciada pelo menor valor do conjunto de dados.

Resumindo, para montar uma distribuio de frequncias com intervalos


de classes devemos:

captulo 2 35
Achar o mnimo e o mximo dos dados.
Determinar as classes de frequncias que na verdade nada mais do que
escolher intervalos de mesmo comprimento que cubra a amplitude entre
o mnimo e o mximo. Para determinar o nmero de classes, usaremos
k
k @ n e para determinar o tamanho das classes usaremos h =
k'

Contar o nmero de observaes que pertencem a cada intervalo de classe.


Esses nmeros so as frequncias observadas da classe.
Calcular as frequncias relativas e acumuladas de cada classe.
De modo geral, a quantidade de classes no deve ser inferior a 5 e nem
superior a 25.

Agora, aprenderemos como caracterizar um conjunto de dados atravs de


medidas numricas que sejam representatativas de todo o conjunto.

2.2 Medidas de posio

As medidas de posio, tambm chamadas de medidas de tendncia central, tm


o objetivo de apresentar um ponto central em torno do qual os dados se distri-
buem. As mais conhecidas so: a mdia, a mediana e a moda. Vamos estudar
cada uma dessas medidas de posio (estatsticas).
Primeiramente, vamos fazer um estudo para os dados no tabulados, ou seja,
quando os dados no estiverem na forma de distribuio de frequncia. Em se-
guida, as mesmas medidas sero calculadas com base em dados tabulados.

2.2.1 Mdia aritmtica

A mdia aritmtica (x ) a mais comum e mais simples de ser calculada dentre


todas as medidas de posio mencionadas.
Para calcul-la, basta fazer a diviso da soma de todos os valores (x1, x2, ..., xn)
da varivel pelo nmero total de elementos do conjunto de dados (n):

36 captulo 2
n
xi
i =1
x=
n

onde:
x = a mdia aritmtica;
xi = os valores da varivel;
n = o nmero de valores no conjunto de dados.

2.2.2 Mediana

A mediana outra medida de posio, dita mais robusta que a mdia, pois, da
forma como ela determinada, no permite que alguns valores muito altos ou
muito baixos interfiram de maneira significativa em seu valor. Desta forma, se
o conjunto de dados apresentar alguns poucos valores discrepantes em relao
maioria dos valores do conjunto de dados, em geral, aconselhvel usar a
mediana ao invs da mdia.

ATENO
A mediana a medida de posio mais frequentemente usada quando a varivel em estudo
for renda (R$), pois algumas rendas extremamente elevadas podem inflacionar a mdia.
Neste caso, a mediana uma melhor medida de posio central.

A mediana encontrada ordenando os dados do menor para o maior valor e


em seguida identificando o valor central destes dados ordenados. uma medi-
da que divide o conjunto de dados ao meio, deixando a mesma quantidade de
valores abaixo dela e acima.
A determinao da mediana difere no caso do tamanho (n) do conjunto de
dados ser par ou mpar. Vejamos a seguir.

captulo 2 37
Se o nmero de elementos do conjunto de dados for mpar, ento a mediana
ser exatamente o valor do meio, ou seja:

Md = x n +1

2

(2.3)
Se o nmero de elementos do conjunto de dados for par, ento a mediana
ser exatamente a mdia dos dois valores do meio, isto :

x n + x n
+1
2 2
Md =
2
(2.4)
x n , x n+1 e x n
onde +1
indicam as posies onde os dados se encontram.
2 2 2

2.2.3 Moda

A moda de um conjunto de dados o valor (ou valores) que ocorre com maior
frequncia. A moda, diferentemente das outras medidas de posio, tambm
pode ser encontrada quando a varivel em estudo for qualitativa. Existem con-
juntos de dados em que nenhum valor aparece mais vezes que os outros. Neste
caso, dizemos que o conjunto de dados no apresenta moda.
Em outros casos, podem aparecer dois ou mais valores de maior frequncia no
conjunto de dados. Nestes casos, dizemos que o conjunto de dados bimodal e
multimodal, respectivamente.
Por conta das definies diferentes, a mdia, a mediana e a moda fornecem,
muitas vezes, informaes diferentes sobre o centro de um conjunto de dados,
embora sejam todas medidas de tendncia central.
No exemplo 2.3 apresentaremos os clculos das medidas de posio para
dados no tabelados (dados brutos).

Exemplo 2.3: Um gerente de banco deseja estudar a movimentao de pes-


soas em sua agncia na segunda semana de um ms qualquer. Ele constata que
no primeiro dia entraram 1.348 pessoas, no segundo dia, 1.260 pessoas, no ter-
ceiro, 1.095, no quarto, 832 e no ltimo dia do levantamento, 850 pessoas. En-
contre a mdia aritmtica, a mediana e a moda para este conjunto de dados e
interprete os resultados.

38 captulo 2
Resoluo:
A mdia aritmtica dada por:

n
xi 1.348 + 1.260 + 1.095 + 832 + 850 5.385
i=
=1
=x = = 1.077
n 5 5

O nmero mdio de pessoas que entram na agncia bancria na segunda


semana do ms de 1.077 pessoas. Isto quer dizer que, alguns dias entram me-
nos que 1.077 e outros dias entram mais, ou seja, 1.077 um valor em torno do
qual o nmero de pessoas que entram na agncia, durante a segunda semana
de cada ms, se concentra.
Para encontrar a mediana, devemos, primeiramente, ordenar os dados em
ordem crescente (pode ser decrescente tambm):

832, 850, 1095, 1.260, 1.348

Como a quantidade de dados (n) um nmero mpar, a mediana exata-


mente o valor que se encontra no meio do conjunto de dados:

Md= x n+1=

x=
6 x=
3 1.095 pessoas
2
2

Isto significa que temos o mesmo nmero de observaes menores ou iguais


ao valor da mediana e o mesmo nmero de observaes maiores ou iguais ao
valor da mediana.
Este conjunto de dados no possui moda, pois no existe nenhum valor que
aparece com mais frequncia que os outros.
Agora, vamos fazer um estudo para os dados tabulados, ou seja, quando os da-
dos estiverem na forma de uma distribuio de frequncias.
Neste caso, a maneira de se calcular a mdia aritmtica muda um pouco.
Como as frequncias so nmeros que indicam quantas vezes aparece deter-
minado valor ou quantos valores tm em cada classe de frequncia, elas funcio-

captulo 2 39
naro como fatores de ponderao. Estas situaes sero apresentadas nos
exemplos 2.4 e 2.5, respectivamente.

Mdia Aritmtica

No caso de dados tabulados, o clculo da mdia aritmtica :

k
xi fi
i =1
x= k
fi
i =1
(2.5)

onde:
xi o valor da varivel (ou o ponto mdio de uma classe de frequncia);
fi a frequncia referente a cada valor (ou classe);
k
fi a soma dos valores das frequncias (n).
i =1

A expresso (2.5) apresentada acima tambm conhecida como frmula da


mdia ponderada.
No caso de distribuies de frequncias que no apresentam intervalos de
classes, a mediana e a moda so encontradas utilizando os conceitos apresenta-
dos nos itens 2.2.2 e 2.2.3, respectivamente.

Exemplo 2.4: Em um determinado ms, foi computado o nmero de faltas


ao trabalho, por motivos de sade, que cada funcionrio de uma determinada
empresa teve. Os dados esto apresentados na tabela a seguir.

40 captulo 2
NMERO DE
f
FALTAS
0 31
1 20
2 8
3 2
4 0
5 1
6 1

Total 63

Tabela 2.4 Nmero de faltas ao trabalho, por motivos de sade.

Encontre a mdia aritmtica, a mediana e a moda para este conjunto de da-


dos e interprete os resultados.

Resoluo:

Mdia Aritmtica

k
xi fi ( 0 31) + (1 20 ) + ( 2 8) + ( 3 2 ) + ( 4 0 ) + ( 5 1) + ( 6 1) 53
i =1
x
= =
k
= 0,84
63 63
fi
i =1

ou seja, nesta empresa ocorreram, em mdia, 0,84 faltas por funcionrio,


por motivo de sade.

Mediana
Como os dados esto tabelados, eles j se encontram ordenados. Para ficar
mais fcil encontrar o valor da mediana, vamos incluir na distribuio de frequ-
ncias uma coluna com as frequncias acumuladas.

captulo 2 41
ATENO
Quando os dados estiverem dispostos numa distribuio de frequncias, o clculo da mdia
aritmtica pode ser feito acrescentando uma coluna na distribuio de frequncias. Esta
coluna denominada xi x fi e obtida multiplicando cada valor da varivel (xi ) pela sua res-
pectiva frequncia (fi ). A mdia aritmtica obtida dividindo a soma dos valores desta coluna
pela soma dos valores da coluna da frequncia.

NMERO DE
f fa
FALTAS
0 31 31
1 20 51
2 8 59
3 2 61
4 0 61
5 1 62
6 1 63

Total 63

Para encontrar o valor da mediana, seguimos os seguintes passos:

1 Passo: identificaremos a frequncia acumulada imediatamente superior


metade do somatrio das frequncias absolutas:

2 Passo: a mediana ser o valor da varivel associado frequncia acumu-


lada imediatamente superior ao valor encontrado no 1 Passo. Ento, a frequ-
ncia acumulada imediatamente superior a 31,5 fa = 51. . Portanto, o valor da
mediana o valor da varivel associado fa = 51, ou seja,

Md = 1 falta
Neste conjunto de dados, pelo menos 50% das observaes so maiores ou
iguais a 1 falta.

42 captulo 2
k
fi
No caso do valor i =1 ser exatamente igual a uma das frequncias acumu
2
ladas fa, o clculo da mediana ser a mdia aritmtica entre dois valores da varivel:
xi e xi + 1. k

O valor da varivel xi ser aquele cujo


fi
e o valor da varivel xi + 1
i =1
= fa
2
ser aquele que est imediatamente aps xi na distribuio de frequncia.

Moda
A resposta que aparece com maior frequncia neste conjunto de dados o
0 (com frequncia 31), ou seja, mais frequente encontrar funcionrios que
no faltam.

ATENO
As medidas resumo calculadas quando os dados estiverem agrupados em intervalos de clas-
ses so apenas aproximaes dos verdadeiros valores, pois substitumos os valores das ob-
servaes pelo ponto do mdio do intervalo de classe.

No caso do exemplo 2.5 veremos que os dados esto agrupados em interva-


los de classes. Quando o conjunto de dados for apresentado sob a forma agru-
pada perdemos a informao dos valores das observaes. Neste caso, vamos
supor que todos os valores dentro de uma classe tenham seus valores iguais ao
ponto mdio desta classe.
Os clculos da mdia, da moda e da mediana para distribuio de frequn-
cias agrupadas em classes esto apresentados a seguir.
Vale ressaltar que, sempre que possvel, as medidas de posio e disperso
devem ser calculadas antes dos dados serem agrupados.
Exemplo 2.5: A tabela abaixo apresenta a distribuio de frequncias do tem-
po de vida de 60 componentes eletrnicos (medido em dias) submetidos experi-
mentao num laboratrio especializado. Calcular as medidas de posio.

captulo 2 43
TEMPO DE VIDA PONTO MDIO
f
(DIAS) (xi )
3 18 3 10,5
18 33 4 25,5
33 48 4 40,5
48 63 8 55,5
63 78 10 70,5
78 93 28 85,5
93 108 2 100,5
108 123 1 115,5

Total 60

Tabela 2.5 Tempo de vida de componentes eletrnicos.

Resoluo:
Neste tipo de tabela, como temos classes de frequncias, devemos encon-
trar um valor que represente cada classe, para que possamos efetuar os clcu-
los. Por exemplo, considerando a primeira classe de frequncia,

TEMPO DE VIDA PONTO MDIO


f
(DIAS) (xi )
3 18 3 10,5

sabemos que 3 componentes eletrnicos tiveram tempo de vida entre 3 e 18


dias, porm, no sabemos exatamente qual foi o tempo de vida de cada um. Se
considerarmos o limite inferior da classe (3) para efetuarmos os clculos esta-
remos subestimando as estimativas. Por outro lado, se considerarmos o limite
superior da classe (18) estaremos superestimando as estimativas. Portanto, va-
mos utilizar o ponto mdio de cada classe para podermos fazer os clculos sem
grandes prejuzos. A terceira coluna da tabela acima contm os pontos mdios
calculados para cada intervalo de classe. O valor do ponto mdio passa a ser o
nosso valor xi a ser utilizado nos clculos. Vamos aprender como se faz:

44 captulo 2
Mdia Aritmtica
k
xi fi
i =1
x= k
=
fi
i =1

=
(10, 5 3)+ (25, 5 4 )+ (40, 5 4 )+ (55, 5 8)+ (70, 5 10 )+ (85, 5 28)+ (100, 5 2 )+ (115, 5 1)
60
4155
= = 69, 25
60

Podemos dizer, atravs da mdia aritmtica, que os componentes eletrni-


cos tm uma durao mdia de 69 dias e 6 horas (69,25 dias).

Mediana
Como os dados esto tabelados em classes de frequncias, calculamos a
mediana atravs da seguinte frmula:

h (X m - Fiaa )
Me = Xe +
F

onde
Xe o limite inferior da classe que contm a mediana;
Xm: metade do valor da frequncia total; (2.6)
Fiaa: frequncia acumulada da classe anterior classe que contm a mediana;
Fi: nmero de observaes na classe que contm a mediana;
h: amplitude da classe que contm a mediana.

No clculo da mediana para os dados da tabela 2.5 temos que primeiramen-


te encontrar a classe que contm a mediana. Esta classe corresponde classe

associada frequncia acumulada imediatamente superior i . f


Como
fi 60
=
2
= 30 , temos que a classe que contm a mediana de
2 2
78 93 (pois fa = 57).

captulo 2 45
Tempo P. M
f fa
de vida xi
N de
318 3 10,5 3 observaes da
classe que contm
1833 4 25,5 7 a mediana
Classe que 3348 4 40,5 11 fa da classe
contm 8 55,5 19 anterior a classe
4863
a mediana que contm
6378 10 70,5 29 a Md.
7893 28 85,5 57
93108 2 100,5 59
108123 1 115,5 60
Total 60

fi

Alm disso, temos:


Xe 78;
Xm: 30;
Fiaa: 29;
Fi: 28;
h: 15
Agora, basta substituirmos todos os valores encontrados na frmula 2.6 e
encontramos o valor da mediana:

15 (30 - 29 )
M e = 78 + = 28 + 0.54 @ 78.5
28

Atravs da mediana podemos dizer que pelo menos 50% dos componentes
eletrnicos avaliados tm durao igual ou inferior a 78 dias e 12 horas.
Para calcularmos a moda para distribuies de frequncias com intervalos
de classes, utilizaremos a seguinte frmula:

46 captulo 2
h (Fm - Fa )
Mo = X o +
(
2Fm - Fa + Fp )
onde (2.7)
Xo o limite inferior da classe que contm a moda;
Fm: frequncia mxima;
Fa: frequncia anterior frequncia mxima;
Fp: frequncia posterior frequncia mxima;
h: amplitude da classe que contm a moda.

No clculo da moda para os dados da Tabela 2.5 temos que primeiramente


encontrar a classe que contm a moda. Esta classe corresponde classe que
possui a frequncia mxima. Ento, a classe que contm a moda de 7893
(pois f = 28).

Alm disso, temos:


Xo 78;
Fm: 28;
Fa: 10;
Fp: 2;
h: 15.

Agora, basta substituirmos todos os valores encontrados na frmula 2.7 e


encontramos o valor da moda:

15 (28 - 10 ) 270
Mo = 78 + = 78 + @ 84,1
2 (28 )- (10 + 2 ) 44

Portanto, comum encontrar componentes eletrnicos que durem, aproxi-


madamente, 84 dias e 2 horas.

captulo 2 47
CONEXO
Sugerimos os vdeos: Novo Telecurso E. Fundamental Matemtica Aula 34 (parte
1) e Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 2) disponveis,
respectimante em <http://www.youtube.com/watch?v=SyWbYOtAIYc&NR=1> e <http://
www.youtube.com/watch?v=ejMyWfuSO5k>. que apresenta de modo bem prtico a
utilizao das medidas de posio.

ATIVIDADE
1. Abaixo temos as idades dos funcionrios de uma determinada empresa. Construir uma
distribuio de frequncias, agrupando os dados em classes.

OBS.: A tabela de distribuio de frequncias deve ser completa com f, fr e fa.

Idades (dados brutos)

48 28 37 26 29 59 27 28 30 40 42 35 23 22 31

21 51 19 27 28 36 25 40 36 49 28 26 27 41 29

Baseado na distribuio de frequncias construda, responda:


a) Quantos so os funcionrios com idade inferior a 33 anos?
b) Que porcentagem de funcionrios tem idade igual ou superior a 47 anos?
c) Quantos so os funcionrios com idade maior ou igual a 26 anos e no tenham mais
que 40 anos?
d) Qual a porcentagem de funcionrios com idade abaixo de 40 anos?
e) Qual a porcentagem de funcionrios que tm no mnimo 40 anos?

2. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em


um determinado supermercado no primeiro sbado aps receberem seus pagamentos
(salrios). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e
18h, e anotou os valores gastos por cada um deles. Estes valores esto listados abaixo:

48 captulo 2
4,89 11,00 5,60 73,85 24,83 98,00 186,00 234,87 58,00 198,65

223,86 341,42 94,76 445,76 82,80 35,00 455,00 371,00 398,60 234,00

64,90 54,98 48,80 68,90 120,32 126,98 76,43 6,35 9,98 12,68

243,00 18,65 134,90 11,10 321,09 290,76 74,00 48,80 74,52 138,65

26,00 210,13 15,78 197,45 75,00 76,55 32,78 166,09 105,34 99,10

Analisando o conjunto de dados, responda os seguintes itens:


a) Qual a varivel em estudo? Classifique-a.
b) Construa uma tabela de frequncias a partir do conjunto de dados brutos.

3. Os dados abaixo referem-se ao nmero de horas extras de trabalho que uma amostra de
64 funcionrios de uma determinada empresa localizada na capital paulista.

10 10 12 14 14 14 15 16

18 18 18 18 18 19 20 20

20 20 20 21 22 22 22 22

22 22 22 22 22 22 22 22

23 23 24 24 24 24 24 24

24 25 25 25 25 26 26 26

26 26 26 27 27 27 28 28

29 30 30 32 35 36 40 41

Pede-se:
a) Calcule e interprete as seguintes medidas descritivas calculadas para os dados bru-
tos (dados no tabulados): mdia aritmtica; mediana; moda.
b) Construir uma distribuio de frequncias completa (com freq. absoluta, freq. relativa,
freq. acumulada e ponto mdio).
c) Com a tabela construda no item b), encontre as seguintes medidas: mdia aritmtica,
mediana, moda. Interprete os resultados.

captulo 2 49
4. Os dados abaixo representam as vendas mensais (em milhes de reais) de vendedores de
gnero alimentcios de uma determinada empresa.

VENDAS MENSAIS NMERO DE VENDEDORES


(EM MILHES DE REAIS)
0 | 1 6
1 | 2 12
2 | 3 20
3 | 4 48
4 | 5 14
5 | 6 10

Total 110

a) Qual a varivel em estudo? Que tipo de varivel esta?


b) Encontre a mdia, mediana e moda e interprete os resultados.
c) Qual a porcentagem de vendedores com vendas mensais inferior a 2 milhes de reais?
d) Qual a porcentagem de vendedores com vendas mensais superior a 4 milhes de reais?
e) Qual a porcentagem de vendedores com vendas mensais entre 3 (inclusive) e 5 (ex-
clusive) milhes de reais?
f) Qual a porcentagem de vendedores que vendem, pelo menos, 3 milhes de reais
mensais?

5. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com


relao ao nmero de filhos por famlia:

NMERO DE FILHOS 0 1 2 3 4 5

FREQUNCIA DE
19 22 28 16 2 4
FAMLIAS

Calcule e interprete os resultados da:


a) mdia aritmtica
b) mediana
c) moda

50 captulo 2
6. Define-se a mdia aritmtica de n nmeros dados como o resultado da diviso por n da
soma dos n nmeros dados. Sabe-se que 4,2 a mdia aritmtica de 2.7; 3.6; 6.2; e x.
Determine o valor de x.

LEITURA
Recomendamos a leitura do texto Como analisar de forma simples um grande n-
mero de dados?, disponvel no endereo: <http://www.klick.com.br/conteudo/pagi-
na/0,6313,POR-1453--1453,00.html>, que aborda de maneira clara alguns procedimentos
que podem ser utilizados quando nos deparamos com situaes em que precisamos resumir
as informaes de grandes conjuntos de dados.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada adminis-
trao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.

COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.

DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo estatsti-
ca. Rio de Janeiro: LTC, 2003.

TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.

VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003.

captulo 2 51
NO PRXIMO CAPTULO
Se at agora vimos como organizar os dados (informaes) em distribuies de frequncias
e como resumir as informaes numricas em medidas de posio central, iremos incremen-
tar esse processo atravs da insero de medidas de ordenamento e disperso. As medidas
de ordenamento nos fornecem uma ideia sobre a distribuio dos dados ordenados e apre-
sentam a vantagem de no serem afetadas pela forma da distribuio dos dados ou por va-
lores discrepantes. Para que tenhamos informaes mais completas do conjunto de dados,
necessrio estudar a sua variabilidade. As estatsticas que tm essa funo so denomina-
das medidas de variabilidade ou de disperso. Finalizaremos o captulo apresentando vrios
tipos de grficos que representam de maneira adequada as informaes contidas em um
conjunto de dados.

52 captulo 2
3
Medidas de
Ordenamento e
Forma, Medidas de
Disperso e
Grficos
3 Medidas de Ordenamento e Forma,
Medidas de Disperso e Grficos

Nesse terceiro captulo estudaremos, primeiramente, as medidas de ordenamen-


to, que so usadas para comparao de valores dentro do conjunto de dados. Estas
medidas apresentam a vantagem de no serem afetadas pela presena de valores
extremos no conjunto de dados. Estudaremos, tambm, as medidas de disperso,
que servem para indicar o quanto os dados se apresentam dispersos em torno da
regio central. Fornecem, portanto, o grau de variao existente no conjunto de da-
dos. Dois ou mais conjuntos de dados podem, por exemplo, ter a mesma mdia,
porm, os valores podero estar muito mais dispersos num conjunto do que no
outro. Ou seja, podem ter maior ou menor grau de homogeneidade.
E, para finalizar, apresentaremos os principais tipos de grficos utilizados para
representar a distribuio de uma varivel.

OBJETIVOS
Calcular e interpretar as medidas de ordenamento e de disperso;
Saber escolher representaes grficas mais apropriadas para variveis qualitativas e
quantitativas.

REFLEXO
Voc se lembra de, aps ter feito uma prova bimestral, algum professor ter informado que o de-
sempenho mdio da turma ficou em torno de 7,2? Para efeito de comparao, ele tambm pode
ter calculado a mdia de outra turma, e verificado que o desempenho mdio tambm ficou em
torno de 7,2. Surgem os seguintes questionamentos:
ser que as notas das duas turmas foram iguais?
ser que as notas das turmas esto prximas da mdia ou dispersas?
Utilizaremos os conceitos deste captulo para responder a estas perguntas.

54 captulo 3
3.1 Medidas de ordenamento

Os quartis, decis e percentis so muito similares mediana, uma vez que tam-
bm subdividem a distribuio de dados de acordo com a proporo das frequ-
ncias observadas.
J vimos que a mediana divide a distribuio em duas partes iguais, ento, os
quartis (Q1, Q2 e Q3), como o prprio nome sugere, divide a distribuio dos dados
ordenados em quatro partes, sendo, Q1 o quartil que separa os 25% valores infe-
riores dos 75% superiores, Q2 o que divide o conjunto ao meio ( igual mediana)
e Q3 o que separa os 75% valores inferiores dos 25% superiores. No h um con-
senso universal sobre um procedimento nico para o clculo dos quartis, e dife-
rentes programas de computador muitas vezes produzem resultados diferentes.

ATENO
Perceba que o 2 quartil, o 5 decil e o 50 percentil representam a prpria mediana, ou seja,
todas estas medidas separatrizes (Q2, D5, e P50), dividem a distribuio dos dados ao meio,
deixando aproximadamente 50% dos dados abaixo delas e 50% acima.

Os decis, por sua vez, dividem a distribuio dos dados em 10 partes (Di, i =
1, 2, ..., 9) e os percentis dividem a distribuio em 100 partes (Pi = 1, 2, ..., 99).
As medidas separatrizes, geralmente, s so calculadas para grandes quan-
tidades de dados.
No Excel, por exemplo, temos a opo de pedir o clculo de tais medidas.
Com os clculos dos quartis, juntamente com os valores mnimo e mxi-
mo do conjunto de dados, podemos construir um grfico chamado desenho
esquemtico ou boxplot. A anlise deste grfico bastante til no sentido de
informar, entre outras coisas, a variabilidade e a simetria dos dados.

CONEXO
Para se entender quais so os procedimentos utilizados na construo de um boxplot, bem
como sua interpretao, leia o texto: Diagramas de Caixa (Boxplots) em: TRIOLA, Mario F.
Introduo estatstica. 10.ed. Rio de Janeiro: LTC, 2008. pp. 98 a 102.

captulo 3 55
3.1.1 Clculo dos quartis, decis e percentis para dados no agrupados em classes

3.1.1.1 Quartis
Como os quartis so medidas separatrizes precisamos, primeiramente, orde-
nar o conjunto de dados.
Podemos obter os quartis utilizando a seguinte frmula:

Qnq = xnqn 1
+
4 2

Onde
Q: quartil que se deseja obter;
nq: nmero do quartil que se deseja obter (1, 2 ou 3);
x: elemento do conjunto de dados ordenados;
n: tamanho da amostra.

Exemplo 3.1: Um escritrio que presta consultoria em administrao levan-


tou os tempos de espera de pacientes que chegam a uma clnica de ortopedia
para atendimento de emergncia. Foram coletados os seguintes tempos, em
minutos, durante uma semana. Encontre os quartis.

2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7

Resoluo:
Para encontrarmos os quartis, precisamos ordenar o conjunto de dados.
Ento:

2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

56 captulo 3
Primeiro quartil (Q1)

Q1 = x118 1
+
4 2
Q1 = x5

Portanto, o primeiro quartil o elemento que est na quinta posio, no


conjunto de dados ordenados. Ento:

Q1 = 3

Pelo menos, 25% das observaes so menores ou iguais a 3 minutos.

Segundo quartil (Q2)

Q2 = x218 1
+
4 2
Q2 = x9,5

Portanto, o segundo quartil est entre os elementos que ocupam a nona e


a dcima posio do conjunto de dados orenados. Para encontr-lo, fazemos a
mdia entre os valores que esto nestas posies, ou seja:

6 + 7
Q2 = = 6, 5
2

Pelo menos, 50% das observaes so menores ou iguais a 6,5 minutos.

Terceiro quartil (Q3)

Q3 = x318 1
+
4 2
Q3 = x14

captulo 3 57
Portanto, o terceiro quartil o elemento que ocupa a dcima quarta posio
do conjunto de dados ordenados. Ento:

Q3 = 8

Pelo menos, 25% das observaes so maiores ou iguais a 8 minutos.

3.1.1.2 Decis
Os decis dividem o conjunto de dados ordenados em 10 partes. Eles podem ser
obtidos atravs da seguinte frmula:

Dnq = xnd n 1
+
10 2

Onde
D: decil que se deseja obter;
nd: nmero do decil que se deseja obter (1, 2 ou 3);
x: elemento do conjunto de dados ordenados;
n: tamanho da amostra.

Exemplo 3.2: Vamos utilizar os dados do Exemplo 3.1 para encontrar o oi-
tavo decil:

2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7

Resoluo:
Para encontrarmos os decis, precisamos ordenar o conjunto de dados. Ento:

2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

Oitavo decil (D8)

D8 = x8 18 1
+
10 2
D8 = x14,9

58 captulo 3
Portanto, o oitavo decil corresponde ao elemento 14,9 no conjunto de dados
ordenados, situados entre as posies 14 e 15. Como o oitavo decil no est
exatamente no meio de dois elementos (x14,9), obtemos este elemento seguindo
o seguinte raciocnio:

x -8 2
=
0, 9 1

Usando a propriedade fundamental da proporo (multiplicao em


cruz), obtemos:

x - 8 = 1, 8
x =1, 8 + 8
x = 9, 8

Aproximadamente 20% das observaes so maiores ou iguais a 9,8 minutos.

ATENO
A proporo montada neste exemplo foi obtida atravs do seguinte raciocnio: a diferena
entre o elemento x que queremos encontrar e o elemento que est na dcima quarta posio
(8) est para a diferena entre as posies 14,9 e 14 (14,9 14) assim como a diferena
entre os elementos 10 e 8 est para a diferena entre as posies 15 e 14 (15-14).

3.1.1.3 Percentis
Os percentis dividem o conjunto de dados ordenados em 100 partes. Eles
so obtidos de maneira similiar aos quartis e decis, ou seja:

Pnq = xnp n 1
+
100 2

Onde
P: percentil que se deseja obter;
np: nmero do percentil que se deseja obter (1, 2, ..., 99);
x: elemento do conjunto de dados ordenados;
n: tamanho da amostra.

captulo 3 59
Exemplo 3.3: Vamos utilizar os dados do Exemplo 3.1 para encontrar o tri-
gsimo quinto percentil:

2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7

Resoluo:
Para encontrarmos os percentis, precisamos ordenar o conjunto de dados.
Ento:

2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

Trigsimo quinto percentil (P35)

P35 = x3518 1
+
10 2
P35 = x6,8

Portanto, o trigsimo quinto percentil corresponde ao elemento 6,8 no con-


junto de dados ordenados, situados entre as posies 6 e 7. A sexta e a stima
posio so ocupadas pela observao 4, portanto:

P35 = 4

Ento, aproximadamente 35% das observaes so menores ou iguais a 4


minutos.

3.1.2 Clculo dos quartis e percentis para dados agrupados em classes

Podemos encontrar os quartis e decis para dados agrupados em classes, utili-


zando a frmula dos percentis para dados agrupados:

nx x
100 - Faant
Pnx = Li + h
Fi

60 captulo 3
onde
n: nmero de elementos da amostra.
nx: 1, 2, ..., 99;
Li: limite inferior da classe encontrada;
h: amplitude do intervalo;
Faant: frequncia acumulada anterior classe Pi.
Fi: frequncia absoluta da classe encontrada Pi.

CONEXO
Podemos utilizar esta frmula geral, pois Q1= P25, Q2= P50 e Q3 = P75, D1 = P10, D2 = P20, ..., D9 = P90

Exemplo 3.4: Vamos utilizar os dados do Exemplo 2.5 para encontrar o ter-
ceiro quartil, o quinto decil e o dcimo quinto percentil.

TEMPO DE VIDA (DIAS) f P. M. x1 fa

3 18 3 10,5 3

18 33 4 25,5 7

33 48 4 40,5 11

48 63 8 55,5 19

63 78 10 70,5 29

78 93 28 85,5 57

93 108 2 100,5 59

108 123 1 115,5 60

Total 60

captulo 3 61
Resoluo

Terceiro Quartil
Primeiramente, temos que encontrar a classe que contm o terceiro quartil.
Esta classe corresponde classe associada frequncia acumulada imediata-

mente superior
75 fi .
100
75 fi 75 60
Como = = 45 , temos que a classe que contm o pri-
100 100
meiro quartil de 7893 (pois fa = 57).

Alm disso, temos:


60: nmero de elementos da amostra.
nx: 75;
Li: 78;
h: 15;
Faant: 29.
Fi: 28.
Agora, basta substituirmos todos os valores encontrados na frmula 3.4 e
encontrar o valor do terceiro quartil:

nx n
100 - Faant
Pnx = Li + h
Fi

75 60
100 - 29
P75 = 78 + 15
28

45 - 29
P75 = 78 + 15 = 78 + 8,57 @ 86, 6
28

De acordo com o resultado obtido podemos esperar que aproximadamente


25% dos dados so maiores ou iguais a 86,6, ou seja, aproximadamente 25% dos
componentes eletrnicos tm durao superior a 86 dias e 14 horas.

62 captulo 3
Quinto decil
Primeiramente, temos que encontrar a classe que contm o quinto decil.
Esta classe corresponde classe associada frequncia acumulada imediata-

50 fi
mente superior .
100

50 fi 50 x 60
Como = = 30 , temos que a classe que contm o quinto
100 100
decil de 7893 (pois fa = 57).

Alm disso, temos:


60: nmero de elementos da amostra.
nx: 50;
Li: 78;
h: 15;
Faant: 29.
Fi: 28.
w
Agora, basta substituirmos todos os valores encontrados na frmula 3.4 e
encontrar o valor do quinto percentil:

nx n
100 - Faant
Pnx = Li + h
Fi

50 60
100 - 29
P50 = 78 + 15
28

30 - 29
P50 = 78 + 15 = 78 + 0,54 @ 78,5
28

De acordo com o resultado obtido podemos esperar que aproximadamente


50% dos dados so menores ou iguais a 78,5, ou seja, aproximadamente 50%
dos componentes eletrnicos tm durao inferior a 78 dias e 12 horas.
Vale ressaltar que o P50 = Md e este clculo j havia sido feito no exemplo 2.5.

captulo 3 63
Dcimo quinto percentil

Primeiramente, temos que encontrar a classe que contm o dcimo quinto


percentil. Esta classe corresponde classe associada frequncia acumulada

15 fi
imediatamente superior .
100

Como 50 fi 15 x 60
= = 9 , temos que a classe que contm o quinto
100 100
decil de 33 48 (pois fa = 11).

Alm disso, temos:


60: nmero de elementos da amostra.
nx: 15;
Li: 33;
h: 15;
Faant: 7.
Fi: 4.

Agora, basta substituirmos todos os valores encontrados na frmula 3.4 e


encontrar o valor do dcimo quinto percentil:

nx n
100 - Faant
Pnx = Li + h
F i

15 60
100 - 7
P15 = 33 + 15
4

9 - 7
P15 = 33 + 15 = 33 + 7,5 @ 40,5
4

64 captulo 3
De acordo com o resultado obtido podemos esperar que aproximadamente
15% dos dados so menores ou iguais a 40,5, ou seja, aproximadamente 15%
dos componentes eletrnicos tm durao inferior a 40 dias e 12 horas.

3.2 Medidas de Disperso

Para termos uma ideia da importncia de se conhecer as medidas de disperso


para a tomada de decises, vamos analisar o exemplo a seguir.

Exemplo 3.5: Imagine que estamos interessados em fazer uma viagem para
Honolulu (Hava) ou Houston (Texas) e para arrumar as malas necessitamos sa-
ber se a localidade a ser visitada faz calor, faz frio ou ambos. Se tivssemos ape-
nas a informao de que a temperatura mdia diria (medida durante um ano)
das duas localizaes fosse igual a 25 C, poderamos colocar na mala apenas
roupas de vero? A resposta no. Por exemplo, se estivssemos interessados
em viajar para o Hava (em Honolulu), poderamos levar apenas roupas de ve-
ro, pois a temperatura mnima observada durante um ano foi de 21C e a m-
xima foi de 29C. Porm, se resolvermos ir ao Texas (Houston), devemos tomar
cuidado com a poca, pois as temperaturas, durante um ano, variaram de 4C
(mnima) a 38C (mxima). Com estas informaes conclumos que as tempe-
raturas em Honolulu variam pouco em torno da mdia diria, ou seja, podemos
levar uma mala apenas com roupas leves. Porm, em Houston, as temperaturas
variam muito, com perodos de muito frio ou muito calor. Portanto, para ir
Houston sem perigo de sofrer com a temperatura, devemos analisar o perodo
do ano para saber se a temperatura estar alta ou baixa.
Percebemos, atravs deste exemplo bem simples, que uma simples medida
de disperso (a amplitude, por exemplo) j ajudaria muito a tomar certos cuida-
dos com a arrumao das bagagens.
Veremos, nos prximos itens, como calcular e interpretar as seguintes me-
didas de disperso: amplitude, amplitude interquartil, desvio-padro, varincia
e coeficiente de variao.
Primeiramente, vamos apresentar os clculos das medidas de disperso
para dados no-tabulados, ou seja, quando os dados no estiverem na forma de
distribuio de frequncias.

captulo 3 65
ATENO
As medidas de disperso indicam o grau de variabilidade das observaes. Estas medidas pos-
sibilitam que faamos distino entre conjuntos de observaes quanto sua homogeneidade.
Quanto menor as medidas de disperso, mais homogneo o conjunto de dados.

3.2.1 Amplitude Total

A amplitude total a diferena entre o maior e o menor valor observado no con-


junto de dados, ou seja:

R = x(mximo) x(mnimo)

A amplitude no uma medida muito utilizada, pois s leva em conta dois


valores de todo o conjunto de dados e muito influenciada por valores extre-
mos. No prximo item estudaremos uma medida de disperso mais resistente
a valores extremos.

3.2.2 Amplitude Interquartil

A amplitude interquartil, ou distncia interquartil, uma medida de variabili-


dade que no facilmente influenciada por valores discrepantes no conjunto
de dados. Ela engloba 50% das observaes centrais do conjunto de dados e seu
clculo definido como:

Amplitude do interquartil = Q3 Q1

Agora, vamos estudar uma medida de disperso muito utilizada e que leva
em conta todos os valores do conjunto de dados: o desvio-padro.

66 captulo 3
3.2.3 Desvio-Padro

Primeiramente, vamos entender qual a definio da palavra desvio em estats-


tica. Desvio nada mais do que a distncia entre qualquer valor do conjunto de
dados em relao mdia aritmtica deste mesmo conjunto de dados.
Existem vrias medidas de disperso que envolvem os desvios. So elas: o
desvio-padro (mais utilizada), a varincia e o coeficiente de variao.
O desvio-padro a medida mais utilizada na comparao de diferenas
entre grupos, por ser mais precisa e estar na mesma medida do conjunto de
dados. Matematicamente, sua frmula dada pela raiz quadrada da mdia arit-
mtica aproximada dos quadrados dos desvios, ou seja:

n
( xi - x )2 ( x1 - x ) 2 + ( x2 - x ) 2 + + ( xn - x ) 2
i =1
s= =
n -1 n -1

onde xi cada uma das observaes do conjunto de dados, x a mdia do


conjunto de dados e n o nmero total de observaes do conjunto de dados.
Desenvolvendo a frmula (3.7) chegamos a frmula (3.8) que, para alguns ca-
sos, tornam os clculos mais simples e rpidos.

( xi )
2

xi2 -
n
s=
n -1

onde:

xi2 a soma de cada valor da varivel ao quadrado;


( xi )
2
o quadrado da soma de todos os valores da varivel;

n o nmero total de valores do conjunto de dados.

captulo 3 67
Como o desvio-padro uma medida de disperso e mede a variabilidade
entre os valores temos que valores muito prximos resultaro em desvios-pa-
dres pequenos, enquanto que valores mais espalhados resultaro em desvios
-padres maiores.

ATENO
O valor do desvio-padro nunca negativo. zero apenas quando todos os valores do conjunto
de dados so os mesmos. A unidade do desvio-padro a mesma unidade dos dados originais.

3.2.3.1 Uma Regra Prtica para Interpretar o Desvio-Padro


Depois que calculamos o desvio-padro surge uma pergunta: como interpret-lo?
Para conjuntos de dados que tenham distribuio em forma de sino, valem
as seguintes consideraes:
Cerca de 68% das observaes do conjunto de dados ficam a 1 desvio-pa-
dro da mdia, ou seja, (x - s ) e (x + s )
Cerca de 95% das observaes do conjunto de dados ficam a 2 desvios-pa-
dres da mdia, ou seja, (x - 2 s ) e (x + 2 s )
Cerca de 99,7% das observaes do conjunto de dados ficam a 3 desvios
-padres da mdia, ou seja, (x - 3s ) e (x + 3s )

3.2.3.2 Propriedades do desvio-padro


1. Somando-se (ou subtraindo-se) uma constante c de todos os valores de
uma varivel, o desvio padro no se altera:

yi = xi c S y = S x

2. Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por


uma constante (diferente de zero), o desvio padro fica multiplicado
(ou dividido) por essa constante:

xi S
yi = xi c S y = c S x ou yi = Sy = x
c c

68 captulo 3
3.2.4 Varincia (s2)

A varincia de um conjunto de dados nada mais do que o valor do desvio-pa-


dro elevado ao quadrado, ou seja,

n
( xi - x )2
i =1
s2 =
n -1

ou

( xi )
2

x2 -i
n
s2 =
n -1

A varincia no uma medida muito utilizada para mostrar a disperso de


um conjunto de dados, pois, expressa o seu resultado numa medida ao quadra-
do, no sendo possvel interpretar o seu valor. Portanto, na anlise descritiva
dos dados, no vamos trabalhar com esta medida constantemente. Se um de-
terminado problema fornecer a varincia do conjunto de dados, basta calcular-
mos a raiz quadrada deste valor (varincia) e obteremos o desvio-padro, que
facilmente interpretado por estar na mesma medida do conjunto de dados.

3.2.5 Coeficiente de Variao (cv)

O coeficiente de variao (cv) definido como o quociente entre o desvio-pa-


dro e a mdia, e frequentemente expresso em porcentagem. Ele mede o grau
de variabilidade do conjunto de dados. Quando calculamos o desvio-padro,
obtemos um valor que pode ser grande ou pequeno, dependendo da varivel
em estudo. O fato de ele ser um valor considerado alto relativo, pois depen-
dendo da varivel que est sendo estudada e da mdia, esta variao dos dados
pode ser relativamente pequena. Ento, o coeficiente de variao serve para cal-

captulo 3 69
cular o grau de variao dos dados em relao mdia aritmtica. E obtido
atravs do seguinte clculo:

s
cv = 100
x

onde s o desvio-padro e x a mdia aritmtica.

Alguns autores consideram a seguinte regra emprica para a interpretao


do coeficiente de variao:
Baixa disperso: C. V. 15%
Mdia: C. V. 15% 30%
Alta: C. V. 30%

Em geral, o coeficiente de variao uma estatstica til para comparar a


variao para valores originados de diferentes variveis (por exemplo: peso, em
Kg e altura, em cm), pois ele adimensional.

3.2.6 Exemplo de Aplicao das Medidas de Disperso para Dados no Tabulados

Vamos exemplificar o clculo da amplitude, da amplitude interquartil, do des-


vio-padro, da varincia e do coeficiente de variao utilizando o exemplo 2.3,
que apresenta o conjunto de dados brutos.

Exemplo 3.6: Um gerente de banco deseja estudar a movimentao de pes-


soas em sua agncia na segunda semana de um ms qualquer. Ele constata que
no primeiro dia entraram 1348 pessoas, no segundo dia, 1260 pessoas, no ter-
ceiro, 1095, no quarto, 832 e no ltimo dia do levantamento, 850 pessoas. En-
contre a amplitude, o desvio-padro, a varincia e o coeficiente de variao para
este conjunto de dados e interprete os resultados.

70 captulo 3
Resoluo:
A amplitude dada por:

R = x(mximo) x(mnimo) = 1348 832 = 516 pessoas

A diferena, no nmero de pessoas que entram na agncia, entre o dia de


maior movimento e o dia de menor movimento de 516 pessoas.
Para encontrarmos a amplitude interquartil precisamos calcular o primei-
ro e o terceiro quartil. Para isto, vamos seguir os procedimentos descritos no
item 3.1.1.1.
Primeiro quartil (Q1)

Q1 = x15 1
+
4 2
Q1 = x1,75

Portanto, o primeiro quartil est entre os elementos que ocupam a primeira


e a segunda posio do conjunto de dados ordenados. Ento:

x - 832 850 - 832


=
0, 75 1
x - 832 = 13, 5
x = 832 + 13, 5 = 845, 5

Terceiro quartil (Q3)

Q3 = x35 1
+
4 2
Q3 = x4,25

captulo 3 71
Portanto, o terceiro quartil est entre os elementos que ocupam a quarta e a
quinta posio do conjunto de dados ordenados. Ento:

x - 1260 1348 - 1260


=
0, 25 1
x - 1260 = 22
x = 1260 + 22 = 1282
Amplitude interquartil = Q3 - Q1
= 1282 - 845, 5
= 436, 5 pessoas

Ento, a amplitude do intervalo que contm 50% das observaes centrais


436,5 pessoas.
O desvio-padro obtido atravs das frmulas (3.7) ou (3.8). Como a mdia
aritmtica um nmero inteiro e existem poucos dados, a frmula (3.7) mais
rpida de ser calculada. Porm, fica a critrio de cada um a utilizao de uma ou
de outra. Lembrando que a mdia aritmtica encontrada anteriormente igual
a 1077 e utilizando a frmula (3.7), temos:

n
( xi - x )2
i =1
s= =
n -1

=
(1348 -1077 )2 + (1260 -1077 )2 + (1095 -1077 )2 + (832 -1077 )2 + (850 -1077 )2 =
5 -1

=
(271)2 + (183)2 + (18)2 + (-245)2 + (-2227 )2 =
4

=
(73441)+ (33489 )+ (324 )+ (60025)+ (51529 ) =
4
218808
= = 54702 @ 233 , 88 pessoas
4

Neste exemplo, entram na agncia, em mdia, 1077 pessoas por dia. O n-


mero de pessoas que entram na agncia varia, mas, tipicamente, a diferena
em relao mdia foi de aproximadamente 234 pessoas.

72 captulo 3
A varincia, como vimos, obtida atravs das frmulas (3.9) ou (3.10), ou
simplestemente, como j temos o desvio-padro, a varincia o valor que est
dentro da raiz quadrada, ou seja:

s2 = 54.702 pessoas2

No h como interpretar a expresso pessoas2. Por esse motivo, utilizamos o


desvio-padro no lugar da varincia.
O coeficiente de variao, dado pela frmula (3.11), muito fcil de ser obti-
do desde que j conheamos os valores da mdia aritmtica e do desvio-padro.
Pela frmula podemos observar que basta fazermos uma simples diviso. Para
este exemplo temos que:

s 233, 88
cv = = @ 0, 2172 ou 21, 72%
x 1077

Utilizando a regra emprica, podemos dizer que o conjunto de dados apre-


senta uma mdia disperso.
Agora, vamos aprender a calcular as medidas de disperso atravs de da-
dos tabulados.
Quando os dados estiverem na forma tabulada, haver uma pequena dife-
rena no clculo das medidas de disperso, pois agora ser necessrio conside-
rar as frequncias, que funcionaro como fatores de ponderao, referentes
a cada valor da varivel.

3.2.7 Desvio-Padro para Dados Tabulados

Se os dados estiverem tabulados, o desvio-padro pode ser encontrado da se-


guinte forma:

k
( xi - x )2 fi
i =1
s=
n -1

captulo 3 73
Desenvolvendo a frmula (3.12) chegamos a frmula (3.13) que tambm
utilizada para o clculo do desvio-padro:

( xi fi )
2

xi2 fi -
n
s=
n -1

onde, para ambas as frmulas (3.12) e (3.13), xi representa cada uma das
observaes do conjunto de dados ou, se os dados estiverem agrupados em
classes de frequncias, xi representa o ponto mdio da classe, x a mdia do
conjunto de dados, fi a frequncia associada a cada observao (ou classe de
observaes) do conjunto de dados e n o nmero de total de observaes no
conjunto de dados.

3.2.8 Varincia para Dados Tabulados

A varincia de um conjunto de dados agrupados dada por:

k
( xi - x )2 fi
i =1
s2 =
n -1

ou

( xi fi )
2

xi2 fi -
n
s2 =
n -1

A amplitude, a amplitude interquartil e o coeficiente de variao no sofrem


modificaes significativas. A amplitude continua sendo a diferena entre o
maior e o menor valor (se os dados estiverem em classes de frequncias, R ser a
diferena entre o limite superior da ltima classe e o limite inferior da primeira
classe). A amplitude interquartil continua sendo a diferena entre o terceiro e o

74 captulo 3
primeiro quartil e o clculo do coeficiente de variao feito utilizando a frmula
(3.11), porm, se os dados estiverem em classes de frequncias, o desvio-padro e
a mdia aritmtica so obtidos utilizando xi como o ponto mdio da classe.

3.2.9 Exemplos de Aplicaes das Medidas de Disperso para Dados Tabulados

Para demonstrao dos clculos para dados tabelados, vamos continuar utili-
zando os exemplos desenvolvidos no item 2.2 (Exemplos 2.4 e 2.5).

NMERO DE FALTA f
0 31

1 20

2 8

3 2

4 0

5 1

6 1

Total 63

Exemplo 3.7: Em um determinado ms, foi computado o nmero x de faltas


ao trabalho, por motivos de sade, que cada funcionrio de uma determinada
empresa teve. Os dados esto apresentados na tabela abaixo:

Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de varia-


o para este conjunto de dados e interprete os resultados.

captulo 3 75
Resoluo:
A amplitude para este conjunto de dados dada por:

R = x(mximo) x(mnimo) = 6 0 = 6 pessoas

A maior diferena entre os nmeros de faltas ao trabalho, por motivo de


sade, que funcionrios de uma determinada empresa tiveram no perodo de
um ms, 6 faltas.
O desvio-padro obtido atravs das frmulas (3.12) ou (3.13). Para exem-
plificar, vamos trabalhar com a frmula (3.13). Para facilitar, vamos montar um
quadro com os resultados que nos interessa para aplicar tal expresso.

NMERO DE
f xi fi x2i fi
FALTAS (xi )
0 31 0 0

1 20 20 20

2 8 16 32

3 2 6 18

4 0 0 0

5 1 5 25

6 1 6 36

Total ( ) 63 53 131

76 captulo 3
Substituindo os valores encontrados no quadro acima na frmula 3.13, ob-
temos:

( xi fi )
2
(53)
2

xi2 fi -
n
131 -
63
s= = =
n -1 63 -1
2809
131 -
= 63 @ 131 - 44, 59 @
62 62
@ 1, 3938 @ 1,18 faltas

Podemos dizer que, em mdia, ocorre aproximadamente 1 falta por funcio-


nrio, por ms. Na verdade, sabemos que esse nmero de faltas por funcionrio
varia em torno da mdia, mas, tipicamente, a diferena em relao mdia
de, aproximadamente, 1 falta.
A varincia obtida atravs das frmulas (3.14) ou (3.15), porm, como j
temos o desvio-padro, a varincia o valor que est dentro da raiz quadrada.
Portanto, temos:

s2 = 1,3938 faltas2

ATENO
O valor da mdia, calculado anteriormente para este conjunto de dados, igual a 0,84 falta.
Se arredondarmos esse valor para um valor inteiro, podemos dizer que a mdia aproxima-
damente igual a 1 falta.

Como 1,3938 faltas2 no tem interpretao, utilizamos o desvio-padro para


interpretar o comportamento dos dados.
O coeficiente de variao para este exemplo dado por:

s 1,18
cv = = @ 1, 4048 ou 140.48%
x 0, 84

captulo 3 77
O coeficiente de variao nos diz que este conjunto de dados apresenta uma
alta disperso.
Para finalizarmos, vamos fazer os clculos para os dados agrupados em
classes de frequncias. Para isto vamos utilizar o exemplo 2.5 que se encontra
no item 2.2.

Exemplo 3.8: A tabela abaixo apresenta a distribuio de frequncias do


tempo de vida de 60 componentes eletrnicos (medido em dias) submetidos
experimentao num laboratrio especializado.

TEMPO DE PONTO
f
VIDA (DIAS) MDIO (xi )
3 18 3 10,5

18 33 4 25,5

33 48 4 40,5

48 63 8 55,5

63 78 10 70,5

78 93 28 85,5

93 108 2 100,5

108 123 1 115,5

Total 60

Calcule a amplitude, o desvio-padro, a varincia e o coeficiente de variao


para este conjunto de dados e interprete os resultados.

78 captulo 3
Resoluo:
A amplitude para este conjunto de dados dada por:

R = x(mximo) x(mnimo) = 123 3 = 120 dias

A maior diferena entre os tempos de vida (em dias) dos componentes ele-
trnicos foi de 120 dias, ou seja, o componente com maior sobrevivncia durou
120 dias a mais do que o componente que durou menos tempo.
Para o clculo do desvio-padro, podemos utilizar as frmulas (3.12) ou
(3.13), onde o termo xi o ponto mdio de cada classe de frequn-cia. Como a
mdia aritmtica envolve valores decimais, mais simples efetuar os clculos
atravs da frmula (3.13). Como no exemplo anterior, vamos construir um qua-
dro acrescentando as colunas que fornecero os valores que precisamos para
substituir na frmula 3.13.

CLASSES DE PONTO
f xi fi x2i fi
FREQUNCIAS MDIO (xi )
3 18 3 10,5 31,5 330,75

18 33 4 25,5 102 2601

33 48 4 40,5 162 6561

48 63 8 55,5 444 24642

63 78 10 70,5 705 49702,5

78 93 28 85,5 2394 204687

93 108 2 100,5 201 20200,5

108 123 1 115,5 115,5 13340,25

Total 60 4155 322065

captulo 3 79
Com os valores obtidos, temos:

( xi fi )
2
(4155 )
2
xi2 fi -
n
322065 -
60
s= = =
n -1 60 -1
172640025
322065 -
60 322065 - 287733, 75
= @ @
59 59
@ 581, 89 @ 24,12 dias

Em mdia, os componentes eletrnicos tm durao de 69 dias e 6 horas


com uma variao de, aproximadamente, 24 dias e 3 horas para mais ou para
menos com relao mdia.
A varincia, como j sabemos, o desvio-padro ao quadrado. Assim, temos:

s2 = 581,89 dias2

Como 581,89 dias2 no tem interpretao, utilizamos o desvio-padro para


interpretar o comportamento dos dados.
O coeficiente de variao para este exemplo :

s 24,12
cv = = @ 0, 3483 ou 34, 83%
x 69, 25

o que indica uma variabilidade alta no conjunto de dados.

3.3 Grficos

O objetivo da utilizao de grficos em anlise de dados o de facilitar a com-


preenso do fenmeno estatstico por meio do efeito visual imediato que os
grficos proporcionam.

80 captulo 3
CONEXO
Vamos refletir um pouco sobre a necessidade de abordagens pedaggicas para o ensino e a
aprendizagem de grficos acessando o endereo <http://www.ufrrj.br/emanped/paginas/
conteudo_producoes/docs_22/carlos.pdf>.

3.3.1 Tipos de Grficos

Existem vrios tipos de grficos. Os mais usados so: grfico em linhas, diagra-
mas de rea (como por exemplo: grfico em colunas, grfico em barras e grfico
em setores) e grficos para representar as distribuies de frequncias cons-
trudas com intervalos de classes (como por exemplo: polgono de frequncias,
histograma e ogiva).
Segundo VIEIRA(2013, p. 17):

Cada tipo de grfico tem indicao especfica, mas, de acordo com as normas brasileiras:
Todo grfico deve apresentar ttulo e escala;
O ttulo deve ser colocado abaixo da ilustrao.
As escalas devem crescer da esquerda para a direita e de baixo para cima.
As legendas explicativas devem ser colocadas, de preferncia, direita da figura.
Os grficos devem ser numerados, na ordem em que so citados no texto.

Vamos saber um pouco quando usar e como construir cada um destes grficos.

3.3.1.1 Grfico em Linhas


Sempre que os dados estiverem distribudos segundo uma varivel no tempo
(meses, anos, etc.), assim como sucede com os dados do exemplo 3.9 figura 1,
os dados podem, tambm, ser descritos atravs de um grfico em linhas. Esse
tipo de grfico retrata as mudanas nas quantidades com respeito ao tempo
atravs de uma srie de segmentos de reta. muito eficiente para mostrar pos-
sveis tendncias no conjunto de dados.

captulo 3 81
Exemplo 3.9: A tabela 3.1 fornece uma lista do nmero de assinantes de
telefones celulares, em milhes, de 1997 a 2007, do pas X. Construa um grfico
para resumir os dados da tabela abaixo.

ANO ASSINANTES (EM MILHES)


1997 1,1

1998 1,3

1999 1,5

2000 1,9

2001 2,4

2002 2,6

2003 3,1

2004 7,4

2005 18,6

2006 21,5

2007 29

Tabela 3.1 Assinantes de telefones celulares, em milhes, de 1997 a 2007.

O grfico que melhor representa este conjunto de dados o grfico em li-


nhas, j que os dados se reportam a uma srie no tempo (srie temporal). O gr-
fico est ilustrado na figura 1..

82 captulo 3
35

30 29

25
Assinantes (em milhes)

21,5
20 18,6

15

10
7,4
5
1,9 2,4 2,6 3,1
1,1 1,3 1,5
0
1996 1998 2000 2002 2004 2006 2008
Anos

Figura 1 Grfico em linha para os dados de assinantes de telefones celulares.

3.3.1.2 Grfico (ou Diagrama) em Barras (ou Colunas)


Os diagramas em barras (ou colunas) so bastante utilizados quando trabalhamos
com variveis qualitativas (dados categricos). No eixo horizontal especificamos os
nomes das categorias e no eixo vertical construmos uma escala com a frequncia
ou a frequncia relativa. As barras tero bases de mesma largura e alturas iguais
frequncia ou frequncia relativa. O grfico em barras, quando as barras esto
dispostas no sentido vertical, tambm chamado de grfico em colunas.

ATENO
Quando construmos o grfico de barras para variveis qualitativas e as barras so arranja-
das em ordem descendente de altura, a partir da esquerda para a direita, com o atributo que
ocorre com maior frequncia aparecendo em primeiro lugar, denominamos este grfico de
barras de Diagrama de Pareto.

Exemplo 3.10: Uma grande indstria de materiais de construo, com di-


versas lojas espalhadas pelo pas, fez um levantamento das principais causas
de perda de ativos durante o ano de 2007 e as informaes esto dispostas na
tabela seguinte.

captulo 3 83
VALOR PERDIDO
CAUSAS
(MILHES DE REAIS)
M administrao 5,2

Roubos de funcionrios 3,9

Fraudes nas vendas 5,5

Assaltos s lojas 1,8

Perda do estoque 1,6

Atendimento ruim 0,8

Tabela 3.2: Causas de perda de ativos durante o ano de 2007.

Graficamente, podemos representar este conjunto de dados de trs formas


diferentes: grfico em colunas, grfico em barras e o grfico em setores (ou piz-
za ou circular), que ser apresentado no prximo item.

6
Valor perdido (milhes de reais)

0
M administrao

Roubos de funcionrios

Fraudes nas vendas

Assaltos s lojas

Perda do estoque

Atendimento ruim

Causas

Figura 2a Grfico em colunas para a varivel causas de perdas de ativos.

84 captulo 3
Atendimento ruim

Perda do estoque

Causas Assaltos s lojas

Fraudes nas vendas

Roubos de funcionrios

M administrao

0 1 2 3 4 5 6
Valor perdido (milhes de reais)

Figura 2b Grfico em barras para a varivel causas de perdas de ativos.

3.3.1.3 Grfico (ou Diagrama) em Setores


O diagrama em setores, tambm conhecido como grfico de pizza, um dos
grficos mais utilizados para representar variveis qualitativas (ou categricas)
e bastante apropriado quando se deseja visualizar a proporo que cada cate-
goria representa do total.
Vamos utilizar os dados do exemplo 3.10 para mostrar um grfico em setores.

Valor Perdido (milhes de reais)

Atendimento ruim
Perda do estoque 4% M administrao
8% 28%

Assaltos
s lojas
10%

Fraudes nas vendas Roubos de funcionrios


29% 21%

Figura 3 Grfico em setores para a varivel causas de perdas de ativos.

captulo 3 85
Os grficos que sero apresentados a seguir so grficos construdos segun-
do uma distribuio de frequncias com intervalos de classes. So eles: o histo-
grama, o polgono de frequncias e a ogiva.

3.3.1.4 Histograma
Um histograma semelhante ao diagrama de barras, porm refere-se a uma
distribuio de frequncias para dados quantitativos contnuos. Por isso, apre-
senta uma diferena: no h espaos entre as barras. Os intervalos de classes
so colocados no eixo horizontal enquanto as frequncias so colocadas no
eixo vertical. As frequncias podem ser absolutas ou relativas.

Exemplo 3.11: A tabela abaixo apresenta o salrio de funcionrios de uma


empresa no interior de Minas Gerais.

SALRIO (R$) FREQ. ABSOLU TA (f ) FREQ. ACUMULADA (fa )

400,00 800,00 38 38

800,00 1200,00 18 56

1200,00 1600,00 12 68

1600,00 2000,00 8 76

2000,00 2400,00 8 84

2400,00 2800,00 5 89

2800,00 3200,00 3 92

3200,00 3600,00 0 92

3600,00 4000,00 2 94

4000,00 4400,00 0 94

4400,00 4800,00 1 95

Total 95

86 captulo 3
Tabela 3.3 Distribuio de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.

Como os dados da tabela 3.3 esto apresentados em intervalos de classes


podemos represent-los graficamente atravs de um histograma ou do polgo-
no de frequncias, como mostram as figuras 4 e 5, respectivamente.

40
35
30
25
Frequncia

20
15
10
5
0
400,00800,00

800,001200,00

1200,001600,00

1600,002000,00

2000,002400,00

2400,002800,00

2800,003200,00

3200,003600,00

3600,004000,00

4000,004400,00

4400,004800,00
Salrio (R$)

Figura 4 Histograma dos salrios dos funcionrios de uma empresa no interior de Minas
Gerais.

3.3.1.5 Polgono de Frequncias


Podemos dizer que o polgono de frequncias um grfico de linha de uma
distribuio de frequncias. No eixo horizontal so colocados os pontos m-
dios de cada intervalo de classe e no eixo vertical so colocadas as frequncias
absolutas ou relativas (como no histograma). Para se obter as interseces do
polgono com o eixo das abscissas, devemos encontrar o ponto mdio da classe
anterior primeira e o ponto mdio da classe posterior ultima.
O histograma e o polgono de frequncias so grficos alternativos e con-
tm a mesma informao. Fica a critrio de quem est conduzindo o estudo a
escolha de qual deles utilizar.

captulo 3 87
Considerando os dados do Exemplo 3.11, temos o polgono de frequncias
representado pela Figura 5.

40
38
35

30

25
Frequncia

20
18
15
12
10
8 8
5 5
3
2
0 0 0 1 0
0
200 600 1000 1400 1800 2200 2600 3000 3400 3800 4200 4600 5000
Ponto mdio das faixas salariais (R$)

Figura 5 Polgono de frequncias dos salrios dos funcionrios de uma empresa no interior
de Minas Gerais.

3.3.1.6 Ogiva
Uma ogiva um grfico para uma distribuio de frequn-cias acumuladas.
Utilizando o Exemplo 3.11, a terceira coluna traz a frequncia acumulada dos
dados e a ogiva fica representada pela Figura 6.

ATENO
Para construir um grfico de ogiva, devemos usar o limite superior de cada intervalo no eixo
horizontal e a frequncia acumulada no eixo vertical. A frequncia acumulada relacionada
com o limite inferior da primeira classe sempre zero.

88 captulo 3
100

90

80

70

Frequncia Acumulada 60

50

40

30

20

10

0
400 800 1200 1600 2000 2400 2800 3200 3600 4000 4400 4800
Salrio (R$)

Figura 6 Ogiva dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

3.3.1.7 Diagrama de Disperso


O diagrama de disperso um grfico muito utilizado quando temos interes-
se em identificar a associao entre duas variveis quantitativas (X e Y). Para
constru-lo, cada para ordenado colocado em suas determinadas coordena-
das (x,y). Vamos construir um diagrama de disperso utilizando os dados do
exemplo a seguir.

Exemplo 3.12: Uma concessionria de veculos quer verificar a eficcia de


seus anncios em determinado jornal na venda de carros novos. A tabela, a
seguir, mostra o nmero de anncios publicados, por ms, e o correspondente
nmero de carros vendidos nos ltimos seis meses.

NMERO DE ANNCIOS PUBLICADOS (X) NMERO DE CARROS VENDIDOS (Y)

28 140

20 110

22 100
14 75
10 60
7 52

Tabela 3.4 Nmero de anncios publicados e nmero de carros vendidos

captulo 3 89
Para verificarmos, visualmente, se h relao entre o nmero de anncios pu-
blicados e o nmero de carros vendidos, construmos o diagrama de disperso.

160
140
120
Nmero de carros vendidos

100
80
60
40
20
0
0 5 10 15 20 25 30
Nmero de anncios publicados

Figura 7 Diagrama de disperso do nmero de anncios publicados e nmero de carros


vendidos.

Pela anlise grfica observamos que medida que o nmero de anncios


publicados aumenta, ocorre um aumento no nmero de carros vendidos.

ATENO
Um tipo de grfico muito utilizado em jornais e revistas o grfico pictrico. Estes grficos
so construdos a partir de figuras ou conjunto de figuras que so representativas do fe-
nmeno em estudo. Como so representados por figuras, despertam a ateno do leitor.

Como vimos nos itens anteriores, os grficos nos auxiliam no estudo do


comportamento da varivel em estudo no conjunto de dados. Apesar de ser
uma ferramenta eficaz, precisamos tomar cuidado na construo dos grficos
para no obtermos concluses enganosas. Os principais erros na elaborao de
um grfico so:
1. Grfico sucata: neste tipo de grfico, h um uso excessivo de figuras que
podem ocultar a informao que se deseja transmitir.
2. Ausncia de base relativa: quando utilizamos informaes de mais de
um conjunto de dados de tamanhos diferentes em um mesmo grfico,
com o objetivo de fazer comparaes, devemos utilizar a frequncia re-

90 captulo 3
lativa ao invs da frequncia absoluta.
3. Eixo vertical comprimido: as escalas empregadas devem ser coerentes
com o tamanho da figura exibida. Se o eixo vertical estiver comprimido,
as diferenas reais entre as categorias de respostas da varivel podem
ficar distorcidas.
4. Ausncia do ponto zero: a ausncia do ponto zero no eixo vertical ten-
de a produzir uma impresso enganosa do comportamento dos dados,
exagerando ou reduzindo eventuais variaes.

ATIVIDADE
1. Uma agncia de turismo est interessada em saber o perfil dos seus clientes com rela-
o varivel estado civil. Para isso, o gerente desta agncia pediu ao funcionrio do
setor de vendas para fazer um grfico que resuma estas informaes. Construa o grfico
e interprete-o.

ESTADO CIVIL NMERO DE CLIENTES


Solteiro 2600
Casado 900
Vivo 345
Separado 1200
Outros 1020
Total 6065

2. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em


um determinado supermercado no primeiro sbado aps receberem seus pagamentos
(salrios). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e
18h, e anotou os valores gastos por cada um deles. Estes valores esto listados abaixo:

4,89 11,00 5,60 73,85 24,83 98,00 186,00 234,87 58,00 198,65

223,86 341,42 94,76 445,76 82,80 35,00 455,00 371,00 398,60 234,00

64,90 54,98 48,80 68,90 120,32 126,98 76,43 6,35 9,98 12,68

captulo 3 91
243,00 18,65 134,90 11,10 321,09 290,76 74,00 48,80 74,52 138,65

26,00 210,13 15,78 197,45 75,00 76,55 32,78 166,09 105,34 99,10

Analisando o conjunto de dados, responda os seguintes itens:


a) Construa uma distribuio de frequncias a partir do conjunto de dados brutos.
b) Construa um histograma e um polgono de frequncias para a tabela construda no
item b).

3. Analise o grfico abaixo e responda:

50
45
45
40
35
30
Frequncia

25
20 17
15 12
10
5 4 3 3 2
0
500| 800

800| 1100

1100| 1400

1400| 1700

1700| 2100

2100| 2400

2400| 2700

Salrio (R$)

a) Qual a varivel em estudo? Classifique-a.


b) Quantos funcionrios ganham entre R$800,00 (inclusive) e R$1100,00 (exclusive)?
c) Qual o nmero de funcionrios total desta empresa?
d) Qual a porcentagem de funcionrios que ganham R$1700,00 ou mais?
e) Qual a porcentagem de funcionrios que ganham entre R$500,00 (inclusive) e no
mais que R$1100,00?
f) A partir do histograma, monte uma tabela de distribuio de frequncias.

92 captulo 3
4. Os dados abaixo referem-se ao nmero de horas extras de trabalho que uma amostra de
64 funcionrios de uma determinada empresa localizada na capital paulista.

10 10 12 14 14 14 15 16

18 18 18 18 18 19 20 20

20 20 20 21 22 22 22 22

22 22 22 22 22 22 22 22

23 23 24 24 24 24 24 24

24 25 25 25 25 26 26 26

26 26 26 27 27 27 28 28

29 30 30 32 35 36 40 41

Pede-se:
a) Calcule e interprete as seguintes medidas de disperso, calculadas para os dados
brutos (dados no tabulados): amplitude, desvio-padro, varincia e coeficiente de
variao e interprete os resultados.
b) Construir uma distribuio de frequncias completa (com freq. absoluta, freq. relati-
va, freq. acumulada e ponto mdio).
c) Atravs da distribuio de frequncias construda no item b), encontre a amplitude,
o desvio-padro, a varincia e o coeficiente de variao e interprete os resultados.
d) Com a tabela construda no item b), encontre as seguintes medidas: 1 quartil, 7
decil e 99 Percentil. Interprete os resultados.
e) Construa o histograma para este conjunto de dados.

5. Os dados a seguir representam as notas de 5 disciplinas de um determinado candidato


em um concurso pblico. So elas:
2, 5, 8, 8, 9
Calcule a amplitude, o desvio-padro, a varincia e o coeficiente de variao. Interprete
os resultados.

captulo 3 93
6. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com
relao ao nmero de filhos por famlia:

NMERO DE FILHOS 0 1 2 3 4 5

FREQUNCIA DE 19 22 28 16 2 4
FAMLIAS

Calcule e interprete os resultados da:


a) amplitude
b) desvio-padro
c) coeficiente de variao

7. O histograma abaixo representa a distribuio das idades dos funcionrios de uma agn-
cia bancria. Com base no histograma abaixo, responda:

Histograma
16
15
14
13
12
11
10
frequncias

9
8
7
6
5
4
3
2
1
0
2025 2530 3035 3540 4045 4550
Idade

Qual a amplitude, o desvio-padro, a varincia e o coeficiente de variao para as idades


dos funcionrios? Interprete os resultados.

94 captulo 3
8. Um fabricante de caixas de cartolina fabrica trs tipos de caixa. Testa-se a resistncia
de cada caixa, tomando-se uma amostra de 100 caixas e determinando-se a presso
necessria para romper cada caixa. So os seguintes os resultados dos testes:

TIPOS DE CAIXAS A B C
Presso mdia de ruptura (bria) 15 20 30

Desvio-padro das presses (bria) 4 5 6

a) Que tipo de caixa apresenta a menor variao absoluta na presso de ruptura?


b) Que tipo de caixa apresenta a maior variao relativa na presso de ruptura?

REFLEXO
Vimos, nesse captulo, que to importante quanto conhecer a mdia de um conjunto de da-
dos, por exemplo, determinar o seu grau de variabilidade (ou disperso). Na maioria dos
estudos que realizamos, nos deparamos com conjuntos que podem apresentar maior ou
menor grau de homogeneidade.
Conjuntos com caractersticas de maior homogeneidade tendem a nos fornecer informa-
es mais precisas e confiveis. Imagine, por exemplo, um estabelecimento que diariamente
presta atendimento aos seus clientes. Se a quantidade desses clientes varia muito de um dia
para outro, fica mais difcil voc determinar quantos funcionrios disponibilizar para realizar
o atendimento. No entanto, se esse nmero varia pouco (apresenta-se mais homogneo) de
um dia para o outro, fica muito mais fcil montar uma estrutura adequada de atendimento.

LEITURA
Sugerimos a leitura do artigo E se todos fossem ao cinema ao mesmo tempo? do professor
Luiz Barco, disponvel em:<http://super.abril.com.br/ciencia/lei-regularidade-estatistica-se-to-
dos-fossem-ao-mesmo-cinema-ao-mesmo-tempo-439499.shtml>. Ele retrata, de forma bem
interessante, a questo da regularidade dos fenmenos relacionados ao comportamento social.

captulo 3 95
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada admi-
nistrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BRUNI, Adriano L. Estatstica Aplicada Gesto Empresarial. 2.ed. So Paulo: Atlas, 2010.

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003

COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.

DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo es-
tatstica. Rio de Janeiro: LTC, 2003.

TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.

VIEIRA, Sonia. Estatstica Bsica. So Paulo: Cengage Learning, 2013.

NO PRXIMO CAPTULO
No prximo captulo estudaremos uma das tcnicas mais utilizadas da Inferncia Estatstica: Es-
timao Pontual e Estimao Intervalar. Veremos como estimar a mdia populacional a partir da
mdia de uma amostra retirada dessa populao. Nesse tipo de estudo, surgem definies co-
nhecidas como: margem de erro, nvel de confiana da pesquisa, etc. Alm da estimao das
mdias, tambm estudaremos a estimao de propores populacionais. Na construo do inter-
valo de confiana precisamos de conhecimentos sobre a distribuio Normal, cujo conceito tam-
bm ser introduzido no prximo captulo.

96 captulo 3
4
Distribuies
Amostrais e
Estimao
4 Distribuies Amostrais e Estimao
A Inferncia Estatstica um conjunto de tcnicas muito utilizadas em proble-
mas prticos do dia a dia. Com estas tcnicas podemos tirar concluses acerca de
uma populao de interesse utilizando informaes de uma amostra aleatria.
A grande vantagem em se utilizar a Inferncia Estatstica economizar tempo
e dinheiro que seriam gastos para analisar uma populao inteira, ressaltando
que, algumas vezes, impossvel trabalhar com toda a populao de interesse.
Uma das tcnicas mais importante e utilizada da Inferncia Estatstica a Es-
timao.
Veremos neste captulo como estimar uma caracterstica de interesse na popu-
lao atravs da estimao pontual e por intervalo.
Alguns conceitos bsicos necessrios para o desenvolvimento terico das tcni-
cas de Inferncia Estatstica tambm sero apresentados.

OBJETIVOS
Saber estimar tanto a mdia como a proporo populacional (referentes a uma varivel presen-
te na populao) a partir de dados coletados em uma amostra aleatria retirada dessa populao.

REFLEXO
Voc se lembra de j ter ouvido notcias sobre divulgao de resultados de pesquisas em que
foram citados termos como margem de erro e nvel de confiana da pesquisa? Sempre que as
pesquisas so realizadas em amostras, esses conceitos passam a fazer parte dos resultados que
sero obtidos. Vamos compreender melhor o que eles significam e como so determinados.

4.1 Conceitos Bsicos

Parmetro uma quantidade numrica, em geral desconhecida, que descreve


uma caracterstica da populao. Normalmente representado por letras gre-
gas como , e , entre outras.
Estimador uma funo dos valores da amostra que utilizamos para esti-
mar um parmetro populacional. Os estimadores, em geral, so representados

98 captulo 4
por letras gregas com acento circunflexo: q , m
es etc.
Estimativa o valor numrico obtido atravs do estimador.
Erro amostral a diferena entre o resultado amostral e o verdadeiro resulta-
do da populao; tais erros resultam de flutuaes amostrais devidas ao acaso.
Erro no amostral ocorre quando os dados amostrais so coletados, regis-
trados ou analisados incorretamente. Por exemplo: os dados so selecionados
atravs de uma amostra tendenciosa, uso de um instrumento de medida defei-
tuoso ou o registro incorreto dos dados.
Amostra Aleatria Simples (AAS) de tamanho n de uma v.a. X, com determi-
nada distribuio, o conjunto de n v.a.s independentes X1, X2, ..., Xn cada uma
com a mesma distribuio de X.

Populao
Amostra

Parmetro Estatstica

Interferncia Estatstica

Figura 8 Esquema de inferncia sobre um parmetro


Fonte: (MARTINS, 2006).

Como o estimador uma funo de valores da amostra aleatria, ou seja, q


= f (X1, X2, ..., Xn), para diferentes amostras vamos obter valores diferentes para
o estimador q . Portanto, q
tambm uma varivel aleatria. Como uma esti-
mativa para o parmetro populacional pode ser obtida utilizando mais de um
estimador, precisamos estudar algumas propriedades dos estimadores para
decidir qual utilizar. Vamos estudar agora duas propriedades dos estimadores:
vcio e consistncia.
Vcio: um estimador q no viciado para se E( q
) = , ou seja, o valor espe-
rado do estimador igual ao valor do parmetro.

captulo 4 99
Consistncia: um estimador consistente se:
q

^
limE(q) = q
n
^
limVar(q) = 0
n

Podemos observar que um estimador consistente se, quando aumentamos


o tamanho da amostra, o valor esperado do estimador igual ao valor do parme-
tro, portanto, no viciado, e a varincia do estimador convergir para zero.
Dois parmetros populacionais muito importantes e de grande interesse
em se estimar so a mdia e a proporo. Portanto, vamos escolher agora os es-
timadores utilizados para estimar estes dois parmetros de maneira que eles
satisfaam as propriedades de vcio e consistncia.

4.2 Estimador de uma Mdia Populacional

O melhor estimador da mdia populacional a mdia amostral:

1
X = ( X1 + X 2 + ... + X n )
n

Para mostrar que X um estimador no viciado e consistente da mdia po-


pulacional precisamos encontrar E(X) e Var(X) .
Seja X1, X2, ..., Xn uma amostra aleatria retirada de uma populao,
identificada pela varivel X, com mdia e varincia 2 Da definio de
AAS temos que cada Xi, i = 1, 2, ..., n tem a mesma distribuio de X, ou seja,
E(X i )= m e Var(X i )= s 2 .

100 captulo 4
Pelas propriedades da esperana e da varincia temos:

X + X 2 + ... + X n 1
E( X ) = E 1 = n
E ( X1 ) + E ( X 2 ) + ... + E ( X n )

n
1 nm
= [m + m + ... + m] = =m
n n

X + X 2 + ... + X n 1
Var ( X ) = Var 1 = n 2
Var ( X1 ) + Var ( X 2 ) + ... + Var ( X n )

n
1 ns2 s2
= 2 [s 2 + s 2 + ... + s2 ] = 2 =
n n n

O primeiro resultado mostra que a mdia amostral um estimador no


viciado da mdia populacional. O segundo resultado mostra que, conforme n
cresce, a varincia da mdia amostral tende a zero, portanto X um estimador
consistente para .

Exemplo 4.1: Uma amostra aleatria de 20 famlias de determinado bairro


foi selecionada e observou-se o nmero de pessoas em cada famlia com nvel
superior completo. Os dados obtidos foram:

1, 2, 2, 0, 3, 1, 1, 3, 0, 1, 2, 2, 1, 3, 1, 0, 2, 1, 1, 2

Encontre a estimativa para a mdia de pessoas com nvel superior completo


neste bairro.

captulo 4 101
Resoluo:
Pelo que vimos na teoria, o estimador utilizado para se estimar a mdia po-
pulacional a mdia amostral, ou seja:

1
X= (1 + 2 + 2 + 0 + ... + 2)
20
29
= @ 0, 97
30

Ento, podemos concluir que, neste bairro, aproximadamente 1 pessoa


possui nvel superior completo.

4.3 Estimador de uma Proporo Populacional

O melhor estimador da proporo populacional p a proporo amostral:

p = nmero de indivduos na amostra com determinada caracterrstica


n

Se definirmos uma varivel aleatria Xi como:

1 , se o indivduo apresenta a caracterstica


Xi =
0 , se o indivduo no apresenta a caracterstica

podemos reescrever frmula da proporo amostral como:

n X
p = X1 + X 2 + ... + X n =
n
ni = X
i =1

Portanto, o estimador da proporo populacional uma mdia de variveis


aleatrias convenientemente definidas.

102 captulo 4
ATENO
A distribuio de Bernoulli uma distribuio de probabilidade discreta com as seguintes
caractersticas: o experimento realizado somente uma vez e a v.a. X assume apenas dois
valores, P(sucesso) = P(X = 1) = p e P (fracasso) = P(X = 0) = 1 p, com E(X) = p e VAR(X)
= 1 p.

Seja X1, X2, ..., Xn uma sequncia de variveis aleatrias independentes com
distribuio de Bernoulli. Pelas propriedades da esperana e da varincia temos:

() X + X 2 + ... + X n 1
E p = E 1
n E ( X1 ) + E ( X 2 ) + ... + E ( X n )
= n


1 np
= [p + p + ... + p] = =p
n n

() X + X 2 + ... + X n 1
Var p = Var 1
n = n 2

Var ( X1 ) + Var ( X 2 ) + ... + E ( X n )

1 np (1 - p ) p (1- p )
= 2 [ p (1 - p ) + p (1 - p ) + ... + p (1 - p )] = =
n n2 n

Como no caso do estimador X vemos que p um estimador no viciado



pois E( p ) = p e consistente pois, a medida que n aumenta, a varincia da pro-
poro amostral tende a zero.

Exemplo 4.2: Uma determinada academia, interessada em abrir uma filial


em certo bairro, selecionou uma amostra aleatria de 30 adultos e perguntou
se a pessoa fazia atividades fsicas pelo menos 3 vezes por semana. As respostas
foram classificadas da seguinte maneira: foi atribudo o valor 1 se a pessoa res-
pondeu sim e 0 se a pessoa respondeu no. Os resultados so:

0 1 0 0 1 1 1 1 1 0 1 1 0 0 0
1 0 0 1 1 0 1 0 0 1 0 1 1 1 0

captulo 4 103
Obtenha (estime) a proporo de pessoas, neste bairro, que fazem ativida-
des fsicas pelo menos trs vezes por semana.
Para estimarmos esta proporo utilizamos a proporo amostral dada por:

p = 0 +1 + 0 + 0 +1 + ... + 0 = 16 = 0, 5333
30 30

Portanto, baseado nesta amostra, aproximadamente 53,33% das pessoas


deste bairro fazem atividade fsica pelo menos trs vezes por semana.
Antes de passarmos para o conceito de distribuies amostrais e estimao
intervalar vamos estudar as caractersticas de uma varivel aleatria cuja distri-
buio Normal. Precisaremos do conceito da distribuio Normal para cons-
truir intervalos de confiana.

4.4 Propriedades da Distribuio Normal

A distribuio normal uma distribuio contnua de probabilidade de uma


varivel aleatria X. Seu grfico chamado de curva normal.
Segundo LARSON (2004, p. 160), a distribuio normal tem as seguintes
propriedades:
1. A mdia, a mediana e a moda so iguais.
2. A curva normal tem formato de sino e simtrica em torno da mdia.
3. A rea total sob a curva normal igual a 1.
4. A curva normal aproxima-se mais do eixo x medida que se afasta da
mdia em ambos os lados, mas nunca toca o eixo.

Dois parmetros, e , determinam completamente o aspecto de uma cur-


va normal. A mdia () informa a localizao do eixo de simetria e o desvio pa-
dro () descreve quanto os dados se espalham em torno da mdia.

104 captulo 4
0,9 a

0,8 = 0, 2 = 0,2
0,7 = 0, 2 = 1,0
= 0, 2 = 5,0
0,6 d
= 2, 2 = 0,5
0,5
b
0,4

0,3

0,2 c
0,1

0
5 4 3 2 1 0 1 2 3 4 5

Figura 9 Distribuies Normais, N (, 2)


Fonte:<http://www.cultura.ufpa.br/dicas/biome/bionor.htm>.

As curvas normais a, b e c apresentam mdias iguais (por isto esto locali-


zadas na mesma posio no eixo x), mas apresentam desvios padro diferentes
(por isto a curva c, que apresenta maior desvio padro, mais achatada e a curva
a, que apresenta menor desvio padro, mais fechada em torno da mdia).
A curva d apresenta mdia diferente das outras curvas, por isto est localiza-
da numa posio diferente no eixo x.

4.5 Distribuies Amostrais

Estudamos como determinar os estimadores da mdia e da proporo popu-


lacional. Encontramos o valor esperado e a varincia de cada estimador sem
especificar a sua distribuio.
Agora vamos obter informao sobre a forma da distribuio dos estimado-
res da mdia e da proporo.
A distribuio amostral de um estimador a distribuio de todos os va-
lores do estimador quando todas as amostras possveis de mesmo tamanho n
so extradas da mesma populao. A distribuio amostral de um estimador
representada, frequentemente, atravs de uma tabela ou de um histograma.

captulo 4 105
4.5.1 Distribuio Amostral da Mdia

Para encontrar a distribuio amostral da mdia utilizaremos um resultado


fundamental na teoria da Inferncia Estatstica, conhecido como Teorema do
Limite Central.

Teorema do Limite Central (TLC)


Para amostras aleatrias simples (X1, X2, ..., Xn), selecionadas de uma popu-
lao com mdia e varincia 2 finita, a distribuio amostral da mdia X
pode ser aproximada, para n grande, pela distribuio normal, com mdia e
varincia 2/n (desvio padro, 2/ n ).
Observao: para amostras com 30 elementos ou mais a aproximao con-
siderada boa.
Se a populao normal N(, 2), a distribuio amostral da mdia tem
distribuio exata normal com mdia e varincia 2/n para qualquer tamanho
de amostra.

Na aplicao do teorema do limite central, o resultado supe que a popu-


lao seja infinitamente grande. Quando trabalhamos com amostragem com reposio,
a populao infinitamente grande. Agora, em populaes finitas, cuja amostragem
feita sem reposio, precisamos fazer um ajuste no resultado . Vamos
utilizar a seguinte regra emprica:
Quando a amostragem for sem reposio e o tamanho amostral n for maior que 5% do
tamanho finito N da populao, ou seja, n > 0,05 N, devemos ajustar o desvio padro
das mdias amostrais multiplicando-o pelo fator de correo para populao finita:

106 captulo 4
4.5.2 Distribuio amostral da proporo

No item 4.3 vimos que o estimador da proporo populacional uma mdia de


v.as, ou seja,

p = X1 + X 2 + ... + X n = X
n

Portanto, para n grande podemos considerar a distribuio amostral de p


como aproximadamente normal:

p ~ N p, p (1- p )

n

4.6 Erro Padro de um Estimador

Seja um estimador do parmetro . O erro padro de q


q a quantidade:

) = Var (q
EP(q )

Em palavras, o erro padro avalia a preciso do clculo do estimador popu-


lacional.
No caso da mdia amostral, que estimador da mdia populacional, temos:

s2 s
EP(X) = =
n n

Como , em geral, desconhecido podemos obter o erro padro estimado


de X , ou seja:

s2 s
EP(X) = =
n n

captulo 4 107
onde s2 a varincia amostral.
No caso da proporo amostral, que o estimador da proporo populacio-
nal, temos:

p (1 - p )
EP( p ) =
n

Quando no conhecemos p obtemos o erro padro estimado de p substi-


tuindo p por
p:

p ) =
EP(
(
p 1 - p
)
n

Os estimadores vistos at agora so pontuais, ou seja, produzem um nico


valor como estimativa do parmetro. Se quisermos medir a preciso da estima-
tiva obtida podemos construir intervalos de confiana que so baseados na dis-
tribuio amostral do estimador pontual.
A um intervalo de confiana est associado um nvel de confiana 1 que
fornece a probabilidade de que o intervalo incluir o verdadeiro parmetro po-
pulacional em vrias amostras repetidas.
Devemos tomar bastante cuidado na interpretao do intervalo de con-
fiana. Uma interpretao conveniente a seguinte: se selecionarmos vrias
amostras de mesmo tamanho e calcularmos, para cada uma delas, os corres-
pondentes intervalos de confiana com nvel de confiana 1 , esperamos que
a proporo de intervalos que contenham o valor do parmetro populacional
seja igual a 1 . Por exemplo, se selecionarmos 100 amostras de mesmo tama-
nho e construirmos seus respectivos intervalos de confiana, 95 intervalos iro
conter o verdadeiro valor do parmetro populacional.

108 captulo 4
Valor do parmetro da populao desconhecido

Figura 10 intervalos de confiana para o parmetro populacional

As escolhas mais comuns para o nvel de confiana e, consequentemente,


os respectivos valores crticos obtidos da distribuio normal so:

NVEL DE
CONFIANA VALOR CRTICO Z/2

90% 0,10 1,645

95% 0,05 1,96

99% 0,01 2,575

A escolha de 95% a mais comum porque resulta em um bom equilbrio en-


tre preciso (que refletido na largura do intevalo de confiana) e confiabilida-
de (conforme expresso pelo nvel de confiana). Dependendo da necessidade,
o nvel de confiana pode superar 99%. No entanto, quanto maior esse nvel,

captulo 4 109
maior tambm ser a margem de erro, que significa perda na preciso dos re-
sultados. Portanto, necessrio dosar nvel de confiana e margem de erro,
para se chegar aos resultados mais apropriados.

ATENO
De acordo com TRIOLA (2008, p. 255) , um valor crtico um nmero na fronteira que
separa estatsticas amostrais que tm chance de ocorrer daquelas que no tem. O nmero
Z/2 um valor crtico que um escore z com a propriedade de separar uma rea de /2 na
cauda direita da distribuio normal padronizada.

4.7 Intervalos de Confiana para a Mdia Populacional

Podemos construir intervalos de confiana para a mdia populacional consi-


derando 2 casos: conhecido ou desconhecido. Estudaremos cada um dos
casos a seguir.

1 CASO Com conhecido


Para construirmos um intervalo de confiana para a mdia populacional
com conhecido temos que verificar os seguintes requisitos:
1. A amostra em estudo uma amostra aleatria simples.
2. O valor do desvio padro populacional, , conhecido.
3. Uma ou ambas as condies so satisfeitas: a populao normalmente
distribuda ou n > 30.

Um intervalo de confiana para a mdia populacional, verificado os requisi-


tos acima, dado por:

s
x za / 2
n

onde 1 o nvel de confiana e za / 2 o valor tabelado da distribuio


normal padronizada.
s
O valor obtido de za / 2 chamado margem de erro ou erro mximo
da estimativa. n

110 captulo 4
2 CASO Com desconhecido
Para construirmos um intervalo de confiana para a mdia populacional
com desconhecido temos que verificar os seguintes requisitos:
1. A amostra em estudo uma amostra aleatria simples.

ATENO
Quando coletamos um conjunto de dados amostrais para estimar um parmetro populacional,
o valor obtido pelo estimador deste parmetro tipicamente diferente do valor do parmetro. A
diferena entre estes dois valores chamada margem de erro ou erro mximo de estimativa, ou
seja, a diferena mxima provvel entre a estimativa obtida atravs do estimador e o verdadeiro
valor do parmetro populacional.

2. Uma ou ambas as condies so satisfeitas: a populao normalmente


distribuda ou n > 30.

Um intervalo de confiana para a mdia populacional, verificado os requisi-


tos acima, dado por:

s
x ta / 2
n

onde 1 o nvel de confiana, ta / 2 o valor tabelado da distribuio t de


Student com n 1 graus de liberdade e s o desvio-padro amostral.
s
O valor obtido de ta / 2 chamado margem de erro ou erro mximo da
n
estimativa.
A forma da distribuio t de Student parecida com a da distribuio nor-
mal: tem mdia t = 0, como a distribuio normal padronizada, com mdia z =
0; simtrica mas apresenta caudas mais alongadas, ou seja, maior variabilida-
de do que a normal. Quando aumentamos o tamanho da amostra, a distribui-
o t de Student tende para a distribuio normal.
O quadro a seguir resume os Casos 1 e 2.

captulo 4 111
DISTRIBUIO CONDIES
conhecido e populao normalmente
Use a distribuio normal (z)
distribuda ou conhecido e n > 30

desconhecido e populao normalmen-


Use a distribuio t te distribuda ou desconhecido e n >
30

Use um mtodo no paramtrico ou Populao no normalmente distribuda


bootstrap en 30

Notas: 1. Critrios para decidir se a populao ou no normalmente distribuda: A


populao no precisa ser exatamente normal, mas deve parecer simtrica de algu-
ma forma, com uma nica moda e sem outliers.
2. Tamanho amostral n > 30: Essa uma diretriz comumentemente usada, mas tama-
nhos amostrais de 15 a 30 so adequados se a populao parecer ter uma distribuio
que no se afasta muito da normal e se no h outliers. Para algumas distribuies
populacionais que se afastam extremamente da normal, o tamanho amostral pode pre-
cisar ser maior do que 50, ou mesmo 100.

Quadro 4.1 Escolha entre z e t


Fonte: (TRIOLA, 2008, p. 280).

4.8 Intervalos de Confiana para a Proporo Populacional

Vimos na distribuio amostral do estimador p que, para n grande,

p ~ N p, p (1- p )

n

112 captulo 4
Verificados os requisitos, temos que um intervalo de confiana para a pro-
poro dado por:


p z p (1 - p )
a /2
n

onde 1 o nvel de confiana e za /2 o valor tabelado da distribuio


normal padronizada.
p (1 - p )
O valor obtido de za /2 chamado margem de erro ou erro m-
n
ximo da estimativa.

CONEXO
Os requisitos necessrios para a costruo de intervalos de confiana para a proporo po-
pulacionam exigem conhecimento da distribuio de probabilidade Binomial. Para isto, leia a
Seo 7.2 Estimao da Proporo Populacional, em (TRIOLA, 2008, p. 252).

Exemplo 4.3: De uma amostra de 40 observaes de uma populao normal


com mdia desconhecida e desvio-padro =5, obtemos uma mdia amostral
x = 25.
Construir um intervalo de 95% de confiana para a mdia populacional.

Resoluo:

Neste exemplo vamos usar a frmula do intervalo de confiana descrito no


1 CASO. Os dados que o exerccio fornece so:

x = 25; n = 40; s = 5; 1 - a = 0, 95;


a = 0, 05; a /2 = 0,025; za / 2 = 1, 96

captulo 4 113
Substituindo na frmula temos:

s s
x - za / 2 ; x + za / 2
n n
5 5
25 -1, 96 ; 25 +1, 96
40 40
9, 8 9, 8
25 - 6, 3246 ; 25 + 6, 3246

[25 -1, 5495 ; 25 +1, 5495]
[23, 4505 ; 26, 5495]

Podemos interpretar este intervalo da seguinte maneira: estamos 95% con-


fiantes que o intervalo de 23,4505 a 26,5495 realmente contenha o verdadeiro
valor de . Ou ainda, se selecionssemos muitas amostras diferentes de tama-
nho 40 e construssemos os intervalos de confiana como fizemos aqui, 95%
deles conteriam realmente o valor da mdia populacional .

Exemplo 4.4: Uma amostra de tamanho 15, extrada de uma populao nor-
mal, fornece uma mdia amostral x = 23 e s = 0,5. Construir um intervalo de
90% de confiana para a mdia populacional.

Resoluo:

Vamos usar o intervalo de confiana descrito no 2 CASO, pois temos uma


populao normal com desconhecido. Os dados so:

x = 23, 5; n = 15; S = 0, 5; 1 - a = 0, 9; a = 0,1;


a /2 = 0,05; ta / 2 = 1, 761; n -1 = 14

114 captulo 4
Usando a frmula:

S S
x - ta / 2 ; x + ta / 2
n n
0, 5 0, 5
23, 5 -1, 761 ; 23, 5 +1, 761
15 15
0, 8805 0, 8805
23, 5 - 3, 8730 ; 23, 5 + 3, 8730

[23, 5 - 0, 2273 ; 23, 5 + 0, 2273]
[23, 2727 ; 23, 7273]

Exemplo 4.5: Em uma cidade foram entrevistadas 2.000 pessoas e constatou-se


que 1.200 esto satisfeitas com o atual prefeito. Construir um intervalo de 95% de
confiana para a proporo populacional que est satisfeita com o atual prefeito.

Resoluo:
Os dados so:

p = 1.200 = 0, 6; 1 - p = 0, 4; n = 2.000; 1 - a = 0, 95;


2.000
a = 0, 05; a /2 = 0,025; za / 2 = 1, 96

Um intervalo de 95% de confiana para a proporo populacional dado por:

S S
p - za / 2 ; p + za / 2
n n
0, 6 0, 4 0, 6 0, 4
0, 6 -1, 96 ; 0, 6 +1, 96
2.000 2.000
[0, 6 -1, 96 0, 01095 ; 0, 6 +1, 96 0, 01095]
[0, 6 - 0, 021462 ; 0, 6 + 0, 021462]
[0, 57854 ; 0, 62146]

Se quisermos um intervalo de 95% de confiana para a porcentagem popula-


cional podemos expressar este resultado como [57,85% ; 62,15%].

captulo 4 115
ATENO
Podemos interpretar este intervalo da seguinte maneira: entre os moradores desta cidade, a por-
centagem dos que esto satisfeitos com o atual prefeito estimada em 60%, com uma margem
de erro de 2,15%.

ATIVIDADE
1. Uma agncia de publicidade est interessada em estimar a idade mdia em que os adoles-
centes comeam a fumar. Uma amostra aleatria de 25 fumantes, extrada de uma popu-
lao normal, forneceu uma mdia amostral de 15 anos e um desvio-padro amostral de
1,7 ano. Construir um intervalo de 99% de confiana para estimar a idade mdia em que
a populao adolescente comea a fumar. Determine a margem de erro e o erro padro
estimado da mdia.

2. 02. A fim de averiguar a popularidade da gesto da nova reitoria de determinada universi-


dade, uma amostra aleatria de 400 estudantes foi selecionada e constatou-se que 45%
estavam satisfeitos com a nova gesto.
a) Obtenha o erro padro estimado da proporo;
b) Determine o intervalo de 95% de confiana para a proporo populacional.

3. Os dados abaixo referem-se ao nmero de horas semanais que os estudantes do primeiro


semestre de administrao passaram se preparando para o exame de Estatstica.

1 1 1 2 2 2 3 3 4 4 4 4 4 4 5 5 5 6
6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 8 8

Determine:
a) o erro padro estimado da mdia;
b) o intervalo de 96% de confiana para a mdia populacional.

4. Dos 1.600 funcionrios entrevistados numa empresa, 880 esto de acordo com a nova
poltica salarial. Construir um intervalo de 98% de confiana para a proporo populacional
dos funcionrios desta empresa favorveis nova poltica salarial.

116 captulo 4
5. Para se avaliar a popularidade de certo candidato prxima eleio para prefeito de de-
terminada cidade, extraiu-se uma amostra aleatria de 1.000 eleitores e constatou-se que
400 votariam no candidato. Estimar a proporo de eleitores em toda a cidade que tm a
inteno de votar no candidato. Encontre o erro padro estimado da proporo.

REFLEXO
Vimos que possvel encontrar a melhor estimativa pontual da mdia e da proporo, mas
no temos indicao de quo boa esta nossa melhor estimativa. Para contornar isto, utili-
zamos a estimativa intervalar, ou intervalo de confiana, que consiste em uma faixa de valores
em vez de apenas um nico valor. Como dissemos anteriormente, precisamos ser cuidado-
sos para interpretar corretamente os intervalos de confiana. Na interpretao correta, o nvel
de confiana se refere taxa de sucesso do processo em uso para se estimar o parmetro
populacional e no a chance de que o verdadeiro valor do parmetro esteja entre os limites
do intervalo de confiana. Por exemplo, um nvel de confiana de 95% nos diz que o processo
em uso resultar, a longo prazo, em limites de intervalo de confiana que contenham o ver-
dadeiro valor do parmetro populacional 95% das vezes.

LEITURA
Sugerimos que voc oua os udios que esto no seguinte endereo: <http://m3.ime.uni-
camp.br/recursos/1288>. Nestes udios voc aprender o significado da expresso mar-
gem de erro no contexto da Matemtica.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada admi-
nistrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo estats-
tica. Rio de Janeiro,: LTC, 2003.

captulo 4 117
LARSON, R; FARBER, Betsy. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.

SMAILES, Joanne; McGRANE, Angela. Estatstica aplicada administrao com Excel. So Pau-
lo: Atlas, 2002.

SPIEGEL, Murray R.. Estatstica. So Paulo: Makron Books, 1993.

TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 2008.

NO PRXIMO CAPTULO
Neste captulo estudamos a tcnica de Estimao, uma das mais importantes da inferncia
estatstica. Usando dados amostrais, aprendemos a obter estimativas pontuais e intervalares
para parmetros populacionais importantes: mdia e proporo. Para a construo de inter-
valos de confianas vimos que precisamos encontrar valores crticos da distribuio normal
padro ou da distribuio t-student.
No prximo captulo estudaremos outra tcnica da inferncia estatstica: teste de hiptese.
E, nos aprofundaremos no estudo da distribuio normal.

118 captulo 4
5
Distribuio Normal
e Teste de Hiptese
5 Distribuio Normal e Teste de Hiptese
Neste captulo estudaremos a distribuio de probabilidade mais importante
em Estatstica: a distribuio normal. As distribuies normais podem ser usa-
das para modelar muitos conjuntos de medidas na natureza, na indstria e no
comrcio. Por exemplo, a altura de uma determinada populao ou a durao
de aparelhos de televiso segue, em geral, uma distribuio normal.
Ao finalizarmos o conceito da distribuilao normal aprenderemos outra tcni-
ca da inferncia estatstica, alm da estimao, muito utilizada: teste de hipte-
se. Veremos as caractersticas dos testes paramtricos e no paramtricos, bem
como os procedimentos necessrios para a construo de um teste de hiptese.

OBJETIVOS
Identificar situaes nas quais podemos aplicar o modelo de probabilidade normal, bem
como calcular probabilidades associadas a tal modelo.
Compreender quais so as etapas necessrias para a realizao de um teste de hiptese.

REFLEXO
Voc se lembra de ter ouvido de alguma companhia de transporte que, em mdia, o
intervalo entre sucessivos nibus de 20 minutos? Aprenderemos neste captulo como
podemos testar a afimartiva da companhia utilizando o conceito de teste de hiptese.
Antes de iniciarmos o estudo da distribuio normal, importante a compreenso do
conceito de varivel aleatria.

5.1 Varivel Aleatria

Uma varivel aleatria (v.a.) uma varivel que associa um valor numrico a
cada ponto do espao amostral. Ela denominada discreta quando pode assu-
mir apenas um nmero finito ou infinito enumervel de valores e dita cont-
nua quando assume valores num intervalo da reta real.
comum utilizarmos letras latinas para representarmos variveis aleatrias.

120 captulo 5
Quando trabalhamos com uma v.a. que pode assumir valores num intervalo
de nmeros reais, como mensurao de peso, altura e temperatura, estamos
lidando com uma distribuio contnua de probabilidade. Em distribuies
deste tipo podemos construir uma curva contnua que a representao grfica
da funo densidade de probabilidade, usualmente designada por f(x).

5.2 Funo Densidade de Probabilidade

Uma funo f(x) uma funo densidade de probabilidade (f.d.p.) para uma
v.a. contnua X se satisfaz as condies:
f(x) 0 para todo x (- , );
a rea definida por f(x) igual a 1;
P(X = x0) = 0, ou seja, a probabilidade da v.a. assumir um valor pontual zero.

O valor esperado e a varincia de uma v.a. contnua so definidos, respecti-


vamente, por:


E (X )= x f (x )dx
-
e
Var (X )= E (X 2 )-
E (X )
2


onde E (X )= x f (x )dx . Essa expresso uma integral que um con-
-

ceito matemtico cuja compreenso no nada elementar. Mas no se preocu-


pe, pois no teremos que saber como calcul-la.

5.3 Modelo Probabilstico para Variveis Aleatrias Contnuas

Estudaremos aqui a distribuio de probabilidade mais importante: A Distribui-


o Normal. Esta distribuio desempenha papel fundamental na Inferncia
Estatstica. A curva da funo densidade de probabilidade desta distribuio
conhecida por muitos como a curva em forma de sino.

captulo 5 121
5.3.1 Distribuio Normal

A Distribuio Normal tem funo densidade de probabilidade dada por

1
f (x )= exp-(x - m ) / 2s ,
2
- < x <
2

s 2p

em que e 2 so os parmetros da distribuio.

A Figura 11 ilustra uma curva normal tpica:

+ x

Figura 11 f.d.p. de uma v.a. Normal com mdia e desvio-padro .

Representaremos v.a.s com distribuio normal por X ~ N (, 2).


As principais caractersticas da distribuio normal so:
o ponto de mximo de f(x) o ponto x = ;
os pontos de inflexo so: x = + e x = ;
a curva simtrica com relao a ;
f(x) 0 quando x .

Para se obter o clculo de probabilidades de uma v.a. X ~ N (, 2) devemos


resolver a integral da funo densidade de probabilidade no intervalo de inte-
resse, isto ,

b
P (a X b )= f (x )dx
a

122 captulo 5
onde a integral indica a rea sob a curva da densidade entre os pontos a e b.

0 a b x

Figura 12 rea sob a curva normal, no intervalo de a a b

Esta integral s pode ser resolvida, aproximadamente, por meio de integra-


o numrica. Para contornar esta dificuldade, as probabilidades para a distri-
buio normal so calculadas com o auxlio de tabelas. Para isto, utilizamos
uma transformao da v.a. X em uma v.a. Z definida por:

X -m
Z=
s

onde = mdia e = desvio padro.

Esta nova varivel denominada de varivel normal padronizada com m-


dia 0 e varincia 1, ou seja, Z ~N (0, 1)

1 0 1 z

Figura 13 f.d.p. de uma v.a. Z ~ N(0,1)

captulo 5 123
A tabela fornecida no final do livro, utilizada nos clculos das probabilida-
des, nos d a P(0 Z zc) = P, isto ,

0 z z

Figura 14 rea correspondente P(0 Z zc) fornecida pela tabela

ATENO
A caracterstica de simetria da distribuio normal implica que a probabilidade de estar acima
(ou abaixo) de zero 0,5, ou seja, P(Z 0) = 0,5 = P( Z 0).

Exemplo 5.1: As vendas mensais de determinado produto tm distribuio


aproximadamente normal, com mdia 500 unidades e desvio-padro 50 unidades.
Determine as probabilidades de que, em um ms, as vendas do produto sejam:
a) no mximo 530 unidades;
b) no mnimo 460 unidades;
c) entre 450 e 550 unidades;
d) no mnimo 530 unidades.

ATENO
O enunciado desse exemplo forneceu o valor do desvio-padro que, por definio, a raiz
quadrada da varincia. Portanto, 2 = 502 = 2.500 unidades.

124 captulo 5
Resoluo:
Vamos definir a v.a. como sendo X: vendas mensais de determinado produto.
Portanto, X ~ N(500,2500).

a) P(X 530)

Para calcularmos esta probabilidade, vamos transformar a v.a. X na v.a. Z


para podermos usar a tabela.

X - m 530 - 500 30
Z= = = = 0, 6
s 50 50

0,6 z

Portanto,
P(X 530) = P(Z 0,6) =0,5 + P(0 Z 0,6) = 0,5 + 0,2257= 0,7257
O valor 0,5 vem do fato que P(Z 0) = 0,5.

b) P(X 460)

Usando a transformao:

X - m 460 - 500
Z= = = 40 / 50 =- 0, 8
s 50

captulo 5 125
-0,8 0 z

Portanto,
P(X 460) = P(Z 0,8) = P(0,8 Z 0) + 0,5 = 0,2881 + 0,5 = 0,7881
Observao.: Devido simetria da distribuio normal temos que
P(0,8 Z 0) = P(0 Z 0,8) e, como no item anterior, o valor 0,5 vem do fato
que P(Z 0) =0,5.

c) P(450 X 550)

Transformando:

X - m 450 - 500 50
Z1 = = = =-1
s 50 50
X - m 550 - 500 50
Z2 = = = =1
s 50 50

1 0 +1 z

P(450 X 550) = P(1 Z 1) = P(1 Z 0) + P(0 Z 1) =


0,3413 + 0,3413 = 0,3826
Observao: Devido simetria P(1 Z 0) + P(0 Z 1).

126 captulo 5
d) P(X 530)

Para calcularmos esta probabilidade, vamos transformar a


v.a. X na v.a. Z para podermos usar a tabela.

X - m 530 - 500 30
Z= = = = 0, 6
s 50 50

Portanto,
P(X 530) = P(Z 0,6) =0,5 P(0 Z 0,6) = 0,5 0,2257= 0,2743
O valor 0,5 vem do fato que P(Z 0) =0,5

Exemplo 5.2: O tempo de vida mdio de certo aparelho de dez anos, com
desvio-padro de 1,5 ano. O fabricante substitui os aparelhos que acusam de-
feito dentro do prazo de garantia. Qual deve ser o prazo de garantia para que a
porcentagem de aparelhos substitudos seja no mximo 5%?

Resoluo
X: tempo de vida do aparelho
X ~N (10, 2,25)

Neste exerccio queremos encontrar Xc: prazo de garantia para que no mxi-
mo 5% dos aparelhos produzidos sejam substitudos dentro desse prazo. Observe
que o exerccio j forneceu a probabilidade e queremos encontrar qual o valor
correspondente a esta probabilidade, isto ,

P(X Xc) =0,05

Transformando na v.a. Z temos P(Z Zc) =0,5 e procurando no corpo da tabe-


la 0,45 (0,5-0,05) encontramos Zc = 1,645.

captulo 5 127
0,05
z = 1,645 0 z

Portanto:

Xc - m
Zc =
s
X -m
-1, 645 = c
1, 5
X c - 10 =- 2, 4675
X c =- 2, 4675 + 10
X c = 7, 5325

Ento, o prazo de garantia deve ser de 7,5 anos.

5.4 Teste de Hiptese

A inferncia estatstica utiliza os dados amostrais principalmente para: esti-


mar um parmetro populacional (como vimos no Captulo 4) e para testar uma
hiptese ou uma afirmativa sobre um parmetro populacional (que veremos
neste captulo).
Um teste de hiptese usa estatsticas amostrais para testar uma afirmativa
sobre uma propriedade da populao. Por exemplo, pesquisadores da rea m-
dica e da poltica utilizam testes de hipteses para a tomada de decises sobre
novos medicamentos ou resultados de uma eleio.
Os testes de hiptese podem ser paramtricos ou no paramtricos.
Testes paramtricos tm requisitos sobre a natureza ou a forma das popula-
es envolvidas. So baseados em parmetros da distribuio.

128 captulo 5
Testes no paramtricos no exigem que as amostras sejam provenientes
de populaes normais ou qualquer outra distribuio especfica. Com isso,
em geral, so chamados testes livres de distribuio.

5.4.1 Passos para a construo de um teste de hiptese

1. Dada uma afirmativa, identificar a hiptese nula e a hiptese alternativa


e expressar ambas em forma simblica;
2. Atravs de uma afirmativa e dos dados amostrais, calcular o valor da es-
tatstica de teste.
3. Fixar e identificar o(s) valor(es) crtico(s).
4. Concluir o teste com base na estatstica de teste e na regio crtica.

5.4.2 Hiptese nula e hiptese alternativa

A hiptese nula (representada por H0) uma afirmativa de que o valor de


um parmetro populacional igual a algum valor especificado.
A hiptese alternativa (representada por H1 ou Ha) a afirmativa de que o
parmetro tem um valor que, de alguma forma, difere da hiptese nula. Re-
presentamos a hiptese alternativa usando um destes smbolos: <, > ou .

Por exemplo, se uma afirmativa para a mdia populacional


que ela assume o valor k, alguns pares possveis de hiptese nula
e alternativa so:

H 0 : m = k H 0 : m = k H 0 : m = k

H1 : m > k H1 : m < k H1 : m k

Segundo (TRIOLA, 2008, p. 309), se voc est fazendo um estudo e deseja


usar um teste de hiptese para apoiar sua afirmativa, esta deve ser escrita de
modo a se tornar a hiptese alternativa. (e deve ser expressa usando apenas os
smbolos <, > ou . Voc no pode usar um teste de hiptese para apoiar uma
afirmativa de que um parmetro seja igual a algum valor especfico.

captulo 5 129
ATENO
Alguns livros texto usam os smbolos ou na hiptese nula H0, mas seguiremos a notao
da maioria dos peridicos profissionais que usam apenas o smbolo de igualdade.

Exemplo 5.3: Identifique as hipteses nulas e alternativa e identifique qual


representa a afirmao em cada um dos itens abaixo.
a) Uma universidade alega que a proporo de seus alunos que so do sexo
masculino de 46%. O departamento de marketing da universidade de-
seja testar esta afirmao.
b) Os amortecedores de automveis que circulam em cidades duram, em
mdia, 35.000 quilmetros, segundo informao de algumas oficinas es-
pecializadas. Um proprietrio de automvel deseja testar essa afirmao.
c) Um veterinrio conseguiu ganho mdio dirio de 2,5 litros de leite por
vaca com uma nova composio de rao. Um pecuarista acredita que o
ganho no to grande assim.

Resoluo:
a) H0 : p = 0,46 afirmao
H1 : p 0,46
b) H0 : = 35.000 afirmao
H1 : 35.000
c) H0 : = 2,5 afirmao
H1 : < 2,5

5.4.3 Estatstica de teste paramtrico para a mdia

Segundo (TRIOLA, 2008, p. 310)

A estatstica de teste um valor usado para se tomar a deciso sobre a hiptese nula
e encontrada pela converso da estatstica amostral (como a proporo amostral p
ou a mdia amostral x ou o desvio padro s) em um escore (como z, t ou ) com a
2

suposio de que a hiptese nula seja verdadeira.

130 captulo 5
Estudaremos, neste captulo, a seguinte estatstica de teste para a mdia:

x -m x -m
Z = ou t=
s s
n n

Podemos observar que esta estatstica de teste pode se basear na distribui-


o normal ou na distribuio t de Student, dependendo das condies que se-
jam satisfeitas. Utilizaremos, aqui, os mesmos requisitos descritos no item 4.7
(ver quadro 4.1).

5.4.4 Regio crtica, nvel de significncia e valor crtico

A regio crtica composta por todos os valores da estatstica de teste que nos
fazem rejeitar a hiptese nula.
O nvel de significncia () a probabilidade da estatstica de teste cair na
regio crtica quando a hiptese nula for realmente verdadeira. Portanto,
a probabilidade de cometermos o erro de rejeitar a hiptese nula quando ela
verdadeira. Esse erro conhecido como Erro do tipo I. Este nvel de signifi-
cncia o mesmo que aquele foi definido para a construo do intervalo de
confiana no Captulo 4, cujas escolhas comuns para so 0,05; 0,01 e 0,10.

5.4.5 Teste bilateral, unilateral esquerda e unilateral direita

Um teste de hiptese pode ser bilateral, unilateral esquerda ou unilateral


direita. O tipo de teste depende da regio da distribuio amostral que favorece
uma rejeio de H0
Temos que:
Se a hiptese alternativa H1 contiver o smbolo <, o teste de hiptese ser
um teste unilateral esquerda, ou seja, a regio crtica est na cauda es-
querda sob a curva;
Se a hiptese alternativa H1 contiver o smbolo >, o teste de hiptese ser
um teste unilateral direita, ou seja, a regio crtica est na cauda direita
sob a curva;
Se a hiptese alternativa H1 contiver o smbolo , o teste de hiptese ser
um teste bilateral, ou seja, a regio crtica est nas duas caudas sob a curva;

captulo 5 131
Nos testes bilaterais, o nvel de significncia dividido igualmente entre
as duas caudas que constituem a regio crtica. Em testes unilaterais esquer-
da ou direita, a rea da regio crtica na cauda respectiva .

5.4.6 Concluso do teste de hiptese

O objetivo de um teste de hiptese testar a hiptese nula, de modo que nossa


concluso ser uma das seguintes:
1. Rejeitar a hiptese nula.
2. Deixar de rejeitar a hiptese nula.

CONEXO
O uso do mtodo do valor P est sendo utilizado com bastante frequncia, pois tal valor aparece
nos resultados de pacotes estatsticos. Para a compreenso de tal mtodo, leia o Procedi-
mento para a Determinao de Valores P, que se encontra em (TRIOLA, 2008, p. 314).

A deciso de rejeitar ou deixar de rejeitar uma hiptese nula pode ser feita
utilizando o mtodo tradicional (mtodo clssico), o mtodo do valor P, ou ba-
seando-se em intervalos de confiana.
Utilizaremos o mtodo clssico para concluir um teste de hiptese.
Quando conclumos um teste de hiptese e a estatstica de teste no cair
na regio crtica, vamos usar a terminologia deixar de rejeitar a hiptese nula.
Alguns textos escrevem aceitar a hiptese nula. Mas, no estamos provando a hi-
ptese nula. Apenas estamos nos baseando em evidncias amostrais que no
garantiram a rejeio da hiptese nula e, por isso, o termo deixar de rejeitar pa-
rece o mais correto.

Exemplo 5.4: Uma grande revista de negcios brasileira afirmou que o fatu-
ramento mdio das indstrias de uma determinada regio do sul do pas seria
igual a R$ 820.000,00. Sabe-se que o desvio padro do faturamento de todas as
empresas da regio igual a R$ 120.000,00? Um pesquisador independente
analisou os dados de uma amostra formada por 35 empresas, encontrando um
faturamento mdio igual a R$ 780.000,00. Assumindo nvel de significncia
igual a 8%, seria possvel concordar com a alegao?

132 captulo 5
Resoluo:
1. Identificar a hiptese nula e alternativa:

H0 : = 820.000
H1 : 820.000

2. Atravs de uma afirmativa e dos dados amostrais, calcular o valor da es-


tatstica de teste.

Como o desvio padro conhecido e n > 30, utilizaremos a seguinte estats-


tica de teste:

x -m
Z =
s
n
780.000 - 820.000 40.00
Z= = =-1, 97
120.000 20283, 702
35

3. Fixar e identificar o(s) valor(es) crtico(s).

Do enunciado, temos = 0,08. Como o teste bilateral, o nvel de significn-


cia = 0,08 dividido igualmente entre as dus caudas que constituem a regio
crtica. Portanto:

Z/2 = 1,755 e Z/2 = 1,755

4. Concluir o teste com base na estatstica de teste e na regio crtica.

Temos que a estatstica de teste caiu na regio de rejeio, do lado esquerdo


da cauda, pois 1,97 < 1,755. Portanto, rejeitamos a hiptese nula.
H evidncia suficiente para garantir a rejeio da afirmativa de que o fatu-
ramento mdio das indstrias de uma determinada regio do sul do pas de
R$ 820.000,00.

captulo 5 133
Exemplo 5.5: Uma grande construtora nacional afirma que seus funcion-
rios recebem um salrio mdio igual a, no mnimo, R$ 1.450,00, com desvio
padro igual a R$ 700,00 e a distribuio supostamente normal. Uma amostra
com 500 funcionrios apresentou uma mdia de R$ 1 000,00. A alegao da
empresa poderia ser aceita? Justifique. Considere = 2%.

Resoluo:
1. Identificar a hiptese nula e alternativa:

H0 : = 1.450
H1 : < 1.450

2. Atravs de uma afirmativa e dos dados amostrais, calcular o valor da es-


tatstica de teste.

Como a distribuio supostamente normal e o desvio padro conhecido,


utilizaremos a seguinte estatstica de teste:

x -m
Z =
s
n
1.000 -1.450 450
Z= = =-14, 37
700 31, 204952
5 00

3. Fixar e identificar o(s) valor(es) crtico(s).

Do enunciado, temos = 0,02. Como o teste unilateral esquerda, a rea


da regio crtica na cauda respectiva :

Z = 2,055

134 captulo 5
4. Concluir o teste com base na estatstica de teste e na regio crtica.

Temos que a estatstica de teste caiu na regio de rejeio, pois 14,37 < 2,055.
Portanto, rejeitamos a hiptese nula.
H evidncia suficiente para garantir a rejeio da afirmativa de que salrio
mdio dos funcionrios da construtora seja de, no mnimo, R$ 1.450,00.

5.4.7 Testes no paramtricos

Como vimos no item 5.4, os testes paramtricos tm requisitos sobre a natu-


reza ou a forma das populaes envolvidas. So baseados em parmetros da
distribuio. Quando no for possvel supor ou assumir caractersticas sobre
parmetros da populao de onde os dados foram extrados, torna-se necess-
rio aplicar testes no paramtricos de hiptese.
Listaremos os principais testes na paramtricos e em que situao devem
ser utilizados.
De acordo com (BRUNI, 2010, p. 256), dentre os principais modelos de tes-
tes no parmtricos, podem ser destacados os relacionados a seguir:
a) Teste do qui-quadrado: empregado na anlise de frequncias, quando
uma caracterstica da amostra analisada;
b) Teste do qui-quadrado para independncia ou associao: tambm em-
pregado na anlise de frequncias, porm quando duas caractersticas
da amostra so analisadas;
c) Teste dos sinais: empregado no estudo de dados emparelhados, quando
um mesmo elemento submetido a duas medidas;
d) Teste de Wilcoxon: tambm analisa dados emparelhados, permitindo,
porm, uma considerao das magnitudes encontradas;
e) Teste de Mann-Whitney: analisa se dois grupos originam-se de popula-
es com mdias diferentes;
f) Teste da mediana: analisa se dois grupos originam-se de populaes
com medianas diferentes;
g) Teste de Kruskal-Wallis: analisa se mais de dois grupos originam-se de
populaes com mdias diferentes.

Os testes no paramtricos no so to eficientes quanto os testes param-


tricos. Ento, precisamos, em geral, de evidncia mais forte (amostra maior ou
diferenas maiores) para rejeitar a hiptese nula.

captulo 5 135
ATIVIDADE
1. A durabilidade de um tipo de pneu de determinada marca descrita por uma v.a.Normal
de mdia 70.000 km e desvio-padro de 9.000 km.
a) Se o fabricante desta marca garante os pneus pelos primeiros 50.000 km,qual a pro-
poro de pneus que devero ser trocados pela garantia?
b) Qual deve ser a garantia (em km) para assegurar que o fabricante troque sob garantia
no mximo 2% dos pneus?

2. As vendas de determinado produto tm distribuio aproximadamente normal, com m-


dia 700 unidades e desvio-padro 80 unidades. Se a empresa decide fabricar 800
unidades no ms em estudo, qual a probabilidade de que no possa atender a todos
os pedidos desse ms, por estar com a produo esgotada?

3. As velocidades dos carros numa rodovia tm distribuio normal, com mdia de 90km/h.
Determinar:
a) o desvio-padro das velocidades, se 5% dos carros ultrapassar 100 km/h;
b) a porcentagem dos carros que trafegam a menos de 80 km/h.

4. Uma fbrica de embalagens de papelo afirma que suas caixas modelo padro tm uma
resistncia mdia no inferior a 14 kg. Uma amostra de cinco caixas revelou uma resis-
tncia mdia igual a 12,6 kg. Assumindo um nvel de significncia igual a 2%, possvel
confiar na palavra da fbrica? Sabe-se que o desvio padro populacional das resistn-
cias das caixas igual a 2 kg e que esta varivel encontra-se normalmente distribuda.

5. 05. A campanha WZA fabrica um determinado analgsico que alega ter durao no
inferior a quatro horas. Uma anlise de 30 medicamentos escolhidos aleatoriamente
acusou uma mdia de 3,8 horas de durao. Teste a alegao da campanhia, contra a
alternativa de que a durao seja inferior a quatro horas ao nvel de 0,05, se o desvio
populacional for de 0,5 hora.

136 captulo 5
REFLEXO
Agora, acreditamos que voc poder interpretar de maneira mais profunda muitas das infor-
maes que recebe. O conhecimento dos conceitos abordados neste livro de fundamental
importncia nas anlises que qualquer profissional necessita fazer em seu cotidiano.
Comprovadamente, o uso da Estatstica em qualquer rea leva a tomada de decises com
maiores chances de acerto. Agora, aplicar ou no o que voc aprendeu, depende exclusiva-
mente de voc. Boa sorte e muito sucesso!

LEITURA
Sugerimos que voc assista ao vdeo que est no seguinte endereo: <http://m3.ime.unicamp.
br/recursos/1098>. Voc aprender algumas tcnicas de planejamento de experimento, bem
como verificar a importncia da formulao correta de uma hiptese na anlise estatstica.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BRUNI, Adriano L. Estatstica Aplicada Gesto Empresarial. 2.ed. So Paulo: Atlas, 2010.

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.

LARSON, R; FARBER, Betsy. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.

MAGALHES, Marcos Nascimento; LIMA, Antnio Carlos Pedroso de. Noes de probabili-
dade e estatstica. So Paulo: Editora da Universidade de So Paulo, 2004.

TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC,.

captulo 5 137
EXERCCIO RESOLVIDO
Captulo 1

1. Resposta
a) qualitativa nominal
b) quantitativa discreta
c) quantitativa contnua
d) quantitativa discreta
e) quantitativa contnua
f) quantitativa contnua
g) quantitativa discreta
h) qualitativa nominal
i) quantitativa contnua
j) quantitativa contnua
k) qualitativa ordinal
l) qualitativa ordinal
m) qualitativa nominal
n) qualitativa nominal

2. Resposta
a) Como estamos interessados nas respostas dos consumidores de refrigerantes sabor cola
no teste de sabor, um consumidor desse tipo de refrigerante uma unidade experimental.
Assim, a populao de interesse a coleo ou conjunto de todos esses consumidores.
b) A caracterstica que a Pepsi deseja medir a preferncia do consumidor de refrige-
rante sabor cola revelada sob a aplicabilidade de um teste cego, logo, a preferncia
pelo tipo de refrigerante a varivel de interesse.
c) A amostra de 1.000 consumidores de refrigerante sabor cola selecionados da po-
pulao de todos os consumidores desse tipo de refrigerante.
d) A inferncia de interesse a generalizao da preferncia de refrigerantes sabor
cola dos 1.000 consumidores da amostra para a populao de todos os consumi-
dores desse tipo de refrigerante. Em particular, as preferncias dos consumidores
da amostra podem ser usadas para estimar o percentual de todos os consumidores
que preferem cada marca.

138 captulo 5
3. Qualitativos.
Qualitativos, pois as categorias foram simplesmente codificadas. Mas, isto no torna a vari-
vel quantitativa. No h sentido, por exemplo, calcular a mdia para estes dados codificados.

4. Resposta
a) Todos os cidados brasileiros.
b) Avaliao do trabalho do presidente (bom ou mau); qualitativa.
c) 2.500 indivduos sorteados.
d) Estimar a proporo de todos os cidados que acreditam que o presidente est fa-
zendo um bom trabalho.
e) Pesquisa.
f) A amostra em estudo no representativa, pois foram entrevistadas somente pesso-
as que possuem telefone.

5. Aproximadamente 48.

6. Resposta
a) Sim, ser representativa.
b) Foram utilizados pelo menos 3 tipos de tcnicas de amostragem: Amostragem Estra-
tificada no primeiro momento, Amostragem casual simples no segundo momento e
Amostragem por meio de conglomerados para finalizar.

7. Resposta
a) x p = 161.33; x g =1279, 85
b) x ponderada = 524, 85

captulo 5 139
8. Resposta
a)

AMOSTRA ESTRATIFICADA
N DE N DE (N = 50)
FUNCIONRIOS PROPRIEDADES
UNIFORME PROPORCIONAL
0 20 500 10 25
20 50 320 10 15
50 100 100 10 6
100 200 50 10 2
200 400 30 10 2

Total 1.000 50 50

b) x u = 114; x p = 42, 5 A mdia obtida atravs da amostragem estratificada uniforme


no mostra a realidade das empresas com relao ao nmero de funcionrios, j que
a grande maioria tem no mximo 50 funcionrios (como mostra a mdia obtida atra-
vs da amostragem estratificada proporcional).

Captulo 2

Antes das respostas gostaramos de deixar claro que as interpretaes das ques-
tes ficam a cargo do estudante. Se ocorrer dvidas, entrar em contato com o tutor.

1. k 6 classes e amplitude da classe h 7

IDADES f fr fa
19 26 5 0,1667 5
26 33 13 0,4333 18
33 40 4 0,1333 22
40 47 4 0,1333 26
47 54 3 0,1000 29
54 61 1 0,0333 30

Total 30 1

Tabela 1: Distribuio de frequncias das idades dos funcionrios.

140 captulo 5
a) 18
b) 13,33%
c) 17
d) 73,33%
e) 26,67%

2. Resposta
a) Valores gastos com supermercado. Varivel quantitativa contnua.
b)

CLASSES(GASTOS EM R$) f fr fa
4,89 61,89 17 0,34 17
61,89 118,89 13 0,26 30
118,89 175,89 5 0,10 35
175,89 232,89 5 0,10 40
232,89 289,89 3 0,06 43
289,89 346,89 3 0,06 46
346,89 403,89 2 0,04 48
403,89 460,89 2 0,04 50

Total 30 1

Tabela 1: Distribuio de frequncias para a varivel Valores gastos com supermercado.

captulo 5 141
3. Resposta
a) x = 23,1, Md = 22, 5, Mo = 22
b)

CLASSES f fr fa Pm
10 14 3 0,0469 3 12
14 18 5 0,0781 8 16
18 22 12 0,1875 20 20
22 26 25 0,3906 45 24
26 30 12 0,1875 57 28
30 34 3 0,0469 60 32
34 38 2 0,0313 62 36
38 42 2 0,0313 64 40

Total 64 1,0000

c) x = 24, 06, Md = 23, 92, Mo = 24

4. Resposta
a) Vendas mensais. Varivel quantitativa contnua.
b) x @ 3, 2, Md = 3, 4, Mo = 3, 5
c) 16,36%
d) 21,82%
e) 56,36%
f) 65,45%

5. x @ 1, 7, Md = 2, Mo = 2

6. 4,3

142 captulo 5
Captulo 3
1. Resposta

Outros
16,82%

Solteiro
42,87%
Separado
19,79%

Casado
Vivo 14,84%
5,69%

Atravs do grfico, podemos dizer que aproximadamente 43% dos clientes desta agncia
de turismo so solteiros, 20% so separados, 17% tm outro tipo de estado civil, 15% so
casados e apenas 5% so vivos. Esta informao importante na hora de lanar pacotes
de viagens. A agncia deve se lembrar que grande parte de seus clientes so solteiros. Tam-
bm pode criar estratgias para trazer mais clientes casados ou vivos, que provavelmente
devem ter outro tipo de perfil.

2. Resposta
a)

IDADES f fr fa
4,89 61,89 17 0,34 17
61,89 118,89 13 0,26 30
118,89 175,89 5 0,10 35
175,89 232,89 5 0,10 40
232,89 289,89 3 0,06 43
289,89 346,89 3 0,06 46
346,89 403,89 2 0,04 48
403,89 460,89 2 0,04 50
Total 50 1

captulo 5 143
b)

Histograma

18
16
14
12
Frequncia

10
8
6
4
2
0
4,8961,89

61,89118,89

118,89175,89

175,89232,89

232,89289,89

289,89346,89

346,89403,89

403,89460,89
Gastos (R$)

Polgono de Frequncias

18
17
16

14
13
12

10
Frequncia

6
5 5
4
3 3
2 2 2
0 0 0
0 33,39 90,38 147,39 204,39 261,39 318,39 375,39 432,39 489,39
Ponto mdio das classes Gastos (R$)

3. Resposta
a) Salrio de funcionrios de uma empresa. Esta varivel classificada como quantita-
tiva contnua.
b) 45 funcionrios
c) 86 funcionrios
d) 9,30%
e) 72,09%
f) Tabela 1: Distribuio de frequncias dos salrios dos funcionrios de uma empresa.

144 captulo 5
IDADES f fr fa
500,00 800,00 17 19,77 17
800,00 1100,00 45 52,33 62
1100,00 1400,00 12 13,95 74
1400,00 1700,00 4 4,65 78
1700,00 2100,00 3 3,49 81
2100,00 2400,00 3 3,49 84
2400,00 2700,00 2 2,33 86

Total 86 100

4. Resposta
a) R = 31, s @ 6,1, s 2 @ 37, 2, cv @ 0, 2633 ou 26, 33%
b)

CLASSES f fr fa Pm
10 14 3 0,0469 3 12
14 18 5 0,0781 8 16
18 22 12 0,1875 20 20
22 26 25 0,3906 45 24
26 30 12 0,1875 57 28
30 34 3 0,0469 60 32
34 38 2 0,0313 62 36
38 42 2 0,0313 64 40

Total 64 1,0000

c) R = 32, s @ 5, 8, s 2 @ 33, 6, cv @ 0, 2358 ou 23, 58%


d) Q1 @ 20, 7, D7 @ 26, P99 = 40, 7
e)

captulo 5 145
30
25
20
Frequncia
15
10
5
0
1014

1418

1822

2226

2630

3034

3438

3842
Nmero de horas

5. R = 7, s @ 2, 88, s 2 @ 8, 29, cv @ 0, 45 ou 45%

6. R = 5, s @ 1, 29, s 2 @ 8, 29, cv @ 0, 7588 ou 75, 88%

7. R = 30, s @ 6, 9, s 2 @ 47, 6, cv @ 0, 2233 ou 22, 33%

8. Resposta
a) Caixa A (menor variao absoluta (s))
b) Caixa A (maior variao relativa (cv))

Captulo 4

^ S
1. [14,04902 ; 15,95098] Margem de erro: 0,95098 EP(X) = = 0, 34
n

^ p (1 - p )
2. a) EP( p ) = = 0, 02487 b) [0,40125 ; 0,49875]
n

^ S
3. a) EP(X) = = 0, 3863 b) [4,3749 ; 6,0251]
n

146 captulo 5
4. [0,52110 ; 0,57890]

^ p (1 - p )
5. a) p = 0.4 b) EP( p ) = = 0, 01549
n

Captulo 5

6. a) 0,0132 b) 51.496 km

7. 0,1056

8. a) =6.08 b) 5,05%

9. z = 2,055 e z = 1,5652 (estatstica de teste)


No h evidncia suficiente para garantir a rejeio da afirmativa de que as caixas modelo
padro da fbrica de embalagens tm resistncia mdia no inferior a 14 kg.

10. z = 1.645 e z = 2.1909 (estatstica de teste)


H evidncia suficiente para garantir a rejeio da afirmativa de que a durao do efeito do
analgsico fabricado por esta companhia no seja inferior a 4 horas.

Curva Normal (p = rea entre 0 z)

SEGUNDA CASA DECIMAL


z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.1 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.2 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.3 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.4 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.5 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

captulo 5 147
0.6 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.7 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.8 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 2764 0.2794 0.2823 0.2852

0.9 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

1.0 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.1 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.2 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.3 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.4 0.4032 0.4049 0.4066 0.4082 0.4099 0.1415 0.4131 0.4147 0.4162 0.4177

1.5 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.6 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.7 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.2545

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 04732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 04916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

Tabela Valores crticos da distribuio t de Student

P(|T DE STUDENT| VALOR TABELADO) = VALORES BILATERAIS

G. L. 0.50 0.20 0.10 0.05 0.04 0.02 0.01 0.005 0.001

1 1.000 3.078 6.314 12.706 15.894 31.821 63.656 127.321 636.578

2 0.816 1.886 2.920 4.303 4.849 6.965 9.925 14.089 31.600

3 0.765 1.638 2.353 3.182 3.482 4.541 5.841 7.453 12.924

148 captulo 5
P(|T DE STUDENT| VALOR TABELADO) = VALORES BILATERAIS
4 0.741 1.533 2.132 2.776 2.999 3.747 4.604 5.598 8.610

5 0.727 1.476 2.015 2.571 2.757 3.365 4.032 4.773 6.869

6 0.718 1.440 1.943 2.447 2.612 3.143 3.707 4.317 5.959

7 0.711 1.415 1.895 2.365 2.517 2.998 3.499 4.029 5.408

8 0.706 1.397 1.860 2.306 2.449 2.896 3.355 3.833 5.041

9 0.703 1.383 1.833 2.262 2.398 2.821 3.250 3.690 4.781

10 0.700 1.372 1.812 2.228 2.359 2.764 3.169 3.581 4.587

11 0.697 1.363 1.796 2.201 2.328 2.718 3.106 3.497 4.437

12 0.695 1.356 1.782 2.179 2.303 2.681 3.055 3.428 4.318

13 0.694 1.350 1.771 2.160 2.282 2.650 3.012 3.372 4.221

14 0.692 1.345 1.761 2.145 2.264 2.624 2.977 3.326 4.140

15 0.691 1.341 1.753 2.131 2.249 2.602 2.947 3.286 4.073

16 0.690 1.337 1.746 2.120 2.235 2.583 2.921 3.252 4.015

17 0.689 1.333 1.740 2.110 2.224 2.567 2.898 3.222 3.965

18 0.688 1.330 1.734 2.101 2.214 2.552 2.878 3.197 3.922

19 0.688 1.328 1.729 2.093 2.205 2.539 2.861 3.174 3.883

20 0.687 1.325 1.725 2.086 2.197 2.528 2.845 3.153 3.850

21 0.686 1.323 1.721 2.080 2.189 2.518 2.831 3.135 3.819

22 0.686 1.321 1.717 2.074 2.183 2.508 2.819 3.119 3.792

23 0.685 1.319 1.714 2.069 2.177 2.500 2.807 3.104 3.768

24 0.685 1.318 1.711 2.064 2.172 2.492 2.797 3.091 3.745

25 0.684 1.316 1.708 2.060 2.167 2.485 2.787 3.078 3.725

26 0.684 1.315 1.706 2.056 2.162 2.479 2.779 3.067 3.707

27 0.684 1.314 1.703 2.052 2.158 2.473 2.771 3.057 3.689

28 0.683 1.313 1.701 2.048 2.154 2.467 2.763 3.047 3.674

29 0.683 1.311 1.699 2.045 2.150 2.462 2.756 3.038 3.660

30 0.683 1.310 1.697 2.042 2.147 2.457 2.750 3.030 3.646

31 0.682 1.309 1.696 2.040 2.144 2.453 2.744 3.022 3.633

captulo 5 149
P(|T DE STUDENT| VALOR TABELADO) = VALORES BILATERAIS
32 0.682 1.309 1.694 2.037 2.141 2.449 2.738 3.015 3.622

33 0.682 1.308 1.692 2.035 2.138 2.445 2.733 3.008 3.611

34 0.682 1.307 1.691 2.032 2.136 2.441 2.728 3.002 3.601

35 0.682 1.306 1.690 2.030 2.133 2.438 2.724 2.996 3.591

36 0.681 1.306 1.688 2.028 2.131 2.434 2.719 2.990 3.582

37 0.681 1.305 1.687 2.026 2.129 2.431 2.715 2.985 3.574

38 0.681 1.304 1.686 2.024 2.127 2.429 2.712 2.980 3.566

39 0.681 1.304 1.685 2.023 2.125 2.426 2.708 2.976 3.558

40 0.681 1.303 1.684 2.021 2.123 2.423 2.704 2.971 3.551

41 0.681 1.303 1.683 2.020 2.121 2.421 2.701 2.967 3.544

42 0.680 1.302 1.682 2.018 2.120 2.418 2.698 2.963 3.538

43 0.680 1.302 1.681 2.017 2.118 2.416 2.695 2.959 3.532

44 0.680 1.301 1.680 2.015 2.116 2.414 2.692 2.956 3.526

45 0.680 1.301 1.679 2.014 2.115 2.412 2.690 2.952 3.520

46 0.680 1.300 1.679 2.013 2.114 2.410 2.687 2.949 3.515

47 0.680 1.300 1.678 2.012 2.112 2.408 2.685 2.946 3.510

48 0.680 1.299 1.677 2.011 2.111 2.407 2.682 2.943 3.505

49 0.680 1.299 1.677 2.010 2.110 2.405 2.680 2.940 3.500

50 0.679 1.299 1.676 2.009 2.109 2.403 2.678 2.937 3.496

60 0.679 1.296 1.671 2.000 2.099 2.390 2.660 2.915 3.460

70 0.678 1.294 1.667 1.994 2.093 2.381 2.648 2.899 3.435

80 0.678 1.292 1.664 1.990 2.088 2.374 2.639 2.887 3.416

90 0.677 1.291 1.662 1.987 2.084 2.368 2.632 2.878 3.402

100 0.677 1.290 1.660 1.984 2.081 2.364 2.626 2.871 3.390

110 0.677 1.289 1.659 1.982 2.078 2.361 2.621 2.865 3.381

120 0.677 1.289 1.658 1.980 2.076 2.358 2.617 2.860 3.373

0.674 1.282 1.645 1.960 2.054 2.326 2.576 2.807 3.290

0,25 0,10 0,05 0,025 0,02 0,01 0,005 0,0025 0,0005

150 captulo 5