Você está na página 1de 219

Universidade Sul de Santa Catarina

Probabilidade e
Estatstica

UnisulVirtual
Palhoa, 2016

Crditos
Universidade do Sul de Santa Catarina Unisul
Reitor

Sebastio Salsio Herdt


Vice-Reitor

Mauri Luiz Heerdt


Pr-Reitor de Ensino, de Pesquisa e de Extenso

Mauri Luiz Heerdt

Pr-Reitor de Desenvolvimento Institucional

Luciano Rodrigues Marcelino

Pr-Reitor de Operaes e Servios Acadmicos

Valter Alves Schmitz Neto

Diretor do Campus Universitrio de Tubaro

Heitor Wensing Jnior

Diretor do Campus Universitrio da Grande Florianpolis

Hrcules Nunes de Arajo

Diretor do Campus Universitrio UnisulVirtual

Fabiano Ceretta

Campus Universitrio UnisulVirtual


Diretor

Fabiano Ceretta
Unidade de Articulao Acadmica (UnA) Cincias Sociais, Direito, Negcios e Servios

Amanda Pizzolo (coordenadora)

Unidade de Articulao Acadmica (UnA) Educao, Humanidades e Artes

Felipe Felisbino (coordenador)

Unidade de Articulao Acadmica (UnA) Produo, Construo e Agroindstria

Anelise Leal Vieira Cubas (coordenadora)

Unidade de Articulao Acadmica (UnA) Sade e Bem-estar Social

Aureo dos Santos (coordenador)

Gerente de Operaes e Servios Acadmicos

Moacir Heerdt

Gerente de Ensino, Pesquisa e Extenso

Roberto Iunskovski

Gerente de Desenho, Desenvolvimento e Produo de Recursos Didticos

Mrcia Loch

Gerente de Prospeco Mercadolgica

Eliza Bianchini Dallanhol

Luiz Arthur Dornelles Jnior

Probabilidade e
Estatstica
Livro didtico

Reviso e atualizao de contedo


Joseane Borges de Miranda

3a Edio

Designer instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
Eliete de Oliveira Costa

UnisulVirtual
Palhoa, 2016

Copyright
UnisulVirtual 2016

Nenhuma parte desta publicao pode ser reproduzida por


qualquer meio sem a prvia autorizao desta instituio.

Livro Digital

Professor conteudista
Luiz Arthur Dornelles Jnior

Revisor
Contextuar

Reviso e atualizao de contedo


Gabriel Oscar Cremona Parma (2 edio)
Joseane Borges de Miranda (3 edio)

ISNB
978-85-506-0036-9

Designer instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher (2 edio)
Eliete de Oliveira Costa (3 edio)

e-ISBN
978-85-506-0037-6

Projeto grfico e capa


Equipe UnisulVirtual
Diagramador(a)
Caroline Casassola

D75

Dornelles Jnior, Luiz Arthur


Probabilidade e estatstica : livro didtico / Luiz Arthur Dornelles Jnior ;
reviso e atualizao de contedo Joseane Borges de Miranda, [ Gabriel Oscar
Cremona Parma] ; design instrucional [Karla Leonora Dahse Nunes], [Sabrina
Bleicher], Eliete de Oliveira Costa. 3. ed. Palhoa : UnisulVirtual, 2016.
217 p. : il. ; 28 cm.
Inclui bibliografia.
ISBN 978-85-506-0036-9
e-ISBN 978-85-506-0037-6
1. Estatstica. 2. Probabilidades. I. Mirada, Joseane Borges de. II.
Parma, Gabriel Oscar Cremona. III. Nunes, Karla Leonora Dahse. IV.
Bleicher, Sabrina. V. Costa, Eliete de Oliveira. VI. Ttulo.
CDD (21. ed.) 519.5
Ficha catalogrfica elaborada pela Biblioteca Universitria da Unisul

Sumrio

Introduo |7

Captulo 1

Estatstica descritiva|9

Captulo 2

Medidas de posio e disperso|51

Captulo 3

Probabilidade|91

Captulo 4

Amostragem e clculo de estimativa|131

Captulo 5

Regresso Linear simples|163

Consideraes Finais|177
Referncias|179
Sobre os Professores Conteudistas |181
Respostas e comentrios das atividades de autoavaliao|183
Anexos|216

Introduo

Ol! Bem-vindo(a) disciplina Probabilidade e Estatstica.


Dentro desta unidade de aprendizagem voc ir estudar o que os profissionais e
cientistas chamam de probabilidade e estatstica.
Tendo como base a matemtica, esta unidade de aprendizagem trata da
aplicao no cotidiano, em pesquisas e avaliaes. Trata tambm de tcnicas
eficientes para organizar e analisar dados e tomar decises.
No objetivo desta unidade de aprendizagem formar estatsticos e, sim, profissionais
com conhecimento tcnico para realizar anlises e interpretao de dados, alm de ter
condies de argumentar, dar suporte e trocar ideias com outros profissionais.
Desta forma, o esperado que ao final da unidade de aprendizagem voc tenha em
suas mos uma verdadeira caixa com vrias ferramentas para apoiar suas decises.
Sinta-se, agora, convidado a estudar para obter todas as ferramentas que lhe
sero apresentadas nesta unidade de aprendizagem, e cuide para ordenar as
ferramentas na caixa, de modo a poder fazer uso delas quando for necessrio.

Bons estudos!
Professor Luiz Arthur Dornelles Jr.

Captulo 1

Estatstica descritiva
Seo 1
Introduo Estatstica
A cada dia, nossa sociedade torna-se mais complexa. Convivemos com os
indicadores econmicos, com a inflao, com a reforma da previdncia, com o
controle de qualidade, enfim, deparamo-nos constantemente com situaes e
informaes sempre mais complexas.
No que se refere gesto das organizaes, a situao no diferente. Para se
administrar uma empresa, seja pblica ou privada, necessitamos de ferramentas
para poder acompanhar a evoluo da sociedade e, assim, analisar situaes
e informaes, bem como dar suporte s nossas decises. Assim como no
setor pblico, a Estatstica uma tima forma para prever e estudar as variveis
econmicas, tais como juros, inflao, dentre outros.
Por isso, dizemos que a Estatstica um conjunto de ferramentas, as quais,
quando bem empregadas, podem ser de grande utilidade para a gesto de
empresas e no setor pblico em geral. Hoje em dia, sem a Estatstica, no
seramos capazes de avaliar a variao de preos, da inflao, de consumo, nem
fazer controle de qualidade, pesquisa eleitoral etc.
Para conhecer Estatstica, importante que voc compreenda, antes, o
significado da palavra e o seu conceito. A palavra Estatstica origina-se do
latim, e o seu radical status, significa estado. Sendo assim, a palavra Estatstica
significa o estudo do estado. Para entender o conceito de estudo do estado,
acompanhe as seguintes definies sobre Estatstica:
A Estatstica uma coleo de mtodos para planejar
experimentos, obter dados e organiz-los e, deles, extrair
concluses. (TRIOLA, 1999, p. 2).

Captulo 1
A Estatstica est interessada nos mtodos cientficos para a
coleta, a organizao, o resumo, a apresentao e a anlise
de dados, bem como na obteno de concluses vlidas e
na tomada de decises razoveis, baseadas em tais anlises.
(SPIEGEL, 1994, p. 1).
Estatstica um conjunto de mtodos e processos
quantitativos que serve para estudar e medir os fenmenos
coletivos. (SILVA, 1999, p. 11).

Voc percebeu que as definies assemelham-se e completam-se? Ento, observe,


a seguir, a definio de Estatstica adotada neste estudo que comea agora.
A Estatstica corresponde a um conjunto de mtodos cientficos para a coleta,
organizao, apresentao e anlise de dados, bem como, para a concluso e tomada
de decises baseadas em tais anlises.

Em termos gerais, convm destacar que a Estatstica est dividida em duas partes:
Estatstica descritiva: aplicada quando voc depara-se com uma
quantidade muito grande de dados, e difcil tirar concluses sobre o
fenmeno. A Estatstica descritiva usada para reduzir as informaes
at o ponto em que se possa interpretar tal fenmeno. O objetivo da
Estatstica descritiva observar fenmenos de mesma natureza, coletar,
organizar, classificar, apresentar, interpretar e analisar dados referentes
ao fenmeno por meio de grficos e tabelas, alm de calcular medidas
de tendncia que permitam descrever o fenmeno.
Estatstica indutiva: aplicada quando impossvel realizar levantamentos
com a totalidade dos objetos de uma pesquisa, seja por tempo, ou por
economia etc., somente uma parcela desses elementos utilizada para
realizar as observaes. Partindo, nesse caso, de uma parcela desses
elementos, a Estatstica indutiva chega a concluses e realiza previses
sobre elementos em questo (mtodo que se fundamenta na teoria da
probabilidade associada a uma margem de incerteza).
Para a obteno de resultados confiveis, que reflitam a realidade dos fatos, necessrio
realizar uma pesquisa, cuidadosamente planejada, com mtodos adequados.
O mtodo um conjunto de meios dispostos convenientemente para se chegar a um fim
que se demarcou. O mtodo estatstico, diante da impossibilidade de manter as causas
constantes, admite as causas presentes, variando-as, registrando essas variaes e
procurando determinar, no resultado final, que influncias cabem a cada uma delas.

10

Probabilidade e Estatstica
Alguns passos precisam ser seguidos para que seja aplicado o mtodo estatstico
e, assim, realizada uma boa pesquisa. Para voc entender quais so esses
passos, acompanhe, a seguir, as principais fases.
a. Definio do problema: a primeira fase do trabalho estatstico
consiste em uma definio ou formulao correta do problema a ser
estudado. Nesta fase, voc precisa definir:
O que ser pesquisado? Definir o tema e os objetivos de
pesquisa.
Em que setor geogrfico? O pblico-alvo a ser planejado.
Como ser a amostra? Incluir o clculo da amostra e as
tcnicas de coletas de dados.
b. Planejamento: consiste em determinar o procedimento necessrio
para levantar informaes sobre o assunto objeto do estudo. Voc
dever definir como sero coletados os dados de pesquisa, j que
isso pode ser feito de vrias formas.
Observao direta: caracteriza-se quando o pesquisador
somente faz observaes para coletar os dados necessrios
para a pesquisa.
Entrevista oral: caracteriza-se por estabelecer perguntas
orais a um indivduo ou grupo de indivduos. As entrevistas
podem ser classificadas em estruturadas e no estruturadas;
entrevistas estruturadas so aquelas em que o pesquisador
estabelece um roteiro prvio de perguntas. Nas entrevistas
no estruturadas, o pesquisador, por meio de uma conversa
amigvel, busca levantar dados que possam ser utilizados em
anlise qualitativa, selecionando-se os aspectos mais relevantes
do problema de pesquisa. (RAUEN, 2006).
Entrevista escrita ou questionrio: questionrio uma lista
de indagaes escritas, as quais devem ser respondidas por
escrito pelo informante. Sua vantagem a possibilidade de se
indagarem muitas pessoas ao mesmo tempo. Para entrevistar
uma sala de universitrios, basta distribuir as folhas, para
que todos respondam simultaneamente (entrevista de grupo)
(RAUEN, 2006). O questionrio uma forma muito utilizada
na coleta de dados, mas exige ser: completo (responder
tudo), concreto (perguntas claras e objetivas), secreto (sem
identificao) e discreto (perguntas bem formuladas).

11

Captulo 1
preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se
pretende atingir.
c. Coleta de dados: compreende a coleta das informaes
propriamente ditas. Formalmente, a coleta de dados refere-se
obteno, reunio e ao registro sistemtico de dados com um
objetivo determinado.
d. Apurao dos dados: consiste em reunir os dados por meio de sua
contagem e seu agrupamento.
e. Apresentao dos dados: os dados estatsticos podem ser mais
facilmente compreendidos quando apresentados por meio de uma
representao grfica, o que permite uma visualizao instantnea
de todos os dados.
f. Anlise e interpretao de dados: nesta etapa, o interesse maior
reside em tirar concluses que auxiliam o pesquisador a atingir seu
objetivo, ou seja, encontrar a resposta para a sua pergunta.

Todas essas fases so realizadas quando se cumpre um processo de pesquisa.


Veja a representao no esquema a seguir.
Figura 1.1 O processo da pesquisa

Populao

Produo de
dados

Amostra

Estudo da amostra:
- tabelas
- grficos
- medidas

Caractersticas
populacionais

Estatstica
Indutiva

Caractersticas
amostrais

Fonte: Adaptado de Ao Local de Estatstica Aplicada ALEA (1999-2010).

12

Probabilidade e Estatstica

Populao e amostra
Quando voc prepara um alimento, pode provar (observar) uma pequena poro.
Nesse procedimento, voc est fazendo o processo de amostragem, ou seja,
extraindo do todo (populao) uma parte (amostra), com o propsito de inferir
(avaliar) a qualidade de todo o alimento. A partir do exemplo, podemos distinguir
dois importantes conceitos da Estatstica descritiva: populao e amostra.
Populao o conjunto total de elementos com, pelo menos, uma caracterstica em
comum, cujo comportamento interessa estudar.

A definio dos elementos que sero estudados est ligada diretamente s


caractersticas levantadas no objetivo da pesquisa, ou seja, este objetivo que
auxiliar na definio desta populao. Estes elementos podem ser:
animados: pessoas, animais etc.;
inanimados: notas fiscais, produtos industrializados etc.

Em relao ao nmero de elementos, a populao pode ser:


finita: quando tem um nmero limitado de elementos (nmero de
funcionrios de um determinado banco etc.);
infinita: quando tem um nmero ilimitado de elementos (exemplo:
nmero possvel de anlises qumicas que podem ser feitas em um
rio poludo etc.).
A representao do tamanho da populao dada por N = nmero de
elementos da populao.
So exemplos de definio de populao:
ao estudar a idade e o sexo de funcionrios da empresa A: para definir
a populao, devemos considerar todos os funcionrios da empresa;
ao estudar a qualidade de peas de uma linha de produo da
empresa A: para definir a populao, devemos considerar todas as
peas produzidas pela empresa.
Amostra o conjunto de elementos ou observaes, recolhidos a partir de um
subconjunto da populao, que se estuda com o objetivo de tirar concluses para a
populao de onde foi recolhida.

13

Captulo 1
A amostra precisa ser representativa, ou seja, possuir as mesmas caractersticas
da populao.
A representao do tamanho da amostra dada por n = nmero de elementos
da amostra.

Processos estatsticos de abordagem


Ao estudar um fenmeno coletivo, ou seja, um fenmeno que se refere a uma
determinada populao, compreendendo um grande nmero de elementos,
coisas e indivduos, podemos optar entre os seguintes processos estatsticos:
Censo1: uma coleo de dados relativos a todos os elementos
de uma populao; uma avaliao direta de um parmetro que
utiliza todos os componentes da populao. No Brasil, por
exemplo, o censo feito de dez em dez anos, momento em que so
pesquisados todos os domiclios brasileiros.

Principais propriedades do censo:


admite erro processual zero e tem confiabilidade de 100%;
caro e lento;
quase sempre desatualizado;
nem sempre vivel.
Parmetro: usado para designar alguma caracterstica descritiva
dos elementos da populao (percentagem, mdia etc.).
Estimao: uma avaliao indireta de um parmetro com base em
um estimador, por intermdio do clculo de probabilidades. Nesse
caso, utiliza-se uma amostra.
Principais propriedades da estimao:
admite erro processual positivo e tem confiabilidade menor do
que 100%;
barata e rpida;
atualizada;
sempre vivel.

1 - O censo era considerado uma pesquisa desatualizada pela demora da publicao dos dados, mas a
tecnologia veio para diminuir em muito esse tempo de publicao. No ano de 2010, constatamos que os dados
foram publicados com mais rapidez do que nas dcadas anteriores. Acesse o site do Instituto Brasileiro de
Geografia e Estatstica (IBGE) e consulte informaes da sua cidade e do seu estado: <www.ibge.gov.br>.

14

Probabilidade e Estatstica
Estimativa: o valor assumido por certa Estatstica (exemplo: 60%
o valor de estimativa do referido parmetro).

Amostragem
Como exposto neste captulo, as pesquisas so realizadas por meio de estudo
dos elementos que compem uma amostra extrada da populao que se
pretende analisar.
A populao o conjunto de indivduos ou objetos que apresentam, em comum,
determinadas caractersticas definidas para o estudo. Amostra um subconjunto
da populao. O estudo de todos os elementos da populao possibilita
conhecimento preciso das variveis que esto sendo pesquisadas; todavia, nem
sempre possvel obter as informaes de todos os elementos da populao.
Limitaes de tempo, custo e as vantagens do uso das tcnicas Estatsticas
justificam o uso de planos amostrais. A representatividade da amostra depender
do seu tamanho (quanto maior, melhor). O investigador procurar acercar-se de
cuidados, visando obteno de uma amostra significativa, ou seja, que de fato
represente toda a populao da melhor maneira possvel. (FONSECA, 1996).
Observe, a seguir, mais alguns conceitos do processo estatstico, relacionados
amostragem:
Estatstica: caracterstica descritiva dos elementos da amostra
(percentagem, mdia etc.).
Erro amostral: a mxima diferena que o investigador/pesquisador
admite entre a mdia da populao e a mdia da amostra. Em
pesquisa, admite-se o uso do erro amostral entre 1% a 10%. Observe,
por exemplo, as pesquisas eleitorais, a maioria destas efetuada com
erro amostral de 2%. Isso significa que pode variar de 2% a +2%.
Quando se diz que dois candidatos esto com empate tcnico, isso
quer dizer que, somando ou diminuindo 2%, eles esto empatados.
Exemplo
O candidato A est com 48% da preferncia dos votos, e o candidato B est com
52% da preferncia dos votos. O candidato A tem 48%; diminuindo os 2% = 46;
com 48% mais 2% = 50%. Ou seja, varia de 46% a 50%. J, o candidato B tem
52% menos 2% = 50%; com 52% mais 2% = 54%. Logo, considerando-se o erro
amostral, os candidatos esto empatados tecnicamente, com 50% cada.

15

Captulo 1
Nvel de confiana: expresso em percentual e representa quantas
vezes o percentual real da populao encontra-se dentro do
intervalo de confiana. O nvel de confiana de 95% significa que
voc tem 95% de certeza. A maioria dos pesquisadores usa o nvel
de confiana de 95%.

Como podemos ver, o uso da amostragem vantajoso por trazer:


economia: mais econmico, o levantamento de somente
uma parte da populao, muitas vezes pelo custo do prprio
levantamento e tambm por no ser mais possvel recuperar
elementos da populao;
tempo: em pouco tempo, pode-se pesquisar uma amostra, ao
contrrio de uma populao;
confiabilidade: quando se pesquisa um nmero menor de
elementos, pode-se dar mais ateno, evitando erros nas respostas.

Variveis
Variveis so conjuntos de caractersticas que podem ser observados e/ou medidos
em cada elemento da populao ou amostra, sob as mesmas condies.
Ao analisar uma determinada experincia, um fato ou um elemento, voc pode
verificar que todos eles assumem diferentes caractersticas ou valores.
Exemplo: ao analisar um determinado setor de uma empresa, voc pode verificar,
entre seus funcionrios, algumas caractersticas (variveis) como sexo, idade,
salrio, assiduidade etc.
Essas caractersticas variam de elemento para elemento, por isso so chamadas
de variveis.
As variveis so classificadas em dois tipos:
Qualitativas: representam a informao que identifica alguma
qualidade, categoria ou caracterstica, no suscetvel de medida (no
numrica), mas de classificao, assumindo vrias modalidades.
Exemplo:
Estado civil: casado, solteiro, vivo, divorciado.
Sexo: masculino e feminino.
Escolaridade: 1 grau, 2 grau, 3 grau.

16

Probabilidade e Estatstica
As variveis qualitativas esto divididas em:
Nominais: so dados caracterizados por rtulos ou categorias.
Por exemplo, sexo, estado civil, cor dos olhos etc.
Ordinais: so dados caracterizados por uma ordem, mas no
podem ser diferenciados por valor numrico. Por exemplo: nvel
de escolaridade (1, 2 e 3 graus), intensidade da luz (muito
forte, forte, mdia, suave, muito suave).
Quantitativas: representam a informao resultante de
caractersticas suscetveis de serem medidas, apresentam-se com
diferentes intensidades.
Exemplo:
Idade: 19 anos, 20 anos, 35 anos.
Nmero de nascidos vivos: 10, 15, 22, 12, 14.
Peso: 55 kg, 66 kg, 71 kg.

As variveis quantitativas esto divididas em:


Variveis discretas: se ela pode assumir um conjunto constante
discreto, ou seja, enumervel, finito de valores. Geralmente so
expressas por valores inteiros no negativos. Por exemplo: nmero
de pessoas do setor, quantidade de notas fiscais (observao: no
se pode considerar meia nota fiscal ou meia pessoa).
Variveis contnuas: so as variveis em que no conseguimos
enumerar seus possveis resultados, por estes formarem um conjunto
infinito de valores, em um intervalo de nmeros reais. Por exemplo:
peso, altura, temperatura.

Diferena entre as variveis discreta e contnua


Voc, noite, ao ir deitar-se, tem 1,65m e desperta pela manh com 1,70m. Voc cresce
5cm de forma instantnea? No, voc cresce aos poucos e, entre 1,65 e 1,70, voc
tem infinitas alturas. Para a varivel discreta, observamos que no possvel aumentar
o nmero de pessoas de 22 para 22,57. No podemos aumentar em 0,57 pessoa. S
podemos aumentar em uma unidade.

17

Captulo 1

Dados
Dados estatsticos so medidas da presena de um determinado conjunto de
valores de uma varivel em uma populao ou amostra. Os tipos de dados
estatsticos so:
dados primrios: quando so observados e/ou levantados pelo
prprio pesquisador ou pela organizao que os tenha recolhido;
dados secundrios: quando so observados e/ou levantados por
outra organizao ou pesquisador.

Alm dessa classificao, os dados tambm pode ser absolutos e relativos. Nesta
seo, vamos aprender a transformar dados absolutos em dados relativos, mas,
antes disso, vamos conhecer suas definies.
Dados absolutos so dados estatsticos resultantes da coleta direta
da fonte, sem outra manipulao a no ser a contagem ou medida.
A leitura dos dados absolutos sempre enfadonha e inexpressiva.
Embora, esses dados traduzam um resultado exato e fiel, no tm a
virtude de ressaltar de imediato as suas concluses numricas.

Da o uso imprescindvel que faz a Estatstica dos dados relativos. O


nmero de vezes que um valor da varivel de uma pesquisa citado
representa a frequncia absoluta daquele valor.

Dados relativos so o resultado de comparaes por quociente


(razes) que se estabelecem entre dados absolutos e tm por
finalidade realar ou facilitar as comparaes entre quantidades.
Traduzem-se os dados relativos, em geral, por meio de:
percentagens;
coeficientes;
taxas;
ndices.
A frequncia relativa o quociente entre a frequncia absoluta de uma varivel e
o total de citaes de todas as variveis da pesquisa.

18

Probabilidade e Estatstica

Seo 2
Distribuio de frequncia
Com a posse dos dados de forma desorganizada, um primeiro passo seria
organiz-los em tabelas para que possibilitem uma primeira anlise, alm de
servirem para uma srie de interpretaes. Voc poder aprender como se
organizam dados brutos e como pode ser analisada a distribuio de frequncias.
Antes de qualquer coisa, voc precisa saber o que so dados brutos e dados agrupados.

Dados brutos
Dados brutos so sequncias de valores numricos ou no, os quais no sofreram
qualquer tratamento estatstico, nem foram organizados, obtidos diretamente da
observao de um fenmeno.

Mais precisamente, dados brutos so os dados apresentados da forma como foram


coletados na pesquisa ou no levantamento, desorganizados, sem ordenao.
Acompanhe os exemplos de levantamento de dados de acordo com o tipo de
varivel: qualitativa, quantitativa discreta ou quantitativa contnua.

Para uma varivel qualitativa


Em um levantamento realizado com 56 clientes de um banco, foram obtidos os
seguintes dados sobre o tipo de investimento em que estes mais confiavam,
conforme legenda.
Quadro 1.1 Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam

Legenda do quadro:

I Investimentos imobilirios;

M Investimento em mercado de aes;


P Investimento em poupana;

R Investimento em fundos de renda fixa.

Fonte: Elaborao do autor (2010).

19

Captulo 1
Repare que, neste caso, foram pesquisados 56 clientes e foram anotadas as
respostas na ordem das entrevistas.

Para uma varivel quantitativa discreta


O controle de qualidade de uma fbrica de rolamentos vem analisando os lotes para
detectar defeitos nas peas fabricadas. Cada lote contm 56 peas. A seguir, est
relacionado o nmero de defeitos por pea, conforme estas so produzidas neste lote.
Quadro 1.2 Levantamento sobre o nmero de defeitos por pea de uma fbrica de rolamentos

Fonte: Elaborao do autor (2010).

Repare que foram analisadas 56 peas e foram anotados os nmeros de defeitos


por pea, na ordem em que estas foram produzidas.

Para uma varivel quantitativa contnua


Os valores anotados, a seguir, representam o volume de vendas mensal de 56
representantes de uma empresa que fabrica remdios. Os valores esto em
milhares de reais.

20

Probabilidade e Estatstica
Quadro 1.3 Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remdios

23,25

27,43

17,76

33,33

33,05

16,08

34,49

23,74

32,63

20,58

18,50

16,69

16,43

20,08

19,00

16,13

21,36

26,60

22,49

22,77

23,05

33,55

22,73

24,89

24,11

34,83

21,73

31,53

35,13

34,36

20,80

16,84

29,55

34,76

31,72

24,89

21,65

22,65

30,43

30,93

17,25

17,05

19,67

22,79

25,30

23,08

25,77

35,03

16,59

15,90

20,30

33,86

17,76

30,93

20,81

29,05

Fonte: Elaborao do autor (2010).

Dados agrupados
Dados agrupados so sequncias de valores numricos, ou no, os quais se
encontram j organizados, ou por semelhana (qualitativas), ou por ordenao
numrica (quantitativas), em tabelas.

Tabelas para varivel qualitativa


Para montar uma tabela com varivel qualitativa, acompanhe o exemplo, a seguir,
de um levantamento de dados acerca do tipo de investimento em que os clientes
de um banco mais confiavam.
Para comear, voc deve organizar os dados por semelhana. Conforme o quadro abaixo.
Quadro 1.4 Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam

Fonte: Elaborao do autor (2010).

21

Captulo 1
Repare que os dados esto organizados por tipo de investimento.
Agora, voc vai escrever, em uma coluna, cada uma das opes verificadas. Contar
o nmero de vezes em que cada tipo aparece e marcar com traos, ao lado, para
representar as aparies. Em seguida, conte o nmero de traos para obter o nmero
de vezes que cada opo aparece. Observe o quadro da contagem dos dados.
I

= 14

= 10

= 22

= 10

Aps a contagem e organizao dos dados, agora, s montar a tabela, sem


esquecer-se de nenhum de seus componentes. Acompanhe.
Tabela 1.2 Tipos de investimento

Tipo de investimento

Nmero de clientes

Imobilirio

14

Mercado de aes

10

Poupana

22

Fundos de renda fixa

10

Total

56

Fonte: Elaborao do autor (2010).

Tabelas para varivel quantitativa discreta


Nesta seo, vamos verificar como montar uma tabela com varivel quantitativa
discreta. Para saber como so montados estes tipos de tabela, acompanhe os
passos apresentados a seguir.
Observe que a opo de montar uma tabela sem intervalos deve-se ao fato de
esta srie ter um nmero de elementos distintos pequeno.
Para comear, organize os dados em ordem crescente.

22

Probabilidade e Estatstica
Quadro 1.5 Levantamento sobre o nmero de defeitos por pea de uma fbrica de rolamentos

Fonte: Elaborao do autor (2010).

Repare que foram organizados conforme uma ordem numrica crescente (de
0 a 6). A organizao dos dados na forma de lista em ordem crescente ou
decrescente chamada de Rol.
Depois de criar o Rol de dados, escreva, em uma coluna, cada um dos valores
observados. Conte o nmero de vezes em que cada tipo aparece e marque com
traos, ao lado, para representar as aparies. Aps terminar, conte o nmero
de traos para obter o nmero de vezes em que cada valor aparece. Observe o
quadro da contagem dos dados.
Quadro 1.6 Contagem do nmero de elementos X

33

Fonte: Elaborao do autor (2010).

Agora, s montar a tabela, sem esquecer-se de nenhum de seus componentes.

23

Captulo 1
Tabela 1.3 Nmero de defeitos por peas analisadas do lote

Valores que a
varivel pode
assumir

Nmero de defeitos (xi)

Nmero de peas (fi)

33

1
Total (fi) 56

Frequncia
simples

Frequncia
total

Fonte: Elaborao do autor (2010).

Nessa tabela, utilizamos algumas expresses Estatsticas para representao


dos elementos:
os valores que a varivel pode assumir so representados por xi;
o nmero de observaes de cada linha chama-se de frequncia
simples, denotada por fi; e
o nmero total de observaes chama-se de frequncia total e

pode ser denotada por N (tamanho da populao), n (tamanho da


amostra) ou

Tabelas para varivel quantitativa contnua


A opo de montar uma tabela com intervalos prefervel porque esta srie
possui um grande nmero de elementos distintos ou, ainda, quando os valores
apresentam uma natureza de continuidade. Vamos acompanhar um exemplo para
montagem das tabelas para varivel quantitativa contnua2.
Exemplo: os valores anotados, a seguir, representam o volume de vendas mensal
de 56 representantes de uma empresa que fabrica remdios. Os valores esto em
milhares de reais.

2 - Para a varivel quantitativa contnua, utilizam-se intervalos na tabela para representar a srie de dados.
Esses intervalos denominam-se intervalos de classes.

24

Probabilidade e Estatstica
Para comear, novamente, voc deve organizar os dados em ordem crescente (Rol).
Quadro 1.7 Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remdios

15,90

16,08

16,13

16,43

16,59

16,69

16,84

17,05

17,25

17,76

17,76

18,50

19,00

19,67

20,08

20,30

20,58

20,80

20,81

21,36

21,65

21,73

22,49

22,65

22,73

22,77

22,79

23,05

23,08

23,25

23,74

24,11

24,89

24,89

25,30

25,77

26,60

27,43

29,05

29,55

30,43

30,93

30,93

31,53

31,72

32,63

33,05

33,33

33,55

33,86

34,36

34,49

34,76

34,83

35,03

35,13

Fonte: Elaborao do autor (2010).

Note que, como os dados so de uma varivel contnua e so bastante variados,


temos que reduzir os dados calculando intervalos de classes das variveis X, para
tanto, voc deve calcular o nmero e o tamanho dos intervalos.
O nmero de intervalos (k) obtido a partir dos seguintes critrios:
critrio da raiz

k= n;

frmula de Sturges k = 1 + 3,3.log n;


n = tamanho da amostra (poder ser usado N, quando for com a
populao, log, logartimo).
Observe que:
1. ainda que existam dois critrios, em geral, o critrio utilizado o da
raiz: k =

n;

2. o nmero do intervalo (k), em alguns casos, pode ser predefinido;


3. as tabelas devem ter, no mnimo, 4 e, no mximo, 20 intervalos de
classes, para que no haja nem perda, nem excesso de informao;

Para este estudo, sendo n o nmero de elementos da amostra, n = 56, e

k = n , ento , k = 56 logo k = 7,48, nesse caso, temos que arredondar,

pois os intervalos devem ser nmeros inteiros, neste caso, o nmero de


intervalos utilizado ser igual a 7.

25

Captulo 1
Agora, vamos analisar as amplitudes e os limites de classe para determinar o
tamanho dos intervalos.
a. Amplitude total da distribuio (AT): a diferena entre o maior
valor e o menor valor observado.

L (mx.) = Limite mximo (maior valor);
l (mn.) = Limite mnimo (menor valor).

No exemplo que voc est estudando,

Nesta etapa, conveniente que o resultado seja arredondado para cima, a fim de que
no haja perda de informao, sempre, em qualquer caso, arredondar para cima.
b. Amplitude de um intervalo de classe (h): tambm chamada de
tamanho do intervalo de classe, obtida da seguinte forma.

h=

No exemplo:

AT
k

Antes de partir para a construo da tabela, conveniente testar se os clculos


esto corretos. Para que isso acontea, verifique se:

Aplique sobre o exemplo dado:


2,80 . 7 = 19,60 > 19,23
Ou seja, ao somar 19,60 ao menor valor observado, resulta 35,50, que maior do
que o valor da maior observao, 35,13. Note que, dessa forma, o valor real do
Rol de dados estar dentro de um ltimo intervalo de classe:
15,90 + 19,60 = 35,50 > 35,13

26

Probabilidade e Estatstica
Caso no seja satisfeita essa condio, ser necessrio fazer um ajuste,
aumentando o tamanho do intervalo.
Ento, resumindo, segundo o exemplo dado, a tabela ter:
sete intervalos;
cada um com o tamanho de 2,80.
c. Limites de classes: so os extremos de cada classe. O limite
inferior da classe (Li) o menor nmero do intervalo. O limite
superior (Ls) o maior nmero do intervalo.

Escreva os intervalos da tabela.


Tabela 1.4 Passo a passo do clculo dos intervalos de classe

Comece pela primeira classe, escreva o menor valor observado.

15,90

A este valor, some o h (2,8) e encontre o limite superior do intervalo:


15,9 + 2,8 = 18,7. Voc deve escrever na tabela:

15,90 |--- 18,70

Na segunda classe, repita o ltimo valor da classe anterior (18,7), some


o h (2,8) e encontre o limite superior do intervalo: 18,7 + 2,8 = 21,5.
Voc pode escrever na tabela:

18,70 |--- 21,50

Na terceira classe, repita o ltimo valor da classe anterior (21,5), some


o h (2,8) e encontre o limite superior do intervalo: 21,5 + 2,8 = 24,3.
Voc pode escrever na tabela:

21,50 |--- 24,30


24,30 |--- 27,10

Usando este procedimento para as outras classes, voc ter os


seguintes intervalos a seguir, at a stima classe:

27,10 |--- 29,90


29,90 |--- 32,70
32,70 |--- 32,50

Fonte: Elaborao do autor (2010).

Observe que os intervalos so escritos dessa forma: 15,90 |--- 18,70. O que
isso significa?

27

Captulo 1
A representao indica um intervalo fechado esquerda e, aberto direita
[15,90; 18,70), ou seja, os valores deste intervalo chegam perto de 18,70, mas no
exatamente o valor 18,70 est no prximo intervalo: 18,70 |--- 21,50; o valor 21,50
no est neste intervalo, e sim no intervalo: 21,50 |---24,30. E assim por diante.
Agora, a vez de partir para a construo da tabela, sem esquecer-se de seus
componentes. Primeiro, monte a tabela e escreva os intervalos.
Tabela 1.5 Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remdios outubro/2010

Classe

Volume de vendas (em mil reais)

15,90 |--- 18,70

18,70 |--- 21,50

21,50 |--- 24,30

24,30 |--- 27,10

27,10 |--- 29,90

29,90 |--- 32,70

32,70 |--- 35,50

Fonte: Elaborao do autor (2010).

Aps a construo da tabela, s contar e marcar o nmero de valores em cada


intervalo. aconselhvel marcar os limites dos intervalos no Rol e usar os traos
para indicar a contagem ou marcar, conforme o quadro a seguir.
Quadro 1.7 Volume de vendas mensais

15,90

16,08

16,13

16,43

16,59

16,69

16,84

17,05

17,25

17,76

17,76

18,50

19,00

19,67

20,08

20,30

20,58

20,80

20,81

21,36

21,65

21,73

22,49

22,65

22,73

22,77

22,79

23,05

23,08

23,25

23,74

24,11

24,89

24,89

25,30

25,77

26,60

27,43

29,05

29,55

30,43

30,93

30,93

31,53

31,72

32,63

33,05

33,33

33,55

33,86

34,36

34,49

34,76

34,83

35,03

35,13

Fonte: Elaborao do autor (2010).

28

Probabilidade e Estatstica
Tabela 1.6 Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remdios outubro/2010

Classe

Volume de vendas
(em mil reais)

No de
representantes (fi)

15,9 |--- 18,7

12

18,7 |--- 21,5

21,5 |--- 24,3

12

24,3 |--- 27,1

27,1 |--- 29,9

29,9 |--- 32,7

32,7 |--- 35,5

10

Contagem

56

Total (fi)
Fonte: Elaborao do autor (2010).

A tabela fica como est apresentado a seguir.


Tabela 1.7 Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remdios outubro/2010

Intervalo de
classes

Volume de vendas (em mil reais)

No de representantes (fi)

15,9 |--- 18,7

12

18,7 |--- 21,5

21,5 |--- 24,3

12

24,3 |--- 27,1

27,1 |--- 29,9

29,9 |--- 32,7

32,7 |--- 35,5

10

Total (fi)

56

Frequncia
simples

Frequncia
total

Fonte: Elaborao do autor (2010).

29

Captulo 1

Tipos de frequncia
A Estatstica tem como uma de suas finalidades facilitar a anlise e a leitura dos
dados, e, justamente, para isso, um dos mtodos utilizados trabalhar com tipos
de frequncia. O nmero de vezes que o X aparece no Rol de dados representa
a fi, frequncia simples, e, a partir dessa frequncia simples, podemos calcular a
fa (frequncia acumulada), a fr (frequncia relativa) e a fp (frequncia percentual).
Esses tipos de frequncia sero apresentados a seguir.

Frequncia acumulada
Na tabela, na coluna da frequncia acumulada, voc dever escrever o valor
acumulado das frequncias, ou seja, para comear, repita a frequncia simples
da primeira linha e, nas linhas seguintes, some a frequncia simples frequncia
acumulada anterior.
Esse processo dever chegar at a frequncia total

fa = fa(ant) + fi
Sendo:
fa: frequncia acumulada;
fa(ant.): frequncia crescente da classe anterior;
fi: frequncia simples da classe.

Acompanhe com ateno a tabela.

30

Probabilidade e Estatstica
Tabela 1.8 Volume de vendas.
Volume de vendas (em
mil reais)

No de
representantes (fi)

fa

15,9 |--- 18,7

12

12

18,7 |--- 21,5

20

21,5 |--- 24,3

12

32

24,3 |--- 27,1

37

27,1 |--- 29,9

40

29,9 |--- 32,7

46

32,7 |--- 35,5

10

56

Total (fi)

56

Repetir a
primeira fi

Somar a fi desta classe com a


acumulada anterior --> 12 + 8 = 20
Somar a fi desta classe com a
acumulada anterior --> 20 + 12 = 32
Somar a fi desta classe com a
acumulada anterior --> 32 + 5 = 37

Somar sucessivamente at chegar a


frequncia total --> 46 + 10 = 56
Fonte: Elaborao do autor (2010).

A frequncia acumulada d a posio de um determinado X.


Imagine que voc est apresentando um relatrio de vendas da empresa para
a diretoria. Ento, um dos diretores pergunta: Quantos representantes tiveram
vendas menores que 29,9 mil reais? Voc no necessitar fazer contas, s
observar a quinta classe, na coluna da frequncia acumulada na tabela e dizer:
40 representantes.
E se perguntarem: Quantos representantes venderam abaixo de 24,3 mil reais?
Voc vai encontrar a resposta na terceira classe, na coluna com a frequncia
acumulada e responder: 32 representantes.
Observe que o volume de vendas questionado sempre do limite superior de
cada intervalo para baixo.

31

Captulo 1

Frequncia relativa (fr)


o quociente entre a frequncia (fi) da classe e o nmero total de observaes.

fr =

fi
n

Sendo:
fr: frequncia relativa da classe;
fi: frequncia simples da classe;
n: nmero total de observaes (pode-se usar n ou

).

Neste caso, deve-se calcular a frequncia com quatro casas decimais visando ao
prximo passo.
Tabela 1.9 Volume de vendas
Volume de vendas (em
mil reais)

No de
representantes (fi)

fr

15,9 |--- 18,7

12

0,2143

18,7 |--- 21,5

0,1429

21,5 |--- 24,3

12

0,2143

24,3 |--- 27,1

0,0893

27,1 |--- 29,9

0,0536

29,9 |--- 32,7

0,1071

32,7 |--- 35,5

10

0,1786

Total (fi)

56

1,00

Dividir a fi da classe pelo total


fr = = 0,2143

Dividir a fi da classe pelo total


fr = = 0,1429

fr =

= 0,2143

fr =

= 0,0893

Aps calcular a ltima, voc deve calcular


o total, que deve ser 1,00 ou aproximado,
devido aos arredondamentos

Fonte: Elaborao do autor (2010).

Lembre-se: use sempre quatro casas decimais para arredondar a frequncia relativa.

32

Probabilidade e Estatstica

Frequncia percentual (fp)


a frequncia relativa multiplicada por 100. dada em porcentagem (%).

fp = fr . 100

Sendo:
fp: frequncia percentual;
fr: frequncia relativa.
Tabela 1.10 Volume de vendas
Volume de vendas
(em mil reais)

No de
representantes (fi)

fr

fp (%)

15,9 |--- 18,7

12

0,2143

21,43

18,7 |--- 21,5

0,1429

14,29

21,5 |--- 24,3

12

0,2143

21,43

24,3 |--- 27,1

0,0893

8,93

0,0893.100 = 8,93

27,1 |--- 29,9

0,0536

5,36

0,0536.100 = 5,36

29,9 |--- 32,7

0,1071

10,71

0,1071.100 = 10,71

32,7 |--- 35,5

10

0,1786

17,86

Total (fi)

56

1,00

100,00

0,2143.100 = 21,43
0,1429.100 = 14,29
0,2143.100 = 21,43

0,1786.100 = 17,86

Aps calcular a ltima, voc deve calcular


o total, que deve ser 100 ou aproximado,
devido aos arredondamentos
Fonte: Elaborao do autor (2010).

Observe que, ao usar quatro casas decimais para a frequncia relativa, o


percentual ficou com duas casas decimais. Usaremos duas casas decimais em
todos nossos casos.

Para que serve a frequncia percentual?


Mais uma vez, voc est apresentando um relatrio de vendas da empresa
para a diretoria.

33

Captulo 1
E vem aquela pergunta: O que representa, do total, os representantes que
venderam de 32,70 a 35,50 mil reais? Voc poderia responder diretamente, sem
clculos: 17,86%.
E, se perguntarem: Quantos representantes venderam de 24,3 a 27,1 mil reais ou
mais? Voc responderia: 8,93%.
Observe que, nesse exemplo, o volume de vendas questionado sempre um
intervalo. Antes de acompanhar os outros tipos de frequncia, entenda o que
ponto mdio de uma classe.
Ponto mdio de uma classe so os valores da varivel que se encontram
exatamente na metade do intervalo de cada classe.
Para calcular o ponto mdio, usa-se a mdia aritmtica simples dos limites de
cada intervalo.

PM =

Ls + Li
2

Sendo:
PM: ponto mdio;
Ls: limite superior do intervalo;
Li: limite inferior de cada intervalo.
A tabela, a seguir, indica o clculo do ponto mdio para o exemplo que estamos
estudando.
Tabela 1.11 Volume de vendas.
Volume de vendas
(em mil reais)

No de
representantes (fi)

PM

15,9 |--- 18,7

12

17,3

18,7 |--- 21,5

20,1

21,5 |--- 24,3

12

22,9

24,3 |--- 27,1

25,7

27,1 |--- 29,9

28,5

29,9 |--- 32,7

31,3

32,7 |--- 35,5

10

34,1

Total (fi)

56

Fonte: Elaborao do autor (2010).

34

PM =

15,9 + 18,7 = 17,3


2

PM =

18,7 + 21,5 = 20,1


2

PM =

21,5 + 24,3 = 22,9


2

PM =

24,3 + 27,1 = 25,7


2

Probabilidade e Estatstica
Lembre-se deste conceito, o ponto mdio ser usado para outros clculos que
voc ir realizar mais adiante, tais como mdia e desvio padro.

Seo 3
Representao grfica
O grfico constitui outra maneira de se apresentarem os dados estatsticos. Eles
tm a finalidade de mostrar com clareza, veracidade e rapidez os dados que
esto sendo estudados. Alm disso, os grficos propiciam uma noo muito boa
de como algum fenmeno comporta-se.
Por meio de formas geomtricas, os grficos mostram, por rea ou volume, as
diferenas entre as opes de cada varivel.
Tome cuidado ao interpretar um grfico. Assim como os grficos podem dar
informaes rpidas e precisas, sua manipulao pode distorcer a realidade,
provocando tendenciosidade nas informaes.

Observe os grficos a seguir.


Grfico 1.1 Censo demogrfico Brasil 1890 2000

180

Censo Demogrfico - Brasil - 1890 - 2000

Populao (em milhes)

160
140
120
100
80
60
40
20
2000

1990

1980

1970

1960

1950

1940

1920

1900

1890

Anos

Fonte: IBGE (2010).

35

Captulo 1
Grfico 1.2 Censo demogrfico Brasil 1890 2000

Censo Demogrfico - Brasil - 1890 - 2000

180
Populao (em milhes)

160
140
120
100
80
60
40
20
0
1890

1900

1920

1940

1950

1960

Anos

1970

1980

1990

2000

Fonte: IBGE (2010).

Observe que, no Grfico 1.1, a impresso de que a populao aumenta


abruptamente, enquanto que, no Grfico 1.2, a impresso de que a populao
aumenta lentamente. E a nica diferena entre os dois grficos a largura que se
usou para cada um deles. Em alguns casos, isso pode ser muito prejudicial.
Os grficos comunicam as mesmas ideias das tabelas, porm produzem uma
impresso e compreenso mais rpida, mais viva, pois eliminam detalhes
desnecessrios, apresentando somente as caractersticas mais importantes dos dados.
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou no pblico em geral, uma impresso
mais rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido
compreenso do que as sries.
A representao grfica de um fenmeno deve obedecer a certos requisitos
fundamentais para ser realmente til. So eles:
a. simplicidade: o grfico deve ser destitudo de detalhes com
importncia secundria, assim como de traos desnecessrios que
possam levar o observador a uma anlise morosa ou com erros;
b. clareza: o grfico deve possibilitar uma correta interpretao dos
valores representativos do fenmeno em estudo;
c. veracidade: o grfico deve expressar a verdade sobre o fenmeno
em estudo.

36

Probabilidade e Estatstica
Para a construo de grficos, voc dever observar alguns itens que se fazem
necessrios neles:
todo grfico deve ter ttulo e fonte (no rodap), para que o leitor no
tenha a necessidade de voltar ao texto para saber do que se trata;
a escala do eixo horizontal deve ser escrita abaixo deste e dever
crescer da esquerda para a direita;
a escala do eixo vertical deve ser escrita esquerda deste e crescer
de baixo para cima;
cada eixo deve ser identificado com o que est sendo medido ou
representado;
no necessrio colocar linhas de grade (que saem das marcas das
escalas horizontais e verticais), pois estas so opcionais.

Acompanhe, a seguir, um grfico com todos os detalhes citados.


Grfico 1.3 Censo demogrfico Brasil 1890 2000
180

Eixo vertical

Populao (em milhes)

Aqui, a escala
fica a esquerda

160
140
120
100
80
60

Linha de grade

40
20
0
1890

Ttulo e
Fonte

1900

1920

1940

1950

1960

Anos

Grfico 3.3 - Censo demogrfico - Brasil - 1890 - 2000


Fonte: IBGE (2007)

1970

1980

1990

2000
Eixo horizontal

Aqui, a escala
fica abaixo

Antigamente, os grficos eram feitos mo, com a ajuda de rgua, compasso,


transferidor, esquadros e canetas ou giz coloridos. Hoje, podemos contar com
softwares especficos que auxiliam e facilitam na construo de grficos e,
muitas vezes, propiciam mais preciso e clareza. Alm dos softwares especficos
de Estatstica, temos os programas aplicativos de escritrio, que incluem as
chamadas planilhas eletrnicas.

37

Captulo 1
Uma planilha eletrnica utiliza tabelas para a realizao de clculos e permite,
tambm, a criao de vrios tipos de grficos, o que facilita a representao e
anlise de dados estatsticos.
Os principais tipos de grficos so os diagramas, os cartogramas e os pictogramas.

Diagramas
Os diagramas so grficos geomtricos de, no mximo, duas dimenses; para
sua construo, em geral, fazemos uso do sistema cartesiano (eixo X e Y). Os
principais diagramas so os grficos de linhas, colunas, barras, setores ou pizza e
o grfico polar. Veja cada um desses tipos.

Grfico de colunas
usado para apresentar sries temporais, geogrficas e especficas. Formado
por retngulos dispostos verticalmente, de mesma largura (arbitrria), com altura
proporcional s grandezas (variveis) do fenmeno a ser representado.
Todos os retngulos tm base comum no eixo de x e, no eixo de y, os valores das
variveis estudadas. Observe os exemplos na Tabela 2.10 e nos Grficos 2.6 e 2.7.
Tabela 1.12 Mortalidade Infantil, na regio Sul e Sudeste, 2004

Estado

Por mil nascimentos

SC

17,2

RS

14,3

PR

20,0

SP

16,5

RJ

20,9

ES

20,1

MG

21,8

Fonte: Portal Brasil (2004).

38

Probabilidade e Estatstica
Grfico 1.4 Mortalidade Infantil, na regio Sul e Sudeste, 2004

25

Por mil nascimentos

20
15
10
5
0
SC

RS

PR

SP

RJ

ES

MG

Fonte: Portal Brasil (2004).

Grfico 1.5 Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
50

47

45
40

35

Percentual (%)

35

29

30
25
19

20
15
10
5
0
frica

Amrica do Norte

Amrica Latina

sia

Fonte: Population Reference Bureau (2000).

39

Captulo 1
Grfico de barras
Segue as mesmas normas do grfico de colunas, porm os retngulos ocupam
posio horizontal e, por isso, tero base comum no eixo y. tambm mais
indicado para sries geogrficas e especficas.

Grfico de linhas
comum, para quem trabalha na rea de administrao e negcios, observar o
comportamento de uma varivel ao longo do tempo. Por exemplo, um executivo
que acompanha a cotao diria das aes da sua empresa, um gerente que
acompanha o volume semanal de vendas de sua loja ou um engenheiro de
produo que acompanha caractersticas de qualidade do produto que fabrica.

Grfico de setores ou de pizza


usado para mostrar a importncia relativa das propores e construdo a
partir das coordenadas polares:
comparar a parte com o todo;
formado por um crculo, do qual cada parte representa um
percentual da varivel.
Neste caso, utilizamos o mesmo exemplo do grfico de barras, de modo que
voc possa analisar as propores no grfico de setores.

Grficos em colunas ou em barras mltiplas


Este tipo de grfico , geralmente, empregado quando queremos representar,
simultaneamente, dois ou mais fenmenos estudados com o propsito de comparao.
Tabela 1.13 Balana Comercial brasileira (Valores em US$ Milhes), 2005 a 2009

Ano

Exportao

Importao

2005

118.309

73.545

2006

137.807

91.350

2007

160.649

120.610

2008

197.953

173.148

2009

152.252

127.637

Fonte: Base de dados do Portal Brasil (2010).

40

Probabilidade e Estatstica

Valores

Grfico 1.6 Balana comercial brasileira (Valores em US$ milhes), 2005 a 2009

200.000
180.000
160.000
140.000
120.000
100.000
80.000
60.000
40.000
20.000
0

Exportao
Importao

.2005

.2006

.2007

.2008

.2009

Ano

Fonte: Base de dados do Portal Brasil, Banco Central do Brasil,

Ministrio do Desenvolvimento, Siscomex e Fundao


Fonte: Portal Brasil (2010).

Anlise dos dados: observando o grfico, podemos concluir que o saldo da


balana comercial brasileira positivo, pois as colunas em cinza-claro, que
representam as exportaes em todos os anos, so maiores do que as colunas
de cor cinza-escuro, que representam as importaes.
O ano que representou um maior volume de exportao e tambm de importao
foi o de 2008. O menor volume de importao foi no ano de 2005.

Grfico polar
o grfico mais indicado quando temos necessidade de representar variaes
cclicas, ou seja, que se repetem em perodos predeterminados. O grfico polar
mais utilizado em estudos climticos (para sries temporais).
Cartograma
O cartograma a representao sobre um mapa. Este grfico empregado
quando o objetivo o de figurar os dados estatsticos diretamente relacionados
com reas geogrficas ou polticas.
Pictogramas
Pictogramas so construdos a partir de figuras ou conjunto de figuras
representativas da intensidade ou das modalidades do fenmeno.
So mais utilizados em jornais, revistas, cartazes e propagandas, ou seja, quando se
deseja dar um efeito mais atrativo ou chamar a ateno, sem nenhum rigor cientfico.

41

Captulo 1

Representao grfica de uma distribuio


Alguns grficos em Estatstica so usados para interpretaes de informaes,
anlises de dados e, tambm, para a deduo geomtrica de frmulas de
algumas medidas importantes.
Para as distribuies de frequncias simples, so utilizados o histograma e
o polgono de frequncias. E, para as frequncias acumuladas, utilizado o
polgono de frequncias acumuladas.

Histograma
Este grfico muito semelhante ao de colunas, ou seja, formado por um
conjunto de retngulos justapostos, de maneira que a altura de cada retngulo
seja proporcional frequncia simples da classe por ele representada.
construdo no sistema de eixos cartesianos. No eixo horizontal, so marcados
os valores ou intervalos das classes assumidos pela varivel. No eixo vertical,
so marcadas as frequncias simples, que serviro para marcar a altura dos
retngulos, indicando, assim, o nmero de observaes (ocorrncias) de cada
valor ou classe da varivel.
Como a altura de cada retngulo proporcional frequncia simples, a rea de
cada retngulo tambm . Considerando isso, a soma das reas dos retngulos
tambm proporcional frequncia total.
Para construir um histograma:
desenhe os eixos vertical e horizontal;
faa as escalas em cada um dos eixos no horizontal, os intervalos
de classe; e, no vertical, a frequncia;
desenhe os retngulos que representam cada intervalo com a
mesma largura de cada intervalo e com a altura proporcional s
frequncias dos intervalos;
no se esquea de escrever o ttulo e a fonte.

Observe o exemplo na Tabela 1.12 e no Grfico 1.7.

42

Probabilidade e Estatstica
Tabela 1.14 Quantidade de xido de enxofre

Quantidade de xido de
enxofre

N de meses (fi)

6,2 |--- 9,9

9,9 |--- 13,6

10

13,6 |--- 17,3

11

17,3 |--- 21,0

20

21,0 |--- 24,7

13

24,7 |--- 28,4

28,4 |--- 32,1

3
70

Total
Fonte: Elaborao do autor (2010).

Grfico 1.7 Emisso de xido de enxofre nos ltimos 70 meses (em toneladas)

25
20

No meses

20

15

13
10

10

11
7

5
5

6,2 |--- 9,9

9,9 |--- 13,6

13,6 |--- 17,3

17,3 |--- 21,0 21,0 |--- 24,7

24,7 |--- 28,4 28,4 |--- 32,1

Fonte: Elaborao do autor (2010).

H uma analogia dos histogramas com os grficos de barras. Contudo, nos


grficos de barras, no h necessidade de se usar escala horizontal contnua,
alm de no ser necessria a rigidez de construo que tm os histogramas.

43

Captulo 1
Polgono de frequncias
Unindo por linhas retas os pontos mdios das bases superiores dos retngulos
do histograma, obtm-se outra representao dos dados, denominada
polgono de frequncias.
Voc pode observar que a rea do histograma igual rea abaixo do polgono
de frequncias, ou seja, os retngulos que ficam fora so compensados pelos
tringulos que esto adicionados por dentro.
Grfico 1.8 Emisso de xido de enxofre (em toneladas)

25
20

No meses

20

15

13
10

10

11
7

5
5

6,2 |--- 9,9

9,9 |--- 13,6

13,6 |--- 17,3

17,3 |--- 21,0 21,0 |--- 24,7 24,7 |--- 28,4 28,4 |---32,1

Fonte: Elaborao do autor (2010).

Voc tambm ter a oportunidade de adquirir mais uma importante ferramenta


para utilizar na anlise e interpretao de dados: a representao grfica.
Voc ir conhecer alguns tipos de representao grfica mais utilizados e suas
caractersticas.
Poder constatar que os dados representados por meio de grficos, muitas
vezes, facilitam a leitura e a compreenso de algum fenmeno ou acontecimento.

44

Probabilidade e Estatstica

Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.
1. Analise os conceitos de censo e estimao e descreva a principal diferena
entre os termos.
2. Ao escolher os elementos de uma amostra, o que voc deve considerar para
que ela seja representativa? Por qu?
3. Como voc pde acompanhar, existem dois tipos de variveis: a qualitativa,
que est dividida em nominal e ordinria, e a quantitativa, que est dividida em
contnua e discreta. Identifique, no seu dia a dia, pelo menos um exemplo de cada
uma dessas variveis e escreva-as no quadro a seguir.
Varivel

Exemplo

Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contnua

4. Ao planejar uma pesquisa sobre uma determinada sndrome, um pesquisador


tem a inteno de usar um questionrio para a coleta de dados e, tambm,
planeja fazer um levantamento de dados no Ministrio da Sade, para que possa
realizar comparativos. Como consequncia disso, ele ter que trabalhar com dois
tipos de dados: os resultantes dos questionrios e os resultantes do levantamento
no Ministrio. Classifique os dois tipos de dados.
a. Os dados coletados por meio de questionrio so:________________
b. Os dados coletados no Ministrio so:__________________________

45

Captulo 1
5. Classifique cada uma das variveis a seguir em qualitativa nominal ou ordinal
e em quantitativa discreta ou contnua.
Descrio da varivel
Saldo em conta corrente em R$:
Idade do cliente:
Sexo do cliente:
Classe econmica:
Estado civil:
Nmero de defeitos do produto:
Consumo de energia em kWh:
Nmero de filhos:
Comprimento da pea:
Tempo de espera em caixa eletrnico
(em minutos):
Nome de pas exportador de petrleo:
Grau de satisfao no atendimento
em uma loja comercial:
Nmero de alunos de uma
universidade:

46

Classificao

Probabilidade e Estatstica
6. Um relatrio recente distinguiu em seis tipos os principais motivos de tenso
(estresse). A pesquisa realizada para provar isso resultou nos dados a seguir
(dados fictcios).
MP

MC

DO

DG

MF

DM

MF

MP

DG

MC

MC

MF

MF

MC

MC

MF

MC

MP

DO

MP

MP

MP

DM

MP

DO

MP

DM

DG

DM

MC

MF

MF

MF

MF

MF

DO

MP

DG

MP

DG

MF

MC

MF

MP

DO

DO

DO

DM

MF

MC

MF

DM

MC

MC

DG

DO

MF

DG

MF

MC

Legenda: tipos de fobias


MF: Morte de um filho;
MC: Morte do cnjuge;
MP: Morte dos pais ou irmos;
DO: Divrcio;
DG: Doena grave;
DM: Demisso.

Monte a tabela de frequncia simples, no esquecendo de todos seus


componentes.

7. Uma empresa procurou estudar a ocorrncia de acidentes com seus


empregados, tendo, para isso, realizado um levantamento abrangendo um
perodo de 36 meses. No levantamento, foi observado o nmero de operrios
acidentados para cada ms. Os dados correspondentes esto expostos a seguir.
4

Levando em considerao os dados apresentados, monte a tabela com as


variveis quantitativas discretas.

47

Captulo 1
8. Os dados a seguir representam a renda de uma amostra de famlias de um
bairro de classe baixa de Florianpolis, em reais (dados fictcios). Construa
a tabela de distribuio de frequncias. Usar k = 6 (nmero de intervalos).
Sugesto: ao calcular o h (tamanho de cada intervalo), arredonde para um nmero
inteiro. Exemplo: 3,84 4
115

121

117

124

122

116

123

118

123

119

123

126

128

122

112

125

124

126

125

121

129

127

128

129

113

115

116

124

119

118

126

129

116

127

123

121

9. Uma empresa procurou estudar a ocorrncia de acidentes com seus


empregados, tendo, para isso, a Comisso Interna de Preveno de Acidentes
(CIPA) realizado um levantamento abrangendo um perodo de 36 meses, em que
foi observado o nmero de operrios acidentados em cada ms. A tabela abaixo
resume estes dados:
Nmero de operrios acidentados em cada ms

Nmero de
acidentados

Nmero de
meses

Total (fi)

36

Fonte: Elaborao do autor (2006).

48

fa

fr

fp (%)

Probabilidade e Estatstica
Complete a tabela com as frequncias acumulada, relativa e percentual. Depois,
responda as perguntas.
a. Em quantos meses a empresa teve um nmero de funcionrios
acidentados menor do que 6? ______
b. Em quantos meses a empresa teve um nmero de funcionrios
acidentados maior ou igual a 5? ______
c. Qual foi o percentual de meses em que a empresa verificou 5
funcionrios acidentados? ______
d. Qual foi o percentual de meses em que a empresa verificou 7
funcionrios acidentados? ______

10. A seguir, voc tem uma distribuio de frequncias e um sistema de eixos.


Construa o histograma e o polgono de frequncias para essa distribuio usando
o sistema de eixos (no se esquea de todos os componentes de um grfico,
inclusive as escalas dos eixos, ttulo e fonte): tempo de sono, em minutos,
induzido em ratos por injeo de certo qumico, na dosagem de 40 mg por quilo.
Tempo de sono (em min.)

Nmero de ratos

7 |--- 12

12 |--- 17

17 |--- 22

17

22 |--- 27

27|--- 32

32 |--- 37

49

Captulo 2

Medidas de posio e disperso

Seo 1
Medidas de posio
Neste captulo, voc vai obter mais ferramentas de estatstica descritiva para auxililo a compreender e a utilizar a Estatstica no seu dia a dia profissional. O objetivo
aqui estudar medidas importantes e bastante utilizadas nos mtodos estatsticos.
O clculo de medidas como a mdia, a moda e a mediana, e os conceitos
apresentados neste captulo, so de grande valia no seu cotidiano profissional,
pois fornecero dados que sero pertinentes para o entendimento de algum fato
ou acontecimento. Chamamos essas medidas de medidas de posio.
Contudo, conhecer as interpretaes dessas medidas no basta por si s.
Por meio delas, podemos chegar a algumas concluses, mas estas no so
suficientes, por isso, voc vai estudar, tambm, medidas que iro auxili-lo na
avaliao do comportamento das sries de dados com relao sua mdia.
Chamamos essas medidas de medidas de disperso.
Muitas vezes voc ir deparar-se com uma massa de dados grande o bastante
para que a leitura e a anlise tornem-se muito difceis. Ento, como fazer para
tirar informaes relevantes e resumir os dados de forma eficaz nesses casos?
Usando medidas estatsticas. Neste captulo, vamos ver algumas delas.
As medidas de posio, assim chamadas pela posio que elas ocupam na srie
estatstica, quando bem utilizadas e interpretadas, podem ser teis, no s por
elas mesmas, mas tambm auxiliando o clculo de outras medidas.

51

Captulo 2
Alm de tudo, elas facilitam o estudo de grandes volumes de dados, pois as
medidas de posio podem resumir as informaes, dando a voc uma noo do
comportamento do todo. As medidas de posio esto divididas da seguinte maneira:
a. Medidas de tendncia central: so valores da varivel que tendem
a estar no centro da srie, por isso o nome. Referem-se ao valor da
varivel que est, seno no centro, perto dele. Est dividia em trs
tipos: mdia, mediana e moda.
b. Separatrizes: so valores da varivel que dividem a srie ordenada de
dados em partes que contm a mesma quantidade de observaes.

Medidas de Tendncia Central


a. Mdia
A mdia uma das medidas mais importantes dentro da Estatstica. Ela o
ponto de equilbrio de uma srie de dados. Veja a figura a seguir, extrada do livro
Introduo Estatstica, Triola (1999).
Figura 2.1 A mdia como ponto de equilbrio

Fonte: Triola (1999, p. 32).

Vrios tipos de mdias podem ser calculados para uma massa de dados. A mais
importante a mdia aritmtica, que voc ir estudar nesta seo.
A mdia aritmtica a soma de todos os elementos de uma srie de dados,
dividida pelo nmero de elementos que compe essa srie. Veja a seguir
como represent-la.

52

Probabilidade e Estatstica
Notao:
= mdia dos dados de uma amostra.
= mdia dos dados de uma populao (em que = 12 letra do alfabeto grego,
l-se como mi).

a. A mdia aritmtica para dados brutos


Agora, voc vai calcular a mdia para dados que no foram organizados em
tabelas, ou seja, esto conforme foram coletados, brutos.
A soma de todos os valores dividida pelo nmero de valores.

Em que:
n = nmero de valores da srie (ou tamanho da amostra);
xi = valores da srie.

Veja, a seguir, um exemplo bem detalhado para compreender como realizar os


clculos.
Um exemplo bem tpico calcular a mdia das notas das provas. Digamos que as
notas de uma disciplina cursada por voc sejam: 7; 7,8; 6 e 8, ento a mdia ser:

b. A mdia aritmtica para dados agrupados


Agora, voc vai calcular a mdia para dados que foram organizados em tabelas, ou
seja, aps a coleta, eles foram organizados em categorias e escritos em uma tabela.
b.1 Dados agrupados sem intervalos (varivel discreta)
Para os dados agrupados (em tabela), sem intervalos, utiliza-se a frmula descrita
a seguir, em que cada frequncia simples pode ser considerada como peso. Por
isso que se chama, tambm, de mdia aritmtica ponderada (pesos).

53

Captulo 2
A soma de todos os valores multiplicados por sua frequncia simples dividida
pela soma das frequncias (frequncia total).

Em que:
n = nmero de valores da srie (ou tamanho da amostra);
xi = valores da srie;

fi = frequncia simples de cada xi.


Veja, na sequncia, um exemplo. Calcule a mdia dos dados representados na
tabela abaixo.
Tabela 2.1 Nmero de filhos por famlias de um bairro de Florianpolis

No de filhos (xi)

No de famlias (fi)

xi . fi

16

16

11

22

2 x 11 = 22

27

16

3 x 9 = 27

14

Total (fi)

56

92

0 x 14 = 0
1 x 16 = 16

xi.fi = 92
Somar as frequncias simples

Fonte: Elaborao do autor (2006).

Veja, agora, como calcular passo a passo.

Passo 1: some a coluna das frequncias simples (fi) para obter fi (frequncia total).

fi = 56
Passo 2: multiplique cada xi por sua correspondente fi e escreva o resultado na
coluna xi.fi.

54

Probabilidade e Estatstica

Passo 3: some os valores calculados no passo 2 e escreva a soma no final da


coluna. Esse resultado o xi.fi.

xi.fi = 92
Passo 4: divida o resultado do passo 3 (xi.fi) pelo resultado do passo 1 (fi).

Como interpretar esses dados? O valor mdio da srie 1,64, ou seja, a mdia
de filhos por famlia de 1,64 filhos. Analisando dessa maneira, pode parecer um
absurdo, mas voc pode concluir que a mdia de filhos por famlia de 1 a 2 filhos.
Ou de, aproximadamente, dois filhos, arredondando para cima.

b.2 Dados agrupados com intervalos (varivel contnua)


Para os dados agrupados em tabela, com intervalos, voc deve utilizar a frmula
descrita a seguir, semelhante quela utilizada para dados sem intervalos, entretanto,
por estarmos usando intervalos, usamos os pontos mdios para representar xi.
A mdia, da mesma forma que para varivel discreta, a soma de todos os
pontos mdios (x) multiplicados por sua frequncia simples, dividida pela soma
das frequncias (frequncia total).

Em que:
n = nmero de valores da srie (ou tamanho da amostra);
PM = ponto mdio do intervalo;

fi = frequncia simples de cada intervalo.


Quando trabalhamos com dados agrupados em intervalos, passamos a trabalhar
com a perda dos valores individuais, ou seja, sabemos a frequncia de cada
intervalo, mas no sabemos exatamente quais so os valores contidos nele
(intervalo). Por esse motivo, o clculo da mdia, nesse caso, feito com o uso do
ponto mdio. A mdia, sendo assim, um valor aproximado.

55

Captulo 2
Veja o exemplo a seguir para compreender melhor.
Calcule a mdia dos dados representados como na tabela abaixo.
Tabela 2.2 Quantidade emitida de xido de enxofre (SO), em toneladas, pelas fbricas do distrito
industrial de Florianpolis

Qtde. de SO
(em ton.)

No de meses

15,9 |-- 18,7

(15,9 + 18,7)/2 = 17,3

PM

PM.fi

12

17,3

207,6

18,7 |-- 21,5

20,1

160,8

21,5 |-- 24,3

12

22,9

274,8

22,9 x 12 = 274,8

24,3 |-- 27,1

25,7

128,5

25,7 x 5 = 128,5

27,1 |-- 29,9

28,5

85,5

29,9 |-- 32,7

31,3

187,8

32,7 |-- 35,5

10

34,1

341

Total (fi)

56

(fi)

1386

17,3 x 12 = 207,6
20,1 x 8 = 160,8

xi.fi = 1386

Somar as frequncias simples


Fonte: Elaborao do autor (2006).

Veja, a seguir, como calcular passo a passo.

Passo 1: some a coluna das frequncias simples (fi) para obter fi (frequncia total).

fi = 56
Passo 2: calcule o ponto mdio de cada intervalo.

Passo 3: multiplique cada PM por sua correspondente fi e escreva o resultado na


coluna PM.fi.
Passo 4: some os valores calculados no passo 3 e escreva a soma no final da
coluna; esse resultado o PM.fi.

PMi.fi = 1386
Passo 5: divida o resultado do passo 4 (PM.fi) pelo resultado do passo 1 (fi).
= 1386/56=24,75
Como interpretar o resultado? A quantidade mdia de xido de enxofre emitida,
em 56 meses, foi de 24,75 toneladas.

56

Probabilidade e Estatstica

b. Mediana
A mediana um valor que divide a srie de dados em duas partes iguais, ou seja,
o valor observado que est no meio da srie.
Notao:
Me = Mediana (tambm usado md).

a. Mediana para dados brutos


Agora, voc vai calcular a mediana para dados que no foram organizados em
tabelas, ou seja, esto conforme foram coletados, brutos. Aps a ordenao
crescente dos dados, determinamos o nmero de elementos (n) do mesmo.
Separamos em dois casos:
a.1) quando o n (tamanho da amostra) mpar o clculo da posio da
mediana deve ser conforme segue:

a.2) quando o n (tamanho da amostra) par o clculo da posio da mediana


deve ser realizado com a seguinte frmula:
e

Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) mpar.

Calcular a mediana da srie X: 5, 30, 27, 9, 15, 19, 24, 20, 31.
Passo 1: ordene os valores de forma crescente

5, 9, 15, 19, 20, 24, 27, 30, 31.

Passo 2: o nmero de elementos 9 ( n = 9, mpar).


Passo 3: calcule a posio da mediana.

57

Captulo 2

Passo 4: a mediana o 5 elemento, volte para rol de dados e conte at o quinto x.


Me = 20 (a resposta sempre me X).
1

15

19

20

24

27

30

31

Como interpretar esses dados? 50% dos valores da srie so menores ou iguais
a 20, e 50% dos valores da srie so maiores ou iguais a 20.

Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) par.

Para voc encontrar a mediana, preciso calcular o ponto mdio dos dois valores
que ocupam as posies calculadas.
Calcular a mediana da srie X: 5, 30, 27, 9, 15, 19, 24, 20.
Passo 1: ordene os nmeros de forma crescente

5, 9, 15, 19, 20, 24, 27, 30.

Passo 2: o nmero de elementos 8 ( n = 8, par).


Passo 3: calcule as duas posies, Pos1 e Pos2.

Passo 4: a mediana est entre o 4 e o 5 elemento.

15

19

19,5

20

24

27

30

Como interpretar esses dados? 50% dos valores da srie so menores do que
19,5, e 50% dos valores da srie so valores maiores do que 19,5.

58

Probabilidade e Estatstica
Voc viu como se encontra a mediana para dados brutos? Assim como voc
estudou na mdia, aqui, tambm para efeito de clculo, voc usar diferente
tratamento quando se tratar de dados agrupados com intervalos (varivel
contnua) e dados agrupados sem intervalos (varivel discreta).

b. Mediana para dados agrupados


Se os dados esto apresentados na forma de uma tabela, eles j esto
naturalmente ordenados. Ento, vamos calcular a mediana para dados agrupados
sem intervalos e com intervalos de classe. Observe o exemplo.
Tabela 2.3 Idade de 50 alunos de uma universidade

Nmero de
alunos

fac

18

18

21

19

17

38

22a a 38a posio

20

46

39a a 46a posio

21

50

47a a 50a posio

Total

50

Idade (anos)
17

1a a 3a posio
4a a 21a posio

Fonte: Elaborao do autor (2010)

Para facilitar a localizao dos termos centrais, construmos a frequncia


acumulada crescente (fac).
O primeiro passo encontrar a posio em que se encontra a mediana.
Logo:
e
O resultado indica que a mediana est na 250 e 260 posio, ento precisamos
verificar os valores na terceira coluna da frequncia acumulada. Temos 3 alunos
com 17 anos e 21 alunos com 18 anos. At aqui, j estamos na 240 posio, logo
a posio seguinte a que procuramos. Por isso, na soma 38, esto inclusos os
valores da 250 posio at a 3800.
Para descobrir a mediana, basta verificarmos qual idade corresponde a essa
soma, ou seja, 19 anos.

59

Captulo 2
Assim:
Mediana = 19 anos.
Interpretao
50% dos alunos da srie possuem idade inferior ou igual a 19 anos; e
50% dos alunos da srie possuem idade igual ou superior a 19 anos.

Dados agrupados com intervalo de classe (varivel contnua). Quando a srie


agrupada em classes, a mediana corresponder ao termo que dividir a srie em
duas partes iguais.
A classe que contm a mediana, chamamos classe mediana.
Neste caso, vamos localizar uma classe onde se encontra a mediana, utilizando
a frmula:

Em que:
Li = Limite inferior da classe que contm a mediana;
n = nmero de elementos da srie;

Fa = frequncia acumulada anterior;

fi = frequncia da classe mediana;

h = amplitude do intervalo de classe.

Todas as medidas calculadas para uma varivel contnua sero valores aproximados
para essas medidas, uma vez que, ao agruparmos os dados segundo uma varivel
contnua, h perda de informaes referentes identidade dos dados. (SILVA, 1999).
Exemplo: a tabela a seguir revela o consumo de energia eltrica em 250 residncias
de famlias da classe mdia, com dois filhos. Calcule e interprete o valor mediano.

60

Probabilidade e Estatstica
Tabela 2.4 Consumo de energia eltrica em residncias

Consumo (kWh)

No de famlias

0 |-- 50

50 |-- 100

15

100 |-- 150

32

150 |-- 200

47

200 |-- 250

50

250 |-- 300

80

300 |-- 350

24

Total

250

Fonte: Elaborao do autor (2010)

Para o clculo da mediana, o primeiro passo calcular a frequncia acumulada


crescente, acrescentando os valores em uma nova coluna na prpria tabela.
Tabela 2.5 Consumo de energia eltrica em residncias

Consumo (kWh)

No de famlias

fac

0 |-- 50

50 |-- 100

15

17

100 |-- 150

32

49

150 |-- 200

47

96

200 |-- 250

50

146

250 |-- 300

80

226

300 |-- 350

24

250

Total

250

97a a 146a posio, logo


a mediana encontra-se
nesta classe

Fonte: Elaborao do autor (2010).

O primeiro passo encontrar a posio em que est a mediana.


Logo:

Observando a coluna com a fa, verificamos que a posio 960 vai at 200 kWh,
assim a 125a e 126a a posio seguinte, que vai at a posio 146a. Essa a
classe da mediana que vai de 200 at 250 kWh.

61

Captulo 2
Agora, vamos identificar os dados para aplicar na frmula:
Li = 200 (limite inferior da classe da mediana);
n = 250 (nmero da amostra);

Fa = 96 (frequncia acumulada anterior);

fi = 50 (frequncia da classe mediana);

h = 50 (amplitude do intervalo de classe).

Aps a identificao de todos os valores, vamos aplicar na frmula.

Interpretao
50% das famlias consumiram valor igual ou inferior a 229 kWh; e
50% das famlias consumiram valor igual ou superior a 229 kWh.

c) Moda
A moda um valor que mais se repete em uma srie de dados, ou seja, o valor
com maior frequncia.
Notao:
Mo = Moda.

62

Probabilidade e Estatstica
a. Moda para dados brutos
Agora, voc vai encontrar a moda para dados que no foram organizados em
tabelas, ou seja, que esto conforme foram coletados, brutos. A moda ser o
valor que mais se repete no conjunto de dados.
Veja os exemplos.
Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
O elemento que mais se repete o 22, ento, Mo = 22. Observe que o nmero
20 repete-se, mas no mais do que o 22. Para esse caso, no qual a Mo = 22,
afirma-se que a srie unimodal.
Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Os elementos que mais se repetem so o 20 e o 22, ento Mo1 = 20 e Mo2 =
22. Para esse caso, no qual temos duas modas na srie, afirma-se que a srie
bimodal. Acima de duas modas, mais comum chamarmos a srie de polimodal.
Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.
Na srie anterior, no temos um elemento que mais se repete, pois todos tm a
mesma frequncia. Nesse caso, afirma-se que a srie amodal.
Voc viu como se encontra a moda para dados brutos. Assim como voc estudou
na mdia, aqui, tambm para efeito de clculo, voc usar diferente tratamento
quando se tratar de dados agrupados com intervalos (varivel contnua) e dados
agrupados sem intervalos (varivel discreta).
b. Moda para dados agrupados
Vimos que, para calcular a moda em uma srie com dados no agrupados em
classe (varivel contnua), necessrio observar somente o termo que mais
aparece, ou seja, a frequncia mais alta.
Veja o exemplo na tabela a seguir.
Tabela 2.6 Idade de 50 alunos de uma universidade
Idade (anos)

Nmero de alunos

17

18

18

19

17

20

21

Total

50

Fonte: Elaborao do autor (2010).

63

Captulo 2
Para identificarmos a mdia, precisamos observar a maior frequncia, que,
neste caso, 18. Logo, a idade que corresponde a maior frequncia 18,
ento a moda = 18 anos.
Para uma distribuio de frequncia com os dados agrupados em classe (varivel
continua), pela prpria complexidade como as variveis apresentam-se, teremos
que fazer uso de uma frmula, para podermos identificar a moda.
Um breve histrico da moda para dados agrupados. No incio, o clculo da moda
fazia-se pelo ponto mdio da classe modal: tratava-se de uma forma bem simples
e rudimentar de calcular. Depois, percebeu-se que esse mtodo apresentava
falhas. At que surgiu o matemtico de nome King, o qual props um segundo
modelo, que levou o seu nome, e, durante um perodo longo, passou-se a uslo. Mesmo assim, apesar do avano, percebia-se ainda no ser modelo o ideal.
A partir do processo de Czuber, quando se necessita calcular a moda de uma
distribuio de Frequncia, emprega-se esse modelo. Muitos livros ainda trazem
ambos os modelos: King e Czuber.
Aqui, vamos estudar a Moda Czuber, a qual leva em considerao as variaes
das frequncias das classes anterior e posterior em relao frequncia modal.

Em que,
Li = Limite inferior da classe modal;

d1 = diferena entre a frequncia de classe modal e a vizinha


imediatamente anterior;
d2 = diferena entre a frequncia de classe modal e a vizinha
imediatamente posterior;

h = amplitude do intervalo de classe. Para exemplificar, calcule


a moda para a distribuio, a qual representa os salrios de 25
funcionrios selecionados em uma empresa.

64

Probabilidade e Estatstica
Tabela 2.7 Valor do salrio base de 25 funcionrios de uma empresa

Salrios (R$)

No de funcionrios

1.000 |-- 1.200

1.200 |-- 1.400

1.400 |-- 1.600

10

1.600 |-- 1.800

1.800 |-- 2.000

Total

25

Vizinha imediatamente
anterior
Classe modal
Vizinha imediatamente
posterior

Fonte: Elaborao do autor (2010).

O primeiro passo identificar a classe modal, ou seja, a classe com a maior


frequncia. Logo, a classe modal de 1400 a 1600, com a frequncia 10.
Depois de identificarmos a classe modal, vamos identificar os valores que vamos
precisar para calcularmos a moda.
Li = 1.400 (limite inferior da classe modal);
d1= 10 6 = 4 (diferena entre a frequncia de classe modal e a
vizinha imediatamente anterior);
d2= 10 -5 = 5 (diferena entre a frequncia de classe modal e a
vizinha imediatamente posterior);
h = 200 (amplitude do intervalo de classe).

Substituindo os valores na frmula, temos:

65

Captulo 2
Interpretao
A moda R$ 1.488,89, ou seja, esse o salrio que mais se repete.
Entre mdia, mediana ou moda, qual utilizar? No h uma resposta simples e objetiva
para determinar a medida que seja mais representativa. A seguir, voc encontrar um
resumo das vantagens e desvantagens de cada medida de tendncia central.
Quadro 2.1 Resumo das vantagens e desvantagens de cada medida de tendncia central

Frequncia

Existncia

Leva em
conta todos
os valores?

Afetada
pelos
valores
extremos?

Vantagens e
desvantagens

Sim.

Usada em toda
Estatstica;
funciona bem
com muitos
mtodos
estatsticos.

Medida

Definio

Mdia

Soma de
todos os
valores
divididos pelo
nmero de
valores.

Mais usada.

Existe
sempre.

Mediana

Valor que
divide a srie
na metade.

Usada
comumente.

Existe
sempre.

No.

No.

Costuma
ser uma boa
escolha se h
alguns valores
extremos.

Moda

Valor que
mais se
repete (maior
frequncia).

Usada s
vezes.

Pode no
existir ou,
ainda, pode
haver mais
de uma.

No.

No.

Apropriada para
dados ao nvel
nominal.

Sim.

Fonte: Elaborao do autor (2006).

Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer outros aspectos
relativos ao conjunto de valores, alm de um valor central ou valor tpico. Algumas
informaes relevantes podem ser obtidas por meio do conjunto de medidas:
mdia, extremos, quarts, decs, percents etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.
a. Quarts: divide uma srie ordenada em quatro partes iguais, ou seja,
em partes de 25% cada.

66

Representao: Q1, Q2 e Q3.


Denominao: 1 quartil, 2 quartil e 3 quartil.

Probabilidade e Estatstica
b. Decs: divide uma srie ordenada em 10 partes iguais, ou seja, em
partes de 10% cada.

Representao: D1, D2, .... e D9.


Denominao: 1 decil, 2 decil, ... e 9 decil.

c. Percentil: divide uma srie ordenada em 100 partes iguais, ou seja,


em partes de 1% cada.

Representao: P1, P2, .... e P99.


Denominao: 1 percentil, 2 percentil, ... e 99 percentil.

Note que a mediana tambm uma separatriz. Voc saberia dizer com quais
separatrizes podemos compar-la? Veja:
Q2 = D5 = P50 = Me
Todas essas medidas dividem a srie de dados pela metade.
50% dos valores so maiores do que Q2 = D5 = P50 = Me; e
50% dos valores so menores do que Q2 = D5 = P50 = Me.
Separatrizes para dados brutos
O procedimento bastante semelhante ao da mediana. Preste ateno nas
explicaes a seguir: aps a ordenao crescente dos dados (rol), determinamos
o seu nmero de elementos (n).
Veja o exemplo passo a passo.

Calcular Q1 para a srie de dados X: 22, 15, 20, 22, 28, 20, 20, 22, 25, 26, 16.
Passo 1: ordene de forma crescente (rol)

15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.

Passo 2: o nmero de elementos 11 (n = 11, mpar). Aqui, voc deve adotar


procedimento semelhante ao da mediana e deve usar a mesma frmula para
calcular a posio. Lembre-se: da posio! Assim, voc ir encontrar a mediana, ou
seja, o segundo quartil (Q2).

67

Captulo 2

Passo 3: Pos = 6, ou seja, Q2 ocupa a 6 posio.

10

11

15

16

20

20

20

22

22

22

25

26

28

Observe que o Q2 = 22.


Interpretao para Q2 = 22: 50% dos valores da srie so menores ou iguais
a 22, e 50% dos valores da srie so maiores ou iguais a 22. Antes do Q2, est
formado um novo conjunto de dados, mostrado a seguir.
1

15

16

20

20

20

Nesse caso, a mediana (dessa nova srie de dados) ser o primeiro quartil. s
repetir o mesmo processo feito nos passos 2 e 3.
Passo 4: o nmero de elementos 5 (n = 5, mpar).
Passo 5: Pos = 3, ou seja, Q1 ocupa a 3 posio.

15

16

20

20

20

Observe que o elemento que ocupa a terceira posio o 20, ento Q1 = 20.
Como interpretar esses dados? 25% dos dados observados so menores ou
iguais a 20. J 75% dos valores observados, so maiores ou iguais a 20.

68

Probabilidade e Estatstica

Observe que podem ser usadas, tambm, para calcular a posio do primeiro quartil
e do terceiro, respectivamente, as seguintes frmulas:
Para o primeiro quartil

Para o terceiro quartil

Veja, passo a passo, como voc pode calcular o terceiro quartil.

Passo 1: o nmero de elementos 11

(n = 11).

Passo 2: Pos = 9, ou seja, Q3 ocupa a 9 posio.

10

11

15

16

20

20

20

22

22

22

25

26

28

Observe que o elemento que ocupa a nona posio o 25, ento Q3 = 25.

Percentis
Observao: para calcular a posio dos percentis use a seguinte frmula.
Para o primeiro quartil

= posio da separatriz;

N ou n = tamanho da populao (ou amostra);


i = nmero da separatriz (ex.: P60 = i = 60).

69

Captulo 2
Continuando com o mesmo exemplo, calcule o sexagsimo percentil.
Passo 1: o nmero de elementos 11 (n = 11) e o i = 60.

= 7,2, ou seja,

Passo 2:

entre a 7 e a 8 posies.

10

11

15

16

20

20

20

22

22

22

25

26

28

Passo 3: para calcular o sexagsimo percentil, voc deve encontrar o valor que fica
entre os valores que ocupam a 7 e a 8 posies.
Valor que ocupa a 7 posio = 22.
Valor que ocupa a 8 posio = 22.

Ento,

= 22.

Como interpretar esses dados? 60% dos dados observados so menores ou


iguais a 22. J 40% dos valores observados, so maiores ou iguais a 22.

Decs
Se voc notar, poder comparar os decs com alguns percentis.
Decs

Percentis

10

20

30

40

50

60

70

80

90

Isso mesmo, por exemplo, o D1 = P10, o D2 = P20, o D3 = P30 e, assim,


sucessivamente. Note, tambm, que as interpretaes so as mesmas:

70

Probabilidade e Estatstica
para o primeiro decil, 10% dos valores observados so menores e
90% dos valores observados so maiores;
para o segundo decil, 20% dos valores observados so menores e
80% dos valores observados so maiores;
para o terceiro decil, 30% dos valores observados so menores e
70% dos valores observados so maiores etc.

Continuando com o mesmo exemplo, calcule o terceiro decil. Note que ele igual
ao trigsimo percentil (D3 = P30)! Ser a mesma coisa que calcular P30.
Passo 1: o nmero de elementos 11 (n = 11) e o i = 30.
Passo 2: PD3 = PP30 = 3,6, ou seja, D3 est entre a 3 e a 4 posies.

PD3

10

11

15

16

20

D3

20

20

22

22

22

25

26

28

Passo 3: para calcular o terceiro decil, voc deve encontrar o valor que fica entre os
valores que ocupam a 3 e a 4 posies.
Valor que ocupa a 3 posio = 20.
Valor que ocupa a 4 posio = 20.

Ento, D3 = 20.
Como interpretar esses dados? 30% dos dados observados so menores ou
iguais a 20. E 70% dos valores observados so maiores ou iguais a 20.

Assim como voc estudou na mdia, aqui, tambm para efeito de clculo, voc
usar diferente tratamento quando se tratar de dados agrupados com intervalos
(varivel contnua) e dados agrupados sem intervalos (varivel discreta). No
entanto, para a finalidade deste estudo, no ser includo.

71

Captulo 2

Seo 2
Medidas de disperso
Para compreender melhor o que so as medidas de disperso, acompanhe o
exemplo a seguir.
A realizao de testes em trs grupos de pessoas resultou nos escores
descritos na sequncia.
Tabela 2.8 Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos

Grupos

Escores (em pontos) obtidos por pessoa (10 pessoas)

Total

Grupo 1:

60

Grupo 2:

10

60

Grupo 3:

60

Fonte: Elaborao do autor (2006).

Se voc calcular a mdia dos escores para cada grupo, obter os seguintes resultados.
Para o grupo 1:
ou seja, 6 pontos o escore mdio;

Para o grupo 2:
ou seja, 6 pontos o escore mdio;

Para o grupo 3:
ou seja, 6 pontos o escore mdio.

Observe que os escores mdios dos trs grupos so iguais. E agora, como
diferenciar um grupo do outro? Olhando somente para os dados, voc pode tirar
algumas concluses: no grupo 1, as pessoas tm o mesmo escore; no grupo 2,
os escores so diversificados; e, no grupo 3, existe uma pequena diversificao,
ou seja, os escores esto bem prximos da mdia.

72

Probabilidade e Estatstica
Pode-se afirmar, quanto disperso das sries anteriores, que:
grupo 1: no uma srie em que os dados apresentam disperso
com relao mdia, ou seja, os dados esto totalmente
concentrados na mdia;
grupo 2: uma srie de dados em que os valores observados esto
bastante dispersos, ou seja, apresenta muitos valores distantes da
mdia. Podemos dizer que uma srie dispersa;
grupo 3: h uma pequena diferena de alguns dados com relao
mdia, ou seja, apresenta uma pequena disperso com relao
mdia, os dados esto concentrados em torno da mdia.

Em resumo, nos grupos 1 e 3, a mdia pode servir como uma medida


representativa, mas, no grupo 2, a mdia no resulta representativa.
Para identificar esses tipos de situaes que usamos as medidas de disperso.
Essas medidas so a maneira mais adequada para quantificar a disperso dos
dados e avaliar a representatividade da mdia.
As principais medidas denominadas de disperso absolutas so: amplitude total,
desvio mdio simples, varincia e desvio padro.
O desvio mdio simples, no menos importante, no ser visto neste estudo,
pois, para o objetivo que se pretende alcanar, a varincia e o desvio padro so
mais adequados.

Clculos da varincia e do desvio padro


Para comear a trabalhar com disperso, necessrio que voc conhea as
definies e as formas de representao da varincia e do desvio padro.
A varincia a mdia dos quadrados dos desvios de cada valor da srie com relao
mdia. Ficou complicado? No se preocupe, a seguir voc vai aprender como calcular!

O desvio padro a raiz quadrada da varincia, pois assim ca mais fcil analisar e
comparar com a mdia; se usssemos a varincia, as unidades seriam ao quadrado,
enquanto que o desvio padro apresentaria a mesma unidade de medida que a mdia.

Veja a seguir como represent-las.

73

Captulo 2
Quadro 2.2 Representao do desvio padro

Populao

(x)
(x)

Amostra
S2 (x)

varincia

s (x)

desvio padro

varincia
desvio padro

= 18 letra do alfabeto grego, chama-se sigma.


Fonte: Elaborao do autor (2006).

A varincia e o desvio padro para dados brutos


Neste item, voc vai aprender como calcular a varincia e o desvio padro para dados
brutos. Preste ateno! A frmula para populao e para amostra so diferentes.
O quadro a seguir apresenta as frmulas utilizadas para calcular a varincia e o
desvio padro.
Quadro 2.3 Frmulas para o clculo de medidas de disperso com dados brutos

Medidas

Populao

Amostra

Varincia

Desvio padro
Fonte: Elaborao do autor (2006).

Observao: a diferena entre as duas frmulas da varincia so os


denominadores. Para a populao, usamos n e, para a amostra, usamos n 1.
Como, ao trabalharmos com uma amostra para estimar valores de uma populao,
a variabilidade dos dados maior, ento, dessa maneira, mais indicado usarmos
n 1 para que no subestimemos a disperso. O n 1 usado, nesse caso,
como uma correo para a varincia da amostra. Para amostras com mais de 30
elementos, essa correo torna-se irrelevante.
Para voc entender melhor, imagine que a mdia de depsitos dirios de
uma agncia bancria seja de 120.000 reais e a varincia, de 25.000 reais ao
quadrado. Seria difcil comparar reais com reais ao quadrado. Para tanto, ao fazer
uso do desvio padro, o qual corresponde raiz quadrada de 25.000 reais ao
quadrado, teramos 5.000 reais. E essa a mesma unidade de medida da mdia.

74

Probabilidade e Estatstica
Daremos continuidade ao exemplo, para calcular a varincia e o desvio padro.
Acompanhe a resoluo passo a passo.

Exemplo 1: uma vez dadas as notas: 6; 7; 7,8 e 8.


Passo 1: calcular a mdia: observe que, na mdia para a populao, usa-se a
letra grega .

Passo 2: agora, calcular os desvios ao quadrado


= (6 7,20) = (-1,20)2= 1,4400

= (7 7,20) = (0,20)2 = 0,0400

= (7,8 7,20) = (0,60)2 = 0,3600

= (8 7,20) = (0,80)2 = 0,6400

Passo 3: calcular a mdia dos quadrados dos desvios, ou seja, a varincia. Aqui,
voc vai calcular para a populao e para a amostra.
Caso sejam dados de uma populao:

Ento:
Caso sejam dados de uma amostra:

Ento:

Passo 4: calcular o desvio padro, calculando a raiz da varincia.


Caso sejam dados de uma populao:

Caso sejam dados de uma amostra:

75

Captulo 2
Interpretao dos dados Para dados de uma populao, a variabilidade das
notas de 0,79 pontos. Para dados de uma amostra, a variabilidade das notas
de 0,91 pontos. Ou seja, a mdia 7,20 e para a amostra de notas poderia chegar
a 7,20-0,91 = 6,29 e 7,20 +0,91 = 8,11.

A varincia e o desvio padro para dados agrupados sem


intervalos (varivel discreta)
Agora, voc vai calcular a varincia e o desvio padro para dados que foram
organizados em tabelas, ou seja, aps a coleta, eles foram organizados em
categorias e tabelas, nas quais os dados esto agrupados sem intervalos.
Observe as frmulas que so utilizadas para calcular esse tipo de dados, a
varincia e o desvio padro.
Quadro 2.4 Frmulas para o clculo de medidas de disperso com dados agrupados sem intervalos

Medidas

Populao

Amostra

Varincia

Desvio padro
Fonte: Elaborao do autor (2006).

Acompanhe o exemplo a seguir para compreender como realizar o clculo dos


dados agrupados sem intervalos.
Exemplo: a tabela apresenta dados referentes remunerao de funcionrios de
uma empresa. Foram levantados o nmero de funcionrios e sua faixa salarial, em
nmero de salrios-mnimos.

76

Probabilidade e Estatstica
Tabela 2.9 Remunerao de funcionrios

N de salriosmnimos (xi)

N de
funcionrios (fi)

xi.fi

(x

29

29

157,4381

28

56

49,5292

20

60

2,1780

18

72

8,0820

16

80

44,4560

15

90

106,9335

63

121,1607

135

450

489,7757

fi

xi.fi

)2.fi

(1-3,33)2.29 = 157,4381

S (x
i

)2.fi

Fonte: Elaborao do autor (2010).

Agora, acompanhe o clculo passo a passo.

Passo 1: inicie por somar a coluna das frequncias simples (fi) para obter fi
(frequncia total); fi = 135.
Passo 2: calcule a mdia: multiplique cada xi por sua correspondente fi e escreva
na coluna xi. fi, some os valores calculados e escreva esse resultado no final da
coluna e divida pelo resultado do passo 1 ( fi).

Para facilitar os clculos, arredondamos a mdia em duas casas decimais.


Passo 3: calcule a soma dos quadrados dos desvios e multiplique por fi, esta
coluna vai ser utilizada na parte de cima da frmula da varincia,
- 2 . fi:
1 3,33 = (2,33)2 = 5,4289 . 29 = 157,4381
2 3,33 = (1,33)2 = 1,7689 . 28 = 49,5292
3 3,33 = (0,33)2 = 0,1089 . 20 = 2,1780
4 3,33 = (0,67)2 = 0,4489 . 18 = 8,0802

77

Captulo 2

5 3,33 = (1,67)2 = 2,7785 . 16 = 44,4560


6 3,33 = (2,67)2 = 7,1289 . 15 = 106,9335
7 3,33 = (3,67)2 = 13,4689 . 9 = 121,1607
Some os valores: (

. fi = 489,7757

Neste passo, usa-se quatro casas decimais, deixando para arredondar para duas
casas somente o resultado.
Passo 4: calcule a varincia.
Caso sejam dados de uma populao:

Na varincia, sero usadas quatro casas decimais, pois ainda ser necessrio extrair
a raiz quadrada para chegar ao desvio padro.
Caso sejam dados de uma amostra:

Passo 5: calcule o desvio padro.


Caso sejam dados de uma populao:

Caso sejam dados de uma amostra:

Interpretao dos dados Para dados de uma populao, a variabilidade


do nmero de salrios de 1,90 salrios. Para dados de uma amostra, a
variabilidade do nmero de salrios de 1,91 salrios.

Dados agrupados com intervalos (varivel contnua)


Neste item, voc poder ver como se calcula a varincia e o desvio padro para
dados agrupados com intervalos (varivel contnua).

78

Probabilidade e Estatstica
Observe as frmulas que so utilizadas para calcular esse tipo de dados.
Quadro 2.5 Frmulas para o clculo de medidas de disperso com dados agrupados com intervalos

Medidas

Populao

Amostra

Varincia

Desvio padro
Fonte: Elaborao do autor (2010).

Para o caso de dados agrupados com intervalos, usa-se o ponto mdio PM


de cada intervalo, pois no se tem um valor especfico para usar. O ponto mdio
serve como uma boa aproximao.
Agora, vamos analisar um exemplo para realizar os clculos de medidas de
disperso com dados agrupados com intervalos.
Tabela 2.10 Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remdios outubro/2010
N de vendas
(em mil reais)

N de
representantes (fi)

PM

PM.fi

15,9 |-- 18,7

12

17,3

207,6

666,0300

18,7 |-- 21,5

20,1

160,8

172,9800

21,5 |-- 24,3

12

22,9

274,8

41,0700

24,3 |-- 27,1

25,7

128,5

4,5125

27,1 |-- 29,9

28,5

85,5

42,1875

29,9 |-- 32,7

31,3

187,8

257,4150

32,7 |-- 35,5

10

34,1

341,0

874,2250

Total (fi)

56

1.386

2.058,4200

fi

PMi . fi

(PMi

)2.fi

S (PMi

(17,3 - 24,75)2.12 = 666,0300

)2.fi

Fonte: Elaborao do autor (2010).

Acompanhe os clculos passo a passo.

79

Captulo 2

Passo 1: primeiro, some a coluna das frequncias simples (fi) para obter fi
(frequncia total); fi = 56.
Passo 2: calcule a mdia; nesse caso, calcule o ponto mdio de cada intervalo,

multiplique cada PM por sua correspondente fi e escreva na coluna PM.fi; e some


os valores e divida o resultado pelo resultado do passo 1 (fi). Assim, voc obter:

Passo 3: calcule a soma dos quadrados dos desvios e multiplique por fi, esta
coluna vai ser utilizada na parte de cima da frmula da varincia,
17,3 24,75 = (7,45)2 = 55,5025 . 12 = 666,0300
20,1 24,75 = (4,65)2 = 21,6225 . 8 = 172,9800
22,9 24,75 = (1,85)2 = 3,4225 . 12 = 41,0700
25,7 24,75 = (0,95)2 = 0,9025 . 5 = 4,5125
28,5 24,75 = (3,75)2 = 14,0625 . 3 = 42,1875
31,3 24,75 = (6,55)2 = 42,9025 . 6 = 257,4150
34,1 24,75 = (9,35)2 = 87,4225 . 10 = 874,2250

Some os valores :

. fi .= 2.058,4200.

Passo 4: calcule a varincia.


Caso sejam dados de uma populao:

Caso sejam dados de uma amostra:

Passo 5: calcule o desvio padro.


Caso sejam dados de uma populao:

80

. fi .

Probabilidade e Estatstica

Caso sejam dados de uma amostra:


Interpretao dos dados Para dados de uma populao, a variabilidade


do volume de vendas de 6,06 mil reais. Para dados de uma amostra, a
variabilidade do volume de vendas de 6,12 mil reais.

Interpretao do desvio padro


O desvio padro uma importante medida de disperso. com ele que voc
ir quantificar a disperso dos dados de uma srie com relao sua mdia.
Preste ateno:
quanto maior o valor do desvio padro, mais dispersos esto os
valores. Pode-se dizer, tambm, que mais distantes esto da mdia;
quanto menor o valor do desvio padro, menos dispersos esto os
valores. Pode-se dizer, tambm, que mais prximos esto da mdia.

Veja a figura, a seguir, para compreender melhor o que foi colocado.


Figura 2.2 Quanto mais distantes da mdia, mais dispersos os dados esto

S=0

7
6

S=0,8

S=1,2

f=3,0

3
2
1
1

O desvio padro cresce quando a disperso dos dados aumenta

Fonte: Triola (1999, p. 42).

81

Captulo 2
Outra utilizao do desvio padro
Muitas sries, quando representadas por seu polgono de frequncias, com certo
ajuste nas curvas, apresentam um formato semelhante a um sino, uma curva
simtrica (observando que a mdia, a moda e a mediana esto posicionadas ao
centro), como mostra o grfico a seguir.
Grfico 2.1 Grfico da curva normal

x
Fonte: Elaborao do autor (2006).

Para sries de dados que apresentam esse tipo de representao, podese trabalhar com a rea abaixo do polgono. A rea abaixo proporcional
frequncia total. Essa curva chamada de Curva Normal ou Curvas de Gauss,
e suas principais caractersticas so:
a curva caracteriza-se por ter a forma de um sino;
a curva normal simtrica com relao mdia;
a rea limitada pela curva e pelo eixo das abscissas 1 ou 100%;
a curva assinttica, isto , aproxima-se indefinidamente do eixo
das abscissas sem toc-lo;
a curva normal unimodal, ou seja, possui um s pico ou ponto de
frequncia mxima, ponto este que coincide com a moda, a mdia
e a mediana.
Como relacionar a curva com o desvio padro? Veja a curva a seguir.
Grfico 2.2 Grfico da curva normal

34,13%

2,15%

13,59%

Fonte: Elaborao do autor (2006).

82

34,13%

13,59%

2,15%

Probabilidade e Estatstica
Exemplo: em uma srie em que = 80 e o (x)=3, pode-se interpretar esses
valores da seguinte forma:
os valores da srie esto concentrados em torno da mdia, que de
80 unidades;
o intervalo [ (x); + (x)] contm, aproximadamente, 68,26% dos
elementos da srie, ou seja, o intervalo [77;83];
o intervalo [ 2(x); + 2(x)] contm, aproximadamente, 95,44%
dos elementos da srie, isto , o intervalo [74;86];
o intervalo [ 3(x); + 3(x)] contm, aproximadamente, 99,74%
dos elementos da srie, ou seja, o intervalo [71;89].

A curva normal ser utilizada nos clculos de distribuio de probabilidade

Coeficiente de variao
Sries de dados com mdias iguais
Acompanhe o exemplo: considere dois grupos de pessoas, nos quais foram
feitos levantamentos de suas rendas. Os resultados desse levantamento foram
os seguintes:
Tabela 2.11 Resultado do levantamento de renda de uma populao

Grupo 1

Grupo 2

Mdia: = 122 pontos

Mdia: = 122 pontos

Desvio padro: (x) = 4,5 pontos

Desvio padro: (x) = 7,5 pontos

Fonte: Elaborao do autor (2006).

Compare a disperso das duas sries:


note que as mdias so iguais;
o desvio padro do grupo 1 4,5, e o do grupo 2 7,5; portanto, o grupo
que apresenta maior disperso quanto ao nvel de renda o grupo 2;
concluso: os nveis de renda do grupo 2 so mais dispersos
com relao ao grupo 1 (valores mais distantes da mdia); ou, os
integrantes do grupo 1 tm renda mais semelhantes entre eles do
que os integrantes do grupos 2.

83

Captulo 2
Para comparar duas sries de dados usando medidas de disperso absolutas
(varincia e desvio padro) necessrio que as mdias sejam iguais, caso
contrrio, usamos uma medida de disperso relativa que veremos nesta seo.

Sries de dados com mdias diferentes


Como voc pde observar no item anterior, para comparar duas sries de dados
quanto a suas disperses, pode-se usar valores absolutos dos desvios padro,
mas somente quando as mdias so iguais.
Quando as mdias so diferentes, utiliza-se o Coeficiente de Variao (CV), que
uma medida de disperso relativa.
O coeficiente de variao a relao do desvio com a mdia. Veja a frmula a seguir.
Tabela 2.12 Frmula do coeficiente de variao

Para a populao

Para a amostra

Fonte: Elaborao do autor (2006).

A srie que apresentar maior coeficiente de variao ser a srie de maior


disperso dos dados. O resultado expresso em percentual (%), ou seja, quanto
o desvio padro representa da mdia.
Acompanhe o exemplo a seguir para compreender como realizar o clculo.
Exemplo: considere dois grupos de pessoas, nos quais foram feitos levantamentos
de suas rendas. Os resultados desse levantamento foram os seguintes.
Tabela 2.13 Resultado do levantamento

Grupo 1

Grupo 2

Desvio padro: (x) = 9,8 reais

Desvio padro: (x) = 7,5 reais

Mdia: = 145 reais

Mdia: = 95 reais

Fonte: Elaborao do autor (2006).

84

Probabilidade e Estatstica
note que as mdias so diferentes;
o desvio padro do grupo 1 9,8; e, o do grupo 2 7,5; portanto,
o grupo que apresenta maior disperso absoluta quanto ao nvel de
renda o grupo 1;
como as mdias so diferentes, devemos calcular o coeficiente de
variao, pois, simplesmente pela disperso absoluta, no podemos
afirmar nada (se fossem iguais, bastaria a disperso absoluta).
Para o grupo 1:

Para o grupo 2:

O grupo que apresenta maior coeficiente de variao o grupo 2. Ou seja, os


nveis de renda observados no grupo 2 so mais dispersos com relao ao grupo
1 (valores mais distantes da mdia).
Comparando os dois, voc poderia dizer que, no grupo 1, as pessoas tm a
renda mais prxima da mdia do grupo do que no Grupo 2, que, por sua vez,
as pessoas apresentam nveis de renda mais diferenciados da mdia do grupo,
comparando os dois grupos.
Para comparar a disperso dos dados de duas sries de mdias diferentes, usamos
o coeficiente de variao. Ele compara o desvio padro com a mdia (proporo)
entre o desvio padro e a mdia da srie, sendo, assim, considerado uma forma
mais eficaz de comparao e, portanto, prevalecendo sobre a absoluta.

85

Captulo 2

Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.
1. Uma empresa procurou estudar a ocorrncia de uso de drogas lcitas
bebidas alcolicas por seus empregados, tendo, para isso, realizado um
levantamento sobre o nmero de dias por semana que cada um dos empregados
costuma beber. Calcule e interprete a mdia. Os dados correspondentes so:
Consumo de bebidas alcolicas por semana pelos funcionrios
No de dias (xi)

No de func. (fi)

10

16

14

Total (fi)

64

xi . fi

Fonte: Pesquisa de campo (dados fictcios)

2. Os dados seguintes representam a renda de uma amostra de famlias de


um bairro de classe baixa de Florianpolis, em reais (dados fictcios). Calcule e
interprete a mdia.
Renda de famlias de um bairro de classe baixa de Florianpolis

Renda (R$)

No de famlias (fi)

112 | --- 115

115 | --- 118

118 | --- 121

121 | --- 124

124 | --- 127

127 | --- 130

Total (fi)

Fonte: Dados fictcios

86

36

PM

PM.fi

Probabilidade e Estatstica
3. Nos itens a seguir, esto dois conjuntos de dados. Calcule a mediana para
cada um deles e interprete seus resultados.
a. Conjunto 1
15

19

13

21

16

17

15

12

13

Sugesto: use a tabela a seguir para organizar e posicionar os dados.

b. Conjunto 2
17

18

14

14

15

15

16

16

13

Sugesto: use a tabela a seguir para organizar e posicionar os dados.

4. Nas opes a seguir, esto trs conjuntos de dados. Encontre a moda para
cada um deles e interprete seus resultados.
a. Conjunto 01
7

b. Conjunto 02
5

c. Conjunto 03
5

87

Captulo 2
5. Em um grupo de pacientes acometidos de fobias, foi levantado o tempo
para tratamento, em anos, conforme tabela abaixo. Calcule o Q3, o D9 e o P35 e
interprete seus resultados.

Tempo para tratamento de fobias, em anos:


4

Use a tabela abaixo para organizar e posicionar os dados.

6. Os dados a seguir representam o tempo em minutos usados por um grupo


de seis pessoas na realizao de um teste. Calcule a varincia e o desvio padro,
considerando como uma populao.

Tempo (em min.): 25, 22, 36, 20, 29, 38.

7. Os escores obtidos por cinco pessoas em um teste esto relacionados a


seguir. Calcule a varincia e o desvio padro, considerando como uma amostra.

Tempo: 15, 10, 9, 23, 31.

8. Uma empresa procurou estudar a ocorrncia de uso de drogas lcitas bebidas


alcolicas por seus empregados, tendo, para isso, tem-se realizado um levantamento
sobre o nmero de dias por semana que cada um dos empregados costuma beber.
Calcule a varincia e o desvio padro, considerando que os dados so de uma amostra
(sugere-se utilizar colunas para facilitar o clculo). Os dados correspondentes so:

88

Probabilidade e Estatstica
Consumo de bebidas alcolicas por semana pelos funcionrios

N de dias (xi)

N de
funcionrios (fi)

10

16

14

64

xi . fi

(x

)2.fi

Fonte: Elaborao autor, 2016.

9. Na tabela a seguir, esto relacionados dados relativos idade de um grupo


de 63 estudantes matriculados em uma disciplina da Unisul Virtual. Calcule a
varincia e o desvio padro, considerando que so dados da populao (sugerese utilizar colunas para facilitar o clculo).
Idade dos estudantes da disciplina Estatstica

Idade (xi)

N de estudantes (fi)

17

18

20

19

22

20

10

21

63

xi . fi

(xi )2.fi

Fonte: Dados fictcios elaborados pelo autor.

89

Captulo 2
10. Os dados abaixo representam a renda de uma amostra de famlias de um
bairro de classe baixa de Florianpolis, em reais. (dados fictcios). Calcule a
varincia e o desvio padro, considerando como sendo dados de uma amostra.
Renda de famlias de um bairro de classe baixa de Florianpolis

Renda (R$)

No de famlias (fi)

112 | --- 115

115 | --- 118

118 | --- 121

121 | --- 124

124 | --- 127

127 | --- 130

Total (fi)

36

PM

PM.fi

(PMi

)2.fi

Fonte: Elaborao do autor, 2016.

11. Analise cada caso, comparando quanto disperso dos dados, e responda
as perguntas:
a. Qual das sries apresenta maior disperso absoluta (comparar os
desvios padro)?
b. Qual das sries apresenta maior disperso relativa (comparar os
coeficientes de variao)?
c. Conclua qual das sries realmente apresenta maior disperso (no
se esquea de que o coeficiente de variao mais eficaz para
determinar a disperso de uma srie).
11.1
Srie A

Srie B

= 57; (x) = 5,6

= 96; (x) = 8,2

Srie A

Srie B

= 64; (x) = 12

= 96; (x) = 18

11.2

90

Captulo 3

Probabilidade

Seo 1
Principais conceitos
A partir de agora, voc iniciar o estudo da Estatstica Indutiva, que tem como
base o estudo de probabilidades.
Talvez voc deva estar perguntando-se: probabilidade? O que ? Tenho certeza
de que muitas vezes voc j pensou em possibilidades de algo acontecer. Ser
que vai chover? Ser que serei escolhido para participar de um grupo? Ser que
vou encontrar meu amigo hoje? etc.
Muitas vezes, no podemos prever acontecimentos como esses, ou seja, podem
acontecer ou no. Voc at poderia associar isso tudo sorte ou ao azar, enfim,
ao acaso. E aqui que o estudo de probabilidade entra. Tentar formular e calcular
modelos matemticos que definam essas situaes e possibilitem a voc tomar
suas decises e, assim, conduzir sua vida, suas experincias e seus caminhos;
esse um dos principais objetivos desta unidade.
Nesta unidade, voc tambm conhecer como possvel expressar em
nmeros algumas situaes com a finalidade de possibilitar um melhor
tratamento matemtico a elas. Sero apresentados os tipos de distribuies de
probabilidades e como se calcula probabilidade usando a distribuio discreta e a
distribuio contnua de probabilidades.
Vamos comear com os conceitos de fenmenos, o que um espao amostral
e o que so eventos. Esses so alguns dos conceitos mais importantes que so
utilizados na probabilidade. O objetivo que voc compreenda como aplicar
esses conhecimentos no seu dia a dia.

91

Captulo 3

Fenmenos (ou experimentos)


Voc pode entender por fenmeno quaisquer acontecimentos, sejam eles naturais
ou no. Eles podem ser classificados em dois tipos: determinsticos ou aleatrios.
Fenmenos determinsticos: so fenmenos em que as condies iniciais
determinam um nico resultado.
Fenmenos aleatrios: so fenmenos em que as condies iniciais no
determinam a possibilidade da existncia de um resultado em particular.
Em resumo, quando voc pode determinar o resultado de um fenmeno, voc ir
cham-lo de determinstico, mas quando os resultados do fenmeno no podem
ser determinados, voc ir cham-lo de aleatrio, pois este pode apresentar
qualquer resultado dentro de um grupo de esperados (mais de um).
Veja, a seguir, exemplos de cada um deles.
Exemplo: para ilustrar, considere dois dados diferentes. O dado 1 tem as faces
com o mesmo nmero de pontos em cada face, e o dado 2 um dado normal,
tem as faces com nmeros de pontos diferentes.
Dado 1: tem as faces com o mesmo nmero de pontos;
Dado 2: um dado normal, tem as faces com nmeros de pontos
diferentes e no viciado (observe que um dado viciado aquele
que, ao ser jogado, sempre sai o mesmo nmero).
Fenmeno determinstico: se voc jogar o dado 1 vrias vezes, sob as
mesmas condies, este sempre ir apresentar o mesmo nmero de pontos
na face voltada para cima. Nesse caso, voc pode dizer que um fenmeno
determinstico, pois no existe outra possibilidade de resultado, e possvel
prever qual ser.
Fenmeno aleatrio: se voc jogar o dado 2 vrias vezes, sob as mesmas
condies, este poder apresentar resultados diferentes a cada lanamento.
Nesse caso, voc pode dizer que um fenmeno aleatrio, pois existem vrias
possibilidades de resultado, e no possvel prever qual ser.
A partir do exposto, conclui-se que o estudo de probabilidade baseado nos
fenmenos aleatrios. Voc pode dizer que o estudo de probabilidades est
intimamente ligado ao acaso.

92

Probabilidade e Estatstica

Espao amostral
Observe que quando se trabalha com experimentos que admitem mais de um
resultado, torna-se interessante definir o conjunto de todos esses resultados;
nesse caso, voc pode chamar esse conjunto de espao amostral. O smbolo
para representar o conjunto do espao amostral S (letra maiscula).
Espao amostral o conjunto de todos os possveis resultados de um
experimento (fenmeno) aleatrio.
Veja, a seguir, exemplos sobre o espao amostral.
Ao verificar os exemplos, lembre-se de que o nmero de elementos do conjunto
do espao amostral representado por n(S):

n(S) = nmero de elementos de S.

Exemplo 1: voc pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades. Pode-se construir o seguinte conjunto.

S = {1, 2, 3, 4, 5, 6}: observe que so todas as possibilidades de pontos de um

dado normal.

Exemplo 2: um mdico trabalha com um grupo de pessoas com problemas


de alcoolismo. O grupo composto por cinco pessoas, das quais duas delas
apresentam cirrose e trs no apresentam cirrose (veja legenda).
Cn Pessoa nmero n com cirrose;
Pn Pessoa nmero n sem cirrose.
Exemplo:
C1 pessoa nmero 1 com cirrose;
P1 pessoa nmero 1 sem cirrose.
Pode-se construir o seguinte conjunto:

S = {C1, C2, P1, P2, P3}: observe que so todas as possibilidades entre as

pessoas do grupo.

93

Captulo 3
Exemplo 3: um psiclogo trabalha com um grupo de pessoas e estuda os
distrbios do sono. O grupo composto por sete pessoas, das quais cinco
apresentam distrbios e duas no apresentam distrbios (veja legenda).
Dn Pessoa nmero n com distrbio;
Pn Pessoa nmero n sem distrbio.
Exemplo:
D1 pessoa nmero 1 com distrbio;
P1 pessoa nmero 1 sem distrbio.
Pode-se construir o seguinte conjunto:

S = {D1, D2, D3, D4, D5, P1, P2}: observe que so todas as possibilidades entre

as pessoas do grupo.

Exemplo 4: um grupo de pessoas que apresentam diferenas na cor do cabelo


(veja legenda).
Pn - Pessoa nmero n com cabelos pretos;
Ln - Pessoa nmero n com cabelos louros;
Cn - Pessoa nmero n com cabelos castanhos;
Rn - Pessoa nmero n com cabelos ruivos.
Sabendo que, nesse grupo, tem trs pessoas com cabelos pretos, duas com
cabelos louros, trs com cabelos castanhos e uma com cabelos ruivos, como fica
o conjunto do espao amostral? Pense e anote, a seguir, como voc acha que
fica o conjunto do espao amostral do exemplo.

S = {______________________________________}
Agora, compare se o seu conjunto do espao amostral est igual ao seguinte
conjunto do espao amostral.

S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que so todas as possibilidades

entre as pessoas do grupo.

Qual o nmero de elementos dos espaos amostrais citados nos exemplos


dados? Veja:
No exemplo 1: n(S) = 6;
No exemplo 2: n(S) = 5;
No exemplo 3: n(S) = 7;
No exemplo 4: n(S) = 9.

94

Probabilidade e Estatstica

Eventos
Quando voc tiver que estudar algum experimento aleatrio, dever identificar
as diferentes variaes de resultados possveis dentro do espao amostral.
Voc pode chamar de evento cada uma dessas variaes, ou seja, cada uma
dessas partes (subconjuntos) do espao amostral um evento. O smbolo para
representar o subconjunto de um evento A (letra maiscula).
Um evento qualquer subconjunto do espao amostral determinado pelo
experimento (fenmeno) aleatrio em estudo.
Ao verificar os exemplos, lembre-se de que o nmero de elementos de evento
representado por n(A):
n(A) = nmero de elementos de A.
Usando os exemplos citados anteriormente, voc pode observar:
Exemplo 1: voc pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades.
Pode-se construir o seguinte evento:
A: sair um nmero par na face superior.
A = {2, 4, 6}: observe que so todas as possibilidades de pontos pares de dado normal.

Exemplo 2: um mdico trabalha com um grupo de pessoas com problemas


de alcoolismo. O grupo composto por cinco pessoas, das quais duas delas
apresentam cirrose e trs no apresentam cirrose (veja legenda).
Cn Pessoa nmero n com cirrose;
Pn Pessoa nmero n sem cirrose.
Pode-se construir o seguinte conjunto:
B: ser uma pessoa sem cirrose.
B = {P1, P2, P3}: observe que so todas as possibilidades de pessoas sem cirrose.

Exemplo 3: um professor trabalha com um grupo de pessoas e estuda os


distrbios do humor. O grupo composto por sete pessoas. Cinco delas
apresentam distrbios e duas no apresentam distrbios (veja legenda).

95

Captulo 3

Dn Pessoa nmero n com distrbio;


Pn Pessoa nmero n sem distrbio.
Pode-se construir o seguinte evento:

C: ser uma pessoa com distrbio.


C = {D1, D2, D3, D4, D5}: observe que so todas as possibilidades de pessoas
com distrbio.

Exemplo 4: um grupo de pessoas que apresentam diferenas na cor do cabelo


(veja legenda).

Pn Pessoa nmero n com cabelos pretos;


Ln Pessoa nmero n com cabelos louros;
Cn Pessoa nmero n com cabelos castanhos;
Rn Pessoa nmero n com cabelos ruivos.
Sabendo que nesse grupo voc tem trs pessoas com cabelos pretos, duas com
cabelos louros, trs com cabelos castanhos e uma com cabelos ruivos, como fica
o subconjunto do evento pessoas com cabelos ruivos?
Pode-se construir o seguinte evento:

D: ser uma pessoa com cabelos ruivos.

D = {R1}: observe que a nica possibilidade com cabelos ruivos.


Qual o nmero de elementos dos eventos citados nos exemplos anteriores?
No exemplo 1: n(A) = 3;
No exemplo 2: n(B) = 3;
No exemplo 3: n(C) = 5;
No exemplo 4: n(D) = 1.

Tipos de eventos
Existem trs tipos de eventos, os quais so:
Evento simples: formado por apenas um elemento do espao amostral.

96

Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o exemplo 4).

D = {R1} n(D) = 1

Probabilidade e Estatstica
Evento composto: formado por dois ou mais elementos do
espao amostral.

Exemplo: B: ser uma pessoa sem cirrose. (Veja o exemplo 2).

B = {P1, P2, P3} n(B) = 3

Evento impossvel: no ocorre, seja qual for a realizao do


experimento aleatrio.

Exemplo: F: ser uma pessoa com cabelos verdes naturais. (Veja o


exemplo 4).

F = { } n(F) = 0

Evento certo: quando o evento o prprio espao amostral.


Exemplo: E: ser uma pessoa com alcoolismo. (Veja o exemplo 2).

E = {C1, C2, P1, P2, P3} n (E) = 5 = n(S)

Operaes com eventos


As operaes com eventos so muito semelhantes s operaes com conjuntos,
at porque os eventos nada mais so do que conjuntos. Veja, a seguir, mais
detalhes sobre esse assunto.
Unio de eventos

Se existem os eventos A e B de um espao amostral S, a unio desses eventos


existe se pode ocorrer A ou B.
Figura 3.1 Representao em diagrama da unio entre eventos

S
A

Fonte: Elaborado pelo autor (2006).

A unio de A e B pode ser representada por: A soma B ou AB. A unio


corresponde a toda a rea colorida.

97

Captulo 3
Interseo de eventos

Se existem os eventos A e B de um espao amostral S, a interseco desses


eventos existe se pode ocorrer A e B, simultaneamente.
Figura 3.2 Representao em diagrama da interseco entre eventos

S
A

Fonte: Elaborado pelo autor (2006).

A interseco de A e B pode ser representada por: A vezes B ou AB. A interseco


corresponde a toda a rea colorida.

Complemento de um evento

um evento formado por todos os elementos pertencentes a S, mas que no


pertencem a A.
Figura 3.3 Representao em diagrama do complementar de um evento

S
A

A'

Fonte: Elaborado pelo autor (2006).

Complementar de A pode ser representado por: , A ou CA. O complementar


de A corresponde a toda a rea colorida.

98

Probabilidade e Estatstica
Subtrao de eventos

Voc pode dizer que A menos B se, e somente se, ocorre A e no ocorre B.
Figura 3.4 Representao em diagrama da subtrao de eventos

S
A

Fonte: Elaborado pelo autor (2006).

A subtrao de eventos pode ser representada por A B, que corresponde a


toda a rea colorida.

Eventos excludentes
Dois ou mais eventos so ditos excludentes (mutuamente exclusivos) se a
realizao de um dos eventos excluir a realizao do outro, ou de outros eventos.
Figura 3.5 Representao em diagrama da subtrao de eventos

A
C

Fonte: Elaborado pelo autor (2006).

Se, quando A ocorrer, exclui ocorrerem os outros, isso quer dizer que no h
interseco entre eles! A e B so mutuamente exclusivos, e B e C no so
mutuamente exclusivos.
Agora que voc j estudou os conceitos mais importantes utilizados na
probabilidade, hora de saber os conceitos de probabilidade propriamente ditos
e como so feitos os seus clculos!

99

Captulo 3

Seo 2
Clculo de probabilidade
Nesta seo, vamos estudar os conceitos de probabilidade e a forma de fazer
seus clculos! Acompanhe as duas definies mais importantes dentro do
estudo de probabilidades. So elas: a definio clssica de probabilidade e a
frequncia relativa.
Veja, ento, separadamente, cada uma dessas definies.
Probabilidade clssica
Antes de conhecer como calcular a probabilidade clssica, saiba como ela possvel.
A probabilidade de ocorrer um determinado resultado na realizao de um
experimento igual ao quociente entre o nmero de casos favorveis ao sucesso
(nmero de elementos do evento A) e o nmero de casos possveis (nmero de
elementos do espao amostral S).
Observe a frmula a seguir.
Probabilidade de um evento A ocorrer:
= p = sucesso.

Observao: a probabilidade de no ocorrncia pode ser representada por:


= q = fracasso.

Observe que, se voc quiser o resultado em porcentagem, deve multiplic-lo por


100 ao final.
Veja, a seguir, alguns exemplos do clculo de probabilidade clssica.
Exemplo 1: em um levantamento feito com oito moradores de um condomnio,
verificou-se que dois so casados, dois so solteiros, trs so divorciados e um
vivo. Qual a probabilidade de, ao escolher um morador ao acaso, ele ser casado?
E qual a probabilidade de, ao escolher um morador ao acaso, ele ser divorciado?

100

Probabilidade e Estatstica
Compreenda passo a passo.
Legenda
Estado civil:

C Casado (dois moradores) C1, C2;


S Solteiro (dois moradores) S1, S2;

D Divorciado (trs moradores) D1, D2, D3;


V Vivo (um morador) V1.

Passo 1: identificar os elementos do espao amostral e do evento solicitado.

S: moradores do condomnio
A: moradores casados

B: moradores divorciados

S = {C1, C2, S1, S2, D1, D2, D3, V1};


A = {C1, C2};
B = {D1, D2, D3}.

Passo 2: identificar o nmero de elementos de cada conjunto.


n(S) = 8;
n(A) = 2;
n(B) = 3.
Passo 3: usar a frmula da probabilidade.
Observao: aps efetuar a diviso, s multiplicar por 100 para obter a
probabilidade na forma percentual.
Para o evento A:

Para o evento B:

P(A) = 0,25 ou 25,00%

P(A) = 0,375 ou 37,50%

Passo 4: interpretar os dados.


Como interpretar esses dados? A probabilidade de um morador casado ser escolhido
de 25%, e a probabilidade de um morador divorciado ser escolhido de 37,5%.

101

Captulo 3
Exemplo 2: em um levantamento realizado com um grupo de 118 chefes de
famlias com diferentes vnculos de trabalho, obteve-se os seguintes resultados
(dados fictcios).
Figura 3.6 Resultado do levantamento

Pesquisa dos motivos de estresse


Tipos de vnculo

Evento A

Evento C
Evento B
Espao
amostral

No de
pessoas

Funcionrio pblico municipal

29

Funcionrio pblico estadual

24

Funcionrio pblico federal

20

Comercirio

17

Temporrio

17

Comrcio informal

Total

11
118

n(A)
n(C)
n(B)
Tamanho do espao
amostral - n(S)

Fonte: Elaborado pelo autor (2006).

Se voc escolher ao acaso uma pessoa do grupo pesquisado, qual a


probabilidade de ela ter vnculo do tipo:
a. funcionrio pblico municipal;
b. comercirio;
c. comrcio informal.

Compreenda passo a passo.


Passo 1: identificar os elementos do espao amostral e do evento solicitado.

S: todas as pessoas pesquisadas;


A: pessoa com vnculo do tipo funcionrio pblico municipal;
B: pessoa com vnculo do tipo comercirio;
C: pessoa com vnculo do tipo comrcio informal.
Passo 2: identificar o nmero de elementos de cada conjunto.
n(S) = 118;
n(A) = 29;
n(B) = 17;
n(C) = 11.

102

Probabilidade e Estatstica
Passo 3: usar a frmula da probabilidade.
Obs: aps efetuar a diviso, s multiplicar o resultado por 100 para obter a
probabilidade na forma percentual.
Para o evento A

P(A) = 0,2458 ou 24,58%.

Para o evento B

P(B) = 0,0932 ou 9,32%.

Para o evento C

P(C) = 0,1441 ou 14,41%.

No exemplo anterior, voc calculou a probabilidade para trs eventos. A


seguir, voc montar uma tabela com as probabilidades para todos os eventos
calculados. Siga os passos.

Compreenda passo a passo.


Passo 1: identificar os elementos do espao amostral e do evento solicitado.

S: todas as pessoas pesquisadas (no caso, pessoas acometidas de estresse);


D: pessoa com vnculo do tipo funcionrio pblico estadual;
E: pessoa com vnculo do tipo funcionrio pblico federal;
F: pessoa com vnculo do tipo temporrio.
Passo 2: identificar o nmero de elementos de cada conjunto.
n(S) = 118;
n(D) = 24;
n(E) = 20;
n(F) = 17.

Passo 3: usar a frmula da probabilidade.


Obs: aps efetuar a diviso, s multiplicar o resultado por 100 para obter a
probabilidade na forma percentual.

103

Captulo 3
Para o evento D

P(D) = 0,2034 ou 20,34%.

Para o evento E

P(E) = 0,1695 ou 16,95%.

Para o evento F

P(F) = 0,1441 ou 14,41%.

Passo 4: montar a tabela com as probabilidades correspondentes a cada evento.


Tabela 3.1 Levantamento com 90 chefes de famlias sobre os diferentes vnculos de trabalho

Tipos de vnculo

No de pessoas

Probabilidade

Funcionrio pblico municipal

29

0,2458

Funcionrio pblico estadual

24

0,2034

Funcionrio pblico federal

20

0,1695

Comercirio

17

0,1441

Temporrio

17

0,1441

Comrcio informal

11

0,0932

118

1*

Total
* Repare que a soma 1 ou 100%
Fonte: Elaborao do autor (2006).

Agora que voc j compreendeu o conceito clssico de probabilidade e como


realizar os clculos, hora de compreender o que frequncia relativa e como
realizar os clculos.

Frequncia Relativa

A frequncia relativa de um evento A calculada dividindo o nmero de vezes


que ocorre o evento A pelo total de observao do experimento. chamada,
tambm, de probabilidade avaliada ou probabilidade estimada.
Veja a frmula abaixo.


104

Frequncia relativa de um evento A.

frA = nmero de vezes que ocorreu A


nmero total de observaes

Probabilidade e Estatstica
Na verdade, a frequncia relativa calculada quando voc deparar-se com
situaes em que o clculo da probabilidade de um evento no possvel. Nesse
caso, s possvel o clculo de uma aproximao, a qual, por sua vez, consiste em
analisar o experimento e, com os resultados obtidos, calcular a frequncia relativa.
importante que voc saiba que essa aproximao para o clculo de probabilidade
s ser considervel caso haja um nmero bastante grande de tentativas de
execuo do experimento. Como fazer isso? Veja os exemplos a seguir.

Exemplos do clculo da frequncia relativa.


Em um teste feito com cobaias em laboratrio, foi analisada uma delas e, aps
inmeras vezes, sob efeito de estmulos (comida, reao a dor etc.), ela executou
um comando, que era empurrar uma pequena alavanca. Foi observado que, aps
3500 estmulos, a cobaia executou o comando 875 vezes. Qual a frequncia
relativa para o evento A: a cobaia executar o comando?

Como realizar o clculo passo a passo.


Passo 1: identificar o numerador e o denominador da frmula.
Nmero total de observaes: 3500.
Nmero de vezes que ocorre A: 875.

Passo 2: usar a frmula da frequncia relativa.


Obs: aps efetuar a diviso, s multiplicar o resultado por 100 para obter a
probabilidade na forma percentual.
frA = nmero de vezes que ocorreu A
nmero total de observaes

Passo 3: interpretar os dados.


A frequncia relativa para a cobaia executar a tarefa de 25%; ou, ainda, a
probabilidade estimada da cobaia executar a tarefa de 25%.

105

Captulo 3
Algumas consideraes.

Consideremos S um espao amostral, e A, B, C so eventos contidos em S, ento:


a. para cada evento A 0 P(A) 1 (a probabilidade de A vai de 0 a
1 ou de 0% a 100%);
b. P(S) = 1

c. sejam A, B e C todos os eventos possveis do espao amostral, ento


P(A) + P(B) + P(C) = 1 ou 100%;
d. quando A e B so mutuamente exclusivos: P(A B) = P(A) + P(B);
e. quando A e B no so mutuamente exclusivos: P(A B) = P(A) +
P(B) P(A B);
f. se A, B, C, ... so uma sequncia de eventos mutuamente
exclusivos, ento P(A B C ...) = P(A) + P(B) + P(C) + ....

Seo 3
Distribuio de probabilidades
A varivel aleatria uma ferramenta na anlise estatstica que possibilita a
atribuio de nmeros para resultados de experimentos, adequando, assim, o
problema para um melhor tratamento matemtico. Dentro da Estatstica, ela
considerada uma funo que associa os nmeros aos eventos de um espao
amostral. Voc poder entender melhor se comear analisando um exemplo.

Exemplos de varivel aleatria e distribuio de probabilidades.


Exemplo 1: se o experimento consistir em dois lanamentos de uma moeda, e a
varivel aleatria (v.a.), definida como o n de caras obtidas em dois lanamentos
de uma moeda, ento voc ter:
v.a. X = n de caras obtidas em dois lanamentos de uma moeda;
X definir uma varivel aleatria que poder assumir os valores descritos na
tabela a seguir (K = cara e C = coroa).

106

Probabilidade e Estatstica
Tabela 3.2 Organizao dos resultados e valores

Resultados
1 lanamento

Resultados
2 lanamento

Resultados possveis nos


dois lanamentos

Valor VA

KK

KC

CK

CC

Fonte: Elaborao do autor (2006).

Voc pode observar que existe apenas uma possibilidade para cada situao e o total
de possibilidades 4; ento, o clculo da probabilidade d-se da seguinte forma.

Escrevendo na tabela, atribuindo a probabilidade de cada linha, voc ter


conforme na sequncia.
Tabela 3.3 Distribuio de probabilidade
Resultados possveis
nos dois lanamentos

Valor VA

KK

KC

CK

CC

Probabilidade
/4
/4
/4
/4

Duas possibilidades
de sair uma cara

Fonte: Elaborao do autor (2006).

Essa tabela caracteriza a distribuio de probabilidade, que a probabilidade


de ocorrncia de cada um dos valores da varivel aleatria.
Note que o valor 1 repete-se, no ? Ento, voc pode agrupar e montar uma
nova tabela sem as repeties. claro que se agrupam os valores repetidos. Voc
deve somar as probabilidades, no se esquea disso. Observe a seguir.

107

Captulo 3
Tabela 3.4 Agrupamento de resultados
No de caras (Valor v.a)

Probabilidade

/4

/2

/4

Ao agrupar os
resultados da varivel
aleatria (uma cara -1),
voc deve somar as
probabilidade:

Fonte: Elaborao do autor (2006).

O estudo de probabilidades uma ferramenta de apoio deciso. com base em


seu estudo que voc ter oportunidade de suporte para analisar os experimentos,
organizar suas possibilidades e, ento, partir para a ao, adotando o resultado
que julgar mais eficaz.
A varivel aleatria e a distribuio de probabilidades so muito utilizadas
nesse sentido. Voc pode ver que, a cada valor da varivel, corresponde uma
probabilidade de ocorrncia.
Como a varivel aleatria possibilita a atribuio de valores aos eventos, voc
pode encontrar dois tipos de situao.
Variveis aleatrias discretas: elas podem assumir um conjunto constante
discreto, ou seja, enumervel, finito de valores.
Exemplo: nmero de caras resultante de lanamentos de uma moeda,
quantidade de caminhes de determinado modelo, nmero de defeitos por pea,
entre outros, so exemplos deste tipo de variveis.
Variveis aleatrias contnuas: so as variveis em que no conseguimos
enumerar seus possveis resultados, por estes formarem um conjunto infinito de
valores em um intervalo de nmeros reais.
Exemplo: peso, altura, temperatura, tempo de transporte, custo de uma operao etc.
Baseado nesses dois conceitos, voc pode atribuir a cada um dos tipos de
variveis aleatrias uma distribuio de probabilidades de acordo com o tipo de
varivel, veja a figura a seguir.
Figura 3.7 Tipos de distribuio de probabilidade

Varivel aleatria
discreta

Distribuio discreta
de probabilidade

Varivel aleatria
contnua

Distribuio contnua
de probabilidade

Fonte: Elaborao do autor (2011).

108

Probabilidade e Estatstica
Como voc pde observar, cada tipo de varivel gera um tipo de distribuio de
probabilidade. Em resumo, os tipos de distribuio de probabilidades so:
distribuio discreta de probabilidades; e
distribuio contnua de probabilidades.

Como elas so diferentes, os mtodos de clculos das probabilidades tambm so.


Voc vai estudar, na prxima seo, os modelos mais importantes e mais
aplicados dentro da rea de seu curso, que so a distribuio binomial, para a
varivel discreta, e a distribuio normal, para a contnua1.
Uma distribuio discreta de probabilidade de uma varivel aleatria atribui
probabilidades aos distintos valores dessa varivel. Observe que essa distribuio
no atribui probabilidade para intervalos, e sim para cada valor ou para um
conjunto de valores da varivel.
Uma das principais distribuies discretas a binomial. Veja, a seguir, como se
calcula probabilidade usando esse mtodo.
A distribuio binomial o mtodo utilizado para clculo de probabilidades de
experimentos que se repetem algumas vezes e seguem algumas caractersticas.
A distribuio binomial aplicvel se:
1. o experimento que voc est observando for repetido n vezes
independentes;
2. cada tentativa (repetio) admitir somente dois resultados:
sucesso: denotado por S;
fracasso: denotado por F.

A probabilidade de sucesso denotada por p P(S) = p, e a probabilidade de


fracasso denotada por q P(F) = q.
Importante: a soma das probabilidades de sucesso e fracasso igual a 100%,
ou seja, igual a 1 p + q = 1.
A soma utilizada se voc estiver interessado em estudar o nmero de sucessos
e fracassos sem importar a ordem em que acontecem.

1. Para o bom andamento de seu estudo, importante que voc entenda bem a diferena entre as duas
variveis, a discreta e a contnua!

109

Captulo 3
Diante do exposto, importante salientar que:
a distribuio binomial s aplicvel caso ocorram os dois casos
citados anteriormente;
os termos sucesso e fracasso so usados se o resultado esperado
ocorre ou no, ou seja, depende do objetivo de seu estudo.

Veja o exemplo, a seguir, para compreender como realizar os clculos.


Em um exame, voc deseja saber a probabilidade de erro de uma determinada
questo. Esta apresenta cinco alternativas (a, b, c, d, e) e somente uma est
correta. Qual a probabilidade de sucesso?
Nesse caso, o objetivo estudar a probabilidade de erro, ento, o sucesso
refere-se ao erro. Para calcular a probabilidade de sucesso, voc deve calcular a
probabilidade de erro da questo.

Veja como se calcula passo a passo.


Passo 1: identificar os elementos do espao amostral e do evento solicitado.
Evento A e espao amostral S.

A: errar a questo;
S: todas as opes (a, b, c, d, e).

Passo 2: identificar o nmero de elementos do evento e do espao amostral.

n(A) = 4 (se somente uma est correta, sobram quatro incorretas);


n(S) = 5.

Passo 3: usar a frmula da probabilidade.


a probabilidade de sucesso , ento, p = 0,8.
Qual a probabilidade de fracasso?

110

Probabilidade e Estatstica
Veja, a seguir, passo a passo.
Passo 1: identificar os elementos do espao amostral e do evento solicitado.

B: acertar a questo;
S: todas as opes (a, b, c, d, e).

Passo 2: identificar o nmero de elementos do evento e do espao amostral.

n(B) = 1 (se somente uma est correta);


n(S) = 5.

Passo 3: usar a frmula da probabilidade.


- a probabilidade de fracasso , ento, q = 0,20
Observe:

p + q = 0,8 + 0,2 = 1 ou 100%


Desta forma, para achar o fracasso, poderia diminuir o sucesso 0,80 de 1,
ento: 1-0,80 = 0,20.

Analise o seguinte exemplo: estudar a probabilidade de errar, como no


exemplo anterior. Ainda citando o exemplo anterior: nesse problema, voc
estudou a probabilidade de errar somente uma questo do exame, mas e para
estudar as possibilidades de erro ou acerto de questes de um exame inteiro?
a que entra a distribuio binomial.
No exemplo anterior, voc calculou a probabilidade de sucesso (errar) para
somente uma tentativa (questo). Agora, voc vai calcular, para n tentativas, a
probabilidade de k sucessos. Acompanhe.
Seja X o nmero de sucessos em n tentativas do experimento.
Ento, a frmula para determinar a probabilidade de um dado nmero k de
sucessos dada por:
Em que:

111

Captulo 3
Sendo:

Cn,k = combinao de n elementos organizados em grupos de k elementos;


n = tentativas do experimento;
k = nmero de sucessos desejados;
p = probabilidade de sucesso (ocorrncia do evento);
q = probabilidade de fracasso (no ocorrncia do evento).

Notao: n! (fatorial)

n! = n.(n 1).(n 2). ... .


k! = k.(k 1).(k 2). ... .
Veja, a seguir, exemplos do clculo de probabilidade usando a distribuio binomial.
Exemplo 1: uma prova com quatro questes, cada uma apresenta cinco
alternativas (a, b, c, d, e) e somente uma est correta. Qual a probabilidade de
errar duas questes?
Nesse caso, o objetivo estudar a probabilidade de erro, ento o sucesso referese ao erro. Veja, a seguir, como se calcula passo a passo.
Passo 1: calcular a probabilidade de errar (no caso, sucesso) para cada questo.

A: errar a questo;

S: todas as opes (a, b, c, d, e);


n(A) = 4 (se somente uma est correta, sobram quatro incorretas);
n(S) = 5;
a probabilidade de sucesso , ento, p = 0,80.

Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para cada questo.
Voc pode calcular de dois modos.
1. Primeiro modo de clculo:

B: acertar a questo;
S: todas as opes (a, b, c, d, e);

112

Probabilidade e Estatstica

n(B) = 1 (se somente uma est correta);


n(S) = 5;

a probabilidade de fracasso, ento q = 0,20.

2. Segundo modo de clculo:

p + q = 1 0,8 + q = 1 q = 1 0,8 q = 0,20

Passo 3: identificar cada um dos componentes da frmula.

n = 4 (total de repeties so quatro questes com as mesmas caractersticas);


k = 2 (nmero de sucessos errar duas questes);

p = 0,80 (probabilidade de sucesso, calculado anteriormente);

q = 0,20 (probabilidade de fracasso, calculado anteriormente).


Passo 4: calcular a probabilidade usando a frmula apresentada.

Passo 5: como interpretar esses dados?


A probabilidade de uma pessoa errar duas questes de um teste de quatro questes
de 15,36%. Note que no 50%, pois voc deve levar em considerao que cada
questo tem sua probabilidade e, tambm, voc pde agrupar as questes de vrias
maneiras (errar a 1 e a 3, ou a 2 e a 4, ou a 1 e a 4, e assim por diante).
Tudo o que voc acabou de estudar, neste tpico, o mtodo de clculo de
probabilidade usando a distribuio binomial. A inteno, com esse estudo, que
voc tenha uma noo desse processo, porm sem maiores aprofundamentos.

113

Captulo 3

Clculo de probabilidade usando distribuio contnua de


probabilidade.
Uma distribuio contnua de probabilidade de uma varivel aleatria atribui
probabilidades a intervalos de valores dessa varivel. Note que essa distribuio
atribui probabilidade para intervalos, e no para um valor dessa varivel.
Uma das principais distribuies contnuas a distribuio normal. No decorrer
deste tpico, voc vai estudar um pouco dessa distribuio, alm de aprender a
calcular probabilidade usando esse mtodo.

A distribuio normal.
Como voc estudou anteriormente, quando se utiliza uma varivel aleatria
contnua, pode-se atribuir probabilidade a essa varivel. Conforme a seo anterior,
os processos definidos a partir de contagens conduzem aos modelos que envolvem
variveis aleatrias discretas, enquanto que os processos definidos a partir de
medidas conduzem aos modelos que envolvem variveis aleatrias contnuas.
Figura 3.8 Tipos de distribuies de probabilidade

Contagens

Varivel aleatria
discreta

Medidas

Varivel aleatria
contnua

Fonte: Elaborao do autor (2011).

Podemos citar, como exemplos de variveis contnuas, a altura das pessoas, a


temperatura corporal, o peso, os escores obtidos em testes psicolgicos etc.
Antes de comear o estudo do clculo de probabilidade usando a distribuio
normal, vamos relembrar alguns conceitos.
Considere a distribuio de frequncias e seu histograma a seguir.

114

Probabilidade e Estatstica
Tabela 3.6 Tempo, em minutos, para as entregas urbanas da empresa X

Tempo (em minutos)

N de entregas (fi)

15,9 |--- 18,7

18,7 |--- 21,5

21,5 |--- 24,3

10

24,3 |--- 27,1

14

27,1 |--- 29,9

10

29,9 |--- 32,7

32,7 |--- 35,5

Total (fi)

50

Fonte: Elaborao do autor (2011).

Histograma
Grfico 3.2 Tempo, em minutos, para as entregas urbanas da empresa X

16

No de entregas

14
12
10
8
6
4
2
0
15,9 |-- 18,7 18,7 |-- 21,5 21,5 |-- 24,3 24,3 |-- 27,1 27,1 |-- 29,9 29,9 |-- 32,7 32,7 |-- 35,5

Tempo em minutos
Fonte: Elaborao do autor (2011).

Observe que o grfico construdo no sistema de eixos cartesianos, no


mesmo? No eixo horizontal, so marcados os valores ou intervalos das classes
assumidos pela varivel. No eixo vertical, marcamos as frequncias simples,
que serviro para marcar a altura dos retngulos, indicando, assim, o nmero de
observaes (ocorrncias) de cada valor ou classe da varivel.

115

Captulo 3
Como a altura de cada retngulo proporcional frequncia simples, a rea de
cada retngulo tambm . Considerando isso, a soma das reas dos retngulos
tambm proporcional frequncia total.
Continuando com a recordao, veja, agora, o polgono de frequncias. Para
construir um polgono de frequncia de dados, s unir, por linhas, os pontos
mdios das bases superiores dos retngulos do histograma.
Acompanhe o exemplo a seguir.
Grfico 3.3 Tempo, em minutos, para as entregas urbanas da empresa X

16

No de entregas

14
12

Polgono de
Frequncia

Estes tringulos
compensam os
que ficam fora
do polgono

10
8
6
4
2

,5
35

,7

|-,7
32

29

,9

|--

32

,9
27

,1

|--

27
|-,3
24

|-,5
21

29

,1

,3
24

,5
21
|-,7
18

15

,9

|--

18

,7

Tempo em minutos
Fonte: Elaborao do autor (2011).

Voc pde observar que a rea do histograma igual rea abaixo do polgono
de frequncias, ou seja, os tringulos que ficam fora so compensados por
aqueles que esto adicionados por dentro.
O grfico expressa os tempos que a empresa levou para realizar 100% das
entregas de um determinado perodo.
Voc observou que o polgono de frequncias tem um formato especial? Sim, ele tem
o formato de um sino. Essa curva chamada de curva normal ou curva de GaussLaplace e tem algumas caractersticas bem especiais. Conhea-a no tpico a seguir.

116

Probabilidade e Estatstica

Caractersticas da curva normal.


Analisando o polgono de frequncias da maioria das sries, voc pode observar,
com certo ajuste, que elas aproximam-se de uma distribuio normal, ou seja,
apresentam um grfico semelhante conforme pode ser observado a seguir.
Grfico 3.4 Curva de Gauss-Laplace

X = Me = Mo

Fonte: Adaptado de Silva (1997, p.70).

Principais caractersticas da curva normal.


Dentre as principais, podemos citar algumas, tais como:
a. a curva caracteriza-se por ter a forma de um sino;
b. a curva tem 2 pontos de inflexo (lugar onde a curva modifica-se);
c. a curva normal simtrica com relao mdia ( igual tanto
esquerda, quanto direita da mdia);
d. a rea limitada pela curva e pelo eixo das abscissas 1 ou 100%
(sendo assim, por ser simtrica, tem 50% da rea esquerda e
50% da rea direita da mdia);
e. a curva assinttica, isto , aproxima-se, indefinidamente, do eixo
das abscissas sem toc-lo;
f. a curva normal unimodal, isto , possui um s pico ou ponto de
frequncia mxima, ponto este em que coincidem a moda, a mdia
e a mediana;
g. a funo que define a curva

117

Captulo 3
A distribuio normal de probabilidade usa como base a curva normal.
Sabendo que a rea abaixo do polgono (curva) representa proporcionalmente
a frequncia total da srie, e com o uso da mdia e do desvio padro tem-se
condies de realizar o estudo de concentrao dos dados em torno da mdia.
Com relao rea abaixo da curva, analise o grfico a seguir.
Grfico 3.5 Distribuio normal, com percentuais em referncia ao desvio padro

3 4 ,1 3 %
1 3 ,5 9 %

0 ,5 o u 5 0 %

2 ,1 5 %

X
Fonte: Adaptado de Triola (1999, p.43).

Veja, a seguir, alguns exemplos para compreender como realizar os clculos do


desvio padro.
Em um teste, a mdia dos escores de um grupo de pessoas foi de = 80, e
o desvio padro foi de (x) = 3. Pode-se interpretar esses valores da forma
mostrada na sequncia.
Os valores da srie esto concentrados em torno da mdia:
o intervalo ( (x); + (x)) contm, aproximadamente, 68,26%
dos elementos da srie, ou seja, o intervalo (77; 83) (80 3 = 77
e 80 + 3 = 83);
o intervalo ( 2(x); + 2(x)) contm, aproximadamente, 95,44%
dos elementos da srie, ou seja, o intervalo(74; 86) (80 6 = 74
e 80 + 6 = 86);
o intervalo ( 3(x); + 3(x)) contm, aproximadamente, 99,74%
dos elementos da srie, ou seja, o intervalo (71; 89) (80 9 = 71
e 80 + 9 = 89).

Veja, no grfico a seguir, a ilustrao desse exemplo.

118

Probabilidade e Estatstica
Grfico 3.6 Distribuio normal, com percentuais em referncia ao desvio padro

9 9 ,7 4 %
9 5 ,4 4 %
6 8 ,2 6 %

3 4 ,1 3 %

3 4 ,1 3 %

1 3 ,5 9 %

1 3 ,5 9 %

2 ,1 5 %

71

2 ,1 5 %

74

77

=80

83

86

89

Fonte: Adaptado de Triola (1999, p.43).

Como ler os grficos? A vo algumas sugestes:

o percentual de entregas com tempo entre 77 e 83 minutos de 68,26% (ou,


ainda, a probabilidade de escolher uma entrega que tenha sido feita entre 77
e 83 minutos de 68,26%);
o percentual de entregas com tempo entre 74 e 86 minutos de 95,44% (ou,
ainda, a probabilidade de escolher uma entrega que tenha sido feita entre 74
e 86 minutos de 95,44%);
o percentual de entregas com tempo entre 71 e 89 minutos de 99,74% (ou,
ainda, a probabilidade de escolher uma entrega que tenha sido feita entre 71
e 89 minutos de 99,74%).

Como voc pde observar, os percentuais esto ligados mdia e ao desvio


padro e, por sua vez, determinam os intervalos a serem estudados. Esses
percentuais so obtidos calculando a rea entre a curva e o eixo X, entre os
extremos do intervalo que voc est estudando. Exemplo: (77; 83).
Baseado nesse estudo, voc poder calcular a probabilidade de algum evento
que resulte em um intervalo. Veja como fazer esses clculos no prximo tpico.

119

Captulo 3

Descrio do mtodo de clculo


A probabilidade em uma distribuio contnua de probabilidade (probabilidade
de ocorrncia de um intervalo) obtida calculando a rea entre a curva e o eixo
X, como voc j viu em estudos anteriores. Essa rea calculada com o uso de
uma ferramenta matemtica chamada de integral definida da funo, ou seja,
dada a funo a seguir, a rea entre a curva e o eixo X, no intervalo (a; b),
calculada da seguinte forma.

Grfico 3.7 Distribuio normal, com intervalo definido

f
P (a < x < b )

Fonte: Adaptado de Silva (1997, p.71).

A determinao dessa rea usando o clculo de integral bastante complicada


e no ser usado em seu estudo. Para superar essa dificuldade, utiliza-se outra
distribuio, chamada de Distribuio Normal Padronizada (ou Reduzida). O artifcio
consiste em transformar a varivel X, com mdia e desvio padro , em uma
varivel Z, com mdia 0 e desvio padro 1, para que voc possa fazer utilizao da
tabela de Z (varivel padronizada) com os valores das reas j calculados.
Como padronizar a varivel X e para qu?
Essa padronizao adotada para tornar o clculo de probabilidade da
ocorrncia de intervalo mais fcil e mais simples. Qualquer distribuio X com
as caractersticas citadas anteriormente pode ser transformada na distribuio
normal padronizada (ou reduzida) Z, para que seja possvel o clculo de reas.
A transformao da varivel aleatria X na varivel padronizada d-se mediante o
uso da frmula a seguir.

120

Probabilidade e Estatstica
Clculo da varivel padronizada.

Em que:
X1 = valor da varivel aleatria (limite do intervalo);
= mdia;
= desvio padro.
Acompanhe os exemplos a seguir para compreender como realizar o clculo.

Exemplo 1: a rea a ser calculada est no intervalo que vai da mdia at x1.
Nesse caso, s necessrio o clculo de um limite do intervalo.
Grfico 3.8 e 3.9 Padronizao de uma distribuio normal
P( < x< x1)

x1

P(0 < z< z1 )

z1

Fonte: Adaptado de Silva (1997, p.71).

Nesse caso, a probabilidade de ocorrer o intervalo da mdia at o x1 igual


probabilidade de ocorrer o intervalo de 0 Z1 P(< x < x1 ) = P (0 < z < z1).
Exemplo 2: a rea a ser calculada est no intervalo que vai de x1 at x2. Nesse
caso, necessrio o clculo de dois limites do intervalo (Z1 e Z2).
Clculo da varivel padronizada.
e

121

Captulo 3
Em que:
X1 e X2 = valores da varivel aleatria (limites do intervalo);
= mdia;

= desvio padro.
Grficos 3.10 e 3.11 Padronizao de uma distribuio normal
P(x1< x< x2)

x1

x2

P(z1< Z < z2)

z1

z2

Fonte: Adaptado de Silva (1997, p.71).

Nesse caso, a probabilidade de ocorrer o intervalo entre x1 e x2 igual


probabilidade de ocorrer o intervalo entre Z1 e Z2 P(x1 < x < x2) = P (z1 < z < z2).
At aqui, voc conheceu como padronizar os valores da varivel aleatria X. Agora,
voc ir aprender como usar a tabela2 de reas da distribuio padronizada.
Veja, a seguir, um grfico com representao da rea dada pela tabela.
Grfico 3.12 Distribuio normal padronizada

rea
0

Fonte: Triola (1999, Anexos).

Observe que, conhecendo a rea especificada na tabela, qualquer tipo de rea


poder ser calculada usando a simetria da curva.

2. Com o valor de Z calculado, basta encontrar o valor na tabela (ver tabela no final deste livro didtico).

122

Probabilidade e Estatstica
Observe os exemplos a seguir com ateno.
Exemplo 1: em um levantamento executado por uma empresa de entregas, resultou
que o tempo mdio para a realizao das entregas era de 21 minutos e o desvio
padro foi de 7 minutos. Ao escolher, ao acaso, uma das entregas realizadas, qual a
probabilidade de o tempo para realiz-la estar entre 21 e 28 minutos?
Calculando passo a passo.
Passo 1: identificar todos os elementos que compem o problema.
mdia: = 21;

desvio padro: (x) = 7;


os limites do intervalo: como um dos limites a prpria mdia, voc
s ter que calcular um Z, o outro limite 28 X = 28.
Passo 2: calcular a varivel padronizada Z.
Z=1
Passo 3: identificar, no grfico, qual a rea que voc deve encontrar.
Grficos 3.13 e 3.14 Padronizao de uma distribuio normal

rea
=21

x=28

rea
0

z=1

Fonte: Elaborao do autor (2011).

Passo 4: procurar, na tabela, o Z = 1,00 e encontrar sua rea correspondente.

123

Captulo 3

Primeiro, voc deve procurar o valor


1,0 na primeira coluna.
Depois, procurar, na primeira linha,
o valor 0,00 ( como se separasse o
nmero 1,00 em dois, uma parte seria
1,0 e a outra seria o 0,00).
No cruzamento da coluna em que
est o 0,00 e da linha em que est o
1,0, voc encontrar um nmero (no
caso 0,3413).
Esse nmero a rea entre Z e 0.

Z
0,0
0,l
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3

0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032

0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049

0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066

Passo 5: responder e interpretar.


P(21 < x < 28) = 0,0000 + 0,3413 ou 34,13%
A probabilidade do tempo para realizar uma entrega estar entre 21 e 28
minutos de 34,13%.

Exemplo 2: em mdia, a vida til de um modelo de mquina de empacotar de


24 anos, com um desvio padro de 6 anos. Levando em considerao que a vida
til desse tipo de mquina distribui-se normalmente, qual a probabilidade de uma
mquina, adquirida recentemente pela empresa, durar entre 17, 52 e 29,7 anos?
Calculando passo a passo.
Passo 1: identificar todos os elementos que compem o problema.
a mdia: = 24;

desvio padro: (x) = 6;


os limites do intervalo: como os limites so diferentes da mdia,
voc deve calcular Z para os dois valores (x1 = 17,52 e x2 = 29,7).
Passo 2: calcular as variveis padronizadas Z1 e Z2.

124

Probabilidade e Estatstica

Note que obrigatoriamente voc deve utilizar o valor de Z com duas casas
decimais, por conta da formatao da tabela Z.

Passo 3: identificar, no grfico, qual a rea que voc deseja encontrar.


Grfico 3.15 e 3.16 Padronizao de uma distribuio normal

rea
x2=17,52

=24

x1=29,7

rea
z=-1,08

z=0,95

Fonte: Adaptado de Silva (1997, p.71).

Veja que a rea est entre 1,08 e 0,95.


No se preocupe com o sinal negativo de Z1. Esse sinal serve apenas para indicar
que a rea est esquerda da mdia (zero), por isso o negativo. Como a curva
simtrica, a rea tanto esquerda como direita calculada da mesma maneira,
e o uso da tabela tambm o mesmo.

Passo 4: procurar, na tabela, o Z1 = 1,08 e Z2 = 0,95 e encontrar suas reas


correspondentes.
Procurando o Z1:
primeiro, procurar o valor 1,0 na primeira coluna;
depois, procurar, na primeira linha, o valor 0,08 ( como se separasse
o nmero 1,08 em dois, uma parte seria 1,0, e a outra, seria o 0,08);

125

Captulo 3
no cruzamento da coluna na qual est o 0,08 e da linha na qual est
o 1,0, voc encontrar um nmero (no caso, 0,3599). Esse nmero
a rea entre Z1 e 0.
Tabela 3.7 Tabela de valores normais Z

Cruzando a
linha com a
coluna.

Procurar 1,0
Procurar 0,08

Cruzando a
linha com a
coluna.

Z
0,0
0,l
0,2
...
0,8
0,9
1,0
1,1
1,2

0,00
0,0000
0,0398
0,0793
...
0,2881
0,3159
0,3413
0,3643
0,3849

0,01
0,0040
0,0438
0,0832
...
0,2910
0,3186
0,3438
0,3665
0,3869

...
...
...
...
...
...
...
...
...
...

0,07
0,0279
0,0675
0,1064
...
0,3078
0,3340
0,3577
0,3790
0,3980

0,08
0,0319
0,0714
0,1103
...
0,3106
0,3365
0,3599
0,3810
0,3997

Fonte: Elaborao do autor (2011).

Agora, falta procurar o Z2! Veja como fazer:


primeiro, voc deve procurar o valor 0,9 na primeira coluna;
depois, procurar, na primeira linha, o valor 0,05 ( como se separasse
o nmero 0,95 em dois, uma parte seria 0,9, e a outra, seria o 0,05);
no cruzamento da coluna na qual est o 0,05 e da linha na qual est
o 0,9, voc encontrar um nmero (no caso, 0,3289). Esse nmero
a rea entre Z2 e 0.
Tabela 3.8 Parte da tabela de valores normais Z
Z
0,0
0,l
...
0,7
0,8
0,9
1,0
1,1

0,00
0,0000
0,0398
...
0,2580
0,2881
0,3159
0,3413
0,3643

...
...
...
...
...
...
...
...
...

Fonte: Elaborao do autor (2011).

126

0,04
0,0160
0,0557
...
0,2704
0,2995
0,3264
0,3508
0,3729

0,05
0,0199
0,0596
...
0,2734
0,3023
0,3289
0,3531
0,3749

Probabilidade e Estatstica
Passo 5: responder e interpretar.
Como voc tem duas reas, o prximo passo somar. Veja o grfico a seguir.
Grfico 3.17 Soma das reas determinadas pela padronizao

Fonte: Elaborao do autor (2011).

P(17,52 < x < 29,7) = 0,3599 + 0,3289 = 0,6888 ou 68,88%.


A probabilidade de uma mquina, adquirida recentemente pela empresa, durar
entre 17,52 e 29,7 anos de 68,88%.

Exemplo 3: em mdia, a vida til de um modelo de mquina de empacotar de


24 anos, com um desvio padro de 6 anos. Levando em considerao que a vida
til desse tipo de mquina distribui-se normalmente, qual a probabilidade de uma
mquina, adquirida recentemente pela empresa, durar mais do que 29,7 anos?

Calculando passo a passo.


Passo 1: identificar todos os elementos que compem o problema.
a mdia: = 24;

o desvio padro: (x) = 6;

os limites do intervalo: o intervalo limitado abaixo por x = 29,7 e no


tem limite acima. Ento, voc deve calcular Z somente pelo valor de x.

Passo 2: calcular a varivel padronizada Z.

127

Captulo 3
Passo 3: identificar, no grfico, qual a rea que voc deseja encontrar.
Grficos 3.18 e 3.19 Padronizao de uma distribuio normal.

rea

=24

x1=29,7

z=0,95

rea

Fonte: Elaborao do autor (2011).

Veja que a rea est de 0,95 para cima.


Passo 4: procurar, na tabela, o Z = 0,95 e encontrar sua rea correspondente.
Como usar a tabela?
primeiro, voc deve procurar o valor 0,9 na primeira coluna;
depois, procurar, na primeira linha, o valor 0,05 ( como se separasse
o nmero 0,95 em dois, uma parte seria 0,9 e a outra, seria o 0,05);
no cruzamento da coluna na qual est o 0,05 e da linha na qual est
o 0,9, voc encontrar um nmero (no caso, 0,3289). Esse nmero
a rea entre Z2 e 0.
Cruzando a
linha com a
coluna.

Tabela 3.9 Parte da tabela normal Z

Procurar 0,9
Procurar 0,05

Cruzando a
linha com a
coluna.

Z
0,0
0,l
...
0,7
0,8
0,9
1,0
1,1

Fonte: Elaborao do autor (2011).

128

0,00
0,0000
0,0398
...
0,2580
0,2881
0,3159
0,3413
0,3643

...
...
...
...
...
...
...
...
...

0,04
0,0160
0,0557
...
0,2704
0,2995
0,3264
0,3508
0,3729

0,05
0,0199
0,0596
...
0,2734
0,3023
0,3289
0,3531
0,3749

Probabilidade e Estatstica
Passo 5: interpretar e responder.
Como a rea dada pela tabela sempre entre zero e Z, como calcular a rea de
Z para cima?
Voc lembra que a curva normal simtrica e que, de cada lado, tem 50% da
rea total. Ento, se a metade tem 50%, ou 0,5, e voc diminuir dessa rea a rea
encontrada, restar a rea que voc quer encontrar. Veja o grfico a seguir.
Grfico 3.20 Determinar a rea limitada abaixo pelo valor padronizado e sem limite acima

0,3289

0,5-0,3289
z=0,95

Fonte: Elaborao do autor (2011).

A rea cinza-escuro calculada diminuindo 0,3289 (rea entre zero e Z


encontrada na tabela) de 0,5.

P(x > 29,7) = 0,5000 0,3289 = 0,1711 ou 17,11%.


Ento, a probabilidade de uma mquina, adquirida recentemente pela empresa,
durar mais do que 29,7 anos de 17,11%.
Alm dos casos que voc estudou nos exemplos, ainda h outros. Um deles
pode ser ilustrado a seguir.
Grfico 3.21 Determinar a rea limitada abaixo pelo valor padronizado e sem limite acima

0,3413
ou
34,13%

0,5
ou
50%

Fonte: Elaborao do autor (2011).

Caso o limite inferior do intervalo esteja esquerda da mdia, o processo o


mesmo, calcular o Z, encontrar a rea na tabela e, no final, calcular a rea final.
No caso anterior, note que voc ter que juntar as duas reas, a cinza-claro com
a cinza-escuro. Lembre-se de que a rea, na metade da curva, de 0,5 ou 50%.
Somando as duas: 0,5000 + 0,3413 = 0,8413 ou 84,13%.

129

Captulo 3

Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.

1. Em um estudo realizado sobre os padres de indeciso, depresso e ansiedade


em adolescentes, revelou-se que a relao com os pais era fator influenciador
dessas reaes. Nessa estudo, foi pesquisado um total de 1500 adolescentes, e em
675 casos, os jovens sofriam com o autoritarismo dos pais. Qual a probabilidade de
ser escolhido, ao acaso, um jovem que sofra com o autoritarismo dos pais?

2. Segundo o IBGE, na Grande Florianpolis, as pessoas com dez anos ou mais


de idade, foram agrupadas na tabela abaixo, de acordo com seu estado civil.

Casado(a)

Desquitado(a)
ou separado(a)
judicialmente

Divorciado(a)

Vivo(a)

Solteiro(a)

Total

3. O teste chamado Tarefa de Memria Seletiva (TMS) testa alguns aspectos


da memria verbal. Este baseia-se em ouvir, lembrar e aprender doze palavras
apresentadas pessoa que est sendo testada. Diversos aspectos da memria
verbal, tais como lembrana total, armazenamento na memria de longa durao
etc., so combinados para produzir um escore global. Sabendo que, para um
grupo determinado de pessoas, a mdia dos escores foi de 126 pontos e que o
desvio padro foi de 10 pontos, determine o que pedido a seguir.
a. Calcule Z (varivel padronizada) para x = 116, para x = 136, para
x = 131 e para x = 141 pontos.
b. Qual a probabilidade de escolher uma pessoa com escore maior
do que 136 pontos?
c. Qual a probabilidade de escolher uma pessoa com escore entre
126 e 131 pontos?
d. Qual a probabilidade de escolher uma pessoa com escore entre
116 e 141 pontos?

130

Captulo 4

Amostragem e clculo de estimativa

Seo 1
Principais conceitos
Neste captulo, voc conhecer com mais detalhes o que amostra e poder
aumentar seus conhecimentos sobre como escolher, calcular e para que usar
amostras em pesquisas e levantamentos de dados. Voc ter a oportunidade de
verificar como importante o estudo da amostragem, uma vez que uma das
ferramentas essenciais que pode apoiar suas decises.
Voc tambm conhecer como proceder para calcular o erro padro de uma estimativa.
Voc j deve ter visto, nos jornais ou na televiso, quando anunciam resultados
de uma pesquisa eleitoral, informarem que os resultados tm uma margem de
erro. Isto ocorre devido ao fato do uso da amostragem, ou seja, quando uma
pesquisa baseia-se apenas em uma parcela da populao.
Como no possvel executar a pesquisa com a totalidade dessa populao, os
resultados no so exatos, necessitando, assim, do clculo da margem de erro.
Dessa forma, voc vai entender como se procede para encontrar esse erro.
Sero usados alguns termos que so fundamentais no entendimento dos clculos
e da interpretao. Sendo assim, antes de saber como se calcula o erro de uma
estimativa, muito importante que voc aprenda alguns conceitos importantes.
A amostragem est intimamente ligada aos estudos de Estatstica descritiva
e probabilidades. Alm de estarem ligados, so dependentes uns dos outros.
Veja a figura a seguir.

131

Captulo 4
Figura 4.1 Relaes dos estudos estatsticos

Amostragem

Estatstica descritiva

Probabilidade

Fonte: Elaborao do autor (2006).

Como feita essa relao entre os trs? Com o estudo deste captulo, voc vai
poder compreender melhor. Conhea, a seguir, alguns conceitos importantes
para o estudo da amostragem.

Populao
Populao o conjunto total de elementos com, pelo menos, uma caracterstica
em comum, cujo comportamento interessa estudar.
Notao:

N = nmero de elementos da populao (tamanho da populao).


Censo: uma coleo de dados relativos a todos os elementos de
uma populao.
Parmetro: utilizado para designar alguma caracterstica descritiva
dos elementos da populao (percentagem, mdia etc.).

Amostra
Amostra o conjunto de elementos ou observaes, recolhidos a partir de um
subconjunto da populao, que se estuda com o objetivo de tirar concluses
para a populao de onde foi recolhida.
Notao:

n = nmero de elementos da amostra (tamanho da amostra).


Contudo, qual tamanho de amostra usar? Essa sempre a dvida de muitos
pesquisadores. O tamanho da amostra muitas vezes depende da experincia
e do conhecimento do pesquisador. Experincia em saber qual o tamanho que
realmente representar, com fidelidade, a populao e o conhecimento do
pesquisador sobre o tema e sobre a populao-alvo do estudo. Dessa forma,
voc ver duas formas de calcular o tamanho da amostra, que so as seguintes:

132

Probabilidade e Estatstica
quando no se tem informaes sobre a populao: se o pesquisador
no tem acesso s medidas, como desvio padro, percentuais etc.
quando se tem informaes sobre a populao: se o pesquisador
tem acesso s medidas, como desvio padro, percentuais etc.
Quando no se tem informaes sobre a populao.
Nesse caso, necessria a especificao do erro amostral pretendido
pelo pesquisador. Sugeridas por Barbetta (2002), as formas de clculo
do tamanho da amostra, quando voc no tem acesso a informaes da
populao, so as que seguem.
a. Quando no se conhece o tamanho da populao.
Tamanho da amostra:

n0 =

1
.
E2

Em que:

n0 = primeira aproximao para o tamanho da amostra;


E = erro amostral tolervel.

(Usar o erro na forma unitria, exemplo: erro de 2%, usar 0,02).

b. Quando se conhece o tamanho da populao.


Tamanho da amostra:

n=

N .n0
.
N + n0

Em que:

n0 = primeira aproximao para o tamanho da amostra;


N = tamanho da populao;
n = tamanho da amostra.

Veja, a seguir, um exemplo de como realizar os clculos.


Um pesquisador deseja realizar um estudo para com estudantes do Ensino
Fundamental da rede municipal de escolas da cidade de Florianpolis. Nessa
pesquisa, ele ir tolerar um erro amostral de 4%, e gostaria de saber qual seria o
tamanho da amostra necessria para realizar sua pesquisa, nos seguintes casos.

133

Captulo 4
a. O pesquisador no conhece o nmero total de estudantes do
Ensino Fundamental da cidade.
Calculando passo a passo.
Passo 1: identificar os elementos da frmula.

n0 = tamanho aproximado da amostra;

E = erro amostral tolervel = 4% ou 0,04 ( s dividir por 100).


Passo 2: usar a frmula.

n0 =

1
1
1
=
=
= 625
2
2
0,0016
(E)
(0,04)

n0 = 625 estudantes.

Um tamanho aproximado para a amostra seria de 625 estudantes do Ensino


Fundamental.
b. O nmero total de estudantes do Ensino Fundamental da cidade
de 27.000 alunos.
Calculando passo a passo.
Passo 1: identificar os elementos da frmula.
n0 = tamanho aproximado da amostra;

E = erro amostral tolervel = 4% ou 0,04;


N = tamanho da populao = 27000.
Passo 2: usar a frmula.

n0 =

1
1
1
=
=
= 625
( E ) 2 (0,04) 2 0,0016

n0 = 625 estudantes.

Um tamanho aproximado para a amostra seria de 625 estudantes do Ensino


Fundamental. Observe que o pesquisador teve acesso informao de que a
populao seria de 27.000 estudantes, ento voc deve passar para o passo seguinte.
Passo 3: calcular o tamanho da amostra usando a populao com a seguinte frmula.

n=

N .n0
27000.625 16875000
=
=
= 610,86
N + n0 27000 + 625
27625

Arredondando, seriam 611 estudantes.


134

Probabilidade e Estatstica
c. Quando se tem informaes sobre a populao.
Neste caso, alm da margem de erro tolervel, seriam necessrias informaes
como desvio padro, percentual dos indivduos que apresentam as caractersticas
estudadas etc. Essas informaes poderiam ser obtidas de pesquisas anteriores
ou, at mesmo, de uma pr-pesquisa. Nesta ltima, seria preciso uma
amostragem prvia para realizar os levantamentos necessrios. Embora, no seja
de nosso interesse aprofundar o estudo sobre este assunto, a seguir esto as
frmulas para se calcular o tamanho da amostra para os dois casos existentes,
para estimar a proporo (percentual) e a mdia populacional.
Quadro 4.1 Tamanho da amostra, proporo (percentual) e mdia populacional
Para a estimativa da mdia populacional
Para amostragem com reposio
(populao infinita)

Z .(x)
n= e

Para a estimativa da proporo


populacional (percentual)
Para amostragem com reposio
(populao infinita)

Z . pq
e2

n=

Para amostragem sem reposio

Para amostragem sem reposio

(populao infinita)

(populao infinita)

n=

Z2. 2 (x)N
2
e (N-1)+Z2.2 (x)

n=

N
Z2 . pq
2

e (N-1)+Z2. pq

Onde:

Onde:

n = tamanho da amostra;
N = tamanho da populao;
e = erro amostral;

n = tamanho da amostra;
N = tamanho da populao;
e = erro amostral;
p = percentual de elementos com a

= desvio padro;

Z = limite do intervalo (dist. Normal)

caracterstica estudada;

q = percentual de elementos sem a


caracterstica estudada;

Z = limite do intervalo (dist. Normal)


Fonte: Elaborao do autor (2006).

Representatividade da amostra na populao


Quando voc est cozinhando, aps temperar a comida, costuma mexer com
uma colher, no ? Por que voc mexe? Para que o tempero fique bem misturado
com a comida. Correto? Qual o passo seguinte? Provar! Claro, voc pega
apenas um pouco da comida para saber como est o gosto. Para tanto, no
necessrio comer tudo!

135

Captulo 4
Em resumo, o processo de amostragem bem semelhante. Para que a prova de
comida seja representativa, voc teve, antes, que mexer bem, tornando, assim,
uma mistura homognea. Se for bem misturada, qualquer amostra que voc colha,
em qualquer lugar da panela, dar uma boa noo de como o todo (a comida) est.
Em pesquisas, o processo bem semelhante!
Voc lembra-se da pesquisa de intenes de voto? Em poca de campanha
eleitoral, quando um instituto de pesquisa faz uma pesquisa, ele tem que
selecionar eleitores que representem as mais diversas camadas sociais, regies,
raas etc., tornando, assim, a amostra representativa da populao.
Voc saberia dizer se os dados levantados, com base em alguns poucos
elementos, podem trazer informaes precisas acerca de uma populao inteira?
De certa forma, sim! Voc no ter informaes exatas da populao usando uma
amostra, mas, sim, uma aproximao bastante precisa. importante salientar
que, por no haver pesquisado a totalidade dos elementos, voc levado a
concluir que os dados nunca representaro um reflexo exato da populao.
Exemplos bem conhecidos so as pesquisas eleitorais divulgadas pelos meios
de comunicao. Veja.
Grfico 4.1 Exemplo dos dados de uma pesquisa eleitoral

35%
26%

37%

24%

39%

26%

A
B
C

15%
11%

10%

Agosto

11%

Setembro

9%

7%

Outubro

Fonte: Elaborao do autor (2006).

Como era a notcia que deu origem a esta tabela?


A pesquisa de outubro apresentou os seguintes resultados: o candidato A tem
39% das intenes de voto, o candidato B tem 26% das intenes de voto,
o candidato C tem 9% das intenes de voto e o candidato D tem 7% das
intenes de votos. O erro de 2%.
136

Probabilidade e Estatstica
De fato, existe uma margem de erro. Esse erro, relatado na notcia, gera um
intervalo, ou seja, as intenes de votos para o candidato A podem variar de 37%
a 41%. Por se tratar de uma pesquisa feita por amostragem, voc no pode dizer
que o candidato ter realmente 39% das intenes de votos.
Quais so as informaes que a amostragem pode fornecer?
Como voc j viu em Estatstica, esses intervalos so divididos em dois tipos, de
acordo com a varivel estudada. Vale relembrar.
Figura 4.2 Varivel aleatria discreta e intervalo de produo; varivel aleatria contnua e intervalo da mdia

Varivel aleatria
discreta
Varivel aleatria
contnua

Intervalo de proporo
(percentual)

Intervalo da mdia

Fonte: Elaborao do autor (2006).

Intervalos de proporo: como visto no exemplo anterior, correspondem


aos percentuais das intenes de votos. Exemplos: proporo de famlias,
percentual de pacientes, proporo de cobaias etc.
Intervalos da mdia: so intervalos baseados em medidas. So
sempre calculados pela mdia destas. Exemplo: escore mdio, peso
mdio, altura mdia etc.

Outra informao importante para a definio do erro o conhecimento do que,


em Estatstica, chamado de nvel de confiana.

Nvel de confiana
O nvel de confiana a probabilidade de o intervalo conter o parmetro
estimado, ou seja, pode-se entender que o valor ou percentual da populao
que voc est tentando estimar tem a probabilidade de estar em um intervalo
que seria o definido pelo erro.

Intervalo de confiana
Intervalo de confiana aquele que contm o parmetro estudado com
determinada probabilidade (nvel de confiana), ou seja, citando o exemplo da
pesquisa eleitoral, o intervalo calculado com o erro. Veja os valores no exemplo
citado nesta seo: ... as intenes de voto para o candidato A podem variar de
37% a 41%. Esse o intervalo de confiana.
137

Captulo 4

Curva normal
Voc poderia perguntar-se, a partir do que foi apresentado, qual relao pode
estabelecer-se entre o nvel de confiana e o intervalo de confiana. Como o nvel
de confiana a probabilidade de a estimativa estar correta e essa probabilidade
determina um intervalo (o intervalo de confiana), possvel usar a curva normal
para identificar a ambos. Veja a figura a seguir
Figura 4.3 Curva normal

Nvel de
confiana
%

Intervalo de confiana
Fonte: Elaborado pelo autor (2006).

Note que o nvel de confiana um percentual definido pelo intervalo de z a z.


Como a curva simtrica, metade da rea vai de z a zero, e a outra metade vai
de zero a z, ou seja, ambas so iguais. Isso muito importante na definio do
valor de z. Para descobri-lo, voc deve calcular a metade do nvel de confiana e
usar a tabela da distribuio normal padronizada.

Exemplo 1
Nvel de confiana: NC = 95%. Encontrar o valor de z na tabela.
Calculando passo a passo.
Passo 1: dividir o NC por dois. Antes disso, no se esquea de usar o valor do
nvel de confiana na forma decimal, ou seja, dividido por 100.

NC =

95
= 0,95
100

0,95
= 0,475
2

Passo 2: procurar esse valor na tabela e encontrar o z correspondente. O valor


referente rea entre zero e z, localizado na regio central da tabela. Veja a
tabela a seguir.

138

Probabilidade e Estatstica
Tabela 4.1 Tabela de valores normais

Fonte: Elaborao do autor (2006).

Localizada a rea, s seguir a coluna onde est o valor at a primeira linha,


encontrando o nmero 0,06. Na horizontal, basta traar a linha at a primeira
coluna, encontrando o valor correspondente a 1,9. Juntando, ou somando os dois
valores, voc encontra o valor 1,96 para z, ou seja, z = 1,96.

Exemplo 2
Nvel de Confiana: NC = 90%. Encontrar o valor de z na tabela.
Calculando passo a passo.
Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do nvel de
confiana na forma decimal, ou seja, dividido por 100.

NC =

90
= 0,90
100

0,90
= 0,45
2

139

Captulo 4
Passo 2: procurar esse valor na tabela e encontrar o z correspondente. O valor
referente rea entre zero e z, localizado na regio central da tabela. Veja a
figura a seguir.
Tabela 4.2 Tabela de valores normais

Fonte: Elaborao do autor (2006).

Encontrando a rea, s seguir a coluna na qual est o valor at a primeira


linha. Note que o valor situa-se entre 0,4495 e 0,4505 e, sendo assim, voc deve
usar o valor compreendido entre 0,04 e 0,05 como se fosse um ponto mdio, ou
seja, 0,045. Seguindo a linha at a primeira coluna, voc encontra o valor 1,6.
Efetuando-se a soma, chega-se ao valor 1,645 para z, ou seja, z = 1,645.
Para calcular o erro, necessrio conhecer ou estabelecer previamente o nvel
de confiana. No existe uma regra especfica para a determinao do nvel de
confiana. Ele determinado pelo pesquisador, com base em sua experincia e, em
geral, os mais usados so 90% e 95%, os zs so, respectivamente, 1,645 e 1,96.
Na seo seguinte, voc aprender a usar o nvel de confiana e a saber como se
calcula o erro da estimativa e o intervalo correspondente.

140

Probabilidade e Estatstica

Seo 2
Estimativas para a proporo populacional
Antes de comear a calcular o erro da estimativa, conhea algumas notaes:

p = proporo da mostra (percentual) probabilidade de sucesso;

p = proporo da populao probabilidade de sucesso;

q = proporo da mostra (percentual) probabilidade de fracasso;

q = proporo da populao probabilidade de fracasso.


Para diferenciar um percentual da amostra do percentual da populao, tanto
de sucesso quanto de fracasso, deve-se usar o acento circunflexo (chapu)
para a amostra.
Veja os exemplos a seguir.
Exemplo 1: em uma determinada populao, foi retirada uma amostra antes da
eleio, e verificou-se que 30% dos eleitores votariam no candidato Tho. Aps
a realizao da eleio, verificou-se que o total de votantes (da populao) para
esse candidato foi de 33%. Com base nisso, voc deve indicar os percentuais de
sucesso e fracasso tanto para a populao quanto para a amostra de votantes e
no votantes em relao ao candidato em questo.
Quadro 4.2 Populao e amostra
Populao
Percentual de votantes em Tho = 33%;

p = 33% (percentual de sucesso da populao).


Percentual de eleitores que no votam em Tho:
calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100.

p=

33
= 0,33
100

q = 1 p = 1 0,33 = 0,67

Amostra
Percentual de votantes em Tho = 30%;

p = 30% (percentual de sucesso da amostra).


Percentual de eleitores que no votam em Tho:
calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100.

30
= 0,30
100
q = 1 p = 1 0,30 = 0,70
p =

Depois, multiplique por 100 para encontrar

Depois, multiplique por 100 para encontrar

novamente o percentual:

novamente o percentual:

q = 0,67. 100 = 67%

q = 0,70.100 = 70%

(percentual de fracasso da populao).

(percentual de fracasso da amostra).

Fonte: Elaborao do autor (2006).

141

Captulo 4
Observao: note que a diferena, alm dos valores, est em identificar o
percentual da amostra com o acento circunflexo (chapu).
A seguir, veja um exemplo mais elaborado.
Exemplo 2: em uma determinada populao, foi retirada uma amostra de 200
votantes antes da eleio e verificou-se que 60 eleitores votariam no candidato Tho.
Aps a realizao da eleio, verificou-se que o total de votantes (da populao) era
de 3000 eleitores e que 990 votaram no referido candidato. Ento, voc deve indicar
os percentuais de sucesso e fracasso tanto para a populao quanto para a amostra
de votantes e no votantes em relao ao candidato mencionado.
Quadro 4.3 Populao e amostra
Populao

Amostra

Passo 1: identificar os valores.

Passo 1: identificar os valores.

N = 3000 (tamanho da populao);

n = 200 (tamanho da amostra);

X = 990 (nmero de votantes no candidato).

X = 60 (nmero de votantes no candidato).

Passo 2: clculo do percentual de votantes no

Passo 2: clculo do percentual de votantes no

candidato.

p=

990
= 0,33
3000

candidato.

p =

60
= 0,30
200

Percentual de votantes em Tho = 33%;

Percentual de votantes em Tho = 30%;

p = 33% (percentual de sucesso da populao).

p = 30% (percentual de sucesso da amostra).

Percentual de eleitores que no votam em Tho:


calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100.

Percentual de eleitores que no votam em Tho:


calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100.

p = 0,33

p = 0,30

q = 1 p = 1 0,33 = 0,67

q = 1 p = 1 0,30 = 0,70

No final, multiplique por 100 para encontrar

No final, multiplique por 100 para encontrar

novamente o percentual:

novamente o percentual:

q = 0,67. 100 = 67%

q = 0,7.100 = 70%

(percentual de fracasso da populao).

(percentual de fracasso da amostra).

Fonte: Elaborao do autor (2006).

E para calcular o erro e o intervalo de uma estimativa?


Para fazer uma estimativa, aps ter os resultados e calculado os percentuais,
voc deve calcular o erro da estimativa e o seu intervalo (intervalo de confiana).
Veja, a seguir, a frmula para o clculo do erro.

142

Probabilidade e Estatstica

e = .

p q
n

Em que:

e = erro da estimativa;
z = limite do intervalo definido pelo nvel de confiana;

p = proporo da mostra (percentual) probabilidade de sucesso (ex.: percentual

de votantes em relao a um determinado candidato);

q = proporo da mostra (percentual) probabilidade de fracasso (ex.:


percentual dos eleitores que no votam em determinado candidato);
n = tamanho da amostra.
O intervalo calculado subtraindo-se o erro do percentual e, em seguida,
somando-se o erro a esse percentual. Veja, na sequncia, a notao usada.

P( p e < p < p + e) = NC
Em que:

P = probabilidade de o valor estimado estar no intervalo calculado;

p = proporo da mostra (percentual) probabilidade de sucesso (exemplo:

percentual da amostra de votantes em relao a um determinado candidato);

P = proporo da populao (percentual) que se quer estimar probabilidade

de sucesso (ex.: percentual da populao de votantes em relao a um


determinado candidato);

NC = nvel de confiana.

Veja os exemplos a seguir.


Exemplo 1: uma pesquisa recente, efetuada com uma amostra de 300 eleitores
de uma pequena cidade, indicou que 35% deles votariam no candidato Arthur.
Faa uma estimativa para a totalidade dos eleitores (populao) dessa cidade que
votaro no referido candidato. Use um nvel de confiana de 95%.

143

Captulo 4
Calculando passo a passo.
Passo 1: calcular e procurar o z na tabela. Dividir o NC por dois. Para tanto,
no se esquea de usar o valor do nvel de confiana na forma decimal, ou seja,
dividido por 100.

NC =

95
= 0,95
100

0,95
= 0,475
2

Como vimos anteriormente, o z para o nvel de confiana de 95% sempre ser 1,96.
Passo 2: discriminar cada elemento da frmula de clculo do erro e aplic-la ao
caso em anlise.

e = .

p q
n

Em que:

e = erro da estimativa;

z = 1,96 (para o NC de 95%);

35
p = 35% ou
= 0,35 (percentual da amostra de eleitores que votam no candidato);
100
q = 1 0,35 = 0,65 (percentual da amostra dos eleitores que no votam no candidato);
n = 300 (tamanho da amostra).
Clculo do erro

e = .

p q
0,35.0,65
0,2275
= 1,96.
=
= 1,96.
300
300
n

e = 1,96. 0,000758333 = 1,96.0,02754 = 0,05397 ou 5,40%


Ao final do clculo, deve-se multiplicar o resultado por 100, para que ele fique em
porcentagem. Os meios de comunicao (TV, rdio, jornais, etc.), ao informarem os
resultados de uma pesquisa citam ... com um erro de 5,40% a mais ou a menos.

144

Probabilidade e Estatstica
Passo 4: calcular o intervalo da estimativa. Neste passo, o clculo pode ser efetuado
na forma percentual ou decimal. Interpretando os resultados obtidos, tem-se que as
intenes de votos para o candidato referido devem ficar entre 29,60% e 40,40%.
Segundo as notaes da Estatstica, esse intervalo escreve-se da seguinte forma.

p e = 0,35 0,054 = 0,2960

ou

29,60%.

p e = 0,35 + 0,054 = 0,4040 ou 40,40%.


Interpretando os resultados obtidos, tem-se que as intenes de votos para o
candidato referido devem ficar entre 29,60% e 40,40%.
Segundo as notaes da Estatstica, esse intervalo escreve-se da seguinte forma.

P( p e < p < p + e ) = 0,95


P(0,35 0,054 < p < 0,35 + 0,54 ) = 0,95

P(0,2960 < p < 0,4040) = 0,95

ou

P(29,60% < p < 40,40%) = 95%.

Que leitura voc pode fazer desses resultados?

O intervalo da estimativa para a totalidade dos eleitores que votariam no


candidato mencionado est compreendido entre 29,60% e 40,40%, com base
em um nvel de confiana de 95%.

Veja os exemplos a seguir.


Exemplo 2: um levantamento de alunos aprovados e reprovados feito com
base no sistema municipal de educao de um municpio, referente ao Ensino
Fundamental, usando uma amostra de 2500 alunos, indicou que 1500 alunos
dentre eles haviam sido reprovados. Com um nvel de confiana de 90%, faa
uma estimativa para a populao de alunos que foram reprovados no Ensino
Fundamental do sistema municipal de educao.

145

Captulo 4
Calculando passo a passo
Passo 1: como no foi indicado o percentual de alunos da amostra que foram
reprovados, voc deve, em primeiro lugar, calcular esse percentual.

n = 2500 (tamanho da amostra);


X = 1500 (nmero de alunos reprovados).

Clculo do percentual

p =

1500
= 0,60
2500

p = 1 0,60 = 0,40
Voc pode manter o resultado na forma decimal, pois o clculo do erro tambm
feito assim.

Z para 90% sempre 1,645.

Passo 3: discriminar cada elemento da frmula de clculo do erro e aplic-la ao


caso em exame.

e = .

p q
n

Em que:

e = o que se quer calcular (erro da estimativa);


z = 1,645;

p = 60% ou

60
= 0,60 (percentual da amostra de alunos reprovados);
100

q = 1 0,60 = 0,40 (percentual da amostra de alunos que no foram reprovados);


n = 2500 (tamanho da amostra).

146

Probabilidade e Estatstica
Clculo do erro

e = .

p q
0,60.0,40
0,24
= 1,645.
= 1,645. 0,000096
= 1,645.
n
2500
2500

e = 1,645 0,009797959 = 0,01612 ou 1,16%.


Ao final, no se esquea de multiplicar o resultado por 100 para transform-lo
novamente em porcentagem.

Passo 4: calcular o intervalo da estimativa.


Neste passo, o clculo pode ser feito na forma percentual ou decimal.

p e = 0,60 0,016 = 0,5840 ou 58,40 %;

p e = 0,60 + 0,016 = 0,6160 ou 61,60 %.


Interpretando os resultados obtidos, tem-se que de 58,40% a 61,60% da totalidade
dos alunos cursando o Ensino Fundamental na rede municipal foram reprovados.
Segundo as notaes de Estatstica, escreve-se esse intervalo da seguinte forma.

P( p e < p < p + e ) = 0,90


P(0,60 0,016 < p < 0,60 + 0,016) = 0,90

P(0,5840 < p < 0,6160) = 0,90 ou P(58,40% < p < 61,60%) = 90%.
Que leitura voc pode fazer?

O intervalo da estimativa para a totalidade dos alunos cursando o Ensino


Fundamental na rede municipal que foram reprovados est compreendido entre
58,40% e 61,60%, com base em um nvel de confiana de 90%.
Voc aprendeu como calcular o erro referente estimativa do percentual de uma
populao. Na sequncia, voc ver como calcular o erro de uma estimativa para
a mdia de uma populao.

147

Captulo 4

Seo 3
Estimativas para mdia populacional
Ao realizar uma pesquisa por amostragem, alm de calcular percentuais, voc
pode obter algumas mdias como, por exemplo, a mdia das alturas, das idades,
dos pesos etc. O processo semelhante, ou seja, calcula-se o erro e o intervalo.
O que muda a forma de clculo do erro. Isso vale para as sries de dados
amostrais que podem ser aproximados por uma distribuio normal.
Para calcular o erro de uma estimativa da mdia populacional, voc vai precisar
da mdia de uma amostra e do desvio padro. Este pode ser obtido com base na
prpria populao, se for possvel, ou na amostra. O desvio padro da amostra
pode ser usado como uma aproximao.
Veja, a seguir, a frmula para o clculo do erro.

e = .

S ( x)
n

Em que:

e = erro da estimativa;

z = limite do intervalo definido pelo nvel de confiana;

S(x) = desvio padro da amostra (ou da populao, se possvel);


n = tamanho da amostra.

O intervalo calculado subtraindo-se o erro da mdia da amostra e somando-se


o erro referida mdia. Veja, na sequncia, a notao usada.

P ( x e < < x + e) = NC
Em que:

P = probabilidade de o valor estimado estar no intervalo calculado;

x = mdia da amostra;
= mdia da populao (o que voc vai estimar);

NC = nvel de confiana.

148

Probabilidade e Estatstica
Veja os exemplos a seguir.
Exemplo 1: em sondagem realizada com base nos alunos do curso de Matemtica
das quintas sries de uma determinada escola, o resultado geral apresentou uma
mdia de 6,7, com um desvio padro de 1,2. Com esse tipo de informao, pode-se
realizar uma srie de anlises. A partir desses dados, calcule uma estimativa (erro
e intervalo), considerando essa srie com uma distribuio normal para a mdia
populacional a um nvel de confiana de 95%, e que a amostra foi de 35 alunos.

Calculando passo a passo.


Passo 1: identificar o z com NC de 95% ou seja, z =1,96.
Passo 2: discriminar cada elemento da frmula de clculo do erro e aplic-la ao
caso em questo.

e = .

S ( x)
n

Em que:

e = o que se quer calcular (erro da estimativa);


z = 1,96;
S(x) = 1,2 (desvio padro da amostra);
n = 35 (tamanho da amostra).

Clculo do erro

e = .

S ( x)
n

= 1,96.

1,2
35

= 1,96.

1,2
= 1,96.0,20284 = 0,3976 ou 0,40.
5,91607978

No necessrio multiplicar por 100, pois esse resultado no indica um


percentual, mas, sim, pontos (a nota).
Passo 4: calcular o intervalo da estimativa.
Neste passo, como na estimativa para o percentual, voc deve subtrair e somar o
erro mdia.

x e = 6,70 0,40 = 6,30


x + e = 6,70 + 0,40 = 7,10

149

Captulo 4
Interpretando os resultados obtidos, tem-se que a mdia das notas da totalidade
dos alunos est compreendida entre 6,30 e 7,10 pontos, aproximadamente.
Segundo as notaes de Estatstica, escreve-se esse intervalo da seguinte forma.

P( x e < < x + e) = 0,95

P(6,70 0,40 < < 6,70 + 0,40) = 0,95

P(6,30 < < 7,10) = 0,95


Que leitura voc pode fazer?

O intervalo da estimativa para a mdia das notas da totalidade dos alunos est
compreendido entre 6,30 e 7,10 pontos, aproximadamente, com um nvel de
confiana de 95%.
Exemplo 2: em uma pesquisa realizada com diversas turmas de uma escola,
os alunos levaram 39 minutos, em mdia, para terminar uma avaliao de
Matemtica. O tamanho da amostra era de 100 estudantes. O desvio padro
dessa amostra foi de 18 minutos. Com base em um nvel de confiana de 90%,
qual seria a estimativa para a mdia populacional da escola e a sua interpretao?

Calculando passo a passo


Passo 1: identificar o z com NC de 90%, ou seja, z = 1,645.
Passo 2: discriminar cada elemento da frmula de clculo do erro e aplic-la ao
caso em questo.

e = .

S ( x)
n

Em que:

e = o que se quer calcular (erro da estimativa);


z =1,645;

S(x) = 18 (desvio padro da amostra);


n = 100 (tamanho da amostra).

150

Probabilidade e Estatstica
Clculo do erro

e = .

S ( x)
n

= 1,645.

18
100

= 1,645.

18
= 1,645.1,8 = 2,961 ou
10

2,96.

No necessrio multiplicar por 100, pois esse resultado no indica um


percentual, mas, sim, minutos.
Passo 3: calcular o intervalo da estimativa. Neste passo, como na estimativa para
o percentual, voc deve subtrair e somar o erro mdia.

x e = 39 2,96 = 36,04

x + e = 39 + 2,96 = 41,96
Interpretando os resultados obtidos, tem-se que o tempo mdio para a realizao
da avaliao est compreendido entre 36,04 e 41,96 minutos, aproximadamente.
Segundo as notaes de Estatstica, escreve-se esse intervalo da seguinte forma.

P( x e < < x + e) = 0,90

P(39 2,96 < < 39 + 2,96) = 0,90

P(36,04 < < 41,96) = 0,90


Que leitura voc pode fazer?

O intervalo da estimativa para a mdia do tempo de execuo da avaliao est


compreendido entre 36,04 e 41,96 minutos, com um nvel de confiana de 90%.

151

Captulo 4

Seo 4
Anlise de varincia ANOVA
Como comparar as caractersticas de vrias amostras
Logo aps calcular a estimativa de uma mdia populacional, podemos ter outro
desafio: definir se as mdias de vrias populaes so mesmo semelhantes ou
existem diferenas que superam os prprios problemas do processo de amostragem.
Isso porque, muitas vezes, amostras de diferentes populaes so selecionadas
com a finalidade de se avaliarem possveis diferenas entre as distribuies
populacionais de alguma caracterstica de interesse.
Podemos citar alguns exemplos dessas situaes.
Exemplos
Seleo de lotes de parafusos fabricados em diferentes empresas
com diferentes equipamentos, para avaliar se a distribuio
(populacional) do valor mdio do dimetro da cabea dos parafusos
produzidos varia com a marca do equipamento usado na fabricao.
Para curar certa doena, existem quatro tratamentos possveis: A, B, C e
D. Pretende-se saber se existem diferenas significativas nos tratamentos,
no que diz respeito ao tempo necessrio para eliminar a doena.

Anlise de amostras de gua de diversos pontos da cidade para verificar


se existe variao na distribuio de alguma caracterstica (nvel de
cidos, por exemplo) associada qualidade da gua entre bairros.

Em muitos casos, uma anlise descritiva dos dados indica que modelos
gaussianos ou normais so compatveis com suas distribuies. Em outras
palavras, sob o ponto de vista estatstico, podemos considerar as k amostras
disponveis como provenientes de populaes normais com mdias 1, 2, ..., k.
Se no existirem razes contrrias, podemos tambm supor que as amostras so
independentes. Adicionalmente, a anlise descritiva muitas vezes sugere que as k
populaes tm a mesma varincia 2 (desconhecida).
O problema proposto pode, ento, ser encarado como um teste da hiptese de
que as mdias so iguais: H: 1 = 2 = ... = k. E, nessas situaes, a tcnica
para resolver problemas desse tipo (e muitos outros semelhantes) chamada de
anlise de varincia de um fator.

152

Probabilidade e Estatstica
Considerando que existem k populaes de interesse, nas quais se estuda uma
caracterstica comum X1, X2, ..., Xk, so as variveis aleatrias que representam
tais caracterstica nas populaes 1, 2, ..., k, respectivamente. Assim, a hiptese
a testar : 1 = 2 = ... = k.
Nesse problema, as k populaes podem ser vistas como k nveis de um mesmo
fator. E, assim, a questo saber se o fator exerce alguma influncia na variao
da caracterstica em estudo (a mdia, neste caso).
Caso o problema apresente somente um fator, estaremos trabalhando com
anlise de varincia de um fator, conhecido como ANOVA de um nico fator.
Claro que tambm existe ANOVA de mltiplos fatores, mas esse tema no ser
abordado neste estudo.
Analisando o problema com um exemplo.
Exemplo: o Sr. Fernando Fernandes dono de uma Indstria Metal-Mecnica
e pretende comprar trs fbricas de parafusos para suprimentos da sua prpria
indstria. Para isso, precisa analisar o volume de fabricao das fbricas a
comprar, j que ele precisa que as trs tenham produes semelhantes de
parafusos para prover regularmente sua indstria.
Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente cinco semanas do
semestre, nas quais observa o volume de fabricao semanal de cada fbrica (ou
seja, as trs amostras so independentes).
Os dados amostrais esto registrados na seguinte tabela.
Tabela 4.3 Dados amostrais

Semanas

Fbrica 1

Fbrica 2

Fbrica 3

Semana 1

47

55

54

Semana 2

53

54

50

Semana 3

49

58

51

Semana 4

50

61

51

Semana 5

46

52

49

x1 = 49

x2 = 56

x3 = 51

xi (mdias amostrais)

= 52

Fonte: Elaborao do autor (2011).

Representamos por Xi o volume de fabricao semanal na Fbrica i (i = 1, 2, 3) e,


por i o valor mdio de Xi.

153

Captulo 4
A mdia da fbrica 1 dada pela soma das semanas e dividida por 5, ou seja,
145/5= 49. Para a fbrica 2,280/5 = 56 e para a fbrica 255/5 = 51, note que a
mdia das mdias das trs fbricas a soma das mdia (ltima linha da tabela)
dividida por 3.
Neste exemplo, existe apenas um fator de interesse, o fator fbrica, que
apresenta trs nveis ou grupos: fbrica 1, fbrica 2 e fbrica 3. Assim, cada nvel
do fator define uma populao de mdia i.
Assim, o que o Sr. Fernando Fernandes pretende saber se as mdias dos trs nveis,
ou populaes, so iguais, isto , pretende-se saber se a hiptese certa ou no.

H: 1 = 2 = 3
(Hiptese de igualdade na fabricao mdia das trs fbricas).
Ento, a questo a responder : sero as mdias amostrais

x1 = 49, x2 = 56,

x3 = 51, diferentes porque h diferenas entre as mdias populacionais: 1 =

2 = 3? Ou sero essas diferenas atribudas a flutuaes amostrais?


Podemos, ento, formular as seguintes hipteses.

H: 1 = 2 = 3
Ou, em outras palavras, a hiptese est afirmando que no h diferena entre o
volume mdio de fabricao das trs fbricas.
Lembre-se: como toda hiptese, as pesquisas (testes em nosso caso) podero
confirm-la ou neg-la!
Pressupostos para resolver a questo
A aplicao da anlise de varincia pressupe a verificao das seguintes condies:
as amostras devem ser aleatrias e independentes;
as amostras devem ser extradas de populaes normais;
as populaes devem ter varincias iguais.

Assim, temos duas situaes possveis demonstradas a seguir.


A hiptese H verdadeira
As diferenas observadas entre as mdias amostrais so devidas a flutuaes
amostrais. Ou seja, nesse caso, teremos que 1 = 2 = 3: todas as amostras
provm de populaes com mdias iguais.

154

Probabilidade e Estatstica
Como se sups que todas as populaes so normais e tm varincias iguais,
isto , o mesmo que extrair todas as amostras de uma nica populao (de
uma nica fbrica).
Grfico 4.2 Distribuio populacional quando 1 = 2 = 3 =

Fonte: Elaborao do autor (2011).

A hiptese H falsa
As diferenas observadas entre as mdias amostrais so demasiado grandes para
serem devidas unicamente a flutuaes amostrais.
Aqui, as mdias das populaes no so iguais, ou seja, pelo menos duas
fbricas tm volumes de produo mdia diferentes. As amostras recolhidas
provm de populaes diferentes.
Grfico 4.3 Distribuio populacional quando 1 2 3

3 1

Fonte: Elaborao do autor (2011).

Teste ANOVA

Para testar a hiptese, devemos trabalhar com o valor da Estatstica de teste F


(Anexo 2), que outro valor que surge de outra distribuio de probabilidade, que
a semelhana da distribuio normal tem uma tabela para calcular seu valor, no
qual devemos entrar com os graus de liberdades (nmero de dados da amostra
diminudo um) para obter o valor correspondendo a certo nvel de confiana, por
exemplo, NC = 95%, que equivale a um nvel de significncia de 5% ou = 5%.

155

Captulo 4
Ento, a Estatstica de teste mede a razo entre a variao entre grupos e a
variao dentro dos grupos.

A hiptese H , pois, rejeitada para valores grandes da Estatstica F.


A tabela ANOVA tem a seguinte estrutura.
Tabela 4.4 Tabela ANOVA

Fonte: Elaborao do autor (2011).

Por exemplo, para n = 3 (trs grupos) e m = 5 (cinco amostras por grupo), resultam em:
GLn = 3 1 = 2 (graus de liberdade do numerador, 2 = K);

GLm = 15 3 = 12 (graus de liberdade do denominador, 15 = 3 x 5 = N).


Ao final da seo, voc pode achar a tabela completa para determinar o PC
(ponto crtico) ou estatstica F, para um nvel de confiana de 95%.
Assim, na tabela, procura-se na primeira coluna (GL do denominador) a linha do 12
e, na primeira fila, a linha do 2 (GL do numerador), resulta em um valor do estatstico
F: F = 3,89. Este valor definido pela tabela conhecido como Ponto Crtico ou PC.
Devemos aclarar que existem diversas tabelas de F, cada uma delas calculada
para um grau de significncia diferente, a tabela de nosso trabalho a tabela para
um grau de significncia de 5%.

156

Probabilidade e Estatstica
Agora, temos que calcular o valor de F para nosso experimento, e, se o valor do F
calculado for maior do que o valor de F tabelado (PC), a hiptese dever ser rejeitada.
Dessa forma, para calcular nosso valor de F amostral, devemos utilizar uma
tabela de layout para organizar nossos clculos.
A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura tradicional.
Tabela 4.5 Tabela ANOVA

Fonte: Elaborao do autor (2011).

Nessa tabela, temos:

SST = a soma de quadrados total e mede a variao total nos dados;


SSA = a soma de quadrados entre os nveis (grupos) do fator e mede a variao

entre grupos (populaes), designada por variao explicada, pois ela


explicada pelo fato de as amostras poderem provir de populaes diferentes;

SSE = a soma de quadrados dentro dos nveis (grupos) do fator e mede a

variao dentro dos grupos (populaes), , por vezes, designada por variao
residual, pois atribuda a flutuaes dentro da mesma populao, portanto no
pode ser explicada pelas possveis diferenas entre os grupos (populaes).
Tambm temos que:

MSA = a soma mdia de quadrados entre grupos;


MSE = a soma mdia de quadrados dentro dos grupos ou residual.
Pode-se provar que

SST = SSA + SSE;

157

Captulo 4
e, tambm, que

(K 1) + (N K) = N 1.

Isso permite verificar os clculos da tabela ANOVA.


Assim, sob o pressuposto da hiptese ser verdadeira, tem-se:

A hiptese deve ser rejeitada se o valor observado de F situar-se direita do ponto


crtico; isto , rejeita-se H se Fobs pc, em que o ponto crtico PC dado por

Ento, para nosso exemplo da compra das fbricas por parte do Sr. Fernando
Fernandes, vamos ver o que podemos concluir ao nvel de significncia de 0.05,
ou seja, a um nvel de confiana NC = 95%.
Clculo de SSE

Calculamos cada desvio de X menos a mdia de cada grupo, ou seja, de cada


fbrica, e somamos, agora vamos somar as somas finais.

SSE=30+50+14=94
Clculo de SSA

O SSa a diferena entre a mdia de cada fbrica menos a mdia das mdias
elevada ao quadrado e multiplicada pelo n, no caso 5 de cinco semanas.

158

Probabilidade e Estatstica
Assim, a tabela ANOVA resulta, numericamente, para o exemplo, nos seguintes valores.
Tabela 4.6 Tabela ANOVA

Fonte: Elaborao do autor (2011).

E, se a hiptese H verdadeira, resultar em


.
Ento, o F calculado para o nosso exemplo 65/7,83, que resulta em 8,30. Note
que um F 2/12, ou seja, vamos procurar na Tabela F, coluna2 e linha 12.
Da tabela F, a gente j identificou o valor F para os graus de liberdade 2 e 12, e
95% de confiana.

E, segundo a tabela ANOVA, o valor observado da estatstica F


.

E, como resultando que 8,3 > 3,89, ento a hiptese (H: 1 = 2 = 3) rejeitada
ao nvel de significncia de 0,05, ou nvel de confiana de 95%; isto , existem
diferenas significativas entre as mdias amostrais das vendas, e h, portanto,
evidncia de que existem pelo menos duas lojas com volumes mdios de
produo diferentes entre elas.
Em outras palavras, o fator fbrica exerce uma influncia significativa sobre o volume
mdio da produo de parafusos: tem, ao menos, uma fbrica que est produzindo
bem menos ou bem mais do que as outras, desequilibrando o suprimento constante
de parafusos de que a indstria de Fernando Fernandes precisa.

159

Captulo 4

Atividades de Autoavaliao
1. Esto listadas, a seguir, uma srie de estudos e a margem de erro que o
pesquisador ir adotar como tolervel, bem como o tamanho da populao-alvo
desse estudo. Calcule o tamanho da amostra necessria para realizar as pesquisas,
considerando que o pesquisador no tem acesso ao tamanho da populao e que
o pesquisador tem acesso ao tamanho da populao (calcular para os dois casos).
Tabela 1 Tipos de estudos, margem de erro e tamanho da populao e da amostra

Erro
tolervel

Tamanho da
populao

a) Estudo socioeconmico com


estudantes da Unisul

0,03

5600

b) Estudo com famlias do bairro Rio


Vermelho, em Florianpolis

0,04

9400

c) Estudo da fecundidade na cidade de


Florianpolis

0,06

125.000

d) Estudo com adolescentes de uma


escola usurios de drogas

0,09

250

e) Estudo de ndice de massa corporal


dos estudantes da Unisul

0,05

4.000

f) Pesquisa de intenes de voto no


Brasil

0,02

80.000.000

Tema do estudo

Tamanho da
amostra

Fonte: Elaborao do autor (2006).

2. Leia a notcia da Isto on-line (2004).

Florianpolis / SC Caa ao tucano


Sem contar com o apoio do governador, da prefeita ngela Amin (PP) e de caciques
da poltica catarinense, Drio Berger, candidato da coligao PSDB-PMN, a
grande surpresa at o momento nas eleies em Florianpolis. Concorrendo pela
primeira vez a um cargo pblico de expresso, Berger vem liderando com folga a
corrida eleitoral em Floripa. Pela pesquisa ISTO/Databrain feita entre os dias 26 e
27 de julho, com 700 entrevistados, margem de erro de 2,74 pontos porcentuais e
coeficiente de confiana de 90% Berger apresenta tranquilos 26,4% das intenes
de voto. O levantamento foi registrado no TRE-SC com o nmero 559/2004. (Dados
adaptados de ISTO ON-LINE, 2004).

160

Probabilidade e Estatstica
Com os dados da matria, mostre os clculos que foram feitos para se chegar ao
erro de 2,74 pontos percentuais, e encontre o intervalo da estimativa.

3. Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-srie. O peso
mdio dos alunos entrevistados foi de 29,3 Kg, e apresentou um desvio padro
de 3,4 Kg. Usando um nvel de confiana de 95%, calcule uma estimativa para a
totalidade (populao) de alunos da quinta-srie.

4. O diretor de marketing de uma indstria pretende comprar uma nova


mquina para fabricar parafusos. Voc foi designado para estudar trs marcas
semelhantes, cada uma delas combina, de modo diferente, fatores como o preo
do produto, volume de fabricao, condies de consumo de energia etc.
Qualquer um dos equipamentos pode ser utilizado na sua indstria, no
havendo qualquer tipo de influncia no rendimento pela presena dos outros
equipamentos da indstria.
Para saber se h diferena entre o volume de produo das trs mquinas
visando sua eficcia, cada uma delas testada, aleatoriamente, funcionando
em algumas das lojas dos fabricantes durante um perodo de durao limitada.
Note que as lojas de venda so selecionadas de modo que as trs amostras
sejam aleatrias e independentes entre si.
A quantidade de peas produzidas durante esse perodo consta na tabela a seguir.
Mquina 1

Mquina 2

Mquina 3

10

12

10

11
Soma

32

67

38

Seja Xi a varivel aleatria que representa o volume de produo de cada


mquina i (i = 1,2,3), tambm admitamos que X1, X2 e X3 tm distribuio normal
com iguais varincias e fixemos o nvel de confiana do teste em 95%, ou seja,
trabalharemos com um nvel de significncia de 5%.

161

Captulo 4
A hiptese a testar : H: 1 = 2 = 3, ou seja: aceita-se que no h diferena entre
os nveis de produo relativamente ao volume mdio de peas que podem fabricar.
Assim, para resolver o problema, calcule o ponto crtico pelo mdio do estatstico
F da tabela da distribuio para um nvel de significncia de 5%. Verifique se
aceita ou rejeita a hiptese de trabalho e crie a tabela ANOVA.

162

Captulo 5

Regresso Linear simples

Seo 1
Correlao linear simples
Os mtodos que voc estudou at o momento so eficazes para analisar e interpretar
somente uma varivel de cada vez. Se eles servem para a anlise de uma varivel,
como analisar e comparar duas variveis simultaneamente? Para compreender como
solucionar tal situao, voc ir conhecer a correlao linear simples.
A correlao uma ferramenta destinada ao estudo da relao entre duas
variveis quantitativas, alm de fornecer a intensidade dessa relao.
Para voc estudar como usar a correlao linear simples, importante que voc
conhea o que diagrama de disperso e o coeficiente de correlao linear de
Pearson. Conhea melhor esses assuntos a seguir.

Diagrama de disperso
O diagrama de disperso ajuda a definir a correlao entre duas variveis
quantitativas de modo grfico. Em outras palavras, a relao entre duas variveis,
X e Y, pode ser vista em um diagrama, no qual so marcados os pontos
correspondentes aos pares ordenados gerados pela relao XY, e (x,y) so
esses pares ordenados. Dessa forma, constri-se um diagrama de disperso.
Quanto mais esses pontos esto prximos reta imaginria gerada pela nuvem
de pontos, mais forte ser a correlao. Observe o grfico a seguir e acompanhe
os exemplos apresentados.
No grfico abaixo, os pares ordenados so gerados pela relao entre a altura
das pessoas em centmetros e o peso em quilos.

163

Captulo 5
Grfico 5.1 Diagrama de disperso

Fonte: Elaborao do autor (2006).

Coeficiente de correlao linear de Pearson


O coeficiente de correlao permite que voc analise a fora ou a existncia da
correlao entre duas variveis. Considerando que n o nmero de observaes
(tamanho da amostra), o coeficiente ser dado pela seguinte frmula.

rxy =

n. x. y [( x )(
. y )]

[n x

][

( x ) . n y 2 ( y )

Em que:
r = resultado do coeficiente de correlao linear de Pearson;
n = nmero de observaes;

x = valores assumidos pela varivel X;

y = valores assumidos pela varivel Y.


O coeficiente de Pearson pode variar de 1 a +1 [1,+1].
Quanto ao resultado de r, voc deve considerar cinco situaes, descritas no
quadro a seguir.

164

Probabilidade e Estatstica
Quadro 5.1 Resultados possveis do valor de x

Valor de r

Correlao entre as variveis

r prximo de 0

Correlao linear pouco significativa.

r=0

No h correlao linear entre as variveis.

r prximo de 1

H correlao linear negativa (significativa).

r = 1

H correlao linear negativa perfeita.

r prximo de +1

H correlao linear positiva (significativa).

r = +1

H correlao linear positiva perfeita.

Fonte: Elaborao do autor (2006).

Tipos de correlaes
Segundo os resultados de r, as correlaes podem assumir diferentes tipos, os
quais voc pode acompanhar detalhadamente a seguir.
a) Correlao linear positiva
Neste caso, o coeficiente de Pearson estar entre 0 e 1 intervalo (0,1).
prximo de 1, forte, porm no igual a 1, perto de 1, estamos falando em algo
acima de 0,8. Note que os pontos esto perto da reta de regresso, porm no
esto exatamente em cima da reta.
Grfico 5.2 Correlao linear positiva: altura e peso

Fonte: Elaborado pelo autor (2006).

Interpretao: se o x cresce o y cresce tambm, no exemplo, se a altura cresce,


o peso cresce; se o x decresce o y decresce tambm.

165

Captulo 5
b) Correlao linear perfeita positiva

Neste caso, o coeficiente de Pearson r ser igual a +1, neste caso, os pontos
esto perfeitamente alinhados em cima da reta.
Grfico 5.3 Correlao linear perfeita positiva: altura e peso

Fonte: Elaborado pelo autor (2006).

A interpretao a mesma, ou seja, se o x cresce, o y cresce tambm. No


exemplo, se altura cresce, o peso cresce e, se o x decresce, o y decresce
tambm. Dizemos que eles apresentam a mesa tendncia.
c) Correlao linear negativa
Neste caso, o coeficiente de Pearson estar entre 0 e 1, no caso prximo de 1:
intervalo [1,0].
Grfico 5.4 Correlao linear perfeita negativa: idade e nota

Fonte: Elaborado pelo autor (2006).

Interpretao: o x cresce e o y decresce, no exemplo, se a idade cresce, a nota


decresce; e, se o x decresce, o y cresce, no exemplo, se a idade decresce, a nota
cresce. So inversamente proporcionais.
166

Probabilidade e Estatstica
d) Correlao linear perfeita negativa

Neste caso, o coeficiente de Pearson r ser 1: os pontos esto perfeitamente


alinhados sobre a reta de regresso.
Grfico 5.5 Correlao linear perfeita negativa: idade e nota

10

11

12

13

14

15

16

Fonte: Elaborado pelo autor (2006).

A interpretao a mesma, ou seja, se o x cresce, o y decresce, no exemplo, se


a idade cresce, a nota decresce; e, se o x decresce, o y cresce.
e) Correlao linear nula ou ausncia de correlao

A seguir, veja um exemplo de quando no h correlao entre as variveis X e Y,


neste caso, o coeficiente de Pearson igual a zero, r = 0. Note que no h uma
tendncia nos pontos de disperso, diferentemente dos exemplos anteriores.
Grfico 5.6 correlao linear nula ou ausncia de correlao: altura e nota

Fonte: Elaborado pelo autor (2006).

167

Captulo 5

Como calcular o coeficiente de correlao?


Para obter esta resposta, acompanhe com ateno o exemplo.
Exemplo: calcule o coeficiente de correlao de Pearson e construa o diagrama de
disperso para uma turma de alunos, correlacionando altura e peso, descritos a seguir.
Tabela 6.1 Altura e peso dos alunos de uma srie

Fonte: Elaborao do autor (2006).

Calculando passo a passo.


Passo 1: acrescente, na tabela, mais trs colunas para auxiliar nos clculos.
Some os elementos da coluna x (altura) e escreva o total na ltima linha,
obtendo, assim, a
Some os elementos da coluna y (peso) e escreva o total
na ltima linha, obtendo, assim, a
(veja tabela).
Passo 2: calcule os elementos da terceira coluna (x.y), multiplicando cada um dos
elementos da coluna x por cada um dos elementos da coluna y.
(160).(61) = 9760
(155).(56) = 8680
(152).(55) = 8360
......
(177).(77) = 13629
Em seguida, some todos eles e escreva o total na ltima linha, obtendo, assim, a

168

Probabilidade e Estatstica
Passo 3: calcule os elementos da quarta coluna (x2), elevando ao quadrado, cada
um dos elementos da coluna x.
(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
....
(177)2=31329
Em seguida, some todos eles e escreva o total na ltima linha, para obter, assim, a
Passo 4: calcule os elementos da quinta coluna (y2), elevando, ao quadrado, cada
um dos elementos da coluna y.
(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
....
(77)2 = 5929
Em seguida, some todos eles e escreva o total na ltima linha, para obter, assim, o
Passo 5: calcule o coeficiente de correlao utilizando a frmula vista anteriormente.

n = nmero de observaes (10 alunos) n = 10.


Os elementos, a seguir, foram calculados nos passos anteriores:

Observao: importante lembrar que:


1.

Note que no primeiro caso, voc multiplica os elementos x e y, depois soma


a multiplicao no fim, e, no segundo caso, voc soma x e y primeiro, depois
multiplica a soma final.

169

Captulo 5
2.

Neste caso, a diferena consiste no elevar ao quadrado, no primeiro caso, voc


eleva ao quadrado cada varivel x, depois soma. No segundo caso, voc soma
primeiro o x e depois eleva a soma ao quadrado.
Se voc escrever na frmula, ter:

Passo 6: agora, construa o diagrama de disperso. Para constru-lo; voc deve


marcar os pontos de cada par ordenado, usando, para isso, os valores da coluna
das alturas, como x, e da coluna dos pesos, como y, formando (x, y). Veja o
grfico a seguir.
Grfico 5.7 Altura e peso

Fonte: Elaborado pelo autor (2006).

170

Probabilidade e Estatstica
Interpretao do resultado final do coeciente de correlao: o coeficiente de
correlao resultou em um nmero positivo e prximo de 1 (r = 0,98), sendo
assim, a correlao entre a altura dos alunos e o peso positiva (significativa), ou
seja, quanto maior a altura do aluno, maior ser seu peso, e, quanto menor for a
sua altura, menor ser o seu peso.

Seo 2
Anlise de regresso linear
Para fazer a anlise da regresso, nos casos em que possvel estabelecer uma
correlao entre duas variveis, voc ter que usar essa relao para prever
valores para uma delas (sempre a varivel que for adotada como Y), mas isso s
ser possvel quando for conhecido o valor da outra varivel, no caso, a varivel
X. E essa previso s tem significado caso a fora da correlao seja significativa
ou perfeita (quando r est prximo ou igual a +1 ou 1). Essa fora d-se pela
proximidade dos pontos do diagrama de disperso reta de regresso.
A reta de regresso obtida pela aproximao dos pontos do diagrama.
Para encontrar uma equao que auxilie a prever os valores de Y, usa-se o
Mtodo dos Mnimos Quadrados, o qual voc conhecer a seguir.
A escolha da varivel que ser o Y est relacionada varivel que o pesquisador
deseja estimar. No exemplo anterior, se a inteno a de estimar o peso dos
alunos, ento o Y deve ser a varivel peso. Caso a necessidade fosse a de
estimar a altura dos alunos, a varivel Y passaria a ser a altura.

Mtodo dos mnimos quadrados


Pode-se representar a reta imaginria pela equao exposta na sequncia.
Reta de regresso:
Sendo:

171

Captulo 5
Em que:
= valor predito de y (a ser estimado);

x = valor da varivel x para determinado elemento da amostra;


y = valor da varivel y para determinado elemento da amostra;
n = n total de observaes (tamanho da amostra);

b = a interseco do eixo y (ou coeficiente linear da reta);

a = coeciente de inclinao da reta (ou coeficiente angular da reta).


Ao predizer um valor de Y com base em determinado valor de X, quanto mais
significativa a correlao linear, mais precisa torna-se a previso.
Interpolao: estimativas com valores entre os da srie.
Extrapolao: estimativas com valores fora dos da srie.
Resduo: a diferena entre um valor amostral, observado Y, e o valor predito,
com base na equao de regresso.
A tabela, a seguir, descreve as alturas e os pesos dos alunos de uma turma.
Voc dever:
a. construir a equao de uma reta de regresso para prever o peso
dos alunos;
b. prever o peso (

) de um aluno com 175 cm (x) de altura.

Tabela 5.2 Altura e peso dos alunos de uma srie

Fonte: Elaborado pelo autor (2006).

172

Probabilidade e Estatstica
Calculando passo a passo.
Para o item a:
Considerando que a tabela a mesma do exemplo da Seo 1 (clculo do coeficiente
de correlao), no ser necessrio calcular as colunas nem os totais (veja a tabela).
Equao da reta de regresso
Passo 1: sendo assim, voc pode comear calculando a inclinao da reta (a).
Inclinao da reta (a):

Agora, identifique os elementos da frmula:


n = 10.
Os elementos, a seguir, foram calculados nos passos anteriores;
;
;
;
.
Se voc escrever na frmula, ter:

173

Captulo 5
Passo 2: calcule a interseco com o eixo y, item (b).
Interseco do eixo y (b):

Agora, identifique os elementos da frmula:


n = 10.
Os elementos, a seguir, foram calculados nos passos anteriores.
;
;
.

Passo 3: construa a equao da reta de regresso.


Aps calcular a e b, tem-se:

a = 0,72;
b = 53,76;

Para o item b:

Fazer a previso para um aluno que mede 175 cm. Voc deve usar 175 como X = 175.
Substituir o valor de X na equao de regresso.

Como interpretar? A previso para o peso deste aluno que mede 175 cm de 72,24 Kg.

174

Probabilidade e Estatstica

Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.
1. Uma turma da oitava srie realizou avaliaes em duas disciplinas,
Matemtica e Biologia; as notas obtidas esto na tabela abaixo. Usando estes
dados, calcule o que se pede.
Aluno

Nota Matemtica

Nota Biologia

X.Y

X2

Y2

9,5

3,4

32,3

90,3

11,6

9,0

5,4

48,6

81,0

29,2

8,5

6,0

51,0

72,3

36,0

8,0

6,0

48,0

64,0

36,0

8,0

5,0

40,0

64,0

25,0

7,5

7,0

52,5

56,3

49,0

7,5

9,0

67,5

56,3

81,0

6,0

7,5

45,0

36,0

56,3

5,0

8,0

40,0

25,0

64,0

10

4,0

8,0

32,0

16,0

64,0

Totais

73,0

65,3

456,9

561,0

452,0

a. Calcule o coeficiente de correlao entre as duas variveis,


identifique o tipo de correlao e interprete o resultado.
b. Construa uma equao para a relao indicada (a equao da reta
de regresso) para possibilitar o clculo de estimativas para a nota
de Biologia (Y), segundo a nota de Matemtica (X).
c. Estime a nota de Biologia, considerando que um aluno tenha
tirado nota 6,5 (X) em Matemtica. Substitua na equao da reta
construda no item b.

175

Consideraes Finais

Muitas vezes deparamos-nos com situaes em que temos que lidar com
muitos dados e no sabemos como vamos lidar com eles. O contedo e as
atividades apresentados nesta unidade de aprendizagem tm como objetivo
desenvolver habilidades e proporcionar ferramentas para os profissionais que
lidam com esse tipo de situao.
Desde a apresentao de relatrios e trabalhos cientficos a pesquisas, controle,
testes, projees e previses, a Estatstica est sempre presente. Afinal, no dia
a dia, lidamos com uma grande quantidade de informaes, ento pergunto: de
que vale ter tanta informao se no sabemos o que fazer com ela? Espera-se
que todo o conhecimento que voc adquiriu nesta unidade de aprendizagem seja
suporte para as suas anlises, opinies e decises.

Muito sucesso profissional!


Prof. Luiz Dornelles

177

Referncias

ACO LOCAL DE ESTATSTICA APLICADA ALEA. 1999-2010. Disponvel em:


<http://alea-estp.ine.pt>. Acesso em: 15 ago. 2010.
ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatstica
aplicada administrao e economia. 2. ed. So Paulo: Cengage Learning,
2007. ISBN 9788522105212. Disponvel em: <https://aplicacoes.unisul.br/
pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.php>.
Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.
ARANGO, Hctor Gustavo. Bioestatstica terica e computacional. Rio de
Janeiro: Guanabara, 2001.
ASSOCIAO NACIONAL DE ENTIDADES PROMOTORAS DE EMPREENDIMENTOS
INOVADORES - Anprotec. 2008. Disponvel em: <http://www.anprotec.org.br>.
Acesso em: 15 ago. 2010.
BANCO CENTRAL DO BRASIL. 2010. Disponvel em: <http://www.bcb.gov.br/>.
Acesso em: 15 ago. 2010.
BARBETTA, Pedro Alberto. Estatstica aplicada s cincias sociais. 5. ed. rev.
Florianpolis: Ed. UFSC, 2002.
CRESPO, Antnio Arnot. Estatstica fcil. So Paulo: Saraiva, 2001.
DEPARTAMENTO INTERSINDICAL DE ESTATSTICA E ESTUDOS
SOCIOECONMICOS DIEESE. 2010. Disponvel em: <http://www.dieese.org.
br/>. Acesso em: 3 ago. 2010.
DOANE, David P. Estatstica aplicada administrao e economia. Porto
Alegre: ArtMed, 2011. 2. v. ISBN 9788563308962. Disponvel em: <https://
aplicacoes.unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib
lioteca_redirect.php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha
Biblioteca.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATSTICA IBGE. 2010.
Disponvel em: <http://www.ibge.gov.br/>. Acesso em: 3 set. 2010.
LARSON, Ron; FARBER, Elizabeth. Estatstica aplicada. 2. ed. So Paulo: Pearson
Prentice Hall, 2004. 476 p. ISBN 8587918591. Disponvel em: <https://aplicacoes.
unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.
php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.
179

LEVIN, Jack. Estatstica aplicada s cincias humanas. So Paulo: Habra, 1987.


MORETTIN, Luiz Gonzaga. Estatstica bsica. So Paulo: Makron Books, 1999
MORETTIN, Pedro Alberto; BUSSAB, Wilton de O. Estatstica bsica. 8. ed. So
Paulo: Saraiva, 2008. 2 v. ISBN 9788502208001. Disponvel em: <https://aplicacoes.
unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.
php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.
PINHEIRO, Joo Ismael D. Estatstica bsica: a arte de trabalhar com dados. Rio
de Janeiro: Elsevier, 2009. 288 p. ISBN 9788535230307. Disponvel em: <https://
aplicacoes.unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib
lioteca_redirect.php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha
Biblioteca. SARAIVA. Segurana e medicina do trabalho. 8. ed. atual. So Paulo,
2011. 1044 p. ISBN 9788502134294.
PORTAL BRASIL. 2010. Disponvel em: <http://www.portalbrasil.net/>. Acesso
em: 3 set. 2010.
POPULATION REFERENCE BUREAU. La juventud del mundo 2000. Washington
DC: Population Reference Bureau, 2000. Disponvel em: <http://www.prb.org/
SpanishContent.aspx>. Acesso em: 3 maro 2011.
SINDICATO DA HABITAO SECOVI/RS. 2010. Disponvel em: <http://www.
secovi-rs.com.br/index.asp>. Acesso em: 10 ago. 2010.
SILVA, Ermes Medeiros da. Estatstica. So Paulo: Atlas, 1996. v.1.
______. Estatstica para os cursos de Economia, Administrao e Cincias
Contbeis. So Paulo: Atlas, 1999.
SPIEGEL, M. R. Estatstica. So Paulo: Makron Books, 1994.
PIEGEL, Murray R.; STEPHENS, Larry J. Estatstica. 4. ed. Porto Alegre:
Bookman, 2009. 2 v. ISBN 9788577805204. Disponvel em: <https://aplicacoes.
unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.
php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.
TRIBUNAL SUPERIOR ELEITORAL. 2010. Disponvel em: <http://www.tse.gov.br>.
Acesso em: 20 set. 2010.
TRIOLA, Mario F. Introduo Estatstica. Rio de Janeiro: LTC, 1999.
VIEIRA, Snia. Introduo bioestatstica. 6. ed. Rio de Janeiro: Campus, 2000.
______. Princpios de Estatstica. So Paulo: Pioneira, 2003.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: LTC, 2004.

180

Sobre os Professores Conteudistas

Luiz Arthur Dornelles Jnior


Graduado em Matemtica pela Fundao Universidade do Rio Grande (FURG).
professor da Universidade do Sul de Santa Catarina (UNISUL) desde 2000, onde leciona
as disciplinas de Estatstica, Mtodos Quantitativos e Programao Linear. Atualmente,
est cursando Especializao em Educao Matemtica na UNISUL Virtual.

Gabriel Cremona Parma (2 edio)


Doutor em Engenharia Civil, na rea de Gesto Territorial, pela Universidade
Federal de Santa Catarina (UFSC). Mestre em Engenharia Civil, pela Universidade
Federal de Santa Catarina (UFSC). Cartgrafo: UNL, Argentina. Consultor
especializado em Geoprocessamento e Controle de Qualidade de Dados
Geoespaciais. Atua como professor e pesquisador na Universidade do Sul de
Santa Catarina (UNISUL) e na Universidade Federal de Santa Catarina (UFSC). Exprofessor na Universidade Nacional do Litoral (UNL), Argentina.

Joseane Borges de Miranda


bacharel em Cincias Econmicas na UFSC (1998), seu TCC objetivou
analisar o impacto da poltica cambial sobre os preos agrcolas em Santa
Catarina. ps-graduada em Economia Industrial, pela Universidade Federal
de Santa Catarina (2000), sua dissertao de Mestrado foi focada nos aspectos
macroeconmicos da competitividade sistmica no setor de revestimento de
Santa Catarina. Crditos de doutorado do programa de ps-graduao da UFSC,
chamado EGC (Engenharia e Gesto do Conhecimento), a rea de conhecimento
Engenharia do Conhecimento. professora, h mais de 12 anos, da disciplina
Econometria, nos cursos de Economia. Na Unisul, professora presencial nos
cursos de Engenharias de Produo, Civil e Ambiental. A maioria das unidades de
aprendizagem ministradas so de Probabilidade e Estatstica, Macroeconomia.
Na UV (Unisul Virtual), professora on-line das unidades de aprendizagem
Gesto do Conhecimento, Finanas Internacionais, Probabilidade e Estatstica
e Econometria. coautora do Livro de Matemtica nas Cincias Sociais,
autora dos Livros: Engenharia Econmica; Econometria I e Econometria II e
coordenadora do curso de bacharelado Cincias Econmicas, da Unisul Virtual.

181

182

Respostas e comentrios das


atividades de autoavaliao
Captulo 1
1. O censo uma coleo de dados sobre uma populao, enquanto que a
estimao usa dados de uma amostra para avaliar um parmetro (caracterstica
descritiva dos elementos da populao).
2. Deve-se escolher elementos com as mesmas caractersticas da populao,
ou seja, elementos que realmente representem a populao. Aqui, voc pode
citar exemplos (escolher clientes de nveis sociais diferentes para estudar grau
de satisfao, escolher amostras de diversos locais de um lago para anlise
etc.). Isso necessrio para que voc possa realmente refletir a realidade, sem
distorcer ou conduzir os resultados.
3. Nesta questo, voc deve citar exemplos do seu dia a dia, por exemplo, as
listadas na tabela a seguir.
Varivel

Exemplos

Qualitativa nominal

Nacionalidade

Qualitativa ordinal

Atendimento (timo, muito bom, ... , muito ruim)

Quantitativa discreta

Nmero de filhos

Quantitativa contnua

Escore de teste psicolgico

4. A classificao que voc pode fazer :


os dados coletados por meio de questionrio primrios;
os dados coletados no Ministrio secundrios.

183

5. Observe, no quadro a seguir, a resposta para esta questo.


DESCRIO DA VARIVEL

CLASSIFICAO

Saldo em conta corrente em R$

Quantitativa contnua

Idade do cliente

Quantitativa contnua

Sexo do cliente

Qualitativa nominal

Classe econmica

Qualitativa ordinal

Estado civil

Qualitativa nominal

Nmero de defeitos do produto

Quantitativa discreta

Consumo de energia em kWh

Quantitativa contnua

Nmero de filhos

Quantitativa discreta

Comprimento da pea

Quantitativa contnua

Tempo de espera em caixa eletrnico (em minutos)

Quantitativa contnua

Nome de pas exportador de petrleo

Quantitativa nominal

Grau de satisfao no atendimento em uma loja comercial

Qualitativa nominal

Nmero de alunos de uma universidade

Quantitativa discreta

6. Montagem da tabela.
Principais motivos de tenso
(estresse)

N de clientes

Morte de um filho

16

Morte do cnjuge

12

Morte dos pais ou irmos

11

Divrcio

Doena grave

Demisso

Total

60

184

7. Montagem da tabela.
Acidentes de trabalho nos ltimos 36 meses

N de acidentes

N de meses

Total

36

8. Montagem da tabela.
Renda das famlias de um bairro de classe baixa de Florianpolis

Renda famlia (R$)

N de pacientes

112 |---- 115

115 |---- 118

118 |---- 121

121 |---- 124

124 |---- 127

127 |---- 130

Total

36

185

9. Completando a tabela.
Nmero de operrios acidentados em cada ms

N de
acidentados

N de meses

fa

Fr

fp (%)

0,1111

11,11

0,1389

13,89

18

0,2500

25,00

25

0,1944

19,44

30

0,1389

13,89

36

0,1667

16,67

Total (fi)

36

1,0000

100,0

a. 18 meses (9+5+4);
b. 27 meses (9+7+5+6);
c. 25% dos meses;
d. 13,89% dos meses.

10. O histograma e o polgono de frequncias devero ser semelhantes ao


apresentado a seguir.

186

Captulo 2
1. Em primeiro lugar, construa a tabela.
Consumo de bebidas alcolicas por semana pelos funcionrios.

Nmero de dias
(xi)

Nmero de
funcionrios (fi)

xi.fi

10

16

16

14

28

24

20

20

24

21

Total (fi)

64

153

Em segundo lugar, calcule a mdia, dividindo a soma da coluna xi.fi pela soma da
coluna fi. O resultado a mdia.

Interpretao: o nmero mdio de dias de consumo de lcool pelos funcionrios


de 2,39 dias.

2. Usando um processo semelhante ao anterior, em primeiro lugar, voc deve


calcular o ponto mdio. Em seguida, multiplicar o ponto mdio pela fi de cada
linha e, porteriormente, escrever o resultado na coluna PM.fi. Some esses
nmeros no final da coluna, conforme a tabela.

187

Renda de famlias de um bairro de classe baixa de Florianpolis

Renda (R$)

Nmero de famlias

PM

PM.fi

112 |---- 115

113,5

227

115 |---- 118

116,5

699

118 |---- 121

119,5

478

121 |---- 124

122,5

1102,5

124 |---- 127

125,5

1004

127 |---- 130

128,5

899,5

Total (fi)

36

4410

Em segundo lugar, divida o resultado da soma (PM.fi) pela soma dos nmeros
da coluna fi.

Interpretao: o nvel da renda familiar de 122,5 reais.

3. a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente
(Rol) e, na linha de baixo, as posies.
12

13

13

15

15

16

17

19

21

Segundo passo: calcular a posio, levando em considerao que a srie tem 9


elementos, sendo, assim, mpar.

188

Terceiro passo: encontrar, na tabela p, o elemento que ocupa a 5 posio.


12

13

13

15

15

16

17

19

21

Me = 15 o tempo de internao mediano de 15 dias.


Interpretao: 50% dos valores observados so menores ou iguais a 15, e 50%
dos valores observados so maiores ou iguais a 15.

b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente
(Rol) e, na linha de baixo, as posies.
14

14

15

15

16

16

17

18

Segundo passo: calcular a posio, levando em considerao que a srie tem 8


elementos, sendo, assim, par.

A mediana ocupa uma posio entre a 4 e a 5 posies.

Terceiro passo: encontrar, na tabela, os elementos que ocupam as posies 4 e 5.


14

14

15

15

Me

16

16

17

18

Elemento da 4 posio = 15;


Elemento da 5 posio = 16.

189

Quarto passo: calcular a mdia.


Me = (15+16)/2 = 15,5.
Interpretao: 50% dos valores observados so menores ou iguais a 15,5, e
50% dos valores observados so maiores ou iguais a 15,5.

4. a) Conjunto 1
Organizando os dados.
1

A srie tem duas modas: Mo1 = 1 e Mo2 = 2.


Interpretao moda 1: o valor mais frequente 1.
Interpretao moda 2: o valor mais frequente 2.

b) Conjunto 2
Organizando os dados.
2

A srie tem duas modas: Mo1 = 3 e Mo2 = 5.


Interpretao moda 1: o valor mais frequente 3.
Interpretao moda 2: o valor mais frequente 5.

c) Conjunto 3
Organizando os dados.
1

A srie no tem moda, pois no tem nenhum dado que se repita mais do que os outros.
Interpretao moda: uma srie amodal, ou seja, no tem valor(es) mais frequente(s).

190

Nome da disciplina
5. Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posies.
2

10

11

12

Para o terceiro quartil.


Segundo passo: calcular a posio. Considerando n= 12.

Ou seja, Q3 est entre a 9 e a 10 posies.

Terceiro passo: calcular o terceiro quartil.


Valor que ocupa a 9 posio = 8;
Valor que ocupa a 10 posio = 8.
Ento, calcule da seguinte forma.

Interpretao :75% dos dados observados so menores ou iguais a 8, e 25%


dos dados observados so maiores ou iguais a 8.
Para o nono decil (note que D9 = P90).
Quarto passo: calcular a posio. Considerando n= 12.

Ou seja, D9 est entre a 11 e a 12 posies.

191

Quinto passo: calcular o nono decil.


Valor que ocupa a 11 posio = 9;
Valor que ocupa a 12 posio = 9.
Ento, calcule da seguinte forma.

Interpretao: 90% dos dados observados so menores ou iguais a 9, e 10%


dos dados observados so maiores ou iguais a 9.
Para o trigsimo quinto percentil.
Sexto passo: calcular a posio. Considerando n = 12.

Ou seja, P35 est entre a 4 e a 5 posies.

Stimo passo: calcular o trigsimo quinto percentil.


Valor que ocupa a 4 posio = 4;
Valor que ocupa a 5 posio = 4.
Ento, calcule da seguinte forma.

Interpretao: 35% dos dados observados so menores ou iguais a 4, e 65%


dos dados observados so maiores ou iguais a 4.

192

6. Nesta questo, voc pode seguir os seguintes passos.


Passo 1: calcular a mdia.

Obs.: no se esquea de que, na mdia, usamos a letra grega para a populao.

Passo 2: calcular os quadrados dos desvios (xi )2.


(x1 )2 = (25 28,33)= (3,33) 2 = 11,0889
(x2 )2 = (22 28,33) = (6,33) 2 = 40,0689
(x3 )2 = (36 28,33) = (7,67) 2 = 58,8289
(x4 )2 = (20 28,33) = (8,33) 2 = 69,3889
(x5 )2 = (29 28,33) = (0,67) 2 = 0,4489
(x6 )2 = (38 28,33) = (9,67) 2 = 93,5089

Somando todos os resultados, temos 273,3334.

Passo 3: calcular a mdia dos quadrados dos desvios. Aqui, voc vai calcular
para a populao (varincia).
Varincia

Ento 2(x) = 45,5556.

193

Passo 4: calcular o desvio padro calculando a raiz da varincia.


Desvio padro

Interpretao: a variabilidade de tempo de execuo do teste de 6,75 minutos.

7. O modo de calcular o mesmo da questo anterior, s muda no final, ao


calcular a varincia, usamos a frmula para amostra.
Passo 1: calcular a mdia.

Passo 2: calcular os quadrados dos desvios (xi ) 2


(x1

) 2 = (15 17,6) = (2,6)2 = 6,76

(x2

) 2 = (10 17,6) = (7,6)2 = 57,76

(x3

) 2 = (9 17,6) = (8,6) 2 = 73,96

(x4

) 2 = (23 17,6) = (5,4) 2 = 29,16

(x5

) 2 = (31 17,6) = (13,4) 2 = 179,56

Somando todos os resultados, temos 347,20.

Passo 3: calcular a mdia dos quadrados dos desvios. Aqui, voc vai calcular
para a amostra (varincia).
Varincia

Ento, s2 (x) = 86,80.

194

Passo 4: calcular o desvio padro calculando a raiz da varincia.


Desvio padro
= 9,3166
Interpretao: a variabilidade dos escores de 9,32 pontos.

8. O primeiro passo calcular a mdia.


Consumo de bebidas alcolicas por semana pelos funcionrios

N de dias (xi)

N de
funcionrios (fi)

xi.fi

(xi ) 2.fi

10

57,10

16

16

30,88

14

28

2,10

24

2,96

20

12,95

20

27,24

24

52,12

21

63,75

64

153

249,10

Vamos calcular passo a passo.


Passo 1: devemos somar a coluna das frequncias simples (fi) para obter fi
(frequncia total).
fi = 64

Passo 2: calcular a mdia, multiplicar cada xi por sua correspondente fi e escrever


na coluna xi.fi; somar os valores calculados e escrever no final da coluna esse
resultado, e dividir o resultado pelo resultado do passo 1 (fi).

195

Passo 3: calcular os quadrados dos desvios, (xi )2.fi


0 2,39 = (2,39)2 = 5,7110 = 57,10
1 2,39 = (1,39) 2 = 1,9316 = 30,88
2 2,39 = (0,39) 2 = 0,1514 = 2,10
3 2,39 = (0,61) 2 = 0,378 = 2,96
4 2,39 = (1,61) 2 = 2,595 = 12,95
5 2,39 = (2,61) 2 = 6,814 = 27,24
6 2,39 = (3,61) 2 = 13,034 = 52,12
7 2,39 = (4,61) 2 = 21,253 = 63,75

Somar os valores obtidos.


(xi )2.fi = 249,10

Passo 4: calcular a varincia para a amostra.

Passo 9: calcular o desvio padro.

Desvio padro igual a 1,99.

9. Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferena est em que aquela era para amostra, enquanto que esta para a
populao. Sugesto: use as colunas para facilitar os clculos.

196

Idade dos estudantes da disciplina Estatstica

Idade (xi)

N de estudantes
(fi)

xi.fi

(xi )2.fi

17

85

17,4845

18

20

360

15,1380

19

22

418

0,3718

20

10

200

12,769

21

126

27,2214

63

1189

72,9847

Passo 1: devemos somar a coluna das frequncias simples (fi) para obter fi
(frequncia total).
fi = 63
Passo 2: calcular a mdia, multiplicar cada xi por sua correspondente fi e escrever
na coluna xi.fi; somar os valores calculados e escrever no final da coluna esse
resultado, que o xi.fi, dividir o resultado pelo resultado do passo 1 (fi).

Passo 3: calcular os quadrados dos desvios, (xi )2.fi.


17 18,87 = (1,87)2 = 3,49695= 17,4845
18 18,87 = (0,87)2 = 0,756920 = 15,1380
19 18,87 = (0,13) 2 = 0,016922 = 0,3718
20 18,87 = (1,13) 2 = 1,276910 = 12,769
21 18,87 = (2,13) 2 = 4,53696= 27,2214

Somar os valores obtidos na sexta coluna, (xi )2.fi.


(xi )2.fi = 72,9847

197

Passo 4: calcular a varincia para a amostra.

Passo 9: calcular o desvio padro.

Desvio padro igual a 1,08.

10. Quando voc tiver que calcular o desvio padro para uma tabela com
intervalos, use o mesmo processo, apenas substituindo o xi pelo ponto mdio.
Renda de famlias de um bairro de classe baixa de Florianpolis

Renda (R$)

N de famlias
(fi)

PM

PM.fi

(PMi )2.fi

112 |-- 115

113,5

227

162

115 |-- 118

116,5

699

216

118 |-- 121

478

36

121 |-- 124

125,5

1102,2

124 |-- 127

128,5

1004

72

127 |-- 130

899,5

252

Total (fi)

36

4410

738

119,5
122,5

Vamos calcular passo a passo.


Passo 1: somar a coluna das frequncias simples (fi) para obter fi (frequncia total).
fi = 36

198

Passo 2: clculo da mdia, calcular o ponto mdio de cada intervalo (112+115)/2


= 113,5 primeiro PM, e multiplicar cada PM por sua correspondente fi e escrever
na coluna PM.fi, somar os valores calculados nessa coluna e escrever o total.
Dividir o resultado pelo resultado do Passo 1 (fi).

Passo 3: calcular os quadrados dos desvios (PMi )2.fi


113,5 122,5 = (9)2 = 812 = 162
116,5 122,5 = (6)2 = 366 = 216
119,5 122,5 = (3)2 = 94 = 36
122,5 122,5 = (0)2 = 09 = 0
125,5 122,5 = (3)2 = 98 = 72
128,5 122,5 = (6)2 = 367 = 252

Somar os valores obtidos.


(PMi )2.fi = 738

Passo 4: calcular a varincia.

Passo 5: calcular o desvio padro.

O desvio padro igual a 4,59.

199

11.
11.1
a) A mais dispersa em termos absolutos a srie B (maior desvio padro).
b) Voc tem que calcular o coeficiente de variao.
Para a srie A.

Para a srie B.

A srie com maior disperso relativa a srie A (maior coeficiente de variao).


c) Concluindo: a srie mais dispersa a srie A.

11.2
a) A mais dispersa em termos absolutos a srie B (maior desvio padro).
b) Voc tem que calcular o coeficiente de variao.
Para a srie A.

Para a srie B.

As duas sries apresentam o mesmo valor para os coeficientes de variao.


c) Concluindo: as duas sries apresentam a mesma disperso.

200

Captulo 3
1.
Passo 1: para comear, voc deve identificar o evento e o espao amostral.
A: jovens sofriam com o autoritarismo dos pais.
S: adolescentes.

Passo 2: identificar o nmero de elementos do evento e do espao amostral.


n(A) = 675;
n(S) = 1500.

Passo 3: calcular usando a frmula.


0,45 ou 45%.

2.
Passo 1: para comear, voc deve identificar os eventos e o espao amostral.
A: casado(a);
B: solteiro(a);

C: divorciado(a);

S: total pesquisado.

Passo 2: identificar o nmero de elementos dos eventos e do espao amostral.


n(A) = 267.867;
n(B) = 333.974;
n(C) = 16.779;

n(S) = 665.541.

201

Passo 3: calcular usando a frmula apresentada a seguir.


0,4025 ou 40,25%

0,5018 ou 50,18%.

0,0252 ou 2,52%.

3.
a) Calcule Z (varivel padronizada) para x = 116, x = 136, para x = 131 e para
x = 141 pontos.
Passo 1: identificar todos os elementos que compe o problema.
a mdia: = 126;
o desvio padro: (x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.

Passo 2: calcular a varivel padronizada Z.


Para X = 116.

Z = 1
Para X = 136.

Z=1

202

Para X = 131.

Z = 0,5
Para X = 141.

Z = 1,5

b) Qual a probabilidade de se escolher uma pessoa com escore maior do que


136 pontos?
Passo 1: identificar, no grfico, o intervalo e a rea que voc deve calcular (usar o
z calculado no item anterior, para x = 136, o z = 1).

Passo 2: procurar, na tabela, a rea correspondente a z = 1 (no se esquea de


que a rea dada na tabela sempre entre 0 e z).
Z = 1 rea = 0,3413.
Passo 3: calcular a probabilidade.
A rea dada na tabela de 0 a Z (0,3413), mas o intervalo solicitado de 136 para
cima. Nesse caso, voc deve subtrair de 0,5 (total de rea de um lado da curva) o
valor encontrado (0,3413).
P(x > 136) = 0,5000 0,3413 = 0,1587 ou 15,87%.

203

c) Qual a probabilidade de se escolher uma pessoa com escore entre 126 e 131
pontos? Note que 126 a mdia. Esse fica mais fcil.
Passo 1: identificar, no grfico, o intervalo e a rea que voc deve calcular (usar o
z calculado no item anterior, para x = 131, o z = 0,5)

Passo 2: procurar na tabela a rea correspondente z = 0,5 (no se esquea de


que a rea dada na tabela sempre entre 0 e z).
Z = 0,5 rea = 0,1915.

Passo 3: calcular a probabilidade.


A rea dada na tabela de 0 a Z (0,1915), e o intervalo solicitado entre 0 e Z,
ento, voc j tem o resultado.
P(126 < x < 131) =0,5000 + 0,1915 ou 19,15%.

204

d) Qual a probabilidade de se escolher uma pessoa com escore entre 116 e


141 pontos?
Passo 1: identificar, no grfico, o intervalo e a rea que voc deve calcular (usar
os valores de z calculados no item anterior, para x = 116, o z = 1 e para x = 141, o
z = 1,5).

Passo 2: procurar, na tabela, a rea correspondente z1 = 1 e z2 = 1,5 (no se


esquea de que a rea dada na tabela sempre entre 0 e z).
Z1 = 1 rea = 0,3413 (no se esquea de que a curva simtrica, e o sinal s
indica de que lado est a rea).
Z2 = 1,5 rea = 0, 4332.

Passo 3: calcular a probabilidade.


A rea solicitada a soma das duas reas, a correspondente Z1 (0,3413), e a
correspondente Z2 (0,4332).
P(116 < x < 141) = 0,3413 + 0,4332 = 0,7745 ou 77,45%.

205

Captulo 4
1.
a) Estudo socioeconmico com estudantes da Unisul.
Passo 1: identificar os elementos da frmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolervel = 0,03;
N = tamanho da populao = 5600.

Passo 2: usar a frmula.

n0 = 1111,11 arredondando, temos 1111 pessoas.


Um tamanho aproximado para a amostra seria de 1111 pessoas. Observe que
o pesquisador teve acesso informao de que a populao seria de 5600
pessoas, ento voc deve passar para o passo seguinte.

Passo 3: calcular o tamanho da amostra usando a populao com a seguinte frmula.

Arredondando, seriam 927 pessoas.

b) Estudo com famlias do bairro Rio Vermelho, em Florianpolis.


Passo 1: identificar os elementos da frmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolervel = 0,04;
N = tamanho da populao = 9400.

206

Passo 2: usar a frmula.

n0 = 625 crianas.
Um tamanho aproximado para a amostra seria de 625 crianas. Observe que
o pesquisador teve acesso informao de que a populao seria de 9400
crianas, ento voc deve passar para o passo seguinte.

Passo 3: calcular o tamanho da amostra usando a populao com a seguinte frmula.

Arredondando, seriam 586 crianas.

c) Estudo da fecundidade na cidade de Florianpolis.


n0 = 278;
n = 277.

d) Estudo com adolescentes de uma escola usurios de drogas.


n0 = 123;
n = 83.

f) Estudo do ndice de massa corporal dos estudantes da Unisul.


n0 = 400;
n = 364.

g) Pesquisa de intenes de voto no Brasil.


n0 = 2500;
n = 2500.

207

2.
Passo 1: como j foi indicado o percentual de eleitores que votam no candidato,
s falta calcular o percentual dos eleitores que no votam no candidato ( )

Voc pode deixar na forma decimal, pois, para calcular o erro, usado dessa forma.

Passo 2: identificar o z com NC de 90%, o z = 1,645.

Passo 3: discriminar cada elemento da frmula de clculo do erro e calcular o

Em que:
e = erro da estimativa;
z = 1,645.

p = 26,4% ou

(percentual da amostra de eleitores que votam no candidato);


(percentual da amostra dos eleitores que no votam no candidato);

n = 700 (tamanho da amostra).

Clculo do erro
=1,645.
ou 2,74%.

208

Passo 4: calcular o intervalo da estimativa.


Neste passo, o clculo pode ser na forma percentual ou decimal.

ou

3.
Passo 1: identificar o z para o NC de 95%, z=1,96.

Passo 2: discriminar cada elemento da frmula de clculo do erro e calcul-lo.

Em que:
e = o que voc quer calcular (erro da estimativa);
z = 1,96;
S(x) = 3,4 (desvio padro da amostra);
n = 250 (tamanho da amostra).

Clculo do erro

Observao importante: no necessrio multiplicar por 100, pois esse


resultado no indica percentual, neste caso, ele indica quilos!

209

Passo 3: calcular o intervalo da estimativa.

4.
Passo 1:
Clculo dos graus de liberdade para definio do ponto crtico:
GLn = 3 1 = 2 (graus de liberdade do numerador, isto porque so 3 mquinas, ou
seja, K=3);
GLm = 18 3 = 15 (graus de liberdade do denominador).
o resultado de N menos K, N composto por 5 peas na mquina 1, mais 7
peas da mquina 2, mais 6 peas da mquina 3.
Agora, procurando na tabela de F para 5% de nvel de significncia, entrando na coluna
da esquerda com GLm = 15 e na fila superior com GLn=2, resulta: F (5%,2,15) = 3,68.

Vamos calcular as mdias das amostras:


Mquina 1 = 32/5= 6,40;
Mquina 2 = 67/7= 9,57;
Mquina 3 = 38/6= 6,33.
E a mdia das mdias = (6,40+9,57+6,33)/3 = 22,30/3 = 7,43

Clculo do SSE
Mquina 1
(8-6,40)^2+(6-6,40)^2+(5-6,40)^2+(6-6,40)^2+(7-6,40)^2 = 5,20

210

Mquina 2
(10-9,57)^2+(8-9,57)^2+(12-9,57)^2+(7-9,57)^2+(9-9,57)^2+(10-9,57)^2+(11-9,57)^2=17,68

Mquina 3
(7-6,33)^2+(5-6,33)^2+(8-6,33)^2+(6-6,33)^2+(7-6,33)^2+(5-6,33)^2=7,34

Somando as trs, temos: 5,20+17,68+7,34 = 30,22.


SSE = 30,22

Clculo do SSA
SSA = 5(6,40-7,43)^2 + 7(9,57-7,43)^2 + 6(6,33-7,43)^2 = 44,62

Clculo do MSE
MSE = 30,22/15 = 2,01

Clculo do MSA
MSA = 44,62/2 = 22,31

E o valor observado de F resulta em:


F(2/15) = 22,31/2,01= 11,01.

Ento, ao nvel de significncia de 0.05 (95% de nvel de confiana), rejeita-se


a hiptese H de igualdade de mdias de produo, pois o valor observado da
estatstica de teste F maior do que o ponto crtico ou o F tabelado.
H, portanto, evidncia estatstica de que as trs mquinas no so iguais
relativamente ao volume mdio de produo.
Em outras palavras: a marca da mquina influencia significativamente a
quantidade de peas fabricadas por ela.

211

A tabela ANOVA resulta nos seguintes valores.


Soma de quadrados

Graus de
liberdade

Varincia

Razo F

Entre grupos

SSA =44,62

MSA = 22,31

11,01

Residual

SSE = 30,22

15

MSE = 2,01

Total

SSE = 74,84

17

Fonte de variao

Captulo 5
1. a)
Passo 1: como as colunas j esto calculadas, voc pode comear identificando
os elementos da frmula.

n =10 (nmero de alunos)


x = 73;
y = 65,3;
x.y = 456,9;
x2 = 561;
y2 = 456,9.

Passo 2: calcule o coeficiente de correlao utilizando a frmula vista no passo anterior.

212

Passo 3: analisando o resultado, voc pode classificar e interpretar


contextualizando-o na situao descrita.
Classificao: a correlao entre as notas de Matemtica e Biologia pode ser
classificada como negativa forte.
Como interpretar?
O coeciente de correlao resultou em um nmero negativo e prximo de 1 (r =
0,73842), sendo assim, a correlao entre as notas de Matemtica e Biologia
negativa (signicativa), ou seja, quanto maior a nota em Matemtica, menor ser a nota
em Biologia, e quanto menor a nota em Matemtica, maior ser a nota em Biologia.

b)
Passo 1: para a equao da reta, conforme mostrada abaixo, voc pode comear
calculando a inclinao da reta (a).
Equao da reta de regresso

b+a.X

Inclinao da reta (a).

Agora, identifique os elementos da frmula.


n = 10 (nmero de alunos);
x = 73;
y = 65,3;
x.y = 456,9;
x2 = 561;

213

Se voc escrever na frmula, ter:

Passo 2: calcule a interseco com o eixo y (b).


Interseco do eixo y (b).

Identifique os elementos da frmula.


n = 10 (nmero de alunos);
x = 73;
y = 65,3;

214

Passo 3: construa a equao da reta de regresso.


Aps calcular a e b, tem-se:
;
;
b+a.X;
11,671171-0,70427.X.
c)
Para calcular a estimativa, voc necessita de um valor para X, que dado no item
c), ou seja, X = 6,5. Para estimar a nota de Biologia, voc precisa de uma nota de
Matemtica. Observe o seguinte procedimento:
X = 6,5;
11,671171 0,70427.X;
11,671171 0,70427.(6,5);
11,671171 4,577755;
7,09.

Interpretao: se um aluno tirar 6,5 em Matemtica, possivelmente, ele tirar em


torno de 7,09 na nota de Biologia.Anexos

215

Anexos
Tabela 3.7 - Tabela de reas da distribuio padronizada.

Fonte: Triola (1999)

216

217