Você está na página 1de 170

CURSO DE ESTATSTICA

APLICADA
Prof. Henrique Dantas Neder
Departamento de Economia Universidade Federal de
Uberlndia.
SUMRIO
1.Introduo............................................................................................................4
2.Estatstica Descritiva............................................................................................8
2.1 Tipos de Variveis........................................................................................8
2.2 Tabelas e Distribuies de Freqncia......................................................10
2.3 Histogramas................................................................................................12
2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas..........13
2.5 Medidas de Posio e de Disperso..........................................................16
2.5.1 Uma Nota sobre Notao Estatstica ................................................17
2.5.2 A Mdia Aritmtica No Ponderada.....................................................18
2.5.3 A Mdia Aritmtica Ponderada.............................................................19
2.5.4 Propores como Mdias.....................................................................20
2.5.5 A Mdia Geomtrica.............................................................................21
2.5.6 A Mdia Harmnica..............................................................................25
2.5.7 A Mediana.............................................................................................26
2.5.8 A Mdia para Dados Agrupados..........................................................27
2.5.9 A Mediana para dados Agrupados.......................................................29
2.5.10 A Moda para dados Agrupados.........................................................30
2.5.11 O Intervalo (ou amplitude)..................................................................37
2.5.12 Percentis, Decis e Quartis..................................................................39
2.5.13 Varincia e Desvio Padro.................................................................40
2.5.14 Varincia e Desvio Padro para Dados Agrupados..........................42
2.5.15 Interpretando e Aplicando o Desvio Padro......................................44
2.5.16 Coeficiente de Variao ....................................................................45
2.6 Medidas de Assimetria...............................................................................46
2.7 Curtose: uma medida de achatamento......................................................48
3. Probabilidade....................................................................................................51
3.1 Definio Clssica de Probabilidade.........................................................52
3.2 Conceito da Freqncia Relativa...............................................................53
3.3 Probabilidade Subjetiva.............................................................................54
3.4 Algumas Regras Bsicas de Probabilidade...............................................54
3.5 A Regra do Complemento..........................................................................55
3.6 A Regra Geral da Adio............................................................................57
3.7 Regras de Multiplicao............................................................................59
3.8 Probabilidade Condicional..........................................................................61
3.9 Diagramas em rvore.................................................................................63
Probabilidades......................................................................................................64
3.10 Teorema de Bayes...................................................................................64
Anexo 1 Recordando Definies e Conceitos ..............................................65
Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades
........................................................................................................................68
Anexo 3 - Probabilidade Condicional ...........................................................73
Resumo do Clculo de Probabilidades............................................................77
Exerccios de Probabilidade.............................................................................78
A............................................................................................................................82
2
4. Variveis Aleatrias Discretas..........................................................................96
4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade
Discreta............................................................................................................100
4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade
Discreta............................................................................................................100
4.3 A Distribuio de Probabilidade Binomial................................................103
4.4 A Mdia e Varincia De Uma Distribuio Binomial................................106
Apndice 1 (Recordao)...............................................................................107
Apendice 2 (Recordao)...............................................................................108
Apndice 3 (Recordao)...............................................................................109
Apndice 4 (recordao)................................................................................115
Valor Esperado e Varincia de uma Varivel Aleatria..............................115
Variveis Aleatrias Independentes...............................................................122
5. Variveis Aleatrias Contnuas e Distribuio Normal..................................125
5.1 Variveis Aleatrias Contnuas................................................................125
5.2 Mdia e Varincia de uma Varivel Aleatria Contnua..........................126
5.3 Varivel Aleatria Normal.........................................................................127
5.4 Distribuio Normal Padro.....................................................................129
5.5 reas Abaixo da Curva Normal................................................................130
6. Mtodos de Amostragem e Distribuies Amostrais.....................................139
6.1 Amostragem Probabilstica .....................................................................140
6.2 Teorema do Limite Central.......................................................................144
6.3 Estimativa de Ponto..................................................................................145
6.4 Estimativa de Intervalo.............................................................................145
6.5 Intervalo de Confiana para Uma Proporo Populacional.....................146
6.6 Fator de Correo de Populao Finita...................................................147
6.7 Selecionando uma Amostra.....................................................................148
6.8 Tamanho Amostral para Estimativa de Propores................................149
7. Teste de Hipteses Amostras Grandes......................................................149
7.1 Testes de Significncia Unicaudais ........................................................151
7.2 Testes de Significncia Bicaudais ...........................................................152
7.3 P-value de um Teste de Hiptese ...........................................................153
7.4 Clculo do P-value....................................................................................154
7.5 Teste de Hipteses: Duas Mdias Populacionais....................................155
7.6 Testes Referentes a Proporo...............................................................157
Exerccios :.....................................................................................................160
...........................................................................................................................170
3
1. Introduo
A Significncia e a Abrangncia da Estatstica
Porque a estatstica importante?

Os mtodos estatsticos so usados hoje em quase todos os campos de
investigao cientfica, j que eles capacitam-nos a responder a um vasto
nmero de questes, tais como as listadas abaixo:
1) Como os cientistas avaliam a validade de novas teorias?
2) Como os pesquisadores mdicos testam a eficincia de novas drogas ?
3) Como os demgrafos prevem o tamanho da populao do mundo em
qualquer tempo futuro?
4) Como pode um economista verificar se a mudana atual no ndice de Preos
ao Consumidor a continuao de uma tendncia secular, ou simplesmente
um desvio aleatrio?
5) Como possvel para algum predizer o resultado de uma eleio
entrevistando apenas algumas centenas de eleitores ?
Estes so poucos exemplos nos quais a aplicao da estatstica
necessria. Podemos presumir que a matemtica uma das rainhas das
cincias porque ela fornece a estrutura terica para quase todas as outras
cincias. Se voc j fez um curso bsico de fsica, j est familiarizado com
algumas das leis matemticas que governam temas to diversificados como
gravidade, energia, luz, eletricidade, etc. Mas tambm devemos considerar o
fato de que as teorias matemticas esto sendo desenvolvidas todos os dias em
muitas reas por estatsticos tericos - pessoas treinadas em teoria estatstica e
probabilidade. Para citar alguns poucos casos ilustrativos elas so
desenvolvidas para teoria dos vos espaciais em fsica; para teorias do
conhecimento do comportamento animal e humano em psicologia; para teorias
da migrao e dos diferenciais de raa em sociologia; para teorias de epidemias
em sade pblica;...
4
De fato, a estatstica tornou-se uma ferramenta cotidiana para todos os
tipos de profissionais que entram em contato com dados quantitativos ou tiram
concluses a partir destes.
O que Estatstica ?
A noo de Estatstica foi originalmente derivada da mesma raiz da
palavra Estado, j que foi a funo tradicional de governos centrais no sentido
de armazenar registros da populao, nascimentos e mortes, produo das
lavouras, taxas e muitas outras espcies de informao e atividades. A
contagem e mensurao dessas quantidades gera todos os tipos de dados
numricos que so teis para o desenvolvimento de muitos tipos de funes
governamentais e formulao de polticas pblicas.
Dados numricos so de fato uma parte da Estatstica, mas so apenas a
matria-prima, que precisa ser transformada pelos mtodos estatsticos para
posterior anlise. A Estatstica, como um mtodo cientfico, refere-se ao projeto
de experimentos e a descrio e interpretao de observaes que so feitas.
De um ponto de vista moderno, a Estatstica freqentemente definida como
um mtodo de tomada de deciso em face da aleatoriedade dos fenmenos.
Em uma mais vasta perspectiva, o escopo da estatstica pode ser pensado em
termos de trs reas diferentes de estudos: (1) a Estatstica Descritiva (2) A
Estatstica Indutiva e (3) A Teoria da Deciso Estatstica.
Estatstica Descritiva
A estatstica Descritiva refere-se ao corpo de mtodos desenvolvidos
para coletar, organizar, apresentar e descrever dados numricos. Essa rea da
Estatstica refere-se s seguintes tarefas:
1) Encontrar um mtodo apropriado de coletar dados numricos eficientemente
e acuradamente para um dado problema.
2) Determinar um formato eficiente , tal como uma apresentao tabular, para a
organizao dos dados de uma forma sistemtica e ordenada, de maneira
5
que a informao fornecida pelos dados possa ser observada com grande
facilidade e preciso.
3) Apresentar dados numricos, seja organizados ou no, de forma que as
caractersticas e o comportamento dos dados so clara e facilmente
revelados. Tais apresentaes So feitas por meio de mtodos grficos.
4) Sumarizar ou descrever cada caracterstica ou propriedade dos dados por um
simples nmero, tal como uma mdia, uma porcentagem ou alguma outra
medida apropriada, a qual calculada a partir dos dados por meio de uma
frmula derivada a partir de algum princpio vlido.
Estatstica Indutiva
A Estatstica Indutiva, que tambm freqentemente chamada de
inferncia estatstica ou estatstica inferencial, em contraste com a estatstica
descritiva, essencialmente analtica em sua natureza. Consiste de um
conjunto de princpios ou teoremas que nos permitem generalizar acerca de
alguma caracterstica de uma populao a partir das caractersticas
observadas de uma amostra. Nessa definio, uma populao o conjunto de
todos os itens, objetos, coisas ou pessoas a respeito das quais a informao
desejada para a soluo de um problema. Uma amostra um grupo de itens
selecionados por um mtodo cuidadosamente concebido e projetado a partir de
uma populao. Existem diferentes tipos de amostras, dependendo dos
diferentes mtodos de seleo disponveis. Uma amostra aleatria simples,
falando em termos simplificados, aquela que selecionada de tal forma que
cada e todos os itens na populao tem a mesma chance de serem includos na
amostra.
Se uma medida descritiva calculada a partir dos dados da populao
ela chamada de parmetro populacional, ou simplesmente parmetro; se
calculada a partir dos dados da amostra ela chamada de estatstica amostral,
ou simplesmente estatstica. Considerando esses conceitos podemos definir
estatstica indutiva como o processo de generalizar acerca de do valor de um
parmetro a partir do valor de uma estatstica. Existem dois procedimentos de
inferncia distintos mas relacionados: estimao e teste de hipteses.
6
Estimao processo de usar o valor de uma estatstica amostral para estimar
o valor de um parmetro que desconhecido, mas uma constante. Como um
exemplo suponhamos que temos uma populao de 100.000 bolas de gude em
um saco, todas as quais so idnticas exceto pela cor, e que no podemos v-
las embora saibamos que uma parte delas so brancas e o restante so pretas.
Suponha que desejamos ter uma idia da proporo de, digamos, bolas brancas
nessa populao. Suponha que para conseguir isso selecionamos 1.000 bolas
aleatoriamente do saco e verificamos que 350 so brancas. Isso significa que
nossa proporo amostral de bolas brancas 35 %. A partir disso conclumos
que a proporo populacional de bolas brancas tambm 35 %. Fazendo isso
ns realizamos o que chamado de estatstica pontual.
Mas afirmar que a proporo de bolas brancas em toda a populao
exatamente igual a proporo daquela amostra particular como dar um tiro no
escuro: o valor da proporo amostral um resultado aleatrio e depende de
cada amostra de 1.000 bolas escolhida da populao. Pode ser que por uma
enorme casualidade o resultado daquela amostra que escolhemos coincida
exatamente com o valor da proporo de bolas brancas em toda a populao.
Mas as chances de que isso no ocorra so muito grandes. Uma forma de
contornarmos esse problema afirmarmos que as chances so de 95 em 100
(ou de 95 %) de que o intervalo formado pela proporo amostral acrescida e
diminuda de 3 pontos percentuais contenha o verdadeiro valor da proporo
populacional desconhecido. Ou seja, construmos um intervalo com limites 35 +
0,03 x 35 = 36,05 e 35 - 0,03 x 35 = 33,95 e afirmamos (com base em algum
princpio obtido a partir da teoria estatstica) que as chances so de 95 em 100
de que o verdadeiro valor da proporo populacional esteja localizado dentro
desse intervalo. Quando uma afirmativa dessa natureza feita estamos
realizando o que se chama de estimativa por intervalo.
Quanto ao segundo procedimento da estatstica inferencial deixaremos
para coment-lo quando for abordado em sua ntegra. E o terceiro campo de
estudos da Estatstica, a Teoria da Deciso Estatstica no ser discutido nessa
apresentao.
7
2. Estatstica Descritiva
2.1 Tipos de Variveis
Existem diversos tipos de variveis que sero utilizadas em um estudo
estatstico. importante compreender o conceito matemtico de varivel.
Varivel uma abstrao que se refere a um determinado aspecto do fenmeno
que est sendo estudado. Podemos afirmar que a quantidade colhida da safra
anual de soja uma varivel. Representemos essa varivel pela letra X. Essa
varivel pode assumir diversos valores especficos, dependendo do anos de
safra, por exemplo, X1986, X1990 e X1992. Esses valores que a varivel assume em
determinados anos no so a prpria varivel , mas valores assumidos ela para
determinados objetos ou pessoas da amostra ou da populao. Se uma amostra
tiver 50 indivduos podemos referimo-nos a X como sendo a varivel nota de
estatstica e a X30 como a nota de um indivduo particular, no caso o trigsimo.
freqente tambm na literatura utilizar-se letras maisculas para a notao de
variveis e as correspondentes letras minsculas para referncia aos valores
particulares assumidos por essa varivel mas nesse resumo procuraremos
evitar essa forma de notao.

Variveis quantitativas - referem-se a quantidades e podem ser medidas em
uma escala numrica. Exemplos: idade de pessoas, preo de produtos, peso
de recm nascidos.
As variveis quantitativas subdividem-se em dois grupos: variveis quantitativas
discretas e variveis quantitativas contnuas. Variveis discretas so aquelas
que assumem apenas determinados valores tais como 0,1,2,3,4,5,6 dando
saltos de descontinuidade entre seus valores. Normalmente referem-se a
contagens. Por exemplo: nmero de vendas dirias em uma empresa, nmero
de pessoas por famlia, quantidade de doentes por hospital.
1
As variveis
1
Uma varivel quantitativa discreta no precisa assumir necessariamente
apenas valores de contagem, ou seja nmeros inteiros ou nmeros naturais em
seqncia. Um exemplo de varivel quantitativa discreta seria, por exemplo,
8
quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua
e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o
peso de pessoas, a renda familiar, o consumo mensal de energia eltrica, o
preo de um produto agrcola.
2
As variveis quantitativas contnuas referem-se
ao conjunto dos nmeros reais ou a um de seus subconjuntos contnuos.
Variveis Qualitativas - referem-se a dados no numricos.
3
Exemplos dessas
variveis so o sexo das pessoas, a cor, o grau de instruo.
As variveis qualitativas subdividem-se tambm em dois grupos: as variveis
qualitativas ordinais e as variveis qualitativas nominais. As variveis
qualitativas ordinais so aquelas que definem um ordenamento ou uma
hierarquia. Exemplos so o grau de instruo, a classificao de um estudante
no curso de estatstica, as posies das 100 empresas mais lucrativas, etc. As
uma que assumisse apenas os seguintes valores : { 1; 3,5 ; 5,75 ; 10 }. Apesar
dessa varivel abranger valores no inteiros ela apresenta saltos de
descontinuidade: nesse exemplo ela no pode assumir nenhum valor
intermedirio entre 1 e 3,5 ou entre 5,75 e 10.

2
Seria impossvel obter na prtica uma varivel perfeitamente contnua j que
os instrumentos de medida no tem preciso infinita. Por exemplo., o peso de
pessoas medido com uma balana com preciso, digamos, de dcimos de
gramas. Ento jamais conseguiremos obter um valor para essa varivel que se
localize entre 50.000,1 e 50.000,2 gramas, por exemplo, 50.000,15 gramas.
Ocorre portanto um salto de descontinuidade entre os dois valores possveis de
serem medidos e a varivel, do ponto de vista terico, no pode ser considerada
como varivel quantitativa contnua, mas varivel quantitativa discreta. Mas do
ponto de vista prtico, acabamos freqentemente por consider-la e trat-la
como sendo uma varivel quantitativa contnua, apesar dessa falta de preciso
absoluta. O mesmo podemos dizer para o caso da renda ou qualquer outra
varivel econmica medida em unidades monetria: no existe uma renda de
por exemplo R$ 200,345 j que o centavo a menor diviso do sistema
monetrio. Mas de qualquer forma, costuma-se tratar a renda como varivel
quantitativa contnua e no discreta.
3
muito comum considerar-se que a estatstica apenas abrange os estudos
que utilizam as variveis quantitativas. Nada mais equivocado. Existe um vasto
campo de aplicaes estatsticas em que so empregadas as variveis
qualitativas, tanto isoladamente como em conjunto com variveis quantitativas.
9
variveis qualitativas nominais por sua vez no definem qualquer ordenamento
ou hierarquia. So exemplos destas a cor , o sexo, o local de nascimento, etc.
4
Dependendo da situao uma varivel qualitativa pode ser representada
(codificada) atravs de emprego de nmeros (por exemplo: em sexo
representamos homens como sendo 0 e mulheres como sendo 1). Mas no
tratamento estatstico dessa varivel codificada no podemos consider-la como
sendo quantitativa. Ela continua sendo uma varivel qualitativa (pois o em sua
essncia e natureza) apesar de sua codificao numrica que tem como
finalidade uma maior finalidade de tabulao de resultados.
No podemos dizer que para qualquer uma destas categorias qualquer
mtodo estatstico pode ser adequadamente aplicado. As variveis quantitativas
contnuas so aquelas que permitem a utilizao de um conjunto maior e
superior de mtodos estatsticos e so, sem dvida, as variveis mais passveis
de um rico tratamento estatstico. Em seguida vm, nessa ordem, as variveis
quantitativas discretas, as variveis qualitativas ordinais e por ltimo, as
variveis qualitativas nominais Essas ltimas so as que permitem a utilizao
de um menor e menos poderoso arsenal de instrumentos estatsticos de anlise.
2.2 Tabelas e Distribuies de Freqncia
A anlise estatstica se inicia quando um conjunto conjunto de dados
torna-se disponvel de acordo com a definio do problema da pesquisa. Um
conjunto de dados, seja de uma populao ou de uma amostra contem muitas
vezes um nmero muito grande de valores. Alm disso, esses valores, na sua
forma bruta, encontram-se muito desorganizados. Eles variam de um valor para
outro sem qualquer ordem ou padro. Os dados precisam ento ser
organizados e apresentados em uma forma sistemtica e seqencial por meio
de uma tabela ou grfico. Quando fazemos isso, as propriedades dos dados
tornam-se mais aparentes e tornamo-nos capazes de determinar os mtodos
estatsticos mais apropriados para serem aplicados no seu estudo.
Suponhamos o seguinte conjunto de dados:
4
No podemos dizer que a cor X superior a cor Y mas podemos afirmar que o
terceiro ano do segundo grau superior hierarquicamente ao primeiro ano do
primeiro grau.
10
14 12 13 11 12 13
16 14 14 15 17 14
11 13 14 15 13 12
14 13 14 13 15 16
12 12
Para montarmos uma distribuio de freqncias desses dados
verificamos quais so os valores no repetidos que existem e em uma primeira
coluna de uma tabela colocamos esses valores e na segunda coluna colocamos
o nmero de repeties de cada um desses valores. Para o exemplo acima, a
distribuio de freqncias ser :
Varivel freqncia
11 2
12 5
13 6
14 7
15 3
16 2
17 1
A freqncia de uma observao o nmero de repeties dessa
observao no conjunto de observaes. A distribuio de freqncia uma
funo formada por pares de valores sendo que o primeiro o valor da
observao (ou valor da varivel) e o segundo o nmero de repeties desse
valor.
Freqncias Relativas e Acumuladas
11
Para o exemplo acima tambm podemos calcular a freqncia relativa
referente a cada valor observado da varivel. A freqncia relativa o valor da
frequncia absoluta dividido pelo nmero total de observaes.
Varivel freqncia
absoluta
freqncia relativa
11 2 2/26 = 0,0769
12 5 5/26 = 0,1923
13 6 6/26 = 0,2308
14 7 7/26 = 0,2692
15 3 3/26 = 0,1154
16 2 2/26 = 0,0769
17 1 1/26 = 0,0385
TOTAL 26 1,0000
Podemos tambm calcular as freqncias acumuladas. Nesse caso
existem as freqncias absolutas acumuladas e as freqncias relativas
acumuladas.
5
Varivel freqncia
absoluta
freqncia
relativa
freqncia
absoluta
acumulada
freqncia
relativa
acumulada
11 2 2/26 = 0,0769 2 2/26 = 0,0769
12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1 1/26 = 0,0385 26 26/26 = 1,0000
TOTAL 26 1,0000
2.3 Histogramas
Histograma uma representao grfica de uma tabela de distribuio
de frequncias. Desenhamos um par de eixos cartesianos e no eixo horizontal
5
Observe que os valores da ltima coluna (freqncia relativa acumulada)
podem ser calculados de duas maneiras. Na primeira, tal como feito na tabela
a seguir, dividimos o valor da freqncia absoluta acumulada pelo total de
observaes. Na segunda maneira, acumulamos o valor da freqncia relativa.
Este ltimo mtodo pode levar a acmulos de erros, de forma que o ltimo valor
de freqncia relativa acumulado se distancie consideravelmente de 1.
12
(abcissas) colocamos os valores da varivel em estudo e no eixo vertical
(ordenadas) colocamos os valores das freqncias. O histograma tanto pode
ser representado para as freqncias absolutas como para as freqncias
relativas. No caso do exemplo anterior, o histograma seria:
Histograma
0
1
2
3
4
5
6
7
1
1
1
2
1
3
1
4
1
5
1
6
1
7
M
a
i
s
Bloco
F
r
e
q

n
c
i
a
Freqncia
histograma de frequncia acumulada (ou ogiva) a representao grfica do
comportamento da frequncia acumulada. Na figura abaixo a ogiva mostrada
em sobreposio ao histograma.

Histograma
0
1
2
3
4
5
6
7
1
1
1
2
1
3
1
4
1
5
1
6
1
7
M
a
i
s
Bloco
F
r
e
q

n
c
i
a
,00%
20,00%
40,00%
60,00%
80,00%
100,00%
Freqncia
% cumulativo
2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas
13
At agora vimos como so calculadas as freqncias (relativas e
acumuladas) para variveis quantitativas discretas. Nesse caso a tabulao dos
resultados mais simples. Mas quando tratamos de variveis quantitativas
contnuas os valores observados devem ser tabulados em intervalos de classes.
Para a determinao dessas classes no existe uma regra pr estabelecida,
sendo necessrio um pouco de tentativa e erro para a soluo mais adequada.
Suponhamos que as safras agrcolas de um determinado produto, em uma
determinada regio seja dada pela tabela a seguir:
Ano Safra (1000 t) Ano Safra (1000 t)
1 280 10 365
2 305 11 280
3 320 12 375
4 330 13 380
5 310 14 400
6 340 15 371
7 310 16 390
8 340 17 400
9 369 18 370

Devem ser seguido alguns passos para a tabulao de freqncias de
dados que se referem a uma varivel quantitativa contnua, como o caso de
nosso exemplo.
1. Definir o nmero de classes. O nmero de classes no deve ser muito
baixo nem muito alto. Um nmero de classes pequeno gera amplitudes de
classes grandes o que pode causar distores na visualizao do histograma.
Um nmero de classes grande gera amplitude de classes muito reduzidas.
Foram definidas regras prticas para a determinao do nmero de classes,
sendo que este deve variar entre 5 e 20 (5 para um nmero muito reduzido
de observaes e 20 para um nmero muito elevado). Se n representa o
nmero de observaes (na amostra ou na populao, conforme for o caso) o
nmero aproximado de classes pode ser calculado por Nmero de Classes =
n arredondando os resultados. No caso do exemplo anterior temos n = 18
e 18 4 24 , e podemos adotar um nmero de 5 classes, que ser razovel.
14
2. Calcular a amplitude das classes. Essa ser obtida conhecendo-se o
nmero de classes e amplitude total dos dados. A amplitude total dos dados
o resultado da subtrao valor mximo - valor mnimo da srie de dados. A
amplitude de classe ser:
classes de
Minimo Valor - Maximo Valor
= classe de Amplitude
nmero
Em geral, o valor do resultado tambm arredondado para um nmero inteiro
mais adequado. No nosso exemplo temos:
Amplitude de Classe =
430 - 280
5
30
3. Preparar a tabela de seleo com os limites de cada classe. Na tabela
abaixo apresentamos para os dados do nosso exemplo os limites inferior e
superior de cada uma das 5 classes de freqncia.
Classe Limite inferior Limite Superior
1 280 310
2 310 340
3 340 370
4 370 400
5 400 430
Observa-se na tabela acima que o limite superior de cada classe coincide com o
limite inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de
uma observao seja exatamente igual ao valor do limite de classe deve-se
estabelecer um critrio de incluso. Para evitar esse tipo de dificuldade
normalmente se estabelece que o limite superior de cada classe aberto (e
consequentemente, o limite inferior de cada classe fechado), ou seja, cada
intervalo de classe no inclui o valor de seu limite superior, com exceo da
ltima classe.
15
4. Tabular os dados por classe de freqncia. A partir da listagem de dados
seleciona-se para cada um deles qual a sua classe de freqncia e
acumula-se o total de freqncia de cada classe. De acordo com nosso
exemplo, teremos:
Classe Freqncia
Absoluta
Simples
Freqncia Relativa
Simples
280 - 310 3 0,12 (12 %)
310 - 340 4 0,16 (16 %)
340 - 370 6 0,24 (24 %)
370 - 400 7 0,28 (28 %)
400 - 430 5 0,20 (20%)
Total 25 1,00 (100 %)
Veremos adiante, quando discutirmos as medidas de posio e de
disperso, que quando agrupamos dados numricos em intervalos de classe
ocorre perda de informao o que leva a resultados no to precisos do que
aqueles que seriam obtidos a partir dos dados originais sem agrupamento.
2.5 Medidas de Posio e de Disperso
Podemos considerar que a Estatstica Descritiva subdivide-se em duas
partes. Na primeira, abordada anteriormente, so estudadas as formas de
apresentao dos dados para que fiquem salientadas as suas caractersticas
principais. Na segunda, que comearemos a tratar agora, abrange as medidas
descritivas na forma de simples nmeros que representam de forma sinttica
essas caractersticas da distribuio estatstica dos dados. Estudaremos, a
rigor, quatro tipos de medidas:
1. Medidas de Tendncia Central (ou medidas de posio). Essa propriedade
dos dados refere-se a localizao do centro de uma distribuio. Elas nos
indicam qual a localizao dos dados ( no eixo que representa o conjunto
dos nmeros inteiros se estivermos tratando de uma varivel quantitativa
contnua).
16
2. Medidas de Disperso. Essa propriedade revela o grau de variao dos
valores individuais em torno do ponto central.
3. Assimetria. a propriedade que indica a tendncia de maior concentrao
dos dados em relao ao ponto central.
4. Curtose. a caracterstica que se refere ao grau de achatamento, ou a taxa
na qual a distribuio cresce ou cai da direita para a esquerda.
2.5.1 Uma Nota sobre Notao Estatstica
Utilizaremos as letras maisculas para representar as variveis, como por
exemplo a varivel X. Os valores individuais que uma varivel pode assumir so
representados pelas correspondentes letras minsculas. Por exemplo se X
usado para designar o peso de uma amostra de 50 pessoas, ento x o valor
numrico do peso de uma dessas 50 pessoas. Diferentes valores de uma
varivel so identificados por subscritos. Assim, os pesos de 50 pessoas em
uma amostra podem ser denotados por x1, x2, ..., x50.
nmero total de observaes em uma populao finita designado por
N e na amostra representado por n. A distino entre medidas
descritivas para populaes e amostras muito importante.
Denotaremos os parmetros (medidas referentes a populao) por
letras gregas ou letras minsculas em portugus. As estatsticas
amostrais sero representadas por letras maisculas em portugus e
os valores observados de uma estatstica amostral pela
correspondente letra minscula em portugus. Por exemplo, as
medidas descritivas a serem introduzidas nessa seo sero
denotadas como segue:

Nome da Medida Parmetro Notao da
Estatstica
Valor
observado
mdia aritmtica

X
x
proporo

P
p
17
mdia geomtrica
~
g
G g
mdia harmnica
~
h
H h
mediana
~
.
x
5
X.5 x.5
moda
~
x
m
Xm xm
2.5.2 A Mdia Aritmtica No Ponderada
A mdia definida como a soma das observaes dividida pelo nmero
de observaes. Se tivermos, por exemplo, n valores, temos:
X
x x x
n
x
n
n
i
i
n

+ + +

1 2 1
...
Propriedades da mdia aritmtica no ponderada:
1. A mdia um valor tpico, ou seja, ela o centro de gravidade da
distribuio, um ponto de equilbrio. Seu valor pode ser substitudo pelo valor
de cada item na srie de dados sem mudar o total. Simbolicamente temos:
n X x ( )
(
6
)
2. A soma dos desvios das observaes em relao a mdia igual a zero.
( ) x X

0
3. A soma dos desvios elevados ao quadrado das observaes em relao a
mdia menor que qualquer soma de quadrados de desvios em relao a
qualquer outro nmero. Em outras palavras,
( ) x X

2
= um mnimo.
6
- Utilizaremos muito freqentemente a notao x
simplificadamente para
representar x
i
i
n

1
.
18
A idia bsica de selecionar um nmero tal que a soma dos quadrados
dos desvios em relao a este nmero minimizada tem grande importncia na
teoria estatstica. Ela chega a ter um nome especial : o princpio dos mnimos
quadrados. Ela , por exemplo, a base racional do mtodo dos mnimos
quadrados que usado para ajustar a melhor curva atravs de um conjunto de
pontos em um sistema de eixos cartesianos, como veremos adiante. Esta
propriedade tambm a base para o clculo de uma importante medida de
disperso, que veremos logo a seguir.
A validade dessas tr6es propriedades pode ser facilmente demonstrada
por um exemplo numrico simples, mostrado na tabela a seguir. Nesta tabela, a
coluna (1) contem o conjunto de dados cuja soma 9 e cuja mdia 3. A
coluna (2) demonstra a primeira propriedade da mdia, ou seja, se cada uma
das observaes individuais dos dados substituda pela mdia, a soma
permanece igual a 9. A coluna (3) verifica que de fato ( ) x X

0 .
Finalmente, as colunas (4), (5) e (6) demonstram que ( ) x X

2
= 14, que
menor que somas quando os desvios individuais so tomados a partir do
nmero 2 e do nmero 5, respectivamente.
(1)
x
(2)
x
(3)
(x - x)
(4)
(x - x)
2
(5)
(x - 2)
2
(6)
(x - 5)
2
1 3 -2 4 1 16
2 3 -1 1 0 9
6 3 +3 9 16 1
Soma 9 9 0 14 17 26

2.5.3 A Mdia Aritmtica Ponderada
No clculo da mdia aritmtica no ponderada todos os valores
observados foram somados atribuindo-se o mesmo peso a todas observaes.
Agora veremos uma nova forma de calcular a mdia. Consideremos um
exemplo familiar de clculo da mdia de notas de estudantes, quando o exame
final vale duas vezes mais do que as duas provas comuns realizadas no
19
decorrer do semestre. Se um determinado obter as notas 7, 5 e 8 a sua mdia
ponderada final ser:
1 (7) +1 (5) +2 8
1+1+2
= 7

Em termos gerais, a frmula para a mdia aritmtica ponderada :
X
w

w x wx
i i
i
n
1
onde wi o peso da observao i
e n o nmero de observaes.
A soma dos pesos no pode ser igual a zero. Fora disto, no existe
restrio para os valores dos pesos. Se todos os pesos forem iguais a 1, a
mdia ponderada recai em seu caso particular, a mdia aritmtica no
ponderada. O mesmo ocorre se todos os pesos forem iguais a uma constante c.
Portanto, a mdia aritmtica no ponderada na realidade uma mdia
aritmtica ponderada com pesos iguais.
2.5.4 Propores como Mdias
Freqentemente encontramos populaes cujas unidades elementares
podem ser classificadas em duas categorias: uma que tem um certo atributo e
outra que no tem esse atributo. Nesse caso, estamos interessados na
proporo de casos que possuem esse atributo. Uma proporo comumente
pensada como uma frao ou porcentagem, mas tambm pode ser pensada
como um caso especial de mdia.
Suponha que queremos determinar a proporo de votantes entre os
cidados brasileiros. Devemos primeiro designar um valor 1 para cada pessoa
qualificada como eleitor e um valor 0 para cada pessoa no qualificada como
eleitor. Ento, a soma dos 1s seria x

e a mdia seria a mdia seria obtida


pela diviso da soma pelo nmero N total de pessoas no Brasil.
20
A mdia da varivel x = x N

. No entanto essa mdia tambm


uma proporo, a proporo de eleitores na populao brasileira.
2.5.5 A Mdia Geomtrica
A mdia geomtrica de uma amostra definida como a raiz ensima do
produto nos n valores amostrais.
G =
n
( )( )...( ) x x x
n 1 2
Por exemplo, a mdia geomtrica de 5, 9 e 13 :
G = = 8,36
3
( )( )( ) 5 9 13
Para a mesma srie de dados a mdia 9. sempre verdade que a
mdia aritmtica maior do que a mdia geomtrica para qualquer srie de
valores positivos, com exceo do caso em que os valores da srie so todos
iguais, quando as duas mdias coincidem.
clculo da mdia geomtrica muito simples. Mas a sua interpretao
e as sua propriedades tornam-se mais evidentes quando reduzimos a
frmula a sua forma logartmica. Tomando logaritmos de ambos os
lados da equao anterior teremos:
logG = log(
n
( )( )...( ) )
log log ... log log
x x x
x x x
n
x
n
n
n
1 2
1 2

+ + +

A concluso que chegamos que o logaritmo da mdia geomtrica


igual a mdia aritmtica dos logaritmos dos valores da srie. Verifica-se que a
mdia geomtrica somente tem significado quando todos os valores da srie
so todos positivos.
Suponhamos como exemplo de aplicao de clculo da mdia
geomtrica os dados da tabela seguinte que mostram as mudanas de preos
de duas mercadorias, A e B, de 1980 a 1985. Durante esse perodo o preo de
A subiu 100 % e o preo de B decresceu 50 %. Qual foi a mudana mdia
21
relativa de preos? Em outras palavras, qual foi o percentual mdio de mudana
de preos?
Preos das Mercadorias A e B em 1980 e 1985
Preo Relativo de Preos
1980 = 100 1985 = 100
Mercadoria 1980 1985 1980 1985 1980 1985
A R$ 50 R$ 100 100 200 50 100
B R$ 20 R$ 10 100 50 200 100
Mdia Aritmtica 100 125 125 100
Mdia Geomtrica 100 100 100 100
A mdia aritmtica fornece uma resposta incorreta para essa questo.
Como indicado pelos clculos da tabela acima leva a duas concluses opostas.
Se 1980 tomado como base para o relativo de preos, os preos so em
mdia 25 % maiores em 1985 do que em 1980. Se 1985 tomado como base,
os preos de 1980 so 25 % maiores do que os preos de 1985. Portanto, a
mdia aritmtica dos relativos de preos conduz a resultados inconsistentes.
No entanto, um resultado consistente obtido quando a mdia
geomtrica aplicada:
1. Se 1980 escolhido como a base, os preos de 1985 so 100 % dos preos
de 1980, ou seja:
g 200 50 10 000 100 .
2. Se 1985 escolhido como a base, os preos de 1980 sero tambm 100 %
dos preos em 1985, ou seja:
g 50 200 100
22

A mais importante aplicao da mdia geomtrica refere-se talvez ao
clculo de taxas de crescimento mdias, desde que essas podem ser
corretamente medidas somente por esse mtodo. Para exemplificar, no campo
da economia, esse ponto, suponha que a produo anual de um setor industrial
cresceu de 10.000 para 17.280 unidades durante o perodo 1985-1988 como
mostrado na tabela a seguir; qual a taxa mdia de crescimento anual? A taxa
mdia anual de crescimento pode ser calculada a partir dos valores em
porcentagem da produo em relao aos anos anteriores. Se calcularmos a
mdia aritmtica desses valores teramos:
x + + ( ) / 60 96 300 3 152
implicando uma taxa de crescimento mdia de 152 -100 = 52 %. Se a produo
cresce 52 % ao ano, comeando da produo de 1985 de 10.000 unidades,
ento a produo de 1986 seria de
23.0 + 0,52 (10.000) = 15.200;
a produo de 1987 seria de
15.200+ 0,52(15.200) = 23.104;
a produo de 1988 seria de
23.104 + 0,52(23.104) = 35.118,08
23
Ano 1985 1986 1987 1988
Produo
Porcentagem
do ano
anterior
10.000 6.000
60
5.760
96
17.280
300

Observe-se que este ltimo valor quase 200 % do valor efetivamente
observado em 1988, de 17.200.
A mdia geomtrica, por sua vez, :
g ( )( )( ) 60 96 300 120
3
implicando uma taxa anual mdia de crescimento de 120 - 100 = 20 %.
Verificando, teremos:
no ano de 1986: 10.000 + 0,20(10.000) = 12.000;
no ano de 1987: 12.000 + 0,20(12.000) = 14.400;
no ano de 1988: 12.000 + 0,20(14.400) = 17.280 que coincide com o valor
observado efetivamente em 1988.
Se o valor da mdia geomtrica das porcentagens de crescimento for
menor do que 100, implica em uma porcentagem mdia de crescimento
negativa, o que indica uma taxa mdia de declnio ao invs de uma taxa mdia
de crescimento.
7
Atente tambm para o fato de que as trs porcentagens a
partir das quais a mdia geomtrica calculada so percentuais do ano anterior
ao invs de mudana percentual do ano anterior.
8

clculo da taxa mdia de crescimento baseado principalmente na
hiptese de uma taxa constante de crescimento ou de que os valores
individuais formam uma progresso geomtrica. Quando o clculo
7
Se, por exemplo, ao invs de 60, 96 e 300 %, como anteriormente, tivermos
60, 96 e 78 %, a taxa de crescimento geomtrica mdia ser de
g ( )( )( ) , 60 96 78 76 59
3
, o que indica um decrscimo mdio de 76,59 - 100 = -
23,41 %.
8
Essas ltimas porcentagens, referentes ao exemplo da tabela anterior, seriam
(6.000 - 10.000)/10.000= - 0,40, ou seja - 40 %; (5.760 - 6.000)/6.000 = -0,04 ,
ou seja, - 4 %; e (17.280 - 5.760)/5760 = 2, ou seja + 200 %.

24
envolve um nmero considervel de perodos, utiliza-se com mais
freqncia uma frmula que se relaciona com a mdia geomtrica, que
:
R
x
x
f
i
n

_
,

1
onde:
R = taxa de crescimento geomtrica mdia,
n = nmero de perodos de tempo,
xf = valor no perodo final,
xi = valor no perodo inicial.
Para os dados da tabela anterior, teremos:
R

_
,

17 280
10 000
1 0 20
3
.
.
, ou 20 % , como obtido anteriormente.
9
Note que
R = G -1.
2.5.6 A Mdia Harmnica
A mdia harmnica o inverso da mdia aritmtica dos inversos dos
valores observados. Simbolicamente, para uma amostra, temos:
H
x x x
n
x
n
n
x
n

+ + +

1
1 1 1
1
1
1
1 2
...
( / )
( / )
Para clculos mais simples, a frmula anterior pode ser reescrita como:
9
- interessante notar que pelo clculo anterior empregam-se os valores dos
anos intermedirios, ao passo que nesse ltimo, apenas empregam-se os
valores do perodo inicial e final, no importando o que ocorreu nos perodos
intermedirios.
25
1
1 1 1
1
1 2
H
x x x
n
x
n
n

+ + +


...
( / )
A mdia harmnica dos trs valores 4, 10 e 16 :
1
1
4
1
10
1
16
3
0 1375
7 27
H
H

+ +

,
,

Para os mesmos dados a mdia aritmtica 10 e a mdia geomtrica
8,62. Para qualquer srie de dados cujos valores no so todos os mesmos e
que no incluem o zero, a mdia harmnica sempre menor que tanto a mdia
aritmtica como a mdia geomtrica.
2.5.7 A Mediana
A mediana o valor do item central da srie quando estes so arranjados
em ordem de magnitude. Para a srie R$ 2, R$ 4, R$ 5, R$ 7 e R$ 8, a mediana
o valor do terceiro item, R$ 5. No caso do nmero de itens na srie ser par, a
mediana a semi-soma dos dois valores mais centrais. Por exemplo, para a
srie 3, 5 ,8 ,10, 15 e 21 kg, a mediana a media dos valores 8 e 10, ou seja 9.
A mediana pode ser formalmente definida como o valor que divide a srie
de tal forma que no mnimo 50 % dos itens so iguais ou menores do que ela, e
no mnimo 50 % dos itens so iguais ou maiores do que ela. Mais
rigorosamente, estabelecemos que:
X.5 = o valor do [(n+1)/2] -simo item
Por exemplo, para uma srie formada pelos valores 3,5,8,10,15 e 21 a
mediana ser o valor do [(6+1)/2] = 3,5 simo item, ou seja, a semi soma do
item de posto 3 e do item de posto 4, que so 8 e 10.
26
O valor da mediana no influenciado pelos valores nas caudas
de uma distribuio. Por exemplo, se temos a srie de dados 1,2,3,4,5 a
mediana 3. Se substitumos os valores das caudas dessa distribuio por
quaisquer valores uma nova distribuio formada poderia ser formada pela srie
-1000,-100,3,500,5000 e a mediana permanece sendo 3. Portanto, ela uma
medida de posio da distribuio bem adequada para distribuies
assimtricas, tais como a distribuio de renda, j que no sabemos se a famlia
mais rica ganha R$7.000.000 ou R$ 500.000.000. Veremos, mais a frente que
ela possui vantagens em relao a mdia aritmtica, como medida de posio
(ou medida de tendncia central) para dados agrupados em classes de
freqncia, quando a ltima classe tem limite superior indeterminado.
A mediana tambm tem a interessante propriedade de que a soma dos desvios
absolutos das observaes em relao a mediana menor do que a soma dos
desvios absolutos a partir de qualquer outro ponto na distribuio.
Simbolicamente:
x X

.5
um mnimo
2.5.8 A Mdia para Dados Agrupados
Quando estamos tratando de amostras ou populaes muito grandes
conveniente calcular as medidas descritivas a partir das distribuies de
freqncia. A mdia no pode ser determinada exatamente a partir de
distribuies de freqncia, mas uma boa aproximao pode ser obtida pela
hiptese do ponto mdio. A aproximao quase sempre muito satisfatria se a
distribuio bem construda.
10
A hiptese do ponto mdio refere-se a
considerar-se de que todas as observaes de uma dada classe esto
centradas no ponto mdio daquela classe. Consequentemente, o valor total da
freqncia da classe da i-sima classe simplesmente o produto fi mi, onde fi
a freqncia (absoluta simples) da classe i e mi ponto mdio da classe i. Sob
10
Isto , principalmente se no agrupamento dos dados originais em uma tabela
de distribuio de freqncia, empregou-se um nmero adequado de classes de
freqncia.
27
essa hiptese, a mdia aproximada para uma distribuio de uma amostra com
k classes vem a ser:
X
f m f m f m
f f f
fm
f
k k
k

+ + +
+ + +

1 1 2 2
1 2
...
...

fm
n
importante notar que todos os somatrios na equao acima referem-
se s classes e no s observaes individuais. Consideremos a seguinte
tabela de distribuio de freqncia para dados de gasto com alimentao
extrados de uma pesquisa de oramentos familiares.
Classe f m fm
R$ 120,00 - R$139,99 5 130,0 650,0
140,00 - 159,99 26 150,0 3900,0
160,00 - 179,99 24 170,0 4080,0
180,00 - 199,99 15 190,0 2850,0
200,00 - 219,99 8 210,0 1680,0
220,00 - 239,99 2 230,0 460,0
Total 80 13620,0

25 , 170 $
80
00 , 13620
R x
Ao utilizar essa aproximao estamos considerando a hiptese de
que todas as observaes em cada classe esto uniformemente distribudas
nessa classe. Por exemplo, se tivermos um intervalo de tamanho 100 e com
frequncia igual a 6 observaes, a localizao dessas observaes seria
0,20,40,60,80 e 100, com distncia constante entre cada par de observaes,
de forma que:
0+20+40+60+80+100 = 300 = m x 6 e m = 50 , ou seja o ponto mdio do
intervalo de 0 a 100. Conclui-se que se a distribuio das observaes for
uniforme em cada intervalo, o somatrio dos valores das observaes de cada
intervalo igual ao produto da freqncia no intervalo pelo valor do ponto mdio
28
desse intervalo. Supe-se que com uma conveniente construo de intervalos
de classe os eventuais erros nos intervalos compensam-se mutuamente.
2.5.9 A Mediana para dados Agrupados
Assim como possvel estabelecer uma aproximao da mdia
aritmtica para dados agrupados, o mesmo pode ser feito para a mediana. O
mtodo usado o da interpolao utilizando-se a distribuio de freqncia
acumulada ou ogiva. Inicialmente determina-se a classe que contem a mediana.
Essa ser a classe cuja freqncia acumulada relativa correspondente a seu
limite inferior menor que 0,50 (ou 50 %) e a freqncia acumulada relativa
correspondente a seu limite superior maior que 0,50 (ou 50 %). O prximo
passo a determinao do ponto exato onde localiza-se a mediana naquela
classe. Para o exemplo anterior de gastos com alimentao de famlias, temos:
Classe freq. absoluta
simples
freq.acumulada freqncia
relativa
acumulada
R$ 120,00 - R$139,99 5 5 0,0625
140,00 - 159,99 26 31 0,3875
160,00 - 179,99 24 55 0,6875
180,00 - 199,99 15 70 0,8750
200,00 - 219,99 8 78 0,9750
220,00 - 239,99 2 80 1,0000
Total 80

A classe que contm a mediana a terceira classe, pois a freqncia
relativa acumulada da classe anterior (segunda classe) menor que 0,5 e a
freqncia relativa acumulada da terceira classe maior do que 0,5.
11


Freqncia acumulada da classe que contem
11
- A freqncia relativa acumulada da classe anterior classe corrente a
freqncia relativa acumulada do limite inferior da classe corrente. A freqncia
relativa acumulada da classe corrente a freqncia relativa acumulada do
limite superior dessa mesma classe.
29
a mediana

5 , 40
2
1 80
2
1

+ n


Por semelhana de tringulos, verifica-se que:
X
X
.
.
,
,
5
5
160
180 160
40 5 31
55 31
167 92


Este procedimento o mesmo que a seguinte frmula de interpolao:
X LI
n F
f
c
a
. .
.
( ) /
5 5
5
1 2
+
+

1
]
1
onde:
LI.5 = limite de classe inferior da classe da mediana,
Fa = freqncia acumulada da classe imediatamente anterior classe da
mediana,
f.5 = freqncia absoluta simples da classe da mediana,
c = amplitude (tamanho) da classe da mediana.
2.5.10 A Moda para dados Agrupados
A moda de uma distribuio de freqncia pode muitas vezes ser
aproximada pelo ponto mdio da classe modal - a classe com maior densidade
30
X.5
160 180
X
55
31
F
de freqncia.
12
Ento, para os dados de gastos com alimentao do exemplo
anterior, xm = R$ 150, o ponto mdio da segunda classe, que possui a maior
freqncia. Esse mtodo de localizar a moda totalmente satisfatrio quando
as densidades de freqncia da classe imediatamente anterior classe modal
(a classe premodal) e da classe imediatamente posterior classe modal (classe
posmodal) so aproximadamente iguais. Quando isso no ocorre, como
sugerido pela figura a seguir, resultados mais precisos podem ser obtidos com a
seguinte frmula, para uma amostra:
X L c
m m
+
+
( )


1
1 2
onde:
Lm = o verdadeiro
13
limite inferior de classe da classe modal
1 = da diferena entre das densidades de freqncia da classe modal e
classe premodal.
2 = da diferena entre das densidades de freqncia da classe modal e
classe posmodal.
C = a verdadeira amplitude de classe da classe modal.

Interpretao geomtrica da interpolao
12
Definimos densidade de freqncia de um intervalo de classe como sendo o
quociente entre a freqncia absoluta simples desse intervalo e o seu tamanho
(amplitude). Quando os intervalos de classe possuem amplitudes desiguais,
existe uma tendncia de os intervalos maiores apresentarem maiores
freqncias. Dessa forma a classe modal no a classe de maior freqncia
mas a classe de maior densidade de freqncia. Naturalmente, quando todos os
intervalos tm a mesma amplitude, como no caso do exemplo anterior e como
geralmente so construdos para no distorcer a distribuio, a classe modal a
classe de maior densidade de freqncia assim como tambm a classe de
maior freqncia. Esse conceito de densidade de freqncia ser muito til,
quando definirmos, mais adiante, a funo densidade de probabilidade e para a
sua compreenso intuitiva.
13
1
Para determinar os limites de classe verdadeiros para uma varivel contnua,
temos que escrever os limites de classe com uma casa decimal a mais do que
os dados originais. Por exemplo, se o conjunto de dados consiste de medidas
de peso arredondadas para um dcimo de grama, os limites nominais de classe
(tambm chamados de limites aparentes podem ser 11,0 - 11,2; 11,3 - 11,5;11,6
- 11.8; ... Os limites verdadeiros de classe (tambm conhecidos como limites
reais ou efetivos) seriam 10,95 - 11,25; 11,25 - 11,55; 11,55 - 11,85;...
31
algbrica para a determinao da moda





No exemplo anterior de gastos com alimentos de 80 famlias, como
a amplitude de todos os intervalos so iguais, podemos utilizar as
freqncias absolutas de classe no lugar das densidades de freqncia,
para o clculo do valor aproximado da mediana.
Lm = 140,00 1 = 26 - 15 = 11
c = 20 2 = 26 - 24 = 2
x
m
+
+
140 00
11
11 2
20 156 92 , ( ) ,
Uma observaes aqui necessria. possvel calcular os
valores aproximados da mediana e da moda para dados agrupados
quando o ltimo intervalo de classe tem limite superior indeterminado. No
caso da mediana isso imediato e no caso da moda, o seu clculo
somente pode ser feito se a ltima classe no for a classe modal e
preciso primeiramente calcular as densidades de freqncia. Como
exemplo, suponhamos que a distribuio de renda de uma certa regio
dada pela seguinte distribuio de freqncia:
32
Densidade de
freqncia
xm X
renda (R$)
limites nominais
limites reais freqncia
absoluta
densidade de
freqncia
0 - 120 0 - 120,50 40 40/120,50 = 0,332
121 - 605 120,50 - 605,50 170 170/485 = 0,350
606 - 1200 605,50 - 1200,50 220 220/595 = 0,370
1201 - 2400 1250,50 - 2400,50 15 15/1150 = 0,013
mais de 2400 mais de 2450,50 97 indeterminado
Total 542

A mediana est localizada na terceira classe:
14
x
.
,
( )
( , , )
5
605 50
542 1
2
210
220
1200 50 605 50 772 +
+

1
]
1
1

A classe modal tambm a terceira classe:
15

x
m
+

+
605 50
0 370 0 350
0 370 0 350 0 370 0 013
1200 50 605 50 637 ,
( , , )
( , , ) ( , , )
( , , )
Infelizmente, para esse exemplo no possvel o clculo da mdia, o que
demonstra que para algumas situaes temos que contar com a mediana
como medida de posio (ou de tendncia central) de uma distribuio
estatstica.
14
Observe-se que os dados originais esto, de acordo com o sugerido pela
tabela acima, com aproximao igual a unidades de gramas. Os limites
verdadeiros (ou reais) de classe) passam, portanto, a ter aproximao de uma
casa decimal de grama. O valor final dos clculos da mediana e da moda so
aproximados para unidades de grama, j que essa a aproximao dos dados
originais (que se refere ao instrumento de medida).
15
1
J que esta classe a que apresenta maior densidade de freqncia. Como a
ltima classe no tem limite superior definido no foi possvel calcular sua
densidade de freqncia, j que no podemos determinar sua amplitude.
Dependendo dessa amplitude ela poderia ter uma densidade de freqncia
maior que a da terceira classe. Mas mesmo nesse caso, a terceira classe ainda
seria modal, j que sua densidade de freqncia maior que a das suas
classes vizinhas, e a distribuio passaria a ser bimodal.
33
Discutiremos agora comparativamente algumas das caractersticas
das trs principais medidas de posio:
A Mdia Aritmtica

1) Ela afetada por todas as observaes e influenciada pelas
magnitudes absolutas dos valores extremos na srie de dados.
2) Ela das trs medidas de posio a que possibilita maiores
manipulaes algbricas, dadas as caractersticas de sua frmula.
3) Em amostragem, a mdia uma estatstica estvel. Isso ser
aprofundado posteriormente.
A Mediana
1) Seu valor afetado pelo nmero de observaes e como elas
esto distribudas mas ela no afetada pelos valores das
observaes extremas.
2) Sua frmula no passvel de manipulao algbrica.
3) Seu valor pode ser obtido, como vimos, em distribuies, com
limites superiores indeterminados para a sua ltima classe.
4) A mediana a estatstica mais adequada para descrever
observaes que so ordenadas ao invs de medidas.
A Moda
1) A moda o valor mais tpico e representativo de uma distribuio.
Ela
representa o seu valor mais provvel.
2) Como a mediana, a moda tambm no influenciada pelos
valores extremos da distribuio e no permite manipulaes
algbricas como a frmula da mdia.
34
Existem algumas relaes entre as diversas medidas de posio:
1) Para qualquer srie, exceto quando no caso de todas as
observaes coincidirem em um nico valor, a mdia aritmtica
sempre maior que a mdia geomtrica, a qual, por sua vez, maior
que a mdia harmnica.
2) Para uma distribuio simtrica e unimodal, mdia = mediana =
moda.
3) Para uma distribuio positivamente assimtrica, mdia > mediana
> moda. A distncia entre a mediana e a mdia cerca de um tero
da distncia entre a moda e a mdia.
4) Para uma distribuio negativamente assimtrica, mdia <
mediana < moda. A distncia entre a mediana e a mdia cerca de
um tero da distncia entre a moda e a mdia.
Essas ltimas caractersticas so apresentadas graficamente, a seguir
POSIES RELATIVAS DA MDIA, MEDIANA E MODA EM FUNO DA
ASSIMETRIA DAS DISTRIBUIES


35
Assimetria positiva
Medidas de Disperso, Assimetria e Curtose
Muitas sries estatsticas podem apresentar a mesma mdia, mas no
entanto, os dados de cada uma dessas sries podem distribuir-se de forma
distinta em torno de cada uma das mdias dessas sries. Na anlise descritiva
de uma distribuio estatstica fundamental, alm da determinao de uma
medida de tendncia central, conhecer a disperso dos dados e a forma da
distribuio. Duas sries de dados podem possuir a mesma mdia, mas uma
pode apresentar valores mais homogneos (menos dispersos em relao a
mdia) do que a outra. Um pas, por exemplo, com uma distribuio de renda
mais equnime, ter uma disperso de suas rendas menor do que um pas com
estrutura de renda mais diferenciada em diversos estratos ou categorias sociais.
Uma mquina que produz parafusos e que estiver menos ajustada do que outra
produzir medidas de parafusos com distribuio mais dispersa em torno de sua
mdia.
A inequao das mdias
A importncia das mdias com freqncia exagerada. Se dizemos que
a renda familiar mdia de um determinado pas de US$ 5.000 por ano no
36
Assimetria negativa
Distribuio Simtrica
Assimetria negativa
sabemos muita coisa sobre a distribuio de renda desse pas. Uma mdia,
como um simples valor adotado para representar a tendncia central de uma
srie de dados uma medida muito til. Porm, o uso de um simples e nico
valor para descrever uma distribuio abstrai-se de muitos aspectos
importantes.
Em primeiro lugar, nem todas as observaes de uma srie de dados tem
o mesmo valor da mdia. Quase sem exceo, as observaes includas em
uma distribuio distanciam-se do valor central, embora o grau de afastamento
varie de uma srie para outra. Muito pouco pode ser dito a respeito da
disperso mesmo quando diversas medidas de tendncia central so calculadas
para a srie. Por exemplo, no podemos dizer qual distribuio tem maior ou
menor grau de disperso da informao dada pela tabela abaixo.
Distribuio A Distribuio B
Mdia
Mediana
Moda
15
15
15
15
12
6
Uma segunda considerao que as formas de distribuio diferem de
um conjunto de dados para outro. Algumas so simtricas; outras no. Assim,
para descrever uma distribuio precisamos tambm de uma medida do grau de
simetria ou assimetria. A estatstica descritiva para esta caracterstica
chamada de medida de assimetria.
Finalmente, existem diferenas no grau de achatamento entre as
diferentes distribuies. Esta propriedade chamada de curtose (em ingls,
kurtosis ). Medir a curtose de uma distribuio significa comparar a
concentrao de observaes prximas do valor central com a concentrao de
observaes prximas das extremidades da distribuio.
2.5.11 O Intervalo (ou amplitude)
37
A medida de disperso mais simples a amplitude, a diferena entre o
maior e o menor valor nos dados. Para uma distribuio de freqncia que usa
intervalos de classe, a amplitude pode ser considerada como a diferena entre o
maior e o menor limite de classe ou a diferena entre os pontos mdios dos
intervalos de classe extremos. Os preos de aes e de outros ativos
financeiros so freqentemente descritos em termos de sua amplitude, com a
apresentao pelas Bolsas de Valores do maior valor e do menor valor da ao
em um determinado perodo de tempo.
Para algumas distribuies simtricas a mdia pode ser aproximada
tomando-se a semi-soma dos dois valores extremos,
16
que freqentemente
chamada de semi-amplitude. Por exemplo, prtica entre os meteorologistas
derivar a mdia diria de temperatura tomando a mdia somente dos valores
mximo e mnimo de temperatura ao invs, de digamos, a mdia das 24 leituras
horrias do dia.
A amplitude tem alguns defeitos srios. Ela pode ser influenciada por um
valor atpico na amostra. Alm disso o seu valor independe do que ocorre no
interior da distribuio, j que somente depende dos valores extremos. Este
defeito ilustrado na figura a seguir:



16
1
Foi o que fizemos ao calcular a mdia para valores agrupados em classes de
freqncia. Nesse caso utilizamos o ponto mdio de cada intervalo de classe
como representativo da mdia de cada intervalo. Assim, ao multiplicarmos a
freqncia de cada classe pelo valor do ponto mdio, estamos calculando
aproximadamente a soma das observaes em cada intervalo, admitindo como
hiptese que a distribuio dos dados em todos os intervalos simtrica.
38
f(X)
X
Na figura acima so mostradas duas distribuies com diferentes
variabilidade, mas com mesma amplitude. A amplitude tende a crescer, embora
no proporcionalmente, a medida que o tamanho da amostra cresce. Por esta
razo, no podemos interpretar a amplitude corretamente sem conhecer o
nmero de informaes dos dados.

2.5.12 Percentis, Decis e Quartis
Podemos tentar responder a seguinte pergunta: que proporo dos
valores de uma varivel menor ou igual a um dado valor? Ou maior ou igual a
um dado valor? Ou entre dois valores ? Quando construmos uma distribuio
de freqncia acumulada, tais questes somente podem ser respondidas com
relao aos limites de classe exatos. Por exemplo, a partir da distribuio de
freqncia relativa acumulada da pgina 28, podemos dizer que 38,75 % das
observaes so menores do que 159,99. Mas no podemos responder a
pergunta: qual o gasto familiar tal que a proporo da amostra tendo este
valor ou menos 35 %?. Mas visvel da tabela que 6,25 % das famlias
gastam com alimentao at R$ 139,99 e 38,75 % das famlias gastam at R$
159,99. Portanto, como 35 % est entre estes dois valores, o gasto familiar tal
que a proporo da amostra tendo este valor ou menos 35 % est situado
entre R$ 139,99 e R$ 159,99. Este valor chamado de percentil 35.
O percentil 40 o valor da varivel que maior do que 40 % das
observaes. Generalizando, o percentil x, o valor da varivel que maior do
que x % das observaes. Em outras palavras, o percentil x o valor da
varivel correspondente ao valor de freqncia relativa acumulada de x %.
17
O
17
1
Para o clculo do valor exato do percentil x para dados agrupados utiliza-se o
mesmo mtodo para a determinao da mediana, ou seja, a interpolao linear.
Como no caso da mediana, podemos empregar uma frmula de interpolao
X LI
p n F
f
c
p p
a
p
+
+

1
]
1
1
( ) / 1 100
onde Xp o percentil p, Lip o limite inferior real da classe que contem o
percentil, Fa a freqncia relativa acumulada da classe anterior classe que
39
primeiro decil o valor da varivel que supera um dcimo (ou 10 %) do total de
observaes. Se tivermos 200 observaes, o segundo decil ser
aproximadamente a observao de posto 40.
O primeiro quartil o valor da varivel cuja freqncia relativa acumulada
0,25 (ou 25 %). O terceiro quartil o valor da varivel cuja freqncia relativa
acumulada 0,75 (ou 75 %). O primeiro quartil maior do que um quarto dos
valores observados e menor do que trs quartos destes valores. O terceiro
quartil maior do que trs quartos dos valores observados e menor do que um
quarto destes valores. O segundo quartil confunde-se com a mediana.
Uma medida de disperso o chamado desvio interquartlico que a
diferena entre o terceiro e o primeiro quartis.
2.5.13 Varincia e Desvio Padro
A varincia definida como a mdia dos desvios ao quadrado em relao
mdia da distribuio. Para uma amostra,
1
) (
2
2

n
X x
S
Para uma populao finita,
N
x

2
2
) (

Na penltima equao, n-1 chamado de nmero de graus de liberdade de S


2
, um conceito a ser definido mais tarde. Existe uma restrio para esta equao:
n > 1 (no se pode calcular a varincia para uma amostra de uma observao
apenas). O desvio padro a raiz quadrada da varincia, e denotado S (para
amostra) e (para populao). Existem frmulas que facilitam os clculos para
S
2
e
2
:
contem o percentil, fp a freqncia relativa (simples) da classe que contem o
percentil, c a amplitude do intervalo de classe que contem o percentil e o
nmero de observaes. O mesmo mtodo pode ser empregado tambm para
os decis e quartis.
40
S
n x x
n n
x
N
x
N
2
2 2
2
2
2
1

_
,



( )
( )

Com estas duas ltimas frmulas, podemos calcular a varincia somente


com a soma dos valores ( x

) e a soma dos quadrados dos valores ( x


2

);
no mais necessrio calcular a mdia, em seguida os desvios em relao s
mdias e finalmente os quadrados destes desvios.
Para ilustrar o processo de clculo da varincia e desvio padro e para
mostrar o uso destas medidas, considere o seguinte exemplo. Dois tipos
diferentes de mquina, X e Y so projetadas para produzir o mesmo produto.
Elas tm o mesmo preo de venda. Um fabricante est tentando decidir qual
delas comprar e observou 10 mquinas distintas de cada tipo em operao por
uma hora. A tabela seguinte mostra as produes horrias nas primeiras duas
colunas. As mdias so x
403
10
40 3 , unidades por hora e y
408
10
40 8 ,
unidades por hora. Portanto, com base nestes dados, o tipo Y um pouco mais
rpida. Podemos retirar mais alguma informao a partir destes dados?
Podemos medir e comparar as disperses das produes horrias dos dois
tipos de mquina. Usando a penltima frmula para os dados da tabela,
obtemos:
S
S
S
S
X
X
Y
Y
2
2
2
2
10 16 405 403
10 10 1
18 23
18 23 4 27
10 17 984 408
10 10 1
13511
13512 11 62



( . ) ( )
( )
,
, ,
( . ) ( )
( )
,
, ,
unidades por hora
unidades por hora
x y x
2
y
2
41
35
36
49
44
43
37
38
42
39
40
25
26
55
52
48
24
34
47
50
47
1.225
1.296
2.401
1.936
1.849
1.369
1.444
1.764
1.521
1.600
625
676
3.025
2.704
2.304
576
1.156
2.209
2.500
2.209
Soma 403 408 16.405 17.984
O tipo X tem menor disperso que o tipo Y. Apesar de ter maior preo
que o tipo Y, a mquina X mais precisa.
2.5.14 Varincia e Desvio Padro para Dados Agrupados
A varincia e o desvio padro (como a mdia, mediana, moda, quartis,
percentis, decis) podem ser calculados para dados agrupados, ou seja,
distribuies de freqncia com intervalos de classe. Entretanto, os resultados
podem ser apenas aproximadamente precisos. Utiliza-se, como no caso da
mdia, a hiptese do ponto mdio: a de que toda observao est localizada no
ponto mdio de sua classe. Cada ponto mdio entra nos clculos quantas vezes
so as observaes naquele intervalo de classe. As equaes para as
varincias so:
42
S
f m X
n
f m
N
2
2
1

( )
( )
, para a amostra;
, para a populacao.
2


Os smbolos utilizados nestas equaes j foram definidos anteriormente.
Para facilitar os clculos podemos utilizar as seguintes frmulas mais
convenientes para as varincias:
S
fm fm n
n
fm N
N
2
2 2
2
1



( ) /
( ) /

e
=
fm
2
2

para a amostra e populao, respectivamente. Aqui, como antes, assumimos


que a populao finita.
Os somatrios em todas estas equaes so para todas as k classes,
no para as observaes individuais. Estas equaes podem ser aplicadas
tanto para intervalos de classe iguais como para intervalos de classe desiguais.
Entretanto, elas no podem ser empregadas quando existem um ou mais
intervalos sem limites. Como para os dados no agrupados, a raiz quadrada
destas equaes so os desvios padres para a amostra e para a populao,
respectivamente.
Aplicando as ltimas equaes para o exemplo de consumo de
alimentos, temos:
Classe (1)
m
(2)
f
(3)
fm
(2)(1)
(4)
fm
2
(3)(1)
R$ 120,00 - R$139,99 130 5 650 84.500
140,00 - 159,99 150 26 3.900 585.000
160,00 - 179,99 170 24 4.080 693.000
180,00 - 199,99 190 15 2.850 541.500
200,00 - 219,99 210 8 1.680 352.800
220,00 - 239,99 230 2 460 105.800
43
Total 80 13.620 2.363.200
S
fm fm n
n
S
2
2 2 2
1
2 363 200 13 620 80
80 1
561 96
561 96 23 71




( ) / . . ( . ) /
,
, ,
2.5.15 Interpretando e Aplicando o Desvio Padro
O desvio padro mais a mais usada das medidas de variabilidade.
Infelizmente, o desvio padro no tem uma interpretao intuitivamente bvia.
Por exemplo, no exemplo anterior das mquinas, SX = 4,27 unidades por hora,
mas no bvio o que isto quer dizer para a mquina X. Para muitas sries de
dados h dois teoremas para a interpretao do desvio padro que so muito
teis. Eles so chamados de Desigualdade de Chebyshev e a Regra de Gauss,
as quais introduzimos a seguir.
Teorema: Desigualdade de Chebyshev. Para qualquer conjunto de dados e
qualquer constante h > 1, no mnimo
1 1
2
/ h
dos dados estaro situados dentro
de um intervalo formado por h desvios padres abaixo e acima da mdia.
Por este teorema temos certeza de que no mnimo , ou 75 % dos dados
iro situar-se dentro do intervalo
X S t 2
. Neste caso h = 2 e
1 1 1 1 2 3 4
2 2
/ / / h
. No mnimo 8/9, ou 88,9 % dos dados estaro no
intervalo X S t3 ; e no mnimo 15/16, ou cerca de 94 % dos valores de
qualquer varivel estaro includos dentro do intervalo X S t4 .
Considere o exemplo anterior das mquinas. Temos X 40 3 , e S
X
4 27 ,
. Que percentagem das mquinas tero produo entre
X S
X
t t 15 40 3 15 4 27 , , , , , ou seja, entre 33,9 e 46,7? Resposta: no mnimo
1
1
15
0 56
2

,
,
, ou aproximadamente 56 %. Da tabela anterior encontramos 9
das 10 mquinas tipo X que esto dentro deste intervalo e claramente 9/10
maior do que 56 %.
44
A vantagem da Desigualdade de Chebyshev que ela pode ser aplicada
variveis com qualquer padro de distribuio (no importa que sejam
simtricas, assimtricas, mesocrticas, platicrticas, leptocticas, etc.).
Entretanto, ela tem a desvantagem de no ser muito precisa, j que a
porcentagem efetiva que caem dentro do intervalo em torno da mdia quase
sempre muito maior do que o mnimo dado por
1 1
2
/ h
, especialmente quando
as amostras so pequenas, como no nosso exemplo anterior.
Teorema: A Regra de Gauss. Se os dados so amostrais e se so, de forma
aproximada, distribudos normalmente, ou seja, o histograma dos dados
aproximadamente simtrico e tem a forma de um sino, ento:
1.
X S t1
incluir aproximadamente 68 % dos dados
2. X S t2 incluir aproximadamente 95 % dos dados
3. X S t3 incluir aproximadamente 100 % dos dados
Chamamos isto de Regra de Gauss, porque baseada na distribuio de
probabilidade gaussiana (ou distribuio de probabilidade normal). Esta
distribuio ser discutida em detalhe em um captulo posterior.
2.5.16 Coeficiente de Variao
Com freqncia, como no caso do exemplo das duas mquinas,
queremos comparar a variabilidade de dois ou mais conjuntos de dados.
Podemos fazer isto facilmente usando as varincias ou os desvios padres
quando, primeiro, todas as observaes individuais tm a mesma unidade de
medida e, segundo, as mdias dos conjuntos de dados so aproximadamente
iguais. Quando qualquer uma destas condies no satisfeita, uma medida
relativa de disperso deve ser usada. Uma medida relativa de variabilidade
freqentemente usada chamada de coeficiente de variao, denotada por CV
para uma amostra. Esta medida o valor do desvio padro em relao mdia:
CV
S
X

45
Suponha que um cientista na ndia obteve os seguintes dados referentes
aos pesos de elefantes e ratos.
Elefantes Ratos
x
E
6 000 . kg
s kg
E
300
x kg
R
0 150 ,
s kg
R
0 04 ,
Se calcularmos os respectivos coeficientes de variao, teremos:
cv(X ou 5,0 %
cv(X ou 26,7 %
E
R
) ,
)
,
,
,


s
x
s
x
E
E
R
R
300
6000
0 050
0 04
0 150
0 266
Portanto, a variabilidade relativa dos pesos dos ratos mais do que 5
vezes maior do que a variabilidade dos pesos dos elefantes. Para o exemplo
anterior das mquinas, teremos:
cv(X ou 10,60 %
cv(Y ou 28,48 %
)
,
,
,
)
,
,
,


4 27
40 30
0 1060
11 62
40 80
0 2848
Assim, a disperso relativa da produo da mquina Y quase trs
vezes maior do que a disperso relativa da mquina X.

2.6 Medidas de Assimetria
Duas distribuies tambm podem diferir uma da outra em termos de
assimetria ou achatamento, ou ambas. Como veremos, assimetria e
achatamento (o nome tcnico utilizado para esta ltima caracterstica de forma
da distribuio curtose) tm importncia devido a consideraes tericas
relativas inferncia estatstica que so freqentemente baseadas na hiptese
de populaes distribudas normalmente. Medidas de assimetria e de curtose
so, portanto, teis para se precaver contra erros aos estabelecer esta hiptese.
Diversas medidas de assimetria so disponveis, mas introduziremos
apenas uma, que oferece simplicidade no conceito assim como no clculo. Esta
46
medida, a medida de assimetria de Pearson, baseada nas relaes entre a
mdia, mediana e moda. Recorde que estas trs medidas so idnticas em
valor para uma distribuio unimodal simtrica, mas para uma distribuio
assimtrica a mdia distancia-se da moda, situando-se a mediana em uma
posio intermediria, a medida que aumenta a assimetria da distribuio.
Consequentemente, a distncia entre a mdia e a moda poderia ser usada para
medir a assimetria. Precisamente,
Assimetria = mdia - moda
Quanto maior a distncia, seja negativa ou positiva, maior a assimetria da
distribuio. Tal medida, entretanto, tem dois defeitos na aplicao. Primeiro,
porque ela uma medida absoluta, o resultado expresso em termos da
unidade original de medida da distribuio e, portanto, ela muda quando a
unidade de medida muda. Segundo, a mesma grandeza absoluta de assimetria
tem diferentes significados para diferentes sries de dados com diferentes graus
de variabilidade. Para eliminar estes defeitos, podemos medir uma medida
relativa de assimetria. Esta obtida pelo coeficiente de assimetria de Pearson,
denotado por SKP e dado por:
SK
X X
S
P
m



A aplicao desta expresso envolve outra dificuldade, que surge devido
ao fato de que o valor modal da maioria das distribuies ser somente uma
distribuio, enquanto que a localizao da mediana mais satisfatoriamente
precisa. Contudo, em distribuies moderadamente assimtricas, a expresso
X X X X
m
3
5
( )
.
adequada (no envolve impreciso muito grande). A partir disto, vemos que:
X X X X X X X X
m
[ ( )] ( )
. .
3 3
5 5

Com este resultado, podemos rescrever o coeficiente de assimetria de
Pearson como:
47
SK
X X
S
P

3
5
( )
.

Esta medida igual a zero para uma distribuio simtrica, negativa para
distribuies com assimetria para a direita e positiva para distribuies com
assimetria para a esquerda. Ela varia dentro dos limites de t 3. Aplicando SKP
aos dados agrupados de gastos com consumo de alimentos das famlias,
temos:
SK
P


+
3 170 25 167 92
23 71
0 295
( , , )
,
,
Este resultado revela que a distribuio de gastos com consumo de alimentos
tem assimetria moderadamente positiva (o que significa maior concentrao de
famlias nas classes de menor gasto). muito comum encontrar distribuies
positivamente assimtricas em dados econmicos, particularmente na produo
e sries de preos, os quais podem ser to pequenos quanto nulos mas podem
ser infinitamente grandes. Distribuies assimetricamente negativas so raras
em cincias sociais.
2.7 Curtose: uma medida de achatamento
Apresentaremos agora uma medida de achatamento das distribuies, o
coeficiente de curtose, denotado por K. Esta medida algebricamente tratvel e
geometricamente interpretvel. definida como a relao entre o desvio semi-
interquartlico, ou seja, a metade do valor do desvio interquertlico, e o intervalo
entre o decil 9 e o decil 1:
K
Q Q
D D

1
2
3 1
9 1
( )

Por meio do coeficiente de curtose, classificamos diferentes graus de
achatamento em trs categorias: leptocrtica, platicrtica e mesocrtica (ver
figura, a seguir). Uma distribuio leptocrtica (curva a) tem a maior parte de
48
suas observaes concentrada no centro. Consequentemente, a diferena entre
as duas distncias, (Q3 - Q1) e (D9 - D1) tende a ser muito pequena. Para um
dado grau de disperso, quanto menor for o achatamento da distribuio, menor
ser diferena entre estas duas distncias. Desde que (Q3 - Q1) < (D9 - D1)
para uma distribuio com forma muito pontiaguda, K aproxima-se de 0,5 no
limite, quando Q3 - Q1 = D9 - D1. Ao contrrio, quanto mais platicrtica a
distribuio (curva b), mais o intervalo entre os decis 9 e 1 tende a exceder o
intervalo interquartlico. Portanto, quando o intervalo de uma varivel tende ao
infinito e para uma curva completamente achatada, K tende a zero. Em vista
destas consideraes, parece razovel estabelecer valores prximos de 0,25
para representar distribuies mesocrticas (curva c). Esta escolha reforada
pelo fato de que para a varivel normal padronizada, k = 0,2630 (veremos este
ponto em captulo posterior).
Na figura acima compara-se a curtose de duas distribuies com a curtose de
uma distribuio mesocrtica (em linha tracejada). Na figura da esquerda temos
uma distribuio platicrtica (linha cheia) e na figura da direita temos uma
distribuio leptocrtica (linha cheia).
Aps o clculo dos quartis e decis a partir dos dados agrupados para a
distribuio de gastos com alimentao, temos que:
49
K
Q Q
D D

1
2
1 2 188 39 154 83
209 78 146 58
0 2655
3 1
9 1
( )
( / )( . , )
, ,
,
Este resultado indica que a distribuio de gastos com alimentos
aproximadamente mesocrtica, j que muito prximo de 0,25.
50
3. Probabilidade
Objetivos do captulo:
Definir o termo probabilidade.
Descrever as abordagens clssica, da freqncia relativa e subjetiva da
probabilidade.
Entender os termos experimento, espaos amostral e evento.
Definir os termos probabildade condicional e probabilidade conjunta
Calcular probabilidades aplicando as regras da adio e da multiplicao
Determinar o nmero de possveis permutaes e combinaes
Calcular uma probabilidade usando o Teorema de Bayes
Probabilidade: uma medida de possibilidade de ocorrncia de um
determinado evento; ela pode assumir um valor entre 0 e 1
Evento: Uma coleo de um ou mais resultados de um experimento
Exemplo: Experimento jogar uma moeda duas vezes
Possveis resultados (espao amostral) { KK, KC, CK, CC }
Evento: no mnimo uma cara = {CC, CK, KC}
Como uma probabilidade expressa ?
Uma probabilidade expressa como uma nmero decimal, tal como 0,70 ;
0,27 ; ou 0,50. Entretanto ela pode ser representada como uma percentagem tal
com 70 %, 27 % ou 50 %. O valor de uma probabilidade est localizado no
intervalo de nmero reais que vai de 0 a 1, inclusive as extremidades deste
intervalo.
51
Quanto mais uma probabilidade prxima de 0, o evento a ela associado
mais improvvel de ocorrer.
Quanto mais uma probabilidade prxima de 1, o evento a ela associado
mais provvel de ocorrer.
3.1 Definio Clssica de Probabilidade
Probabildade Clssica: baseada na hiptese de que os resultados de
um experimento so igualmente provveis.
Usando o ponto de vista clssico:
resultados possveis de total nmero
favorveis resultados de nmero
evento um de ade Probabilid
Considere o experimento de jogar duas moedas.
O espao amostral deste experimento S = { CC,CK,KC,KK}
Considere o evento: uma cara
2
1
4
2
resultados possveis de total nmero
favorveis resultados de nmero
evento um de ade Probabilid
Definies
Eventos mutuamente exclusivos: a ocorrncia de qualquer um evento
significa que nenhum dos outros pode ocorrer ao mesmo tempo.
No caso do experimento de jogar duas moedas, os quatro possveis
resultados so mutuamente exclusivos.
52
Eventos Coletivamente Exaustivos: no mnimo um dos eventos deve ocorrer
quando o experimento conduzido.
No experimento de jogar 2 moedas, os quatro possveis resultados so
coletivamente exaustivos.
Soma das probabilidades = 1
Desde que cada resultado no experimento de jogar 2 moedas tem
probabilidade igual a , ento a soma das probabilidades dos resultados
possveis + + + = 1
3.2 Conceito da Freqncia Relativa
A probabilidade de um evento ocorrer no longo prazo determinada pela
observao de que frao de vezes o evento ocorreu no passado.
A probabilidade pode ser calculada pela frmula:
s observae de total nmero
passado no ocorreu evento o que em vezes de nmero
evento do Pr e obabilidad
53
C
C
C
K
KC KK
Exemplo 2
A questo de ser ou no um ru culpado: em uma amostra de 500
estudantes em um determinado campus, 275 indicaram que o ru era
culpado. Qual a probabilidade de que um estudante neste campus indicar
que o ru neste caso era culpado?
Nota: Neste problema podemos aplicar a frmula para a probabilidade
baseada na frequncia relativa.
Assim, P(culpado) = 275/500 = 0,55
3.3 Probabilidade Subjetiva
Probabilidade Subjetiva : a probabilidade de que um particular evento
ocorra atribuda por um indivduo e baseada em um conjunto de informao
disponvel.
Exemplos de probabilidade subjetiva so:
Estimar a probabilidade de que o time de futebol da Ponte Preta
disputar a final do campeonato nacional.
Estimar a probabilidade de que voc obtenha conceito A neste curso.
3.4 Algumas Regras Bsicas de Probabilidade
Regra da Adio : Se dois eventos A e B so mutuamente exclusivos, a
regra especial da adio estabelece que a probabilidade de que A ou B
ocorram igual a soma de suas respectivas probabilidades. A regra dada
pela seguinte frmula:
P(A ou B) = P(A) + P(B)
Exemplo 3
54
A companhia de aviao X recentemente forneceu a seguinte informao para o
Departamento de Aviao Civil (DAC) sobre os vos da origem A ao destino B
Chegada Frequncia
Adiantada
No horrio
Atrasada
Cancelado
100
800
75
25
Total 1000

Seja A o evento: o vo chega adiantado
Ento P(A) = 100 / 1000 = 0,1
Seja B o evento: o vo chega atrasado
Ento P(B) = 75 / 1000 = 0,075
Nota: os eventos A e B so mutuamente exclusivos. Porque ?
Qual a probabilidade de que um vo chegue adiantado ou atrasado?
P(A ou B) = P(A) + P(B) = 0,1 + 0,075 = 0,175
3.5 A Regra do Complemento
A regra do complemento usada para determinar a probabilidade de um evento
ocorrer subtraindo-se a probabilidade do evento no ocorrer de 1.
Seja P(A) a probabilidade do evento A e ) ( A P a probabilidade do evento no A
(complemento de A).
55
) ( 1 ) (
1 ) ( ) (
A P A P
A P A P

+

Um diagrama de Venn pode ilustrar a Regra do Complemento:
Exemplo 3
Reconsidere os dados do exemplo 2. Seja C o evento: o vo chega no
horrio. Ento P(C) = 800 / 1000 = 0,8
Seja D o evento: o vo cancelado.
Ento P(D) = 25 / 1000 = 0,025
Nota: os eventos C e D so mutuamente exclusivos. Porque?
Use a regra do complemento para mostrar que a probabilidade do vo chegar
adiantado (A) ou atrasado (B) 0,175
P(A ou B) = 1 P(C ou D) = 1 [0,8 + 0,025] = 0,175
O diagrama de Venn abaixo ilustra esta situao:
56


A
A
(C ou D) = (A ou B) =
0,175
A regra do complemento muito importante no estudo de probabilidade.
Com freqncia, mais eficiente calcular a probabilidade de um evento
ocorrer determinando-se a probabilidade do evento no ocorrer e subtraindo
o resultado de 1.
3.6 A Regra Geral da Adio
Sejam A e B dois eventos que no so mutuamente exclusivos. Ento
P(A ou B) dado pela seguinte frmula:
P(A ou B) = P(A) + P(B) P(A e B)
O Diagrama de Venn abaixo ilustra esta regra:
57

C
0,8
D
0,025
B
Exemplo 5
Em uma amostra de 150 estudantes, 70 disseram que somente tm um
aparelho de CD, 50 disseram que somente tm uma TV e 25 disseram que
tm ambos. O Diagrama de Venn a seguir descreve esta situao.
58
A
CD
70

TV
50
Ambos
25
Se um estudante selecionado ao acaso, qual a probabilidade de que ele
tenha somente um aparelho de CD ? De somente uma TV ? De tanto uma TV
como um aparelho de CD?
Seja C o evento o estudante tem um aparelho de CD e T o evento o
estudante tem uma TV
P(C) = 70 / 150 = 0,4667
P(T) = 50 / 150 = 0,3333
P(C e T) = 25 / 150 = 0,1667
Se um estudante selecionado ao acaso, qual a probabilidade de que ele
tenha tanto um aparelho de CD ou uma TV? ( Nota: isto inclui a
probabilidade de Ter ambos os aparelhos).
Desde que:
P(C ou T) = P(C) + P(T) P(C e T)
Ento, P(C ou T) = 0,4667 + 0,3333 0,1667 = 0,6333
3.7 Regras de Multiplicao
Regra Especial de Multiplicao
A regra especial de multiplicao requer que dois eventos A e B sejam
independentes.
Definio: Dois eventos A e B so independentes se a ocorrncia de um
no tem efeito sobre a probabilidade de ocorrncia do outro.
59
A regra especial escrita simbolicamente como:
P(A e B) = P(A). P(B)
Para trs eventos independentes A,B e C, a regra especial da
multiplicao usada para determinar a probabilidade de que todos os
eventos ocorram :
P(A e B e C) = P(A).P(B).P(C)
Exemplo 6
Um investidor possui duas aes. Uma de uma companhia de produo de
petrleo e a outra de uma cadeia de supermercados, de forma que podemos
assumir que suas cotaes so independentes. A probabilidade de que a ao
da companhia de petrleo suba no prximo ano 0,50. A probabilidade de que
a cotao da cadeia de supermercados aumente em valor no prximo ano
0,70.
Qual a probabilidade de que ambas as aes cresam em valor no
prximo ano?
Seja A o evento: a cotao da companhia de petrleo cresce no prximo ano
e seja B o evento: a cotao da cadeia de supermercados cresce no prximo
ano.
P(A e B) = (0,50).(0,70) = 0,35
Qual a probabilidade de que ao menos uma destas aes aumentem
em valor no prximo ano?
Isto implica que tanto uma pode aumentar (sem que a outra aumente) assim
como ambas.
Portanto,
60
P(no mnimo uma) = (0,50).(0,30) + (0,50).(0,70) + (0,70).(0,50) = 0,85
Exemplo 7
Um estudo recente constatou que 60 % das mes com crianas de idade de at
10 anos empregam-se em tempo integral. Trs mes so selecionadas aos
acaso. Assumiremos que as mes so empregadas de forma independente
umas das outras.
Qual a probabilidade de que todas sejam empregadas em perodo
integral?
P( todas as trs empregadas em perodo integral) = (o,60).(0,60).(0,60) = 0,216
Qual a probabilidade de que no mnimo umas das mes sejam
empregadas em perodo integral?
P(no mnimo uma) = 1 P(nenhuma empregada em perodo integral) =
1 [(0,40).(0,40).(0,40)] = 0,936
3.8 Probabilidade Condicional
a probabilidade de que um evento particular ocorra, dado que outro evento
tenha ocorrido.
Notao : A probabilidade do evento A dado que o evento B ocorreu
denotada por P(A/B)
Regra Geral da Multiplicao
61
A Regra Geral da Multiplicao usada para encontrar a probabilidade
conjunta de que dois eventos ocorram.
A regra estabelece que para dois eventos A e B, a probabilidade conjunta
de que os dois eventos ocorram obtida pela multiplicao da probabilidade
de que o evento A ocorra pela probabilidade condicional de B dado que A
ocorreu.
A probabilidade conjunta, P(A e B) dada pela seguinte frmula:
P(A e B) = P(A) . P(B/A)
Alternativamente, podemos tambm escrever:
P(A e B) = P(B) . P(A/B)
Exemplo 8
Uma faculdade coletou a seguinte informao sobre seus estudantes de
graduao:
Curso Homens Mulheres Total
Contabilidade 120 80 200
Finanas 110 70 180
Marketing 70 50 120
Administrao 110 100 210
Estatstica 50 10 60
Computao 140 90 230
Total 600 400 1000
Um estudante selecionado ao acaso. Qual a probabilidade de que o(a)
estudante seja mulher e que esteja cursando Contabilidade?
Seja A o evento: o(a) estudante est cursando Contabilidade e F o evento:
o(a) estudante mulher.
P(A e F) = 80 / 1000
62
Qual a probabilidade de selecionar uma mulher ?
P(F) = 400 / 1000
Dado que o(a) estudante mulher, qual a probabilidade de que esteja
cursando Contabilidade ?
Precisamos calcular P(A / F).
P(A / F) = P(A e F) / P(F) = [80 / 1000] / [400 / 1000] = 0,20
3.9 Diagramas em rvore
Um diagrama em rvore muito til para representar probabilidades
conjuntas e probabilidades condicionais. Ele particularmente til para
analisar decises quando h diversos estgios no problema.
Exemplo : Suponha que h 7 peas vermelhas e 5 peas azuis em uma
sacola. Suponha que voc selecione duas peas, uma aps a outra e sem
reposio. Construa um diagrama em rvore para esta informao.
63
7/12
5/12
6/11
5/11
7/11
4/11
V
1
B
1
V
2
B
2
V
2
B
2
(7/12) (6/11)
(7/12) (5/11)
(5/12) (7/11)
(5/12) (4/11)
3.10 Teorema de Bayes
Considere o seguinte diagrama com as parties A1 e A2 :
Espao Amostral
P(A1 / B) = P(A1 e B) / P(B); P(A1 e B) = P(A1) . P(B / A1)
P(B) = P(A1 e B) + P(A2 e B);
P(A2 e B) = P(A2) P(B / A2)
A partir disto, temos a frmula seguinte (Teorema de Bayes):
) / ( ) ( ) / ( ) (
) / ( ) (
) / (
2 2 1 1
1 1
1
A B P A P A B P A P
A B P A P
B A P
+


Nota: Este teorema pode ser estendido para diversas parties do espao
amostral ( A1, A2, A3, etc.)
64
A
1
A
2
A
1
e B
A
2
e B
B
Probabilidades
Condicionais
Probabilidades
Conjuntas
Exemplo 9 :
A Companhia C & W tem recebido recentemente diversas reclamaes de que
suas garrafas esto sendo preenchidas com contedo abaixo do especificado.
Uma reclamao foi recebida hoje mas o administrador da produo no
capaz de identificar qual das duas plantas (A ou B) preencheu a garrafa. Qual
a probabilidade de que a garrafa com pouco preenchimento provenha da planta
A? Seja S o evento: a garrafa foi preenchida com contedo abaixo do
especificado.
% da Produo Total % de garrafas com pouco
preenchimento
A 55 3
B 45 4

4783 , 0
04 , 0 45 , 0 03 , 0 55 , 0
03 , 0 55 , 0
) / (
+

S A P
Anexo 1 Recordando Definies e Conceitos
Uma moeda mostra cara 50% do tempo, em mdia. Depois de muitos lances, o
nmero de caras aproximadamente igual ao nmero de coroas.
Um conceito de Probabilidade
No limite quando o nmero de lances -> infinito
0,5
lanamenos de nmero
caras de

nmero
Dizemos que a probabilidade de aparecer uma cara em qualquer lance 1/2.
Isto ilustra o conceito de probabilidade que ser usada neste curso.
Exemplo - 10 000 lances de moeda
John Kerrich, um matemtico sul africano estava visitando Copenhague quando
a Segunda Guerra Mundial comeou. Dois dias antes de seu voo marcado para
65
a Inglaterra, os alemes invadiram a Dinamarca. Kerrich passou o resto da
guerra internado em um acampamento em Jutland e para passar o tempo ele
levou a cabo uma srie de experimentos em teoria da probabilidade. Em um
destes experimentos, lanou uma moeda 10.000 vezes. Seus resultados so
mostrados no grfico seguinte.
(O eixo horizontal est em uma escala logartmica)
O lanamento de uma moeda 10 vezes um exemplo de um experimento
aleatrio. A maioria dos experimentos est sujeito a Variao Aleatria. A
Teoria de probabilidade a aproximao matemtica que busca quantificar em
temos de modelos o que ocorre com estes experimentos.
Exemplo - 2 lanamentos de uma moeda
Lance uma moeda duas vezes e registre para cada lance se o resultado era
uma cara (C) ou uma coroa (K). Exerccio: Liste os possveis resultados.
Seja A o evento deu uma ou mais caras. Quais resultados pertencem ao evento
A? (CK, KC, CC).
Seja B o evento no aparece nenhuma cara. (KK)
66
-10
5
10
-5
100 1000 10000
Nmero de lanamentos
0
% de caras
50 %
10
Neste exemplo, os eventos A e B so ditos disjuntos ou mutuamente exclusivos,
pois eles no tm nenhum resultado em comum. Eles tambm so exaustivos,
j que eles cobrem todos os possveis resultados do experimento.
Exerccio: Defina um evento C que no disjunto em relao a A.
DEFINIES
Um espao amostral o conjunto de todos os possveis resultados de um
experimento.
Um evento um conjunto de um ou mais resultados no espao amostral.
Dois eventos so disjuntos ou mutuamente exclusivos se eles no tm
nenhum resultado em comum.
A variao aleatria ocorre quando impossvel predizer com certeza o
resultado exato de um experimento individual, mas como o experimento
repetido um nmero grande de vezes uma distribuio regular de freqncias
relativas surge.
A probabilidade de um resultado ou evento pode ser determinada tanto
empiricamente (baseado em dados) ou teoricamente (baseado em um
modelo matemtico do processo). A definio emprica a seguinte: Suponha
que um resultado (ou evento) A ocorre f vezes em n observaes. Ento
n
f
frequncia
s observae de nmero
ocorre A que em vezes de nmero
A de relativa

O conceito da probabilidade de um evento A um idealizao da freqncia
relativa. o valor limite da freqncia relativa quando n fica muito grande, i.e.
quando n =>
n quando ) ( A P
n
f

(P(A) denota a probabilidade de A ocorrer).
Estimativas tericas de probabilidade esto baseadas em suposies plausveis.
A suposio mais comum a de que todos os possveis resultados so
igualmente provveis. Ento
67

amostral espao no resultados de total nmero
A a endo correspond resultados de
) (
nmero
A P

Por analogia com freqncias relativas, as probabilidades tm as seguintes
propriedades:
1. P(A) um valor entre 0 e 1.
2. P(A) = 0 significa A nunca acontece (correspondendo a f = 0)
3. P(A) = 1 significa A sempre acontece (correspondendo a f = n)
4. O conjunto S de todos os possveis resultados tem probabilidade 1. P(S)
= 1, os quais se agrupam em 5 eventos.
Anexo 2 - Independncia e Modelos de rvore para
Calcular Probabilidades
Se eventos X e Y so mutuamente exclusivos, ento,
P(X ou Y) = P(X) + P(Y)
Em geral, se eventos X e Y no so mutuamente exclusivos ento
P(X ou Y) = P(X) + P(Y) - P(X e Y).
Exemplo - Fruta em 2 distritos
Um certo tipo de fruta produzido em 2 distritos, A e B. Ambas as reas s
vezes so atacadas por uma praga (mariposa que ataca as frutas).
Suponha que as probabilidades so
P(A) = 1/10, P(B) = 1/20, P(A e B) = 1/50
Qual a probabilidade de que um ou outro (ou ambos) distrito esto infetados
em um determinado momento?
P(A ou B) = P(A) + P(B) - P(A e B)
= 0.1 + 0.05 - 0.02
68
= 0.13
Alternativamente, considere partes mutuamente exclusivas
A ou B consiste em 3 partes mutuamente exclusivas: A somente, B somente, A
e B.
P(A ou B) = P(A somente) + P(B somente) + P(A e B)
= 0.08 + 0.02 + 0.03 = 0.13 .
Dois eventos X e Y so ditos independentes se a probabilidade de que X
acontece no afetada pelo fato de Y acontecer ou no. Pode ser mostrado
que isto implica:
P(X e Y) = P(X)P(Y)
Esta chamado a regra de multiplicao para eventos independentes.
Exemplo - 2 guardas de segurana e o seus aparelhos de controle
H dois guardas de segurana para um grande estabelecimento. Cada um
carrega um aparelho de controle ativado por detectores nos edifcios. O Guarda
1 consciencioso e est atento ao aparelho 80% do tempo. O Guarda 2 no
to confivel e s responde ao aparelho 50% do tempo.
Se os guardas relatam independentemente qualquer alerta para a polcia ou o
corpo de bombeiros, qual a probabilidade de que pelo menos um informar
um alerta?
Seja X o evento o Guarda 1 relata o alerta. P(X) = 0.8
Seja Y o evento o Guarda 2 relata o alerta. P(Y) = 0.5
69
P(A somente)
= 0,1 0,02
= 0,08
P(A e B)
= 0,02
P(B somente)
= 0,05 0,02
= 0,03
So os eventos X e Y mutuamente exclusivos? - No, ambos podem informar.
X e Y so independentes? - Considere por hiptese que Sim.
P(no mnimo um Guarda informa)
= P(X ou Y)
= P(X) + P(Y) - P(X e Y)
Mas P(X e Y) = P(X) P(Y) (independentes)
= 0.8 x 0.5 = 0.4
assim P(X ou Y) = 0.8 + 0.5 - 0.4 = 0.9
Assim embora Y s fidedigno 50% do tempo, empreg-lo aumenta a
probabilidade de informar um alerta.
Diagramas de rvore so teis em clculos que envolvem vrias fases. Cada
segmento na rvore uma fase do problema e as probabilidades nos ramos a
partir de cada ponto tem que somar 1. A probabilidade de alcanar o fim de
qualquer caminho completo o produto das probabilidades escritas em seus
ramos.
Exemplo - Meninos e meninas em uma famlia de 3 filhos
Modelo de rvore para meninos (B) e meninas (G) em uma famlia de tamanho
3.
(ver figura a seguir)
70
Figura 1
Cada caminho representa um resultado ( famlia de 3 filhos). H 8 resultados.
Se voc assume que estes so igualmente provveis ento a probabilidade de
cada 1/8.
por exemplo P(BGB) = 1/8.
Outro modo de calcular isto assumir que para cada nascimento
P(B) = P(G) = 1/2.
Ento por exemplo P(BGB) = 1/2 x 1/2 x 1/2 = 1/8 = 0.125
i.e. assumindo que sexo independente dos nascimentos prvios e
multiplicando probabilidades ao longo dos ramos da rvore.
Modelos de rvore so teis para analisar qualquer processo "passo por passo".
Exemplo - Gnero em populaes humanas
Em populaes humanas aproximadamente 52% de nascimentos so meninos
e 48% so meninas. Assim um modelo mais realista usar
71
P(B) = 0.52 P(G) = 0.48
Figura 2 - modelo mais realista
por exemplo P(BGB) = 0.52 x 0.48 x 0.52 = 0.13
Um evento qualquer subconjunto de resultados.
Calcule probabilidades para os eventos seguintes que usam o " modelo realista
".
C: todas as crianas tm o mesmo sexo
D: menos de 2 meninos
E: C e D ==> todas meninas
F: C ou D ==> no 2 meninos
GGG GGG GGG GGG
GGB GGB GGB GGB
GBG GGB GGB GGB
GBB GBB GBB GBB
72
BGG BGG BGG BGG
BGB BGB BGB BGB
BBG BBG BBG BBG
BBG
BBG BBG BBG
BBB BBB BBB BBB
C D E F
P(C) = P(GGG) + P(BBB) = 0.11 + 0.14 = 0.25
P(D) = 0.11 + 3 x 0.12 = 0.47
P(E) = P(C e D) = P(GGG) = 0.11
P(F) = P(C ou D) = 0.11 + 3 x 0.12 + 0.14 = 0.61
Os eventos C e D no so mutuamente exclusivos (disjuntos) porque o
resultado GGG est em ambos. C e D podem acontecer simultaneamente.
Ento P(C ou D) = P(F) no igual a P(C)+P(D), porque isto contaria o
resultado comum (GGG) duas vezes.
[compare isto com a regra de adio para probabilidades de eventos
mutuamente exclusivos].
Ao invs, use a regra mais geral para P(C ou D)
= 0.25 + 0.47 - 0.11
= 0.61 como requirido
Anexo 3 - Probabilidade Condicional
A probabilidade de um evento A pode ter que ser recalculada se ns sabemos
com certeza que outro evento B j aconteceu e A e B no so independentes.
Exemplo - Uma famlia de 3 crianas
Em uma famlia de 3 crianas suponha se sabe que h menos que 2 meninos.
Qual a probabilidade que todas as 3 crianas so do mesmo sexo?
Usando a anotao prvia
73
C: todas as crianas do mesmo sexo
D: menos que 2 meninos.
Ns queremos a probabilidade de C dado que D aconteceu. Usaremos notao
P(C|D) descrever isto.
Cada coluna lista todo os resultados.
Aqueles que incluem o eventos
C e D esto em negrito.
' C' ' D'
GGG GGG
GGB GGB
GBG GBG
GBB GBB
BGG BGG
BGB BGB
BBG BBG
BBB BBB
Como D aconteceu, s 4 resultados so agora possveis: GGG, GGB, GBG e
BGG. As sua probabilidades devem somar 1. Para obter estas probabilidades
calculadas previamente elas precisam ser "recalculadas" dividindo pelo seu total
que era P(D) = 0.47.
A probabilidade de C, dado que D aconteceu, chamada de probabilidade
condicional e escrita como P(C|D). Lembre-se que a probabilidade de GGG
era 0.11:
23 , 0
47 , 0
11 , 0
) (
D) ou (
) / (
D P
C P
D C P
Em geral para eventos X e Y a probabilidade condicional de X dado que Y
aconteceu
P(Y)
Y) e (
) / (
X P
Y X P
P(X|Y) = P(X e Y)/P(Y) Isto pode ser rearranjado como:
P(X e Y) = P(X|Y)P(Y)
P(X e Y) = P(Y|X) P(X)
74
Exemplo - Gnero de empregados
A tabela abaixo mostra as probabilidades de homens (M) e mulheres (F) sendo
empregados (E) ou desempregados (U) em alguma populao (exclui aqueles
que no desejam ser empregado).
M F
E 0.52 0.41 0.93
U 0.05 0.02 0.07
0.57 0.43 1.00
Ache
(a) P(E|M), a probabilidade condicional de emprego dado que a pessoa
masculina
(b) P(M|E), a probabilidade condicional de ser masculino dado que a pessoa
empregada.
Respostas:
91 , 0
57 , 0
52 , 0
P(M)
M) e (
) / (
E P
M E P
Figure 3: Modelo de rvore que mostra probabilidades condicionais
por exemplo P(E) = P(E e M) + P(E e F)
75
= P(E|M)P(M) + P(E|F)P(F)
= 0.91 x 0.57 + 0.95 x 0.43 = 0.93
56 , 0
93 , 0
52 , 0
) ( ) / ( ) ( ) / (
) ( ) / (
) (
E) e (
) / (

+

F P F E P M P M E P
M P M E P
E P
M P
E M P

Independncia Revisitada
A regra para a interseo de dois eventos
P(X e Y) = P(X)P(Y|X) = P(Y)P(X|Y)
Se P(X|Y) = P(X), ento diramos que X independente de Y que a
probabilidade de X ocorrer no afetada se Y acontece ou no. Substituindo
isto na equao acima d P(X e Y) = P(X) .P(Y), a regra para eventos
independentes.
76
Resumo do Clculo de Probabilidades
77
Exerccios de Probabilidade
1) Trs moedas so jogadas simultaneamente. Qual a probabilidade de obter
2 caras? Qual a probabilidade de obter pelo menos 2 caras?
2) Dois dados so jogados simultaneamente. Calcular a probabilidade de que a
soma dos nmeros mostrados nas faces de cima seja 7.
3) Dois dados so jogados simultaneamente. Calcular a probabilidade de que o
mximo seja maior ou igual a 3.
4) Para a Copa do Mundo 24 pases so divididos em seis grupos, com 4
pases cada um. Supondo que a escolha do grupo de cada pas feita ao
acaso, calcular a probabilidade de que dois pases determinados A e B se
encontrem no mesmo grupo. ( Na realidade a escolha no feita de forma
completamente aleatria).
5) Uma loteria tem N nmeros e s um prmio. Um jogador compra n bilhetes
em uma extrao. Outro compra s um bilhete em n extraes diferentes.
( Ambos os jogadores apostam portanto a mesma importncia). Qual deles
tem maior probabilidade de ganhar o prmio?
6) Seis bolas so colocadas em trs urnas diferentes. Qual a probabilidade
de que todas as urnas estejam ocupadas?
7) Um nmero entre 1 e 300 escolhido aleatoriamente. Calcular a
probabilidade de que ele seja divisvel por 3 ou por 5.
8) Um torneio disputado por 4 times A,B, C e D. 3 vezes mais provvel que
A vena do que B, duas vezes mais provvel que B vena do que C e 3
vezes mais provvel que C vena do que D. Quais as probabilidades de
ganhar para cada um dos times?
9) Uma caixa contem 20 peas em boas condies e 15 em ms condies.
Uma amostra de 10 peas extrada. Calcular a probabilidade de que ao
menos uma pea na amostra seja defeituosa.
10) Uma cidade tem 30 000 habitantes e trs jornais A, B e C. Uma pesquisa de
opinio revela que:
12 000 lem A;
8 000 lem B;
7 000 lem A e B;
6 000 lem C;
4 500 lem A e C;
1 000 lem B e C;
78
500 lem A,B e C.
Qual a probabilidade de que um habitante leia:
a) Pelo menos um jornal;
b) S um jornal.
11) Os algarismos 1,2,3,4,5 so escritos em 5 cartes diferentes. Estes cartes
so escolhidos (sem reposio) aleatoriamente e os algarismos que vo
aparecendo so escritos da esquerda para a direita, formando um nmero
de 5 algarismos.
a) calcular a probabilidade de que o nmero escrito seja par
b) Se a escolha fosse com reposio qual seria a probabilidade?
12) Colocam-se aleatoriamente b bolas em b urnas. Calcular a probabilidade de
que exatamente uma urna seja deixada desocupada.
13) Dez pessoas so separadas em dois grupos de 5 pessoas cada um. Qual
a probabilidade de que duas pessoas determinadas A e B faam parte do
mesmo grupo?
14) 5 homens e 5 mulheres compram 10 cadeiras consecutivas na mesma fila
de um teatro. Supondo que se sentaram aleatoriamente nas 10 cadeiras,
calcular:
a) a probabilidade de que homens e mulheres se sentem em cadeiras
alternadas;
b) A probabilidade de que as mulheres se sentem juntas.
15) Um nmero entre 1 e 200 escolhido aleatoriamente. Calcular a
probabilidade de que seja divisvel por 5 ou por 7.
16) Uma moeda foi cunhada de tal forma que 4 vezes mais provvel de dar
cara do que coroa. Calcular as probabilidades de cara e coroa.
17) Aos nmeros inteiros entre 1 e n so designadas probabilidades
proporcionais aos seus valores. Calcular P(i) para n i 1
18) Trs dados so jogados simultaneamente. Calcular a probabilidade de obter
12 como a soma dos resultados.
19) Sejam A e B eventos tais que
79
) B A P( g)
) B A P( f)
B) A P( e)
) B P(A d)
) B P( c)
) A P( )
) ( )
:
5
1
B) P(A e
4
1
P(B) ,
2
1
) (


b
B A P a
Calcular
A P
20) No jogo da Sena so sorteadas 6 dezenas distintas entre as dezenas 01
02 - ...- 50. O apostador escolhe 6 dessas 50 dezenas e premiado se so
sorteadas 4 (quadra), 5 (quina), 6 (Sena Principal) das dezenas por ele
escolhidas ou se as dezenas sorteadas so escolhidas aumentadas (Sena
Anterior) ou diminudas (Sena Posterior) de uma unidade (50 +1 = 01, 01 1
= 50). Determine a probabilidade de uma apostador fazer:
a) uma quadra
b) uma quina
c) a Sena Principal
d) A Sena Anterior ou a Posterior.
21) No jogo da Loto so sorteadas 5 dezenas distintas entre as dezenas 01 02
- ...- 99 - 00. O apostador escolhe 6,7,8,9 ou 10 dezenas e premiado se
so sorteadas 3 (terno), 4 (quadra) ou 5 (quina) das dezenas escolhidas.
Determine a probabilidade de uma apostador que escolheu 10 dezenas
fazer:
a) um terno
b) uma quadra
c) a quina
22) Na Loteria Esportiva h 13 jogos e o apostador deve indicar em cada um
deles a vitria do time 1, a vitria do time 2 ou o empate. Um jogador
premiado:
a) com 10 pontos, se acerta os resultados dos 10 primeiros jogos e erra os dos
3 ltimos;
b) com 11 pontos, se acerta os resultados dos 10 primeiros jogos e acerta
apenas um dos resultados dos 3 ltimos;
c) com 12 pontos, se acerta os resultados dos 10 primeiros jogos e acerta
apenas 2 dos resultados dos 3 ltimos;
d) com 13 pontos, se acerta os resultados dos 13 jogos.
Supondo que em cada jogo os resultados possveis tenham probabilidades
iguais, determine a probabilidade de um apostador ser premiado:
80
a) com 10 pontos;
b) com 11 pontos;
c) com 12 pontos;
d) com 13 pontos.
23) Escolhem-se ao acaso duas peas de um domin. Qual a probabilidade
delas possurem um nmero comum?
24) Em um armrio h n pares de sapatos. Retiram-se ao acaso p pares de
sapatos desse armrio. Qual a probabilidade de haver entre esses ps
exatamente k pares de sapatos?
25) Colocam-se ao acaso n botes em um tabuleiro n x n, no sendo permitido
haver dois botes em uma mesma casa. Qual a probabilidade de no
haver dois botes nem na mesma linha nem na mesma coluna?
26) Um polgono regular de 2n + 1 lados est inscrito em um crculo. Escolhem-
se 3 dos seus vrtices, formando-se um tringulo. Qual a probabilidade do
centro do crculo ser interior ao tringulo?
27) Tem-se n urnas. Bolas so colocadas ao acaso nas urnas, uma de cada
vez, at que alguma urna receba duas bolas. Qual a probabilidade de
colocarmos exatamente p bolas nas urnas?
28) Joo e Pedro lanam, cada um, um dado no-tendencioso. Qual a
probabilidade do resultado de Joo ser maior ou igual ao resultado de
Pedro?
29) Numa prova h 7 perguntas do tipo verdadeiro-falso. Calcular a
probabilidade de acertarmos todas as 7 se:
a) escolhermos aleatoriamente as 7 respostas,
b) escolhermos aleatoriamente as respostas mas sabendo que h mais
respostas verdadeiro do que falso.
30) Sabe-se que 80 % dos pnaltis marcados a favor do Brasil so cobrados por
jogadores do Flamengo. A probabilidade de um pnalti ser convertido 40 %
se o cobrador for do Flamengo e de 70 % em caso contrrio. Um pnalti a
favor do Brasil acabou de ser marcado:
a) Qual a probabilidade do pnalti ser cobrado por um jogador do Flamengo e
ser convertido?
b) Qual a probabilidade do pnalti ser convertido?
c) Um pnalti foi marcado a favor do Brasil e acabou de ser desperdiado. Qual
a probabilidade de que o cobrador tenha sido um jogador do Flamengo?
81
31) Marina quer enviar uma carta a Vernica. A probabilidade de que Marina
escreva a carta de 8/10. A probabilidade de que o correio no perca de
9/10. A probabilidade de que o carteiro entregue de 9/10. Dado que
Vernica no recebeu a carta, qual a probabilidade condicional de que
Marina no a tenha escrito?
32) Durante o ms de agosto a probabilidade de chuva em um dia determinado
de 4/10. O Fluminense ganha um jogo em um dia com chuva com
probabilidade de 6/10 e em um dia sem chuva com probabilidade de 4/10.
Sabendo-se que o Fluminense ganhou um jogo naquele dia de agosto, qual
a probabilidade de que choveu neste dia?
33) Num exame h 3 respostas para cada pergunta e apenas uma delas
certa. Portanto, para cada pergunta, um aluno tem probabilidade de 1/3 de
escolher a resposta certa se ele est adivinhando e 1 se sabe a resposta.
Um estudante sabe 30 % das respostas do exame. Se ele deu a resposta
correta para uma das perguntas, qual a probabilidade de que a adivinhou?
34) Um jogador deve enfrentar, em um torneio, dois outros A e B. Os resultados
dos jogos so independentes e as probabilidades dele ganhar de A e de B
so 1/3 e 2/3 respectivamente. O jogador vencer o torneio se ganhar dois
jogos consecutivos, de uma srie de 3. Que srie de jogos mais favorvel
ao jogador: ABA ou BAB?
35) A probabilidade de fechamento de cada rel do circuito apresentado na
figura abaixo igual a p, 0 < p < 1.

Se todos os rels funcionam independentemente, qual a probabilidade de que
haja corrente circulando entre os terminais A e B?
36) Escolhe-se ao acaso um nmero entre 1 e 50. Se o nmero primo qual a
probabilidade de que seja mpar?
37) Uma moeda jogada 6 vezes. Sabendo-se que no primeiro lanamento deu
coroa, calcular a probabilidade condicional de que o nmero de caras nos 6
lanamentos supere o nmero de coroas.
82
A
B 1
2
4
3
5
38) Uma moeda jogada 4 vezes. Sabendo que o primeiro resultado foi cara,
calcular a probabilidade condicional de obter pelo menos 2 caras.
39) Joga-se um dado duas vezes. Calcule a probabilidade condicional de obter
3 na primeira jogada, sabendo que a soma dos resultados foi 7.
40) Duas mquinas A e B produzem 3000 peas em um dia. A mquina A
produz 1000 peas, das quais 3 % so defeituosas. A mquina B produz as
restantes 2000, das quais 1 % so defeituosas. Da produo total em um dia
uma pea escolhida ao acaso e, examinando-a, constata-se que
defeituosa. Qual a probabilidade de que a pea tenha sido produzida pela
mquina A?
41) Um estudante resolve um teste do tipo verdadeiro-falso. Ele sabe dar a
soluo correta para 40 % das questes. Quando ele responde uma questo
cuja soluo conhece, d a resposta correta, e nos outros casos decide na
cara ou coroa. Se uma questo foi respondida corretamente, qual a
probabilidade que ele sabia a resposta?
42) Sejam A e B dois eventos independentes tais que
P(A) = 1/3 e P(B) =
Calcule B) A P( e B) A P( , ) ( B A P
43) Sejam A e B dois eventos independentes tais que
1/3 B) P(A e 4 / 1 ) ( A P
Calcule P(B)
44) Uma moeda equilibrada jogada duas vezes. Sejam A e B os eventos:
A: cara na primeira jogada;
B: cara na segunda jogada
Verifique que A e B so independentes
45) Jogue um dado duas vezes. Considere os eventos:
A = o resultado do 1

lanamento par;
B = o resultado do 2

lanamento par;
C = a soma dos resultados par.
A e B so independentes? e A e C? e B e C? e A, B e C?

46) Uma pessoa com um molho de n chaves tenta abrir uma porta. Apenas uma
das chaves consegue abrir a porta. Qual a probabilidade dela s conseguir
abrir a porta na k-sima tentativa:
83
a) supondo que aps cada tentativa mal sucedida ela descarta a chave usada;
b) supondo que ela no faz isso.
47) (Problema de Chevalier de Mr) Determine a probabilidade de obter:
a) ao menos um 6 em 4 lanamentos de um dado;
b) ao menos um duplo 6 em 24 lanamentos de um par de dados.
48) A probabilidade de um homem ser canhoto 1/10. Qual a probabilidade
de, em um grupo de 10 homens, haver pelo menos um canhoto?
49) Sacam-se, sucessivamente e sem reposio, duas cartas de um baralho
comum (52 cartas). Calcule a probabilidade de a 1

carta ser uma dama e a


2

ser de copas.
50) Um exame de laboratrio tm eficincia de 95 % para detectar uma doena
quando essa doena existe de fato. Entretanto o teste aponta um resultado
falso positivo para 1 % das pessoas sadias testadas. Se 0,5 % da
populao tem a doena, qual a probabilidade de uma pessoa ter a doena
dado que seu exame foi positivo?
51) A lana uma moeda n+ 1 vezes e B lana a mesma moeda n vezes. Qual
a probabilidade de A obter mais caras que B?
52) Quantas pessoas voc deve entrevistar para ter probabilidade igual ou
superior a 0,5 de encontrar pelo menos uma que aniversarie hoje?
53) Uma urna contm 3 bolas vermelhas e 7 bolas brancas. A e B sacam
alternadamente, sem reposio, bolas dessa urna at que uma bola
vermelha seja retirada. A saca a primeira bola. Qual a probabilidade de A
sacar a bola vermelha?
54) Em uma cidade com n+ 1 habitantes, uma pessoa conta um boato para
outra pessoa, a qual por sua vez conta para uma terceira pessoa, etc.
Calcule a probabilidade do boato ser contado m vezes:
a) sem retornar primeira pessoa;
b) sem repetir nenhuma pessoa.
55) Sacam-se, com reposio, n (n > 1) bolas de uma urna que contem 9 bolas
numeradas de 1 a 9. Qual a probabilidade do produto dos nmeros das n
bolas extradas ser divisvel por 10?
56) Quantas vezes, no mnimo, se deve lanar um dado no tendencioso para
que a probabilidade de obter algum 6 seja superior a 0,9?
84
57) Um jri de 3 pessoas tem dois jurados que decidem corretamente (cada um)
com probabilidade p e um terceiro jurado que decide por cara ou coroa. As
decises so tomadas por maioria. Outro jri tem probabilidade p de tomar
uma deciso correta. Qual dos jris tem maior probabilidade de acerto?
58) Um dia voc captura 10 peixes em um lago, marca-os e coloca-os no lago
novamente. Dois dias aps, voc captura 20 peixes no mesmo lago e
constata que 2 desses peixes haviam sido marcados por voc.
a) se o lago possui k peixes, qual era a probabilidade de, capturando 20 peixes,
encontrar dois peixes marcados?
b) para que valor de k essa probabilidade mxima?
59)Qual a probabilidade de, em um grupo de 4 pessoas:
a) haver alguma coincidncia de signos zodiacais?
b) as quatro terem o mesmo signo?
c) duas terem o mesmo signo, e as outras duas, outro signo?
d) trs terem o mesmo signo e, a outra, outro signo?
e) todas terem signos diferentes?
60) Deseja-se estimar a probabilidade p de um habitante de determinada cidade
ser um consumidor de drogas. Para isso realizam-se entrevistas com alguns
habitantes da cidade. No se deseja perguntar diretamente ao entrevistado
se ele usa drogas, pois ele poderia se recusar a responder ou, o que seria
pior, mentir. Adota-se ento o seguinte procedimento: prope-se ao
entrevistado duas perguntas do tipo SIM-NO:
I) Voc usa drogas?
II) Seu aniversrio anterior ao dia 2 de julho?
Pede-se ao entrevistado que jogue uma moeda, longe das vistas do
entrevistador, e que se o resultado for cara, responda primeira pergunta e, se
for coroa, responda segunda pergunta.
a) sendo p1 a probabilidade de um habitante da cidade responder sim, qual a
relao entre p e p1 ?
b) se forem realizadas 1000 entrevistas e obtidos 600 sim razovel imaginar
que . 6 , 0
1
p Qual seria, ento, sua estimativa de p?
61) Uma firma fabrica chips de computador. Em um lote de 1000 chips, uma
amostra de 10 chips revelou 1 chip defeituoso. Supondo que no lote
houvesse k chips defeituosos:
a) Calcule a probabilidade de em uma amostra de 20 chips haver exatamente
1 chipdefeituoso.
b) Determine o valor de k que maximiza a probabilidade calculada no item a).
85
62) Jogamos uma moeda no viciada 10 vezes. Qual a probabilidade de
obtermos exatamente 5 caras?
63) Um aluno marca ao acaso as respostas em um teste mltipla-escolha com
10 questes e 5 alternativas por questo. Qual a probabilidade dele acertar
exatamente 4 questes?
64) Joga-se uma moeda no viciada. Qual a probabilidade de serem obtidas 5
caras antes de 3 coroas?
65) Lana-se um dado no viciado at a obteno do terceiro 6. Seja X o
nmero do lanamento em que isto ocorre. Calcule:
a) P(X = 10); b) P(X > 10); c) P(X = 10).
66) Dois adversrios A e B disputam uma srie de partidas. A probabilidade de
A ganhar uma partida 0,6 e no h empates. Qual probabilidade de A
ganhar a srie?
67) Dois adversrios A e B disputam uma srie de partidas. O primeiro que
obtiver 12 vitrias ganha a srie. No momento o resultado 6 x 4 a favor de
A. Qual a probabilidade de A ganhar a srie sabendo que em cada partida
as probabilidades de A e B vencerem so respectivamente 0,4 e 0,6?
68) Motores de avio funcionam independentemente e cada motor tem uma
probabilidade p de falhar durante o vo. Um avio voa com segurana se a
maioria de seus motores funciona. Para que valores de p um avio com 3
motores prefervel a um avio com 5 motores?
69) Suponha que uma caracterstica (como a cor dos olhos, por exemplo)
dependa de um par de genes. Representemos por A um gen dominante e
por a um gen recessivo. Assim um indivduo com genes AA dominante
puro, um com genes aa um recessivo puro e um com genes Aa um
hbrido. Dominantes puros e hbridos so semelhantes em relao
caracterstica. Filhos recebem um gen do pai e um da me. Suponha que
pai e me sejam hbridos e tenham 4 filhos.
a) Qual a probabilidade do primeiro filho ser um recessivo puro?
b) Qual a probabilidade de exatamente um dos 4 filhos ser um recessivo puro?
70) (O problema das caixas de fsforos de Banach
18
) Um matemtico sai de
casa todos os dias com duas caixas de fsforos, cada uma com n palitos.
Toda vez que ele que acender um cigarro, ele pega (ao acaso) uma das
caixas e retira da um palito. O matemtico meio distrado, de modo que
quando ele retira o ltimo palito de uma caixa, ele no percebe que a caixa
est vazia. Como ele fuma muito, em certa hora ele pega uma caixa e
18

Stefan Banach (1892-1945), matemtico polons
86
constata que ela est vazia. Qual a probabilidade de nesse momento a
outra caixa conter exatamente k ( n k 0 ) palitos?
71) Lana-se repetidamente um par de dados no tendenciosos. Qual a
probabilidade de obtermos duas somas iguais a 7 antes de obtermos trs
somas iguais a 3?
72) Uma moeda tem probabilidade 0,4 de dar cara. Lanando-a 12 vezes qual o
mais provvel valor do nmero de caras obtidas?
73) Suponha que uma varivel aleatria T tem a seguinte distribuio de
probabilidade
T 0 1 2
P(T=t) 0,5 0,3 0,2
a. Ache P(T <= 0)
b. Ache P(T >= 0 and T < 2)
c. Calcule E(T), a mdia da varivel aleatria T.
74) Suponha que voc escolha uma bola de uma urna contendo 7 bolas
vermelhas, 6 bolas brancas , 5 bolas azuis e 4 bolas brancas. Qual a
probabilidade de que voc escolha uma bola vermelha?
75) Suponha que voc escolha uma bola aleatoriamente de uma urna 7 bolas
vermelhas, 6 bolas brancas, 5 bolas azuis e 4 bolas amarelas. Qual a
probabilidade de que voc escolha uma bola branca?
76) Um dado no viciado jogado duas vezes. Ache a probabilidade de sair um
5 ou 6 no primeiro lance e um 1, 2 ou 3 no segundo lance.
77) Ache a probabilidade de no sair um 5 ou 6 em qualquer uma de duas
jogadas de um dado no viciado.
78) Voc tem um baralho de 52 cartas bem embaralhadas. Qual a
probabilidade de escolher dois valetes consecutivos se a primeira carta no
recolocada no baralho?
79) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis.
Determine a probabilidade de que elas sejam escolhidas na ordem azul,
branca e vermelha dado que cada bola recolocada na urna depois de
escolhida.
80) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis.
Determine a probabilidade de que elas sejam escolhidas na ordem azul,
branca e vermelha dado que cada bola no recolocada na urna depois
que ela escolhida.
87
81) A urna A contem 2 bolas vermelhas e 3 azuis. A urna B contem 8 bolas
vermelhas e 2 azuis. Voc joga uma moeda honesta. Se amoeda mostra
cara voc escohe uma bola da urna A. Se a moeda mostra coroa voc
escolhe uma bola da urna B. Determine a probabilidade de que voc
escolha uma bola vermelha.
82) Voc tem 6 bolas, cada uma de cor diferente. De quantas maneiras distintas
voc pode dispo-las em uma fila?
83) De quantas maneiras possveis 8 pessoas podem sentar-se em um banco
se apenas esto disponveis 3 assentos?
84) De quantas maneiras nmeros de 3 algarismos podem ser formados com os
dgitos 0,1,2,..,9 se repeties so permitidas?
85) De quantas maneiras nmeros de 3 algarismos podem ser formados com os
dgitos 0,1,2,..,9 se repeties no so permitidas?
86) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes
livros de Economia so arranjados em uma estante. De quantas maneiras
possvel dispo-los se todos os livros de cada assunto precisam ficar juntos?
87) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes
livros de Economia so arranjados em uma estante. De quantas maneiras
possvel dispo-los se somente os livros de Cincias precisam ficar juntos?
88) Calcule C(8,3)
89) De quantas maneiras pode um comit de 6 pode ser escolhido de 10
pessoas?
90) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3
mdicos e 4 enfermeiras precisa ser formado. De quantas maneiras isto
pode ser feito se um particular mdico deve ser includo e se qualquer
enfermeira pode ser includa?
91) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3
mdicos e 4 enfermeiras precisa ser formado. De quantas maneiras isto
pode ser feito se uma particular enfermeira no pode ser includa no
comit?
92) De quantas maneiras diferentes saladas de frutas podem ser feitas de
ma, laranja, tangerina e banana?
93) A partir de 6 consoantes e 4 vogais, quantas combinaes distintas de letras
podem ser feitas?
94) Quais dos seguintes pares de eventos so mutuamente exclusivos?
88
a. A: os nmeros pares ; B: o nmero 5;
b. A: os nmeros mpares; B: os nmeros maiores do
que
10;
c. A: os nmeros menores que 5; B: todos os nmeros negativos
d. A: os nmeros maiores do que 100; B: os nmeros menores do
que
200;
e. A: os nmeros negativos; B: os nmeros pares
95) Uma carta escolhida de um baralho padro de 52 cartas. Ao descrever a
ocorrncia de dois possveis eventos, um s e um Rei, estes dois eventos
so:
(a) independentes
(b) mutuamente exclusivos
(c) variveis aleatrias
(d) aleatoriamente independentes.
96) Suponha que certa caracterstica oftalmolgica associada com a cor dos
olhos. 300 indivduos selecionados aleatoriamente so estudados e
apresentam os seguintes resultados:
Caracterstica
Cor dos olhos
Azuis Castanhos Outra Total
Sim 70 30 20 120
No 20 110 50 180
Total 90 140 70 300
A. Qual a probabilidade de que uma pessoa tenha olhos azuis ?
89
B. O que voc espera que seja o valor de P(Ter a caracterstica e olhos
azuis) se a cor dos olhos e a existncia da caracterstica so
independentes ?
C. Quais das seguintes expresses descrevem a relao entre os eventos
A = a pessoa tem olhos castanhos e B = a pessoa tem olhos azuis ?
(marque a resposta correta).
i. independente ii. exaustivo
iii. simples iv. mutuamente exclusivos
97) Uma amostra de 1000 pessoas diagnosticada com certa doena
distribuda de acordo com a altura e o status (evoluo) da doena a partir
de um exame clnico de acordo com a seguinte tabela:
Sem a
doena
Fraca Moderada Severa Totais
Alta 122 78 139 61 400
Mdia 74 51 90 35 250
Baixa 104 71 121 54 350
Totais 300 200 350 150 1000
Como voc estimaria, a partir dessa tabela, a probabilidade de ser
mdia ou baixa em altura e ter moderado ou severo grau de evoluo da
doena ?
a. 600/1000 * 500/1000 d. 300/600
b. 300/500 e. 800/1000
c. 300/1000
98) De cerca de 25 artigos, nove so defeituosos, seis tem defeitos superficiais
e trs tem defeitos importantes. Determine a probabilidade de que um artigo
90
selecionado aleatoriamente tenha defeitos importantes dado que ele tem
defeito.
a. 1/3
b. 0,25
c. 0,24
d. 0,08
99) A seguinte tabela de duas entradas mostra as frequncias de ocorrncia de
uma exposio hipottica e a doena em um grupo de 1000 pessoas.
Doena
Exposio
Presente Ausente
Totais
Presente 75 325 400
Ausente 25 575 600
Totais 100 900 1000
a. Qual a probabilidade de exposio no grupo ?
b. Qual a probabilidade conjunta de tanto exposio como de doena
estar presente no grupo ?
c. Calcule a probabilidade de doena estar presente condicionada a
presena de exposio e condicionada a ausncia de exposio.
100) Um epidemiologista acredita que as rodovias tm alguma relao com o
desenvolvimento de uma nova doena porque a probabilidade de uma
pessoa estar morando a menos de uma milha das rodovias, dado que ela
tem a doena, 0,80. Voc concorda com ele ? Porque ou porque no ?
101) Um dormitrio de um campus universitrio abriga 200 estudantes. 120 so
homens, 50 so dos graus mais avanados e 40 so homens dos graus
mais avanados. Um estudante selecionado ao acaso. A probabilidade
de selecionar um estudante de grau menos elevado, dado que o estudante
mulher, :
(a) 7/8 (d) 7/20
(b) 7/15 (e) 1/4
91
(c) 2/5
102) Uma amostra de 2000 indivduos distribuda de acordo com a cor de olho
e a presena ou ausncia de uma certa caracterstica oftalmolgica como
segue:

Caracterstica Cor dos olhos
Castanho Azul Outro
Sim 400 270 130 800
No 200 650 350 1200
Total 600 920 480 2000

Em uma seleo aleatria de um indivduo da populao em estudo,
Qual sua estimativa da probabilidade de:

a. a pessoa tem olhos azuis? ___________
b. a caracterstica est presente e a pessoa tem castanhos?
____________
c. a pessoa nem no tem olhos castanhos nem olhos azuis dados
que a caracterstica est ausente? _______________
d. a pessoa nem no tem olhos de outra cor nem olhos azuis e a
caracterstica est presente _______________
e. a pessoa no tem olhos castanhos? _______________
f. a pessoa tem olhos azuis ou nem no tem olhos azuis nem olhos
castanhos? __________
g. a pessoa no tem a caracterstica ou no tem olhos castanhos?
________
103) Um sindicato de trabalhadores local consiste de associados encanadores e
eletricistas, classificado de acordo com grau:

Aprendiz Jornaleiro Oficial
Encanadores 25 20 30 75
Eletricistas 15 40 20 75
40 60 50
Um associado do sindicato selecionado ao acaso. Dado que o
pessoa selecionada um encanador, a probabilidade de que ele um
jornaleiro :

a. 1/2
b. 1/3
c. 4/15
92
d. 2/15
e. nenhuma das anteriores.
104) Entre vinte e cinco artigos, nove so defeituosos, seis tem somente um
defeito no importante e trs tm um defeito importante. Determine a
probabilidade de que um artigo selecionado ao acaso tenha defeitos
importantes dado que ele tenha defeitos.
a. 1/3
b. 0,25
c. 0,24
d. 0,08
105) Os depositantes do Banco X so categorizados por idade. Selecionaremos
aleatoriamente um indivduo desse grupo de 2.000 depositantes
Sexo
Idade | Homem | Mulher
-----------------------------------------------
30 ou menos | 800 | 600
31 ou mais | 400 | 200
-----------------------------------------------
i) Ento P(mulher de 30 ou menos) =
a) 2/5 b) 3/4 c) 3/7 d) 3/10 e) nenhuma das anteriores
ii) Ento P[homem ou (31 ou mais)] =
a) 1/5 b) 3/10 c) 1/2 d) 7/10 e) nenhuma das anteriores
iii) Ento P(mulher) =
a) 3/10 b) 2/5 c) 3/5 d) 2/3 e) nenhuma das anteriores
iv) Qual a probabilidade condicional de que um depositante escolhido
tenha idade de 30 anos ou menos, dado que ele homem?
a) 2/3 b) 7/10 c) 4/7 d) 2/5 e) nenhuma das anteriores
v) So as idades e sexos dos depositantes independentes para o Banco
X? Porque?
105) Um epidemiologista sente que as rodovias tem alguma relao com o
desenvolvimento de uma nova doena porque a probabilidade de que uma
pessoa esteja morando a uma milha ou menos da rodovia, dado que ela
tem a doena 0,80. Voc concorda com ele? Explique porque.
93
106) Existem duas urnas marcadas com H e T. A urna H contem 2 bolas
vermelhas e 1 bola azul. A urna T contem 1 bola vermelha e 2 azuis. Uma
moeda jogada ao acaso. Se sai cara escolhida uma bola da urna H. Se
sai coroa, uma bola escolhida da urna T. Ache as seguintes
probabilidades.
a. P(cara e vermelha) b. P(coroa) c. P(vermelha)
d. P(azul) e. P(cara|vermelha)
107) O nmero de paradas de mquinas em uma grande fbrica durante uma
semana tem a seguinte distribuio de probabilidade:
B 5 10 15 20 25
P(B = b) 0,25 0,30 0,25 0,15 0,05
Usando essa distribuio, Calcule E[B] e V[B]
108) A Companhia Beta comprou 80 componentes eletrnicos de um fornecedor
que declara que somente 2 % dos componentes que ele vende so
defeituosos e que os componentes defeituosos so misturados
aleatoriamente com os componentes bons. Cada componente defeituoso
custar a Beta US$ 250 em custos de reparo. Se o fornecedor est certo,
qual ser o nmero esperado de componentes defeituosos ? E qual o
custo esperado de reparo?
109) Um vendedor de carros oferece a todos os seus clientes potenciais uma
corrida de 30 milhas no tipo de carro que o cliente est interessado em
comprar, mais um almoo ou jantar gratuitos. Todos estes custos so
cerca de US$ 50. Se o cliente no compra o carro, o vendedor perde US$
50, mas se o cliente comprar o carro, o lucro mdio do vendedor de
cerca de US$ 500 (dos quais os custos da corrida e da refeio devem ser
deduzidos). No passado, 20 % dos clientes compraram o carro depois da
corrida e da refeio gratuita. Qual o lucro esperado para o vendedor
nessa situao?
110) Um processo de produo paralisado para ajuste toda vez que uma
amostra aleatria de cinco itens, selecionada com reposio, apresenta
dois ou mais defeituosos. Ache a probabilidade de que o processo ser
paralisado aps uma inspeo se ele est produzindo:
a) 20 % de defeituosos
b) 10 % de defeituosos
c) 5 % de defeituosos
94
111) Um simples mssil de certa variedade tem uma probabilidade de de
derrubar um bombardeiro, uma probabilidade de de danific-lo e uma
probabilidade de de err-lo. Alm disso, dois tiros danificadores
derrubaro o avio. Se quatro destes msseis so lanados, qual a
probabilidade de derrubar um avio?
112) De acordo com um cientista poltico, a populao votante de certa cidade
consiste de 46 % do candidato A, 40 % do candidato B, 11 % do candidato
C e 3 % do candidato D. Em uma amostra aleatria de 5 votantes, qual a
probabilidade de que a amostra contenha:
a) Dois votantes para o candidato A e um de cada das outras categorias?
b) Trs votantes para o candidato A e dois para o candidato B?
c) Nenhum votante para o candidato D?
95
4. Variveis Aleatrias Discretas
Objetivos do Captulo:
Distinguir entre uma distribuio de probabilidade discreta e contnua
Calcular a mdia, a varincia e o desvio padro de uma distribuio de
probabilidade discreta.
Definir os termos Distribuio de Probabilidade e Varivel Aleatria
Descrever as caractersticas das distribuies Binomial, Hipergeomtrica e
de Poisson.
Definio : Uma varivel aleatria um valor numrico determinado pelo
resultado de um experimento ( uma quantidade resultante de um
experimento aleatrio que, por acaso, pode assumir diversos valores).
Exemplo 1: Considere um experimento aleatrio no qual uma moeda jogada 3
vezes. Seja X o nmero de caras. Seja H o resultado cara e T o resultado coroa.
O espao amostral para este experimento ser:
TTT, TTH, THT, THH, HTT, HTH, HHT, HHH
Assim, os possveis valores de X (nmero de caras) sero:
X = 0, 1, 2, 3.
Nota: Neste experimento, h 8 possveis resultados no espao amostral.
Desde que eles so todos igualemente provveis de ocorrer, cada resultado
tem uma probabilidade de 1/8 de ocorrer.
A figura a seguir ilustra a associao existente entre resultados do experimento
(no espao amostral) e os valores assumidos pela varivel X.
96

O resultado zero caras ocorre o corre somente uma vez
O resultado 1 cara ocorre trs vezes
O resultado 2 caras ocorre trs vezes
O resultado 3 caras ocorre somente uma vez
Da definio de uma varivel aleatria, X, tal como definida neste
experimento, uma varivel aleatria. Seus valores so determinados pelos
resultados do experimento.
Nota: A varivel aleatria X uma associao de pontos no espao
amostral com pontos na reta dos nmeros reais (0,1, 2,3). Na realidade,
uma varivel aleatria definida atravs de uma funo em que o domnio
o conjunto de todos os resultados possveis do experimento e a imagem o
conjunto de todos os valores assumidos pela varivel aleatria. Note que a
97
TTT
TTH
THT
THH
HTT
HTH
HHT
HHH
0
1
1
2
1
2
2
3
Espao Amostral X = Nmero de Caras
varivel aleatria no resultado do experimento, mas sim um valor
associado a este.
Definio : Uma Distribuio de Probabilidade uma lista de todos os
resultados de um experimento e suas probabilidades associadas. De forma
mais rigorosa, uma funo matemtica em que o domnio so os valores
possveis de uma varivel aleatria e a imagem so as suas probabilidades
associadas.
A distribuio de probabilidade de uma varivel aleatria X (nmero de caras)
nas trs jogadas de uma moeda mostrada a seguir.
Distribuio de Probabilidade para Trs Jogadas de uma Moeda
Nmero de
Caras
Probabilidade
0
1
2
3
1/8 = 0,125
3/8 = 0,375
3/8 = 0,375
1/8 = 0,125
Total 8/8 = 1
98
1/8
3/8
probabilidade
CARACTERSTICAS DE UMA DISTRIBUIO DE PROBABILIDADE
A probabilidade de um resultado deve estar sempre situada entre 0 e 1.
Exemplo: P(0 caras) = 0,125, P(1 cara) = 0,375 , etc. no experimento de jogar
3 moedas.
A soma das probabilidades de todos os resultados mutuamente exclusivos
sempre 1 (veja a tabela de distribuio de probabilidade no texto).
VARIVEL ALEATRIA DISCRETA
Definio : Uma varivel aleatria discreta uma varivel que pode assumir
somente certos valores claramente separados (em descontinuidade)
resultantes, por exemplo, de uma contagem de algum item de interesse.
Exemplo: Seja X o nmero de caras quando uma moeda jogada 3 vezes.
Aqui os valores de X so 0,1,2 ou 3 (so claramente separados, em
descontinuidade).
Nota: uma varivel aleatria discreta no precisa necessariamente assumir
apenas valores inteiros. Poderia, por exemplo, ser uma varivel que
apresentasse os seguintes valores: 0, 23/7 , 72/25, etc. A condio que deve
ser cumprida seus valores sejam descontnuos.
VARIVEL ALEATRIA CONTNUA
99
0 1 2 3
Nmero de caras
Definio : Uma varivel aleatria contnua uma varivel que pode
assumir um nmero infinitamente grande de valores (com certas limitaes
prticas).
Exemplo: (a) Peso de um estudante
(b) comprimento de um carro
4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade
Discreta
A mdia refere-se a localizao central de um conjunto de dados. Ela pode
ser considerada como um valor de longo prazo de uma varivel aleatria e
tambm chamada de valor esperado (ou esperana matemtica), E(X).
A mdia de uma distribuio de probabilidade discreta determinada
pela frmula:

)] ( . [ ) ( X P X X E
onde

(letra grega, mi) representa a mdia (ou valor esperado) e P(X) a


probabilidade dos vrios resultados de X.
4.2 A Varincia e o Desvio Padro de uma Distribuio de
Probabilidade Discreta
A varincia mede a quantidade de disperso ou variabilidade de uma
distribuio. Ela denotada pela letra grega
2

(sigma ao quadrado).
O desvio padro obtido atravs da raiz quadrada de
2

.
A varincia de uma distribuio de probabilidade discreta calculada atravs
da frmula:
100

)] ( ) [(
2 2
X P X
O desvio padro :
2

Exemplo 2
Uma empresa especializa-se no aluguel de carros para famlias que necessitam
de um carro adicional para um perodo curto de tempo. O presidente da
empresa tem estudado seus registros para as ltimas 20 semanas e apresentou
os seguintes nmeros de carros alugados por semana.
Nmero de
Carros alugados
Semanas
10
11
12
13
5
6
7
2
Os dados acima podem ser considerados como uma distribuio de
probabilidade? Porque ou porque no?
Converta o nmero de carros alugados por semana em uma distribuio de
probabilidade.
Nmero de
carros alugados
Probabilidade
P(X)
10
11
12
13
0,25
0,30
0,35
0,10
Total 1,00
101
Calcule o nmero mdio de carros alugados por semana.
A mdia

3 , 11 ) 10 , 0 ( ) 13 ( ) 35 , 0 ( ) 12 (
) 30 , 0 ( ) 11 ( ) 25 , 0 ( ) 10 ( )] ( . [ ) (
+ +
+ X P X X E
Calcule a varincia do nmero de carros alugados por semana.
A varincia
91 , 0 10 , 0 ) 3 , 11 13 ( ... 30 , 0 ) 3 , 11 11 ( 25 , 0 ) 3 , 11 10 (
)] ( . ) [(
2 2 2
2 2
+ + +

X P X
Clculo de E(X)
Nmero de Carros
alugados
Probabilidade, P(X) XP(X)
10
11
12
13
0,25
0,30
0,35
0,10
2,5
3,3
4,2
1,3
Total 1,00 E(X) = 11,3
Clculo de
2

Nmero de
Carros
Alugados
Prob.
P(X)
) ( X
2
) ( X ) ( ) (
2
X P X
10
11
12
13
0,25
0,30
0,35
0,10
10-11,3
11-11,3
12-11,3
13-11,3
1,69
0,09
0,49
2,89
0,4225
0,0270
0,1715
0,2890
Total 9135 , 0
2

9558 , 0 9135 , 0
102
4.3 A Distribuio de Probabilidade Binomial
A Distribuio Binomial tem as seguintes caractersticas:
Considere um experimento que apresenta apenas dois resultados possveis
que so categorias mutuamente exclusivas: sucesso e falha.
So repetidos diversas vezes este mesmo experimento.
A probabilidade de sucesso permanece constante para cada tentativa
(consequentemente, a probabilidade de falha tambm permanece
constante).
As tentativas so independentes, significando que o resultado de uma
tentativa no afeta o resultado de qualquer outra tentativa.
Para construir uma distribuio binomial, consideremos:
n o nmero de tentativas
r o nmero de sucessos observados
p a probabilidade de sucesso em cada tentativa
q a probabilidade de falha em cada tentativa, que igual a 1-p
FRMULA PARA A DISTRIBUIO DE PROBABILIDADE BINOMIAL
r n r
q p
r n r
n
r X P




)! ( !
!
) (
onde n! lido como n fatorial. Por exemplo, 4! = (4).(3).(2).(1)=24.
0! igual a 1, por definio e 1! = 1.
Exemplo 3
O Departamento de Estatstica do Trabalho de um municpio estimou que 20 %
da fora de trabalho est desempregada. Uma amostra de 14 trabalhadores
obtida deste municpio. Calcule as seguintes probabilidades:
103
Trs esto desempregados na amostra. (Nota: n = 14 e p = 0,2)
250 , 0 8 , 0 2 , 0
)! 3 14 ( ! 3
! 14
) 3 (
3 14 3



X P
No mnimo um dos trabalhadores da amostra esto desempregados.
956 , 0 8 , 0 2 , 0
)! 0 14 ( ! 0
! 14
1 ) 0 ( 1 ) 1 (
0 14 0



X P X P
No mximo dois dos trabalhadores esto desempregados.
448 , 0 250 , 0 154 , 0 044 , 0 ) 2 ( + + X P
Exemplo 4
Uma companhia fabrica rolamentos para serem usados em bicicletas. Sabe-se
que 5 % dos dimetros dos rolamentos estaro fora dos limites de aceitao
(defeituosos). Se 6 rolamentos so selecionados ao acaso, qual a
probabilidade de que:
Exatamente zero sejam defeituosos? Exatamente um seja defeituoso?
Exatamente dois sejam defeituosos? Exatamente trs sejam defeituosos?
Exatamente quatro sejam defeituosos? Exatamente cinco sejam defeituosos?
Exatamente seis sejam defeituosos?
Note que as condies de uma distribuio binomial esto satisfeitas
neste exemplo:
- H uma probalidade constante de sucesso (0,05)
- H um nmero fixo de tentativas (6)
- As tentativas so independentes (Porque?)
- H somente dois possveis resultados (um rolamento defeituoso ou no
defeituoso).
104
DISTRIBUIO DE PROBABILIDADE BINOMIAL para n = 6 e p = 0,05
Nmero de rolamentos defeituosos, X Probabilidade de ocorrncia, P(X)
0
1
2
3
4
5
6
0,735
0,232
0,031
0,002
0,000
0,000
0,000
Verifique os clculos para os valores da tabela acima
Mostre a representao grfica para a Distribuio de Probabilidade
Binomial com n = 6 e p = 0,05
Para um n fixo (10) e p pequeno (0,05), a distribuio positivamente
assimtrica
Para um n fixo (10) e p aproximando-se de 0,5, a distribuio torna-se
simtrica.
Para um n fixo (10) e p grande (0,95), a distribuio torna-se negativamente
assimtrica.
Para um p fixo e para valores cada vez maiores de n, a distribuio torna-se
cada vez mais simtrica
Nota: Como os procedimentos de clculo tornam-se repetitivos (e montonos)
faremos a seguir uma simulao no computador para diversos valores dos
parmetros n e p de uma distribuio binomial.
105
4.4 A Mdia e Varincia De Uma Distribuio Binomial
A mdia dada por:
np
A varincia dada por:
) 1 (
2
p np
Nota: A demonstrao terica para estes valores ser desenvolvida em sala de
aula e encontra-se na maioria dos livros de Introduo a Estatstica.
Para o exemplo anterior:
p = 0,05 e n = 6
285 , 0 95 , 0 05 , 0 6 ) 1 (
3 , 0 05 , 0 6
2


p np
np

Distribuio Cumulativa de Probabilidade


Um engenheiro estimou que 60 % das pontes de um Estado necessitam de
reparos. Uma amostra de 10 pontes no Estado foi aleatoriamente selecionada.
Qual a probabilidade de que exatamente 6 destas pontes necessitem de
reparos? Esta situao (deste exemplo) satisfaz as condies para uma
distribuio binomial ? Porque?
Verificar:
n = 10, p = 0,6 P(X = 6) = 0,251
106
Qual a probabilidade de que 7 ou menos destas pontes necessitem de
reparos ?
) (verificar 833 , 0 ) 7 ( ... ) 1 ( ) 0 ( ) 7 ( + + + X P X P X P X P
Este um exemplo de probabilidade cumulativa.

Apndice 1 (Recordao)
Uma varivel aleatria (v.a.) um valor numrico que definido em ou
determinado pelos resultados ou eventos de um experimento. Variveis
aleatrias normalmente so denotadas por letras maisculas, X, Y etc e podem
ser discretas ou contnuas.
Seja a v.a. X o nmero de sementes que germinam em 100 plantadas.
Possveis valores para X so 0,1,2,100, (discreta)
Seja a v.a. X a temperatura mxima diria em Uberlndia. Possveis valores so
0 - 50 C por exemplo 26.1276(contnua).
Seja X a resposta a uma questo com ' Sim', ' No', 'No Sei'. X no uma v.a
(no numrica).
Seja Y o nmero de 'Sim's. Y uma v.a. discreta.
Distribuio de probabilidade de um v.a. Discreta.
Esta uma lista dos possveis valores da v.a. e as probabilidades
correspondentes (que tem que somar 1). As probabilidades podem ser escritas:


k
i
i
i i
p
p x X P
1
i
1
1 p 0 e k 1,2,..., i para ) (
107
Apendice 2 (Recordao)
Varivel Aleatria discreta
Uma varivel aleatria discreta uma varivel aleatria que toma valores
discretos com probabilidades especificadas.
Exemplo - uma Famlia de 3 crianas.
Seja X uma Varivel Aleatria (VA) = nmero de meninas
Possveis valores:
X = 3 GGG
X = 2 GGB GBG BGG
X = 1 BBG BGB GBB
X = 0 BBB
Considere que os 8 resultados so igualmente provveis de forma que
x 0 1 2 3
Probabilidade
P(X = x)
1/8 3/8 3/8 1/8

A lista de valores que X pode assumir e as suas probabilidades
chamada de distribuio de probabilidade discreta para X.
Conveno de notao - use letras maisculas para variveis aleatrias e letras
minsculas para valores especficos
Exemplo - tentativas de Bernoulli
Cada tentativa um 'experimento' com exatamente 2 possveis resultados,
"sucesso " e " fracasso " com probabilidades p e 1-p.
Seja X = 1 se sucesso, 0 se fracasso
A Distribuio de probabilidade

x 0 1
P(X = x) p 1-p

108
Exemplo - so lanados 2 dados
Seja X a soma dos resultados.
Resultados:
11 21 31 41 51 61
12 22 32 42 52 62
13 23 33 43 53 63
14 24 34 44 54 64
15 25 35 45 55 65
16 26 36 46 56 66
Considere que os 36 resultados so igualmente provveis. Portanto cada um
tem probabilidade = 1/36.
Possveis valores de X so 2, 3,... , 12
por exemplo P(X = 4) = P(1,3 ou 2,2 ou 3,1) = 3/36.
A distribuio de probabilidade
x 2 3 4 . . . 10 11 12
P(X=x) 1/36 2/36 3/36 . . . 3/36 2/36 1/36
Apndice 3 (Recordao)
A distribuio Binomial
Considere n tentativas Bernoulli.
Assuma que a probabilidade de sucesso (S) o mesma para todas as
tentativas, P(S) = p.
Assuma que as tentativas so independentes e portanto a probabilidade para
qualquer determinada combinao de sucessos e fracassos, por exemplo para 5
tentativas, a probabilidade do resultado SSFSF, pode ser obtida multiplicando
as probabilidades para cada resultado de tentativa.
por exemplo P(SSFSF) = p.p. (1-p) .p.(1-p) = p
3
(1-p)
2
De fato, a probabilidade de obter trs sucessos e dois fracassos em cinco
tentativas p
3
(1-p)
2
para cada um dos modos diferentes que isto poderia
acontecer, isto , SSSFF, SSFSF,... etc.
109
O nmero de arranjos " distintos " de 3 sucessos e 2 fracassos pode ser
facilmente calculado usando o coeficiente binomial

,
_

x
n
onde n o nmero de
tentativas e x o nmero de sucessos requerido.
O coeficiente binomial (leia-se como "binomial de x em n") definido como

,
_

x
n
110
p ) - ( 1 p a d e p r o b a b i l i d u m a t e n d o
a r r a n j o c a d a c o m s , t e n t a t i v a 5 e m s u c e s s o s 3 o b t e r s e d e d i s t i n t a s m a n e i r a s 1 0 h
p o r t a n t o 1 0 ,
1 ) ( 3 . 2 . 1 ) ( 2 .
5 . 4 . 3 . 2 . 1
3 ! 2 !
5 !
3
5
e x e m p l o , N e s t e
) ! ( !
!
2 3

,
_

,
_

x n x
n
x
n

Seja X a V.A. igual ao nmero total de sucessos em n tentativas .
Para calcular a probabilidade de obter x sucessos, pode ser mostrado que
x - n x
p ) - ( 1 p ) (

,
_


x
n
x X P
111
nmero de arranjos prob. de prob. de
de x Ss e (n-x) Fs x Ss (n-x) Fs
onde o nmero mnimo de sucessos 0 e o mximo n.
A distribuio do nmero de sucessos chamada distribuio binomial com dois
parmetros, n e p, necessrios para determinar P(X=x). Dizemos, de forma
abreviada, X ~ B(n,p)
Exemplo - Um time de futebol joga 3 jogos
Assuma que cada jogo uma tentativa Bernoulli com prob(ganhar) = 0,5
Seja X a V.A. = nmero de vitrias
Ento X tem distribuio binomial com n=3 e p=0,5, com resultado vitria (W) ou
derrota (L) em cada tentativa.
(Isto abreviado como X ~ B(3;0,5))
Qual a probabilidade de que o time ganhe 2 jogos exatamente?
P(X=2) = P(WWL) + P(WLW) + P(LWW)
= 3/8 (desenhe um diagrama de rvore)
112
ou usando a frmula para probabilidades binomiais, a prob(WWL) = p
2
(1-p) e o
nmero de distintos arranjos de 2 vitrias em trs jogos
3
! 1 ! 2
! 3
2
3

,
_

. Portanto a
resposta 3p
2
(1-p). Assim
8
3
0 , 5 p 2 , x 3 , n u s a n d o ) 5 , 0 1 ( ) 5 , 0 (
2
3
) 2 (
1 2

,
_

X P

As distribuies binomiais so usadas para modelar situaes que podem ser
pensadas como tentativas repetidas e " independentes " cada uma com
somente 2 possveis resultados. Ns os usaremos posteriormente para fazer
inferncias estatsticas sobre propores.
113
Exemplo - Um Sistema de Controle de Qualidade
Um Sistema de Controle de Qualidade requer que de cada lote de itens uma
amostra de 10 selecionada e testada. Se 2 ou mais itens da amostra so
defeituosos o lote inteiro rejeitado.
Se a probabilidade de um item ser defeituoso 0,05
(i) qual a probabilidade de 2 defeituosos na amostra?
(ii) Qual a probabilidade do lote ser rejeitado?
Seja X a V.A. = nmero de defeituosos na amostra de n = 10 itens.
Portanto, X ~ Binomial (10; 0,05)
(i)
0 7 4 6 , 0 ) 9 5 , 0 ( ) 0 5 , 0 (
2
1 0
) 2 (
8 2

,
_

X P
(ii) P(rejeitar o lote) =

,
_


1 0
2
1 0
) 9 5 , 0 ( ) 0 5 , 0 (
1 0
) 2 (
x
x x
x
X P
o que muito trabalhoso de calcular.
Mas:
114
0 8 6 2 , 0
] ) 9 5 , 0 ( ) 0 5 , 0 (
1
1 0
) 9 5 , 0 ( ) 0 5 , 0 (
0
1 0
[ - 1
e x c l u s i v o s m u t u a m e n t e 1 ) ] P ( X 0 ) [ P ( X - 1
1 ) X o u 0 ( 1 ) 2 ( 1 ) 2 (
9 1 1 0 0

,
_

,
_

+
< X P X P X P
Apndice 4 (recordao)
Valor Esperado e Varincia de uma Varivel Aleatria
Anlise de deciso
Exemplo - explorao de petrleo
Uma companhia de explorao de petrleo tem um arrendamento para o qual
precisa decidir se:
(i) vende agora,
(ii) segura durante um ano e ento vende, ou
115
(iii) perfura agora.
O custo de perfurar $200,000 ($200K).
Perfurando conduzir a um dos resultados seguintes
Resultado Probabilidade Receita
Poo Seco 0.5 $0
Poo com pouco petrleo 0.4 $400K
Poo com jorro 0.1 $1500K
Se vende agora, a companhia pode adquirir $125K.
Se segura durante um ano e os preos do petrleo sobem (probabilidade =0.6)
pode vender por $300K ou se os preos do petrleo caem (probabilidade = 0.4)
pode adquirir $100K. O que deveria fazer?
116
125 K
Vende agora
$ 300 K
$ 100 K
Vende
depois
$0 200 K
Seco
0,5
Preos do petrleo
sobem
Preos do petrleo
caem
0,6
0,4
Deciso
Valor esperado
$ 125 K
300 x 0,6 +
100 x 0,4 =
$ 220 K
A melhor deciso segurar durante um ano e ento vender. Este um exemplo
de usar um diagrama de rvore para Anlise de Deciso. Tambm ilustra o
conceito do valor esperado de uma varivel aleatria .
Se a distribuio de probabilidade de uma varivel aleatria X
Valores de X x1 x2 ... xk
Probabilidades p1 p2 ... pk
seu valor esperado

+ + +
K
i
i i K K
p x p x p x p x X E
1
2 2 1 1
. . . ) (
exemplo Perfurao de Petrleo
Resultado Probabilidade Receita
Poo seco 0.5 0
Poo com pouco petrleo 0.4 $400K
Poo com jorro 0.1 $1500K
Seja X a varivel aleatria lucro financeiro
= Receita custo de perfurao
= Receita - $200K
A distribuio de probabilidade para X
x -200 200 1300
P(X=x) 0.5 0.4 0.1
117
Perfura
$400 200 K
$1500-200 K
Pouco petrleo
Jorro
0,4
0,1
-200 x 0,5
+ 200 x 0,4
+ 1300 x 0,1
= $ 110 K
Portanto, o valor esperado (mdia) de X
E(X) = -200 x 0.5 + 200 x 0.4 + 1300 x 0.1 = $110K
Isto diretamente anlogo mdia amostral.
E(X) pode ser considerada como uma idealizao de, ou um valor terico para,
a mdia da amostra.
E(X) denotado freqentemente pela letra grega

(pronuncia-se mu).
Varincia de uma Varivel Aleatria
Recorde que a varincia uma medida de disperso. Para uma amostra de
observaes de uma populao a varincia ao redor da mdia definida como
1
) (
1
2
2

n
x x
s
n
i
i

A varincia de uma Varivel Aleatria X definida como


+ + +
K
i
i i
K K
x E x p x
ou
x p x p x p x
1
2 2
2 2
2 2
2
1 1
) ( ) ( ) var(
) ( ... ) ( ) ( ) var(




Ela representa o limite terico da varincia amostral s
2
quando o tamanho da
amostra (n) fica muito grande.
var(X) denotada freqentemente por
2
(sigma quadrado).
Uma frmula mais simples para var(X)
2 2
2 2 2
1 1
)] ( [ ) (
) ... ( ) var(
X E X E
x p x p X
K K

+ +
Exemplo - Gnero em uma classe de 5
Assuma que a probabilidade de um estudante em uma classe ser masculino
um meio. Seja a varivel aleatria X o nmero de estudantes masculinos em
um grupo da classe de tamanho 5.
118
Qual o valor de E(X), o nmero esperado de homens no grupo, e qual a
varincia de X?
Considere X ~ binomial (5;0,5).
Ento a distribuio de probabilidade de X
x 0 1 2 3 4 5
P(X=x) 1/32 5/32 10/32 10/32 5/32 1/32
(Confira isto usando a frmula para probabilidades binomiais e desenhe um
diagrama de rvore para analisar a estrutura dos resultados.)
+ +
+ + +

5 , 2
32
80
32
1
5
32
5
4
32
10
3
32
10
2
32
5
1
32
1
0 ) ( ) ( x xp X E
isto , em mdia tais grupos tm 2,5 homens.
12 , 1 25 , 1 ) var( Portanto,
1,25
(2,5) - 7,5
) 5 , 2 (
32
1
5 ...
32
1
0 ) ( ) var(
2
2 2 2 2 2

+ +

X
x p x X

Esta uma medida da variabilidade de X.



Em geral se X ~ binomial (n,p) pode ser mostrado que
E(X) = np e var(X) = npq
onde q = 1 - p
[Confira os valores de E(X) e var(X) calculados acima para X ~ binomial (5;0,5)
usando estas frmulas.]
EMPRICO TERICO
119
(baseado nos dados)
QUANTIDADE
(MATEMTICO)
QUANTIDADE
(a) Freqncia relativa
n
f
x
i
i

PROB[X = xi] = pi
0

n
quando
n
f
i


i
1 ) (
n
f
b
i

n
i
i
p
1
=1

i
i i
f x
c
n
1

x mdia ) (

i
i i
x p E(X)
ESPERANA,

n
quando
X E x ) (

n
i
i i
n
f x x
d
1
2
2
1
) (
S VARINCIA ) (

i
n
ii
i
p x x
X VAR
2
1
) (
) (

n
quando
X VAR S ) (
2

Valor esperado e Varincia para uma Funo de Variveis Aleatrias
Se Y = aX + b
onde X uma varivel aleatria e a e b so valores constantes conhecidos,
ento,
E(Y) = a E(X) + b
X x Y
a a X a
X a Y

2 2 2
2
) var( , Portanto
) var( ) var(

e
Semelhantemente se T = a X + b Y + c onde X e Y so variveis aleatrias e a,
b e c so constantes conhecidas, ento,
E(T) = a E (X) + b E (Y) + c.
e ) , cov( 2 ) var( ) var( ) (
2 2
Y X ab Y b X a T Var + +
Em particular, se X e Y so independentes ento a covarincia cov(X,Y) zero.
Portanto
120
) var( ) var( ) (
2 2
Y b X a T Var +
Prova: Segue das definies de E(X) e var(X).
Exemplo - Lucro previsto estimado
Uma companhia faz produtos para mercados locais e de exportao.
O nmero de vendas do prximo ano no pode ser predito exatamente mas
estimativas podem ser feitas como a seguir
unidades de X,local 1,000 3,000 5,000 10,000
Probabilidade 0.1 0.3 0.4 0.2

unidades Y, export. 300 500 700
Probabilidade 0.4 0.5 0.1
Consequentemente E(X) = 1000 x 0.1 + 3000 x 0.3 + 5000 x 0.4 + 10000 x 0.2
= 5000 (= esperou vendas locais)
E(Y) = 300 x 0.4 + 500 x 0.5 + 700 x 0.1
= 440 (= vendas de exportao esperadas)
A companhia lucra $2000 em cada unidade vendida no mercado local e $3500
em cada unidade exportada.
Consequentemente o lucro total
T = 2000 X + 3500 Y
Usando a frmula acima
E(T) = 2000 E(X) + 3500 E(Y)
= 2000 x 5000 + 3500 x 440
= $11,540,000
- este o lucro estimado (previsto) durante o prximo ano.
121
Exemplo - Fabricao de um componente de metal
Um componente feito cortando um pedao de metal de comprimento X e
reduzindo este valor da quantidade Y. Ambos estes processos so um pouco
imprecisos.
O comprimento lquido ento
T = X - Y.
Isto pode ser escrito na forma T = a X + b Y com a = 1 e b = -1
assim
E(T) = a E (X) + b E (Y) = 1 E(X) + (-1)E(Y)
= E(X) - E(Y)
) var( ) var( ) (
2 2
Y b X a T Var +
var(Y) var(X)
) var( ) 1 ( ) var( 1 var(T) tan
2 2
+
+ Y X to Por
ou seja, var(T) maior tanto que var(X) ou var(Y), embora T = X - Y, porque X
e Y contribuem variabilidade em T.
Variveis Aleatrias Independentes
Lembremos que dois eventos A e B so independentes se e somente se P(A e
B) = P(A)P(B) se a probabilidade da interseo de A e B o produto das
probabilidades de A e de B. Podemos relacionar variveis aleatrias a eventos,
ou seja, podemos definir eventos em termos de valor(es) que uma varivel
aleatria assume. Por exemplo, o evento A = {a < X b) ocorre se X maior do
que a e menor do que b. Duas variveis aleatrias, X e Y, so independentes
se e somente se todo evento da forma {a < X b} independente de todo
evento da forma {c < Y d}. Duas variveis aleatrias so independentes se
conhecendo o valor de uma no ajuda a predizer o valor da outra.
Exemplos: Considere a jogada de uma moeda 10 vezes.
122
Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras
nas ltimas 4 jogadas. Portanto X e Y so independentes. Conhecer o valor de
X no ajuda a predizer o valor de Y e vice-versa.
Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras
nas ltimas 5 jogadas. Ento X e Y so dependentes porque, por exemplo, o
evento {5 < X 6) e o evento {-1 < Y 0} so dependentes (e mutuamente
exclusivos).
Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de coroas
nas primeiras 2 jogadas. Ento X e Y so dependentes porque, por exemplo, o
evento {5 < X 6} e o evento {2 < Y 3} so dependentes (e mutuamente
exclusivos).
Que espcies de experimentos conduzem a variveis aleatrias independentes?
Somas e mdias de seqncias que no se sobrepem seja de jogadas de
moedas, de jogadas de dados so alguns exemplos. O segundo e terceiro
exemplo acima mostram porque existe a necessidade das seqncias serem
no sobrepostas (ou seja, no tenham interseco).
Valor Esperado do Produto de Variveis Aleatrias Independentes
Se as variveis aleatrias X e Y so independentes, Ento
] [ ] [ ] [ Y E X E Y X E
O inverso (recproca) no verdadeiro em geral:
] [ ] [ ] [ Y E X E Y X E
no
implica que X e Y sejam independentes.

123

124
5. Variveis Aleatrias Contnuas e Distribuio
Normal
5.1 Variveis Aleatrias Contnuas
Diferentemente de uma varivel aleatria discreta, para uma varivel aleatria
contnua no podemos definir uma funo de distribuio de probabilidade
(f.d.p.). No entanto, podemos definir o que se chama de uma funo densidade
de probabilidade para as variveis aleatrias contnuas. Por exemplo,
suponhamos uma distribuio uniforme do tipo:

Observe que f(X) uma funo constante assumindo sempre o valor 1/10 no
intervalo fechado 10 5 X . Essa funo goza das seguintes propriedades:
1) ela sempre positiva ou nula. Ou seja,
0 ) ( X f
para qualquer valor de X.
2) se integrarmos esta funo no intervalo 10 5 X o valor desta integral
definida ser igual a 1. Ou seja,
1
10
5
10
15
] 10 / [ 10 / 1 ) (
15
5
15
5
15
5


x dx dx X f
125
5 15
1/10
f(X)
X
Toda funo que satisfizer essas duas propriedades chamaremos de funo
densidade de probabilidade. Essa funo apenas um instrumento matemtico
para que possamos calcular probabilidades para variveis aleatrias contnuas
(assim como utilizamos a funo distribuio de probabilidade para as variveis
aleatrias discretas). Por exemplo, para o exemplo acima, se quisermos calcular
a probabilidade da varivel aleatria contnua X estar contida no intervalo
12 10 X ser:
10 / 2
10
10
10
12
] 10 / [ ) 10 / 1 ( ) ( ) 12 10 (
12
10
12
10
12
10


x dx dx X f X P
Dessa forma, podemos calcular a probabilidade para qualquer intervalo sendo
esta probabilidade o valor da integral definida da funo densidade de
probabilidade sendo que os limites de integrao so as extremidades do
intervalo. De uma forma geral, podemos dizer que se f(X) a funo densidade
de probabilidade de uma varivel aleatria contnua, ento:


b
a
dx X f b X a P ) ( ) (
5.2 Mdia e Varincia de uma Varivel Aleatria Contnua
A mdia (ou valor esperado) de uma varivel aleatria contnua dada pela
expresso:

+

dx X Xf X E ) ( ] [
No exemplo anterior, o valor esperado da varivel aleatria X ser:
10
20
25
20
225
20
) 10 / 1 ( ) ( ] [
15
5
15
5
2

1
]
1



+

x
dx X dx X Xf X E

A varincia de uma varivel aleatria contnua dada pela expresso:
126

+

dx X f X E X X V ) ( ]) [ ( ] [
2
No exemplo anterior, a varincia da varivel aleatria X ser:
333 , 8 10
30
) 10 2
10
(
) 10 / 1 ( ) 10 ( ) ( ]) [ ( ] [
15
5
15
5
2
3 2
15
5
2 2

1
]
1

+ +


+

X X
X
dx X
X
dx X dx X f X E X X V
5.3 Varivel Aleatria Normal
A mais importante (e mais utilizada na prtica) varivel aleatria contnua a
varivel aleatria normal.
A varivel aleatria normal tem uma funo densidade de probabilidade
(chamada de curva normal) que apresenta a forma de um sino e unimodal
no centro exato da distribuio.
A mdia, mediana e a moda da distribuio normal so iguais e localizadas
no pico da distribuio.
Metade da rea sob a curva est acima do ponto central (pico) e a outra
metade est acima dele.
A distribuio de probabilidade normal simtrica em relao a sua mdia.
Ela assinttica acurva aproxima-se cada vez mais do eixo X mas nunca
toca efetivamente ele.
Figura 1 Caractersticas de uma Funo Densidade de Probabilidade Normal
(Distribuio Normal)
127
Figura 2 Duas Distribuies Normais com mesma mdia mas distintos desvios
padres
Podemos tambm ter distribuies normais com o mesmo desvio padro mas
com distintas mdias ou com mdias e desvios padres distintos. Na realidade a
distribuio normal um nome genrico para definir uma famlia de infinitas
distribuies normais particulares, cada uma com os seus valores especficos
de mdia e desvio padro. O que caracteriza, portanto, e diferencia uma
distribuio normal de outra so os valores destes dois parmetros: a sua mdia
e o seu desvio padro. A funo densidade de probabilidade de uma varivel
aleatria normal dada por:
2
2
2
) (
2
2
1
) (

X
e X f
128
possvel demonstrar matematicamente que a mdia (ou valor esperado)
dessa varivel aleatria igual ao seu parmetro

e o seu desvio padro


igual ao seu segundo parmetro (da equao acima) . O que quer dizer que
se aplicarmos as definies de valor esperado e de varincia de uma varivel
aleatria contnua a expresso acima chegaremos aos resultados

e
2
. O
problema recamos em integrais mais difceis de serem resolvidas:



+

+


dx e X dx X Xf X E
X
2
2
2
) (
2
2
1
) ( ] [
e
2
2
) (
2
2 2
2
2
2
1
) ( ) ( ]) [ ( ] [



+

+


dx e X dx X f X E X X V
X
(talvez um bom matemtico possa fazer essa demonstrao, mas no o nosso
caso pois pretendermos ser bons em estatstica aplicada to somente).
possvel tambm demonstrar matematicamente que as duas abcissas no eixo
X de valor - e + correspondem a pontos de inflexo da curva normal.
Para isto basta obter a segunda derivada da funo densidade e provar que o
seu valor muda de sinal no ponto de inflexo mostrando que a a curvatura
muda de sentido de cncava para convexa ou vice-versa.
5.4 Distribuio Normal Padro
muito difcil ficarmos calculando probabilidades para distribuies normais
atravs de clculos de integrao. Para evitar este trabalho foi definida uma
distribuio normal particular chamada de distribuio normal padro. Esta
distribuio tem as caractersticas de ser uma distribuio normal com mdia
(valor esperado) igual a zero e desvio padro igual a 1. Em notao matemtica
dizemos que:
129
N(0,1) ~ Z
Se X uma varivel aleatria normal com mdia

diferente de zero e desvio


padro diferente de 1 podemos converter essa distribuio em uma
distribuio normal padro atravs da transformao linear:

X
Z
Para que serve essa distribuio Z? Nada melhor que um exemplo para explicar
isso.
Exemplo: As rendas mensais dos graduados em um curso de especializao em
uma grande empresa so normalmente distribudas com uma mdia de R$ 2000
e um desvio padro de R$ 200. Qual o valor de Z para uma renda X de R$
2200? R$ 1700?
Para X = 2200 1
200
2000 2200

X
Z
Para X = 1700 5 , 1
200
2000 1700

X
Z
Um valor de Z = 1 indica que o valor de R$ 2200 est localizado 1 desvio
padro acima da mdia de R$ 2000.
Um valor de Z = -1,5 indica que o valor de R$ 1700 est localizado 1,5
desvio padro abaixo da mdia de R$ 2000.
5.5 reas Abaixo da Curva Normal
Cerca de 68 % da rea sob a curva normal est entre menos um e mais um
desvio padro da mdia. Isto pode ser escrito como
1 t
.
130
Cerca de 95 % da rea sob a curva normal est entre menos dois e mais
dois desvios padres da mdia, escrito como
2 t
.
Praticamente toda (99,74 %) a rea sob a curva normal est entre menos
trs e mais trs desvios padres da mdia, escrito como
3 t
.
Exemplo 2:
O uso dirio de gua por pessoa em uma determinada cidade normalmente
distribudo com mdia

igual a 20 litros e desvio padro

igual a 5 litros. O
uso dirio de cerca de 68 % das pessoas nesta cidade caem entre que valores?

(5) 1 20 1 t t
. Ou seja, cerca de 68 % das pessoas usam de 15 a
25 litros de gua por dia.
Similarmente, para 95 % e 99 %, os intervalos sero de 10 a 30 litros e 5 a
35 litros.
131
Qual a probabilidade de que uma pessoa selecionada ao acaso usar menos
do que 20 litros por dia ?
O valor de Z Z = (20 20) / 5 = 0. Portanto P(X < 20) = P(Z < 0) = 0,5.
Qual a probabilidade de que uma pessoa selecionada ao acaso use mais do
que 20 litros por dia ?
O valor de Z Z = (20 20) / 5 = 0. Portanto P(X > 20) = P(Z > 0) = 0,5.
Que percentagem da populao usa entre 20 e 24 litros por dia ?
X = 20 Z = 0
X = 24 8 , 0
5
20 24

Z
P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).
Que percentagem usa entre 16 e 20 litros ?
X = 16 8 , 0
5
20 16

Z
X = 20 Z = 0
P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P(0 < Z < 0,8) = 0,2881 = 28,81

Para a obteno das probabilidades para a curva normal padro Z consulta-se
uma tabela que pode ser encontrada em anexo em praticamente todos os livros
de estatstica. Reproduziremos a seguir integralmente essa tabela (para que
possa ser mostrado para os exemplos anteriores como foram obtidas as reas
(que so probabilidades) abaixo da curva norma Z. Resolvemos colocar a tabela
no corpo do texto devido a sua grande importncia em estatstica aplicada ( e
132
achamos que ela no deve ser relegada a um anexo que poucos alunos tem a
curiosidade de consultar).
Tabela 1 Valor de P(0 < Z < Z0) onde Z varivel normal padro
Z0 Segunda decimal de Z0
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1
0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2
0,0793 0,0832 0,0871 0,1103 0,1141
0,3
0,1179 0,1217 0,1255 0,1480 0,1517
0,4
0,1554 0,1591 0,1628 0,1844 0,1879
0,5
0,1915 0,1950 0,1985 0,2190 0,2224
0,6
0,2257 0,2291 0,2324 0,2517 0,2549
0,7
0,2580 0,2611 0,2642 0,2823 0,2852
0,8
0,2881 0,2910 0,2939 0,3106 0,3133
0,9
0,3159 0,3186 0,3212 0,3365 0,3389
1,0
0,3413 0,3438 0,3461 0,3599 0,3621
1,1
0,3643 0,3665 0,3686 0,3810 0,3830
1,2
0,3849 0,3869 0,3888 0,3997 0,4015
1,3
0,4032 0,4049 0,4066 0,4162 0,4177
1,4
0,4192 0,4207 0,4222 0,4306 0,4319
1,5
0,4332 0,4345 0,4357 0,4429 0,4441
1,6
0,4452 0,4463 0,4474 0,4535 0,4545
1,7
0,4554 0,4564 0,4573 0,4625 0,4633
1,8
0,4641 0,4649 0,4658 0,4699 0,4706
1,9
0,4713 0,4719 0,4726 0,4761 0,4767
133
2,0
0,4772 0,4778 0,4783 0,4812 0,4817
2,1
0,4821 0,4826 0,4830 0,4854 0,4857
2,2
0,4861 0,4864 0,4868 0,4887 0,4890
2,3
0,4893 0,4896 0,4898 0,4913 0,4916
2,4
0,4918 0,4920 0,4922 0,4934 0,4936
2,5
0,4938 0,4940 0,4941 0,4951 0,4952
2,6
0,4953 0,4955 0,4956 0,4963 0,4964
2,7
0,4965 0,4966 0,4967 0,4973 0,4974
2,8
0,4974 0,4975 0,4976 0,4980 0,4981
2,9
0,4981 0,4982 0,4982 0,4986 0,4986
3,0
0,4987 0,4987 0,4987 0,4990 0,4990
134
135

Qual a probabilidade de que uma pessoa selecionada ao acaso use mias do que 28
litros ?
X = 28 Z = (28 20 )/ 5 = 1,6
P( X > 28) = P (Z > 1,6) = 0,5 - 0,4452 = 0,0548
136
Qual a porcentagem entre 18 e 26 litros ?
X = 18 4 , 0
5
20 18

Z
X = 26 2 , 1
5
20 26

Z
P(18 < X < 26) = P(-0,4 < Z < 1,2) = 0,1554 + 0,3849 = 0,5403
Quantos litros ou mais 10 % da populao usam ? Em outras palavras,para
os 10 % da populao que mais consomem gua qual o valor mnimo desse
consumo ?
Seja X a quantidade mnima. Portanto, precisamos encontrar X tal que
1 , 0 ) ' ( X X P
. Para achar o valor de Z correspondente veja no corpo (miolo)
da tabela o valor de Z0 que deixa uma rea entre 0 e Z0 igual a (0,5 0,1) = 0,4.
O valor correspondente de Z0 1,28 (aproximadamente). Portanto, temos:
137
28 , 1
5
20 '

X
X = 26,4. Ou seja, 10 % da populao usa no mnimo 26,4
litros por dia (ver figura).
Exemplo 4
Um professor verificou que as mdias finais em seu curso de Estatstica tem
distribuio normal com uma mdia igual a 72 e desvio padro 5. Ele decide atribuir
conceitos para o seu curso tal que os melhores 15 % recebem grau A . Qual a
mnima mdia que o estudante precisa receber para obter um A ?
Seja X a mnima mdia.
15 , 0 ) ' ( X X P

O Z correspondente 1,04 (aproximadamente)
77,2 X' 04 , 1
5
72 '

X
138
6. Mtodos de Amostragem e Distribuies
Amostrais
OBJETIVOS DO CAPTULO:
Explicar porque em muitas situaes uma amostra a nica forma plausvel
de aprender alguma coisa sobre uma populao.
Explicar os mtodos de selecionar uma amostra
Distinguir entre amostragem probabilstica e amostragem no probabilstica
Definir e construir uma distribuio amostral de mdias amostrais
Explicar o Teorema do Limite Central e sua importncia para a Inferncia
Estatstica
Calcular Intervalos de Confiana para Mdias e Propores
139
Determinar que tamanho uma amostra deve ter para estimar mdias e
propores
Porque amostrar uma populao
Natureza destrutiva de certos testes
A impossibilidade fsica de checar todos os itens na populao
O custo de estudar todos os itens em uma populao freqentemente
proibitivo
Muitas vezes as estimativas baseadas em uma amostra so mais precisas
do que os resultados obtidos atravs de um levantamento censitrio
Tempo muito elevado para a apurao de resultados em censos
6.1 Amostragem Probabilstica
O que uma amostragem probabilstica ?
uma amostra selecionada de tal forma que cada item ou pessoa na
populao estudada tm uma probabilidade (no nula) conhecida de ser
includa na amostra.
Mtodos de Amostragem Probabilstica:
Amostragem Aleatria Simples (AAS)
Uma amostra escolhida de tal forma que cada item ou pessoa na populao tem
a mesma probabilidade de ser includa.
Se a populao tem um tamanho N, cada pessoa desta populao tem a
mesma probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela
de nmeros aleatrios para sortear (com mesma probabilidade) os elementos
140
da amostra. Tambm pode ser utilizada uma funo randmica: No Excel, por
exemplo, temos a funo ALEATRIO ENTRE.
Amostragem Aleatria Sistemtica
Os itens ou indivduos da populao so ordenados de alguma forma
alfabeticamente ou atravs de algum outro mtodo. Um ponto de partida
aleatrio sorteado, e ento cada k-simo membro da populao selecionado
para a amostra.
Amostragem Aleatria Estratificada
A populao inicialmente dividida em subgrupos (estratos) e uma subamostra
selecionada a partir de cada estrato da populao
Amostragem aleatria Estratificada com Repartio Proporcional
Suponhamos que a populao subdividida em k estratos. Sejam:
N = o nmero de indivduos na populao
n = o nmero de indivduos na amostra
Ni = o nmero de indivduos contidos no i-simo estrato da populao
ni = o nmero de indivduos contidos no i-simo estrato na amostra
k 1,2,...., i
N
N
n n
i
i


os estratos devem ser o mais homogneos possveis com relao s
caractersticas relevantes da pesquisa (variveis que se correlacionam
fortemente com a varivel estudada) para um mesmo tamanho amostral, a
amostragem aleatria estratificada com repartio proporcional mais precisa
(menor varincia do estimador) do que a amostragem aleatria simples (AAS).
Amostragem Aleatria Estratificada com Repartio de Neyman (ou
repartio tima)
141
Se conhecermos a varincia de cada estrato populacional referente a varivel
que estamos desejando estimar o seu parmetro, um mtodo mais adequado
o da repartio de Neyman.



k
i
i i
i i
k
i
i i
i i
N
N
n
W
w
n n
i
1 1

para um mesmo tamanho amostral a preciso maior para amostra aleatria


estratificada com repartio de Neyman (repartio tima) do que para a
amostra aleatria estratificada com repartio proporcional que por sua vez
maior do que a amostra aleatria simples
Amostragem por Conglomerados
A populao inicialmente subdividida inicialmente em subgrupos (estratos) e
uma amostra de estratos selecionada (por exemplo, com probabilidade
proporcional ao tamanho de cada estrato). A seguir, amostras so selecionadas
dos estratos selecionados previamente.
A principal vantagem da amostra por conglomerados a de possibilitar
considervel reduo de custos (em relao por exemplo a uma amostragem
aleatria estratificada) para um mesmo tamanho amostral.
O mtodo costuma ser empregado quando no dispomos de um cadastro da
populao (como no caso da amostragem sistemtica) e os custos de ser
elaborado um cadastro para toda a populao muito elevado.
Erro amostral: A diferena entre a estatstica amostral e seu correspondente
parmetro.
Uma distribuio de probabilidade consiste de uma lista de todos os
possveis valores das mdias amostrais de um dado tamanho amostral
constante selecionado da populao e a probabilidade de ocorrncia
associada a cada mdia amostral.
Exemplo 1 Uma empresa tem 5 scios. Semanalmente, os scios relatam
o nmero de horas de atendimento a clientes
Scio Horas
1 22
2 26
3 30
4 26
142
5 22

Dois scios so selecionados aleatoriamente. Quantas amostras distintas
so possveis?
O nmero de amostras distintas de dois elementos tomados em 5 objetos
corresponde a:
10
) ! 3 )( ! 2 (
! 5
2 5
C
Scios Total Mdia
1,2 48 24
1,3 52 26
1,4 48 24
1,5 44 22
2,3 56 28
2,4 52 26
2,5 48 24
3,4 56 28
3,5 52 26
4,5 48 24
Organize as mdias amostrais em uma distribuio de freqncias.
Mdia
Amostral
freqncia Freqncia
Relativa
(Probabilidade)
22 1 1/10
24 4 4/10
26 3 3/10
28 2 2/10
Calcule a mdia das mdias amostrais e compare-a com a mdia da
populao.
A mdia da populao :
2 , 25
5
22 26 30 26 22

+ + + +

A mdia das mdias amostrais :
2 , 25
10
) 2 )( 28 ( ) 3 )( 26 ( ) 4 )( 24 ( ) 1 )( 22 (

+ + +
143
Observe que a mdia das mdias amostrais igual a mdia populacional
6.2 Teorema do Limite Central
Para uma populao com mdia

e uma varincia
2
, a distribuio
amostral das mdias de todas as possveis amostras de tamanho n, geradas
a partir da populao, ser aproximadamente normalmente distribuda com
a mdia da distribuio amostral igual

e varincia igual n /
2
-
assumindo que o tamanho amostral suficientemente grande, ou seja,
30 n .
Em outras palavras, se a populao tem qualquer distribuio (no precisa
ser necessariamente normal) com mdia igual a

e varincia igual a
2

, ento a distribuio amostral dos valores mdios amostrais


normalmente distribuda com a mdia das mdias (
X

) igual a mdia da
populao (
X
) e o erro padro das mdias amostrais igual a
n

,
desde que n 30 .
Note que o erro padro das mdias amostrais mostra quo prximo da
mdia da populao a mdia amostral tende a ser.
O erro padro das mdias amostrais calculado por:
n
X
X


X
o smbolo para o erro padro das mdias amostrais
X
o desvio padro da populao
n o tamanho da amostra
Se no conhecido e n 30 (considerada uma amostra grande), o desvio
padro da amostra, designado por s, usado para aproximar o desvio padro
da populao, . A frmula para o erro padro torna-se:
n
s
s
X

onde
1
) (
1
2

n
X X
s
n
i
i
144
6.3 Estimativa de Ponto
Estimativa de ponto um valor (chamado um ponto) que usado para
estimar um parmetro populacional
Exemplos de estimativas de ponto so a mdia amostral, o desvio padro
amostral, a varincia amostral, a proporo populacional, etc.
Exemplo: O nmero de itens defeituosos produzidos por uma mquina foi
registrado em cinco horas selecionadas aleatoriamente durante uma semana de
trabalho de 40 horas. O nmero observado de defeituosos foi 12,4,7,14 e 10.
Portanto, a mdia amostral 9,4. Assim a estimativa de ponto para a mdia
semanal do nmero de defeituosos 9,4.
6.4 Estimativa de Intervalo
Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da
qual um parmetro populacional provavelmente cai.
O intervalo dentro do qual um parmetro populacional esperado ocorrer
chamado de intervalo de confiana.
Os intervalos de confiana que so extensivamente usados so os de 95
% e 99 %.
Um intervalo de confiana de 95 % significa que cerca de 95 % dos
intervalos construdos similarmente contero o parmetro que est sendo
estimado.
Outra interpretao do intervalo de confiana de 95 % que 95 % das
mdias amostrais para um tamanho de amostra especificado cairo a uma
distncia mxima de 1,96 desvios padres da mdia populacional.
Para o intervalo de confiana de 99 %, 99 % das mdias amostrais para um
tamanho amostral especificado cairo a uma distncia mxima de 2,58
desvios padres da mdia populacional.
Os intervalos de confiana para 95 % e 99 % so construdos como segue, para
n 30:
O IC de 95 % para a mdia populacional

dado por:
n
s
X 96 , 1 t
O IC de 99 % para a mdia populacional

dado por:
n
s
X 58 , 2 t
Em geral, um intervalo de confiana para a mdia, calculado por:
n
s
Z X t
onde Z obtido da tabela de distribuio normal padro.
145
Exemplo 2
Uma universidade quer estimar o nmero mdio de horas trabalhadas por
semana por seus estudantes. Uma amostra de 49 estudantes mostrou uma
mdia de 24 horas com um desvio padro de 4 horas.
A estimativa de ponto do nmero mdio de horas trabalhadas por semana 24
horas (mdia amostral).
Qual o intervalo de confiana de 95 % para o nmero mdio de horas
trabalhadas por semana ?
Usando a frmula anterior (
n
s
X 96 , 1 t ) temos
49
4
96 , 1 24 t ou 22,88 a
25,12. O limite de confiana inferior 22,88. O limite superior de confiana
25,12. O grau de confiana (nvel de confiana) utilizado 0,95.
Interprete os resultados
Se ns tivssemos tempo para selecionar aleatoriamente 100 amostras
de tamanho 49 da populao de alunos do campus e calcular as mdias
amostrais e os intervalos de confiana para cada uma destas 100 amostras,
a mdia populacional (parmetro) do nmero de horas trabalhadas estaria
contida em cerca de 95 dos 100 intervalos de confiana. Cerca de 5 dos
100 intervalos de confiana no conteriam a mdia populacional.
6.5 Intervalo de Confiana para Uma Proporo Populacional
Um intervalo de confiana para uma proporo populacional dado por:
p
Z t p
onde:
p
a proporo amostral
p

o erro padro da proporo amostral e dado por:


n
p p
p
) 1 (

O intervalo de confiana construdo por:
146
n
p p
p
) 1 (
Z

t
onde:
p
a proporo amostral
Z o valor da varivel normal padro para o grau de confiana adotado.
n o tamanho amostral
Exemplo 3
Um planejador financeiro est estudando os planos de mudana de jovens
executivos. Uma amostra de 500 jovens executivos que possuem suas prprias
casas revelou que 175 planejam vend-las e retirarem-se para o interior do
Pas. Construa um intervalo de confiana de 98 % para o parmetro proporo
populacional de executivos que planejam mudar para o interior.
Aqui n = 500, 35 , 0
500
175
p
e Z = 2,33 (para
adotado confiana de nvel 98 , 0
)
O CI de 98 % 0,0497 0,35 ou
500
) 65 , 0 ( ) 35 , 0 (
33 , 2 35 , 0 t

t
Interprete a resposta
6.6 Fator de Correo de Populao Finita
Uma populao que tem um limite superior definido chamada de finita. Em
estatstica, considera-se como populao finita quando 05 , 0 >
N
n
(ou seja,
quando a frao amostral maior do que 5 %).
Para uma populao finita, onde o nmero total de objetos N e o tamanho
da amostra n, o seguinte ajuste feito para os erros padres da mdia
amostral e da proporo amostral.
Erro padro da mdia amostral:
1

N
n N
n
X

Erro padro da proporo amostral:


1
) 1 (

N
n N
n
p p
p

Este ajuste chamado de Fator de Correo de Populao Finita (FCPF)


147
Nota: se 05 , 0
N
n
, o fator de correo de populao finita ignorado.
Exemplo 4
A universidade do exemplo 2 quer estimar o nmero mdio de horas
trabalhadas por semana pelos estudantes. Uma amostra de 49 estudantes
mostrou uma mdia de 24 horas e um desvio padro de 4 horas. Construa um
intervalo de confiana para o nmero mdio de horas trabalhadas se h
somente 500 estudantes no campus.
Agora 05 , 0 098 , 0
500
49
>
N
n
. Portanto, temos que usar o FCPF
[ ] 25,11 ; 93 , 22
1 500
49 500
49
4
96 , 1 24

t
6.7 Selecionando uma Amostra
H 3 fatores que determinam o tamanho de uma amostra, nenhum dos quais
tendo uma relao direta com o tamanho da populao. Eles so:
1. O grau de confiana adotado
2. O mximo erro permissvel
3. A variabilidade da populao
Uma frmula de clculo conveniente para determinar o tamanho amostral n :
2

,
_

E
Zs
n
onde:
E o erro permissvel
Z o valor da varivel normal padro associado ao grau de confiana adotado
s o desvio padro da amostra piloto
Exemplo 5
Um grupo de consumidores deseja estimar a mdia de gasto mensal em
eletricidade para um domiclio familiar simples em Julho. Baseado em estudos
similares o desvio padro estimado como sendo R$ 20,00. Deseja-se construir
um intervalo de confiana de 99 % com um erro mximo admissvel de
00 , 5 $ R t . Qual deve ser o tamanho da amostra?
148
( ) ( )
107 50 , 106
5
20 58 , 2
2

,
_


n

6.8 Tamanho Amostral para Estimativa de Propores
A frmula para determinar o tamanho amostral no caso de estimativa de
propores :
2
) 1 (

,
_


E
Z
p p n onde
p
a proporo estimada, baseada na experincia passada ou em uma
amostra piloto
Z o valor da varivel normal padro associado ao grau de confiana adotado.
E o mximo erro permissvel que o pesquisador tolera.
Exemplo 6
Um clube deseja estimar a proporo de crianas que tem um cachorro.
Se o clube deseja que a estimativa esteja no mximo afastada 3 % da
proporo populacional, quantas crianas devem conter a amostra?
Assuma um intervalo de confiana de 95 % e que o clube estimou, com
base em experincia anterior, que aproximadamente 30 % das crianas
tm um cachorro.
( )( ) 893 4 , 893
03 , 0
96 , 1
70 , 0 30 , 0
2

,
_

n
7. Teste de Hipteses Amostras Grandes
OBJETIVOS:
149
Definir hipteses e Testes de Hipteses
Descrever os 5 passos do procedimento de Teste de Hipteses
Distinguir entre Teste de Hipteses Unicaudal e Bicaudal
Realizar um teste para a mdia populacional
Realizar um teste para a diferena entre duas mdias ou propores
populacionais
Descrever os erros estatsticos associados aos testes de hipteses
Nota:
Se nada conhecido acerca da populao, a estimao usada para
fornecer uma estimativa de ponto e de intervalo acerca da populao.
Se alguma informao acerca da populao proposta ou suspeitada, o
Teste de Hipteses usado para determinar a plausibilidade desta
informao.
O que uma hiptese ?
Hiptese: uma sentena sobre o valor de um parmetro populacional
desenvolvida para o propsito de teste.
Exemplos de hipteses, ou sentenas, feitas acerca de um parmetro
populacional so:
A renda mdia mensal proveniente de todas as fontes para os analistas de
sistemas de US 3625
Vinte por cento de todos os transgressores juvenis so presos e
sentenciados a priso.
O que um Teste de Hipteses ?
Teste de Hipteses: um procedimento, baseado na evidncia amostral e na
teoria da probabilidade, usado para determinar se a hiptese uma
afirmao razovel e no seria rejeitada, ou no razovel e seria rejeitada.
A seguir so propostos 5 passos para um teste de hipteses:
Passo 1: Estabelea a Hiptese Nula e a Hiptese Alternativa
Passo 2: Selecione um nvel de significncia
Passo 3: Identifique a Estatstica de teste
Passo 4: Formule uma regra de deciso
Passo 5: Tome uma amostra e obtenha uma deciso: No rejeitar H0 ou
rejeitar H0 e aceitar H1
150
Hiptese Nula H0: Uma afirmao (sentena) sobre o valor de um parmetro
populacional
Hiptese Alternativa H1: Uma afirmao (sentena) que aceita se os dados
amostrais fornecem evidncia de que a hiptese nula falsa.
Nvel de Significncia: A probabilidade de rejeitar a hiptese nula quando ela
efetivamente verdadeira, ou seja, valor de (alfa)
Erro Tipo I: Rejeitar a Hiptese Nula, H0, quando ela efetivamente
verdadeira. A probabilidade do erro tipo I igual ao nvel de significncia,
(alfa).
Erro Tipo II: Aceitar a Hiptese Nula, H0, quando efetivamente falsa. A
probabilidade do erro tipo II igual a

(beta)
Tipos de Erros
Aceita H0 Rejeita H0
H0 verdadeira Deciso Correta Erro Tipo I
H0 falsa Erro Tipo II Deciso Correta
Alfa = erro tipo I Beta = erro tipo II
Estatstica de Teste (ou z efetivo ou valor de t): Um valor, determinado a partir
da informao amostral, usado para determinar se devemos ou no rejeitar a
hiptese nula.
Valor Crtico (ou z crtico ou valor de t): O ponto divisor entre a regio
onde a hiptese nula rejeitada e a regio onde ela no rejeitada. Este
valor obtido a partir da tabela de z (normal padro) ou da tabela de t (t de
Student).
7.1 Testes de Significncia Unicaudais
Um teste unicaudal quando a hiptese alternativa, H1, estabelece uma
direo tal como:
151
H0: A renda mdia das mulheres menor que ou igual a renda mdia dos
homens.
H1: A renda mdia das mulheres maior que a renda mdia dos homens.
A regio de rejeio neste caso a cauda direita (superior) da curva.
Figura com distribuio normal mostrando a regio de rejeio para um teste
unicaudal
7.2 Testes de Significncia Bicaudais
Um teste bicaudal quando no existe uma direo especificada para a
hiptese alternativa H1, tal com:
H0: A renda mdia das mulheres igual a renda mdia dos homens.
H1: A renda mdia das mulheres no igual a renda mdia dos homens.
A regio de rejeio neste caso dividida igualmente em duas caudas da
curva.
Figura com distribuio normal mostrando a regio de rejeio para um teste
bicaudal
(distribuio amostral para a estatstica z para um teste bicaudal, 0.05 de nvel
de significncia
Testando a Mdia Populacional: Amostra Grande, Desvio Padro da Populao
conhecido.
Neste caso a estatstica de teste (z efetivo) dado por:
152
n
X
z

Exemplo 1
Os processadores de uma indstria indicam o ponto (marca) que a garrafa
contem 16 onas (medida inglesa de peso) do produto. O Departamento de
Controle de Qualidade responsvel pelo controle da quantidade includa na
garrafa. Uma amostra de 36 garrafas selecionada por hora e o seu
contedo pesado. Na ltima hora uma amostra de 36 garrafas apresentou
um peso mdio de 16,12 onas com um desvio padro de 0,5 onas.
Ao nvel de significncia de 0,05 podemos concluir que o processo est fora
de controle?
Passo 1: Estabelecer a Hiptese Nula e a Hiptese Alternativa:
16 : H 16 :
1 0
H
Passo 2: Estabelecer a regra de deciso:
H0 rejeitado se o z (efetivo calculado com base nos valores amostrais) <
-1,96 ou z > 1,96.
Passo 3: calcule o valor da estatstica de teste ( z efetivo)
44 , 1
]
36
5 , 0
[
] 16 12 , 16 [

z
Passo 4: Qual a deciso sobre H0?
H0 no rejeitada, porque 1,44 menor que o valor crtico de 1,96.
7.3 P-value de um Teste de Hiptese
153
P-value: Esta a probabilidade (considerando que a hiptese nula
verdadeira) de ter um valor para a estatstica de teste no mnimo to extremo
como o valor calculado (efetivo) para o teste.
Se o p-value menor que o nvel de significncia (alfa), H0 rejeitada.
Se o p-value maior que o nvel de siginificncia (alfa), H0 no
rejeitada.
7.4 Clculo do P-value
Teste Unicaudal (para a direita ou cauda superior):
p-value = P{z valor da estatstica de teste calculada}
Teste Unicaudal (para a esquerda ou cauda inferior):
p-value = P{z valor da estatstica de teste calculada}
Teste Estatstico Bicaudal
p-value = 2P{z valor absoluto do valor da estatstica de teste calculado}
Para o exemplo anterior, z = 1,44, e desde que era um teste bicaudal, ento o
p-value =
1498 , 0 ) 4251 , 0 5 , 0 ( 2 } 44 , 1 { 2 z P
. Desde que 0,1498 > 0,05, no
rejeitada H0.
Testando para a Mdia Populacional: Grandes Amostras, Desvio Padro
Populacional desconhecido
Aqui

desconhecido, portanto o estimamos com o desvio padro


amostral s.
Quanto maior for o tamanho amostral for n 30, o z efetivo pode ser
aproximado com
n
s
X
z

154
Exemplo 2
A cadeia de Lojas Arjo emite o seu prprio carto de crdito. O administrador
de crdito quer verificar se o saldo no pago mensal maior do que US$
400. O nvel de significncia fixado em 0,05. Uma amostra aleatria de 172
saldos no pagos revelou uma mdia amostral de US$ 407 e o desvio
padro amostral de US$ 38. O admistrador de crdito pode concluir que a
mdia populacional maior que US$ 400, ou razovel assumir que a
diferena de US$ 7 (US$ 407 US$ 400 devido a chance (variao
aleatria)?
Etapa 1: Estabelea a Hiptese Nula e a Hiptese Alternativa.
400 : H 400 :
1 0
> H
Etapa 2: Estabelea a regra de deciso.
H0 rejeitada se o z (efetivo) > 1,645.
Etapa 3: Calcule o valor da estatstica de teste.
42 , 2
172
38
400 407

z
Etapa 4: Qual a deciso sobre H0?
H0 rejeitada. O administrador conclui que a mdia dos saldos no pagos
maior do que US$ 400.
Figura ilustrando a regio de rejeio do exemplo
7.5 Teste de Hipteses: Duas Mdias Populacionais
Assuma que os parmetros para duas populaes so:
2 1 2 1
e , , .
Caso I: Quando
2 1
, so conhecidos, a estatstica de teste (Z efetivo) :
155
2
2
2
1
2
1
2 1
n n
X X
z

+

Caso II: Quando


2 1
, no so conhecidos mas os tamanhos amostrais n1
e n2 so maiores ou iguais a 30, a estatstica de teste (Z efetivo) :
2
2
2
1
2
1
2 1
n
s
n
s
X X
z
+

Exemplo 3
Na indstria X foi realizado um estudo para comparar o nmero mdio de
anos de servio para aqueles que se aposentaram em 1975 com aqueles
que se aposentaram no ltimo ano. Os seguintes dados amostrais foram
obtidos. A um nvel de significncia de 0,01 podemos concluir que os
trabalhadores que se aposentaram no ltimo ano tiveram mais anos de
servio?
Caracterstica 1975 ltimo ano
Mdia Amostral 25,6 30,4
Desvio Padro Amostral 2,9 3,6
Tamanho amostral 40 4,5

Estabelea a Hiptese Nula e a Hiptese Alternativa
Considere que a populao 2 aquela dos que se aposentaram no ltimo ano.
1 2 1 1 2 0
: H : > H
Estabelea a regra de deciso
Rejeitar H0 se o z (efetivo) > 2,33.
Calcule o valor da estatstica de teste (valor de z efetivo):
80 , 6
40
9 . 2
45
6 , 3
6 , 25 4 , 30
2 2

+

z
156
Nota : Desde que neste problema estamos testando para:
H0 :
1 2

Precisamos trocar as posies das variveis na equao do z efetivo (a
seguinte equao).
2
2
2
1
2
1
2 1
n
s
n
s
X X
z
+

Z efetivo
Qual a deciso sobre a hiptese nula ? Interprete os resultados?
Desde que o Z efetivo = 6,80 > Z crtico = 2,33, H0 rejeitada. Aqueles que se
aposentaram no ltimo ano tiveram mais anos de servio.
7.6 Testes Referentes a Proporo

Proporo: Uma frao ou porcentagem que indica uma parte da populao
ou amostra que tem um particular trao de interesse.
A proporo amostral denotada por
p
onde:
amostra da
amostra na sucessos de
tamanho
nmero
p
Estatstica de teste para testar uma Proporo Simples de uma Populao
157
n
p p
p p
z
) 1 (

proporo populacional
p proporo amostral
Exemplo 4
No passado, 15 % das solicitaes postais feitas por uma instituio de
caridade resultaram em contribuio financeira. Uma nova carta de
solicitao foi redigida. Esta nova carta elevou a taxa de contribuio? A
nova carta enviada a uma amostra de 200 pessoas e 45 responderam com
uma contribuio.
Ao nvel de significncia de 0,05 pode-se concluir que a nova carta mais
efetiva?
Estabelea a Hiptese Nula e a Hiptese Alternativa:
0,15 p : H 0,15 p :
1 0
> H
Estabelea a regra de deciso
H0 rejeitada se o Z (efetivo) > 1,645.
Calcule o valor da estatstica de teste ( valor do Z efetivo):
97 , 2
200
) 85 , 0 )( 15 , 0 (
15 , 0
200
45

z
Qual a deciso sobre a hiptese nula? Interprete os resultados.
Desde que o z efetivo = 2,97 > z crtico (1,645), H0 rejeitada. A nova carta
mais efetiva.
Um Teste envolvendo a Diferena entre duas Propores Populacionais
158
A Estatstica de teste (Z efetivo) neste caso :
2 1
2 1
) 1 ( ) 1 (
n
p p
n
p p
p p
z
c c c c

+

n1 o tamanho da amostra da populao 1.


n2 o tamanho da amostra da populao 2.
c
p
a mdia ponderada das duas propores amostrais, calculada por:
2 1
2 1
amostras duas das total tamanho
sucessos de total nmero
n n
X X
p
c
+
+

X1 o nmero de sucessos em n1.
X2 o nmero de sucessos em n2.
Exemplo 5
Os trabalhadores solteiros so mais provveis de faltar ao trabalho do que
os trabalhadores casados?
Uma amostra de 250 trabalhadores casados mostrou que 22 faltaram mais do
que 5 dias no ltimo ano por alguma razo. Uma amostra de 300 trabalhadores
solteiros mostrou que 35 faltaram mais do que 5 dias. Use o nvel de
significncia de 0,05.
Estabelea a hiptese nula.
1 2 1 1 2 0
p : H p : p p H >
onde o subscrito 2 refere-se a populao dos trabalhadores solteiros.
Estabelea a regra de deciso.
Rejeitar H0 se z > 1,645.
159
Calcular o valor da estatstica de teste, Z efetivo:
10 , 1
250
) 1036 , 0 1 ( 1036 , 0
300
) 1036 , 0 1 ( 1036 , 0
300
35
250
22
1036 , 0
300 250
35 22

+
+

Z
p
c
Nota: Novamente, trocamos a posio das duas variveis
Qual a deciso referente a hiptese nula?
H0 rejeitada. No h diferena na proporo de ausncias para trabalhadores
casados e solteiros.
Qual o p-value?
p-value = P{z > 1,1} = 0,1357 , ( a hiptese nula no rejeitada).
Exerccios :
(incluem recordao de tpicos anteriores)
1. A Associao Nacional de Educao coleta e publica dados sobre o
nmero de anos de experincia em sala de aula dos professores do curso
secundrio. Uma amostra obtida neste ano de 10 professores de curso
secundrio e foram publicados os seguintes dados sobre o nmero de anos
de experincia.
33 18 21 12 2
18 9 16 15 17

a. Calcule a mdia amostral, X , dos dados.
b. Calcule a amplitude dos dados.
c. Calcule o desvio padro amostral, , s, dos dados.
d. Pelo Teorema de Chebychev, no mnimo _________ % dos dados caem
dentro de dois desvios padres de cada lado da mdia.

2. A seguinte tabela de contingncia fornece uma distribuio de
freqncias conjunta para os votos populares apurados na eleio
160
presidencial de 1984 por regio e por partido poltico. Os dados esto em
milhares, arredondados para o mais prximo milhar.
Democrata Republicano Outros
P1 P2 P3 Total
Nordeste R1 9,056 11,336 101 20,493
Meio Oeste R2 10,511 14,761 169 25,441
Sul R3 10,998 17,699 136 28,833
Oeste R4 7,022 10,659 214 17,895
Total 37,587 54,455 620 92,662

a. Quantos pessoas votaram no partido Republicano?
b. Quantas pessoas no Meio Oeste votaram?
c. Quantas pessoas no Sul votaram no partido Democrata?
d. Determine a probabilidade dos eventos R3 e P2 (simultneos).
e. Calcule Pr(R3 ou P2), usando a tabela de contingncia diretamente
f. Calcule Pr(R3 ou P2), usando a regra geral da adio de probabilidade,
isto , Pr(A ou B) = Pr(A) + Pr(B) - Pr (A e B).
g. Ache Pr(R3 | P2).
h. Calcule Pr(P1) e Pr(P1 | R4).
i. So os eventos P1 e R4 independentes? Explique sua resposta.
So os eventos P1 e R4 mutuamente exclusivos? Explique sua
resposta.

3. Em um levantamento recente, a probabilidade de que um acidente de
carro causado por um motorista embriagado cerca de 0,229. Nos
prximos trs acidentes, qual a probabilidade de que:
a. exatamente um acidente seja causado por um motorista embriagado?
b. No mnimo um acidente seja causado por um motorista embriagado?
c. Se voc6e tem os seguintes resultados de probabilidade de acidentes
causados por motoristas embriagados nos 10 prximos acidentes

pdf (*) Cdf (**)
0 0,0742 0,0742
1 0,2205 0,2947
2 0,2947 0,5893
3 0,2334 0,8227
4 0,1213 0,9440
5 0,0432 0,9873
6 0,0107 0,9980
7 0,0018 0,9998
8 0,0002 1,0000
9 0,0000 1,0000
10 0,0000 1,0000

(*) Pdf = Probability Distribution Function (Funo de Distribuio de
Probabilidade)
(**) Cdf = Cumulative Distribution Function (Funo de Distribuio Cumulativa)
161
1. Ache Pr(x = 3).
2. Ache Pr(5 < x 9).
3. Qual a mdia e a varincia da distribuio tabulada acima?
4. Um dentista tem 5 cadeiras disponveis para pacientes em sua sala de
espera. A distribuio de probabilidade do nmero de cadeiras ocupadas, x,
dada por
x p(x)
0 0,304
1 0,228
2 0,171
3 0,128
4 0,096
5 0,073
a. Ache a mdia

da varivel aleatria x.
b. Calcule o desvio padro,

, da varivel aleatria x.
c. Calcule Pr(2 x 5).
d. Desenvolva (no formato tabular a cdf (Cumulative Distribution Function -
Funo de Distribuio Acumulada) dessa distribuio.

5. Seja X normalmente distribuda com mdia = 100 e desvio padro = 7
(daqui em diante indicaremos tal distribuio como X ~ N(100;7) ).
Determinar:
a. P(X = 80)
b. P(X > 100)
c.
P X ( ) < 95 5
d.
P X ( < 100 10
6. Dado que X uma varivel aleatria normal com mdia = 10 e
P(X > 12) = 0,1587, qual a probabilidade de que X esteja includo no intervalo
(9,11) ?
7. Os pesos de certos produtos em quilogramas so normalmente distribudos
com mdia = 180 e desvio padro
2
= 4. Se uma unidade deste produto
escolhida aleatoriamente, qual o peso desta unidade se a probabilidade de
ocorrncia :
a. De um peso maior igual a 0,10 ?
b. De um peso menor igual a 0,05 ?
162
8. Se W uma varivel aleatria normal e se P(W < 10) = 0,8413 e
P(W < -10) = 0,0668, qual E(W) e V(W) respectivamente ?
9. H dois procedimentos para possibilitar que um determinado tipo de avio
esteja pronto para a decolagem. O procedimento A requer um tempo mdio
de 27 minutos com desvio padro de 5 minutos. Para o procedimento B, =
30 e = 2 minutos, respectivamente. Qual procedimento deve ser utilizado
se o tempo disponvel de 30 minutos? 34 minutos?
10. Suponha que os dividendos anuais de quatro aes sejam respectivamente
$ 2,00, $ 4,00, $ 6,00 e $ 8,00. Deduza a distribuio amostral de X
considerando as seguintes hipteses :
1. tamanho amostral n = 2.
2. mtodo de amostragem: amostragem aleatria simples com reposio
Para a distribuio amostral deduzida de X , verifique por demonstrao que
a. E( X ) =
b. V( X ) =
2
/n
c. Se a amostragem for sem reposio deduza a distribuio de X e
demonstre que E( X ) = e V( X ) =
[ ]

n
N n N

_
,
( ) / ( ) 1
d. Se a amostragem fosse realizada com reposio, qual o valor de V( X
)?
11. Uma populao consta de 4 nmeros: 3, 7, 11 e 15. Considerar todas as
amostras possveis que podem ser retiradas com reposio. Determinar: a) a
mdia populacional; b) o desvio padro da populao; c) a mdia da
distribuio amostral das mdias; d) o desvio padro da distribuio amostral
das mdias. Verificar (c) e (d) diretamente e por meio de (a) e (b) atravs
das frmulas apropriadas.
12. Certas vlvulas fabricadas por uma companhia tm uma vida mdia de 800
horas e desvio padro de 60 horas. Determinar a probabilidade de uma
amostra aleatria de 16 vlvulas, retiradas do grupo, ter a vida mdia: (a)
entre 790 e 810 horas; (b) inferior a 785 horas. Para realizar esses clculos,
o que necessrio supor? Explique a razo de sua afirmativa.
13. De acordo com o exerccio 8. Se for tomada uma amostra de 64 vlvulas,
como ser resolvido? Explicar a diferena.
14. Os pesos de fardos recebidos por um depsito tm mdia de 150 kg e um
desvio padro de 25 kg. Qual a probabilidade de 25 fardos, recebidos ao
acaso e carregados em um elevador, no exceder o limite especfico desse
ltimo , que de 4100 kg ? Neste caso, para a soluo do problema,
necessrio especificar a forma da distribuio estatstica (funo densidade
de probabilidade) dos pesos dos fardos na populao ?
163

15. Questo terica. Demonstre que
s
X X
n
i
i
n
2 1
2

( )
um estimador viesado
para a varincia populacional

2 1
2

( ) X
N
i
i
N
, onde n o tamanho da
amostra e N o tamanho da populao. Calcule o valor do vis. O que
ocorre com esse valor quando n tende ao infinito. (Lembrar que um
estimador

de um parmetro dito no viesado se E[

] =
16. Questo terica
a. Enuncie o Teorema do Limite Central e o interprete da melhor forma possvel
b. O que considerado populao finita (e infinita) para fins estatsticos ?
b. Assinale as condies em que necessrio realizar a correo de
populao finita, justificando a resposta:
quando a populao infinita, no importando se a amostragem feita
com ou sem reposio
quando a populao finita, no importando se a amostragem feita
com ou sem reposio
quando a populao finita e a amostragem feita com reposio
quando a populao finita e a amostragem feita sem reposio
quando a populao infinita e a amostragem feita com reposio
quando a populao infinita e a amostragem feita sem reposio
quando a populao finita ou a amostragem feita com reposio
existem outras alternativas no enumeradas acima
17. Uma funo de probabilidade uma regra de correspondncia ou uma
equao que:
a) Acha o valor mdio da varivel aleatria
b) Atribui valores de x a eventos de um experimento probabilstico
c) Atribui probabilidades para valores de x
d) Define a variabilidade no experimento
e) Nenhuma das anteriores correta
18. Suponha que a varivel aleatria T tenha a seguinte distribuio de
probabilidade:
t | 0 1 2
----------------------
P(T = t) | .5 .3 .2
a. Ache P(T <= 0)
164
b. Ache P(T >= 0 e T < 2)
Calcule E(T), a mdia da varivel aleatria T.
19. Uma centena de estudantes realizou um teste no qual o escore mdio foi de
73 com uma varincia de 64. Um grau A foi dado para quem obteve um
escore de 85 ou mais. Quantos As foram obtidos aproximadamente,
assumindo que os escores So normalmente distribudos? (escolha o mais
prximo)
1. 42
2. 7
3. 58
4. 5
5. 22
20. Se uma distribuio normal tem mdia 200 e desvio padro 20, ache K tal
que a probabilidade de que um valor amostral seja menor do que K 0,975.
a. 239 b. 204 c. 210 d. 215 e. 220
f. 230 g. 239 h. 250
21. Se X a mdia de uma amostra extrada de uma distribuio normal com

= 10,
X
2

= 25 e n = 9, ento P( X > 15) :


(a) 0,001350 (c) 0,98778
(b) 0,998650 (d) 0,15866
22. A distribuio do tempo de vida de certo tipo de lmpada eltrica
normalmente distribuda com mdia de 1000 horas e um desvio padro de
100 horas. Ache o 33

Percentil da distribuio de tempo de vida.



a. 560
b. 330
c. 1044
d. 1440
e. nenhuma das anteriores
23. O valor de Z correspondente ao 52

percentil :
a. 2,06
b, 2,05
c, 1,99
d, 0,48
e, 0,05
24. Pr(Z > +1.96 ou Z < -1.65)
1) 0,025
165
2) 0,05
3) 0,0745
4) 0,0495
5) Nenhuma das anteriores
25. Em uma distribuio normal com mdia 3 e varincia 49, quais so o limite
superior e inferior para os 50 % dos dados centrais?
a. -29,83 e 35,83
b. -1,31 e 7,69
c. -1,69 e 7,69
d. 3,00 e 24,00
e. nenhuma das anteriores
26. Uma amostra aleatria de tamanho 25 escolhida de uma populao com
mdia 7 e varincia 4. A mdia amostral calculada como 8. Qual o valor
da varivel normal padro (z) correspondente a mdia amostral?
a. 25
b. 1,25
c. 1,25
d. +2,5
e. nenhuma das anteriores
27. Suponha que para uma amostra de 36 Auxiliares de Enfermagem de
diversos hospitais similares, uma avaliao de competncia com intervalo
entre 0 e 100 foi obtida a partir de um teste clnico. Suponha que a mdia
populacional da avaliao para todas as Auxiliares de Enfermagem destes
hospitais foi de 80 e a varincia populacional foi de 100. Para uma amostra
de 36 Auxiliares de Enfermagem, qual a probabilidade de que a nota mdia
esteja entre 75 e 80?
a. 0,4987 b. 0,1915 c. 0,5013 d. 0,2287 e. 0,5115
28. Uma companhia fabrica cilindros que tem uma mdia de 2 polegadas de
dimetro. O desvio padro dos dimetros dos cilindros de 10 polegadas.
Os dimetros de uma amostra de 4 cilindros so medidos todas as horas. A
mdia amostral usada para decidir se o processo de fabricao est
operando satisfatoriamente ou no. A seguinte regra de deciso aplicada:
se dimetro mdio da amostra de 4 cilindros maior ou igual a 2,15
polegadas, ou menor ou igual a 1,85 polegadas, interrompe-se o processo.
a. Qual a probabilidade de parar o processo se a mdia do processo


permanece constante no valor de 2,00 polegadas ?
b. Qual a probabilidade de parar o processo se a mdia do processo muda
para

= 2,10 polegadas ?
166
c. Qual a probabilidade do processo continuar operando se a mdia do
processo mudar para

= 2,15 polegadas ?
29. Qual (ou quais) das seguintes sentenas descreve inferncia estatstica ?
a. uma sentena verdadeira sobre uma populao feita atravs de uma
informao amostral de uma populao
b. uma conjectura acerca de uma populao feita a partir da informao contida
em uma amostra daquela populao
c. uma sentena verdadeira acerca de uma amostra feita a partir da informao
contida em uma populao.
30. Para uma certa populao normalmente distribuda, o valor do desvio
padro conhecido, mas o valor da mdia desconhecido. Qual ser o
efeito de mudanas no tamanho amostral e do grau de confiana no
comprimento do intervalo de confiana da estimativa da mdia populacional?
a. Aumentando o tamanho amostral aumenta o comprimento dado um grau de
confiana fixo.
b. Aumentando o grau de confiana reduz o comprimento, dado um tamanho
amostral fixo.
c. Aumentando o tamanho amostral reduz o comprimento, dado um grau de
confiana fixo.
d. Nenhuma das anteriores.
31. A distribuio das mdias de todas as possveis amostras de tamanho (n)
escolhidas de uma populao se aproximar de uma curva normal se
a. n grande o bastante
b. a populao grande
c. a populao simtrica
d. a mdia de cada amostra igual a mdia da populao
e. nenhuma das anteriores correta
32. A distribuio amostral das mdias de amostras aleatrias de tamanho n
extradas de uma populao se aproximar de uma distribuio normal se
a. somente se a populao normalmente distribuda e se n grande
b. somente se a populao normalmente distribuda no importando o valor de
n
c. se n grande no importando a forma da distribuio da populao
d. no importa o valor de n e no importa a forma da distribuio da
populao original
167
33. Em um estudo sobre que relao existente entre uma atitude de criana e a
idade na qual ela fala primeiro, os pesquisadores registraram a idade (em
meses) da primeira fala da criana e o nmero de pontos (escore) obtido
pela criana em um teste sobre a atitude. Seguem-se os dados para 21
crianas:
criana 1 2 3 4 5 6 7 8 9 10 11
Idade 15 2 10 9 15 20 18 11 8 20 7
Escore 95 71 83 91 102 87 93 100 104 94 113
Criana 12 13 14 15 16 17 18 19 20 21
Idade 9 10 11 11 10 12 42 17 11 10
Escore 96 83 84 102 100 105 57 121 86 100
A linha de mnimo quadrado para a predio do scorea partir da idade
da primeira fala :
escore = 110 1,13 * idade ; o valor do coeficiente de correlao
0,640.
a. Que proporo da variabilidade nos escores da atitude explicada
pela reta de mnimos quadrados ?
b. Qual seria a predio de mnimos quadrados para os escore de
uma criana que fala primeiro aos 20 meses ?
c. Calcule o resduo para a criana 6.
d. A partir do diagrama de disperso, qual criana tem o maior (em
valor absoluto) resduo? O que incomum para esta criana?
e. Qual criana tem o menor valor ajustado?
34. Uma amostra no ano de 1989 de 130 mulheres que visitaram um
ginecologista em uma determinada universidade do Noroeste dos EUA
indicou que 113 tiveram experincia sexual.
a. Assumindo que essas mulheres so uma amostra aleatria simples da
populao de todas as mulheres daquela universidade, calcule um
intervalo de confiana para a proporo da populao que
sexualmente ativa.
b. O intervalo seria mais largo, mais estreito ou da mesma largura se
520 mulheres fossem amostradas? (Voc no precisa fazer nenhum
clculo) Explique.
c. O intervalo seria mais largo, mais estreito ou da mesma largura se
resultassem 73 mulheres com experincia sexual 130 mulheres
amostradas? (Voc no precisa fazer nenhum clculo) Explique.
d. Voc acha que razovel assumir que essas mulheres formam uma
amostra aleatria? Explique.
168
35. No execute nenhum clculo para responder o seguinte. Explique seu
raciocnio em cada caso.
a. Tres pesquisadores Alex, Bob e Chuck selecionam de maneira independente
amostras aleatrias da mesma populao. Os tamanhos amostrais so 1000
para Alex, 4000 para Bob e 250 para Chuck. Cada pesquisador constri um
intervalo de confiana de 95 % para a partir de seus dados. A semi-
amplitude dos trs intervalos so 0,015; 0,031 e 0,062. Relacione cada semi-
amplitude com o pesquisador.
b. Cada um dos dois pesquisadores Donna e Eileen selecionam amostras
aleatrias de tamanho 1000 de populaes diferentes e constrem intervalos
de confiana de 95 % para p (a proporo populacional). A semi-amplitude
do intervalo de Donna 0,030 e a de Eileen 0,025. Dado que as
propores amostrais foram
1
p =.20 e
2
p =.40, relacione cada
pesquisadora com a sua proporo amostral.
c. Um pesquisador de nome Fran seleciona 100 indivduos aleatoriamente de
uma populao, observa 50 sucessos e calcula 5 intervalos de confiana. Os
nveis de confiana so 80 %, 90 %, 95 %, 98 % e 99 % e os cinco intervalos
so (0,402 ; 0,598), (0,371 ; 0,629), (0,418 ; 0,582), (0,436 ; 0,564) e (0,384 ;
0,616). Relacione cada intervalo com o seu nvel de confiana.
36. Suponha que 80 % de todos os habitantes da Pensilvnia comam Peru no
Dia de Ao de Graas. Suponha alm disso que voc planeja selecionar
uma amostra aleatria simples (AAS) de 300 habitantes da Pensilvnia
visando determinar a sua proporo que come peru no Dia de Ao de
Graas.
a. 80 % uma parmetro ou uma estatstica? Que smbolo voc deve usar para
represent-lo?
b. De acordo com o Teorema do Limite Central, como a proporo amostral de
quem come peru no Dia de Ao de Graas varia de amostra para
amostra ?
c. Determine a probabilidade de que menos do que 3 quartos da amostra
comam peru no Dia de Ao de Graas.
d. Seria a resposta a (c) menor, maior ou a mesma se o tamanho amostral de
800 fosse usado? (voc no precisa executar o clculo). Explique.
d. Podemos mostrar que nesse contexto
) 80 , 0 ( p P
0.15. Se essa
afirmativa no estiver correta escreva uma verdadeira que a substitua.
Escreva uma ou duas sentenas explicando para um leigo o que essa
afirmativa significa.
169
37. A seguinte tabela lista a temperatura mdia mensal e minha conta de
eletricidade para aquele ms.
ms temp conta ms temp Conta
Abr-91 51 $41.69 Jun-92 66 $40.89
Mai-91 61 $42.64 Jul-92 72 $40.89
Jun-91 74 $36.62 Ago-92 72 $41.39
Jul-91 77 $40.70 Set-92 70 $38.31
Ago-91 78 $38.49 Out-92 * *
Set-91 74 $37.88 Nov-92 45 $43.82
Out-91 59 $35.94 Dez-92 39 $44.41
Nov-91 48 $39.34 Jan-93 35 $46.24
Dez-91 44 $49.66 Fev-93 * *
Jan-92 34 $55.49 Mar-93 30 $50.80
Fev-92 32 $47.81 Abr-93 49 $47.64
Mar-92 41 $44.43 Mai-93 * *
Abr-92 43 $48.87 Jun-93 68 $38.70
Mai-92 57 $39.48 Jul-93 78 $47.47
A linha de mnimos quadrados desenhada no diagrama de disperso; a
equao dessa reta : conta = 55,1 0,214 temp. mdia

a. Estime o valor do coeficiente de correlao entre a conta de
eletricidade e a temperatura mdia.
b. Qual a predio de mnimos quadrados para a conta de energia
eltrica em uma temperatura mdia de 60 graus F?
c. Sem fazer clculos, identifique que ms tem o maior (em valor
absoluto) resduo.
d. Que ms tem o menor valor ajustado?
170