Você está na página 1de 226

CURSO DE ESTATSTICA

APLICADA

Prof. Henrique Dantas Neder


Instituto de Economia Universidade Federal
de Uberlndia.
SUMRIO

1. Introduo ....................................................................................................4
2. Estatstica Descritiva .........................................................................................8
2.1 Tipos de Variveis ...........................................................................................8
2.2 Tabelas e Distribuies de Freqncia .............................................................10
2.3 Histogramas ..................................................................................................12
2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas .......................13
2.5 Medidas de Posio e de Disperso .................................................................16
2.5.1 Uma Nota sobre Notao Estatstica ..........................................................17
2.5.2 A Mdia Aritmtica No Ponderada...........................................................18
2.5.3 A Mdia Aritmtica Ponderada .................................................................19
2.5.4 Propores como Mdias ..........................................................................20
2.5.5 A Mdia Geomtrica ................................................................................21
2.5.6 A Mdia Harmnica .................................................................................25
2.5.7 A Mediana ..............................................................................................25
2.5.8 A Mdia para Dados Agrupados ................................................................27
2.5.9 A Mediana para dados Agrupados .............................................................28
2.5.10 A Moda para dados Agrupados ................................................................30
2.5.11 O Intervalo (ou amplitude) ......................................................................37
2.5.13 Varincia e Desvio Padro ......................................................................39
2.5.14 Varincia e Desvio Padro para Dados Agrupados .....................................42
2.5.15 Interpretando e Aplicando o Desvio Padro ..............................................43
2.5.16 Coeficiente de Variao ..........................................................................45
2.6 Medidas de Assimetria ...................................................................................46
2.7 Curtose: uma medida de achatamento ..............................................................48
3. Probabilidade ..................................................................................................50
3.1 Definio Clssica de Probabilidade ...............................................................51
3.2 Conceito da Freqncia Relativa .....................................................................52
3.3 Probabilidade Subjetiva.................................................................................53
3.4 Algumas Regras Bsicas de Probabilidade .......................................................53
3.5 A Regra do Complemento ..............................................................................55
3.6 A Regra Geral da Adio................................................................................56
3.7 Regras de Multiplicao ................................................................................58
3.8 Probabilidade Condicional..............................................................................60
3.9 Diagramas em rvore ....................................................................................62
3.10 Teorema de Bayes........................................................................................64
Anexo 1 Recordando Definies e Conceitos ......................................................65
Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades ............68
Anexo 3 - Probabilidade Condicional ....................................................................74
Anexo 4 Revisando os conceitos ........................................................................77
Resumo do Clculo de Probabilidades...................................................................96
Exerccios de Probabilidade .................................................................................97
4. Variveis Aleatrias Discretas.......................................................................114

2
4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta .......118
4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta ..119
4.3 A Distribuio de Probabilidade Binomial .....................................................121
4.4 A Mdia e Varincia De Uma Distribuio Binomial ......................................125
Apndice 1 (Recordao) ...................................................................................126
Apendice 2 (Recordao) ...................................................................................127
Apndice 3 (Recordao) ...................................................................................128
Apndice 4 (Recordao) Valor Esperado e Varincia de uma Varivel Aleatria ....132
Variveis Aleatrias Independentes.....................................................................140
Apndice 4 (recordao) ....................................................................................141
5. Variveis Aleatrias Contnuas e Distribuio Normal .........................................144
5.1 Variveis Aleatrias Contnuas .....................................................................144
5.2 Mdia e Varincia de uma Varivel Aleatria Contnua ...................................146
5.3 Varivel Aleatria Normal............................................................................165
5.4 Distribuio Normal Padro..........................................................................167
5.5 reas Abaixo da Curva Normal ....................................................................168
6. Mtodos de Amostragem e Distribuies Amostrais ............................................175
6.1 Amostragem Probabilstica ...........................................................................180
6.2 Teorema do Limite Central ...........................................................................184
6.3 Estimativa de Ponto .....................................................................................186
6.4 Estimativa de Intervalo.................................................................................186
6.5 Intervalo de Confiana para Uma Proporo Populacional ...............................188
6.6 Fator de Correo de Populao Finita ...........................................................189
6.7 Selecionando uma Amostra ..........................................................................190
6.8 Tamanho Amostral para Estimativa de Propores ..........................................191
7. Teste de Hipteses Amostras Grandes .....................................................192
7.1 Testes de Significncia Unicaudais ................................................................194
7.2 Testes de Significncia Bicaudais ..................................................................194
7.3 P-value de um Teste de Hiptese ...................................................................196
7.4 Clculo do p-value.......................................................................................196
7.5 Teste de Hipteses: Duas Mdias Populacionais .............................................198
7.6 Testes Referentes Proporo.......................................................................201
EXERCCIOS : ................................................................................................204

3
1.Introduo

A Significncia e a Abrangncia da Estatstica


Porque a estatstica importante?

Os mtodos estatsticos so usados hoje em quase todos os campos de investigao


cientfica, j que eles capacitam-nos a responder a um vasto nmero de questes, tais
como as listadas abaixo:

1) Como os cientistas avaliam a validade de novas teorias?


2) Como os pesquisadores mdicos testam a eficincia de novas drogas ?
3) Como os demgrafos prevem o tamanho da populao do mundo em qualquer tempo
futuro?
4) Como pode um economista verificar se a mudana atual no ndice de Preos ao
Consumidor a continuao de uma tendncia secular, ou simplesmente um desvio
aleatrio?
5) Como possvel para algum predizer o resultado de uma eleio entrevistando apenas
algumas centenas de eleitores ?
Estes so poucos exemplos nos quais a aplicao da estatstica necessria. Podemos
presumir que a matemtica uma das rainhas das cincias porque ela fornece a estrutura
terica para quase todas as outras cincias. Se voc j fez um curso bsico de fsica, j
est familiarizado com algumas das leis matemticas que governam temas to
diversificados como gravidade, energia, luz, eletricidade, etc. Mas tambm devemos
considerar o fato de que as teorias matemticas esto sendo desenvolvidas todos os dias
em muitas reas por estatsticos tericos - pessoas treinadas em teoria estatstica e
probabilidade. Para citar alguns poucos casos ilustrativos elas so desenvolvidas para
teoria dos vos espaciais em fsica; para teorias do conhecimento do comportamento
animal e humano em psicologia; para teorias da migrao e dos diferenciais de raa em
sociologia; para teorias de epidemias em sade pblica;...

4
De fato, a estatstica tornou-se uma ferramenta cotidiana para todos os tipos de
profissionais que entram em contato com dados quantitativos ou tiram concluses a partir
destes.

O que Estatstica?

A noo de Estatstica foi originalmente derivada da mesma raiz da palavra Estado,


j que foi a funo tradicional de governos centrais no sentido de armazenar registros da
populao, nascimentos e mortes, produo das lavouras, taxas e muitas outras espcies
de informao e atividades. A contagem e mensurao dessas quantidades gera todos os
tipos de dados numricos que so teis para o desenvolvimento de muitos tipos de
funes governamentais e formulao de polticas pblicas.
Dados numricos so de fato uma parte da Estatstica, mas so apenas a matria-prima,
que precisa ser transformada pelos mtodos estatsticos para posterior anlise. A
Estatstica, como um mtodo cientfico, refere-se ao projeto de experimentos e a
descrio e interpretao de observaes que so feitas. De um ponto de vista moderno, a
Estatstica freqentemente definida como um mtodo de tomada de deciso em face da
aleatoriedade dos fenmenos. Em uma mais vasta perspectiva, o escopo da estatstica
pode ser pensado em termos de trs reas diferentes de estudos: (1) a Estatstica
Descritiva (2) A Estatstica Indutiva e (3) A Teoria da Deciso Estatstica.

Estatstica Descritiva

A estatstica Descritiva refere-se ao corpo de mtodos desenvolvidos para coletar,


organizar, apresentar e descrever dados numricos. Essa rea da Estatstica refere-se s
seguintes tarefas:

1) Encontrar um mtodo apropriado de coletar dados numricos eficientemente e


acuradamente para um dado problema.
2) Determinar um formato eficiente, tal como uma apresentao tabular, para a
organizao dos dados de uma forma sistemtica e ordenada, de maneira que a

5
informao fornecida pelos dados possa ser observada com grande facilidade e
preciso.
3) Apresentar dados numricos, seja organizados ou no, de forma que as caractersticas e
o comportamento dos dados so clara e facilmente revelados. Tais apresentaes So
feitas por meio de mtodos grficos.
4) Sumarizar ou descrever cada caracterstica ou propriedade dos dados por um simples
nmero, tal como uma mdia, uma porcentagem ou alguma outra medida apropriada, a
qual calculada a partir dos dados por meio de uma frmula derivada a partir de algum
princpio vlido.

Estatstica Indutiva
A Estatstica Indutiva, que tambm freqentemente chamada de inferncia estatstica ou
estatstica inferencial, em contraste com a estatstica descritiva, essencialmente analtica
em sua natureza. Consiste de um conjunto de princpios ou teoremas que nos permitem
generalizar acerca de alguma caracterstica de uma populao a partir das caractersticas
observadas de uma amostra. Nessa definio, uma populao o conjunto de todos os
itens, objetos, coisas ou pessoas a respeito das quais a informao desejada para a
soluo de um problema. Uma amostra um grupo de itens selecionados por um mtodo
cuidadosamente concebido e projetado a partir de uma populao. Existem diferentes
tipos de amostras, dependendo dos diferentes mtodos de seleo disponveis. Uma
amostra aleatria simples, falando em termos simplificados, aquela que selecionada de
tal forma que cada e todos os itens na populao tm a mesma chance de serem includos
na amostra.
Se uma medida descritiva calculada a partir dos dados da populao ela chamada de
parmetro populacional, ou simplesmente parmetro; se calculada a partir dos dados
da amostra ela chamada de estatstica amostral, ou simplesmente estatstica.
Considerando esses conceitos podemos definir estatstica indutiva como o processo de
generalizar acerca de do valor de um parmetro a partir do valor de uma estatstica.
Existem dois procedimentos de inferncia distintos mas relacionados: estimao e teste
de hipteses. Estimao processo de usar o valor de uma estatstica amostral para

6
estimar o valor de um parmetro que desconhecido, mas uma constante. Como um
exemplo, suponhamos que temos uma populao de 100.000 bolas de gude em um saco,
todas as quais so idnticas exceto pela cor, e que no podemos v-las embora saibamos
que uma parte delas so brancas e o restante so pretas. Suponha que desejamos ter uma
idia da proporo de, digamos, bolas brancas nessa populao. Suponha que para
conseguir isso selecionamos 1.000 bolas aleatoriamente do saco e verificamos que 350
so brancas. Isso significa que nossa proporo amostral de bolas brancas 35 %. A partir
disso conclumos que a proporo populacional de bolas brancas tambm 35 %.
Fazendo isso ns realizamos o que chamado de estatstica pontual.
Mas afirmar que a proporo de bolas brancas em toda a populao exatamente
igual a proporo daquela amostra particular como dar um tiro no escuro: o valor da
proporo amostral um resultado aleatrio e depende de cada amostra de 1.000 bolas
escolhida da populao. Pode ser que por uma enorme casualidade o resultado daquela
amostra que escolhemos coincida exatamente com o valor da proporo de bolas brancas
em toda a populao. Mas as chances de que isso no ocorra so muito grandes. Uma
forma de contornarmos esse problema afirmarmos que as chances so de 95 em 100 (ou
de 95 %) de que o intervalo formado pela proporo amostral acrescida e diminuda de 3
pontos percentuais contenha o verdadeiro valor da proporo populacional desconhecido.
Ou seja, construmos um intervalo com limites 35 + 0,03 x 35 = 36,05 e 35 - 0,03 x 35 =
33,95 e afirmamos (com base em algum princpio obtido a partir da teoria estatstica) que
as chances so de 95 em 100 de que o verdadeiro valor da proporo populacional esteja
localizado dentro desse intervalo. Quando uma afirmativa dessa natureza feita estamos
realizando o que se chama de estimativa por intervalo.
Quanto ao segundo procedimento da estatstica inferencial deixaremos para
coment-lo quando for abordado em sua ntegra. E o terceiro campo de estudos da
Estatstica, a Teoria da Deciso Estatstica no ser discutido nessa apresentao.

7
2. Estatstica Descritiva

2.1 Tipos de Variveis

Existem diversos tipos de variveis que sero utilizadas em um estudo estatstico.


importante compreender o conceito matemtico de varivel. Varivel uma abstrao que
se refere a um determinado aspecto do fenmeno que est sendo estudado. Podemos
afirmar que a quantidade colhida da safra anual de soja uma varivel. Representemos
essa varivel pela letra X. Essa varivel pode assumir diversos valores especficos,
dependendo do anos de safra, por exemplo, X1986, X1990 e X1992. Esses valores que a
varivel assume em determinados anos no so a prpria varivel , mas valores
assumidos ela para determinados objetos ou pessoas da amostra ou da populao. Se uma
amostra tiver 50 indivduos podemos referimo-nos a X como sendo a varivel nota de
estatstica e a X30 como a nota de um indivduo particular, no caso o trigsimo.
freqente tambm na literatura utilizar-se letras maisculas para a notao de variveis
e as correspondentes letras minsculas para referncia aos valores particulares assumidos
por essa varivel mas nesse resumo procuraremos evitar essa forma de notao.

Variveis quantitativas - referem-se a quantidades e podem ser medidas em uma escala


numrica. Exemplos: idade de pessoas, preo de produtos, peso de recm nascidos.

As variveis quantitativas subdividem-se em dois grupos: variveis quantitativas discretas


e variveis quantitativas contnuas. Variveis discretas so aquelas que assumem apenas
determinados valores tais como 0,1,2,3,4,5,6 dando saltos de descontinuidade entre seus
valores. Normalmente referem-se a contagens. Por exemplo: nmero de vendas dirias
em uma empresa, nmero de pessoas por famlia, quantidade de doentes por hospital.1 As

1
Uma varivel quantitativa discreta no precisa assumir necessariamente apenas valores
de contagem, ou seja nmeros inteiros ou nmeros naturais em seqncia. Um exemplo de
varivel quantitativa discreta seria, por exemplo, uma que assumisse apenas os seguintes valores : { 1; 3,5 ;

8
variveis quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua e
no apresentam saltos de descontinuidade. Exemplos dessas variveis so o peso de
pessoas, a renda familiar, o consumo mensal de energia eltrica, o preo de um produto
agrcola.2 As variveis quantitativas contnuas referem-se ao conjunto dos nmeros reais
ou a um de seus subconjuntos contnuos.

Variveis Qualitativas - referem-se a dados no numricos.3 Exemplos dessas variveis


so o sexo das pessoas, a cor, o grau de instruo.
As variveis qualitativas subdividem-se tambm em dois grupos: as variveis qualitativas
ordinais e as variveis qualitativas nominais. As variveis qualitativas ordinais so
aquelas que definem um ordenamento ou uma hierarquia. Exemplos so o grau de
instruo, a classificao de um estudante no curso de estatstica, as posies das 100
empresas mais lucrativas, etc. As variveis qualitativas nominais por sua vez no definem
qualquer ordenamento ou hierarquia. So exemplos destas a cor , o sexo, o local de
nascimento, etc.4
Dependendo da situao uma varivel qualitativa pode ser representada
(codificada) atravs de emprego de nmeros (por exemplo: em sexo representamos
homens como sendo 0 e mulheres como sendo 1). Mas no tratamento estatstico

5,75 ; 10 }. Apesar dessa varivel abranger valores no inteiros ela apresenta saltos de descontinuidade:
nesse exemplo ela no pode assumir nenhum valor intermedirio entre 1 e 3,5 ou entre 5,75 e 10.
2
Seria impossvel obter na prtica uma varivel perfeitamente contnua j que os instrumentos de medida
no tem preciso infinita. Por exemplo., o peso de pessoas medido com uma balana com preciso,
digamos, de dcimos de gramas. Ento jamais conseguiremos obter um valor para essa varivel que se
localize entre 50.000,1 e 50.000,2 gramas, por exemplo, 50.000,15 gramas. Ocorre portanto um salto de
descontinuidade entre os dois valores possveis de serem medidos e a varivel, do ponto de vista terico,
no pode ser considerada como varivel quantitativa contnua, mas varivel quantitativa discreta. Mas do
ponto de vista prtico, acabamos freqentemente por consider-la e trat-la como sendo uma varivel
quantitativa contnua, apesar dessa falta de preciso absoluta. O mesmo podemos dizer para o caso da
renda ou qualquer outra varivel econmica medida em unidades monetria: no existe uma renda de por
exemplo R$ 200,345 j que o centavo a menor diviso do sistema monetrio. Mas de qualquer forma,
costuma-se tratar a renda como varivel quantitativa contnua e no discreta.

3
muito comum considerar-se que a estatstica apenas abrange os estudos que utilizam as variveis
quantitativas. Nada mais equivocado. Existe um vasto campo de aplicaes estatsticas em que so
empregadas as variveis qualitativas, tanto isoladamente como em conjunto com variveis quantitativas.
4
No podemos dizer que a cor X superior a cor Y mas podemos afirmar que o terceiro ano do segundo
grau superior hierarquicamente ao primeiro ano do primeiro grau.

9
dessa varivel codificada no podemos consider-la como sendo quantitativa. Ela
continua sendo uma varivel qualitativa (pois o em sua essncia e natureza) apesar de
sua codificao numrica que tem como finalidade uma maior finalidade de tabulao de
resultados.
No podemos dizer que para qualquer uma destas categorias qualquer mtodo estatstico
pode ser adequadamente aplicado. As variveis quantitativas contnuas so aquelas que
permitem a utilizao de um conjunto maior e superior de mtodos estatsticos e so, sem
dvida, as variveis mais passveis de um rico tratamento estatstico. Em seguida vm,
nessa ordem, as variveis quantitativas discretas, as variveis qualitativas ordinais e por
ltimo, as variveis qualitativas nominais. Essas ltimas so as que permitem a utilizao
de um menor e menos poderoso arsenal de instrumentos estatsticos de anlise.

2.2 Tabelas e Distribuies de Freqncia

A anlise estatstica se inicia quando um conjunto conjunto de dados torna-se disponvel


de acordo com a definio do problema da pesquisa. Um conjunto de dados, seja de uma
populao ou de uma amostra contem muitas vezes um nmero muito grande de valores.
Alm disso, esses valores, na sua forma bruta, encontram-se muito desorganizados. Eles
variam de um valor para outro sem qualquer ordem ou padro. Os dados precisam ento
ser organizados e apresentados em uma forma sistemtica e seqencial por meio de uma
tabela ou grfico. Quando fazemos isso, as propriedades dos dados tornam-se mais
aparentes e tornamo-nos capazes de determinar os mtodos estatsticos mais apropriados
para serem aplicados no seu estudo.
Suponhamos o seguinte conjunto de dados:

141213111213
161414151714
111314151312
141314131516
1212

10
Para montarmos uma distribuio de freqncias desses dados verificamos quais so os
valores no repetidos que existem e em uma primeira coluna de uma tabela colocamos
esses valores e na segunda coluna colocamos o nmero de repeties de cada um desses
valores. Para o exemplo acima, a distribuio de freqncias ser:

Varivel freqncia
11 2
12 5
13 6
14 7
15 3
16 2
17 1

A freqncia de uma observao o nmero de repeties dessa observao no conjunto


de observaes. A distribuio de freqncia uma funo formada por pares de valores
sendo que o primeiro o valor da observao (ou valor da varivel) e o segundo o
nmero de repeties desse valor.

Freqncias Relativas e Acumuladas


Para o exemplo acima tambm podemos calcular a freqncia relativa referente a cada
valor observado da varivel. A freqncia relativa o valor da freqncia absoluta
dividido pelo nmero total de observaes.

Varivel freqncia absoluta freqncia relativa


11 2 2/26 = 0,0769
12 5 5/26 = 0,1923
13 6 6/26 = 0,2308
14 7 7/26 = 0,2692
15 3 3/26 = 0,1154

11
16 2 2/26 = 0,0769
17 1 1/26 = 0,0385
TOTAL 26 1,0000
Podemos tambm calcular as freqncias acumuladas. Nesse caso existem as freqncias
absolutas acumuladas e as freqncias relativas acumuladas. 5

Varivel freqncia freqncia freqncia freqncia


absoluta relativa absoluta relativa acumulada
acumulada
11 2 2/26 = 0,0769 2 2/26 = 0,0769
12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1 1/26 = 0,0385 26 26/26 = 1,0000
TOTAL 26 1,0000

2.3 Histogramas

Histograma uma representao grfica de uma tabela de distribuio de


freqncias. Desenhamos um par de eixos cartesianos e no eixo horizontal (abscissas)
colocamos os valores da varivel em estudo e no eixo vertical (ordenadas) colocamos os
valores das freqncias. O histograma tanto pode ser representado para as freqncias
absolutas como para as freqncias relativas. No caso do exemplo anterior, o histograma
seria:

5
Observe que os valores da ltima coluna (freqncia relativa acumulada) podem ser calculados de duas
maneiras. Na primeira, tal como feito na tabela a seguir, dividimos o valor da freqncia absoluta
acumulada pelo total de observaes. Na segunda maneira, acumulamos o valor da freqncia relativa. Este
ltimo mtodo pode levar a acmulos de erros, de forma que o ltimo valor de freqncia relativa
acumulado se distancie consideravelmente de 1.

12
Histograma

7
6
Freqncia

5
4
Freqncia
3
2
1
0

Mais
11

12

13

14

15

16

17
Bloco

histograma de frequncia acumulada (ou ogiva) a representao grfica do


comportamento da frequncia acumulada. Na figura abaixo a ogiva mostrada em
sobreposio ao histograma.

Histograma

7 100,00%
6
80,00%
Freqncia

5
4 60,00% Freqncia
3 40,00% % cumulativo
2
20,00%
1
0 ,00%
Mais
11
12
13
14
15
16
17

Bloco

2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas

At agora vimos como so calculadas as freqncias (relativas e acumuladas) para


variveis quantitativas discretas. Nesse caso a tabulao dos resultados mais simples.
Mas quando tratamos de variveis quantitativas contnuas os valores observados devem
ser tabulados em intervalos de classes. Para a determinao dessas classes no existe uma
regra pr estabelecida, sendo necessrio um pouco de tentativa e erro para a soluo mais

13
adequada. Suponhamos que as safras agrcolas de um determinado produto, em uma
determinada regio, sejam dadas pela tabela a seguir:

Ano Safra (1000 t) Ano Safra (1000 t)


1 280 10 365
2 305 11 280
3 320 12 375
4 330 13 380
5 310 14 400
6 340 15 371
7 310 16 390
8 340 17 400
9 369 18 370

Devem ser seguidos alguns passos para a tabulao de freqncias de dados que se
referem a uma varivel quantitativa contnua, como o caso de nosso exemplo.
1. Definir o nmero de classes. O nmero de classes no deve ser muito baixo nem
muito alto. Um nmero de classes pequeno gera amplitudes de classes grandes o que
pode causar distores na visualizao do histograma. Um nmero de classes grande
gera amplitude de classes muito reduzidas. Foram definidas regras prticas para a
determinao do nmero de classes, sendo que este deve variar entre 5 e 20 (5 para um
nmero muito reduzido de observaes e 20 para um nmero muito elevado). Se n
representa o nmero de observaes (na amostra ou na populao, conforme for o
caso) o nmero aproximado de classes pode ser calculado por Nmero de Classes =
n arredondando os resultados. No caso do exemplo anterior temos n = 18

e 18 = 4,24 e podemos adotar um nmero de 5 classes, que ser razovel.


2. Calcular a amplitude das classes. Essa ser obtida conhecendo-se o nmero de
classes e amplitude total dos dados. A amplitude total dos dados o resultado da
subtrao valor mximo - valor mnimo da srie de dados. A amplitude de classe ser:

14
Valor Maximo - Valor Minimo
Amplitude de classe =
nmero de classes

Em geral, o valor do resultado tambm arredondado para um nmero inteiro mais


adequado. No nosso exemplo temos:

430 - 280
Amplitude de Classe = = 30
5

3. Preparar a tabela de seleo com os limites de cada classe. Na tabela abaixo


apresentamos para os dados do nosso exemplo os limites inferior e superior de cada
uma das 5 classes de freqncia.

Classe Limite inferior Limite Superior


1 280 310
2 310 340
3 340 370
4 370 400
5 400 430

Observa-se na tabela acima que o limite superior de cada classe coincide com o limite
inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observao
seja exatamente igual ao valor do limite de classe deve-se estabelecer um critrio de
incluso. Para evitar esse tipo de dificuldade normalmente se estabelece que o limite
superior de cada classe aberto (e conseqentemente, o limite inferior de cada classe
fechado), ou seja, cada intervalo de classe no inclui o valor de seu limite superior, com
exceo da ltima classe.

4. Tabular os dados por classe de freqncia. A partir da listagem de dados seleciona-


se para cada um deles qual a sua classe de freqncia e acumula-se o total de
freqncia de cada classe. De acordo com nosso exemplo, teremos:

15
Classe Freqncia Absoluta Freqncia Relativa
Simples Simples
280 - 310 3 0,12 (12 %)
310 - 340 4 0,16 (16 %)
340 - 370 6 0,24 (24 %)
370 - 400 7 0,28 (28 %)
400 - 430 5 0,20 (20%)
Total 25 1,00 (100 %)

Veremos adiante, quando discutirmos as medidas de posio e de disperso, que quando


agrupamos dados numricos em intervalos de classe ocorre perda de informao o que
leva a resultados no to precisos do que aqueles que seriam obtidos a partir dos dados
originais sem agrupamento.

2.5 Medidas de Posio e de Disperso

Podemos considerar que a Estatstica Descritiva subdivide-se em duas partes. Na


primeira, abordada anteriormente, so estudadas as formas de apresentao dos dados
para que fiquem salientadas as suas caractersticas principais. Na segunda, que
comearemos a tratar agora, abrange as medidas descritivas na forma de simples nmeros
que representam de forma sinttica essas caractersticas da distribuio estatstica dos
dados. Estudaremos, a rigor, quatro tipos de medidas:

1. Medidas de Tendncia Central (ou medidas de posio). Essa propriedade dos dados
refere-se a localizao do centro de uma distribuio. Elas nos indicam qual a
localizao dos dados ( no eixo que representa o conjunto dos nmeros inteiros se
estivermos tratando de uma varivel quantitativa contnua).
2. Medidas de Disperso. Essa propriedade revela o grau de variao dos valores
individuais em torno do ponto central.

16
3. Assimetria. a propriedade que indica a tendncia de maior concentrao dos dados
em relao ao ponto central.
4. Curtose. a caracterstica que se refere ao grau de achatamento, ou a taxa na qual a
distribuio cresce ou cai da direita para a esquerda.

2.5.1 Uma Nota sobre Notao Estatstica

Utilizaremos as letras maisculas para representar as variveis, como por exemplo a


varivel X. Os valores individuais que uma varivel pode assumir so representados pelas
correspondentes letras minsculas. Por exemplo, se X usado para designar o peso de
uma amostra de 50 pessoas, ento x o valor numrico do peso de uma dessas 50
pessoas. Diferentes valores de uma varivel so identificados por subscritos. Assim, os
pesos de 50 pessoas em uma amostra podem ser denotados por x1, x2, ..., x50.
nmero total de observaes em uma populao finita designado por N e na
amostra representado por n. A distino entre medidas descritivas para
populaes e amostras muito importante. Denotaremos os parmetros
(medidas referentes a populao) por letras gregas ou letras minsculas em
portugus. As estatsticas amostrais sero representadas por letras maisculas
em portugus e os valores observados de uma estatstica amostral pela
correspondente letra minscula em portugus. Por exemplo, as medidas
descritivas a serem introduzidas nessa seo sero denotadas como segue:

Nome da Medida Parmetro Notao da Valor


Estatstica observado
mdia aritmtica X x
proporo P p
mdia geomtrica g~ G g
mdia harmnica ~ H h
h
mediana ~
x X.5 x.5
.5

moda ~
xm Xm xm

17
2.5.2 A Mdia Aritmtica No Ponderada

A mdia definida como a soma das observaes dividida pelo nmero de observaes.
Se tivermos, por exemplo, n valores, temos:
n

x1 + x 2 +...+ x n
x
i =1
i
X = =
n n
Propriedades da mdia aritmtica no ponderada:

1. A mdia um valor tpico, ou seja, ela o centro de gravidade da distribuio, um


ponto de equilbrio. Seu valor pode ser substitudo pelo valor de cada item na srie de
dados sem mudar o total. Simbolicamente temos:

n( X ) = x (6)

2. A soma dos desvios das observaes em relao a mdia igual a zero.

(x X ) = 0

3. A soma dos desvios elevados ao quadrado das observaes em relao a mdia


menor que qualquer soma de quadrados de desvios em relao a qualquer outro
nmero. Em outras palavras,

(x X ) 2
= um mnimo.

A idia bsica de selecionar um nmero tal que a soma dos quadrados dos desvios em
relao a este nmero minimizada tem grande importncia na teoria estatstica. Ela
chega a ter um nome especial: o princpio dos mnimos quadrados. Ela , por exemplo,
a base racional do mtodo dos mnimos quadrados que usado para ajustar a melhor

n
6
- Utilizaremos muito freqentemente a notao x simplificadamente para representar x
i =1
i .

18
curva atravs de um conjunto de pontos em um sistema de eixos cartesianos, como
veremos adiante. Esta propriedade tambm a base para o clculo de uma importante
medida de disperso, que veremos logo a seguir.
A validade dessas tr6es propriedades pode ser facilmente demonstrada por um exemplo
numrico simples, mostrado na tabela a seguir. Nesta tabela, a coluna (1) contem o
conjunto de dados cuja soma 9 e cuja mdia 3. A coluna (2) demonstra a primeira
propriedade da mdia, ou seja, se cada uma das observaes individuais dos dados
substituda pela mdia, a soma permanece igual a 9. A coluna (3) verifica que de fato

(x X ) = 0 . Finalmente, as colunas (4), (5) e (6) demonstram que (x X ) 2


=

14, que menor que somas quando os desvios individuais so tomados a partir do nmero
2 e do nmero 5, respectivamente.

(1) (2) (3) (4) (5) (6)


x x (x - x) (x - x) 2 (x - 2) 2 (x -5) 2

1 3 -2 4 1 16
2 3 -1 1 0 9
6 3 +3 9 16 1
Soma 9 9 0 14 17 26

2.5.3 A Mdia Aritmtica Ponderada

No clculo da mdia aritmtica no ponderada todos os valores observados foram


somados atribuindo-se o mesmo peso a todas as observaes. Agora veremos uma nova
forma de calcular a mdia. Consideremos um exemplo familiar de clculo da mdia de
notas de estudantes, quando o exame final vale duas vezes mais do que as duas provas
comuns realizadas no decorrer do semestre. Se um determinado aluno obtiver as notas 7,
5 e 8 a sua mdia ponderada final ser:

19
1 (7) +1 (5) + 2 8
=7
1+1+ 2
Em termos gerais, a frmula para a mdia aritmtica ponderada :

n
X w = wi xi = wx
i =1

onde wi o peso da observao i


e n o nmero de observaes.
A soma dos pesos no pode ser igual a zero. Fora disto, no existe restrio para os
valores dos pesos. Se todos os pesos forem iguais a 1, a mdia ponderada recai em seu
caso particular, a mdia aritmtica no ponderada. O mesmo ocorre se todos os pesos
forem iguais a uma constante c. Portanto, a mdia aritmtica no ponderada na realidade
uma mdia aritmtica ponderada com pesos iguais.

2.5.4 Propores como Mdias

Freqentemente encontramos populaes cujas unidades elementares podem ser


classificadas em duas categorias: uma que tem certo atributo e outra que no tem esse
atributo. Nesse caso, estamos interessados na proporo de casos que possuem esse
atributo. Uma proporo comumente pensada como uma frao ou porcentagem, mas
tambm pode ser pensada como um caso especial de mdia.
Suponha que queremos determinar a proporo de votantes entre os cidados brasileiros.
Devemos primeiro designar um valor 1 para cada pessoa qualificada como eleitor e um

valor 0 para cada pessoa no qualificada como eleitor. Ento, a soma dos 1s seria x e

a mdia seria a mdia seria obtida pela diviso da soma pelo nmero N total de pessoas
no Brasil.

A mdia da varivel x = x N . No entanto essa mdia tambm uma proporo, a

proporo de eleitores na populao brasileira.

20
2.5.5 A Mdia Geomtrica

A mdia geomtrica de uma amostra definida como a raiz ensima do produto nos n
valores amostrais.

G = n ( x1 )( x2 )...( xn )

Por exemplo, a mdia geomtrica de 5, 9 e 13 :

G = 3 (5)(9)(13) = 8,36

Para a mesma srie de dados a mdia 9. sempre verdade que a mdia aritmtica
maior do que a mdia geomtrica para qualquer srie de valores positivos, com exceo
do caso em que os valores da srie so todos iguais, quando as duas mdias coincidem.
clculo da mdia geomtrica muito simples. Mas a sua interpretao e as sua
propriedades tornam-se mais evidentes quando reduzimos a frmula a sua
forma logartmica. Tomando logaritmos de ambos os lados da equao anterior
teremos:

logG = log( n ( x1 )( x2 )...( xn ) ) =


log x1 + log x2 +...+ log xn
=
log x
n n

A concluso que chegamos que o logaritmo da mdia geomtrica igual mdia


aritmtica dos logaritmos dos valores da srie. Verifica-se que a mdia geomtrica
somente tem significado quando todos os valores da srie so todos positivos.
Suponhamos como exemplo de aplicao de clculo da mdia geomtrica os dados da
tabela seguinte que mostram as mudanas de preos de duas mercadorias, A e B, de 1980
a 1985. Durante esse perodo o preo de A subiu 100 % e o preo de B decresceu 50 %.
Qual foi a mudana mdia relativa de preos? Em outras palavras, qual foi o percentual
mdio de mudana de preos?

21
Preos das Mercadorias A e B em 1980 e 1985
Preo Relativo de Preos
1980 = 100 1985 = 100
Mercadoria 1980 1985 1980 1985 1980 1985
A R$ 50 R$ 100 100 200 50 100
B R$ 20 R$ 10 100 50 200 100
Mdia Aritmtica 100 125 125 100
Mdia Geomtrica 100 100 100 100

A mdia aritmtica fornece uma resposta incorreta para essa questo. Como indicado
pelos clculos da tabela acima leva a duas concluses opostas. Se 1980 tomado como
base para o relativo de preos, os preos so em mdia 25 % maiores em 1985 do que em
1980. Se 1985 tomado como base, os preos de 1980 so 25 % maiores do que os
preos de 1985. Portanto, a mdia aritmtica dos relativos de preos conduz a resultados
inconsistentes.
No entanto, um resultado consistente obtido quando a mdia geomtrica aplicada:
1. Se 1980 escolhido como a base, os preos de 1985 so 100 % dos preos de 1980, ou
seja:
g = 200 50 = 10.000 = 100
2. Se 1985 escolhido como a base, os preos de 1980 sero tambm 100 % dos preos
em 1985, ou seja:
g = 50 200 = 100

A mais importante aplicao da mdia geomtrica refere-se talvez ao clculo de taxas de


crescimento mdias, desde que essas podem ser corretamente medidas somente por esse
mtodo. Para exemplificar, no campo da economia, esse ponto, suponha que a produo
anual de um setor industrial cresceu de 10.000 para 17.280 unidades durante o perodo
1985-1988 como mostrado na tabela a seguir; qual a taxa mdia de crescimento anual?
A taxa mdia anual de crescimento pode ser calculada a partir dos valores em

22
porcentagem da produo em relao aos anos anteriores. Se calcularmos a mdia
aritmtica desses valores teramos:
x = (60 + 96 + 300) / 3 = 152
implicando uma taxa de crescimento mdia de 152 -100 = 52 %. Se a produo cresce 52
% ao ano, comeando da produo de 1985 de 10.000 unidades, ento a produo de
1986 seria de

23.0 + 0,52 (10.000) = 15.200;


a produo de 1987 seria de
15.200+ 0,52(15.200) = 23.104;
a produo de 1988 seria de
23.104 + 0,52(23.104) = 35.118,08

Ano 1985 1986 1987 1988


Produo 10.000 6.000 5.760 17.280
Porcentagem
do ano anterior
60 96 300

Observe-se que este ltimo valor quase 200 % do valor efetivamente observado
em 1988, de 17.200.
A mdia geomtrica, por sua vez, :

g = 3 (60)(96)(300) = 120

implicando uma taxa anual mdia de crescimento de 120 - 100 = 20 %. Verificando,


teremos:
no ano de 1986: 10.000 + 0,20(10.000) = 12.000;
no ano de 1987: 12.000 + 0,20(12.000) = 14.400;
no ano de 1988: 12.000 + 0,20(14.400) = 17.280 que coincide com o valor observado
efetivamente em 1988.

23
Se o valor da mdia geomtrica das porcentagens de crescimento for menor do que 100,
implica em uma porcentagem mdia de crescimento negativa, o que indica uma taxa
mdia de declnio ao invs de uma taxa mdia de crescimento.7 Atente tambm para o
fato de que as trs porcentagens a partir das quais a mdia geomtrica calculada so
percentuais do ano anterior ao invs de mudana percentual do ano anterior.8
clculo da taxa mdia de crescimento baseado principalmente na hiptese de
uma taxa constante de crescimento ou de que os valores individuais formam
uma progresso geomtrica. Quando o clculo envolve um nmero
considervel de perodos, utiliza-se com mais freqncia uma frmula que se
relaciona com a mdia geomtrica, que :
xf
R = n 1

i
x

onde:
R = taxa de crescimento geomtrica mdia,
n = nmero de perodos de tempo,
xf = valor no perodo final,
xi = valor no perodo inicial.

Para os dados da tabela anterior, teremos:

17.280
R = 3 1 = 0,20 ou 20 % , como obtido anteriormente.9 Note que R = G -1.
10.000

7
Se, por exemplo, ao invs de 60, 96 e 300 %, como anteriormente, tivermos 60, 96 e 78 %, a taxa de
crescimento geomtrica mdia ser de g = 3 (60)(96)(78) = 76,59 , o que indica um decrscimo mdio
de 76,59 - 100 = - 23,41 %.
8
Essas ltimas porcentagens, referentes ao exemplo da tabela anterior, seriam (6.000 - 10.000)/10.000= -
0,40, ou seja - 40 %; (5.760 - 6.000)/6.000 = -0,04 , ou seja, - 4 %; e (17.280 - 5.760)/5760 = 2, ou seja +
200 %.

9
- interessante notar que pelo clculo anterior empregam-se os valores dos anos intermedirios, ao passo
que nesse ltimo, apenas empregam-se os valores do perodo inicial e final, no importando o que ocorreu
nos perodos intermedirios.

24
2.5.6 A Mdia Harmnica

A mdia harmnica o inverso da mdia aritmtica dos inversos dos valores observados.
Simbolicamente, para uma amostra, temos:

1 1
1 1 1
x1 + x2 +...+ xn (1 / x ) = n
H= =
n n (1 / x)

Para clculos mais simples, a frmula anterior pode ser reescrita como:

1 1 1
1 x1 + x2 +...+ xn (1 / x )
H= n
=
n

A mdia harmnica dos trs valores 4, 10 e 16 :

1 +1 +1
1 4 10 16 = 0,1375
H= 3
H = 7,27
Para os mesmos dados a mdia aritmtica 10 e a mdia geomtrica 8,62. Para
qualquer srie de dados cujos valores no so todos os mesmos e que no incluem o zero,
a mdia harmnica sempre menor que tanto a mdia aritmtica como a mdia
geomtrica.

2.5.7 A Mediana

A mediana o valor do item central da srie quando estes so arranjados em ordem de


magnitude. Para a srie R$ 2, R$ 4, R$ 5, R$ 7 e R$ 8, a mediana o valor do terceiro

25
item, R$ 5. No caso do nmero de itens na srie ser par, a mediana a semi-soma dos
dois valores mais centrais. Por exemplo, para a srie 3, 5 ,8 ,10, 15 e 21 kg, a mediana a
media dos valores 8 e 10, ou seja 9.
A mediana pode ser formalmente definida como o valor que divide a srie de tal forma
que no mnimo 50 % dos itens so iguais ou menores do que ela, e no mnimo 50 % dos
itens so iguais ou maiores do que ela. Mais rigorosamente, estabelecemos que:

X.5 = o valor do [(n+1)/2] -simo item

Por exemplo, para uma srie formada pelos valores 3,5,8,10,15 e 21 a mediana
ser o valor do [(6+1)/2] = 3,5 simo item, ou seja, a semi soma do item de posto 3 e do
item de posto 4, que so 8 e 10.
O valor da mediana no influenciado pelos valores nas caudas de uma
distribuio. Por exemplo, se temos a srie de dados 1,2,3,4,5 a mediana 3. Se
substituirmos os valores das caudas dessa distribuio por quaisquer valores uma nova
distribuio formada poderia ser formada pela srie -1000,-100,3,500,5000 e a mediana
permanece sendo 3. Portanto, ela uma medida de posio da distribuio bem adequada
para distribuies assimtricas, tais como a distribuio de renda, j que no sabemos se a
famlia mais rica ganha R$7.000.000 ou R$ 500.000.000. Veremos, mais a frente que ela
possui vantagens em relao a mdia aritmtica, como medida de posio (ou medida de
tendncia central) para dados agrupados em classes de freqncia, quando a ltima classe
tem limite superior indeterminado.
A mediana tambm tem a interessante propriedade de que a soma dos desvios absolutos
das observaes em relao a mediana menor do que a soma dos desvios absolutos a
partir de qualquer outro ponto na distribuio. Simbolicamente:

x X .5 = um mnimo

26
2.5.8 A Mdia para Dados Agrupados

Quando estamos tratando de amostras ou populaes muito grandes conveniente


calcular as medidas descritivas a partir das distribuies de freqncia. A mdia no pode
ser determinada exatamente a partir de distribuies de freqncia, mas uma boa
aproximao pode ser obtida pela hiptese do ponto mdio. A aproximao quase
sempre muito satisfatria se a distribuio bem construda.10 A hiptese do ponto mdio
refere-se a considerar-se de que todas as observaes de uma dada classe esto centradas
no ponto mdio daquela classe. Conseqentemente, o valor total da freqncia da classe
da i-sima classe simplesmente o produto fi mi, onde fi a freqncia (absoluta simples)
da classe i e mi ponto mdio da classe i. Sob essa hiptese, a mdia aproximada para
uma distribuio de uma amostra com k classes vem a ser:

X
f 1m1 + f 2 m2 +...+ f k mk

fm
f 1 + f 2 +...+ f k f
fm
=
n

importante notar que todos os somatrios na equao acima referem-se s


classes e no s observaes individuais. Consideremos a seguinte tabela de distribuio
de freqncia para dados de gasto com alimentao extrados de uma pesquisa de
oramentos familiares.

Classe f m fm
R$ 120,00 - R$139,99 5 130,0 650,0
140,00 - 159,99 26 150,0 3900,0
160,00 - 179,99 24 170,0 4080,0
180,00 - 199,99 15 190,0 2850,0
200,00 - 219,99 8 210,0 1680,0

10
Isto , principalmente se no agrupamento dos dados originais em uma tabela de distribuio de
freqncia, empregou-se um nmero adequado de classes de freqncia.

27
220,00 - 239,99 2 230,0 460,0
Total 80 13620,0

13620,00
x= = R$170,25
80

Ao utilizar essa aproximao estamos considerando a hiptese de que todas as


observaes em cada classe esto uniformemente distribudas nessa classe. Por exemplo,
se tivermos um intervalo de tamanho 100 e com freqncia igual a 6 observaes, a
localizao dessas observaes seria 0,20,40,60,80 e 100, com distncia constante entre
cada par de observaes, de forma que:

0+20+40+60+80+100 = 300 = m x 6 e m = 50, ou seja, o ponto mdio do


intervalo de 0 a 100. Conclui-se que se a distribuio das observaes for uniforme em
cada intervalo, o somatrio dos valores das observaes de cada intervalo igual ao
produto da freqncia no intervalo pelo valor do ponto mdio desse intervalo. Supe-se
que com uma conveniente construo de intervalos de classe os eventuais erros nos
intervalos compensam-se mutuamente.

2.5.9 A Mediana para dados Agrupados

Assim como possvel estabelecer uma aproximao da mdia aritmtica para


dados agrupados, o mesmo pode ser feito para a mediana. O mtodo usado o da
interpolao utilizando-se a distribuio de freqncia acumulada ou ogiva. Inicialmente
determina-se a classe que contem a mediana. Essa ser a classe cuja freqncia
acumulada relativa correspondente a seu limite inferior menor que 0,50 (ou 50 %) e a
freqncia acumulada relativa correspondente a seu limite superior maior que 0,50 (ou
50 %). O prximo passo a determinao do ponto exato onde se localiza a mediana
naquela classe. Para o exemplo anterior de gastos com alimentao de famlias, temos:

28
Classe freq. absoluta freq.acumulada freqncia
simples relativa
acumulada
R$ 120,00 - R$139,99 5 5 0,0625
140,00 - 159,99 26 31 0,3875
160,00 - 179,99 24 55 0,6875
180,00 - 199,99 15 70 0,8750
200,00 - 219,99 8 78 0,9750
220,00 - 239,99 2 80 1,0000
Total 80

A classe que contm a mediana a terceira classe, pois a freqncia relativa


acumulada da classe anterior (segunda classe) menor que 0,5 e a freqncia relativa
acumulada da terceira classe maior do que 0,5.11 Na figura a seguir, F a freqncia
acumulada (representada no eixo vertical) e X o valor da varivel (representada no eixo
horizontal).

55

n + 1 80 + 1
= = 40,5
2 2

31

160 X.5 180 X

11
- A freqncia relativa acumulada da classe anterior classe corrente a freqncia relativa acumulada
do limite inferior da classe corrente. A freqncia relativa acumulada da classe corrente a freqncia
relativa acumulada do limite superior dessa mesma classe.

29
Por semelhana de tringulos, verifica-se que:
X .5 160 40,5 31
=
180 160 55 31

X .5 = 167,92

Este procedimento o mesmo que a seguinte frmula de interpolao:

(n + 1) / 2 Fa
X .5 = LI .5 + c
f .5

onde:
LI.5 = limite de classe inferior da classe da mediana,
Fa = freqncia acumulada da classe imediatamente anterior classe da
mediana,
f.5 = freqncia absoluta simples da classe da mediana,
c = amplitude (tamanho) da classe da mediana.

2.5.10 A Moda para dados Agrupados


A moda de uma distribuio de freqncia pode muitas vezes ser aproximada pelo
ponto mdio da classe modal - a classe com maior densidade de freqncia.12 Ento, para
os dados de gastos com alimentao do exemplo anterior, xm = R$ 150, o ponto mdio da
segunda classe, que possui a maior freqncia. Esse mtodo de localizar a moda
totalmente satisfatrio quando as densidades de freqncia da classe imediatamente

12
Definimos densidade de freqncia de um intervalo de classe como sendo o quociente entre a freqncia
absoluta simples desse intervalo e o seu tamanho (amplitude). Quando os intervalos de classe possuem
amplitudes desiguais, existe uma tendncia de os intervalos maiores apresentarem maiores freqncias.
Dessa forma a classe modal no a classe de maior freqncia mas a classe de maior densidade de
freqncia. Naturalmente, quando todos os intervalos tm a mesma amplitude, como no caso do exemplo
anterior e como geralmente so construdos para no distorcer a distribuio, a classe modal a classe de
maior densidade de freqncia assim como tambm a classe de maior freqncia. Esse conceito de
densidade de freqncia ser muito til, quando definirmos, mais adiante, a funo densidade de
probabilidade e para a sua compreenso intuitiva.

30
anterior classe modal (a classe premodal) e da classe imediatamente posterior classe
modal (classe posmodal) so aproximadamente iguais. Quando isso no ocorre, como
sugerido pela figura a seguir, resultados mais precisos podem ser obtidos com a seguinte
frmula, para uma amostra:
1
X m Lm + ( )c
1 + 2

onde:
Lm = o verdadeiro13 limite inferior de classe da classe modal
1 = da diferena entre das densidades de freqncia da classe modal e classe
premodal.
2 = da diferena entre das densidades de freqncia da classe modal e classe
posmodal.
C = a verdadeira amplitude de classe da classe modal.

Interpretao geomtrica da interpolao


algbrica para a determinao da moda
Densidade de
freqncia

xm X

13
Para determinar os limites de classe verdadeiros para uma varivel contnua, temos que escrever os
limites de classe com uma casa decimal a mais do que os dados originais. Por exemplo, se o conjunto de
dados consiste de medidas de peso arredondadas para um dcimo de grama, os limites nominais de classe
(tambm chamados de limites aparentes podem ser 11,0 - 11,2; 11,3 - 11,5;11,6 - 11.8; ... Os limites

31
No exemplo anterior de gastos com alimentos de 80 famlias, como a amplitude
de todos os intervalos so iguais, podemos utilizar as freqncias absolutas de
classe no lugar das densidades de freqncia, para o clculo do valor aproximado
da mediana.

Lm = 140,00 1 = 26 - 15 = 11
c = 20 2 = 26 - 24 = 2

11
xm 140,00 + ( )20 = 156,92
11 + 2
Uma observao aqui necessria. possvel calcular os valores aproximados da
mediana e da moda para dados agrupados quando o ltimo intervalo de classe tem
limite superior indeterminado. No caso da mediana isso imediato e no caso da
moda, o seu clculo somente pode ser feito se a ltima classe no for a classe
modal e preciso primeiramente calcular as densidades de freqncia. Como
exemplo, suponhamos que a distribuio de renda de uma certa regio dada pela
seguinte distribuio de freqncia:

renda (R$) limites reais freqncia densidade de


limites nominais absoluta freqncia
0 - 120 0 - 120,50 40 40/120,50 = 0,332
121 - 605 120,50 - 605,50 170 170/485 = 0,350
606 - 1200 605,50 - 1200,50 220 220/595 = 0,370
1201 - 2400 1250,50 - 2400,50 15 15/1150 = 0,013
mais de 2400 mais de 2450,50 97 indeterminado
Total 542

verdadeiros de classe (tambm conhecidos como limites reais ou efetivos) seriam 10,95 - 11,25; 11,25 -
11,55; 11,55 - 11,85;...

32
A mediana est localizada na terceira classe:14

(542 + 1) 210
x.5 605,50 + (1200,50 605,50) = 772
2
220

A classe modal tambm a terceira classe:15


(0,370 0,350)
xm = 605,50 + (1200,50 605,50) = 637
(0,370 0,350) + (0,370 0,013)

Infelizmente, para esse exemplo no possvel o clculo da mdia, o que


demonstra que para algumas situaes temos que contar com a mediana como
medida de posio (ou de tendncia central) de uma distribuio estatstica.
Discutiremos agora comparativamente algumas das caractersticas das trs
principais medidas de posio:

A Mdia Aritmtica

1) Ela afetada por todas as observaes e influenciada pelas magnitudes


absolutas dos valores extremos na srie de dados.
2) Ela das trs medidas de posio a que possibilita maiores manipulaes
algbricas, dadas as caractersticas de sua frmula.
3) Em amostragem, a mdia uma estatstica estvel. Isso ser aprofundado
posteriormente.

14
Observe-se que os dados originais esto, de acordo com o sugerido pela tabela acima, com aproximao
igual a unidades de gramas. Os limites verdadeiros (ou reais) de classe) passam, portanto, a ter aproximao
de uma casa decimal de grama. O valor final dos clculos da mediana e da moda so aproximados para
unidades de grama, j que essa a aproximao dos dados originais (que se refere ao instrumento de
medida).

15
J que esta classe a que apresenta maior densidade de freqncia. Como a ltima classe no tem limite
superior definido no foi possvel calcular sua densidade de freqncia, j que no podemos determinar sua
amplitude. Dependendo dessa amplitude ela poderia ter uma densidade de freqncia maior que a da

33
A Mediana

1) Seu valor afetado pelo nmero de observaes e como elas esto distribudas
mas ela no afetada pelos valores das observaes extremas.
2) Sua frmula no passvel de manipulao algbrica.
3) Seu valor pode ser obtido, como vimos, em distribuies, com limites
superiores indeterminados para a sua ltima classe.
4) A mediana a estatstica mais adequada para descrever observaes que so
ordenadas ao invs de medidas.

A Moda

1) A moda o valor mais tpico e representativo de uma distribuio. Ela


representa o seu valor mais provvel.
2) Como a mediana, a moda tambm no influenciada pelos valores extremos da
distribuio e no permite manipulaes algbricas como a frmula da mdia.

Existem algumas relaes entre as diversas medidas de posio:

1) Para qualquer srie, exceto quando no caso de todas as observaes


coincidirem em um nico valor, a mdia aritmtica sempre maior que a
mdia geomtrica, a qual, por sua vez, maior que a mdia harmnica.
2) Para uma distribuio simtrica e unimodal, mdia = mediana = moda.
3) Para uma distribuio positivamente assimtrica, mdia > mediana > moda.
A distncia entre a mediana e a mdia cerca de um tero da distncia entre
a moda e a mdia.

terceira classe. Mas mesmo nesse caso, a terceira classe ainda seria modal, j que sua densidade de
freqncia maior que a das suas classes vizinhas, e a distribuio passaria a ser bimodal.

34
4) Para uma distribuio negativamente assimtrica, mdia < mediana < moda.
A distncia entre a mediana e a mdia cerca de um tero da distncia entre
a moda e a mdia.
Essas ltimas caractersticas so apresentadas graficamente, a seguir
POSIES RELATIVAS DA MDIA, MEDIANA E MODA EM FUNO
DA ASSIMETRIA DAS DISTRIBUIES

Assimetria positiva

Assimetria negativa

Distribuio simtrica

35
Medidas de Disperso, Assimetria e Curtose

Muitas sries estatsticas podem apresentar a mesma mdia, mas no entanto, os dados de
cada uma dessas sries podem distribuir-se de forma distinta em torno de cada uma das
mdias dessas sries. Na anlise descritiva de uma distribuio estatstica fundamental,
alm da determinao de uma medida de tendncia central, conhecer a disperso dos
dados e a forma da distribuio. Duas sries de dados podem possuir a mesma mdia, mas
uma pode apresentar valores mais homogneos (menos dispersos em relao a mdia) do
que a outra. Um pas, por exemplo, com uma distribuio de renda mais equnime, ter
uma disperso de suas rendas menor do que um pas com estrutura de renda mais
diferenciada em diversos estratos ou categorias sociais. Uma mquina que produz
parafusos e que estiver menos ajustada do que outra produzir medidas de parafusos com
distribuio mais dispersa em torno de sua mdia.

A inadequao das mdias

A importncia das mdias com freqncia exagerada. Se dizemos que a renda familiar
mdia de um determinado pas de US$ 5.000 por ano no sabemos muita coisa sobre a
distribuio de renda desse pas. Uma mdia, como um simples valor adotado para
representar a tendncia central de uma srie de dados uma medida muito til. Porm, o
uso de um simples e nico valor para descrever uma distribuio abstrai-se de muitos
aspectos importantes.
Em primeiro lugar, nem todas as observaes de uma srie de dados tem o mesmo valor
da mdia. Quase sem exceo, as observaes includas em uma distribuio distanciam-
se do valor central, embora o grau de afastamento varie de uma srie para outra. Muito
pouco pode ser dito a respeito da disperso mesmo quando diversas medidas de tendncia
central so calculadas para a srie. Por exemplo, no podemos dizer qual distribuio tem
maior ou menor grau de disperso da informao dada pela tabela abaixo.

36
Distribuio A Distribuio B
Mdia 15 15
Mediana 15 12
Moda 15 6

Uma segunda considerao que as formas de distribuio diferem de um conjunto de


dados para outro. Algumas so simtricas; outras no. Assim, para descrever uma
distribuio precisamos tambm de uma medida do grau de simetria ou assimetria. A
estatstica descritiva para esta caracterstica chamada de medida de assimetria.
Finalmente, existem diferenas no grau de achatamento entre as diferentes distribuies.
Esta propriedade chamada de curtose (em ingls, kurtosis). Medir a curtose de uma
distribuio significa comparar a concentrao de observaes prximas do valor central
com a concentrao de observaes prximas das extremidades da distribuio.

2.5.11 O Intervalo (ou amplitude)

A medida de disperso mais simples a amplitude, a diferena entre o maior e o menor


valor nos dados. Para uma distribuio de freqncia que usa intervalos de classe, a
amplitude pode ser considerada como a diferena entre o maior e o menor limite de classe
ou a diferena entre os pontos mdios dos intervalos de classe extremos. Os preos de
aes e de outros ativos financeiros so freqentemente descritos em termos de sua
amplitude, com a apresentao pelas Bolsas de Valores do maior valor e do menor valor
da ao em um determinado perodo de tempo.
Para algumas distribuies simtricas a mdia pode ser aproximada tomando-se a semi-
soma dos dois valores extremos,16 que freqentemente chamada de semi-amplitude. Por
exemplo, prtica entre os meteorologistas derivar a mdia diria de temperatura

16
Foi o que fizemos ao calcular a mdia para valores agrupados em classes de freqncia. Nesse caso
utilizamos o ponto mdio de cada intervalo de classe como representativo da mdia de cada intervalo.
Assim, ao multiplicarmos a freqncia de cada classe pelo valor do ponto mdio, estamos calculando
aproximadamente a soma das observaes em cada intervalo, admitindo como hiptese que a distribuio
dos dados em todos os intervalos simtrica.

37
tomando a mdia somente dos valores mximo e mnimo de temperatura ao invs, de
digamos, a mdia das 24 leituras horrias do dia.
A amplitude tem alguns defeitos srios. Ela pode ser influenciada por um valor atpico na
amostra. Alm disso, o seu valor independe do que ocorre no interior da distribuio, j
que somente depende dos valores extremos. Este defeito ilustrado na figura a seguir:

f(X)

X
Na figura acima so mostradas duas distribuies com diferentes variabilidade, mas com
mesma amplitude. A amplitude tende a crescer, embora no proporcionalmente, a medida
que o tamanho da amostra cresce. Por esta razo, no podemos interpretar a amplitude
corretamente sem conhecer o nmero de informaes dos dados.

2.5.12 Percentis, Decis e Quartis

Podemos tentar responder a seguinte pergunta: que proporo dos valores de uma
varivel menor ou igual a um dado valor? Ou maior ou igual a um dado valor? Ou entre
dois valores? Quando construmos uma distribuio de freqncia acumulada, tais
questes somente podem ser respondidas com relao aos limites de classe exatos. Por
exemplo, a partir da distribuio de freqncia relativa acumulada da pgina 28, podemos
dizer que 38,75 % das observaes so menores do que 159,99. Mas no podemos
responder a pergunta: qual o gasto familiar tal que a proporo da amostra tendo este
valor ou menos 35 %?. Mas visvel da tabela que 6,25 % das famlias gastam com
alimentao at R$ 139,99 e 38,75 % das famlias gastam at R$ 159,99. Portanto, como
35 % est entre estes dois valores, o gasto familiar tal que a proporo da amostra tendo

38
este valor ou menos 35 % est situado entre R$ 139,99 e R$ 159,99. Este valor
chamado de percentil 35.
O percentil 40 o valor da varivel que maior do que 40 % das observaes.
Generalizando, o percentil x, o valor da varivel que maior do que x % das
observaes. Em outras palavras, o percentil x o valor da varivel correspondente ao
valor de freqncia relativa acumulada de x %.17 O primeiro decil o valor da varivel
que supera um dcimo (ou 10 %) do total de observaes. Se tivermos 200 observaes, o
segundo decil ser aproximadamente a observao de posto 40.
O primeiro quartil o valor da varivel cuja freqncia relativa acumulada 0,25 (ou 25
%). O terceiro quartil o valor da varivel cuja freqncia relativa acumulada 0,75 (ou
75 %). O primeiro quartil maior do que um quarto dos valores observados e menor do
que trs quartos destes valores. O terceiro quartil maior do que trs quartos dos valores
observados e menor do que um quarto destes valores. O segundo quartil confunde-se com
a mediana.
Uma medida de disperso o chamado desvio interquartlico que a diferena entre o
terceiro e o primeiro quartis.

2.5.13 Varincia e Desvio Padro


A varincia definida como a mdia dos desvios ao quadrado em relao mdia da
distribuio. Para uma amostra,

S 2
=
(x X ) 2

n 1

17
Para o clculo do valor exato do percentil x para dados agrupados utiliza-se o mesmo mtodo para a
determinao da mediana, ou seja, a interpolao linear. Como no caso da mediana, podemos empregar uma
p (n + 1) / 100 Fa
frmula de interpolao X p = LI p + c
fp
onde Xp o percentil p, Lip o limite inferior real da classe que contem o percentil, Fa a freqncia
relativa acumulada da classe anterior classe que contem o percentil, fp a freqncia relativa (simples) da
classe que contem o percentil, c a amplitude do intervalo de classe que contem o percentil e o nmero
de observaes. O mesmo mtodo pode ser empregado tambm para os decis e quartis.

39
Para uma populao finita,

2
=
(x ) 2

Na penltima equao, n-1 chamado de nmero de graus de liberdade de S2 , um


conceito a ser definido mais tarde. Existe uma restrio para esta equao: n > 1 (no se
pode calcular a varincia para uma amostra de uma observao apenas). O desvio padro
a raiz quadrada da varincia, e denotado S (para amostra) e (para populao).
Existem frmulas que facilitam os clculos para
S2 e 2 :

n x 2 ( x ) 2
S =
2
n(n 1)

x x
2
2

2 =
N N

Com estas duas ltimas frmulas, podemos calcular a varincia somente com a soma dos

valores ( x ) e a soma dos quadrados dos valores ( x 2 ); no mais necessrio

calcular a mdia, em seguida os desvios em relao s mdias e finalmente os quadrados


destes desvios.
Para ilustrar o processo de clculo da varincia e desvio padro e para mostrar o uso
destas medidas, considere o seguinte exemplo. Dois tipos diferentes de mquina, X e Y
so projetadas para produzir o mesmo produto. Elas tm o mesmo preo de venda. Um
fabricante est tentando decidir qual delas comprar e observou 10 mquinas distintas de
cada tipo em operao por uma hora. A tabela seguinte mostra as produes horrias nas

primeiras duas colunas. As mdias so x = 40310 = 40,3 unidades por hora e

y = 408 10 = 40,8 unidades por hora. Portanto, com base nestes dados, o tipo Y um

pouco mais rpida. Podemos retirar mais alguma informao a partir destes dados?

40
Podemos medir e comparar as disperses das produes horrias dos dois tipos de
mquina. Usando a penltima frmula para os dados da tabela, obtemos:

10(16.405) (403) 2
S =2
= 18,23
X
10(10 1)
S X = 18,23 = 4,27 unidades por hora
10(17.984) (408) 2
S =2
= 135,11
Y
10(10 1)
SY = 135,12 = 11,62 unidades por hora

x y x2 y2
35 25 1.225 625
36 26 1.296 676
49 55 2.401 3.025
44 52 1.936 2.704
43 48 1.849 2.304
37 24 1.369 576
38 34 1.444 1.156
42 47 1.764 2.209
39 50 1.521 2.500
40 47 1.600 2.209

Soma 403 408 16.405 17.984

O tipo X tem menor disperso que o tipo Y. Apesar de ter maior preo que o tipo Y, a
mquina X mais precisa.

41
2.5.14 Varincia e Desvio Padro para Dados Agrupados

A varincia e o desvio padro (como a mdia, mediana, moda, quartis, percentis, decis)
podem ser calculados para dados agrupados, ou seja, distribuies de freqncia com
intervalos de classe. Entretanto, os resultados podem ser apenas aproximadamente
precisos. Utiliza-se, como no caso da mdia, a hiptese do ponto mdio: a de que toda
observao est localizada no ponto mdio de sua classe. Cada ponto mdio entra nos
clculos quantas vezes so as observaes naquele intervalo de classe. As equaes para
as varincias so:

S2 =
f (m X ) 2

, para a amostra;
n 1

2 =
f (m ) , para a populacao.
N

Os smbolos utilizados nestas equaes j foram definidos anteriormente. Para facilitar os


clculos podemos utilizar as seguintes frmulas mais convenientes para as varincias:

S2 =
fm 2
( fm) 2 / n
n 1
e

2 =
fm 2
( fm) 2 / N
N

para a amostra e populao, respectivamente. Aqui, como antes, assumimos que a


populao finita.
Os somatrios em todas estas equaes so para todas as k classes, no para as
observaes individuais. Estas equaes podem ser aplicadas tanto para intervalos de
classe iguais como para intervalos de classe desiguais. Entretanto, elas no podem ser
empregadas quando existem um ou mais intervalos sem limites. Como para os dados no

42
agrupados, a raiz quadrada destas equaes so os desvios padres para a amostra e para a
populao, respectivamente.
Aplicando as ltimas equaes para o exemplo de consumo de alimentos, temos:
Classe (1) (2) (3) (4)
m f fm fm2
(2)(1) (3)(1)
R$ 120,00 - R$139,99 130 5 650 84.500
140,00 - 159,99 150 26 3.900 585.000
160,00 - 179,99 170 24 4.080 693.000
180,00 - 199,99 190 15 2.850 541.500
200,00 - 219,99 210 8 1.680 352.800
220,00 - 239,99 230 2 460 105.800
Total 80 13.620 2.363.200

S 2
=
fm 2
( fm) 2 / n 2.363.200 (13.620) 2 / 80
= = 561,96
n 1 80 1

S = 561,96 = 23,71

2.5.15 Interpretando e Aplicando o Desvio Padro

O desvio padro mais a mais usada das medidas de variabilidade. Infelizmente,


o desvio padro no tem uma interpretao intuitivamente bvia. Por exemplo, no
exemplo anterior das mquinas, SX = 4,27 unidades por hora, mas no bvio o que isto
quer dizer para a mquina X. Para muitas sries de dados h dois teoremas para a
interpretao do desvio padro que so muito teis. Eles so chamados de Desigualdade
de Chebyshev e a Regra de Gauss, as quais introduzimos a seguir.

Teorema: Desigualdade de Chebyshev. Para qualquer conjunto de dados e qualquer


constante h > 1, no mnimo 1 1 / h 2 dos dados estaro situados dentro de um intervalo
formado por h desvios padres abaixo e acima da mdia.

43
Por este teorema temos certeza de que no mnimo , ou 75 % dos dados iro situar-se
dentro do intervalo X 2 S . Neste caso h = 2 e 1 1 / h 2 = 1 1 / 2 2 = 3 / 4 . No mnimo
8/9, ou 88,9 % dos dados estaro no intervalo X 3S ; e no mnimo 15/16, ou cerca de
94 % dos valores de qualquer varivel estaro includos dentro do intervalo X 4 S .
Considere o exemplo anterior das mquinas. Temos X = 40,3 e S X = 4,27 . Que

percentagem das mquinas ter produo entre X 1,5S X = 40,3 1,5 4,27 , ou seja,

entre 33,9 e 46,7? Resposta: no mnimo 1 1 2 = 0,56 , ou aproximadamente 56 %. Da


1,5
tabela anterior encontramos 9 das 10 mquinas tipo X que esto dentro deste intervalo e
claramente 9/10 maior do que 56 %.
A vantagem da Desigualdade de Chebyshev que ela pode ser aplicada variveis com
qualquer padro de distribuio (no importa que sejam simtricas, assimtricas,
mesocrticas, platicrticas, leptocticas, etc.). Entretanto, ela tem a desvantagem de no
ser muito precisa, j que a porcentagem efetiva que caem dentro do intervalo em torno da
mdia quase sempre muito maior do que o mnimo dado por 1 1 / h 2 , especialmente
quando as amostras so pequenas, como no nosso exemplo anterior.

Teorema: A Regra de Gauss. Se os dados so amostrais e se so, de forma aproximada,


distribudos normalmente, ou seja, o histograma dos dados aproximadamente simtrico
e tem a forma de um sino, ento:
1. X 1S incluir aproximadamente 68 % dos dados
2. X 2 S incluir aproximadamente 95 % dos dados
3. X 3S incluir aproximadamente 100 % dos dados
Chamamos isto de Regra de Gauss, porque baseada na distribuio de probabilidade
gaussiana (ou distribuio de probabilidade normal). Esta distribuio ser discutida em
detalhe em um captulo posterior.

44
2.5.16 Coeficiente de Variao

Com freqncia, como no caso do exemplo das duas mquinas, queremos comparar a
variabilidade de dois ou mais conjuntos de dados. Podemos fazer isto facilmente usando
as varincias ou os desvios padres quando, primeiro, todas as observaes individuais
tm a mesma unidade de medida e, segundo, as mdias dos conjuntos de dados so
aproximadamente iguais. Quando qualquer uma destas condies no satisfeita, uma
medida relativa de disperso deve ser usada. Uma medida relativa de variabilidade
freqentemente usada chamada de coeficiente de variao, denotada por CV para uma
amostra. Esta medida o valor do desvio padro em relao mdia:

S
CV =
X

Suponha que um cientista na ndia obteve os seguintes dados referentes aos pesos de
elefantes e ratos.
Elefantes Ratos
x E = 6.000 kg x R = 0,150 kg
sE = 300 kg sR = 0,04 kg

Se calcularmos os respectivos coeficientes de variao, teremos:


sE 300
cv(X E ) = = = 0,050 ou 5,0 %
x E 6000
sR 0,04
cv(X R ) = = = 0,266 ou 26,7 %
x R 0,150
Portanto, a variabilidade relativa dos pesos dos ratos mais do que 5 vezes maior do que
a variabilidade dos pesos dos elefantes. Para o exemplo anterior das mquinas, teremos:

45
4,27
cv(X) = = 0,1060 ou 10,60 %
40,30
11,62
cv(Y) = = 0,2848 ou 28,48 %
40,80
Assim, a disperso relativa da produo da mquina Y quase trs vezes maior do que a
disperso relativa da mquina X.

2.6 Medidas de Assimetria

Duas distribuies tambm podem diferir uma da outra em termos de assimetria ou


achatamento, ou ambas. Como veremos, assimetria e achatamento (o nome tcnico
utilizado para esta ltima caracterstica de forma da distribuio curtose) tm
importncia devido a consideraes tericas relativas inferncia estatstica que so
freqentemente baseadas na hiptese de populaes distribudas normalmente. Medidas
de assimetria e de curtose so, portanto, teis para se precaver contra erros aos estabelecer
esta hiptese.
Diversas medidas de assimetria so disponveis, mas introduziremos apenas uma, que
oferece simplicidade no conceito assim como no clculo. Esta medida, a medida de
assimetria de Pearson, baseada nas relaes entre a mdia, mediana e moda. Recorde
que estas trs medidas so idnticas em valor para uma distribuio unimodal simtrica,
mas para uma distribuio assimtrica a mdia distancia-se da moda, situando-se a
mediana em uma posio intermediria, a medida que aumenta a assimetria da
distribuio. Conseqentemente, a distncia entre a mdia e a moda poderia ser usada
para medir a assimetria. Precisamente,
Assimetria = mdia - moda
Quanto maior a distncia, seja negativa ou positiva, maior a assimetria da distribuio.
Tal medida, entretanto, tem dois defeitos na aplicao. Primeiro, porque ela uma
medida absoluta, o resultado expresso em termos da unidade original de medida da
distribuio e, portanto, ela muda quando a unidade de medida muda. Segundo, a mesma
grandeza absoluta de assimetria tem diferentes significados para diferentes sries de
dados com diferentes graus de variabilidade. Para eliminar estes defeitos, podemos medir

46
uma medida relativa de assimetria. Esta obtida pelo coeficiente de assimetria de
Pearson, denotado por SKP e dado por:

X Xm
SK P =
S

A aplicao desta expresso envolve outra dificuldade, que surge devido ao fato de que o
valor modal da maioria das distribuies ser somente uma distribuio, enquanto que a
localizao da mediana mais satisfatoriamente precisa. Contudo, em distribuies
moderadamente assimtricas, a expresso

X m = X 3( X X .5 )
adequada (no envolve impreciso muito grande). A partir disto, vemos que:

X X m = X [ X 3( X X .5 )] = 3( X X .5 )
Com este resultado, podemos rescrever o coeficiente de assimetria de Pearson como:
3( X X .5 )
SK P =
S
Esta medida igual a zero para uma distribuio simtrica, negativa para distribuies
com assimetria para a direita e positiva para distribuies com assimetria para a esquerda.
Ela varia dentro dos limites de 3. Aplicando SKP aos dados agrupados de gastos com
consumo de alimentos das famlias, temos:
3(170,25 167,92)
SK P = = +0,295
23,71

Este resultado revela que a distribuio de gastos com consumo de alimentos tem
assimetria moderadamente positiva (o que significa maior concentrao de famlias nas
classes de menor gasto). muito comum encontrar distribuies positivamente
assimtricas em dados econmicos, particularmente na produo e sries de preos, os

47
quais podem ser to pequenos quanto nulos mas podem ser infinitamente grandes.
Distribuies assimetricamente negativas so raras em cincias sociais.

2.7 Curtose: uma medida de achatamento

Apresentaremos agora uma medida de achatamento das distribuies, o coeficiente de


curtose, denotado por K. Esta medida algebricamente tratvel e geometricamente
interpretvel. definida como a relao entre o desvio semi-interquartlico, ou seja, a
metade do valor do desvio interquertlico, e o intervalo entre o decil 9 e o decil 1:

1
(Q3 Q1 )
K= 2
D9 D1

Por meio do coeficiente de curtose, classificamos diferentes graus de achatamento em trs


categorias: leptocrtica, platicrtica e mesocrtica (ver figura, a seguir). Uma
distribuio leptocrtica (curva a) tem a maior parte de suas observaes concentrada no
centro. Conseqentemente, a diferena entre as duas distncias, (Q3 - Q1) e (D9 - D1)
tende a ser muito pequena. Para um dado grau de disperso, quanto menor for o
achatamento da distribuio, menor ser diferena entre estas duas distncias. Desde que
(Q3 - Q1) < (D9 - D1) para uma distribuio com forma muito pontiaguda, K aproxima-
se de 0,5 no limite, quando Q3 - Q1 = D9 - D1. Ao contrrio, quanto mais platicrtica a
distribuio (curva b), mais o intervalo entre os decis 9 e 1 tende a exceder o intervalo
interquartlico. Portanto, quando o intervalo de uma varivel tende ao infinito e para uma
curva completamente achatada, K tende a zero. Em vista destas consideraes, parece
razovel estabelecer valores prximos de 0,25 para representar distribuies mesocrticas
(curva c). Esta escolha reforada pelo fato de que para a varivel normal padronizada, k
= 0,2630 (veremos este ponto em captulo posterior).

48
Na figura acima se compara a curtose de duas distribuies com a curtose de uma
distribuio mesocrtica (em linha tracejada). Na figura da direita temos uma distribuio
platicrtica (linha cheia) e na figura da esquerda temos uma distribuio leptocrtica
(linha cheia).

Aps o clculo dos quartis e decis a partir dos dados agrupados para a distribuio de
gastos com alimentao, temos que:

1
(Q3 Q1 ) (1 / 2)(188.39 154,83)
K= 2 =
D9 D1 209,78 146,58
= 0,2655
Este resultado indica que a distribuio de gastos com alimentos aproximadamente
mesocrtica, j que muito prximo de 0,25.

49
3. Probabilidade

Objetivos do captulo:

Definir o termo probabilidade.


Descrever as abordagens clssica, da freqncia relativa e subjetiva da probabilidade.
Entender os termos experimento, espaos amostral e evento.
Definir os termos probabildade condicional e probabilidade conjunta
Calcular probabilidades aplicando as regras da adio e da multiplicao
Determinar o nmero de possveis permutaes e combinaes
Calcular uma probabilidade usando o Teorema de Bayes

Probabilidade: uma medida de possibilidade de ocorrncia de um determinado


evento; ela pode assumir um valor entre 0 e 1
Evento: Uma coleo de um ou mais resultados de um experimento
Exemplo: Experimento  jogar uma moeda duas vezes

Possveis resultados (espao amostral)  { KK, KC, CK, CC }


Evento: no mnimo uma cara = {CC, CK, KC}

Como uma probabilidade expressa?

Uma probabilidade expressa como uma nmero decimal, tal como 0,70 ; 0,27 ; ou 0,50.
Entretanto ela pode ser representada como uma percentagem tal com 70 %, 27 % ou 50
%. O valor de uma probabilidade est localizado no intervalo de nmero reais que vai de
0 a 1, inclusive as extremidades deste intervalo.

50
Quanto mais uma probabilidade prxima de 0, o evento a ela associado mais
improvvel de ocorrer.
Quanto mais uma probabilidade prxima de 1, o evento a ela associado mais
provvel de ocorrer.

3.1 Definio Clssica de Probabilidade


Probabildade Clssica: baseada na hiptese de que os resultados de um experimento
so igualmente provveis.

Usando o ponto de vista clssico:

nmero de resultados favorveis


Probabilidade de um evento =
nmero total de possveis resultados

Considere o experimento de jogar duas moedas.

O espao amostral deste experimento S = { CC,CK,KC,KK}

Considere o evento: uma cara

nmero de resultados favorveis 2


Probabilidade de um evento = = =1
nmero total de possveis resultados 4 2

Definies

Eventos mutuamente exclusivos: a ocorrncia de qualquer um evento significa que


nenhum dos outros pode ocorrer ao mesmo tempo.

No caso do experimento de jogar duas moedas, os quatro possveis resultados so


mutuamente exclusivos.

51
CC CK

KC KK

Eventos Coletivamente Exaustivos: no mnimo um dos eventos deve ocorrer quando o


experimento conduzido.

No experimento de jogar 2 moedas, os quatro possveis resultados so coletivamente


exaustivos.

Soma das probabilidades = 1

Desde que cada resultado no experimento de jogar 2 moedas tem probabilidade igual
a , ento a soma das probabilidades dos resultados possveis + + + = 1

3.2 Conceito da Freqncia Relativa

A probabilidade de um evento ocorrer no longo prazo determinada pela


observao de que frao de vezes o evento ocorreu no passado.
A probabilidade pode ser calculada pela frmula:

nmero de vezes em que o evento ocorreu no passado


Pr obabilidade do evento =
nmero total de observaes

52
Exemplo 2

A questo de ser ou no um ru culpado: em uma amostra de 500 estudantes em um


determinado campus, 275 indicaram que o ru era culpado. Qual a probabilidade de
que um estudante neste campus indicar que o ru neste caso era culpado?
Nota: Neste problema podemos aplicar a frmula para a probabilidade baseada na
frequncia relativa.

Assim, P(culpado) = 275/500 = 0,55

3.3 Probabilidade Subjetiva

Probabilidade Subjetiva : a probabilidade de que um particular evento ocorra


atribuda por um indivduo e baseada em um conjunto de informao disponvel.

Exemplos de probabilidade subjetiva so:


Estimar a probabilidade de que o time de futebol da Ponte Preta disputar a final do
campeonato nacional.
Estimar a probabilidade de que voc obtenha conceito A neste curso.

3.4 Algumas Regras Bsicas de Probabilidade

Regra da Adio: Se dois eventos A e B so mutuamente exclusivos, a regra especial


da adio estabelece que a probabilidade de que A ou B ocorram igual a soma de
suas respectivas probabilidades. A regra dada pela seguinte frmula:

P(A ou B) = P(A) + P(B)

53
Exemplo 3

A companhia de aviao X recentemente forneceu a seguinte informao para o


Departamento de Aviao Civil (DAC) sobre os vos da origem A ao destino B

Chegada Frequncia
Adiantada 100
No horrio 800
Atrasada 75
Cancelado 25
Total 1000

Seja A o evento: o vo chega adiantado

Ento P(A) = 100 / 1000 = 0,1

Seja B o evento: o vo chega atrasado

Ento P(B) = 75 / 1000 = 0,075

Nota: os eventos A e B so mutuamente exclusivos. Por qu?

Qual a probabilidade de que um vo chegue adiantado ou atrasado?

P(A ou B) = P(A) + P(B) = 0,1 + 0,075 = 0,175

54
3.5 A Regra do Complemento

A regra do complemento usada para determinar a probabilidade de um evento ocorrer


subtraindo-se a probabilidade do evento no ocorrer de 1.

Seja P(A) a probabilidade do evento A e P ( A ) a probabilidade do evento no A


(complemento de A).

P( A) + P( A ) = 1

P( A) = 1 P( A )

Um diagrama de Venn pode ilustrar a Regra do Complemento:

Exemplo 3

Reconsidere os dados do exemplo 2. Seja C o evento: o vo chega no horrio. Ento


P(C) = 800 / 1000 = 0,8

Seja D o evento: o vo cancelado.

Ento P(D) = 25 / 1000 = 0,025

Nota: os eventos C e D so mutuamente exclusivos. Por qu?

55
Use a regra do complemento para mostrar que a probabilidade do vo chegar adiantado
(A) ou atrasado (B) 0,175

P(A ou B) = 1 P(C ou D) = 1 [0,8 + 0,025] = 0,175

O diagrama de Venn abaixo ilustra esta situao:

C D

0,8 0,025

(C ou D) = (A ou B) =
0,175

A regra do complemento muito importante no estudo de probabilidade. Com


freqncia, mais eficiente calcular a probabilidade de um evento ocorrer
determinando-se a probabilidade do evento no ocorrer e subtraindo o resultado de 1.

3.6 A Regra Geral da Adio

Sejam A e B dois eventos que no so mutuamente exclusivos. Ento P(A ou B)


dado pela seguinte frmula:

P(A ou B) = P(A) + P(B) P(A e B)

56
O Diagrama de Venn abaixo ilustra esta regra:

Exemplo 5

Em uma amostra de 150 estudantes, 70 disseram que somente tm um aparelho de


CD, 50 disseram que somente tm uma TV e 25 disseram que tm ambos. O
Diagrama de Venn a seguir descreve esta situao.

TV

50
Ambos

CD 25

70

57
Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha somente
um aparelho de CD ? De somente uma TV ? De tanto uma TV como um aparelho de
CD?

Seja C o evento o estudante tem um aparelho de CD e T o evento o estudante tem


uma TV

P(C) = 70 / 150 = 0,4667

P(T) = 50 / 150 = 0,3333

P(C e T) = 25 / 150 = 0,1667

Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha tanto


um aparelho de CD ou uma TV? (Nota: isto inclui a probabilidade de ter ambos os
aparelhos).

Desde que:

P(C ou T) = P(C) + P(T) P(C e T)

Ento, P(C ou T) = 0,4667 + 0,3333 0,1667 = 0,6333

3.7 Regras de Multiplicao

Regra Especial de Multiplicao

A regra especial de multiplicao requer que dois eventos A e B sejam independentes.

58
Definio: Dois eventos A e B so independentes se a ocorrncia de um no tem
efeito sobre a probabilidade de ocorrncia do outro.
A regra especial escrita simbolicamente como:

P(A e B) = P(A). P(B)

Para trs eventos independentes A,B e C, a regra especial da multiplicao usada para
determinar a probabilidade de que todos os eventos ocorram :

P(A e B e C) = P(A).P(B).P(C)

Exemplo 6

Um investidor possui duas aes. Uma de uma companhia de produo de petrleo e a


outra de uma cadeia de supermercados, de forma que podemos assumir que suas
cotaes so independentes. A probabilidade de que a ao da companhia de petrleo
suba no prximo ano 0,50. A probabilidade de que a cotao da cadeia de
supermercados aumente em valor no prximo ano 0,70.

Qual a probabilidade de que ambas as aes cresam em valor no prximo ano?


Seja A o evento: a cotao da companhia de petrleo cresce no prximo ano e seja B
o evento: a cotao da cadeia de supermercados cresce no prximo ano.

P(A e B) = (0,50).(0,70) = 0,35

Qual a probabilidade de que ao menos uma destas aes aumentem em valor no


prximo ano?
Isto implica que tanto uma pode aumentar (sem que a outra aumente) assim como ambas.
Portanto,
P(no mnimo uma) = (0,50).(0,30) + (0,50).(0,70) + (0,70).(0,50) = 0,85

59
Exemplo 7

Um estudo recente constatou que 60 % das mes com crianas de idade de at 10 anos
empregam-se em tempo integral. Trs mes so selecionadas aos acaso. Assumiremos
que as mes so empregadas de forma independente umas das outras.

Qual a probabilidade de que todas sejam empregadas em perodo integral?

P( todas as trs empregadas em perodo integral) = (o,60).(0,60).(0,60) = 0,216

Qual a probabilidade de que no mnimo umas das mes sejam empregadas em


perodo integral?

P(no mnimo uma) = 1 P(nenhuma empregada em perodo integral) =

1 [(0,40).(0,40).(0,40)] = 0,936

3.8 Probabilidade Condicional

a probabilidade de que um evento particular ocorra, dado que outro evento tenha
ocorrido.

Notao: A probabilidade do evento A dado que o evento B ocorreu denotada por


P(A/B)

Regra Geral da Multiplicao

A Regra Geral da Multiplicao usada para encontrar a probabilidade conjunta de


que dois eventos ocorram.

60
A regra estabelece que para dois eventos A e B, a probabilidade conjunta de que os
dois eventos ocorram obtida pela multiplicao da probabilidade de que o evento A
ocorra pela probabilidade condicional de B dado que A ocorreu.

A probabilidade conjunta, P(A e B) dada pela seguinte frmula:

P(A e B) = P(A) . P(B/A)

Alternativamente, podemos tambm escrever:

P(A e B) = P(B) . P(A/B)

Exemplo 8

Uma faculdade coletou a seguinte informao sobre seus estudantes de graduao:


Curso Homens Mulheres Total
Contabilidade 120 80 200
Finanas 110 70 180
Marketing 70 50 120
Administrao 110 100 210
Estatstica 50 10 60
Computao 140 90 230
Total 600 400 1000

Um estudante selecionado ao acaso. Qual a probabilidade de que o(a) estudante seja


mulher e que esteja cursando Contabilidade?

Seja A o evento: o(a) estudante est cursando Contabilidade e F o evento: o(a)


estudante mulher.

61
P(A e F) = 80 / 1000

Qual a probabilidade de selecionar uma mulher ?


P(F) = 400 / 1000

Dado que o(a) estudante mulher, qual a probabilidade de que esteja cursando
Contabilidade ?
Precisamos calcular P(A / F).

P(A / F) = P(A e F) / P(F) = [80 / 1000] / [400 / 1000] = 0,20

3.9 Diagramas em rvore

Um diagrama em rvore muito til para representar probabilidades conjuntas e


probabilidades condicionais. Ele particularmente til para analisar decises quando
h diversos estgios no problema.
Exemplo: Suponha que h 7 peas vermelhas e 5 peas azuis em uma sacola. Suponha
que voc selecione duas peas, uma aps a outra e sem reposio. Construa um
diagrama em rvore para esta informao.

62
6/11 V2  (7/12) (6/11)

V1
7/12

B2  (7/12) (5/11)
5/11

7/11
V2  (5/12) (7/11)
5/12

B1

4/11
 (5/12) (4/11)
B2

Probabilidades Probabilidades
Condicionais Conjuntas

63
3.10 Teorema de Bayes

Considere o seguinte diagrama com as parties A1 e A2 :

Espao Amostral

A1 A2

B
A1 e B A2 e B

P(A1 / B) = P(A1 e B) / P(B); P(A1 e B) = P(A1) . P(B / A1)

P(B) = P(A1 e B) + P(A2 e B);


P(A2 e B) = P(A2) P(B / A2)

A partir disto, temos a frmula seguinte (Teorema de Bayes):

P ( A1 ) P ( B / A1 )
P ( A1 / B ) =
P ( A1 ) P ( B / A1 ) + P ( A2 ) P ( B / A2 )

Nota: Este teorema pode ser estendido para diversas parties do espao amostral ( A1,
A2, A3, etc.)

64
Exemplo 9:

A Companhia C & W tem recebido recentemente diversas reclamaes de que suas


garrafas esto sendo preenchidas com contedo abaixo do especificado. Uma reclamao
foi recebida hoje mas o administrador da produo no capaz de identificar qual das
duas plantas (A ou B) preencheu a garrafa. Qual a probabilidade de que a garrafa com
pouco preenchimento provenha da planta A? Seja S o evento: a garrafa foi preenchida
com contedo abaixo do especificado.

% da Produo Total % de garrafas com pouco


preenchimento
A 55 3
B 45 4

0, 55 0, 03
P( A / S ) = = 0, 4783
0,55 0, 03 + 0, 45 0, 04

Anexo 1 Recordando Definies e Conceitos

Uma moeda mostra cara 50% do tempo, em mdia. Depois de muitos lances, o nmero de
caras aproximadamente igual ao nmero de coroas.

Um conceito de Probabilidade

nmero de caras
No limite quando o nmero de lances -> infinito 0,5
nmero de lanamenos
Dizemos que a probabilidade de aparecer uma cara em qualquer lance 1/2. Isto ilustra o
conceito de probabilidade que ser usada neste curso.

Exemplo - 10 000 lances de moeda

John Kerrich, um matemtico sul africano estava visitando Copenhague quando a


Segunda Guerra Mundial comeou. Dois dias antes de seu vo marcado para a Inglaterra,

65
os alemes invadiram a Dinamarca. Kerrich passou o resto da guerra internado em um
acampamento em Jutland e para passar o tempo ele levou a cabo uma srie de
experimentos em teoria da probabilidade. Em um destes experimentos, lanou uma
moeda 10.000 vezes. Seus resultados so mostrados no grfico seguinte.

10

% de
0
caras
50 %
-5

-10
10 100 100 1000
0 0
Nmero de lanamentos

(O eixo horizontal est em uma escala logartmica)


O lanamento de uma moeda 10 vezes um exemplo de um experimento aleatrio. A
maioria dos experimentos est sujeito a Variao Aleatria. A Teoria de probabilidade
a aproximao matemtica que busca quantificar em temos de modelos o que ocorre com
estes experimentos.

Exemplo - 2 lanamentos de uma moeda

Lance uma moeda duas vezes e registre para cada lance se o resultado era uma cara (C)
ou uma coroa (K). Exerccio: Liste os possveis resultados.
Seja A o evento deu uma ou mais caras. Quais resultados pertencem ao evento A? (CK,
KC, CC).
Seja B o evento no aparece nenhuma cara. (KK)

66
Neste exemplo, os eventos A e B so ditos disjuntos ou mutuamente exclusivos, pois eles
no tm nenhum resultado em comum. Eles tambm so exaustivos, j que eles cobrem
todos os possveis resultados do experimento.
Exerccio: Defina um evento C que no disjunto em relao a A.

DEFINIES

Um espao amostral o conjunto de todos os possveis resultados de um experimento.


Um evento um conjunto de um ou mais resultados no espao amostral.
Dois eventos so disjuntos ou mutuamente exclusivos se eles no tm nenhum resultado
em comum.
A variao aleatria ocorre quando impossvel predizer com certeza o resultado exato
de um experimento individual, mas como o experimento repetido um nmero grande de
vezes uma distribuio regular de freqncias relativas surge.
A probabilidade de um resultado ou evento pode ser determinada tanto
empiricamente (baseado em dados) ou teoricamente (baseado em um modelo
matemtico do processo). A definio emprica a seguinte: Suponha que um resultado
(ou evento) A ocorre f vezes em n observaes. Ento

nmero de vezes em que A ocorre f


frequncia relativa de A = =
nmero de observaes n

O conceito da probabilidade de um evento A um idealizao da freqncia relativa. o


valor limite da freqncia relativa quando n fica muito grande, i.e. quando n =>
f
P ( A) quando n
n

(P(A) denota a probabilidade de A ocorrer).


Estimativas tericas de probabilidade esto baseadas em suposies plausveis. A
suposio mais comum a de que todos os possveis resultados so igualmente provveis.
Ento

67
nmero de resultados correspondendo a A
P ( A) =
nmero total de resultados no espao amostral

Por analogia com freqncias relativas, as probabilidades tm as seguintes propriedades:


1. P(A) um valor entre 0 e 1.
2. P(A) = 0 significa A nunca acontece (correspondendo a f = 0)
3. P(A) = 1 significa A sempre acontece (correspondendo a f = n)
4. O conjunto S de todos os possveis resultados tem probabilidade 1. P(S) = 1, os
quais se agrupam em 5 eventos.

Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades

Se eventos X e Y so mutuamente exclusivos, ento,

P(X ou Y) = P(X) + P(Y)

Em geral, se eventos X e Y no so mutuamente exclusivos ento

P(X ou Y) = P(X) + P(Y) - P(X e Y).

Exemplo - Fruta em 2 distritos

Um certo tipo de fruta produzido em 2 distritos, A e B. Ambas as reas s vezes so


atacadas por uma praga (mariposa que ataca as frutas).
Suponha que as probabilidades so

P(A) = 1/10, P(B) = 1/20, P(A e B) = 1/50

Qual a probabilidade de que um ou outro (ou ambos) distrito esto infetados em um


determinado momento?

P(A ou B) = P(A) + P(B) - P(A e B)

= 0.1 + 0.05 - 0.02

= 0.13

68
Alternativamente, considere partes mutuamente exclusivas

P(A
somente) P(B somente)
P(A e B) = 0,05 0,02
= 0,1 0,02 = 0,02
= 0,08 = 0,03

A ou B consiste em 3 partes mutuamente exclusivas: A somente, B somente, A e B.


P(A ou B) = P(A somente) + P(B somente) + P(A e B)

= 0.08 + 0.02 + 0.03 = 0.13 .

Dois eventos X e Y so ditos independentes se a probabilidade de que X acontece no


afetada pelo fato de Y acontecer ou no. Pode ser mostrado que isto implica:
P(X e Y) = P(X)P(Y)
Esta chamado a regra de multiplicao para eventos independentes.

Exemplo - 2 guardas de segurana e o seus aparelhos de controle

H dois guardas de segurana para um grande estabelecimento. Cada um carrega um


aparelho de controle ativado por detectores nos edifcios. O Guarda 1 consciencioso e
est atento ao aparelho 80% do tempo. O Guarda 2 no to confivel e s responde ao
aparelho 50% do tempo.
Se os guardas relatam independentemente qualquer alerta para a polcia ou o corpo de
bombeiros, qual a probabilidade de que pelo menos um informar um alerta?
Seja X o evento o Guarda 1 relata o alerta. P(X) = 0.8
Seja Y o evento o Guarda 2 relata o alerta. P(Y) = 0.5
So os eventos X e Y mutuamente exclusivos? - No, ambos podem informar.
X e Y so independentes? - Considere por hiptese que Sim.
P(no mnimo um Guarda informa)

69
= P(X ou Y)

= P(X) + P(Y) - P(X e Y)

Mas P(X e Y) = P(X) P(Y) (independentes)

= 0.8 x 0.5 = 0.4

assim P(X ou Y) = 0.8 + 0.5 - 0.4 = 0.9


Assim embora Y s fidedigno 50% do tempo, empreg-lo aumenta a probabilidade de
informar um alerta.
Diagramas de rvore so teis em clculos que envolvem vrias fases. Cada segmento na
rvore uma fase do problema e as probabilidades nos ramos a partir de cada ponto tem
que somar 1. A probabilidade de alcanar o fim de qualquer caminho completo o
produto das probabilidades escritas em seus ramos.

Exemplo - Meninos e meninas em uma famlia de 3 filhos

Modelo de rvore para meninos (B) e meninas (G) em uma famlia de tamanho 3.
(ver figura a seguir)

70
Figura 1

Cada caminho representa um resultado ( famlia de 3 filhos). H 8 resultados. Se voc


assume que estes so igualmente provveis ento a probabilidade de cada 1/8.

por exemplo P(BGB) = 1/8.

Outro modo de calcular isto assumir que para cada nascimento

P(B) = P(G) = 1/2.

Ento por exemplo P(BGB) = 1/2 x 1/2 x 1/2 = 1/8 = 0.125


i.e. assumindo que sexo independente dos nascimentos prvios e multiplicando
probabilidades ao longo dos ramos da rvore.
Modelos de rvore so teis para analisar qualquer processo "passo por passo".

Exemplo - Gnero em populaes humanas

Em populaes humanas aproximadamente 52% de nascimentos so meninos e 48% so


meninas. Assim um modelo mais realista usar

71
P(B) = 0.52 P(G) = 0.48

Figura 2 - modelo mais realista

por exemplo P(BGB) = 0.52 x 0.48 x 0.52 = 0.13


Um evento qualquer subconjunto de resultados.
Calcule probabilidades para os eventos seguintes que usam o " modelo realista ".
C: todas as crianas tm o mesmo sexo
D: menos de 2 meninos
E: C e D ==> todas meninas
F: C ou D ==> no 2 meninos

72
GGG GGG GGG GGG
GGB GGB GGB GGB
GBG GGB GGB GGB
GBB GBB GBB GBB
BGG BGG BGG BGG
BGB BGB BGB BGB
BBG BBG BBG BBG

BBG BBG BBG BBG

BBB BBB BBB BBB


C D E F
P(C) = P(GGG) + P(BBB) = 0.11 + 0.14 = 0.25
P(D) = 0.11 + 3 x 0.12 = 0.47
P(E) = P(C e D) = P(GGG) = 0.11
P(F) = P(C ou D) = 0.11 + 3 x 0.12 + 0.14 = 0.61
Os eventos C e D no so mutuamente exclusivos (disjuntos) porque o resultado GGG
est em ambos. C e D podem acontecer simultaneamente.
Ento P(C ou D) = P(F) no igual a P(C)+P(D), porque isto contaria o resultado comum
(GGG) duas vezes.
[compare isto com a regra de adio para probabilidades de eventos mutuamente
exclusivos].
Ao invs, use a regra mais geral para P(C ou D)

= 0.25 + 0.47 - 0.11

= 0.61 como requerido

73
Anexo 3 - Probabilidade Condicional

A probabilidade de um evento A pode ter que ser recalculada se ns sabemos com certeza
que outro evento B j aconteceu e A e B no so independentes.

Exemplo - Uma famlia de 3 crianas

Em uma famlia de 3 crianas suponha se sabe que h menos que 2 meninos. Qual a
probabilidade que todas as 3 crianas so do mesmo sexo?
Usando a anotao prvia
C: todas as crianas do mesmo sexo
D: menos que 2 meninos.
Ns queremos a probabilidade de C dado que D aconteceu. Usaremos notao P(C|D)
descrever isto.

' C' ' D'


GGG GGG
GGB GGB
Cada coluna lista todo os resultados. GBG GBG
Aqueles que incluem o eventos GBB GBB
C e D esto em negrito. BGG BGG
BGB BGB
BBG BBG
BBB BBB

Como D aconteceu, s 4 resultados so agora possveis: GGG, GGB, GBG e BGG. As


sua probabilidades devem somar 1. Para obter estas probabilidades calculadas
previamente elas precisam ser "recalculadas" dividindo pelo seu total que era P(D) = 0.47.
A probabilidade de C, dado que D aconteceu, chamada de probabilidade condicional e
escrita como P(C|D). Lembre-se que a probabilidade de GGG era 0.11:

74
P(C ou D) 0,11
P(C / D ) = = = 0,23
P ( D) 0,47
Em geral para eventos X e Y a probabilidade condicional de X dado que Y aconteceu

P( X e Y)
P( X / Y ) =
P(Y)
P(X|Y) = P(X e Y)/P(Y) Isto pode ser rearranjado como:

P(X e Y) = P(X|Y)P(Y)

P(X e Y) = P(Y|X) P(X)

Exemplo - Gnero de empregados

A tabela abaixo mostra as probabilidades de homens (M) e mulheres (F) sendo


empregados (E) ou desempregados (U) em alguma populao (exclui aqueles que no
desejam ser empregado).

M F
E 0.52 0.41 0.93
U 0.05 0.02 0.07
0.57 0.43 1.00

Ache

(a) P(E|M), a probabilidade condicional de emprego dado que a pessoa masculina

(b) P(M|E), a probabilidade condicional de ser masculino dado que a pessoa


empregada.

Respostas:

75
P( E e M) 0,52
P( E / M ) = = = 0,91
P(M) 0,57

Figure 3: Modelo de rvore que mostra probabilidades condicionais

por exemplo P(E) = P(E e M) + P(E e F)

= P(E|M)P(M) + P(E|F)P(F)

= 0.91 x 0.57 + 0.95 x 0.43 = 0.93

P ( M e E)
P( M / E ) =
P( E )
P( E / M ) P( M )
=
P( E / M ) P( M ) + P( E / F ) P( F )
0,52
= = 0,56
0,93
Independncia Revisitada

A regra para a interseo de dois eventos

P(X e Y) = P(X)P(Y|X) = P(Y)P(X|Y)

Se P(X|Y) = P(X), ento diramos que X independente de Y que a probabilidade de X


ocorrer no afetada se Y acontece ou no. Substituindo isto na equao acima d P(X e
Y) = P(X) .P(Y), a regra para eventos independentes.

76
Anexo 4 Revisando os conceitos
Vimos at o momento alguns conceitos referentes Teoria das Probabilidades. Vamos
recordar alguns deles.

A definio clssica de probabilidade diz que a probabilidade de um evento calculada


como a razo existente entre o nmero de eventos favorveis a este particular evento e o
numero de eventos possveis e equiprovveis. Nesta definio temos que contar com uma
situao em que podemos desdobrar o evento (aquele para o qual queremos calcular a sua
probabilidade) em diversos sub-eventos. Por exemplo, queremos calcular a probabilidade
de que saia um numero par em uma jogada de um dado. Temos 3 sub-eventos favorveis
ao resultado (evento) par: 2, 4 e 6 e temos 6 eventos possveis e equiprovveis: 1,2,3,4,5,
e 6. Neste caso a probabilidade do evento par :

numero de eventos favoraveis a E 3


Pr ob( E ) = = = 0,5
numero de eventos possiveis e equiprovaveis 6

Se quisssemos calcular a probabilidade de ocorrncia de 2 nmeros pares na jogada


(simultnea ou no) de dois dados, o numero de eventos favorveis ao evento E = {saem
dois pares} 3: os eventos (2,2), (4,4) e (6,6). E temos neste casos 36 eventos possveis e
equiprovveis, pois na jogada de 2 dados podemos ter 36 combinaes possveis dentro
de dois conjuntos de 1 a 6, ou seja 6 vezes 6 = 36 combinaes. O espao amostral de
um experimento aleatrio definido como o conjunto de todos os possveis resultados
deste experimento. No experimento de jogar apenas um dado o especo amostral S =
{1,2,3,4,5,6} e no experimento de jogar dois dados o espao amostral S =
{(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3)........(6,6)}.
A probabilidade de sair dois nmeros pares no lanamento de dois dados , portanto:

77
numero de eventos favoraveis a E 9 1
Prob(E)= = = =0,25=25%
numero de eventos possiveis e equiprovaveis 36 4

Nos dois exemplos anteriores de lanamentos de dados no precisamos realizar os


experimentos para calcular as probabilidades. Estas foram calculadas de uma forma a
priori e para isto s precisamos definir os eventos e fazer algumas contagens, tomando-
se o cuidado de enumerar completamente o espao amostral, sem esquecer nenhum
evento. Outro cuidado que devemos tomar que o espao amostral seja definido em
termos de eventos possveis e equiprovveis, ou seja, todos os eventos que esto no
espao amostral devem ser equiprovveis. Muitas vezes um espao amostral pode ser
definido em termos de uma relao de eventos no equiprovveis. Por exemplo,
realizamos o experimento de uma famlia com duas crianas e contamos o numero de
meninas. O espao amostral pode ser definido neste caso de duas formas. A primeira S1
= {0 meninas, 1 menina, 2 meninas} e a segunda S2 = {(menino,menino),
(menino,menina),(menina,menina),(menina,menino). Observe que no segundo espao
amostral todos os eventos tem a mesma probabilidade que igual a (supondo-se que a
probabilidade de nascer um menino igual a probabilidade de nascer uma menina).
Se a probabilidade de nascer um menino igual a probabilidade de nascer uma menina
so iguais, ambas so iguais a . Agora, para nascer duas meninas em dois nascimentos
seguidos (e supondo-se que os resultados destes nascimentos so independentes, um
conceito que iremos definir mais precisamente mais adiante) a probabilidade deve ser
vezes = . O mesmo podemos dizer para qualquer um dos eventos do espao amostral
S2, todos tendo probabilidade igual a . Desta forma podemos dizer que os eventos do
espao amostral S2 so equiprovveis. No podemos dizer o mesmo a respeito do espao
amostral S1, pois, por exemplo, a probabilidade do evento {0 meninas} igual a , mas a
probabilidade do evento {1 menina} igual a . O espao amostral S1 no , portanto,
definido em termos de eventos equiprovveis.

Na segunda definio de probabilidade consideramos que a mesma tambm uma frao,


mas neste caso realizamos o experimento para calcular esta probabilidade. Por exemplo,

78
se desejarmos calcular a probabilidade de sair um nmero par em um lanamento de um
dado, lanamos este dado um numero bastante grande de vezes e contamos quantas vezes
saiu resultado par. medida que o numero de repeties do experimento vai se tornando
maior o resultado da diviso entre o numero de resultados favorveis ao evento (o dado
saiu par) e o numero de lanamentos (numero repeties do experimento) vai se
aproximando da probabilidade terica . Podemos enunciar esta definio de forma
rigorosa atravs da seguinte relao:

f (E)
Pr ob( E ) = lim = lim f R ( E )
n n n

onde f(E) a freqncia de ocorrncias do evento E (o numero de vezes em que o evento


E ocorre em n repeties do experimento) e n o numero de repeties do experimento.
fr(E) a freqncia relativa do evento E, ou seja, a proporo de vezes em que o evento E
ocorre (em relao ao numero de repeties do experimento). A definio diz a
probabilidade de um evento E o limite, quanto n tende ao infinito, da razo entre a
freqncia de ocorrncia do evento E e o numero de realizaes do experimento. A
medida que o numero de repeties do experimento vai se tornando maior a razo
f ( E ) / n vai se aproximando tendencialmente do verdadeiro valor (obtido atravs da
primeira definio) da probabilidade.
Podemos ver, portanto que probabilidade pode ser calculada de duas formas, uma forma
terica e uma forma emprica. Na primeira no precisamos realizar o experimento
para calcul-la. Na segunda, aguardamos o resultado da realizao do experimento com
uma repetio considervel de vezes para calcular a probabilidade. Qual deve ser o
numero de repeties necessrio para chegarmos a um valor bem aproximado da
probabilidade? Esta uma questo que no tem uma resposta terica. Apenas podemos
dizer que quanto maior o numero de repeties do experimento mais tendemos a nos
aproximar do valor terico obtido pela primeira definio. Pode ser que a verdadeira
probabilidade de um evento seja, digamos, 0,2 e ao repetirmos o experimento 1000 vezes
tenhamos como resultado 0,21 e ao repetirmos o experimento 10000 vezes tenhamos

79
0,18. Isto no quer dizer que na tendncia no estejamos nos aproximando do verdadeiro
valor. Tal situao muito difcil de ocorrer.

Axiomas da Teoria das Probabilidades

1) 0 P ( E ) 1

2) P(S)=1

3) P( ) = 0

4) P( A) = 1 P( A )

Regras da Teoria das Probabilidades

1) P( A B) = P( A) + P( B ) P ( A B )

Uma ampliao desta regra para 3 eventos :

P( A B C ) = P ( A) + P ( B) + P(C ) P( A B ) P ( A C ) P( B C )
+ P( A B C )

2) P( A B ) = P ( A) P ( B A) = P ( B ) P ( A B)

Onde P( B A) a probabilidade do evento B condicionada a ocorrncia do evento A. Por

exemplo, queremos calcular a probabilidade de que um aluno tire nota maior do que 7 se
ele estudar. O evento A neste caso A = {o aluno tira nota maior do que 7} e o evento B
B={o aluno estuda}. Temos neste exemplo um tpico caso de eventos dependentes, pois
certamente a ocorrncia de A ira depender da ocorrncia de B. A probabilidade do evento
A depende da ocorrncia (ou no ocorrncia) do evento B. De forma corriqueira, a
probabilidade do evento A (o aluno tirar nota maior do que 7) ter um valor caso ocorra o
evento B (o aluno estuda) e ter outro valor caso no ocorra B (o aluno no estuda). Se os
dois eventos A e B so independentes a probabilidade do evento A no depende da
ocorrncia do evento B, e vice versa, a probabilidade do evento B no depende da

80
ocorrncia do evento A. No conhecido exemplo do efeito borboleta suponhamos que
uma borboleta bata asas no corao do Estado de Minas Gerais e ocorra um terremoto em
Tquio. Certamente estes dois eventos so independentes e sua ocorrncia depende
unicamente da vontade divina.
Se quisermos calcular a probabilidade da ocorrncia simultnea de dois eventos
independentes basta multiplicar as probabilidades dos dois eventos individuais. Por
exemplo, suponhamos que um avio tem 4 motores e desejamos calcular a probabilidade
de que ocorra uma falha simultnea em todos os motores. Se supusermos que a ocorrncia
de falhas nos quatro motores so eventos independentes, podemos dizer que a ocorrncia
de falha simultnea nos 4 ser igual ao produto de suas probabilidades individuais (que
neste caso iremos supor que so todas as mesmas). Se a probabilidade de qualquer um
dos 4 motores falhar igual a 0,001, a probabilidade dos quatro motores falharem
simultaneamente ser 0,0014 = (10-3)4 = 10-12.

A suposio de independncia entre dois eventos uma hiptese bastante forte. Muitas
vezes podemos estar lidando com uma quase independncia, mas que no na pratica
independncia. No exemplo anterior, bastaria que a mesma equipe de mecnicos
realizasse a manuteno dos 4 motores para que no houvesse uma independncia perfeita
entre os 4 eventos.

Vimos anteriormente que pode ocorrer que dois eventos A e B no tenham interseco,
ou seja, A B = . Neste caso, dizemos que os dois eventos A e B so eventos
mutuamente exclusivos ou eventos disjuntos. Uma confuso freqente em teoria das
probabilidades assumir que dois eventos mutuamente exclusivos so necessariamente
independentes. Independncia de dois eventos no implica necessariamente a condio de
serem mutuamente exclusivos. E vice-versa, a condio de dois eventos serem
mutuamente exclusivos no implica necessariamente os mesmos eventos serem
independentes. Se dois eventos A e B so mutuamente exclusivos ento podemos dizer
que P( A B) = P() = 0 . Mas no podemos dizer que P( A B) = P( A) P ( B ) .

Seria assim se pelo menos uma das probabilidades dos dois eventos fossem nulas, ou seja,

81
P(A)=P(B)=0. Certamente existe um nico caso em que os dois eventos A e B so iguais
ao conjunto vazio e assim P( A B) = P( A) P ( B ) .

Podemos dizer tambm que existem muitos casos de eventos independentes para os quais
A B , ou seja, estes eventos tm uma interseco no vazia. O exemplo da
borboleta e do terremoto um caso tpico. Os dois eventos podem ocorrer
simultaneamente e tambm so independentes. Mas tambm podemos dizer que existem
eventos mutuamente exclusivos e que so tambm independentes. Neste caso a
probabilidade da ocorrncia simultnea dos dois eventos ser nula, pois sua interseco
o conjunto vazio. E se so tambm independentes necessariamente
P( A B) = P( A) P ( B ) e para que isto ocorra pelo menos um dos dois eventos (ou
ambos) tem probabilidade nula.
De fato, a nica maneira que dois eventos podem ser ambos mutuamente exclusivos e
independentes se no mnimo um deles tem probabilidade igual zero. Se A e B so
mutuamente exclusivos, sabendo-se que B ocorreu podemos dizer que A no ocorreu. Isto
bastante claro: a probabilidade condicional de A dado B zero! Isto muda a
probabilidade (condicional) de A a no ser que sua probabilidade (no condicional) seja
zero. Podemos concluir esta distino entre eventos mutuamente exclusivos e eventos
independentes com duas afirmativas:

1) Se dois eventos so mutuamente exclusivos, eles no podem ocorrer na mesma


tentativa: a probabilidade de sua interseco zero. A probabilidade de sua unio a
soma de suas probabilidades.

2) Se dois eventos so independentes, ambos podem ocorrer na mesma tentativa (exceto


possivelmente, se no mnimo um deles tem probabilidade zero). A probabilidade de sua
interseco o produto de suas probabilidades. A probabilidade de sua unio menos que
a soma de suas probabilidades, a menos que no mnimo um dos eventos tenha
probabilidade igual zero.

82
Um ultimo ponto sobre a interpretao de uma probabilidade condicional. Quando

dizemos P( A B ) estamos nos referindo a probabilidade de ocorrer o evento A sabendo-

se que ocorreu o evento B. Se A e B so eventos mutuamente exclusivos evidente que

P( A B ) = 0, pois A e B no podem ocorrer simultaneamente. A probabilidade


condicional pode ser interpretada como uma probabilidade calculada em um espao

amostral restrito. Quando dizemos P( A B ) o espao amostral passa a ser B

(anteriormente quando dizamos simplesmente P ( A) , ou seja, uma probabilidade no

condicional, o especo amostral para o calculo desta probabilidade era S, o espao


amostral original do experimento que estamos considerando). Vamos supor um exemplo
numrico em que S = {1,2,3,4,5,6,7,8,9,10}, A = {3,4,5,6} B = {5,6,7,8}. Suponhamos
que todos os algarismos de S possam ser selecionados com a mesma probabilidade de
1/10. Portanto neste caso P(A) = 4/10, P(B) = 4/10, A B = {5,6}, P( A B ) =2/10.

P( A B ) 2 /10
Pela regra do produto P( A B ) = = = 1/ 2
P( B ) 4 /10

Mas podemos interpretar a coisa da seguinte forma: quando calculamos P( A B ) o novo

espao amostral passa a ser B. Se aplicarmos a definio clssica de probabilidade temos


que:

numero de eventos favoraveis a A e que pertecem tambem a B 2


P( A B ) = = = 1/ 2
numero de eventos possiveis e equiprovaveis de B 4

J P ( A) , a probabilidade de A no condicional calculada como:

numero de eventos favoraveis a A 4


P( A B ) = =
numero de eventos possiveis e equiprovaveis de S 10

Se dois eventos A e B so independentes ento P( A B ) = P ( A) , P( B A) = P ( B) e

P( A B ) = P( A).P ( B)

83
Podemos generalizar isto dizendo que se k eventos Ai , i =1,2,..k so todos independentes
entre si, ento:

P( A1 A2 ... Ak ) = P( A1 ).P ( A2 )....P ( Ak )

Se os eventos no fossem independentes a probabilidade simultnea de todos os k eventos


seria:

P( A1 A2 ... Ak ) = P ( A1 ).P( A2 A1 ).P( A3 A1 A2 )...P ( Ak A1 A2 ... Ak 1 )

Soluo de Exerccios de Probabilidade

1) Durante o ms de agosto a probabilidade de chuva em um dia determinado de 4/10.


O Fluminense ganha um jogo em um dia com chuva com probabilidade de 6/10 e em
um dia sem chuva com probabilidade de 4/10. Sabendo-se que o Fluminense ganhou
um jogo naquele dia de agosto, qual a probabilidade de que choveu neste dia?

Enumeramos os seguintes passos metodolgicos para a soluo de um problema de


probabilidades:

a) Enunciar o experimento aleatrio que est sendo tratado.


b) Definir o espao amostral referente ao experimento aleatrio.
c) Definir os eventos relevantes do problema e apresentar os dados do problema e as
perguntas em termos de expresses de probabilidades
d) Aplicar as regras e princpios da Teoria das Probabilidades

No caso deste exerccio, o experimento aleatrio refere-se a jogos de futebol com um


determinado time observando-se as condies de tempo (se chove ou no) e qual o
resultado observado do jogo. O espao amostral deste experimento pode ser definido
como segue:

S = {F C , F C , F C , F C }

84
onde os eventos relevantes do problema so:

F = {o Fluminense ganha o jogo}


C = {chove no dia do jogo}

Os dados deste problema (apresentados no enunciado) so:

P(C ) = 0,4
P(F/C)=0,6
P(F/C)=0,4

E a pergunta feita no enunciado do problema :

P(C / F ) = ?

Faamos um Diagrama de Venn para auxiliar na compreenso do problema:

C C

Podemos ver que a figura oval corresponde ao evento F e a parte desta figura que est a

esquerda do trao vertical (que divide o evento C e C ) representa o evento C F , ou


seja o conjunto de resultados do espao amostral em que o Fluminense ganha o jogo em
um dia de chuva. A direita do trao vertical, temos a parcela da superfcie oval que

corresponde ao evento C F , ou seja, o conjunto de resultados em que o Fluminense


ganha o jogo em dias que no chove. Observe que devemos fazer uma importante

85
distino entre dois eventos diferentes: F C e F / C . No primeiro caso temos o
evento que corresponde a ocorrncia simultnea dos eventos F e C. No segundo caso
temos um evento a ocorrncia do evento F condicionado a ocorrncia do evento C.
Podemos perguntar qual a probabilidade de que o Fluminense ganhe em um dia de
chuva. Neste caso queremos saber P( F C ) . Outra coisa perguntarmos qual a

probabilidade de que o Fluminense ganhe caso ocorra um dia de chuva. Neste caso,
estamos perguntado o valor de P( F / C ) . A diferena bastante sutil, mas ela mostra a

distino entre uma probabilidade de um evento simultneo e a probabilidade de um


evento condicional.
Podemos perguntar, por exemplo, qual a probabilidade de que o pneu do meu carro fure
se ele novo (neste caso a probabilidade de um evento conjunto ou simultneo) e qual
a probabilidade de que ele fure sabendo-se que ele novo (neste caso temos a
probabilidade de um evento condicional).
Continuemos o exemplo do jogo de futebol. O que significa a expresso P(C ) = 0,4 ?

Significa que de cada cem partidas que o Fluminense joga aproximadamente em 40


chovem. O que significa a expresso P(F/C)=0,6 ? Significa que de cada 100 partidas

em que o Fluminense joga com chuva, em 60 destas partidas chuvosas ele ganha. O que

significa a expresso P(F/C)=0,4 . Significa que em 100 partidas que o Fluminense joga

em dias no chuvosos, em aproximadamente 40 ele ganha. Agora, se quisermos calcular


P( F C ) , procedemos da seguinte forma. Aplicando a regra do produto temos que:

P( F C ) = P (C ).P ( F / C ) = 0, 4 0,6 = 0, 24
O que significa esta ultima expresso? Significa que em cada cem partidas que o
Fluminense joga (incluindo-se nestas 100 partidas dias chuvosos e no chuvosos) em
aproximadamente 24 partidas o Fluminense ganha em dias chuvosos. Repare que esta
probabilidade bem distinta de P(F/C)=0,6 , pois aqui estamos afirmando que em cada

100 partidas que o Flu joga em dias chuvosos (estamos condicionando a este tipo de dia)
em aproximadamente 60 destas partidas o time ganha.

86
Continuemos a soluo do problema. Reparem que a metade esquerda do ovo mais a
metade direita formam o evento F (o Flu ganha o jogo). Isto pode ser dito assim:

F = (F C) (F C )
Esta expresso diz que o evento {o Flu ganha} formado pela unio de dois eventos: o
Flu ganha em dia com chuva e o Flu ganha em dia sem chuva. Observem pelo Diagrama
de Venn que estes dois eventos so disjuntos, ou seja, eles tem interseco igual ao
conjunto vazio. Isto ocorre porque ou o Flu ganha em um dia chuvoso ou ele ganha em
um dia no chuvoso e no existe meio-termo. Se dois eventos so iguais as suas
probabilidades tambm sero iguais. Ento podemos dizer que:

P( F ) = P (( F C ) ( F C ))

Sabemos que a probabilidade do conjunto unio de dois eventos disjuntos a soma das
probabilidades de cada um dos eventos unidos. Ento:

P( F ) = P ( F C ) + P ( F C )

Vamos aplicar o teorema do produto aos dois termos do lado direito da expresso acima.

P( F ) = P (C ).P ( F / C ) + P (C ).P ( F / C )

Todas as probabilidades do lado direito da expresso acima so dados do problema.

P( F ) = 0, 4 0,6 + 0,6 0, 4 = 0, 48

Ento temos aqui que de cada 100 partidas (no importando se chove ou no, pois neste
caso estamos lidando com uma probabilidade no condicional) em aproximadamente 48 o
Flu ganha.

87
Agora, estamos em condio de dar uma resposta a pergunta do problema. Pelo teorema
do produto, sabemos que:

P ( F C ) = P ( F ) P (C / F )
Portanto, manipulando os termos desta equao, temos que:

P ( F C ) 0,24
P (C / F ) = = = 0,50
P( F ) 0,48
que a resposta do problema. Um dos segredos para um bom entendimento da Teoria das
Probabilidades no nos contentarmos simplesmente com a soluo de um problema,
mas continuarmos a esmiuar o seu resultado tentando melhor compreende-lo e
interpretar o que conseguimos alcanar. Descobrimos que P(C / F ) = 0,50 o que

significa que de cada 100 partidas e que o Flu ganha o jogo, em aproximadamente 50
destas partidas chove. Isto bem diferente de dizer que P( F / C ) = 0,6 , pois aqui

estamos afirmando que em 100 partidas em dia chuvosos o Flu ganha em


aproximadamente 60 partidas. Poderamos tambm no satisfeitos com a simples soluo

do problema, perguntarmos qual o valor de P(C / F ) , P(C / F ) e P(C F ) .

Observe que C / F e C / F so dois eventos complementares. Quando consideramos um


evento C condicionado a um evento F estamos considerando que C ocorreu se F ocorreu.
O espao amostral aqui deixa de ser S (o espao amostral original do problema) e passa a
ser F. Agora estamos apenas considerando os jogos em que o Fluminense ganha (e nos
abstraindo retirando fora dos jogos em ele perde). Ento, quando estamos dizendo

C / F e C / F estamos nos referindo a duas possibilidades que perfazem todos os


resultados em que o Flu ganha. Em uma parte destas possibilidades (eventos) o jogo em
dia de chuva e em outra parte em dia sem chuva. Vimos pela soluo do problema que o
Flu ganha em 48 % dos jogos. Destes 48 jogos em 100, uma parte deles ocorre em dias de
chuva e outra parte ocorre em dias sem chuva. Ento quando dizemos C / F estamos nos
referindo aos eventos que so parte das 48 partidas que o Flu ganha e nas quais ocorre

88
chuva. A outra parcela corresponde aos dias no chuvosos em que o Flu ganha o jogo.
Desta forma podemos compreender que estes dois eventos so complementares, ou seja,

(C / F ) (C / F ) = F . Quando dois eventos unidos perfazem a totalidade do espao


amostral dizemos que eles so complementares em relao a este espao amostral. Da
mesma forma podemos dizer que F e F so complementares em relao ao espao

amostral S como tambm o so C e C . J que C / F e C / F so complementares, temos


que:

P(C / F ) = 1 P(C / F ) = 1 0,50 = 0,50

Observando o Diagrama de Venn podemos dizer que:

C = (F C ) (F C )
Em linguagem corriqueira, a expresso acima diz que as partidas que o Flu joga em dias
no chuvosos so constitudas por dois grupos: o grupo das partidas em dias no
chuvosos em que ele ganha e o grupo das partidas em dias no chuvosos em que ele
perde. Fazendo o mesmo procedimento j utilizado de tomar probabilidades de ambos os
termos da equao, temos:

P(C ) = P (( F C ) ( F C ))

Aplicando a regra da soma das probabilidades, temos:

P (C ) = P ( F C ) + P ( F C )

Aplicando agora a regra do produto aos dois termos do membro direito da equao acima,
temos:

89
P(C ) = P ( F ).P (C / F ) + P ( F C )

ou P ( F C ) = P (C ) P ( F ).P (C / F ) = 0,60 0, 48 0,50 = 0,36

Novamente, pelo teorema do produto temos que:

P (C F ) 0,36
P (C / F ) = = = 0,6923
P( F ) 0,52

Ou seja, em aproximadamente 70 % dos jogos em que o Flu perde ocorre de no chover.

Ento temos a seguinte contabilidade final para o problema. De cada 1000 partidas em
que o Flu joga, em 400 chove e em 600 no chove, pois P (C ) = 0,4 . Em 480 o Flu

ganha e em 520 ele perde, pois P ( F ) = 0, 48 . Das 400 partidas chuvosas, em 400x0,6 =

240 partidas o Flu ganha, pois P ( F / C ) = 0,6 e das 600 partidas no chuvosas, em

600x0,4=240 partidas ele ganha pois P ( F / C ) = 0,6 . Das 480 partidas em que o Flu

ganha em 240 chove, pois P (C / F ) = 0,5 . Ento temos o seguinte esquema:

F F
C 240 160 400

C 240 360 600

480 520 1000

Veja no quadro acima que todas as probabilidades discutidas e resolvidas no problema


esto representadas. Por exemplo, a probabilidade do Flu ganhar est representada pelos
480 em 1000, ou seja, 0,48. A probabilidade condicional do Flu ganhar em um dia
chuvoso est representada pelas 240 partidas que o Flu ganha em dias chuvosos em um
total de 400 dias chuvosos (primeira clula a esquerda da tabela) o que d 240 / 400 = 0,6

90
que P(F/C), um dado do problema. Podemos ver tambm que P (C F ) = 0,36 pois o

cruzamento da linha C e F representam 360 partidas em que ocorre simultaneamente do


Flu ganhar e chover ao mesmo tempo em um total de 1000 partidas jogadas pelo Flu. Em
resumo, na tabela acima as probabilidades dos eventos conjuntos (interseco de dois
eventos) podem ser calculadas como a diviso das clulas correspondentes e o total geral
de partidas jogadas pelo Flu (1000) e as probabilidades condicionais podem ser vistas
pela diviso de cada clula e o total das linhas ou colunas. Por exemplo, se quisermos ver

quanto P (C / F ) basta vermos a diviso do elemento linha C com a coluna F que

360 com o total da coluna F que 520 o que d 0,6923. Finalmente as probabilidades
no condicionais so obtidas atravs da diviso entre os totais das linhas ou colunas pelo
total geral (1000). Por exemplo, se quisermos calcular a probabilidade de no chover

basta dividirmos o total da linha C por 1000 o que d 0,6.


2) Num exame h 3 respostas para cada pergunta e apenas uma delas certa. Portanto,
para cada pergunta, um aluno tem probabilidade de 1/3 de escolher a resposta certa se ele
est adivinhando e 1 se sabe a resposta. Um estudante sabe 30 % das respostas do exame.
Se ele deu a resposta correta para uma das perguntas, qual a probabilidade de que a
adivinhou?

No caso deste problema qual o experimento? O experimento pode ser enunciado da


seguinte forma: Um aluno vai responder as perguntas de um exame de trs respostas
para cada pergunta sendo apenas uma certa e ele pode tentar adivinhar ou ele sabe
com inteira confiana a resposta certa para cada pergunta. Este experimento tem muitos
resultados para cada uma de suas realizaes. Vamos enumerar estes resultados:

S={ V A , V A , A }

Onde:
V = {o estudante acerta a questo}
A = {o estudante tenta adivinhar a questo}

91
Observem que quando ocorre o evento A , ou seja, o estudante sabe com segurana a
resposta certa da pergunta no existe nenhuma possibilidade dele errar. Isto quer dizer

que A V = . Por isso, no espao amostral acima somente colocamos A e no


desmembramos este evento como fizemos com o evento A. Vejamos agora a coisa em
termos de uma representao espacial atravs do Diagrama de Venn:

A V

A V

Quais so os dados do problema? Se em cada questo do exame h apenas uma resposta


certa em cada trs afirmativas, ento P (V / A) = 1/ 3 . Se o estudante sabe 30 % das

respostas do exame, ento P ( A) = 0,30 . E se existe certeza absoluta quando ele sabe a

resposta podemos dizer que P (V / A) = 1 . A pergunta do problema : P ( A / V ) = ? .

Tentando resolver este problema de forma intuitiva, isto , sem apelar para nossos
conhecimentos de Teoria das Probabilidades (sem aplicar as regras, teoremas e princpios
discutidos em sala de aula) podemos perceber que de 100 questes do exame, supondo-se
que seja um super-exame, 70 questes o aluno tenta adivinhar e 30 questes ele sabe. Das
70 questes que ele tenta adivinhar 1/3 que 23,33 ele acerta e 70 23.33 = 46.67 ele

92
erra. Portanto, no total ele acerta 30 + 23.33 = 53.33 questes e erra 46.67 questes. Se eu
quero saber quanto P ( A / V ) basta saber quantas respostas adivinhadas corresponde

em percentagem do total que ele acerta. Do total que ele acerta (53.33) em 23.33 ele
23.33
tentou (com final feliz) adivinhar. Portanto, P ( A / V ) = = 0,4375 = 43,75% .
53.33
Mas o professor de estatstica um esprito de porco engarrafado e no dar o gostinho
ao aluno para que ele exercite a sua poderosa intuio e vai exigir que ele resolva
formalmente o problema.

P( A V )
Sabemos pelo teorema do produto que P ( A / V ) = . Sabemos tambm, ao
P (V )
observar o diagrama de Venn acima que V = ( A V ) A . E que portanto,

P(V ) = P( A V ) + P ( A)

Aplicando novamente o Teorema do Produto para a expresso acima, temos que:

P(V ) = P ( A) P (V / A) + P ( A) = 0,70 1/ 3 + 0,30 = 0,5333

P( A V ) 0,70 1/ 3
Portanto P ( A / V ) = = = 0, 4375
P(V ) 0,5333

No satisfeitos novamente com a simples soluo do problema (porque somos insaciveis


estudantes de Estatstica) vamos tentar responder a outras probabilidades de eventos e
interpretar mais profundamente tudo que fizemos. Qual a probabilidade do aluno saber

a questo dado que ele acertou, ou seja, P ( A / V ) ? E qual a probabilidade de

ocorrerem simultaneamente os eventos A e V? E os eventos A e V ? Como poderamos


interpretar estas duas probabilidades e como poderamos distingui-las de probabilidades
condicionais semelhantes a elas? Como poderamos construir uma tabela semelhante ao

93
exerccio anterior em que fosse mais fcil, visualizar as diversas probabilidades de
eventos conjuntos, de eventos condicionais e eventos no condicionais? Deixo ao aluno
criativo e amante da Estatstica a resposta a estas questes que discutiremos em sala de
aula. Talvez esta cincia no tenha a forma concreta de um objeto comum de amor, mas
dada a sua coerncia e lgica ela atrai muito aqueles que sempre procuram verdade.
Scrates, Plato e muitos outros pensadores que no tiveram a oportunidade de virem
tudo isto, talvez hoje estejam no seu Hades observando com imenso prazer as nossas
belas tentativas.

2) Um simples mssil de certa variedade tem uma probabilidade de de derrubar um


bombardeiro, uma probabilidade de de danific-lo e uma probabilidade de de
err-lo. Alm disso, dois tiros danificadores derrubaro o avio. Se quatro destes
msseis so lanados, qual a probabilidade de derrubar um avio?

Podemos definir diversas seqncias de quatro lanamentos. Se chamarmos o evento D =


{o mssil derruba o bombardeiro}, o evento B = {o mssel danifica o bombardeiro} e o
evento E = {o missel erra o bombardeiro} teoricamente temos 34 seqncias de 4 tiros,
ou, seja 81 seqncias. As seqncias que tiverem dois ou mais tiros danificadores ou
apenas um tiro que derruba o avio so consideradas os eventos favorveis a derrubar o
avio.

94
D2
D1
D3
B1 B2

B3 D4
E2

E3 B4

E4
D2
D3
E1
B2 B3
D4
E3
B4

E4
E2 D3
D4
B3
B4
E3
E4

Ento, para este experimento temos o seguinte espao amostral:

S = {D1, B1D2, B1B2, B1E2D3, B1E2B3, B1E2E3D4, B1E2E3B4,


B1E2E3E4,E1D2,E1B2D3,E1B2B3,E1B2E3D4,E1B2E3B4,E1B2E3E4,E1E2D3,
E1E2B3D4,E1E2B3B4,E1E2B3E4,E1E2E3D4,E1E2E3B4,E1E2E3E4}

Com exceo das seqncias B1E2E3E4, E1B2E3E4, E1E2B3E4, E1E2E3B4 e E1E2E3E4, todas
as demais derrubam o avio. Portanto, utilizando o evento complementar e considerando
os resultados de cada tiro independentes, temos:

P(derrubar) = 1
(1/4x1/2x1/2x1/2+1/2x1/4x1/2x1/2+1/2x1/2x1/4x1/2+1/2x1/2x1/2x1/4+1/2x1/2x1/2x1/2
) = .....

95
Resumo do Clculo de Probabilidades

96
Exerccios de Probabilidade

3) Trs moedas so jogadas simultaneamente. Qual a probabilidade de obter 2 caras?


Qual a probabilidade de obter pelo menos 2 caras?

4) Dois dados so jogados simultaneamente. Calcular a probabilidade de que a soma dos


nmeros mostrados nas faces de cima seja 7.

5) Dois dados so jogados simultaneamente. Calcular a probabilidade de que o mximo


seja maior ou igual a 3.

6) Para a Copa do Mundo 24 pases so divididos em seis grupos, com 4 pases cada um.
Supondo que a escolha do grupo de cada pas feita ao acaso, calcular a
probabilidade de que dois pases determinados A e B se encontrem no mesmo grupo. (
Na realidade a escolha no feita de forma completamente aleatria).

7) Uma loteria tem N nmeros e s um prmio. Um jogador compra n bilhetes em uma


extrao. Outro compra s um bilhete em n extraes diferentes. ( Ambos os
jogadores apostam portanto a mesma importncia). Qual deles tem maior
probabilidade de ganhar o prmio?

8) Seis bolas so colocadas em trs urnas diferentes. Qual a probabilidade de que todas
as urnas estejam ocupadas?

9) Um nmero entre 1 e 300 escolhido aleatoriamente. Calcular a probabilidade de que


ele seja divisvel por 3 ou por 5.

10) Um torneio disputado por 4 times A,B, C e D. 3 vezes mais provvel que A vena
do que B, duas vezes mais provvel que B vena do que C e 3 vezes mais provvel
que C vena do que D. Quais as probabilidades de ganhar para cada um dos times?

11) Uma caixa contem 20 peas em boas condies e 15 em ms condies. Uma amostra
de 10 peas extrada. Calcular a probabilidade de que ao menos uma pea na
amostra seja defeituosa.

12) Uma cidade tem 30 000 habitantes e trs jornais A, B e C. Uma pesquisa de opinio
revela que:

12 000 lem A;
8 000 lem B;
7 000 lem A e B;
6 000 lem C;
4 500 lem A e C;

97
1 000 lem B e C;
500 lem A,B e C.

Qual a probabilidade de que um habitante leia:

a)Pelo menos um jornal;


b)S um jornal.

13) Os algarismos 1,2,3,4,5 so escritos em 5 cartes diferentes. Estes cartes so


escolhidos (sem reposio) aleatoriamente e os algarismos que vo aparecendo so
escritos da esquerda para a direita, formando um nmero de 5 algarismos.

a)calcular a probabilidade de que o nmero escrito seja par


b)Se a escolha fosse com reposio qual seria a probabilidade?

14) Colocam-se aleatoriamente b bolas em b urnas. Calcular a probabilidade de que


exatamente uma urna seja deixada desocupada.

15) Dez pessoas so separadas em dois grupos de 5 pessoas cada um. Qual a
probabilidade de que duas pessoas determinadas A e B faam parte do mesmo grupo?

16) 5 homens e 5 mulheres compram 10 cadeiras consecutivas na mesma fila de um


teatro. Supondo que se sentaram aleatoriamente nas 10 cadeiras, calcular:

a)a probabilidade de que homens e mulheres se sentem em cadeiras alternadas;


b)A probabilidade de que as mulheres se sentem juntas.

17) Um nmero entre 1 e 200 escolhido aleatoriamente. Calcular a probabilidade de


que seja divisvel por 5 ou por 7.

18) Uma moeda foi cunhada de tal forma que 4 vezes mais provvel de dar cara do que
coroa. Calcular as probabilidades de cara e coroa.

19) Aos nmeros inteiros entre 1 e n so designadas probabilidades proporcionais aos


seus valores. Calcular P(i) para 1 i n

20) Trs dados so jogados simultaneamente. Calcular a probabilidade de obter 12 como


a soma dos resultados.

21) Sejam A e B eventos tais que

98
1 1 1
P ( A) = , P(B) = e P(A B) =
2 4 5
Calcular :
a) P ( A B )
b) P(A)
c) P( B)
d) P(A B)
e) P(A B)
f) P(A B)
g) P(A B)

22) No jogo da Sena so sorteadas 6 dezenas distintas entre as dezenas 01 02 - ...- 50. O
apostador escolhe 6 dessas 50 dezenas e premiado se so sorteadas 4 (quadra), 5
(quina), 6 (Sena Principal) das dezenas por ele escolhidas ou se as dezenas sorteadas
so escolhidas aumentadas (Sena Anterior) ou diminudas (Sena Posterior) de uma
unidade (50 +1 = 01, 01 1 = 50). Determine a probabilidade de uma apostador fazer:

a) uma quadra
b) uma quina
c) a Sena Principal
d) A Sena Anterior ou a Posterior.

23) No jogo da Loto so sorteadas 5 dezenas distintas entre as dezenas 01 02 - ...- 99 -


00. O apostador escolhe 6,7,8,9 ou 10 dezenas e premiado se so sorteadas 3 (terno),
4 (quadra) ou 5 (quina) das dezenas escolhidas. Determine a probabilidade de uma
apostador que escolheu 10 dezenas fazer:

a) um terno
b) uma quadra
c) a quina

24) Na Loteria Esportiva h 13 jogos e o apostador deve indicar em cada um deles a


vitria do time 1, a vitria do time 2 ou o empate. Um jogador premiado:

a) com 10 pontos, se acerta os resultados dos 10 primeiros jogos e erra os dos 3 ltimos;
b) com 11 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas um dos
resultados dos 3 ltimos;
c) com 12 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas 2 dos
resultados dos 3 ltimos;

99
d) com 13 pontos, se acerta os resultados dos 13 jogos.

Supondo que em cada jogo os resultados possveis tenham probabilidades iguais,


determine a probabilidade de um apostador ser premiado:

a) com 10 pontos;
b) com 11 pontos;
c) com 12 pontos;
d) com 13 pontos.

25) Escolhem-se ao acaso duas peas de um domin. Qual a probabilidade delas


possurem um nmero comum?

26) Em um armrio h n pares de sapatos. Retiram-se ao acaso p pares de sapatos desse


armrio. Qual a probabilidade de haver entre esses ps exatamente k pares de sapatos?

27) Colocam-se ao acaso n botes em um tabuleiro n x n, no sendo permitido haver dois


botes em uma mesma casa. Qual a probabilidade de no haver dois botes nem na
mesma linha nem na mesma coluna?

28) Um polgono regular de 2n + 1 lados est inscrito em um crculo. Escolhem-se 3 dos


seus vrtices, formando-se um tringulo. Qual a probabilidade do centro do crculo
ser interior ao tringulo?

29) Tem-se n urnas. Bolas so colocadas ao acaso nas urnas, uma de cada vez, at que
alguma urna receba duas bolas. Qual a probabilidade de colocarmos exatamente p
bolas nas urnas?

30) Joo e Pedro lanam, cada um, um dado no-tendencioso. Qual a probabilidade do
resultado de Joo ser maior ou igual ao resultado de Pedro?

31) Numa prova h 7 perguntas do tipo verdadeiro-falso. Calcular a probabilidade de


acertarmos todas as 7 se:

a) escolhermos aleatoriamente as 7 respostas,


b) escolhermos aleatoriamente as respostas mas sabendo que h mais respostas
verdadeiro do que falso.

32) Sabe-se que 80 % dos pnaltis marcados a favor do Brasil so cobrados por jogadores
do Flamengo. A probabilidade de um pnalti ser convertido 40 % se o cobrador for
do Flamengo e de 70 % em caso contrrio. Um pnalti a favor do Brasil acabou de ser
marcado:

a) Qual a probabilidade do pnalti ser cobrado por um jogador do Flamengo e ser


convertido?

100
b) Qual a probabilidade do pnalti ser convertido?

c) Um pnalti foi marcado a favor do Brasil e acabou de ser desperdiado. Qual a


probabilidade de que o cobrador tenha sido um jogador do Flamengo?

33) Marina quer enviar uma carta a Vernica. A probabilidade de que Marina escreva a
carta de 8/10. A probabilidade de que o correio no perca de 9/10. A probabilidade
de que o carteiro entregue de 9/10. Dado que Vernica no recebeu a carta, qual a
probabilidade condicional de que Marina no a tenha escrito?

34) Durante o ms de agosto a probabilidade de chuva em um dia determinado de 4/10.


O Fluminense ganha um jogo em um dia com chuva com probabilidade de 6/10 e em
um dia sem chuva com probabilidade de 4/10. Sabendo-se que o Fluminense ganhou
um jogo naquele dia de agosto, qual a probabilidade de que choveu neste dia?

35) Num exame h 3 respostas para cada pergunta e apenas uma delas certa. Portanto,
para cada pergunta, um aluno tem probabilidade de 1/3 de escolher a resposta certa se
ele est adivinhando e 1 se sabe a resposta. Um estudante sabe 30 % das respostas do
exame. Se ele deu a resposta correta para uma das perguntas, qual a probabilidade
de que a adivinhou?

36) Um jogador deve enfrentar, em um torneio, dois outros A e B. Os resultados dos


jogos so independentes e as probabilidades dele ganhar de A e de B so 1/3 e 2/3
respectivamente. O jogador vencer o torneio se ganhar dois jogos consecutivos, de
uma srie de 3. Que srie de jogos mais favorvel ao jogador: ABA ou BAB?

37) A probabilidade de fechamento de cada rel do circuito apresentado na figura abaixo


igual a p, 0 < p < 1.

2
3

A 1 4 5 B

Se todos os rels funcionam independentemente, qual a probabilidade de que haja


corrente circulando entre os terminais A e B?

38) Escolhe-se ao acaso um nmero entre 1 e 50. Se o nmero primo qual a


probabilidade de que seja mpar?

101
39) Uma moeda jogada 6 vezes. Sabendo-se que no primeiro lanamento deu coroa,
calcular a probabilidade condicional de que o nmero de caras nos 6 lanamentos
supere o nmero de coroas.

40) Uma moeda jogada 4 vezes. Sabendo que o primeiro resultado foi cara, calcular a
probabilidade condicional de obter pelo menos 2 caras.

41) Joga-se um dado duas vezes. Calcule a probabilidade condicional de obter 3 na


primeira jogada, sabendo que a soma dos resultados foi 7.

42) Duas mquinas A e B produzem 3000 peas em um dia. A mquina A produz 1000
peas, das quais 3 % so defeituosas. A mquina B produz as restantes 2000, das
quais 1 % so defeituosas. Da produo total em um dia uma pea escolhida ao
acaso e, examinando-a, constata-se que defeituosa. Qual a probabilidade de que a
pea tenha sido produzida pela mquina A?

43) Um estudante resolve um teste do tipo verdadeiro-falso. Ele sabe dar a soluo
correta para 40 % das questes. Quando ele responde uma questo cuja soluo
conhece, d a resposta correta, e nos outros casos decide na cara ou coroa. Se uma
questo foi respondida corretamente, qual a probabilidade que ele sabia a resposta?

44) Sejam A e B dois eventos independentes tais que

P(A) = 1/3 e P(B) =

Calcule P ( A B ), P(A B) e P(A B)

45) Sejam A e B dois eventos independentes tais que

P ( A) = 1 / 4 e P(A B) = 1/3

Calcule P(B)

46) Uma moeda equilibrada jogada duas vezes. Sejam A e B os eventos:

A: cara na primeira jogada;


B: cara na segunda jogada
Verifique que A e B so independentes

47) Jogue um dado duas vezes. Considere os eventos:

A = o resultado do 1 lanamento par;


B = o resultado do 2 lanamento par;

102
C = a soma dos resultados par.

A e B so independentes? e A e C? e B e C? e A, B e C?

48) Uma pessoa com um molho de n chaves tenta abrir uma porta. Apenas uma das
chaves consegue abrir a porta. Qual a probabilidade dela s conseguir abrir a porta
na k-sima tentativa:

a) supondo que aps cada tentativa mal sucedida ela descarta a chave usada;
b) supondo que ela no faz isso.

49) (Problema de Chevalier de Mr) Determine a probabilidade de obter:

a) ao menos um 6 em 4 lanamentos de um dado;


b) ao menos um duplo 6 em 24 lanamentos de um par de dados.

50) A probabilidade de um homem ser canhoto 1/10. Qual a probabilidade de, em um


grupo de 10 homens, haver pelo menos um canhoto?

51) Sacam-se, sucessivamente e sem reposio, duas cartas de um baralho comum (52
cartas). Calcule a probabilidade de a 1 carta ser uma dama e a 2 ser de copas.

52) Um exame de laboratrio tm eficincia de 95 % para detectar uma doena quando


essa doena existe de fato. Entretanto o teste aponta um resultado falso positivo
para 1 % das pessoas sadias testadas. Se 0,5 % da populao tem a doena, qual a
probabilidade de uma pessoa ter a doena dado que seu exame foi positivo?

53) A lana uma moeda n+ 1 vezes e B lana a mesma moeda n vezes. Qual a
probabilidade de A obter mais caras que B?

54) Quantas pessoas voc deve entrevistar para ter probabilidade igual ou superior a 0,5
de encontrar pelo menos uma que aniversarie hoje?

55) Uma urna contm 3 bolas vermelhas e 7 bolas brancas. A e B sacam alternadamente,
sem reposio, bolas dessa urna at que uma bola vermelha seja retirada. A saca a
primeira bola. Qual a probabilidade de A sacar a bola vermelha?

56) Em uma cidade com n+ 1 habitantes, uma pessoa conta um boato para outra pessoa, a
qual por sua vez conta para uma terceira pessoa, etc. Calcule a probabilidade do boato
ser contado m vezes:

a) sem retornar primeira pessoa;


b) sem repetir nenhuma pessoa.

103
57) Sacam-se, com reposio, n (n > 1) bolas de uma urna que contem 9 bolas
numeradas de 1 a 9. Qual a probabilidade do produto dos nmeros das n bolas
extradas ser divisvel por 10?

58) Quantas vezes, no mnimo, se deve lanar um dado no tendencioso para que a
probabilidade de obter algum 6 seja superior a 0,9?

59) Um jri de 3 pessoas tem dois jurados que decidem corretamente (cada um) com
probabilidade p e um terceiro jurado que decide por cara ou coroa. As decises so
tomadas por maioria. Outro jri tem probabilidade p de tomar uma deciso correta.
Qual dos jris tem maior probabilidade de acerto?

60) Um dia voc captura 10 peixes em um lago, marca-os e coloca-os no lago


novamente. Dois dias aps, voc captura 20 peixes no mesmo lago e constata que 2
desses peixes haviam sido marcados por voc.

a) se o lago possui k peixes, qual era a probabilidade de, capturando 20 peixes, encontrar
dois peixes marcados?
b) para que valor de k essa probabilidade mxima?

61) Qual a probabilidade de, em um grupo de 4 pessoas:

a) haver alguma coincidncia de signos zodiacais?


b) as quatro terem o mesmo signo?
c) duas terem o mesmo signo, e as outras duas, outro signo?
d) trs terem o mesmo signo e, a outra, outro signo?
e) todas terem signos diferentes?

62) Deseja-se estimar a probabilidade p de um habitante de determinada cidade ser um


consumidor de drogas. Para isso realizam-se entrevistas com alguns habitantes da
cidade. No se deseja perguntar diretamente ao entrevistado se ele usa drogas, pois ele
poderia se recusar a responder ou, o que seria pior, mentir. Adota-se ento o seguinte
procedimento: prope-se ao entrevistado duas perguntas do tipo SIM-NO:

I) Voc usa drogas?


II) Seu aniversrio anterior ao dia 2 de julho?

Pede-se ao entrevistado que jogue uma moeda, longe das vistas do entrevistador, e que se
o resultado for cara, responda primeira pergunta e, se for coroa, responda segunda
pergunta.

a) sendo p1 a probabilidade de um habitante da cidade responder sim, qual a relao


entre p e p1 ?
b) se forem realizadas 1000 entrevistas e obtidos 600 sim razovel imaginar que
p1 0,6. Qual seria, ento, sua estimativa de p?

104
63) Uma firma fabrica chips de computador. Em um lote de 1000 chips, uma
amostra de 10 chips revelou 1 chip defeituoso. Supondo que no lote houvesse k
chips defeituosos:

a) Calcule a probabilidade de em uma amostra de 20 chips haver exatamente 1


chipdefeituoso.
b) Determine o valor de k que maximiza a probabilidade calculada no item a).

64) Jogamos uma moeda no viciada 10 vezes. Qual a probabilidade de obtermos


exatamente 5 caras?

65) Um aluno marca ao acaso as respostas em um teste mltipla-escolha com 10 questes


e 5 alternativas por questo. Qual a probabilidade dele acertar exatamente 4
questes?

66) Joga-se uma moeda no viciada. Qual a probabilidade de serem obtidas 5 caras
antes de 3 coroas?

67) Lana-se um dado no viciado at a obteno do terceiro 6. Seja X o nmero do


lanamento em que isto ocorre. Calcule:

a) P(X = 10); b) P(X > 10); c) P(X = 10).

68) Dois adversrios A e B disputam uma srie de partidas. A probabilidade de A ganhar


uma partida 0,6 e no h empates. Qual probabilidade de A ganhar a srie?

69) Dois adversrios A e B disputam uma srie de partidas. O primeiro que obtiver 12
vitrias ganha a srie. No momento o resultado 6 x 4 a favor de A. Qual a
probabilidade de A ganhar a srie sabendo que em cada partida as probabilidades de
A e B vencerem so respectivamente 0,4 e 0,6?

70) Motores de avio funcionam independentemente e cada motor tem uma


probabilidade p de falhar durante o vo. Um avio voa com segurana se a maioria de
seus motores funciona. Para que valores de p um avio com 3 motores prefervel a
um avio com 5 motores?

69) Suponha que uma caracterstica (como a cor dos olhos, por exemplo) dependa de um
par de genes. Representemos por A um gen dominante e por a um gen recessivo.
Assim um indivduo com genes AA dominante puro, um com genes aa um
recessivo puro e um com genes Aa um hbrido. Dominantes puros e hbridos so
semelhantes em relao caracterstica. Filhos recebem um gen do pai e um da me.
Suponha que pai e me sejam hbridos e tenham 4 filhos.
a) Qual a probabilidade do primeiro filho ser um recessivo puro?
b) Qual a probabilidade de exatamente um dos 4 filhos ser um recessivo puro?

105
70) (O problema das caixas de fsforos de Banach18) Um matemtico sai de casa todos os
dias com duas caixas de fsforos, cada uma com n palitos. Toda vez que ele que
acender um cigarro, ele pega (ao acaso) uma das caixas e retira da um palito. O
matemtico meio distrado, de modo que quando ele retira o ltimo palito de uma
caixa, ele no percebe que a caixa est vazia. Como ele fuma muito, em certa hora
ele pega uma caixa e constata que ela est vazia. Qual a probabilidade de nesse
momento a outra caixa conter exatamente k ( 0 k n ) palitos?

71) Lana-se repetidamente um par de dados no tendenciosos. Qual a probabilidade de


obtermos duas somas iguais a 7 antes de obtermos trs somas iguais a 3?

72) Uma moeda tem probabilidade 0,4 de dar cara. Lanando-a 12 vezes qual o mais
provvel valor do nmero de caras obtidas?

73) Suponha que uma varivel aleatria T tem a seguinte distribuio de probabilidade

T 0 1 2
P(T=t) 0,5 0,3 0,2

a. Ache P(T <= 0)


b. Ache P(T >= 0 and T < 2)
c. Calcule E(T), a mdia da varivel aleatria T.

74) Suponha que voc escolha uma bola de uma urna contendo 7 bolas vermelhas, 6 bolas
brancas , 5 bolas azuis e 4 bolas brancas. Qual a probabilidade de que voc escolha
uma bola vermelha?

75) Suponha que voc escolha uma bola aleatoriamente de uma urna 7 bolas vermelhas, 6
bolas brancas, 5 bolas azuis e 4 bolas amarelas. Qual a probabilidade de que voc
escolha uma bola branca?

76) Um dado no viciado jogado duas vezes. Ache a probabilidade de sair um 5 ou 6 no


primeiro lance e um 1, 2 ou 3 no segundo lance.

77) Ache a probabilidade de no sair um 5 ou 6 em qualquer uma de duas jogadas de um


dado no viciado.

78) Voc tem um baralho de 52 cartas bem embaralhadas. Qual a probabilidade de


escolher dois valetes consecutivos se a primeira carta no recolocada no baralho?

18 Stefan Banach (1892-1945), matemtico polons

106
79) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a
probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado
que cada bola recolocada na urna depois de escolhida.

80) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a
probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado
que cada bola no recolocada na urna depois que ela escolhida.

81) A urna A contem 2 bolas vermelhas e 3 azuis. A urna B contem 8 bolas


vermelhas e 2 azuis. Voc joga uma moeda honesta. Se amoeda mostra cara voc
escohe uma bola da urna A. Se a moeda mostra coroa voc escolhe uma bola da urna
B. Determine a probabilidade de que voc escolha uma bola vermelha.

82) Voc tem 6 bolas, cada uma de cor diferente. De quantas maneiras distintas voc
pode dispo-las em uma fila?

83) De quantas maneiras possveis 8 pessoas podem sentar-se em um banco se apenas


esto disponveis 3 assentos?

84) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos
0,1,2,..,9 se repeties so permitidas?

85) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos
0,1,2,..,9 se repeties no so permitidas?

86) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de
Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los
se todos os livros de cada assunto precisam ficar juntos?

87) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de
Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los
se somente os livros de Cincias precisam ficar juntos?

88) Calcule C(8,3)

89) De quantas maneiras pode um comit de 6 pode ser escolhido de 10 pessoas?

90) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3 mdicos e 4


enfermeiras precisa ser formado. De quantas maneiras isto pode ser feito se um
particular mdico deve ser includo e se qualquer enfermeira pode ser includa?

91) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3 mdicos e 4


enfermeiras precisa ser formado. De quantas maneiras isto pode ser feito se uma
particular enfermeira no pode ser includa no comit?

92) De quantas maneiras diferentes saladas de frutas podem ser feitas de ma, laranja,
tangerina e banana?

107
93) A partir de 6 consoantes e 4 vogais, quantas combinaes distintas de letras podem
ser feitas?

94) Quais dos seguintes pares de eventos so mutuamente exclusivos?

a. A: os nmeros pares ; B: o nmero 5;

b. A: os nmeros mpares; B: os nmeros maiores do que

10;

c. A: os nmeros menores que 5; B: todos os nmeros negativos

d. A: os nmeros maiores do que 100; B: os nmeros menores do que

200;

e. A: os nmeros negativos; B: os nmeros pares

95) Uma carta escolhida de um baralho padro de 52 cartas. Ao descrever a ocorrncia


de dois possveis eventos, um s e um Rei, estes dois eventos so:

(a) independentes

(b) mutuamente exclusivos

(c) variveis aleatrias

(d) aleatoriamente independentes.

96) Suponha que certa caracterstica oftalmolgica associada com a cor dos olhos. 300
indivduos selecionados aleatoriamente so estudados e apresentam os seguintes
resultados:

Cor dos olhos


Caracterstica
Azuis Castanhos Outra Total

Sim 70 30 20 120

No 20 110 50 180

Total 90 140 70 300

A. Qual a probabilidade de que uma pessoa tenha olhos azuis ?

108
B. O que voc espera que seja o valor de P(Ter a caracterstica e olhos azuis) se a
cor dos olhos e a existncia da caracterstica so independentes ?

C. Quais das seguintes expresses descrevem a relao entre os eventos A = a pessoa


tem olhos castanhos e B = a pessoa tem olhos azuis ? (marque a resposta
correta).

i. independente ii. exaustivo

iii. simples iv. mutuamente exclusivos

97) Uma amostra de 1000 pessoas diagnosticada com certa doena distribuda de acordo
com a altura e o status (evoluo) da doena a partir de um exame clnico de acordo
com a seguinte tabela:

Sem a Fraca Moderada Severa Totais


doena

Alta 122 78 139 61 400

Mdia 74 51 90 35 250

Baixa 104 71 121 54 350

Totais 300 200 350 150 1000

Como voc estimaria, a partir dessa tabela, a probabilidade de ser mdia ou


baixa em altura e ter moderado ou severo grau de evoluo da doena ?

a. 600/1000 * 500/1000 d. 300/600

b. 300/500 e. 800/1000

c. 300/1000

98) De cerca de 25 artigos, nove so defeituosos, seis tem defeitos superficiais e trs tem
defeitos importantes. Determine a probabilidade de que um artigo selecionado
aleatoriamente tenha defeitos importantes dado que ele tem defeito.

a. 1/3

b. 0,25

109
c. 0,24

d. 0,08

99) A seguinte tabela de duas entradas mostra as frequncias de ocorrncia de uma


exposio hipottica e a doena em um grupo de 1000 pessoas.

Doena Totais
Exposio Presente Ausente

Presente 75 325 400

Ausente 25 575 600

Totais 100 900 1000

a. Qual a probabilidade de exposio no grupo ?

b. Qual a probabilidade conjunta de tanto exposio como de doena estar


presente no grupo ?

c. Calcule a probabilidade de doena estar presente condicionada a presena de


exposio e condicionada a ausncia de exposio.

100) Um epidemiologista acredita que as rodovias tm alguma relao com o


desenvolvimento de uma nova doena porque a probabilidade de uma pessoa estar
morando a menos de uma milha das rodovias, dado que ela tem a doena, 0,80.
Voc concorda com ele ? Porque ou porque no ?

101) Um dormitrio de um campus universitrio abriga 200 estudantes. 120 so homens,


50 so dos graus mais avanados e 40 so homens dos graus mais avanados. Um
estudante selecionado ao acaso. A probabilidade de selecionar um estudante de
grau menos elevado, dado que o estudante mulher, :

(a) 7/8 (d) 7/20

(b) 7/15 (e) 1/4

(c) 2/5

102) Uma amostra de 2000 indivduos distribuda de acordo com a cor de olho
e a presena ou ausncia de uma certa caracterstica oftalmolgica como segue:

110
Caracterstica Cor dos olhos
Castanho Azul Outro
Sim 400 270 130 800
No 200 650 350 1200
Total 600 920 480 2000

Em uma seleo aleatria de um indivduo da populao em estudo,


Qual sua estimativa da probabilidade de:

a. a pessoa tem olhos azuis? ___________


b. a caracterstica est presente e a pessoa tem castanhos? ____________
c. a pessoa nem no tem olhos castanhos nem olhos azuis dados
que a caracterstica est ausente? _______________
d. a pessoa nem no tem olhos de outra cor nem olhos azuis e a
caracterstica est presente _______________
e. a pessoa no tem olhos castanhos? _______________
f. a pessoa tem olhos azuis ou nem no tem olhos azuis nem olhos castanhos?
__________
g. a pessoa no tem a caracterstica ou no tem olhos castanhos? ________

103) Um sindicato de trabalhadores local consiste de associados encanadores e


eletricistas, classificado de acordo com grau:

Aprendiz Jornaleiro Oficial


Encanadores 25 20 30 75
Eletricistas 15 40 20 75
40 60 50

Um associado do sindicato selecionado ao acaso. Dado que o


pessoa selecionada um encanador, a probabilidade de que ele um
jornaleiro :

a. 1/2
b. 1/3
c. 4/15
d. 2/15
e. nenhuma das anteriores.

104) Entre vinte e cinco artigos, nove so defeituosos, seis tem somente um defeito no
importante e trs tm um defeito importante. Determine a probabilidade de que

111
um artigo selecionado ao acaso tenha defeitos importantes dado que ele tenha
defeitos.

a. 1/3
b. 0,25
c. 0,24
d. 0,08

105) Os depositantes do Banco X so categorizados por idade. Selecionaremos


aleatoriamente um indivduo desse grupo de 2.000 depositantes

Sexo
Idade | Homem | Mulher
-----------------------------------------------
30 ou menos | 800 | 600
31 ou mais | 400 | 200
-----------------------------------------------

i) Ento P(mulher de 30 ou menos) =


a) 2/5 b) 3/4 c) 3/7 d) 3/10 e) nenhuma das anteriores

ii) Ento P[homem ou (31 ou mais)] =


a) 1/5 b) 3/10 c) 1/2 d) 7/10 e) nenhuma das anteriores

iii) Ento P(mulher) =


a) 3/10 b) 2/5 c) 3/5 d) 2/3 e) nenhuma das anteriores

iv) Qual a probabilidade condicional de que um depositante escolhido tenha


idade de 30 anos ou menos, dado que ele homem?

a) 2/3 b) 7/10 c) 4/7 d) 2/5 e) nenhuma das anteriores

v) So as idades e sexos dos depositantes independentes para o Banco X? Porque?

105) Um epidemiologista sente que as rodovias tem alguma relao com o


desenvolvimento de uma nova doena porque a probabilidade de que uma pessoa
esteja morando a uma milha ou menos da rodovia, dado que ela tem a doena
0,80. Voc concorda com ele? Explique porque.

106) Existem duas urnas marcadas com H e T. A urna H contem 2 bolas vermelhas e 1
bola azul. A urna T contem 1 bola vermelha e 2 azuis. Uma moeda jogada ao
acaso. Se sai cara escolhida uma bola da urna H. Se sai coroa, uma bola
escolhida da urna T. Ache as seguintes probabilidades.

112
a. P(cara e vermelha) b. P(coroa) c. P(vermelha)
d. P(azul) e. P(cara|vermelha)

107) O nmero de paradas de mquinas em uma grande fbrica durante uma semana tem
a seguinte distribuio de probabilidade:

B 5 10 15 20 25
P(B = b) 0,25 0,30 0,25 0,15 0,05

Usando essa distribuio, Calcule E[B] e V[B]

108) A Companhia Beta comprou 80 componentes eletrnicos de um fornecedor que


declara que somente 2 % dos componentes que ele vende so defeituosos e que os
componentes defeituosos so misturados aleatoriamente com os componentes bons.
Cada componente defeituoso custar a Beta US$ 250 em custos de reparo. Se o
fornecedor est certo, qual ser o nmero esperado de componentes defeituosos ? E
qual o custo esperado de reparo?

109) Um vendedor de carros oferece a todos os seus clientes potenciais uma corrida de 30
milhas no tipo de carro que o cliente est interessado em comprar, mais um almoo
ou jantar gratuitos. Todos estes custos so cerca de US$ 50. Se o cliente no
compra o carro, o vendedor perde US$ 50, mas se o cliente comprar o carro, o lucro
mdio do vendedor de cerca de US$ 500 (dos quais os custos da corrida e da
refeio devem ser deduzidos). No passado, 20 % dos clientes compraram o carro
depois da corrida e da refeio gratuita. Qual o lucro esperado para o vendedor
nessa situao?

110) Um processo de produo paralisado para ajuste toda vez que uma amostra
aleatria de cinco itens, selecionada com reposio, apresenta dois ou mais
defeituosos. Ache a probabilidade de que o processo ser paralisado aps uma
inspeo se ele est produzindo:

a) 20 % de defeituosos
b) 10 % de defeituosos
c) 5 % de defeituosos

111) Um simples mssil de certa variedade tem uma probabilidade de de derrubar um


bombardeiro, uma probabilidade de de danific-lo e uma probabilidade de de
err-lo. Alm disso, dois tiros danificadores derrubaro o avio. Se quatro destes
msseis so lanados, qual a probabilidade de derrubar um avio?

113
112) De acordo com um cientista poltico, a populao votante de certa cidade consiste de
46 % do candidato A, 40 % do candidato B, 11 % do candidato C e 3 % do
candidato D. Em uma amostra aleatria de 5 votantes, qual a probabilidade de que
a amostra contenha:

a) Dois votantes para o candidato A e um de cada das outras categorias?


b) Trs votantes para o candidato A e dois para o candidato B?
c) Nenhum votante para o candidato D?

4. Variveis Aleatrias Discretas

Objetivos do Captulo:

Distinguir entre uma distribuio de probabilidade discreta e contnua


Calcular a mdia, a varincia e o desvio padro de uma distribuio de probabilidade
discreta.
Definir os termos Distribuio de Probabilidade e Varivel Aleatria
Descrever as caractersticas das distribuies Binomial, Hipergeomtrica e de
Poisson.

Definio: Uma varivel aleatria um valor numrico determinado pelo resultado


de um experimento ( uma quantidade resultante de um experimento aleatrio que,
por acaso, pode assumir diversos valores).

Exemplo 1: Considere um experimento aleatrio no qual uma moeda jogada 3 vezes.


Seja X o nmero de caras. Seja H o resultado cara e T o resultado coroa.

O espao amostral para este experimento ser:

TTT, TTH, THT, THH, HTT, HTH, HHT, HHH

114
Assim, os possveis valores de X (nmero de caras) sero:
X = 0, 1, 2, 3.

Nota: Neste experimento, h 8 possveis resultados no espao amostral. Desde que


eles so todos igualmente provveis de ocorrer, cada resultado tem uma probabilidade
de 1/8 de ocorrer.

A figura a seguir ilustra a associao existente entre resultados do experimento (no


espao amostral) e os valores assumidos pela varivel X.

TTT 0

TTH 1

THT 1

THH 2

HTT 1

HTH 2

HHT 2

HHH 3

Espao Amostral X = Nmero de Caras

O resultado zero caras ocorre o corre somente uma vez


O resultado 1 cara ocorre trs vezes
O resultado 2 caras ocorre trs vezes

115
O resultado 3 caras ocorre somente uma vez

Da definio de uma varivel aleatria, X, tal como definida neste experimento,


uma varivel aleatria. Seus valores so determinados pelos resultados do
experimento.

Nota: A varivel aleatria X uma associao de pontos no espao amostral com


pontos na reta dos nmeros reais (0,1, 2,3). Na realidade, uma varivel aleatria
definida atravs de uma funo em que o domnio o conjunto de todos os resultados
possveis do experimento e a imagem o conjunto de todos os valores assumidos
pela varivel aleatria. Note que a varivel aleatria no resultado do experimento,
mas sim um valor associado a este.

Definio: Uma Distribuio de Probabilidade uma lista de todos os resultados de


um experimento e suas probabilidades associadas. De forma mais rigorosa, uma
funo matemtica em que o domnio so os valores possveis de uma varivel
aleatria e a imagem so as suas probabilidades associadas.

A distribuio de probabilidade de uma varivel aleatria X (nmero de caras) nas trs


jogadas de uma moeda mostrada a seguir.

Distribuio de Probabilidade para Trs Jogadas de uma Moeda

Nmero de Probabilidade
Caras
0 1/8 = 0,125
1 3/8 = 0,375
2 3/8 = 0,375
3 1/8 = 0,125

116
Total 8/8 = 1

probabilidade

3/8

1/8

0 1 2 3
Nmero de
caras

CARACTERSTICAS DE UMA DISTRIBUIO DE PROBABILIDADE

A probabilidade de um resultado deve estar sempre situada entre 0 e 1.


Exemplo: P(0 caras) = 0,125, P(1 cara) = 0,375 , etc. no experimento de jogar 3 moedas.
A soma das probabilidades de todos os resultados mutuamente exclusivos sempre 1
(veja a tabela de distribuio de probabilidade no texto).

VARIVEL ALEATRIA DISCRETA

Definio: Uma varivel aleatria discreta uma varivel que pode assumir somente
certos valores claramente separados (em descontinuidade) resultantes, por exemplo,
de uma contagem de algum item de interesse.

117
Exemplo: Seja X o nmero de caras quando uma moeda jogada 3 vezes. Aqui os
valores de X so 0,1,2 ou 3 (so claramente separados, em descontinuidade).

Nota: uma varivel aleatria discreta no precisa necessariamente assumir apenas valores
inteiros. Poderia, por exemplo, ser uma varivel que apresentasse os seguintes valores: 0,
23/7 , 72/25, etc. A condio que deve ser cumprida seus valores sejam descontnuos.

VARIVEL ALEATRIA CONTNUA

Definio: Uma varivel aleatria contnua uma varivel que pode assumir um
nmero infinitamente grande de valores (com certas limitaes prticas).

Exemplo: (a) Peso de um estudante


(b) comprimento de um carro

4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta

A mdia refere-se a localizao central de um conjunto de dados. Ela pode ser


considerada como um valor de longo prazo de uma varivel aleatria e tambm
chamada de valor esperado (ou esperana matemtica), E(X).

A mdia de uma distribuio de probabilidade discreta determinada pela frmula:

= E ( X ) = [ X .P ( X )]

onde (letra grega, mi) representa a mdia (ou valor esperado) e P(X) a probabilidade

dos vrios resultados de X.

118
4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta

A varincia mede a quantidade de disperso ou variabilidade de uma distribuio. Ela

denotada pela letra grega 2


(sigma ao quadrado).

O desvio padro obtido atravs da raiz quadrada de 2


.
A varincia de uma distribuio de probabilidade discreta calculada atravs da
frmula:

2 = [(X )2 P( X )]

O desvio padro :

= 2
Exemplo 2
Uma empresa especializa-se no aluguel de carros para famlias que necessitam de um
carro adicional para um perodo curto de tempo. O presidente da empresa tem estudado
seus registros para as ltimas 20 semanas e apresentou os seguintes nmeros de carros
alugados por semana.

Nmero de Carros Semanas


alugados
10 5
11 6
12 7
13 2

Os dados acima podem ser considerados como uma distribuio de probabilidade?


Porque ou porque no?

119
Converta o nmero de carros alugados por semana em uma distribuio de
probabilidade.

Nmero de carros Probabilidade


alugados P(X)
10 0,25
11 0,30
12 0,35
13 0,10

Total 1,00

Calcule o nmero mdio de carros alugados por semana.

A mdia

= E ( X ) = [ X .P ( X )] = (10) (0,25) + (11) (0,30)


+ (12) (0,35) + (13) (0,10) = 11,3

Calcule a varincia do nmero de carros alugados por semana.

A varincia

2 = [( X ) 2 .P ( X )] =
(10 11,3) 2 0,25 + (11 11,3) 2 0,30 + ... + (13 11,3) 2 0,10 = 0,91

Clculo de E(X):

120
Nmero de Carros Probabilidade, P(X) XP(X)
alugados
10 0,25 2,5
11 0,30 3,3
12 0,35 4,2
13 0,10 1,3
Total 1,00 E(X) = 11,3

Clculo de
2

Nmero de Prob. (X ) ( X )2 ( X ) 2 P( X )
Carros P(X)
Alugados
10 0,25 10-11,3 1,69 0,4225
11 0,30 11-11,3 0,09 0,0270
12 0,35 12-11,3 0,49 0,1715
13 0,10 13-11,3 2,89 0,2890
Total 2 = 0,9135

= 0,9135 = 0,9558

4.3 A Distribuio de Probabilidade Binomial

A Distribuio Binomial tem as seguintes caractersticas:

Considere um experimento que apresenta apenas dois resultados possveis que so


categorias mutuamente exclusivas: sucesso e falha.
So repetidos diversas vezes este mesmo experimento.

121
A probabilidade de sucesso permanece constante para cada tentativa
(consequentemente, a probabilidade de falha tambm permanece constante).
As tentativas so independentes, significando que o resultado de uma tentativa no
afeta o resultado de qualquer outra tentativa.

Para construir uma distribuio binomial, consideremos:


n o nmero de tentativas
r o nmero de sucessos observados
p a probabilidade de sucesso em cada tentativa
q a probabilidade de falha em cada tentativa, que igual a 1-p

FRMULA PARA A DISTRIBUIO DE PROBABILIDADE BINOMIAL

n!
P( X = r ) = p q r nr

r!(n r )!
onde n! lido como n fatorial. Por exemplo, 4! = (4).(3).(2).(1)=24.
0! igual a 1, por definio e 1! = 1.

Exemplo 3

O Departamento de Estatstica do Trabalho de um municpio estimou que 20 % da fora


de trabalho est desempregada. Uma amostra de 14 trabalhadores obtida deste
municpio. Calcule as seguintes probabilidades:

Trs esto desempregados na amostra. (Nota: n = 14 e p = 0,2)


14!
P( X = 3) = 0,2 3 0,814 3 = 0,250
3!(14 3)!
No mnimo um dos trabalhadores da amostra esto desempregados.

122
14!
P( X 1) = 1 P( X = 0) = 1 0,2 0 0,814 0 = 0,956
0!(14 0)!
No mximo dois dos trabalhadores esto desempregados.

P ( X 2) = 0,044 + 0,154 + 0,250 = 0,448

Exemplo 4

Uma companhia fabrica rolamentos para serem usados em bicicletas. Sabe-se que 5 %
dos dimetros dos rolamentos estaro fora dos limites de aceitao (defeituosos). Se 6
rolamentos so selecionados ao acaso, qual a probabilidade de que:

Exatamente zero sejam defeituosos? Exatamente um seja defeituoso? Exatamente dois


sejam defeituosos? Exatamente trs sejam defeituosos? Exatamente quatro sejam
defeituosos? Exatamente cinco sejam defeituosos? Exatamente seis sejam defeituosos?

Note que as condies de uma distribuio binomial esto satisfeitas neste exemplo:

- H uma probalidade constante de sucesso (0,05)


- H um nmero fixo de tentativas (6)
- As tentativas so independentes (Por qu?)
- H somente dois possveis resultados (um rolamento defeituoso ou no defeituoso).

123
DISTRIBUIO DE PROBABILIDADE BINOMIAL para n = 6 e p = 0,05

Nmero de rolamentos defeituosos, X Probabilidade de ocorrncia, P(X)


0 0,735
1 0,232
2 0,031
3 0,002
4 0,000
5 0,000
6 0,000

Verifique os clculos para os valores da tabela acima


Mostre a representao grfica para a Distribuio de Probabilidade Binomial com n
= 6 e p = 0,05

Para um n fixo (10) e p pequeno (0,05), a distribuio positivamente assimtrica


Para um n fixo (10) e p aproximando-se de 0,5, a distribuio torna-se simtrica.
Para um n fixo (10) e p grande (0,95), a distribuio torna-se negativamente
assimtrica.
Para um p fixo e para valores cada vez maiores de n, a distribuio torna-se cada vez
mais simtrica

Nota: Como os procedimentos de clculo tornam-se repetitivos (e montonos) faremos a


seguir uma simulao no computador para diversos valores dos parmetros n e p de uma
distribuio binomial.

124
4.4 A Mdia e Varincia De Uma Distribuio Binomial

A mdia dada por:

= np

A varincia dada por:

2 = np (1 p )

Nota: A demonstrao terica para estes valores ser desenvolvida em sala de aula e
encontra-se na maioria dos livros de Introduo a Estatstica.

Para o exemplo anterior:


p = 0,05 e n = 6
= np = 6 0,05 = 0,3
2 = np (1 p ) = 6 0,05 0,95 = 0,285

Distribuio Cumulativa de Probabilidade

Um engenheiro estimou que 60 % das pontes de um Estado necessitam de reparos. Uma


amostra de 10 pontes no Estado foi aleatoriamente selecionada.

Qual a probabilidade de que exatamente 6 destas pontes necessitem de reparos? Esta


situao (deste exemplo) satisfaz as condies para uma distribuio binomial ?
Porque?

Verificar:

125
n = 10, p = 0,6 P(X = 6) = 0,251

Qual a probabilidade de que 7 ou menos destas pontes necessitem de reparos ?

P ( X 7) = P ( X = 0) + P ( X = 1) + ... + P ( X = 7) = 0,833 (verificar)

Este um exemplo de probabilidade cumulativa.

Apndice 1 (Recordao)

Uma varivel aleatria (v.a.) um valor numrico que definido em ou determinado


pelos resultados ou eventos de um experimento. Variveis aleatrias normalmente so
denotadas por letras maisculas, X, Y etc e podem ser discretas ou contnuas.
Seja a v.a. X o nmero de sementes que germinam em 100 plantadas. Possveis valores
para X so 0,1,2,100, (discreta)
Seja a v.a. X a temperatura mxima diria em Uberlndia. Possveis valores so 0 - 50 C
por exemplo 26.1276(contnua).
Seja X a resposta a uma questo com ' Sim', ' No', 'No Sei'. X no uma v.a (no
numrica).
Seja Y o nmero de 'Sim's. Y uma v.a. discreta.

Distribuio de probabilidade de um v.a. Discreta.

Esta uma lista dos possveis valores da v.a. e as probabilidades correspondentes (que
tem que somar 1). As probabilidades podem ser escritas:
P ( X = xi ) = p i para i = 1,2,..., k e 0 p i 1
k

p =1
i =1
i

126
Apendice 2 (Recordao)

Varivel Aleatria discreta

Uma varivel aleatria discreta uma varivel aleatria que toma valores discretos com
probabilidades especificadas.

Exemplo - uma Famlia de 3 crianas.

Seja X uma Varivel Aleatria (VA) = nmero de meninas


Possveis valores:
X=3 GGG
X=2 GGB GBG BGG
X=1 BBG BGB GBB
X=0 BBB
Considere que os 8 resultados so igualmente provveis de forma que
x 0 1 2 3
Probabilidade
1/8 3/8 3/8 1/8
P(X = x)

A lista de valores que X pode assumir e as suas probabilidades chamada


de distribuio de probabilidade discreta para X.
Conveno de notao - use letras maisculas para variveis aleatrias e letras minsculas
para valores especficos

Exemplo - tentativas de Bernoulli

Cada tentativa um 'experimento' com exatamente 2 possveis resultados, "sucesso " e "
fracasso " com probabilidades p e 1-p.
Seja X = 1 se sucesso, 0 se fracasso
A Distribuio de probabilidade

127
x 0 1
P(X = x) p 1-p

Exemplo - so lanados 2 dados

Seja X a soma dos resultados.


Resultados:
11 21 31 41 51 61
12 22 32 42 52 62
13 23 33 43 53 63
14 24 34 44 54 64
15 25 35 45 55 65
16 26 36 46 56 66
Considere que os 36 resultados so igualmente provveis. Portanto cada um tem
probabilidade = 1/36.
Possveis valores de X so 2, 3,... , 12
por exemplo P(X = 4) = P(1,3 ou 2,2 ou 3,1) = 3/36.
A distribuio de probabilidade
x 2 3 4 ... 10 11 12
P(X=x) 1/36 2/36 3/36 ... 3/36 2/36 1/36

Apndice 3 (Recordao)
A distribuio Binomial

Considere n tentativas Bernoulli.


Assuma que a probabilidade de sucesso (S) o mesma para todas as tentativas, P(S) =
p.
Assuma que as tentativas so independentes e portanto a probabilidade para qualquer
determinada combinao de sucessos e fracassos, por exemplo para 5 tentativas, a

128
probabilidade do resultado SSFSF, pode ser obtida multiplicando as probabilidades
para cada resultado de tentativa.
por exemplo P(SSFSF) = p.p. (1-p) .p.(1-p) = p3(1-p)2

De fato, a probabilidade de obter trs sucessos e dois fracassos em cinco tentativas p3(1-
p)2 para cada um dos modos diferentes que isto poderia acontecer, isto , SSSFF,
SSFSF,... etc.
O nmero de arranjos "distintos" de 3 sucessos e 2 fracassos pode ser facilmente

n
calculado usando o coeficiente binomial onde n o nmero de tentativas e x o
x
nmero de sucessos requerido.

n
O coeficiente binomial (leia-se como "binomial de x em n") definido como
x

n n!
=
x x!(n x)!
5 5! 5.4.3.2.1
Neste exemplo, = = = 10, portanto
3
3!2! (3.2.1)(2.1)
h 10 maneiras distintas de se obter 3 sucessos em 5 tentativas, com cada arranjo
tendo uma probabilidade p 3 (1 - p) 2

Seja X a V.A. igual ao nmero total de sucessos em n tentativas .


Para calcular a probabilidade de obter x sucessos, pode ser mostrado que

129
n
P ( X = x) = px (1 - p) n - x
x

nmero de arranjos prob. de prob. de


de x Ss e (n-x) Fs x Ss (n-x) Fs

onde o nmero mnimo de sucessos 0 e o mximo n.


A distribuio do nmero de sucessos chamada distribuio binomial com dois
parmetros, n e p, necessrios para determinar P(X=x). Dizemos, de forma abreviada, X ~
B(n,p)

Exemplo - Um time de futebol joga 3 jogos

Assuma que cada jogo uma tentativa Bernoulli com prob(ganhar) = 0,5

Seja X a V.A. = nmero de vitrias

Ento X tem distribuio binomial com n=3 e p=0,5, com resultado vitria (W) ou derrota
(L) em cada tentativa.
(Isto abreviado como X ~ B(3;0,5))
Qual a probabilidade de que o time ganhe 2 jogos exatamente?
P(X=2) = P(WWL) + P(WLW) + P(LWW)
= 3/8 (desenhe um diagrama de rvore)
ou usando a frmula para probabilidades binomiais, a prob(WWL) = p2(1-p) e o nmero

3 3!
de distintos arranjos de 2 vitrias em trs jogos = = 3 . Portanto a resposta
2
2!1!
3
P ( X = 2) = (0,5) 2 (1 0,5) 1 usando n = 3, x = 2, p = 0,5
3p2(1-p). Assim 2
3
=
8

130
As distribuies binomiais so usadas para modelar situaes que podem ser pensadas
como tentativas repetidas e " independentes " cada uma com somente 2 possveis
resultados. Ns os usaremos posteriormente para fazer inferncias estatsticas sobre
propores.

Exemplo - Um Sistema de Controle de Qualidade

Um Sistema de Controle de Qualidade requer que de cada lote de itens uma amostra de
10 selecionada e testada. Se 2 ou mais itens da amostra so defeituosos o lote inteiro
rejeitado.
Se a probabilidade de um item ser defeituoso 0,05

(i) qual a probabilidade de 2 defeituosos na amostra?

(ii) Qual a probabilidade do lote ser rejeitado?

Seja X a V.A. = nmero de defeituosos na amostra de n = 10 itens.


Portanto, X ~ Binomial (10; 0,05)

10
(i) P ( X = 2) = (0,05) 2 (0,95) 8 = 0,0746
2
10 10
(ii) P(rejeitar o lote) = P ( X 2) = (0,05) x (0,95) 10 x o que muito

x=2 x

trabalhoso de calcular. Mas:


P ( X 2) = 1 P ( X < 2) = 1 P ( X = 0 ou X = 1)
= 1 - [P(X = 0) + P(X = 1)] mutuamente exclusivos
10 10
= 1 - [ (0,05) 0 (0,95) 10 + (0,05) 1 (0,95) 9 ]
0 1
= 0,0862

131
Apndice 4 (Recordao) Valor Esperado e Varincia de uma Varivel Aleatria

Anlise de deciso

Exemplo - explorao de petrleo

Uma companhia de explorao de petrleo tem um arrendamento para o qual precisa


decidir se:

(i) vende agora,

(ii) segura durante um ano e ento vende, ou

(iii) perfura agora.

O custo de perfurar $200,000 ($200K).


Perfurando conduzir a um dos resultados seguintes
Resultado Probabilidade Receita
Poo Seco 0.5 $0
Poo com pouco petrleo 0.4 $400K
Poo com jorro 0.1 $1500K
Se vende agora, a companhia pode adquirir $125K.

Se segura durante um ano e os preos do petrleo sobem (probabilidade =0.6) pode


vender por $300K ou se os preos do petrleo caem (probabilidade = 0.4) pode adquirir
$100K. O que deveria fazer?

132
Valor
esperado
Vende agora

125 K $ 125 K

Preos do
petrleo sobem
0,6
Vende $ 300 K
depois
300 x 0,6 +
Deciso Preos do 100 x 0,4 =
petrleo caem $ 220 K

0,4 $ 100 K

Seco

$0 200 K

0,5

Pouco petrleo
Perfura 0,4 -200 x 0,5
+ 200 x 0,4
$400 200 K + 1300 x 0,1
= $ 110 K

0,1

Jorro

$1500-200 K

A melhor deciso segurar durante um ano e ento vender. Este um exemplo de usar
um diagrama de rvore para Anlise de Deciso. Tambm ilustra o conceito do valor
esperado de uma varivel aleatria .

133
Se a distribuio de probabilidade de uma varivel aleatria X
Valores de X x1 x2 ... xk
Probabilidades p1 p2 ... pk
seu valor esperado

E ( X ) = x p + x p + ... + x p = x p
1 1 2 2 K K
i =1
i i

exemplo Perfurao de Petrleo


Resultado Probabilidade Receita
Poo seco 0.5 0
Poo com pouco petrleo 0.4 $400K
Poo com jorro 0.1 $1500K
Seja X a varivel aleatria lucro financeiro

= Receita custo de perfurao

= Receita - $200K

A distribuio de probabilidade para X


x -200 200 1300
P(X=x) 0.5 0.4 0.1
Portanto, o valor esperado (mdia) de X
E(X) = -200 x 0.5 + 200 x 0.4 + 1300 x 0.1 = $110K
Isto diretamente anlogo mdia amostral.
E(X) pode ser considerada como uma idealizao de, ou um valor terico para, a mdia
da amostra.
E(X) denotado freqentemente pela letra grega (pronuncia-se mu).

134
Varincia de uma Varivel Aleatria

Recorde que a varincia uma medida de disperso. Para uma amostra de observaes de
uma populao a varincia ao redor da mdia definida como
n

(x x)
2

s =
i
2 i =1

n 1

A varincia de uma Varivel Aleatria X definida como

var( x) = p1 ( x1 ) 2 + p 2 ( x 2 ) 2 + ... + p K ( x K ) 2
ou
K
var( x) = p i ( x i ) 2 = E ( x ) 2
i =1

Ela representa o limite terico da varincia amostral s2 quando o tamanho da amostra (n)
fica muito grande.

var(X) denotada freqentemente por 2 (sigma quadrado).

Uma frmula mais simples para var(X)

var( X ) = ( p1 x12 + ... + p K x K2 ) 2


= E ( X 2 ) [ E ( X )] 2

Exemplo - Gnero em uma classe de 5

Assuma que a probabilidade de um estudante em uma classe ser masculino um meio.


Seja a varivel aleatria X o nmero de estudantes masculinos em um grupo da classe de
tamanho 5.
Qual o valor de E(X), o nmero esperado de homens no grupo, e qual a varincia de
X?
Considere X ~ binomial (5;0,5).

135
Ento a distribuio de probabilidade de X
x 0 1 2 3 4 5
P(X=x) 1/32 5/32 10/32 10/32 5/32 1/32
(Confira isto usando a frmula para probabilidades binomiais e desenhe um diagrama de
rvore para analisar a estrutura dos resultados.)

1 5 10 10
E ( X ) = xp( x) = 0 + 1 + 2 + 3
32 32 32 32
5 1 80
+ 4 + 5 = = 2,5 =
32 32 32

isto , em mdia tais grupos tm 2,5 homens.

1 1
var( X ) = x 2 p ( x) 2 = 0 2 + ... + 5 2 (2,5) 2
32 32
= 7,5 - (2,5) 2
= 1,25
Portanto, = var( X ) = 1,25 = 1,12

Esta uma medida da variabilidade de X.

Em geral se X ~ binomial (n,p) pode ser mostrado que

E(X) = np e var(X) = npq

onde q = 1 - p

[Confira os valores de E(X) e var(X) calculados acima para X ~ binomial (5;0,5) usando
estas frmulas.]

136
EMPRICO TERICO
(baseado nos dados) (MATEMTICO)
QUANTIDADE QUANTIDADE

fi

(a) Freqncia relativa n
PROB[X = xi] = pi
f quando
xi = i
n n0
fi n
(b) =1 p i
=1
i n i =1

(c) mdia x = ESPERANA, = x E( X )


1 E(X) = p i x i quando
xi f i i
n i n
(d ) VARINCIA S 2 = S 2 VAR( X )
VAR ( X ) =
n (x x) f
2

i i n
quando
n 1 ( x i
x ) 2
pi
i =1
ii =1 n

Valor esperado e Varincia para uma Funo de Variveis Aleatrias

Se Y = aX + b
onde X uma varivel aleatria e a e b so valores constantes conhecidos, ento,

E(Y) = a E(X) + b

var(Y ) = a 2 var( X )
Portanto, Y = a 2 var( X ) = a 2 x2 = a X

137
e
Semelhantemente se T = a X + b Y + c onde X e Y so variveis aleatrias e a, b e c so
constantes conhecidas, ento,

E(T) = a E (X) + b E (Y) + c.

e Var (T ) = a 2 var( X ) + b 2 var(Y ) + 2ab cov( X , Y )


Em particular, se X e Y so independentes ento a covarincia cov(X,Y) zero. Portanto

Var (T ) = a 2 var( X ) + b 2 var(Y )

Prova: Segue das definies de E(X) e var(X).

Exemplo - Lucro previsto estimado

Uma companhia faz produtos para mercados locais e de exportao.


O nmero de vendas do prximo ano no pode ser predito exatamente mas estimativas
podem ser feitas como a seguir
unidades de X,local 1,000 3,000 5,000 10,000
Probabilidade 0.1 0.3 0.4 0.2

unidades Y, export. 300 500 700


Probabilidade 0.4 0.5 0.1

Conseqentemente E(X) = 1000 x 0.1 + 3000 x 0.3 + 5000 x 0.4 + 10000 x 0.2

= 5000 (= esperou vendas locais)

E(Y) = 300 x 0.4 + 500 x 0.5 + 700 x 0.1

= 440 (= vendas de exportao esperadas)

A companhia lucra $2000 em cada unidade vendida no mercado local e $3500 em cada
unidade exportada.

138
Consequentemente o lucro total

T = 2000 X + 3500 Y

Usando a frmula acima

E(T) = 2000 E(X) + 3500 E(Y)

= 2000 x 5000 + 3500 x 440

= $11,540,000

- este o lucro estimado (previsto) durante o prximo ano.

Exemplo - Fabricao de um componente de metal

Um componente feito cortando um pedao de metal de comprimento X e reduzindo este


valor da quantidade Y. Ambos estes processos so um pouco imprecisos.
O comprimento lquido ento

T = X - Y.

Isto pode ser escrito na forma T = a X + b Y com a = 1 e b = -1


assim

E(T) = a E (X) + b E (Y) = 1 E(X) + (-1)E(Y)

= E(X) - E(Y)

Var (T ) = a 2 var( X ) + b 2 var(Y )


Por tan to var(T) = 12 var( X ) + (1) 2 var(Y )
= var(X) + var(Y)

ou seja, var(T) maior tanto que var(X) ou var(Y), embora T = X - Y, porque X e Y


contribuem variabilidade em T.

139
Variveis Aleatrias Independentes

Lembremos que dois eventos A e B so independentes se e somente se P(A e B) =


P(A)P(B) se a probabilidade da interseo de A e B o produto das probabilidades de A
e de B. Podemos relacionar variveis aleatrias a eventos, ou seja, podemos definir
eventos em termos de valor(es) que uma varivel aleatria assume. Por exemplo, o evento
A = {a < X b) ocorre se X maior do que a e menor do que b. Duas variveis aleatrias,
X e Y, so independentes se e somente se todo evento da forma {a < X b}
independente de todo evento da forma {c < Y d}. Duas variveis aleatrias so
independentes se conhecendo o valor de uma no ajuda a predizer o valor da outra.

Exemplos: Considere a jogada de uma moeda 10 vezes.

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas
4 jogadas. Portanto X e Y so independentes. Conhecer o valor de X no ajuda a predizer
o valor de Y e vice-versa.

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas
5 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X 6) e o
evento {-1 < Y 0} so dependentes (e mutuamente exclusivos).

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de coroas nas
primeiras 2 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X
6} e o evento {2 < Y 3} so dependentes (e mutuamente exclusivos).

Que espcies de experimentos conduzem a variveis aleatrias independentes? Somas e


mdias de seqncias que no se sobrepem seja de jogadas de moedas, de jogadas de

140
dados so alguns exemplos. O segundo e terceiro exemplo acima mostram porque existe a
necessidade das seqncias serem no sobrepostas (ou seja, no tenham interseco).

Valor Esperado do Produto de Variveis Aleatrias Independentes

Se as variveis aleatrias X e Y so independentes, Ento E[ X Y ] = E[ X ] E[Y ]


O inverso (recproca) no verdadeiro em geral: E[ X Y ] = E[ X ] E[Y ] no implica
que X e Y sejam independentes.

Apndice 4 (recordao)

A DISTRIBUIAO BINOMIAL DE PROBABILIDADE

Suponhamos que um experimento consista de tentativas repetidas, cada uma com


dois possveis resultados que podem ser vistos como sucesso ou fracasso. Uma aplicao
obvia na rea de cincias sociais aplicadas refere-se a um experimento que se refere a
selecionar repetidas vezes um elemento de amostra de uma populao que contenha
apenas duas categorias, por exemplo, pessoas que votaro em um determinado candidato
ou no. Consideremos que se a pessoa for votar no candidato teremos um resultado de
sucesso e se no for votar teremos um resultado de fracasso. Outro exemplo seria um jogo
de baralho em que extramos repetidas vezes uma carta do conjunto de 52 cartas. Neste
caso poderemos considerar como sucesso o resultado ser uma carta numrica e fracasso o
resultado ser uma carta de figura. A um experimento definido desta forma damos o nome
de processo Bernoulli. Podemos tambm definir uma varivel aleatria que ter valor X
= 1 se ocorrer sucesso e valor X = 0 se ocorrer fracasso. Desta forma tambm podemos
chamar tal varivel de varivel aleatria Bernoulli. Cada tentativa do experimento
denominada tentativa Bernoulli.
Podemos observar que tanto no exemplo do candidato como no exemplo das
cartas se a pessoa selecionada da populao de eleitores ou se a carta selecionada do
baralho no for reposta a probabilidade de um sucesso para as repetidas tentativas muda.
Suponhamos que a nossa populao de eleitores tenha 1000 pessoas e dentro desta

141
populao 300 votaro no candidato e 700 no votaro. Na primeira tentativa do
experimento (seleo da primeira pessoa) temos uma probabilidade de sucesso igual a
300 / 1000 = 0,3. Na segunda tentativa, se no for feita a reposio da primeira pessoa na
populao de origem, teremos uma probabilidade de sucesso igual a 299/999 caso tenha
ocorrido sucesso na primeira tentativa e igual a 300/299 caso tenha ocorrido fracasso na
primeira tentativa. Fica mais complicado de ver o que ocorrer na terceira tentativa, pois
o resultado ir depender do que ocorreu na primeira e na segunda tentativas. Neste caso
no teremos tentativas Bernoulli porque a probabilidade de sucesso no se mantm
constante no decorrer das tentativas seqenciais.
Iremos definir um processo Bernoulli da forma como segue. Estritamente falando, um
processo Bernoulli dever ter as seguintes propriedades:

1) O experimento consiste de n tentativas repetidas.


2) Cada tentativa tem um resultado que pode ser classificado como um sucesso ou um
fracasso.
3) A probabilidade de sucesso, denotada por p, permanece constante de tentativa para
tentativa.
4) As tentativas repetidas so independentes.

Considere um conjunto de tentativas Bernoulli onde trs itens so selecionados


aleatoriamente de um processo de fabricao. A seguir eles so inspecionados e
classificados como defeituosos ou no defeituosos. Um item defeituoso designado como
um sucesso. O numero de sucesso uma varivel aleatria X com valores de 0 a 3. O
espao amostral destes experimento definido por oito eventos:
S = {NNN, NDN, NND, DNN, NDD, DND, DDN, DDD}
Temos ento a seguinte tabela de resultados para esta varivel aleatria:

Resultado X
NNN 0
NDN 1

142
NND 1
DNN 1
NDD 2
DND 2
DDN 2
DDD 3

Como os itens so selecionados independentemente de um processo que digamos, produz


25 % de defeituosos, teremos, por exemplo:

3 1 3 9
P(NDN) = P(N).P(D).P(N) = . . = = 0,14
4 4 4 64
Se no houvesse independncia estatstica entre as tentativas Bernoulli e se tivssemos
um lote de produo de 1000 pecas, teramos o seguinte resultado:
P( NDN ) = P ( N1 ).P ( D2 / N1 ).P ( N 3 / N1 D2 ) =
750 250 749
= 0,14086
1000 999 998

Como pode ser visto, existe uma pequena diferena no valor da probabilidade quando
calculamos considerando como tentativas Bernoulli (tentativas independentes e com
probabilidade de sucesso constante) e quando consideramos que as tentativas no so
independentes (neste ultimo caso no so tentativas Bernoulli).

Vamos agora calcular o valor das probabilidades para cada valor da varivel aleatria X
(numero de sucessos). Para isto construmos a seguinte tabela de distribuio de
probabilidades:

x f(x) = P(X=x)
0 27/64
1 27/64
2 9/64

143
3 1/64

A varivel aleatria X que definida como o numero de sucessos chamada de varivel


aleatria Binomial. A distribuio de probabilidade chamada de distribuio binomial.
Podemos generalizar este resultado com a seguinte definio:

Distribuio binomial
Uma tentativa Bernoulli pode resultar em um sucesso com probabilidade p e com
fracasso com probabilidade q = 1- p. Ento a distribuio de probabilidade de uma
varivel aleatria binomial X, o numero de sucessos em n tentativas independentes,

n
b( x; n, p ) = p x q n x , x = 0,1,2,...,n.
x

5. Variveis Aleatrias Contnuas e Distribuio Normal

5.1 Variveis Aleatrias Contnuas

Diferentemente de uma varivel aleatria discreta, para uma varivel aleatria contnua
no podemos definir uma funo de distribuio de probabilidade (f.d.p.). No entanto,
podemos definir o que se chama de uma funo densidade de probabilidade para as
variveis aleatrias contnuas. Por exemplo, suponhamos uma distribuio uniforme do
tipo:

144
f(X)

1/10

5 15 X

Observe que f(X) uma funo constante assumindo sempre o valor 1/10 no intervalo
fechado 5 X 10 . Essa funo goza das seguintes propriedades:

1) ela sempre positiva ou nula. Ou seja, f ( X ) 0 para qualquer valor de X.


2) se integrarmos esta funo no intervalo 5 X 10 o valor desta integral definida
ser igual a 1. Ou seja,
15 15
15 5
f ( X )dx = 1 / 10dx = [ x / 10]155 = =1
5 5 10 10

Toda funo que satisfizer essas duas propriedades chamaremos de funo densidade de
probabilidade. Essa funo apenas um instrumento matemtico para que possamos
calcular probabilidades para variveis aleatrias contnuas (assim como utilizamos a
funo distribuio de probabilidade para as variveis aleatrias discretas). Por exemplo,
para o exemplo acima, se quisermos calcular a probabilidade da varivel aleatria
contnua X estar contida no intervalo 10 X 12 ser:
12 12
12 10
P (10 X 12) = f ( X )dx = (1 / 10)dx = [ x / 10]1210 = = 2 / 10
10 10 10 10
Dessa forma, podemos calcular a probabilidade para qualquer intervalo sendo esta
probabilidade o valor da integral definida da funo densidade de probabilidade sendo

145
que os limites de integrao so as extremidades do intervalo. De uma forma geral,
podemos dizer que se f(X) a funo densidade de probabilidade de uma varivel
aleatria contnua, ento:

b
P (a X b) = f ( X )dx
a

5.2 Mdia e Varincia de uma Varivel Aleatria Contnua

A mdia (ou valor esperado) de uma varivel aleatria contnua dada pela expresso:
+
E[ X ] = Xf ( X )dx

No exemplo anterior, o valor esperado da varivel aleatria X ser:


+ 15
15
x2
E[ X ] = Xf ( X )dx = X (1 / 10)dx = =
5 20 5
225 25
= 10
20 20
A varincia de uma varivel aleatria contnua dada pela expresso:

+
V[X ] = ( X E[ X ])
2
f ( X )dx

No exemplo anterior, a varincia da varivel aleatria X ser:


+ 15
V[X ] = ( X E[ X ]) f ( X )dx = ( X 10) 2 (1 / 10)dx =
2

5
15
15
X2 X3
5 10 2 X + 10)dx =
(
30
X 2 + 10 X = 8,333
5

146
COVARIANCIA ENTRE DUAS VARIAVEIS ALEATORIAS

Covarincia uma medida de associao (relao) linear entre duas variveis aleatrias.
Se X e Y so duas v.a., a covarincia entre elas definida por:

Cov(X,Y) = E[(X-E(X))(Y-E(Y))]

Desta forma a covarincia entre duas variveis X e Y igual a mdia de uma varivel
aleatria Z que por sua vez o produto dos desvios de cada uma das duas variveis X e Y
em relao as suas respectivas medias.

Exemplifiquemos com o seguinte quadro de distribuio conjunta de duas variveis


aleatrias discretas X e Y:

X 0 1 2 P(y)
Y
1 3/20 3/20 2/20 8/20
2 1/20 1/20 2/20 4/20
3 4/20 1/20 3/20 8/20
P(x) 8/20 5/20 7/20 1

Para interpretar este quadro, podemos dizer que a probabilidade conjunta de X = 1 e Y =


2 P(X=1,Y=2) = 1/20. A probabilidade marginal de X = 1 P(X=1) = 5/20. A
probabilidade condicional de X = 2 dado que Y = 1

P( X = 1, Y = 2) 1/ 20 1
P(Y = 2 / X = 1) = = =
P ( X = 1) 5 / 20 5

A distribuio de probabilidade da varivel aleatria Z = (X-E(X))(Y-E(Y)) a prpria


distribuio de probabilidade conjunta dada no quadro acima para as variveis X e Y.
Como a covarincia uma esperana temos que:

Cov ( X , Y ) = E[( X E ( X ))(Y E (Y )] = ( X E ( X ))(Y E (Y )) p( X , Y )


Ou seja, a covarincia o somatrio do produto da varivel Z = (X-E(X))(Y-E(Y)) pelas
probabilidades conjuntas. Para calcular a covarincia devemos calcular as esperanas
(medias) de X e Y. Estas so:

147
8 5 7 19
E( X ) = 0 + 1 + 2 =
20 20 20 20
8 4 8
E (Y ) = 1 + 2 + 3 =2
20 20 20
No exemplo do quadro acima a covarincia igual a:

19 3 19 3 19 2
Cov( X , Y ) = (0 ) (1 2) + (1 ) (1 2) + (2 ) (1 2)
20 20 20 20 20 20
19 1 19 1 19 2
+ (0 ) (2 2) + (1 ) (2 2) + (2 ) (2 2)
20 20 20 20 20 20
19 4 19 1 19 3
+ (0 ) (3 2) + (1 ) (3 2) + (2 ) (3 2) =0
20 20 20 20 20 20

Um outro mtodo (mais fcil) de se calcular a covarincia dado pela expresso:

Cov ( X , Y ) = E ( XY ) E ( X ).E (Y )

Exerccio: Demonstre a validade da expresso acima

Sabemos que a definio de covarincia :

Cov(X,Y) = E[(X-E(X))(Y-E(Y))]

Podemos desenvolver o segundo termo desta expresso da seguinte forma:

Cov( X , Y ) = E ( XY E ( X )Y E (Y ) X + E ( X ) E (Y )) =
E ( XY ) E ( X ).E (Y ) E (Y ).E ( X ) + E ( X ).E (Y ) = E ( XY ) E ( X ) E (Y )

Apliquemos esta expresso aos dados do quadro acima para calcular a covarincia:

Para isto precisamos calcular E(XY). Para fazer isto devemos para cada valor do quadro
(para cada dupla de valores de X e Y) calculamos o valor do produto XY e multiplicamos
pela probabilidade conjunta.

E ( XY ) = 0.1.3 / 20 + 1.1.3 / 20 + 2.1.2 / 20 + 0.2.1/ 20 + 1.2.1/ 20 + 2.2.2 / 20


+0.3.4 / 20 + 1.3.1/ 20 + 2.3.3 / 20 = 1,9

Portanto a covarincia ser:

Cov ( X , Y ) = 1,9 (0,95).(2) = 0

Conclumos que as duas variveis aleatrias X e Y so no correlacionadas.

Se X e Y so duas variveis aleatrias independentes, ento Cov(X,Y) = 0

148
Mas a recproca no verdadeira. O fato de Cov(X,Y) = 0 no implica
necessariamente que X e Y sejam independentes.

Para o ultimo exemplo, verificamos que Cov(X,Y) = 0. No entanto vamos verificar que
estas duas variveis no so independentes. Para que X e Y sejam independentes
estritamente necessrio que P(X,Y) = P(X).P(Y) para todos os valores de X e Y. Ou seja,
para todas as clulas da distribuio de probabilidade conjunta, o valor da probabilidade
conjunta deve ser igual ao produto das probabilidades marginais respectivas.
Verifiquemos esta propriedade para o quadro de distribuio de probabilidade conjunta
anterior.

X 0 1 2 P(y)
Y
1 3/20 3/20 2/20 8/20
8/20.8/20 = 8/20.5/20 = 8/20.7/20 =
16/400 40/400 56/400
2 1/20 1/20 2/20 4/20
4/20.8/20 = 4/20.5/20 = 4/20.7/20 =
32/400 20/400 28/400
3 4/20 1/20 3/20 8/20
8/20.8/20 = 8/20.5/20 = 8/20.7/20 =
56/400 40/400 56/400
P(x) 8/20 5/20 7/20 1

No quadro acima os valores em negrito so as probabilidades conjuntas e logo em seguida


vem o calculo do produto das probabilidades marginais respectivas. Observe-se que para
a primeira clula temos P(X=0,Y=1) = 3/20 = 0,15 e P(X=0).P(Y=1) = 16/400 = 0,04. Na
segunda clula da primeira linha temos P(X=1,Y=1) = 3/20 = 0,15 e P(X=1).P(Y=1) =
40/400 = 0,1. Portanto em nenhuma destas duas clulas a probabilidade conjunta coincide
com o produto das probabilidades marginais respectivas. Bastava que para apenas uma
das clulas no ocorresse a igualdade de probabilidades e as variveis aleatrias j seriam
dependentes. Para que ocorra independncia perfeita entre as variveis aleatrias
necessrio que para todas as clulas da distribuio de probabilidade conjunta ocorra a
igualdade entre a probabilidade conjunta e o produto das probabilidades marginais
respectivas.

149
Sejam X e Y duas variveis quaisquer. Ento

Var(X + Y) = Var(X) + Var(Y) + 2 Cov(X,Y)

No caso de X e Y serem independentes temos o caso particular de

Var(X + Y) = Var(X) + Var(Y) j que Cov(X,Y) = 0

Exerccio: Demonstre teoricamente a expresso acima. Var(X + Y) = Var(X) + Var(Y) +


2 Cov(X,Y)

Para mais de duas variveis independentes:

Var(X1+ X2 + ......+ Xn) = Var(X1)+ Var(X2)+...+ Var(Xn)

COVARIANCIA PARA VARIAVEIS ALEATORIAS CONTINUAS

Se X e Y so duas variveis aleatrias continuas a covarincia dada pela seguinte


expresso:


Cov( X , Y ) = E[( X E ( X )).(Y E (Y ))] = (x

X )( y Y )dxdy

Exemplo: suponhamos que duas variveis aleatrias continuas X e Y tenham a seguinte


funo de densidade conjunta.

8 xy, 0 x 1,0 y x
f ( x, y ) =
0, para outros valores

Em primeiro lugar calculamos as funes de densidade marginais.

x
x2
g ( x) =

f ( x, y )dy =


8 xydy =8 x ydy =8 x.
0
2
= 4 x3

Portanto a funo de densidade de probabilidade marginal para a varivel aleatria X :

4 x3 0 x 1
g ( x) =
0 para outros valores

150
Da mesma forma podemos determinar a funo de densidade de probabilidade marginal
de Y da seguinte forma:

1
12 y 2
h( y ) =

f ( x, y )dx =


8 xydx =8 y xdx =8 y.
y
2
= 4 y (1 y 2 )

Portanto a funo de densidade de probabilidade marginal para a varivel aleatria Y :

4 y (1 y 2 ) 0 y 1
g ( y) =
0 para outros valores

As esperanas matemticas (medias) de X e Y so calculadas como:


X = E ( X ) = x.4 x3 dx = 4 / 5
0
1


Y = E (Y ) = y.4 y (1 y 2 )dy = 8 /15
0

1 1
4
8x y dxdy = 9
3 2
E ( XY ) =
0 y

4 4 8 4
Cov ( X , Y ) = XY = E ( XY ) X Y = =
9 5 15 225

importante destacar que a varincia de uma varivel aleatria pode ser interpretada
como a covarincia desta varivel com relao a ela mesma. Ou seja,

Cov( X , X ) = E[( X X )( X X )] = E[( X X ) 2 ] = Var ( X )

Qual a interpretao pratica da covarincia?

A covarincia serve para verificar se duas variveis aleatrias movimentam-se ou no no


mesmo sentido. Por exemplo, se quando uma varivel X aumenta a varivel Y tambm
aumenta e se quando X diminui, Y tambm diminui (as variveis) movimentam-se,
covariam no mesmo sentido, a covarincia positiva. Ao contrario, quando X aumenta, Y
diminui ou quando X diminui, Y aumenta, ou seja, as variveis covariam em sentidos
opostos, a covarincia negativa.

Podemos calcular a covarincia, quando temos a distribuio de probabilidade conjunta


como foi mostrado anteriormente. Mas podemos tambm calcular a covarincia se

151
tivermos um conjunto de dados observados para as variveis X e Y. Por exemplo,
utilizemos o exemplo 4.4 da pagina 81 do Morettin.

Na figura a seguir temos o grfico de disperso das variveis X e Y referente a tabela a


seguir. Neste grfico temos os pares de valores (x,y).

Agente Anos de servio (X) Nmero de clientes (Y)


A 2 48
B 3 50
C 4 56
D 5 52
E 4 43
F 6 60
G 7 62
H 8 58
I 8 64
J 10 72

Diagrama de disperso para as variveis X (anos de servio) e Y (numero de clientes)


70
Nmero de clientes (Y)
50 40 60

2 4 6 8 10
Anos de servio (X)

152
Na figura a seguir apresentamos a planilha Excel para o calculo da covarincia e do
coeficiente de correlao. Na quarta e quinta colunas da planilha temos os valores das
variveis subtrados das suas medias. Na sexta coluna temos o produto destas duas
ultimas colunas. A media desta ultima coluna o valor da covarincia. Finalmente nas
duas ultimas colunas calculamos os desvios ao quadrado das variveis em relao as suas
medias (para podermos calcular a varincia e o desvio padro de cada uma delas).
Finalmente, calculamos o coeficiente de correlao como sendo a diviso entre a
covarincia e o produto dos desvios padres de X e de Y.

153
154
Problemas Resolvidos

Problema 31, pg 228 (Morettin)

Casal Rendimento do Homem Rendimento da Mulher (Y)


(X)
1 10 5
2 10 10
3 5 5
4 10 5
5 15 5
6 10 10
7 5 10
8 15 10
9 10 10
10 5 10

(a) Construa a distribuio de probabilidade conjunta de X e Y

(b) Determine as distribuies marginais de X e Y

(c) X e Y so v.a. Independentes? Justifique.

(d) Calcule as medias e varincias de X e Y e a covarincia entre elas.

(e) Considere a varivel aleatria Z igual a soma dos rendimentos de cada homem e cada
mulher. Calcule a media e varincia de Z.

(f) Supondo que todos os casais tenham a renda de um ano disponvel, e que se oferecera
ao casal escolhido a possibilidade de comprar uma casa pelo preo de 20, qual a
probabilidade de que o casal escolhido possa efetuar a compra?

Soluo

(a) Para a varivel X temos a ocorrncia de 3 valores (5, 10 e 15) e para a varivel Y
temos a ocorrncia de 2 valores (5 e 10). Iremos construir a distribuio de
probabilidade conjunta de acordo com a freqncia relativa de ocorrncia destes
valores conjuntos. Por exemplo, em 10 observaes (casais) vemos que o par
(X=10, Y = 5) ocorre 2 vezes. Portanto a freqncia relativa 2 /10 = 0,2 e este
o valor da probabilidade conjunta de X = 10 e Y = 5. Desta forma a nossa
distribuio de probabilidade conjunta :\
(b)

155
X 5 10 15 p(Y)
Y
5 1/10 2/10 1/10 4/10
10 2/10 3/10 1/10 6/10
p(X) 3/10 5/10 2/10 1

(b) As distribuies marginais j foram calculadas na Tabela acima

(c) Para verificar se X e Y so independentes, verifiquemos se o produto das


probabilidades marginais igual a probabilidade conjunta para todas as clulas. Para a
primeira clula no canto superior esquerdo, temos P(X=5).P(Y=5) = 3/10 . 4/10 = 12
/100 que diferente de 1/10 e desta forma j constatamos a no independncia entre X e
Y.

(d) A mdia de X E[X] = 5. 3/10 + 10. 5/10 + 15 . 2/10 = 15/10 + 50/10 + 30/10 =
95/10 = 9,5. A media de Y E[Y] = 5. 4/10 + 10 . 6/10 = 20/10 + 60/10 = 8.

A varincia de X pode ser calculada como E[X2] (E[X])2


3 5 2
= 52. + 102. + 152. 9,52 = 12, 25
10 10 10

A Varincia de Y E[Y 2 ] ( E[Y ])2 = 52.4 /10 + 102.6 /10 82 = 10 + 60 64 = 6

A covarincia pode ser calculada de trs formas. Na primeira forma, consideramos a


expresso da prpria definio de covarincia.

Cov ( X , Y ) = E[( X X )(Y Y )] = (X X )(Y Y ) p XY


1 2 1
= (5 9,5)(5 8) + (10 9,5)(5 8) + ... + (15 9,5)(10 8) = 1
10 10 10

Na segunda forma, utilizamos a expresso


Cov ( X , Y ) = E ( XY ) E ( X ) E (Y ) = XYp XY E ( X ) E (Y ) =
1 2 1 2 3 1
5.5. + 5.10. + 5.15. + 10.5. + 5.10. + 10.15. 9,5 8 = 1
10 10 10 10 10 10

O coeficiente de correlao calculado como:

156
cov( X , Y ) 1
= = = 0,1166
X Y 12, 25 6

Diagrama de disperso para as variveis X e Y


10
9
8
Y
7
6
5

5 10 15
X

157
Planilha Excel para o calculo da covarincia pelos 3 metodos:

158
Problema 35 pagina 229 do MORETTIN

Se E[X] = e Var(X) = 2 , escreva em funo de e 2 as seguintes expresses:

(a) E(X2) (b) E[(X(X-1)]

Soluo:

(a) E ( X 2 ) = Var ( X ) + ( E ( X ) )2 = 2 + 2

E[ X ( X 1)] = E[ X 2 X ] = E[ X 2 ] E[ X ] = Var ( X ) + ( E[ X ])2 E[ X ] =


(b)
2 + 2 = 2 + ( 1)

Problema 39 pagina 229 do MORETTIN

Se ( X , Y ) for o coeficiente de correlao entre X e Y, e se tivermos Z = AX + B, W = CY + D,


com A > 0, C > 0, prove que ( X , Y ) = ( Z , W )

Soluo:

Cov( Z , W ) = Cov( AX + B, CY + D) = E[( AX + B )(CY + D)] E[ AX + B].E[CY + D ]


= E[ ACXY + ADX + BCY + BD] ( E[ AX ] + E[ B]).( E[CY ] + E[ D]) =
cov( Z , W )
( Z ,W ) = Mas AC.E[ XY ] + AD.E[ X ] + BC.E[Y ] + E[ BD] ( A.E[ X ] + B).(C.E[Y ] + D) =
Z W
AC.E[ XY ] + AD.E[ X ] + BC.E[Y ] + BD ( AC.E[ X ].E[Y ] + AD.E[ X ] + BC.E[Y ] + BD) =
AC.E[ XY ] ACE[ X ].E[Y ] = AC.Cov( X , Y )

Z = AX + B = A X pois Var(AX+B)=A 2Var ( X ) e da mesma forma W = C Y

cov( Z , W ) AC cov( X , Y )
Portanto ( Z , W ) = = = ( X ,Y )
Z W A X C Y

interessante notar que a condio imposta pelo MORETTIN de que A > 0 e C > 0 no
necessria.

Problema 41 pagina 230 do MORETTIN

Suponha que X e Y sejam v.a. com Var(X) = 1, Var(Y) = 2 e ( X , Y ) = 1/ 2 . Determine Var(X-


2Y)

Soluo:

159
Var ( X 2Y ) = Var ( X ) + Var (2Y ) 2Cov( X , 2Y ) =
Var ( X ) + 4Var (Y ) 2( E[2 XY ] E[ X ].E[2Y ]) =
Var ( X ) + 4Var (Y ) 2(2 E[ XY ] 2 E[ X ].E[Y ]) =
Var ( X ) + 4Var (Y ) 4Cov ( X , Y ) =
Var ( X ) + 4Var (Y ) 4 ( X , Y ). X Y =
1
1 + 4.2 4. .1. 2 = 11,83
2

Recordao: VARIANCIA E COVARIANCIA

A media ou valor esperado de uma varivel aleatria X de especial importncia na


estatstica porque ela descreve onde a distribuio de probabilidade est centrada. Por ela
mesma, entretanto, a media no d nenhuma noo adequada da distribuio ou da forma
da distribuio da varivel aleatria. Precisamos caracterizar a variabilidade da
distribuio.

Definio

Seja X uma varivel aleatria com distribuio de probabilidade f(x) e media . A


variancia de X
2 = E[( X ) 2 ] = ( x ) 2 f ( x) se X uma variavel aleatoria discreta
x

2 = E[( X ) 2 ] = ( x ) 2 f ( x)dx se X uma variavel aleatoria continua

A raiz quadrada da varincia, , chamada de desvio padro de X.

Estas so as definies de varincia quando estamos considerando a estatstica antes da


realizao do experimento aleatrio, ou seja, trata-se de um calculo baseado em um
modelo probabilstico (a distribuio de probabilidade no caso de varivel aleatria
discreta ou a funo de densidade de probabilidade no caso de varivel aleatria
continua). Quando estamos enfocando a estatstica aps a realizao do experimento
aleatrio temos uma formula distinta para a varincia que :

(x ) 2

2 = i =1
para o caso de uma populao
N

(x )
i =1
2

s2 = para o caso de uma amostra


n 1

160
A quantidade x chamada desvio de uma observao em relao a media da
distribuio. Como estes desvios so elevados ao quadrado e depois calculada a media
destes valores ao quadrado. 2 ser menor se os valores de x estiverem mais prximos
da media e ser maior de os valores de x estiverem mais afastados desta media .

Exemplo:

Seja X uma varivel aleatria representada pelo numero de automveis que so usados
para propsitos de negcios oficiais em qualquer dia da semana. A distribuio de
probabilidade para a companhia A dada por

x 1 2 3
f(x) 0,3 0,4 0,3

e para a companhia B dada por

x 0 1 2 3 4
f(x) 0,2 0,1 0,3 0,3 0,1

Mostre a companhia A, a mdia dada por

= E ( X ) = (1)(0,3) + (2)(0,4) + (3)(0,3) = 2,0

E a varincia dada por

3
2 = ( x 2) 2 f ( x) = (1 2) 2 (0,3) + (2 2) 2 (0,4) + (3 2) 2 (0,3) = 0,6
i =1

Para a companhia A, temos

= E ( X ) = (0)(0,2) + (1)(0,3) + (2)(0,3) + (3)(0,3) + (4)(0,1) = 2,0

E a varincia dada por

4
2 = ( x 2) 2 f ( x) = (0 2) 2 (0,2) + (1 2) 2 (0,1) + (2 2) 2 (0,3) + (3 2) 2 (0,3) + (4 2) 2 (0,1) = 1,6
i =1

A varincia para o numero de automveis maior para a companhia B do que para a


companhia A.

A varincia pode ser obtida tambm atravs de uma formula mais simples.

161
2 = ( x ) 2 f ( x) = ( x 2 2 x + 2 ) f ( x) = x 2 f ( x) 2 xf ( x) + 2 f ( x)
x x x x x

Como = xf ( x) por definio e f ( x) = 1 para qualquer distribuio de


x x
probabilidade discreta, segue-se que

2 = x 2 f ( x) 2 = E ( X 2 ) 2
x

Exemplo: Seja a varivel aleatria X que representa o numero de peas defeituosas para
uma maquina quando 3 peas so selecionadas da linha de produo e testadas. Temos
ento a seguinte distribuio de probabilidade para X:

x 0 1 2 3
f(x) 0,51 0,38 0,10 0,01

Utilizando a ultima expresso, calcule 2 .

Soluo:

= (0)(0,51) + (1)(0,38) + (2)(0,10) + (3)(0,01) = 0,61

E ( X 2 ) = (0)(0,51) + (1)(0,38) + (4)(0,10) + (9)(0,01) = 0,87

Portanto: 2 = 0,87 (0,61) 2 = 0,4979

Exemplo: A demanda semanal por uma marca de refrigerante, em milhares de litros uma
varivel aleatria continua X com densidade de probabilidade

2( x 1), 1 < x < 2


f ( x) =
0, para quaisquer outros valores
Ache a media e a varincia de X.

Soluo:

2
5
= E ( X ) = 2 x( x 1)dx =
1
3
e

2
17
E ( X 2 ) = 2 x 2 ( x 1)dx =
1
6

162
Portanto:

2
17 5 7
= =
2

6 3 18

Neste ponto a varincia ou desvio padro somente tem significado quando comparamos
duas ou mais distribuies que tem as mesmas unidades de medida. Portanto, podemos
comparar as varincias das distribuies dos contedos, medidos em litros, para duas
companhias engarrafadoras de suco de laranja e o maior valor indicar a companhia cujo
produto mais varivel ou menos uniforme. No tem significado comparar a varincia da
distribuio de alturas de pessoas com a varincia da distribuio dos coeficientes de
inteligncia (Q.I.).

Agora vamos estender nosso conceito de varincia de uma varivel aleatria X para
tambm incluir variveis aleatrias relacionadas a X. Para a varivel aleatria g(X), a
varincia ser denotada por g2( X ) e calculada por meio dos seguintes teoremas.

Teorema: Seja X uma varivel aleatria com distribuio de probabilidade f(x). A mdia
ou valor esperado da varivel aleatria g(X)

g ( X ) = E [ g ( X ) ] = g ( x ) f ( x ) se X discreta, e
x

g ( X ) = E [ g ( X ) ] = g ( x ) f ( x )dx se X contnua

Exemplo: Suponha que o numero de carros, X, que passam atravs de uma lavadora de
carros entre 4 hs e 5 hs da tarde em qualquer sexta-feira ensolarada tem a seguinte
distribuio de probabilidade:

x 4 5 6 7 8 9
P(X=x) 1/12 1/12 1/4 1/4 1/6 1/6

Seja g(X) = 2X 1 que representa a quantidade de dinheiro em reais, paga ao lavador


pelo proprietrio. Encontre o ganho esperado do lavador para este perodo de tempo
particular.

Soluo:

163
9
1 1 1
g ( X ) = E [ g ( X ) ] = E [ 2 X 1 ] = (2 x 1) f ( x ) = (7)( ) + (9)( ) + (11)
4 12 12 4
1 1 1
(13)( ) + (15) + (17)( ) = R$12, 67
4 6 6

Teorema.

Seja X uma varivel aleatria com distribuiao de probabilidade f(x). A varincia da


varivel aleatria g(X)

{
g2( X ) = E g ( X ) g ( X )
2
} = g ( X )
x
g( X )
2
f ( x )

Se X discreta, e

{ }

g ( X )
2 2
g2( X ) = E g ( X ) g ( X ) = g( X ) f ( x )dx
x

Se X contnua.

No vamos nos preocupar com a demonstrao deste teorema.

Exemplo: Calcule a varincia de g(X) = 2X + 3, onde X uma varivel aleatria com


distribuio de probabilidade

x 0 1 2 3
f(x) 1/4 1/8 1/2 1/8

Soluo:

3
2 X + 3 = E [ 2 X + 3 ] = (2 x + 3) f ( x ) = 6
x =0

2
2 X +3 =E { [(2 X + 3) 2 X +3 ]2 } = E { [ 2 X + 3 6 ] } = E 4 X
2 2
12 X + 9
3
= (4 x 2 12 x + 9) f ( x ) = 4
x =0

Exemplo: Seja X uma varivel aleatria que tem funao densidade


x3
, -1 < x < 2
f ( x) = 3
0, para quaisquer outros valores

164
Ache a varincia da varivel aleatria g(X) = 4X+3

2 2
(4 x + 3) x 2 1
E (4 X + 3) = 1 3 dx = 3 1 (4 x + 3x )dx = 8
3 2

{ [ (4 X + 3) 8 ] }
2
2 x
= E (4 X 5) = (4 x 5)
2
2
4 X +3 =E 2
dx
1
2
2
1 51
=
3 1
(16 x 4 40 x 3 + 25 x 2 )dx =
5

5.3 Varivel Aleatria Normal

A mais importante (e mais utilizada na prtica) varivel aleatria contnua a varivel


aleatria normal.
A varivel aleatria normal tem uma funo densidade de probabilidade (chamada de
curva normal) que apresenta a forma de um sino e unimodal no centro exato da
distribuio.
A mdia, mediana e a moda da distribuio normal so iguais e localizadas no pico da
distribuio.
Metade da rea sob a curva est acima do ponto central (pico) e a outra metade est
acima dele.
A distribuio de probabilidade normal simtrica em relao a sua mdia.
Ela assinttica  acurva aproxima-se cada vez mais do eixo X mas nunca toca
efetivamente ele.
Figura 1 Caractersticas de uma Funo Densidade de Probabilidade Normal
(Distribuio Normal)

165
Figura 2 Duas Distribuies Normais com mesma mdia mas distintos desvios padres

Podemos tambm ter distribuies normais com o mesmo desvio padro, mas com
distintas mdias ou com mdias e desvios padres distintos. Na realidade a distribuio
normal um nome genrico para definir uma famlia de infinitas distribuies normais
particulares, cada uma com os seus valores especficos de mdia e desvio padro. O que
caracteriza, portanto, e diferencia uma distribuio normal de outra so os valores destes
dois parmetros: a sua mdia e o seu desvio padro. A funo densidade de probabilidade
de uma varivel aleatria normal dada por:

( X ) 2
1
f (X ) = e 2 2

2 2

possvel demonstrar matematicamente que a mdia (ou valor esperado) dessa varivel
aleatria igual ao seu parmetro e o seu desvio padro igual ao seu segundo

parmetro (da equao acima) . O que quer dizer que se aplicarmos as definies de
valor esperado e de varincia de uma varivel aleatria contnua a expresso acima

166
chegaremos aos resultados e 2 . O problema recamos em integrais mais difceis de
serem resolvidas:

+ + ( X ) 2
1
E[ X ] = Xf ( X )dx = X
2 2
e 2 2
dx =

e
+ + ( X ) 2
1
V[X ] = ( X E[ X ]) f ( X )dx = ( X ) 2 2
dx = 2
2 2
e
2 2

(talvez um bom matemtico possa fazer essa demonstrao, mas no o nosso caso pois
pretendermos ser bons em estatstica aplicada to somente).
possvel tambm demonstrar matematicamente que as duas abscissas no eixo X de
valor + e - correspondem a pontos de inflexo da curva normal. Para isto basta
obter a segunda derivada da funo densidade e provar que o seu valor muda de sinal no
ponto de inflexo mostrando que a a curvatura muda de sentido de cncava para convexa
ou vice-versa.

5.4 Distribuio Normal Padro

muito difcil ficarmos calculando probabilidades para distribuies normais atravs de


clculos de integrao. Para evitar este trabalho foi definida uma distribuio normal
particular chamada de distribuio normal padro. Esta distribuio tem as caractersticas
de ser uma distribuio normal com mdia (valor esperado) igual a zero e desvio padro
igual a 1. Em notao matemtica dizemos que:

Z ~ N(0,1)

Se X uma varivel aleatria normal com mdia diferente de zero e desvio padro
diferente de 1 podemos converter essa distribuio em uma distribuio normal padro
atravs da transformao linear:

167
X
Z=

Para que serve essa distribuio Z? Nada melhor que um exemplo para explicar isso.

Exemplo: As rendas mensais dos graduados em um curso de especializao em uma


grande empresa so normalmente distribudas com uma mdia de R$ 2000 e um desvio
padro de R$ 200. Qual o valor de Z para uma renda X de R$ 2200? R$ 1700?

X 2200 2000
Para X = 2200  Z = = =1
200

X 1700 2000
Para X = 1700  Z = = = 1,5
200

Um valor de Z = 1 indica que o valor de R$ 2200 est localizado 1 desvio padro


acima da mdia de R$ 2000.
Um valor de Z = -1,5 indica que o valor de R$ 1700 est localizado 1,5 desvio padro
abaixo da mdia de R$ 2000.

5.5 reas Abaixo da Curva Normal

Cerca de 68 % da rea sob a curva normal est entre menos um e mais um desvio
padro da mdia. Isto pode ser escrito como 1 .

Cerca de 95 % da rea sob a curva normal est entre menos dois e mais dois desvios
padres da mdia, escrito como 2 .

Praticamente toda (99,74 %) a rea sob a curva normal est entre menos trs e mais
trs desvios padres da mdia, escrito como 3 .

168
Exemplo 2:
O uso dirio de gua por pessoa em uma determinada cidade normalmente distribudo
com mdia igual a 20 litros e desvio padro igual a 5 litros. O uso dirio de cerca de
68 % das pessoas nesta cidade caem entre que valores?

1 = 20 1 (5) . Ou seja, cerca de 68 % das pessoas usam de 15 a 25 litros de


gua por dia.

Similarmente, para 95 % e 99 %, os intervalos sero de 10 a 30 litros e 5 a 35 litros.

Qual a probabilidade de que uma pessoa selecionada ao acaso usar menos do que 20
litros por dia ?

O valor de Z Z = (20 20) / 5 = 0. Portanto P(X < 20) = P(Z < 0) = 0,5.

169
Qual a probabilidade de que uma pessoa selecionada ao acaso use mais do que 20 litros
por dia ?

O valor de Z Z = (20 20) / 5 = 0. Portanto P(X > 20) = P(Z > 0) = 0,5.

Que percentagem da populao usa entre 20 e 24 litros por dia ?

X = 20  Z=0

24 20
X = 24  Z= = 0,8
5

P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).

Que percentagem usa entre 16 e 20 litros ?

16 20
X = 16  Z= = 0,8
5
X = 20  Z=0

P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P(0 < Z < 0,8) = 0,2881 = 28,81

Para a obteno das probabilidades para a curva normal padro Z consulta-se uma tabela
que pode ser encontrada em anexo em praticamente todos os livros de estatstica.
Reproduziremos a seguir integralmente essa tabela (para que possa ser mostrado para os
exemplos anteriores como foram obtidas as reas (que so probabilidades) abaixo da
curva norma Z. Resolvemos colocar a tabela no corpo do texto devido a sua grande
importncia em estatstica aplicada (e achamos que ela no deve ser relegada a um anexo
que poucos alunos tem a curiosidade de consultar).

170
Tabela 1 Valor de P(0 < Z < Z0) onde Z varivel normal padro
Z0 Segunda decimal de Z0

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4625 0,4633
1,8 0,4641 0,4649 0,4658 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4986 0,4986

171
3,0 0,4987 0,4987 0,4987 0,4990 0,4990

Qual a probabilidade de que uma pessoa selecionada ao acaso use mias do que 28 litros ?

X = 28  Z = (28 20 )/ 5 = 1,6

P( X > 28) = P (Z > 1,6) = 0,5 - 0,4452 = 0,0548

172
Qual a porcentagem entre 18 e 26 litros ?

18 20
X = 18  Z = = 0,4
5
26 20
X = 26  Z = = 1,2
5

P(18 < X < 26) = P(-0,4 < Z < 1,2) = 0,1554 + 0,3849 = 0,5403

Quantos litros ou mais 10 % da populao usam ? Em outras palavras,para os 10 % da


populao que mais consomem gua qual o valor mnimo desse consumo ?

Seja X a quantidade mnima. Portanto, precisamos encontrar X tal que P ( X X ' ) = 0,1
. Para achar o valor de Z correspondente veja no corpo (miolo) da tabela o valor de Z0 que
deixa uma rea entre 0 e Z0 igual a (0,5 0,1) = 0,4. O valor correspondente de Z0 1,28
(aproximadamente). Portanto, temos:
X '20
= 1,28  X = 26,4. Ou seja, 10 % da populao usa no mnimo 26,4 litros por
5
dia (ver figura).

173
Exemplo 4

Um professor verificou que as mdias finais em seu curso de Estatstica tem distribuio normal
com uma mdia igual a 72 e desvio padro 5. Ele decide atribuir conceitos para o seu curso tal
que os melhores 15 % recebem grau A . Qual a mnima mdia que o estudante precisa receber
para obter um A ?

Seja X a mnima mdia. P ( X X ' ) = 0,15


O Z correspondente 1,04 (aproximadamente)

X '72
= 1,04 X' = 77,2
5

174
6. Mtodos de Amostragem e Distribuies Amostrais

OBJETIVOS DO CAPTULO:

Explicar porque em muitas situaes uma amostra a nica forma plausvel de


aprender alguma coisa sobre uma populao.
Explicar os mtodos de selecionar uma amostra
Distinguir entre amostragem probabilstica e amostragem no probabilstica
Definir e construir uma distribuio amostral de mdias amostrais
Explicar o Teorema do Limite Central e sua importncia para a Inferncia Estatstica
Calcular Intervalos de Confiana para Mdias e Propores
Determinar que tamanho uma amostra deve ter para estimar mdias e propores

Porque amostrar uma populao

Natureza destrutiva de certos testes


A impossibilidade fsica de checar todos os itens na populao
O custo de estudar todos os itens em uma populao freqentemente proibitivo
Muitas vezes as estimativas baseadas em uma amostra so mais precisas do que os
resultados obtidos atravs de um levantamento censitrio
Tempo muito elevado para a apurao de resultados em censos

INFERENCIA ESTATISTICA

O nome inferncia refere-se a operaes estatsticas em que com base em uma amostra
estabelecem-se afirmaes sobre uma populao. Uma populao qualquer conjunto de
objetos (pessoas, animais, coisas no querendo naturalmente coisificar os seres
humanos). Geralmente um conjunto bastante amplo de objetos, por exemplo as pessoas
de um determinado pais ou regio, os representantes de uma espcie animal no planeta e
assim por diante. Os elementos de uma populao podem ser enumerveis ou no

175
enumerveis. So enumerveis quando podemos identificar cada um dos elementos e
relacionar, por exemplo, um numero inteiro a cada um deles. Assim se por exemplo
estivermos estudando uma varivel X, a renda pessoal de cada uma das pessoas desta
populao, a renda da primeira pessoa ser X1, a renda da pessoa ser X2 e a renda da
ultima pessoa da populao ser XN se a populao tiver N elementos.
Muitas vezes, na maior parte dos casos no se examinam todos os elementos da
populao, por razoes de custo da pesquisa e de tempo. Ento seleciona-se uma amostra
de elementos da populao. No caso em que investigamos todos os elementos da
populao a pesquisa comumente chamada de censo, como o caso do Censo
Demogrfico do IBGE que realizado de 10 em 10 anos.
Os levantamentos por amostragem esto sujeitos a um erro denominado erro de
amostragem ou erro amostral. Estes erros tem natureza probabilstica, pois no podemos
prever ou antecipar qual ser o erro exato da amostra mas podemos calcular
probabilidades de que o erro seja de um determinado valor. E mesmo isto s possvel
quando nossa amostra probabilstica. Uma amostra probabilstica uma amostra cuja
seleo definida em termos de probabilidades de seleo dos elementos da populao.
Se definimos um regra de seleo da amostra a partir dos elementos da populao
atribuindo valores bem precisos de probabilidades de seleo para todos os elementos da
populao, dizemos que a amostra probabilstica. Por exemplo, podemos dizer que a
probabilidade de seleo de cada elemento da populao na amostra um numero que
deve ser diretamente proporcional a idade dos elementos. Ento se um individuo tiver 30
anos ele ter o dobro da chance de ser selecionado que um individuo de 15 anos. Alem
disto as probabilidades somadas de todos os indivduos da populao deve perfazer um
total exatamente igual a 1. Dizemos ento que P(Xi) = k . Idadei e
N

P( X ) = 1 . Se tivermos uma populao com 10 indivduos com as seguintes idades


i =1
i

(10,20,30,40,50,60,70,80,90,100) a probabilidade de seleo do primeiro individuo ser


igual a k.10, a probabilidade de seleo do segundo individuo ser k.20 e ento
k.10 + k.20 +....+ k.100 = 1 e portanto k = 1/550 e a probabilidade de seleo do primeiro
individuo ser igual a 10/550 = 0,01818 , a probabilidade de seleo do segundo

176
individuo ser 20/550 = 0,03636 e a probabilidade de seleo do ultimo individuo cuja
idade de 100 anos ser de 100/550 = 0,1818.
A amostra probabilstica mais comumente utilizada aquela chamada de amostra aleatria
simples que doravante chamaremos de AAS. Nesta todos os elementos da populao tem
a mesma probabilidade de serem selecionados. Por exemplo, suponhamos que temos uma
populao com N = 100 e desejamos selecionar uma amostra de tamanho n = 30. Se cada
elemento da populao tem a mesma chance de entrar na amostra ento a probabilidade
de seleo de cada um deles ser um numero constante e igual a 1/100. Esta ser a
probabilidade do elemento Xi ser selecionado na primeira extrao da amostra. Como a
seleo da amostra envolve 30 extraes aleatrias e independentes temos aqui um
problema mais complexo. Dizemos com maior rigor que uma amostra AAS se para cada
uma das extraes todos os elementos da populao tem idntica probabilidade.
Aprofundemos esta questo para o caso mais simples, uma AAS selecionada com
reposio. Neste exemplo de N = 100 e n = 30 a probabilidade do numero de vezes em
que cada um dos elementos da populao est contido na amostra uma varivel aleatria
binomial com parmetros p = 100 e n = 30. Por exemplo, qual a probabilidade de que o
dcimo elemento da populao (poderia ser qualquer um) ser selecionado 3 vezes na
amostra de 30 elementos? Esta probabilidade igual a

3 30 3
10 1 1
P ( X = 3) = 1 = 0,00009148
3 100 100

No vamos complicar para o caso de uma AAS selecionada sem reposio. Fica a cargo
do aluno interessado e curioso tentar calcular qual seria a probabilidade de selecionar ao
menos uma vez um dos 100 elementos da populao em uma amostra de 30 elementos.
Fica apenas a sugesto de utilizar a distribuio hipergeomtrica (deve ser justificada).
Qual a vantagem de uma amostra ser aleatria, frente a amostras no aleatrias,
escolhidas por critrios subjetivos e ao gosto do pesquisador. Em primeiro lugar, porque
como veremos adiante, uma amostra escolhida por critrios rigorosamente objetivos tende
a no introduzir vieses que ocorrem quando a seleo obtida por critrios discutveis.

177
Um pesquisador de campo pode selecionar apenas domiclios que tem menos quantidade
de pessoas para facilitar o seu trabalho e pode tambm evitar os domiclios de difcil
acesso. Mas a principal vantagem de uma amostra probabilstica (frente a uma amostra
subjetivista) que atravs de seus resultados possvel realizar clculos
probabilsticos.
Uma boa amostra deve apresentar 3 virtudes: 1) deve ser aleatria (pelos motivos que j
introduzimos e que iremos aprofundar mais adiante). 2) deve ser precisa e 3) deve ser
representativa e no geradora de vieses para as suas estimativas de parmetros da
populao. A preciso de uma amostra ira depender de seu tamanho. Geralmente quanto
maior o tamanho de uma amostra maior ser a sua preciso. A representatividade da
amostra depender no de seu tamanho, mas da maneira como os elementos so
selecionados da populao. Por exemplo, se tivermos uma populao constituda de 30
% de mulheres e 70 % de homens e estivermos interessados em estimar a quantidade
media de horas de estudo. Se selecionarmos uma amostra com 50 % de homens e 50 % de
mulheres a quantidade media de horas de estudo desta amostra no ser um bom
estimador da quantidade media de horas de estudo da populao (parmetro), se a
quantidade de horas de estudo for uma varivel que depende do sexo da pessoa. Se as
mulheres tenderem a estudar mais do que os homens esta amostra no representativa ir
conduzir a um valor superestimado da quantidade de horas de estudo media. J uma
amostra que tenha o mesmo percentual de homens e de mulheres que existe na populao
ser considerada representativa desta populao e a media de horas estudo obtida desta
amostra ser uma estimativa no viesada da media de horas de estudo da populao
(parmetro).
Podemos neste momento fazer uma importante distino entre: 1) parmetro; 2)
estimador e 3) estimativa. Parmetro uma grandeza fixa e que se refere a uma
populao. No nosso exemplo anterior, o numero de horas de estudo mdio na populao
nosso parmetro. O valor deste parmetro na maior parte dos casos um valor
desconhecido, pois raramente podemos medir toda uma populao. Geralmente
desconhecemos o valor deste parmetro e tentamos estim-lo. Para estim-lo utilizamos
um estimador que se refere a uma formula matemtica que ser aplicada aos dados de

178
uma amostra. A media de uma amostra um estimador do parmetro media da
populao. A estimativa o valor que o estimador assume para uma dada amostra
particular e somente para aquela amostra. As estimativas variam de amostra para amostra.
Para cada amostra diferente temos diferentes estimativas e estas so calculadas de acordo
com uma mesma frmula, que o estimador. No caso do numero de horas de estudo
mdio, podemos selecionar de uma populao de 1000 estudantes diversas amostras de
tamanho n = 50. Em uma primeira amostra, temos uma estimativa de media da amostra,
em uma segunda amostra temos outro valor para a estimativa. Este valor da estimativa
que oscilar de amostra para amostra poder ser considerado resultado (valores
observados) de uma mesma varivel aleatria que justamente o estimador. Ento de
forma geral podemos dizer que um estimador da media populacional ( X ) a media da

amostra ( X ) e este estimador se comporta como uma varivel aleatria sendo que cada
um de seus valores de amostra para amostra uma estimativa.
A seguir mostramos uma tabela com uma listagem de diversos estimadores e parmetros.

Nome do estimador Estimador Nome do parmetro Parmetro


Media amostral n Media populacional N

Xi X i
X = i =1
= i =1

n N
Varincia amostral n Varincia N

(X i X )2 (X i )2
s2 = i =1 populacional 2 = i =1

n 1 N
Proporo amostral n Proporo N

X i X i
p = i =1
onde populacional p= i =1
onde Xi
n N
Xi = 0 ou 1 = 0 ou 1
Total amostral N n Total populacional N
T = X i T = Xi
expandido n i =1 i =1

Na primeira linha desta tabela temos a media amostral que um estimador da media
populacional. Na segunda linha temos a varincia amostral que um estimador da

179
varincia populacional. Observe o detalhe que o denominador da formula da varincia
amostral n-1 e no n (ao contrario o denominador da formula da varincia populacional
N e no N-1). Isto porque necessrio que o estimador seja no viesado o que quer
dizer que E[s2] = 2 . Para entender melhor este conceito suponhamos que de uma
populao de tamanho N = 1000 selecionemos todas as amostras possveis de tamanho n
= 50. Para cada uma destas amostras calculamos o valor de s2 (utilizando a formula da
segunda linha, segunda coluna da tabela acima). Os valores de s2 iro variar de amostra
para amostra e podemos assim considerar que s2 uma varivel aleatria pois depende de
cada amostra selecionada (sendo que todas estas amostras tem o mesmo tamanho n = 50).
A media de todos estes valores de s2 dever ser igual ao valor de 2 (calculado
utilizando-se a formula da segunda linha, quarta coluna). Caso no ocorresse isto o
estimador seria viesado.
Vamos supor uma populao de 4 elementos {2,3,4,5} tendo media = 3,5 e varincia

2 = 1,25

6.1 Amostragem Probabilstica

O que uma amostragem probabilstica ?


uma amostra selecionada de tal forma que cada item ou pessoa na populao
estudada tm uma probabilidade (no nula) conhecida de ser includa na amostra.

Mtodos de Amostragem Probabilstica:

Amostragem Aleatria Simples (AAS)


Uma amostra escolhida de tal forma que cada item ou pessoa na populao tem a mesma
probabilidade de ser includa.
Se a populao tem um tamanho N, cada pessoa desta populao tem a mesma
probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela de nmeros
aleatrios para sortear (com mesma probabilidade) os elementos da amostra. Tambm

180
pode ser utilizada uma funo randmica: No Excel, por exemplo, temos a funo
ALEATRIO ENTRE.

Amostragem Aleatria Sistemtica

Os itens ou indivduos da populao so ordenados de alguma forma alfabeticamente ou


atravs de algum outro mtodo. Um ponto de partida aleatrio sorteado, e ento cada k-
simo membro da populao selecionado para a amostra.

Amostragem Aleatria Estratificada

A populao inicialmente dividida em subgrupos (estratos) e uma subamostra


selecionada a partir de cada estrato da populao

Amostragem aleatria Estratificada com Repartio Proporcional

Suponhamos que a populao subdividida em k estratos. Sejam:

N = o nmero de indivduos na populao


n = o nmero de indivduos na amostra
Ni = o nmero de indivduos contidos no i-simo estrato da populao
ni = o nmero de indivduos contidos no i-simo estrato na amostra

Ni
ni =n i = 1,2,....,k
N

os estratos devem ser o mais homogneos possveis com relao s caractersticas


relevantes da pesquisa (variveis que se correlacionam fortemente com a varivel
estudada) para um mesmo tamanho amostral, a amostragem aleatria estratificada com

181
repartio proporcional mais precisa (menor varincia do estimador) do que a
amostragem aleatria simples (AAS).

Amostragem Aleatria Estratificada com Repartio de Neyman (ou repartio


tima)

Se conhecermos a varincia de cada estrato populacional referente a varivel que estamos


desejando estimar o seu parmetro, um mtodo mais adequado o da repartio de
Neyman.

wi i Ni i
ni = n k
= n k

W
i =1
i i N
i =1
i i

para um mesmo tamanho amostral a preciso maior para amostra aleatria estratificada
com repartio de Neyman (repartio tima) do que para a amostra aleatria estratificada
com repartio proporcional que por sua vez maior do que a amostra aleatria simples

Amostragem por Conglomerados

A populao inicialmente subdividida inicialmente em subgrupos (estratos) e uma


amostra de estratos selecionada (por exemplo, com probabilidade proporcional ao
tamanho de cada estrato). A seguir, amostras so selecionadas dos estratos selecionados
previamente.

182
A principal vantagem da amostra por conglomerados a de possibilitar considervel
reduo de custos (em relao, por exemplo, a uma amostragem aleatria estratificada)
para um mesmo tamanho amostral.

O mtodo costuma ser empregado quando no dispomos de um cadastro da populao


(como no caso da amostragem sistemtica) e os custos de ser elaborado um cadastro para
toda a populao muito elevado.

Erro amostral: A diferena entre a estatstica amostral e seu correspondente


parmetro.

Uma distribuio de probabilidade consiste de uma lista de todos os possveis valores


das mdias amostrais de um dado tamanho amostral constante selecionado da
populao e a probabilidade de ocorrncia associada a cada mdia amostral.

Exemplo 1 Uma empresa tem 5 scios. Semanalmente, os scios relatam o nmero


de horas de atendimento a clientes
Scio Horas
1 22
2 26
3 30
4 26
5 22

Dois scios so selecionados aleatoriamente. Quantas amostras distintas so


possveis?
O nmero de amostras distintas de dois elementos tomados em 5 objetos corresponde
a:

5!
5C2 = = 10
( 2! )( 3! )

183
Scios Total Mdia
1,2 48 24
1,3 52 26
1,4 48 24
1,5 44 22
2,3 56 28
2,4 52 26
2,5 48 24
3,4 56 28
3,5 52 26
4,5 48 24

Organize as mdias amostrais em uma distribuio de freqncias.

Mdia freqncia Freqncia Relativa


Amostral (Probabilidade)
22 1 1/10
24 4 4/10
26 3 3/10
28 2 2/10

Calcule a mdia das mdias amostrais e compare-a com a mdia da populao.

A mdia da populao :
22 + 26 + 30 + 26 + 22
= = 25,2
5

A mdia das mdias amostrais :

(22)(1) + (24)(4) + (26)(3) + (28)(2)


= 25,2
10

Observe que a mdia das mdias amostrais igual a mdia populacional

6.2 Teorema do Limite Central

Para uma populao com mdia e uma varincia 2 , a distribuio amostral das
mdias de todas as possveis amostras de tamanho n, geradas a partir da populao,

184
ser aproximadamente normalmente distribuda com a mdia da distribuio
amostral igual e varincia igual 2 / n - assumindo que o tamanho amostral
suficientemente grande, ou seja, n 30 .

Em outras palavras, se a populao tem qualquer distribuio (no precisa ser


necessariamente normal) com mdia igual a e varincia igual a 2 , ento a
distribuio amostral dos valores mdios amostrais normalmente distribuda com

a mdia das mdias (


X ) igual a mdia da populao ( X ) e o erro
padro das mdias amostrais igual a
, desde que n 30 .
n

Note que o erro padro das mdias amostrais mostra quo prximo da mdia da
populao a mdia amostral tende a ser.

O erro padro das mdias amostrais calculado por:

X
X =
n
X o smbolo para o erro padro das mdias amostrais

X o desvio padro da populao

n o tamanho da amostra

Se no conhecido e n 30 (considerada uma amostra grande), o desvio padro da


amostra, designado por s, usado para aproximar o desvio padro da populao, .A
frmula para o erro padro torna-se:

185
s
sX =
n
n

(X i X )2
onde s = i =1

n 1

6.3 Estimativa de Ponto

Estimativa de ponto um valor (chamado um ponto) que usado para estimar um


parmetro populacional
Exemplos de estimativas de ponto so a mdia amostral, o desvio padro amostral, a
varincia amostral, a proporo populacional, etc.

Exemplo: O nmero de itens defeituosos produzidos por uma mquina foi registrado em
cinco horas selecionadas aleatoriamente durante uma semana de trabalho de 40 horas. O
nmero observado de defeituosos foi 12,4,7,14 e 10. Portanto, a mdia amostral 9,4.
Assim a estimativa de ponto para a mdia semanal do nmero de defeituosos 9,4.

6.4 Estimativa de Intervalo

Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um


parmetro populacional provavelmente cai.
O intervalo dentro do qual um parmetro populacional esperado ocorrer chamado
de intervalo de confiana.
Os intervalos de confiana que so extensivamente usados so os de 95 % e 99 %.
Um intervalo de confiana de 95 % significa que cerca de 95 % dos intervalos
construdos similarmente contero o parmetro que est sendo estimado.

186
Outra interpretao do intervalo de confiana de 95 % que 95 % das mdias
amostrais para um tamanho de amostra especificado cairo a uma distncia mxima
de 1,96 desvios padres da mdia populacional.
Para o intervalo de confiana de 99 %, 99 % das mdias amostrais para um tamanho
amostral especificado cairo a uma distncia mxima de 2,58 desvios padres da
mdia populacional.

Os intervalos de confiana para 95 % e 99 % so construdos como segue, para n 30:


O IC de 95 % para a mdia populacional dado por:

s
X 1,96
n
O IC de 99 % para a mdia populacional dado por:

s
X 2,58
n
Em geral, um intervalo de confiana para a mdia, calculado por:
s
X Z
n
onde Z obtido da tabela de distribuio normal padro.

Exemplo 2

Uma universidade quer estimar o nmero mdio de horas trabalhadas por semana por
seus estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas com um
desvio padro de 4 horas.

A estimativa de ponto do nmero mdio de horas trabalhadas por semana 24 horas


(mdia amostral).

187
Qual o intervalo de confiana de 95 % para o nmero mdio de horas trabalhadas por
semana ?
s 4
Usando a frmula anterior ( X 1,96 ) temos 24 1,96 ou 22,88 a 25,12. O
n 49
limite de confiana inferior 22,88. O limite superior de confiana 25,12. O grau de
confiana (nvel de confiana) utilizado 0,95.

Interprete os resultados

Se ns tivssemos tempo para selecionar aleatoriamente 100 amostras de tamanho 49


da populao de alunos do campus e calcular as mdias amostrais e os intervalos de
confiana para cada uma destas 100 amostras, a mdia populacional (parmetro) do
nmero de horas trabalhadas estaria contida em cerca de 95 dos 100 intervalos de
confiana. Cerca de 5 dos 100 intervalos de confiana no conteriam a mdia
populacional.

6.5 Intervalo de Confiana para Uma Proporo Populacional

Um intervalo de confiana para uma proporo populacional dado por:

p Z p
onde:

p a proporo amostral

p o erro padro da proporo amostral e dado por:

p (1 p )
p =
n
O intervalo de confiana construdo por:
p (1 p )
p Z
n
onde:

188
p a proporo amostral
Z o valor da varivel normal padro para o grau de confiana adotado.
n o tamanho amostral

Exemplo 3

Um planejador financeiro est estudando os planos de mudana de jovens executivos.


Uma amostra de 500 jovens executivos que possuem suas prprias casas revelou que 175
planejam vend-las e retirarem-se para o interior do Pas. Construa um intervalo de
confiana de 98 % para o parmetro proporo populacional de executivos que planejam
mudar para o interior.

Aqui n = 500, p = 175 = 0, 35


500
e Z = 2,33 (para = 0,98 nvel de confiana adotado )

(0,35) (0,65)
O CI de 98 % 0,35 2,33 ou 0,35 0,0497
500

Interprete a resposta

6.6 Fator de Correo de Populao Finita

Uma populao que tem um limite superior definido chamada de finita. Em

estatstica, considera-se como populao finita quando n > 0,05 (ou seja, quando a
N
frao amostral maior do que 5 %).
Para uma populao finita, onde o nmero total de objetos N e o tamanho da
amostra n, o seguinte ajuste feito para os erros padres da mdia amostral e da
proporo amostral.

Erro padro da mdia amostral:

189
N n
X =
n N 1
Erro padro da proporo amostral:

p (1 p ) N n
p =
n N 1

Este ajuste chamado de Fator de Correo de Populao Finita (FCPF)

Nota: se n 0, 05 , o fator de correo de populao finita ignorado.


N

Exemplo 4

A universidade do exemplo 2 quer estimar o nmero mdio de horas trabalhadas por


semana pelos estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas
e um desvio padro de 4 horas. Construa um intervalo de confiana para o nmero mdio
de horas trabalhadas se h somente 500 estudantes no campus.

n 49
Agora = = 0, 098 > 0, 05 . Portanto, temos que usar o FCPF
N 500

4 500 49
24 1,96 = [ 22,93 ; 25,11]
49 500 1

6.7 Selecionando uma Amostra

H 3 fatores que determinam o tamanho de uma amostra, nenhum dos quais tendo
uma relao direta com o tamanho da populao. Eles so:
1. O grau de confiana adotado
2. O mximo erro permissvel
3. A variabilidade da populao

190
Uma frmula de clculo conveniente para determinar o tamanho amostral n :

2
Zs
n=
E

onde:

E o erro permissvel

Z o valor da varivel normal padro associado ao grau de confiana adotado

s o desvio padro da amostra piloto

Exemplo 5

Um grupo de consumidores deseja estimar a mdia de gasto mensal em eletricidade para


um domiclio familiar simples em Julho. Baseado em estudos similares o desvio padro
estimado como sendo R$ 20,00. Deseja-se construir um intervalo de confiana de 99 %
com um erro mximo admissvel de R$5, 00 . Qual deve ser o tamanho da amostra?

( 2,58 ) ( 20 )
2

n= = 106, 50 107
5

6.8 Tamanho Amostral para Estimativa de Propores

A frmula para determinar o tamanho amostral no caso de estimativa de propores :

2
Z
n = p (1 p ) onde
E
p a proporo estimada, baseada na experincia passada ou em uma amostra piloto

Z o valor da varivel normal padro associado ao grau de confiana adotado.

E o mximo erro permissvel que o pesquisador tolera.

191
Exemplo 6

Um clube deseja estimar a proporo de crianas que tem um cachorro. Se o clube


deseja que a estimativa esteja no mximo afastada 3 % da proporo populacional,
quantas crianas devem conter a amostra? Assuma um intervalo de confiana de 95
% e que o clube estimou, com base em experincia anterior, que aproximadamente
30 % das crianas tm um cachorro.

2
1,96
n = ( 0,30 )( 0, 70 ) = 893, 4 893
0, 03

7. Teste de Hipteses Amostras Grandes

OBJETIVOS:
Definir hipteses e Testes de Hipteses
Descrever os 5 passos do procedimento de Teste de Hipteses
Distinguir entre Teste de Hipteses Unicaudal e Bicaudal
Realizar um teste para a mdia populacional
Realizar um teste para a diferena entre duas mdias ou propores populacionais
Descrever os erros estatsticos associados aos testes de hipteses

Nota:
Se nada conhecido acerca da populao, a estimao usada para fornecer uma
estimativa de ponto e de intervalo acerca da populao.
Se alguma informao acerca da populao proposta ou suspeitada, o Teste de
Hipteses usado para determinar a plausibilidade desta informao.

O que uma hiptese?

Hiptese: uma sentena sobre o valor de um parmetro populacional desenvolvida


para o propsito de teste.
Exemplos de hipteses, ou sentenas, feitas acerca de um parmetro populacional so:

192
A renda mdia mensal proveniente de todas as fontes para os analistas de sistemas
de US 3625
Vinte por cento de todos os transgressores juvenis so presos e sentenciados a priso.

O que um Teste de Hipteses?

Teste de Hipteses: um procedimento, baseado na evidncia amostral e na teoria da


probabilidade, usado para determinar se a hiptese uma afirmao razovel e no
seria rejeitada, ou no razovel e seria rejeitada.
A seguir so propostos 5 passos para um teste de hipteses:

Passo 1: Estabelea a Hiptese Nula e a Hiptese Alternativa


Passo 2: Selecione um nvel de significncia
Passo 3: Identifique a Estatstica de teste
Passo 4: Formule uma regra de deciso
Passo 5: Tome uma amostra e obtenha uma deciso: No rejeitar H0 ou rejeitar H0 e
aceitar H1

Hiptese Nula H0: Uma afirmao (sentena) sobre o valor de um parmetro


populacional
Hiptese Alternativa H1: Uma afirmao (sentena) que aceita se os dados amostrais
fornecem evidncia de que a hiptese nula falsa.
Nvel de Significncia: A probabilidade de rejeitar a hiptese nula quando ela
efetivamente verdadeira, ou seja, valor de (alfa)

Erro Tipo I: Rejeitar a Hiptese Nula, H0, quando ela efetivamente verdadeira. A
probabilidade do erro tipo I igual ao nvel de significncia, (alfa).

Erro Tipo II: Aceitar a Hiptese Nula, H0, quando efetivamente falsa. A
probabilidade do erro tipo II igual a (beta)

193
Tipos de Erros

Aceita H0 Rejeita H0
H0 verdadeira Deciso Correta Erro Tipo I
H0 falsa Erro Tipo II Deciso Correta

Alfa = erro tipo IBeta = erro tipo II


Estatstica de Teste (ou z efetivo ou valor de t): Um valor, determinado a partir da
informao amostral, usado para determinar se devemos ou no rejeitar a hiptese nula.

Valor Crtico (ou z crtico ou valor de t): O ponto divisor entre a regio onde a
hiptese nula rejeitada e a regio onde ela no rejeitada. Este valor obtido a
partir da tabela de z (normal padro) ou da tabela de t (t de Student).

7.1 Testes de Significncia Unicaudais

Um teste unicaudal quando a hiptese alternativa, H1, estabelece uma direo tal
como:
H0: A renda mdia das mulheres menor que ou igual a renda mdia dos homens.
H1: A renda mdia das mulheres maior que a renda mdia dos homens.
A regio de rejeio neste caso a cauda direita (superior) da curva.

Figura com distribuio normal mostrando a regio de rejeio para um teste unicaudal

7.2 Testes de Significncia Bicaudais

Um teste bicaudal quando no existe uma direo especificada para a hiptese


alternativa H1, tal com:

194
H0: A renda mdia das mulheres igual a renda mdia dos homens.
H1: A renda mdia das mulheres no igual a renda mdia dos homens.

A regio de rejeio neste caso dividida igualmente em duas caudas da curva.

Figura com distribuio normal mostrando a regio de rejeio para um teste bicaudal

(distribuio amostral para a estatstica z para um teste bicaudal, 0.05 de nvel de


significncia

Testando a Mdia Populacional: Amostra Grande, Desvio Padro da Populao


conhecido.

Neste caso a estatstica de teste (z efetivo) dado por:

X
z =

n

Exemplo 1
Os processadores de uma indstria indicam o ponto (marca) que a garrafa contem 16
onas (medida inglesa de peso) do produto. O Departamento de Controle de
Qualidade responsvel pelo controle da quantidade includa na garrafa. Uma
amostra de 36 garrafas selecionada por hora e o seu contedo pesado. Na ltima
hora uma amostra de 36 garrafas apresentou um peso mdio de 16,12 onas com um
desvio padro de 0,5 onas.

Ao nvel de significncia de 0,05 podemos concluir que o processo est fora de


controle?

195
Passo 1: Estabelecer a Hiptese Nula e a Hiptese Alternativa:

H:
0 =16 H:1 16
Passo 2: Estabelecer a regra de deciso:
H0 rejeitado se o z (efetivo calculado com base nos valores amostrais) < -1,96 ou z >
1,96.
Passo 3: calcule o valor da estatstica de teste ( z efetivo)

z = [16,12 16] = 1,44


[0,5 ]
36
Passo 4: Qual a deciso sobre H0?
H0 no rejeitada, porque 1,44 menor que o valor crtico de 1,96.

7.3 P-value de um Teste de Hiptese

P-value: Esta a probabilidade (considerando que a hiptese nula verdadeira) de ter


um valor para a estatstica de teste no mnimo to extremo como o valor calculado
(efetivo) para o teste.
Se o p-value menor que o nvel de significncia (alfa), H0 rejeitada.
Se o p-value maior que o nvel de significncia (alfa), H0 no rejeitada.

7.4 Clculo do p-value

Teste Unicaudal (para a direita ou cauda superior):


p-value = P{z valor da estatstica de teste calculada}
Teste Unicaudal (para a esquerda ou cauda inferior):

196
p-value = P{z valor da estatstica de teste calculada}

Teste Estatstico Bicaudal

p-value = 2P{z valor absoluto do valor da estatstica de teste calculado}


Para o exemplo anterior, z = 1,44, e desde que era um teste bicaudal, ento o
p-value = 2 P{z 1,44} = 2(0,5 0,4251) = 0,1498 . Desde que 0,1498 > 0,05, no
rejeitada H0.

Testando para a Mdia Populacional: Grandes Amostras, Desvio Padro Populacional


desconhecido

Aqui desconhecido, portanto o estimamos com o desvio padro amostral s.


Quanto maior for o tamanho amostral for n 30, o z efetivo pode ser aproximado
com

X
z=
s
n

Exemplo 2

A cadeia de Lojas Arjo emite o seu prprio carto de crdito. O administrador de


crdito quer verificar se o saldo no pago mensal maior do que US$ 400. O nvel de
significncia fixado em 0,05. Uma amostra aleatria de 172 saldos no pagos
revelou uma mdia amostral de US$ 407 e o desvio padro amostral de US$ 38. O
admistrador de crdito pode concluir que a mdia populacional maior que US$ 400,
ou razovel assumir que a diferena de US$ 7 (US$ 407 US$ 400 devido a
chance (variao aleatria)?

Etapa 1: Estabelea a Hiptese Nula e a Hiptese Alternativa.

197
H:0 400
contra
H:1 > 400

Etapa 2: Estabelea a regra de deciso.

H0 rejeitada se o z (efetivo) > 1,645.

Etapa 3: Calcule o valor da estatstica de teste.

407 400
z= = 2,42
38
172

Etapa 4: Qual a deciso sobre H0?

H0 rejeitada. O administrador conclui que a mdia dos saldos no pagos maior do que
US$ 400.

Figura ilustrando a regio de rejeio do exemplo

7.5 Teste de Hipteses: Duas Mdias Populacionais

Assuma que os parmetros para duas populaes so: 1,2,1 e2.


Caso I: Quando 1, 2 so conhecidos, a estatstica de teste (Z efetivo) :

198
X1 X 2
z =
12 22
+
n1 n2

Caso II: Quando 1, 2 no so conhecidos mas os tamanhos amostrais n e n 1 2 so


maiores ou iguais a 30, a estatstica de teste (Z efetivo) :

X1 X 2
z =
s12 s 22
+
n1 n2
Exemplo 3

Na indstria X foi realizado um estudo para comparar o nmero mdio de anos de


servio para aqueles que se aposentaram em 1975 com aqueles que se aposentaram no
ltimo ano. Os seguintes dados amostrais foram obtidos. A um nvel de significncia
de 0,01 podemos concluir que os trabalhadores que se aposentaram no ltimo ano
tiveram mais anos de servio?

Caracterstica 1975 ltimo ano


Mdia Amostral 25,6 30,4
Desvio Padro Amostral 2,9 3,6
Tamanho amostral 40 4,5

Estabelea a Hiptese Nula e a Hiptese Alternativa

Considere que a populao 2 aquela dos que se aposentaram no ltimo ano.

H0 : 2 1 H1 : 2 > 1

199
Estabelea a regra de deciso

Rejeitar H0 se o z (efetivo) > 2,33.

Calcule o valor da estatstica de teste (valor de z efetivo):

30 , 4 25 , 6
z = = 6 ,80
2 2
3, 6 2 .9
+
45 40

Nota: Desde que neste problema estamos testando para:

H0 : 2 1

Precisamos trocar as posies das variveis na equao do z efetivo (a seguinte equao).

X X
z = 1 2

s 12 s 22
+
n1 n2

z efetivo

Qual a deciso sobre a hiptese nula? Interprete os resultados?

Desde que o Z efetivo = 6,80 > Z crtico = 2,33, H0 rejeitada. Aqueles que se
aposentaram no ltimo ano tiveram mais anos de servio.

200
7.6 Testes Referentes Proporo

Proporo: Uma frao ou porcentagem que indica uma parte da populao ou


amostra que tem um particular trao de interesse.

A proporo amostral denotada por p onde:

nmero de sucessos na amostra


p=
tamanho da amostra

Estatstica de teste para testar uma Proporo Simples de uma Populao

p p
z =
p (1 p )
n
p proporo populacional

p proporo amostral

Exemplo 4

No passado, 15 % das solicitaes postais feitas por uma instituio de caridade


resultaram em contribuio financeira. Uma nova carta de solicitao foi redigida.
Esta nova carta elevou a taxa de contribuio? A nova carta enviada a uma amostra
de 200 pessoas e 45 responderam com uma contribuio.

Ao nvel de significncia de 0,05 pode-se concluir que a nova carta mais efetiva?

Estabelea a Hiptese Nula e a Hiptese Alternativa:

201
H 0 : p 0,15 H1 : p > 0,15
Estabelea a regra de deciso

H0 rejeitada se o Z (efetivo) > 1,645.

Calcule o valor da estatstica de teste ( valor do Z efetivo):

45
0 ,15
z= 200 = 2 ,97
( 0,15 )( 0 ,85 )
200

Qual a deciso sobre a hiptese nula? Interprete os resultados.


Desde que o z efetivo = 2,97 > z crtico (1,645), H0 rejeitada. A nova carta mais
efetiva.

Um Teste envolvendo a Diferena entre duas Propores Populacionais

A Estatstica de teste (Z efetivo) neste caso :

p1 p 2
z=
pc (1 pc ) pc (1 pc )
+
n1 n2
n1 o tamanho da amostra da populao 1.

n2 o tamanho da amostra da populao 2.

202
pc a mdia ponderada das duas propores amostrais, calculada por:

nmero total de sucessos X1 + X 2


pc = =
tamanho total das duas amostras n1 + n 2

X1 o nmero de sucessos em n1.


X2 o nmero de sucessos em n2.

Exemplo 5

Os trabalhadores solteiros so mais provveis de faltar ao trabalho do que os


trabalhadores casados?

Uma amostra de 250 trabalhadores casados mostrou que 22 faltaram mais do que 5 dias
no ltimo ano por alguma razo. Uma amostra de 300 trabalhadores solteiros mostrou que
35 faltaram mais do que 5 dias. Use o nvel de significncia de 0,05.

Estabelea a hiptese nula.

H 0 : p2 p1 H1 : p2 > p1
onde o subscrito 2 refere-se a populao dos trabalhadores solteiros.

Estabelea a regra de deciso.

Rejeitar H0 se z > 1,645.

Calcular o valor da estatstica de teste, Z efetivo:

203
22 + 35
pc = = 0,1036
250 + 300
22 35

Z= 250 300 = 1,10
0,1036(1 0,1036) 0,1036(1 0,1036)
+
300 250

Nota: Novamente, trocamos a posio das duas variveis

Qual a deciso referente a hiptese nula?

H0 rejeitada. No h diferena na proporo de ausncias para trabalhadores casados e


solteiros.

Qual o p-value?

p-value = P{z > 1,1} = 0,1357 , ( a hiptese nula no rejeitada).

EXERCCIOS :
(incluem recordao de tpicos anteriores)

1. A Associao Nacional de Educao coleta e publica dados sobre o nmero de anos


de experincia em sala de aula dos professores do curso secundrio. Uma amostra
obtida neste ano de 10 professores de curso secundrio e foram publicados os
seguintes dados sobre o nmero de anos de experincia.
33 18 21 12 2
18 9 16 15 17

a.Calcule a mdia amostral, X , dos dados.

204
b.Calcule a amplitude dos dados.
c.Calcule o desvio padro amostral, , s, dos dados.
d.Pelo Teorema de Chebychev, no mnimo _________ % dos dados caem dentro de
dois desvios padres de cada lado da mdia.

2. A seguinte tabela de contingncia fornece uma distribuio de freqncias conjunta


para os votos populares apurados na eleio presidencial de 1984 por regio e por
partido poltico. Os dados esto em milhares, arredondados para o mais prximo
milhar.
Democrata Republicano Outros
P1 P2 P3 Total
Nordeste R1 9,056 11,336 101 20,493
Meio Oeste R2 10,511 14,761 169 25,441
Sul R3 10,998 17,699 136 28,833
Oeste R4 7,022 10,659 214 17,895
Total 37,587 54,455 620 92,662

a.Quantos pessoas votaram no partido Republicano?


b.Quantas pessoas no Meio Oeste votaram?
c.Quantas pessoas no Sul votaram no partido Democrata?
d.Determine a probabilidade dos eventos R3 e P2 (simultneos).
e.Calcule Pr(R3 ou P2), usando a tabela de contingncia diretamente
f.Calcule Pr(R3 ou P2), usando a regra geral da adio de probabilidade, isto , Pr(A
ou B) = Pr(A) + Pr(B) - Pr (A e B).
g.Ache Pr(R3 | P2).
h.Calcule Pr(P1) e Pr(P1 | R4).
i. So os eventos P1 e R4 independentes? Explique sua resposta.
So os eventos P1 e R4 mutuamente exclusivos? Explique sua
resposta.

205
3. Em um levantamento recente, a probabilidade de que um acidente de carro causado
por um motorista embriagado cerca de 0,229. Nos prximos trs acidentes, qual a
probabilidade de que:
a.exatamente um acidente seja causado por um motorista embriagado?
b.No mnimo um acidente seja causado por um motorista embriagado?
c.Se voc6e tem os seguintes resultados de probabilidade de acidentes causados por
motoristas embriagados nos 10 prximos acidentes

pdf (*) Cdf (**)


0 0,0742 0,0742
1 0,2205 0,2947
2 0,2947 0,5893
3 0,2334 0,8227
4 0,1213 0,9440
5 0,0432 0,9873
6 0,0107 0,9980
7 0,0018 0,9998
8 0,0002 1,0000
9 0,0000 1,0000
10 0,0000 1,0000

(*) Pdf = Probability Distribution Function (Funo de Distribuio de Probabilidade)


(**) Cdf = Cumulative Distribution Function (Funo de Distribuio Cumulativa)
1.Ache Pr(x = 3).
2.Ache Pr(5 < x 9).
3.Qual a mdia e a varincia da distribuio tabulada acima?

206
4. Um dentista tem 5 cadeiras disponveis para pacientes em sua sala de espera. A
distribuio de probabilidade do nmero de cadeiras ocupadas, x, dada por
x p(x)
0 0,304
1 0,228
2 0,171
3 0,128
4 0,096
5 0,073

a. Ache a mdia da varivel aleatria x.


b. Calcule o desvio padro, , da varivel aleatria x.
c. Calcule Pr(2 x 5).
d. Desenvolva (no formato tabular a cdf (Cumulative Distribution Function - Funo de
Distribuio Acumulada) dessa distribuio.

5. Seja X normalmente distribuda com mdia = 100 e desvio padro = 7 (daqui em


diante indicaremos tal distribuio como X ~ N(100;7) ). Determinar:
a. P(X = 80)
b. P(X > 100)
c. P( X 95 < 5)
d. P( X 100 < 10

6. Dado que X uma varivel aleatria normal com mdia = 10 e


P(X > 12) = 0,1587, qual a probabilidade de que X esteja includo no intervalo (9,11) ?

207
7. Os pesos de certos produtos em quilogramas so normalmente distribudos com
mdia = 180 e desvio padro 2 = 4. Se uma unidade deste produto escolhida
aleatoriamente, qual o peso desta unidade se a probabilidade de ocorrncia :
a. De um peso maior igual a 0,10 ?
b. De um peso menor igual a 0,05 ?

8. Se W uma varivel aleatria normal e se P(W < 10) = 0,8413 e


P(W < -10) = 0,0668, qual E(W) e V(W) respectivamente ?

9. H dois procedimentos para possibilitar que um determinado tipo de avio esteja


pronto para a decolagem. O procedimento A requer um tempo mdio de 27 minutos
com desvio padro de 5 minutos. Para o procedimento B, = 30 e = 2 minutos,
respectivamente. Qual procedimento deve ser utilizado se o tempo disponvel de 30
minutos? 34 minutos?

10. Suponha que os dividendos anuais de quatro aes sejam respectivamente $ 2,00, $
4,00, $ 6,00 e $ 8,00. Deduza a distribuio amostral de X considerando as seguintes
hipteses :

1. tamanho amostral n = 2.
2. mtodo de amostragem: amostragem aleatria simples com reposio
Para a distribuio amostral deduzida de X , verifique por demonstrao que

a. E( X ) =
b. V( X ) = 2 /n
c. Se a amostragem for sem reposio deduza a distribuio de X e demonstre que

E( X ) = e V( X ) =
n
[ ( N n) / ( N 1) ]
d. Se a amostragem fosse realizada com reposio, qual o valor de V( X )?

208
11. Uma populao consta de 4 nmeros: 3, 7, 11 e 15. Considerar todas as amostras
possveis que podem ser retiradas com reposio. Determinar: a) a mdia
populacional; b) o desvio padro da populao; c) a mdia da distribuio amostral
das mdias; d) o desvio padro da distribuio amostral das mdias. Verificar (c) e (d)
diretamente e por meio de (a) e (b) atravs das frmulas apropriadas.

12. Certas vlvulas fabricadas por uma companhia tm uma vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria de
16 vlvulas, retiradas do grupo, ter a vida mdia: (a) entre 790 e 810 horas; (b)
inferior a 785 horas. Para realizar esses clculos, o que necessrio supor? Explique a
razo de sua afirmativa.

13. De acordo com o exerccio 8. Se for tomada uma amostra de 64 vlvulas, como ser
resolvido? Explicar a diferena.

14. Os pesos de fardos recebidos por um depsito tm mdia de 150 kg e um desvio


padro de 25 kg. Qual a probabilidade de 25 fardos, recebidos ao acaso e carregados
em um elevador, no exceder o limite especfico desse ltimo , que de 4100 kg ?
Neste caso, para a soluo do problema, necessrio especificar a forma da
distribuio estatstica (funo densidade de probabilidade) dos pesos dos fardos na
populao ?

(X
i =1
i X )2
15. Questo terica. Demonstre que s 2 = um estimador viesado para a
n
N

(X
i =1
i ) 2
varincia populacional 2 = , onde n o tamanho da amostra e N o
N
tamanho da populao. Calcule o valor do vis. O que ocorre com esse valor quando n
de um parmetro dito no
tende ao infinito. (Lembrar que um estimador
]=
viesado se E[

209
16. Questo terica

a. Enuncie o Teorema do Limite Central e o interprete da melhor forma possvel


b. O que considerado populao finita (e infinita) para fins estatsticos ?
c. Assinale as condies em que necessrio realizar a correo de
populao finita, justificando a resposta:

 quando a populao infinita, no importando se a amostragem feita com ou


sem reposio
 quando a populao finita, no importando se a amostragem feita com ou
sem reposio
 quando a populao finita e a amostragem feita com reposio
 quando a populao finita e a amostragem feita sem reposio
 quando a populao infinita e a amostragem feita com reposio
 quando a populao infinita e a amostragem feita sem reposio
 quando a populao finita ou a amostragem feita com reposio
 existem outras alternativas no enumeradas acima

17. Uma funo de probabilidade uma regra de correspondncia ou uma equao que:

a) Acha o valor mdio da varivel aleatria


b) Atribui valores de x a eventos de um experimento probabilstico
c) Atribui probabilidades para valores de x
d) Define a variabilidade no experimento
e) Nenhuma das anteriores correta

18. Suponha que a varivel aleatria T tenha a seguinte distribuio de probabilidade:

t | 0 1 2

210
----------------------
P(T = t) | .5 .3 .2

a. Ache P(T <= 0)


b. Ache P(T >= 0 e T < 2)
Calcule E(T), a mdia da varivel aleatria T.

19. Uma centena de estudantes realizou um teste no qual o escore mdio foi de 73 com
uma varincia de 64. Um grau A foi dado para quem obteve um escore de 85 ou
mais. Quantos As foram obtidos aproximadamente, assumindo que os escores So
normalmente distribudos? (escolha o mais prximo)

1. 42
2. 7
3. 58
4. 5
5. 22

20. Se uma distribuio normal tem mdia 200 e desvio padro 20, ache K tal que a
probabilidade de que um valor amostral seja menor do que K 0,975.

a. 239 b. 204 c. 210 d. 215 e. 220


f. 230 g. 239 h. 250

21. Se X a mdia de uma amostra extrada de uma distribuio normal com = 10,

2 X = 25 e n = 9, ento P( X > 15) :

(a) 0,001350 (c) 0,98778


(b) 0,998650 (d) 0,15866

211
22. A distribuio do tempo de vida de certo tipo de lmpada eltrica normalmente
distribuda com mdia de 1000 horas e um desvio padro de 100 horas. Ache o 33
Percentil da distribuio de tempo de vida.

a. 560
b. 330
c. 1044
d. 1440
e. nenhuma das anteriores

23. O valor de Z correspondente ao 52 percentil :


a. 2,06
b, 2,05
c, 1,99
d, 0,48
e, 0,05

24. Pr(Z > +1.96 ou Z < -1.65)

1) 0,025
2) 0,05
3) 0,0745
4) 0,0495
5) Nenhuma das anteriores

25. Em uma distribuio normal com mdia 3 e varincia 49, quais so o limite superior
e inferior para os 50 % dos dados centrais?

a. -29,83 e 35,83

212
b. -1,31 e 7,69
c. -1,69 e 7,69
d. 3,00 e 24,00
e. nenhuma das anteriores

26. Uma amostra aleatria de tamanho 25 escolhida de uma populao com mdia 7 e
varincia 4. A mdia amostral calculada como 8. Qual o valor da varivel normal
padro (z) correspondente a mdia amostral?

a. 25
b. 1,25
c. 1,25
d. +2,5
e. nenhuma das anteriores

27. Suponha que para uma amostra de 36 Auxiliares de Enfermagem de diversos


hospitais similares, uma avaliao de competncia com intervalo entre 0 e 100 foi
obtida a partir de um teste clnico. Suponha que a mdia populacional da avaliao
para todas as Auxiliares de Enfermagem destes hospitais foi de 80 e a varincia
populacional foi de 100. Para uma amostra de 36 Auxiliares de Enfermagem, qual a
probabilidade de que a nota mdia esteja entre 75 e 80?

a. 0,4987 b. 0,1915 c. 0,5013 d. 0,2287 e. 0,5115

28. Uma companhia fabrica cilindros que tem uma mdia de 2 polegadas de dimetro. O
desvio padro dos dimetros dos cilindros de 10 polegadas. Os dimetros de uma
amostra de 4 cilindros so medidos todas as horas. A mdia amostral usada para
decidir se o processo de fabricao est operando satisfatoriamente ou no. A seguinte

213
regra de deciso aplicada: se dimetro mdio da amostra de 4 cilindros maior ou
igual a 2,15 polegadas, ou menor ou igual a 1,85 polegadas, interrompe-se o processo.

a. Qual a probabilidade de parar o processo se a mdia do processo permanece


constante no valor de 2,00 polegadas ?
b. Qual a probabilidade de parar o processo se a mdia do processo muda para =
2,10 polegadas ?
c. Qual a probabilidade do processo continuar operando se a mdia do processo mudar
para = 2,15 polegadas ?

29. Qual (ou quais) das seguintes sentenas descreve inferncia estatstica ?

a. uma sentena verdadeira sobre uma populao feita atravs de uma informao
amostral de uma populao
b. uma conjectura acerca de uma populao feita a partir da informao contida em uma
amostra daquela populao
c. uma sentena verdadeira acerca de uma amostra feita a partir da informao contida
em uma populao.

30. Para uma certa populao normalmente distribuda, o valor do desvio padro
conhecido, mas o valor da mdia desconhecido. Qual ser o efeito de mudanas no
tamanho amostral e do grau de confiana no comprimento do intervalo de confiana
da estimativa da mdia populacional?
a. Aumentando o tamanho amostral aumenta o comprimento dado um grau de confiana
fixo.
b. Aumentando o grau de confiana reduz o comprimento, dado um tamanho amostral
fixo.
c. Aumentando o tamanho amostral reduz o comprimento, dado um grau de confiana
fixo.

214
d. Nenhuma das anteriores.

31. A distribuio das mdias de todas as possveis amostras de tamanho (n) escolhidas
de uma populao se aproximar de uma curva normal se

a. n grande o bastante
b. a populao grande
c. a populao simtrica
d. a mdia de cada amostra igual a mdia da populao
e. nenhuma das anteriores correta

32. A distribuio amostral das mdias de amostras aleatrias de tamanho n extradas de


uma populao se aproximar de uma distribuio normal se

a. somente se a populao normalmente distribuda e se n grande

b. somente se a populao normalmente distribuda no importando o valor de n

c. se n grande no importando a forma da distribuio da populao

d. no importa o valor de n e no importa a forma da distribuio da populao original

33. Em um estudo sobre que relao existente entre uma atitude de criana e a idade na
qual ela fala primeiro, os pesquisadores registraram a idade (em meses) da primeira
fala da criana e o nmero de pontos (escore) obtido pela criana em um teste sobre
a atitude. Seguem-se os dados para 21 crianas:

criana 1 2 3 4 5 6 7 8 9 10 11
Idade 15 2 10 9 15 20 18 11 8 20 7
Escore 95 71 83 91 102 87 93 100 104 94 113

215
Criana 12 13 14 15 16 17 18 19 20 21
Idade 9 10 11 11 10 12 42 17 11 10
Escore 96 83 84 102 100 105 57 121 86 100

A linha de mnimo quadrado para a predio do scorea partir da idade da


primeira fala :

escore = 110 1,13 * idade ; o valor do coeficiente de correlao 0,640.

a.Que proporo da variabilidade nos escores da atitude explicada pela reta


de mnimos quadrados ?
b.Qual seria a predio de mnimos quadrados para os escore de uma criana
que fala primeiro aos 20 meses ?
c.Calcule o resduo para a criana 6.
d.A partir do diagrama de disperso, qual criana tem o maior (em valor
absoluto) resduo? O que incomum para esta criana?
e.Qual criana tem o menor valor ajustado?

34. Uma amostra no ano de 1989 de 130 mulheres que visitaram um ginecologista em
uma determinada universidade do Noroeste dos EUA indicou que 113 tiveram
experincia sexual.

a. Assumindo que essas mulheres so uma amostra aleatria simples da


populao de todas as mulheres daquela universidade, calcule um intervalo de
confiana para a proporo da populao que sexualmente ativa.
b. O intervalo seria mais largo, mais estreito ou da mesma largura se 520
mulheres fossem amostradas? (Voc no precisa fazer nenhum clculo)
Explique.

216
c. O intervalo seria mais largo, mais estreito ou da mesma largura se resultassem
73 mulheres com experincia sexual 130 mulheres amostradas? (Voc no
precisa fazer nenhum clculo) Explique.
d. Voc acha que razovel assumir que essas mulheres formam uma amostra
aleatria? Explique.

35. No execute nenhum clculo para responder o seguinte. Explique seu raciocnio em
cada caso.

a. Tres pesquisadores Alex, Bob e Chuck selecionam de maneira independente amostras


aleatrias da mesma populao. Os tamanhos amostrais so 1000 para Alex, 4000
para Bob e 250 para Chuck. Cada pesquisador constri um intervalo de confiana de
95 % para a partir de seus dados. A semi-amplitude dos trs intervalos so 0,015;
0,031 e 0,062. Relacione cada semi-amplitude com o pesquisador.
b. Cada um dos dois pesquisadores Donna e Eileen selecionam amostras aleatrias de
tamanho 1000 de populaes diferentes e constrem intervalos de confiana de 95 %
para p (a proporo populacional). A semi-amplitude do intervalo de Donna 0,030 e
a de Eileen 0,025. Dado que as propores amostrais foram p1 =.20 e p2 =.40,
relacione cada pesquisadora com a sua proporo amostral.
c. Um pesquisador de nome Fran seleciona 100 indivduos aleatoriamente de uma
populao, observa 50 sucessos e calcula 5 intervalos de confiana. Os nveis de
confiana so 80 %, 90 %, 95 %, 98 % e 99 % e os cinco intervalos so (0,402 ;
0,598), (0,371 ; 0,629), (0,418 ; 0,582), (0,436 ; 0,564) e (0,384 ; 0,616). Relacione
cada intervalo com o seu nvel de confiana.

36. Suponha que 80 % de todos os habitantes da Pensilvnia comam Peru no Dia de Ao


de Graas. Suponha alm disso que voc planeja selecionar uma amostra aleatria
simples (AAS) de 300 habitantes da Pensilvnia visando determinar a sua proporo
que come peru no Dia de Ao de Graas.

217
a. 80 % uma parmetro ou uma estatstica? Que smbolo voc deve usar para represent-
lo?
b. De acordo com o Teorema do Limite Central, como a proporo amostral de quem
come peru no Dia de Ao de Graas varia de amostra para amostra ?
c. Determine a probabilidade de que menos do que 3 quartos da amostra comam peru no
Dia de Ao de Graas.
d. Seria a resposta a (c) menor, maior ou a mesma se o tamanho amostral de 800 fosse
usado? (voc no precisa executar o clculo). Explique.
d. Podemos mostrar que nesse contexto P ( p 0,80) = 0.15. Se essa afirmativa no
estiver correta escreva uma verdadeira que a substitua. Escreva uma ou duas sentenas
explicando para um leigo o que essa afirmativa significa.

37. A seguinte tabela lista a temperatura mdia mensal e minha conta de eletricidade para
aquele ms.
ms temp conta ms temp Conta
Abr-91 51 $41.69 Jun-92 66 $40.89
Mai-91 61 $42.64 Jul-92 72 $40.89
Jun-91 74 $36.62 Ago-92 72 $41.39
Jul-91 77 $40.70 Set-92 70 $38.31
Ago-91 78 $38.49 Out-92 * *
Set-91 74 $37.88 Nov-92 45 $43.82
Out-91 59 $35.94 Dez-92 39 $44.41
Nov-91 48 $39.34 Jan-93 35 $46.24
Dez-91 44 $49.66 Fev-93 * *
Jan-92 34 $55.49 Mar-93 30 $50.80
Fev-92 32 $47.81 Abr-93 49 $47.64
Mar-92 41 $44.43 Mai-93 * *
Abr-92 43 $48.87 Jun-93 68 $38.70

218
Mai-92 57 $39.48 Jul-93 78 $47.47

A linha de mnimos quadrados desenhada no diagrama de disperso; a equao dessa


reta : conta = 55,1 0,214 temp. mdia

a. Estime o valor do coeficiente de correlao entre a conta de eletricidade e


a temperatura mdia.
b. Qual a predio de mnimos quadrados para a conta de energia eltrica
em uma temperatura mdia de 60 graus F?
c. Sem fazer clculos, identifique que ms tem o maior (em valor absoluto)
resduo.
d.Que ms tem o menor valor ajustado?

Exerccios Resolvidos

EXERCICIOS

1) Em quatro leituras experimentais de um comercial de 30 segundos, um locutor levou


em media 29,2 segundos com desvio padro de 5,76 segundos. Construir os limites de
confiana para a media, dado = 10 %, supondo que a populao tem distribuio
normal. Resp. (22,42; 35,98)

Soluo:

Os limites de confiana para a estimativa por intervalo do parmetro media populacional


dado pela seguinte expresso:

X X
X Z . < < X + Z .
n n

219
No caso n = 4 (o tamanho da amostra), a media amostral X = 29,2 e o desvio-padrao
amostral s = 5,76 (que utilizamos na expressao acima no lugar do X , o desvio padro
da populao, j que s um estimador no viesado para este parmetro da populao).
Para = 10 % vemos que o valor de z correspondente 1,6448. Assim o intervalo de

confiana de 90 % de probabilidade (1 - = 0,90) ser:

5,76 5,76
29,2 1,6448. < < 29,2 + 1,6448.
4 4
24,46 < < 33,94

2) De 50.000 vlvulas fabricadas por uma companhia, retira-se uma amostra aleatria de
400 vlvulas e obtem-se a vida media de 800 horas, sendo o desvio padro populacional
de 100 horas.

a) Qual o intervalo de confiana de 99 % para a estimativa da media populacional?

b) Com que confiana dir-se-ia que a vida media de 800 9,8 ?

c) Que tamanho deve ter a amostra para que seja de 95 % a confiana na estimativa do
intervalo de 800 7,84 ?

Resp. a) (787,1; 812,9) b) 95 % c) 625

Soluo:

X = 800 2 = 100 n = 400 N = 50.000

a) 1- = 0,99

220
X N n N n
X Z . . < < X + Z . X .
n N 1 n N 1
100 5000 400 100 5000 400
800 2,5758 < < 800 + 2,5758
400 5000 1 400 5000 1
787,6 < < 812,3

b) 800 9,8 Portanto:

100 5000 400


z = 9,8
400 5000 1
z = 2,0432

1- = 0,9590

3) Uma amostra aleatria de 625 donas de casa revelou que 70 % delas preferem a marca
X de detergente. Construir um intervalo de confiana para p = proporo das donas de
casa que preferem X, com uma confiana de 90 %.

Resp. (67 %, 73 %)

4) Antes de uma eleio, um determinado partido poltico est interessado em estimar a


proporo p de eleitores favorveis a seu candidato. Uma amostra piloto de tamanho 100
revelou que 60 % dos eleitores eram favorveis ao candidato em questo.

a) Determine o intervalo de confiana para a proporo de votos favorveis para o


conjunto dos eleitores, com uma confiana de 95 %.

b) Determine o tamanho da amostra necessrio para que o erro cometido na estimao


seja de, no maximo, 0,01 com probabilidade de 80 %.

Resp. a) (0,504; 0,696) b) n = 3933

221
5) Suponha que estamos interessados em estimar a percentagem de consumidores de certo
produto. Se uma amostra de tamanho 300 forneceu 100 indivduos que consomem o dado
produto, determine:

a) O intervalo de confiana de p, com coeficiente de 95 %.


b) O tamanho da amostra para que o erro da estimativa no exceda a 0,02 unidade com
probabilidade de 95 %.

Resp. a) 0,2800; 0,3866) b) n = 2134

EXERCICIOS RESOLVIDOS

1) Considere a funo dada por:

0 se x < 1,5
x se 1,5 x 2

f (x)
0,25 se 2 x 2,5
0 se x > 2,5

a. Mostre que f(x) uma funo densidade de probabilidade.


b. Escolhido um valor ao acaso para x, qual a probabilidade de x pertencer ao intervalo
[1,5;2]?
Soluo:
a) f(x) uma funo densidade de probabilidade se
+
f (x) 0 para qualquer x e f(x)dx = 1
-

dessa forma:

222
2 2,5 2
2
xdx + 0,25dx = x
2,5
+ 0,25 x 2 = 4 / 2 2,25 / 2 + 0,25 2,5 0,25 2 = 2 1,125 + 0,625 0,5 = 1
2 1,5
1, 5 2

Portanto f(x) uma funo densidade de probabilidade


2 2 2

= 4 2,25 = 0,875
2
b) P (1,5 x 2) =
1, 5
f ( x)dx = xdx = x
1, 5
2 2 2
1, 5

2) Uma pessoa dispe de R$ 100.000 e pode comprar terrenos ou investir no mercado


financeiro. Uma avaliao preliminar mostrou que:

a. O cenrio futuro para os terrenos indica que eles devero valorizar em mdia 25 % em
dois anos, mas fatores no controlveis transferem grande variabilidade para esta
previso. Acredita-se que a valorizao tenha uma varincia de 12 %.
b. O mercado financeiro mais estvel e acena com uma taxa de ganho de 20 %, com
varincia de 4 % em dois anos.

O investidor se satisfaz com um ganho de 16 % nessa operao e pretende decidir pelo


investimento mais confivel neste sentido. Qual deve ser sua deciso, se supe as
distribuies normais?

Soluo:

Seja X1 a varivel aleatria que representa a taxa de valorizao dos terrenos e X2 a taxa
de valorizao do mercado financeiro.

X 1 ~ N(25;12) e X 2 ~ N(20;4)

16 25
P ( X 1 16) = P ( z ) = P ( z 2,598) = 1 0,0047 = 0,9953
12
16 20
P ( X 2 16) = P ( z ) = P ( z 2) = 1 0,0227 = 0,9773
4

223
O investidor deve escolher pela compra dos terrenos pois P( X 1 16) > P( X 2 16)

3) Com a finalidade de estabelecer o custo de um novo produto, o encarregado de custos


levantou os possveis fornecedores de um componente desse produto. Dos 60
fornecedores cadastrados foram sorteados e consultados 6 deles. Os preos fornecidos
apresentam uma mdia de 4,83 u.m. A experincia do encarregado indica que o desvio
padro para o preo mdio de 10 % deste preo. Qual deve ser o intervalo de confiana
de 93 % para o preo mdio desse componente?

Soluo:

X = 4,83 X = 0,10 X = 0,10 4,83 = 0,0483 n = 6 N = 60

Observe que a amostragem realizada considerando-se populao finita j que n/N >
0,05. Alm disso como n menor que 30 e como no enunciado nada dito sobre a
distribuio de X no podemos aplicar o Teorema do Limite Central. Dessa forma, para
solucionarmos o problema, temos que supor que o custo tem distribuio normal (caso
contrrio teramos que trabalhar com a teoria das amostras pequenas e aplicar uma outra
distribuio chamada "t" de Student). No clculo do intervalo de confiana temos que
fazer a correo de populao finita.
O intervalo de confiana para um nvel de confiana de 1 - % dado por:

N n N n
P ( X z X X + z X ) = 1
N 1 N 1

Para 1- = 93 % temos:

60 6 60 6
P (4,83 1,48 0,483 4,83 + 1,48 0,483 ) = 0,93
60 1 60 1
P (4,146 5,514) = 0,93

224
4) Uma amostra de 50 elementos foi retirada de uma populao de 500 elementos, para a
avaliao da mdia populacional, fornecendo s(x) = 4. Qual deve ser o tamanho de uma
amostra que avalie a mdia com erro mximo de 2 unidades, ao nvel de confiana de 90
%?

Soluo:

N= 500 n = 50 sx = 4

O tamanho da amostra (sem considerar correo de populao finita) para a


estimativa da mdia populacional dado pela expresso:

Z X = erro

Como

x sx
X =
n n

Temos:

2 2
s Z s 1,64 4
Z x = erro ou n = x = = 10,758 11
n erro 2
Como n/N > 0,05 temos que considerar a correo de populao finita, ou seja,
temos que empregar a seguinte relao:

N n
Z X = erro
N 1

225
elevando ao quadrado ambos os termos da equao acima temos:

N n
Z X
2 2
= erro 2
N 1
2 sx2
Z ( N n) = erro 2 ( N 1)
n

isolando n no primeiro membro temos:

z2 s x2 N 1,64 2 16 500
n= 2 = =
e N e 2 + z2 s x2 4 500 4 + 1,64 2 16

10,55 11

Portanto observa-se que mesmo com a correo de populao finita o tamanho


amostral necessrio no se altera.

226

Você também pode gostar