Você está na página 1de 226

CURSO DE ESTATSTICA

APLICADA

Prof. Henrique Dantas Neder


Instituto de Economia Universidade Federal
de Uberlndia.

SUMRIO
Introduo ....................................................................................................4
1.
2. Estatstica Descritiva .........................................................................................8
2.1 Tipos de Variveis ...........................................................................................8
2.2 Tabelas e Distribuies de Freqncia .............................................................10
2.3 Histogramas ..................................................................................................12
2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas .......................13
2.5 Medidas de Posio e de Disperso .................................................................16
2.5.1 Uma Nota sobre Notao Estatstica ..........................................................17
2.5.2 A Mdia Aritmtica No Ponderada...........................................................18
2.5.3 A Mdia Aritmtica Ponderada .................................................................19
2.5.4 Propores como Mdias ..........................................................................20
2.5.5 A Mdia Geomtrica ................................................................................21
2.5.6 A Mdia Harmnica .................................................................................25
2.5.7 A Mediana ..............................................................................................25
2.5.8 A Mdia para Dados Agrupados ................................................................27
2.5.9 A Mediana para dados Agrupados .............................................................28
2.5.10 A Moda para dados Agrupados ................................................................30
2.5.11 O Intervalo (ou amplitude) ......................................................................37
2.5.13 Varincia e Desvio Padro ......................................................................39
2.5.14 Varincia e Desvio Padro para Dados Agrupados .....................................42
2.5.15 Interpretando e Aplicando o Desvio Padro ..............................................43
2.5.16 Coeficiente de Variao ..........................................................................45
2.6 Medidas de Assimetria ...................................................................................46
2.7 Curtose: uma medida de achatamento ..............................................................48
3. Probabilidade ..................................................................................................50
3.1 Definio Clssica de Probabilidade ...............................................................51
3.2 Conceito da Freqncia Relativa .....................................................................52
3.3 Probabilidade Subjetiva.................................................................................53
3.4 Algumas Regras Bsicas de Probabilidade .......................................................53
3.5 A Regra do Complemento ..............................................................................55
3.6 A Regra Geral da Adio................................................................................56
3.7 Regras de Multiplicao ................................................................................58
3.8 Probabilidade Condicional..............................................................................60
3.9 Diagramas em rvore ....................................................................................62
3.10 Teorema de Bayes........................................................................................64
Anexo 1 Recordando Definies e Conceitos ......................................................65
Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades ............68
Anexo 3 - Probabilidade Condicional ....................................................................74
Anexo 4 Revisando os conceitos ........................................................................77
Resumo do Clculo de Probabilidades...................................................................96
Exerccios de Probabilidade .................................................................................97
4. Variveis Aleatrias Discretas.......................................................................114

4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta .......118


4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta ..119
4.3 A Distribuio de Probabilidade Binomial .....................................................121
4.4 A Mdia e Varincia De Uma Distribuio Binomial ......................................125
Apndice 1 (Recordao) ...................................................................................126
Apendice 2 (Recordao) ...................................................................................127
Apndice 3 (Recordao) ...................................................................................128
Apndice 4 (Recordao) Valor Esperado e Varincia de uma Varivel Aleatria ....132
Variveis Aleatrias Independentes.....................................................................140
Apndice 4 (recordao) ....................................................................................141
5. Variveis Aleatrias Contnuas e Distribuio Normal .........................................144
5.1 Variveis Aleatrias Contnuas .....................................................................144
5.2 Mdia e Varincia de uma Varivel Aleatria Contnua ...................................146
5.3 Varivel Aleatria Normal............................................................................165
5.4 Distribuio Normal Padro..........................................................................167
5.5 reas Abaixo da Curva Normal ....................................................................168
6. Mtodos de Amostragem e Distribuies Amostrais ............................................175
6.1 Amostragem Probabilstica ...........................................................................180
6.2 Teorema do Limite Central ...........................................................................184
6.3 Estimativa de Ponto .....................................................................................186
6.4 Estimativa de Intervalo.................................................................................186
6.5 Intervalo de Confiana para Uma Proporo Populacional ...............................188
6.6 Fator de Correo de Populao Finita ...........................................................189
6.7 Selecionando uma Amostra ..........................................................................190
6.8 Tamanho Amostral para Estimativa de Propores ..........................................191
7. Teste de Hipteses Amostras Grandes .....................................................192
7.1 Testes de Significncia Unicaudais ................................................................194
7.2 Testes de Significncia Bicaudais ..................................................................194
7.3 P-value de um Teste de Hiptese ...................................................................196
7.4 Clculo do p-value.......................................................................................196
7.5 Teste de Hipteses: Duas Mdias Populacionais .............................................198
7.6 Testes Referentes Proporo.......................................................................201
EXERCCIOS : ................................................................................................204

1.Introduo
A Significncia e a Abrangncia da Estatstica
Porque a estatstica importante?
Os mtodos estatsticos so usados hoje em quase todos os campos de investigao
cientfica, j que eles capacitam-nos a responder a um vasto nmero de questes, tais
como as listadas abaixo:

1)

Como os cientistas avaliam a validade de novas teorias?

2)

Como os pesquisadores mdicos testam a eficincia de novas drogas ?

3)

Como os demgrafos prevem o tamanho da populao do mundo em qualquer tempo


futuro?

4)

Como pode um economista verificar se a mudana atual no ndice de Preos ao


Consumidor a continuao de uma tendncia secular, ou simplesmente um desvio
aleatrio?

5)

Como possvel para algum predizer o resultado de uma eleio entrevistando apenas
algumas centenas de eleitores ?

Estes so poucos exemplos nos quais a aplicao da estatstica necessria. Podemos


presumir que a matemtica uma das rainhas das cincias porque ela fornece a estrutura
terica para quase todas as outras cincias. Se voc j fez um curso bsico de fsica, j
est familiarizado com algumas das leis matemticas que governam temas to
diversificados como gravidade, energia, luz, eletricidade, etc. Mas tambm devemos
considerar o fato de que as teorias matemticas esto sendo desenvolvidas todos os dias
em muitas reas por estatsticos tericos - pessoas treinadas em teoria estatstica e
probabilidade. Para citar alguns poucos casos ilustrativos elas so desenvolvidas para
teoria dos vos espaciais em fsica; para teorias do conhecimento do comportamento
animal e humano em psicologia; para teorias da migrao e dos diferenciais de raa em
sociologia; para teorias de epidemias em sade pblica;...

De fato, a estatstica tornou-se uma ferramenta cotidiana para todos os tipos de


profissionais que entram em contato com dados quantitativos ou tiram concluses a partir
destes.
O que Estatstica?
A noo de Estatstica foi originalmente derivada da mesma raiz da palavra Estado,
j que foi a funo tradicional de governos centrais no sentido de armazenar registros da
populao, nascimentos e mortes, produo das lavouras, taxas e muitas outras espcies
de informao e atividades. A contagem e mensurao dessas quantidades gera todos os
tipos de dados numricos que so teis para o desenvolvimento de muitos tipos de
funes governamentais e formulao de polticas pblicas.
Dados numricos so de fato uma parte da Estatstica, mas so apenas a matria-prima,
que

precisa ser transformada pelos mtodos estatsticos para posterior anlise. A

Estatstica, como um mtodo cientfico, refere-se ao projeto de experimentos e a


descrio e interpretao de observaes que so feitas. De um ponto de vista moderno, a
Estatstica freqentemente definida como um mtodo de tomada de deciso em face da
aleatoriedade dos fenmenos. Em uma mais vasta perspectiva, o escopo da estatstica
pode ser pensado em termos de trs reas diferentes de estudos: (1) a Estatstica
Descritiva (2) A Estatstica Indutiva e (3) A Teoria da Deciso Estatstica.
Estatstica Descritiva
A estatstica Descritiva refere-se ao corpo de mtodos desenvolvidos para coletar,
organizar, apresentar e descrever dados numricos. Essa rea da Estatstica refere-se s
seguintes tarefas:

1)

Encontrar um mtodo apropriado de coletar dados numricos eficientemente e


acuradamente para um dado problema.

2)

Determinar um formato eficiente, tal como uma apresentao tabular, para a


organizao dos dados de uma forma sistemtica e ordenada, de maneira que a

informao fornecida pelos dados possa ser observada com grande facilidade e
preciso.
3)

Apresentar dados numricos, seja organizados ou no, de forma que as caractersticas e


o comportamento dos dados so clara e facilmente revelados. Tais apresentaes So
feitas por meio de mtodos grficos.

4)

Sumarizar ou descrever cada caracterstica ou propriedade dos dados por um simples


nmero, tal como uma mdia, uma porcentagem ou alguma outra medida apropriada, a
qual calculada a partir dos dados por meio de uma frmula derivada a partir de algum
princpio vlido.

Estatstica Indutiva
A Estatstica Indutiva, que tambm freqentemente chamada de inferncia estatstica ou
estatstica inferencial, em contraste com a estatstica descritiva, essencialmente analtica
em sua natureza. Consiste de um conjunto de princpios ou teoremas que nos permitem
generalizar acerca de alguma caracterstica de uma populao a partir das caractersticas
observadas de uma amostra. Nessa definio, uma populao o conjunto de todos os
itens, objetos, coisas ou pessoas a respeito das quais a informao desejada para a
soluo de um problema. Uma amostra um grupo de itens selecionados por um mtodo
cuidadosamente concebido e projetado a partir de uma populao. Existem diferentes
tipos de amostras, dependendo dos diferentes mtodos de seleo disponveis. Uma
amostra aleatria simples, falando em termos simplificados, aquela que selecionada de
tal forma que cada e todos os itens na populao tm a mesma chance de serem includos
na amostra.
Se uma medida descritiva calculada a partir dos dados da populao ela chamada de
parmetro populacional, ou simplesmente parmetro; se calculada a partir dos dados
da amostra ela chamada de estatstica amostral, ou simplesmente estatstica.
Considerando esses conceitos podemos definir estatstica indutiva como o processo de
generalizar acerca de do valor de um parmetro a partir do valor de uma estatstica.
Existem dois procedimentos de inferncia distintos mas relacionados: estimao e teste
de hipteses. Estimao processo de usar o valor de uma estatstica amostral para

estimar o valor de um parmetro que desconhecido, mas uma constante. Como um


exemplo, suponhamos que temos uma populao de 100.000 bolas de gude em um saco,
todas as quais so idnticas exceto pela cor, e que no podemos v-las embora saibamos
que uma parte delas so brancas e o restante so pretas. Suponha que desejamos ter uma
idia da proporo de, digamos, bolas brancas nessa populao. Suponha que para
conseguir isso selecionamos 1.000 bolas aleatoriamente do saco e verificamos que 350
so brancas. Isso significa que nossa proporo amostral de bolas brancas 35 %. A partir
disso conclumos que a proporo populacional de bolas brancas tambm 35 %.
Fazendo isso ns realizamos o que chamado de estatstica pontual.
Mas afirmar que a proporo de bolas brancas em toda a populao exatamente
igual a proporo daquela amostra particular como dar um tiro no escuro: o valor da
proporo amostral um resultado aleatrio e depende de cada amostra de 1.000 bolas
escolhida da populao. Pode ser que por uma enorme casualidade o resultado daquela
amostra que escolhemos coincida exatamente com o valor da proporo de bolas brancas
em toda a populao. Mas as chances de que isso no ocorra so muito grandes. Uma
forma de contornarmos esse problema afirmarmos que as chances so de 95 em 100 (ou
de 95 %) de que o intervalo formado pela proporo amostral acrescida e diminuda de 3
pontos percentuais contenha o verdadeiro valor da proporo populacional desconhecido.
Ou seja, construmos um intervalo com limites 35 + 0,03 x 35 = 36,05 e 35 - 0,03 x 35 =
33,95 e afirmamos (com base em algum princpio obtido a partir da teoria estatstica) que
as chances so de 95 em 100 de que o verdadeiro valor da proporo populacional esteja
localizado dentro desse intervalo. Quando uma afirmativa dessa natureza feita estamos
realizando o que se chama de estimativa por intervalo.
Quanto ao segundo procedimento da estatstica inferencial deixaremos para
coment-lo quando for abordado em sua ntegra. E o terceiro campo de estudos da
Estatstica, a Teoria da Deciso Estatstica no ser discutido nessa apresentao.

2. Estatstica Descritiva
2.1 Tipos de Variveis
Existem diversos tipos de variveis que sero utilizadas em um estudo estatstico.
importante compreender o conceito matemtico de varivel. Varivel uma abstrao que
se refere a um determinado aspecto do fenmeno que est sendo estudado. Podemos
afirmar que a quantidade colhida da safra anual de soja uma varivel. Representemos
essa varivel pela letra X. Essa varivel pode assumir diversos valores especficos,
dependendo do anos de safra, por exemplo, X1986, X1990 e X1992. Esses valores que a
varivel assume em determinados anos no so a prpria varivel , mas valores
assumidos ela para determinados objetos ou pessoas da amostra ou da populao. Se uma
amostra tiver 50 indivduos podemos referimo-nos a X como sendo a varivel nota de
estatstica e a X30 como a nota de um indivduo particular, no caso o trigsimo.
freqente tambm na literatura utilizar-se letras maisculas para a notao de variveis
e as correspondentes letras minsculas para referncia aos valores particulares assumidos
por essa varivel mas nesse resumo procuraremos evitar essa forma de notao.

Variveis quantitativas - referem-se a quantidades e podem ser medidas em uma escala


numrica. Exemplos: idade de pessoas, preo de produtos, peso de recm nascidos.

As variveis quantitativas subdividem-se em dois grupos: variveis quantitativas discretas


e variveis quantitativas contnuas. Variveis discretas so aquelas que assumem apenas
determinados valores tais como 0,1,2,3,4,5,6 dando saltos de descontinuidade entre seus
valores. Normalmente referem-se a contagens. Por exemplo: nmero de vendas dirias
em uma empresa, nmero de pessoas por famlia, quantidade de doentes por hospital.1 As
1

Uma varivel quantitativa discreta no precisa assumir necessariamente apenas valores


de contagem, ou seja nmeros inteiros ou nmeros naturais em seqncia. Um exemplo de

varivel quantitativa discreta seria, por exemplo, uma que assumisse apenas os seguintes valores : { 1; 3,5 ;

variveis quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua e
no apresentam saltos de descontinuidade. Exemplos dessas variveis so o peso de
pessoas, a renda familiar, o consumo mensal de energia eltrica, o preo de um produto
agrcola.2 As variveis quantitativas contnuas referem-se ao conjunto dos nmeros reais
ou a um de seus subconjuntos contnuos.
Variveis Qualitativas - referem-se a dados no numricos.3 Exemplos dessas variveis
so o sexo das pessoas, a cor, o grau de instruo.
As variveis qualitativas subdividem-se tambm em dois grupos: as variveis qualitativas
ordinais e as variveis qualitativas nominais. As variveis qualitativas ordinais so
aquelas que definem um ordenamento ou uma hierarquia. Exemplos so o grau de
instruo, a classificao de um estudante no curso de estatstica, as posies das 100
empresas mais lucrativas, etc. As variveis qualitativas nominais por sua vez no definem
qualquer ordenamento ou hierarquia. So exemplos destas a cor , o sexo, o local de
nascimento, etc.4
Dependendo da situao uma varivel qualitativa pode ser representada
(codificada) atravs de emprego de nmeros (por exemplo: em sexo representamos
homens como sendo 0 e mulheres como sendo 1). Mas no tratamento estatstico

5,75 ; 10 }. Apesar dessa varivel abranger valores no inteiros ela apresenta saltos de descontinuidade:
nesse exemplo ela no pode assumir nenhum valor intermedirio entre 1 e 3,5 ou entre 5,75 e 10.
2

Seria impossvel obter na prtica uma varivel perfeitamente contnua j que os instrumentos de medida
no tem preciso infinita. Por exemplo., o peso de pessoas medido com uma balana com preciso,
digamos, de dcimos de gramas. Ento jamais conseguiremos obter um valor para essa varivel que se
localize entre 50.000,1 e 50.000,2 gramas, por exemplo, 50.000,15 gramas. Ocorre portanto um salto de
descontinuidade entre os dois valores possveis de serem medidos e a varivel, do ponto de vista terico,
no pode ser considerada como varivel quantitativa contnua, mas varivel quantitativa discreta. Mas do
ponto de vista prtico, acabamos freqentemente por consider-la e trat-la como sendo uma varivel
quantitativa contnua, apesar dessa falta de preciso absoluta. O mesmo podemos dizer para o caso da
renda ou qualquer outra varivel econmica medida em unidades monetria: no existe uma renda de por
exemplo R$ 200,345 j que o centavo a menor diviso do sistema monetrio. Mas de qualquer forma,
costuma-se tratar a renda como varivel quantitativa contnua e no discreta.
3

muito comum considerar-se que a estatstica apenas abrange os estudos que utilizam as variveis
quantitativas. Nada mais equivocado. Existe um vasto campo de aplicaes estatsticas em que so
empregadas as variveis qualitativas, tanto isoladamente como em conjunto com variveis quantitativas.
4
No podemos dizer que a cor X superior a cor Y mas podemos afirmar que o terceiro ano do segundo
grau superior hierarquicamente ao primeiro ano do primeiro grau.

dessa varivel codificada no podemos consider-la como sendo quantitativa. Ela


continua sendo uma varivel qualitativa (pois o em sua essncia e natureza) apesar de
sua codificao numrica que tem como finalidade uma maior finalidade de tabulao de
resultados.
No podemos dizer que para qualquer uma destas categorias qualquer mtodo estatstico
pode ser adequadamente aplicado. As variveis quantitativas contnuas so aquelas que
permitem a utilizao de um conjunto maior e superior de mtodos estatsticos e so, sem
dvida, as variveis mais passveis de um rico tratamento estatstico. Em seguida vm,
nessa ordem, as variveis quantitativas discretas, as variveis qualitativas ordinais e por
ltimo, as variveis qualitativas nominais. Essas ltimas so as que permitem a utilizao
de um menor e menos poderoso arsenal de instrumentos estatsticos de anlise.
2.2 Tabelas e Distribuies de Freqncia
A anlise estatstica se inicia quando um conjunto conjunto de dados torna-se disponvel
de acordo com a definio do problema da pesquisa. Um conjunto de dados, seja de uma
populao ou de uma amostra contem muitas vezes um nmero muito grande de valores.
Alm disso, esses valores, na sua forma bruta, encontram-se muito desorganizados. Eles
variam de um valor para outro sem qualquer ordem ou padro. Os dados precisam ento
ser organizados e apresentados em uma forma sistemtica e seqencial por meio de uma
tabela ou grfico. Quando fazemos isso, as propriedades dos dados tornam-se mais
aparentes e tornamo-nos capazes de determinar os mtodos estatsticos mais apropriados
para serem aplicados no seu estudo.
Suponhamos o seguinte conjunto de dados:

141213111213
161414151714
111314151312
141314131516
1212

10

Para montarmos uma distribuio de freqncias desses dados verificamos quais so os


valores no repetidos que existem e em uma primeira coluna de uma tabela colocamos
esses valores e na segunda coluna colocamos o nmero de repeties de cada um desses
valores. Para o exemplo acima, a distribuio de freqncias ser:

Varivel

freqncia

11

12

13

14

15

16

17

A freqncia de uma observao o nmero de repeties dessa observao no conjunto


de observaes. A distribuio de freqncia uma funo formada por pares de valores
sendo que o primeiro o valor da observao (ou valor da varivel) e o segundo o
nmero de repeties desse valor.

Freqncias Relativas e Acumuladas


Para o exemplo acima tambm podemos calcular a freqncia relativa referente a cada
valor observado da varivel. A freqncia relativa o valor da freqncia absoluta
dividido pelo nmero total de observaes.

Varivel
11

freqncia absoluta
2

freqncia relativa
2/26 = 0,0769

12

5/26 = 0,1923

13

6/26 = 0,2308

14

7/26 = 0,2692

15

3/26 = 0,1154

11

16

2/26 = 0,0769

17

1/26 = 0,0385

TOTAL

26

1,0000

Podemos tambm calcular as freqncias acumuladas. Nesse caso existem as freqncias


absolutas acumuladas e as freqncias relativas acumuladas. 5

Varivel

freqncia
absoluta

freqncia
relativa

freqncia
relativa acumulada

2/26 = 0,0769

freqncia
absoluta
acumulada
2

11

12

5/26 = 0,1923

7/26 = 0,2692

13

6/26 = 0,2308

13

13/26 = 0,5000

14

7/26 = 0,2692

20

20/26 = 0,7692

15

3/26 = 0,1154

23

23/26 = 0,8846

16

2/26 = 0,0769

25

25/26 = 0,9615

17

1/26 = 0,0385

26

26/26 = 1,0000

TOTAL

26

1,0000

2/26 = 0,0769

2.3 Histogramas
Histograma uma representao grfica de uma tabela de distribuio de
freqncias. Desenhamos um par de eixos cartesianos e no eixo horizontal (abscissas)
colocamos os valores da varivel em estudo e no eixo vertical (ordenadas) colocamos os
valores das freqncias. O histograma tanto pode ser representado para as freqncias
absolutas como para as freqncias relativas. No caso do exemplo anterior, o histograma
seria:

Observe que os valores da ltima coluna (freqncia relativa acumulada) podem ser calculados de duas
maneiras. Na primeira, tal como feito na tabela a seguir, dividimos o valor da freqncia absoluta
acumulada pelo total de observaes. Na segunda maneira, acumulamos o valor da freqncia relativa. Este
ltimo mtodo pode levar a acmulos de erros, de forma que o ltimo valor de freqncia relativa
acumulado se distancie consideravelmente de 1.

12

7
6
5
4
3
2
1
0
Mais

17

16

15

14

13

12

Freqncia

11

Freqncia

Histograma

Bloco

histograma de frequncia acumulada (ou ogiva) a representao grfica do


comportamento da frequncia acumulada. Na figura abaixo a ogiva mostrada em
sobreposio ao histograma.

7
6
5
4
3
2
1
0

100,00%
80,00%
60,00%

Freqncia

40,00%

% cumulativo

20,00%
Mais

17

16

15

14

13

12

,00%
11

Freqncia

Histograma

Bloco

2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas


At agora vimos como so calculadas as freqncias (relativas e acumuladas) para
variveis quantitativas discretas. Nesse caso a tabulao dos resultados mais simples.
Mas quando tratamos de variveis quantitativas contnuas os valores observados devem
ser tabulados em intervalos de classes. Para a determinao dessas classes no existe uma
regra pr estabelecida, sendo necessrio um pouco de tentativa e erro para a soluo mais

13

adequada. Suponhamos que as safras agrcolas de um determinado produto, em uma


determinada regio, sejam dadas pela tabela a seguir:

Ano

Safra (1000 t)

Ano

Safra (1000 t)

280

10

365

305

11

280

320

12

375

330

13

380

310

14

400

340

15

371

310

16

390

340

17

400

369

18

370

Devem ser seguidos alguns passos para a tabulao de freqncias de dados que se
referem a uma varivel quantitativa contnua, como o caso de nosso exemplo.
1. Definir o nmero de classes. O nmero de classes no deve ser muito baixo nem
muito alto. Um nmero de classes pequeno gera amplitudes de classes grandes o que
pode causar distores na visualizao do histograma. Um nmero de classes grande
gera amplitude de classes muito reduzidas. Foram definidas regras prticas para a
determinao do nmero de classes, sendo que este deve variar entre 5 e 20 (5 para um
nmero muito reduzido de observaes e 20 para um nmero muito elevado). Se n
representa o nmero de observaes (na amostra ou na populao, conforme for o
caso) o nmero aproximado de classes pode ser calculado por Nmero de Classes =

arredondando os resultados. No caso do exemplo anterior temos n = 18

e 18 = 4,24 e podemos adotar um nmero de 5 classes, que ser razovel.


2. Calcular a amplitude das classes. Essa ser obtida conhecendo-se o nmero de
classes e amplitude total dos dados. A amplitude total dos dados o resultado da
subtrao valor mximo - valor mnimo da srie de dados. A amplitude de classe ser:

14

Amplitude de classe =

Valor Maximo - Valor Minimo


nmero de classes

Em geral, o valor do resultado tambm arredondado para um nmero inteiro mais


adequado. No nosso exemplo temos:

Amplitude de Classe =

430 - 280
= 30
5

3. Preparar a tabela de seleo com os limites de cada classe. Na tabela abaixo


apresentamos para os dados do nosso exemplo os limites inferior e superior de cada
uma das 5 classes de freqncia.

Classe

Limite inferior

Limite Superior

280

310

310

340

340

370

370

400

400

430

Observa-se na tabela acima que o limite superior de cada classe coincide com o limite
inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observao
seja exatamente igual ao valor do limite de classe deve-se estabelecer um critrio de
incluso. Para evitar esse tipo de dificuldade normalmente se estabelece que o limite
superior de cada classe aberto (e conseqentemente, o limite inferior de cada classe
fechado), ou seja, cada intervalo de classe no inclui o valor de seu limite superior, com
exceo da ltima classe.

4. Tabular os dados por classe de freqncia. A partir da listagem de dados selecionase para cada um deles qual a sua classe de freqncia e acumula-se o total de
freqncia de cada classe. De acordo com nosso exemplo, teremos:
15

Classe
280 - 310

Freqncia Absoluta
Simples
3

Freqncia Relativa
Simples
0,12 (12 %)

310 - 340

0,16 (16 %)

340 - 370

0,24 (24 %)

370 - 400

0,28 (28 %)

400 - 430

0,20 (20%)

Total

25

1,00 (100 %)

Veremos adiante, quando discutirmos as medidas de posio e de disperso, que quando


agrupamos dados numricos em intervalos de classe ocorre perda de informao o que
leva a resultados no to precisos do que aqueles que seriam obtidos a partir dos dados
originais sem agrupamento.

2.5 Medidas de Posio e de Disperso


Podemos considerar que a Estatstica Descritiva subdivide-se em duas partes. Na
primeira, abordada anteriormente, so estudadas as formas de apresentao dos dados
para que fiquem salientadas as suas caractersticas principais. Na segunda, que
comearemos a tratar agora, abrange as medidas descritivas na forma de simples nmeros
que representam de forma sinttica essas caractersticas da distribuio estatstica dos
dados. Estudaremos, a rigor, quatro tipos de medidas:

1. Medidas de Tendncia Central (ou medidas de posio). Essa propriedade dos dados
refere-se a localizao do centro de uma distribuio. Elas nos indicam qual a
localizao dos dados ( no eixo que representa o conjunto dos nmeros inteiros se
estivermos tratando de uma varivel quantitativa contnua).

2. Medidas de Disperso. Essa propriedade revela o grau de variao dos valores


individuais em torno do ponto central.

16

3. Assimetria. a propriedade que indica a tendncia de maior concentrao dos dados


em relao ao ponto central.

4. Curtose. a caracterstica que se refere ao grau de achatamento, ou a taxa na qual a


distribuio cresce ou cai da direita para a esquerda.

2.5.1 Uma Nota sobre Notao Estatstica


Utilizaremos as letras maisculas para representar as variveis, como por exemplo a
varivel X. Os valores individuais que uma varivel pode assumir so representados pelas
correspondentes letras minsculas. Por exemplo, se X usado para designar o peso de
uma amostra de 50 pessoas, ento x o valor numrico do peso de uma dessas 50
pessoas. Diferentes valores de uma varivel so identificados por subscritos. Assim, os
pesos de 50 pessoas em uma amostra podem ser denotados por x1, x2, ..., x50.
nmero total de observaes em uma populao finita designado por N e na
amostra representado por n. A distino entre medidas descritivas para
populaes e amostras muito importante. Denotaremos os parmetros
(medidas referentes a populao) por letras gregas ou letras minsculas em
portugus. As estatsticas amostrais sero representadas por letras maisculas
em portugus e os valores observados de uma estatstica amostral pela
correspondente letra minscula em portugus. Por exemplo, as medidas
descritivas a serem introduzidas nessa seo sero denotadas como segue:

Nome da Medida

Parmetro

Notao da
Estatstica

mdia aritmtica

Valor
observado
x

proporo

g~

mediana

~
h
~
x

.5

X.5

x.5

moda

~
xm

Xm

xm

mdia geomtrica
mdia harmnica

17

2.5.2 A Mdia Aritmtica No Ponderada


A mdia definida como a soma das observaes dividida pelo nmero de observaes.
Se tivermos, por exemplo, n valores, temos:
n

x1 + x 2 +...+ x n
X =
=
n

x
i =1

Propriedades da mdia aritmtica no ponderada:

1. A mdia um valor tpico, ou seja, ela o centro de gravidade da distribuio, um


ponto de equilbrio. Seu valor pode ser substitudo pelo valor de cada item na srie de
dados sem mudar o total. Simbolicamente temos:

n( X ) = x

(6)

2. A soma dos desvios das observaes em relao a mdia igual a zero.

(x X ) = 0
3. A soma dos desvios elevados ao quadrado das observaes em relao a mdia
menor que qualquer soma de quadrados de desvios em relao a qualquer outro
nmero. Em outras palavras,

(x X )

= um mnimo.

A idia bsica de selecionar um nmero tal que a soma dos quadrados dos desvios em
relao a este nmero minimizada tem grande importncia na teoria estatstica. Ela
chega a ter um nome especial: o princpio dos mnimos quadrados. Ela , por exemplo,
a base racional do mtodo dos mnimos quadrados que usado para ajustar a melhor

- Utilizaremos muito freqentemente a notao

x simplificadamente para representar


18

x
i =1

curva atravs de um conjunto de pontos em um sistema de eixos cartesianos, como


veremos adiante. Esta propriedade tambm a base para o clculo de uma importante
medida de disperso, que veremos logo a seguir.
A validade dessas tr6es propriedades pode ser facilmente demonstrada por um exemplo
numrico simples, mostrado na tabela a seguir. Nesta tabela, a coluna (1) contem o
conjunto de dados cuja soma 9 e cuja mdia 3. A coluna (2) demonstra a primeira
propriedade da mdia, ou seja, se cada uma das observaes individuais dos dados
substituda pela mdia, a soma permanece igual a 9. A coluna (3) verifica que de fato

(x X ) = 0 .

Finalmente, as colunas (4), (5) e (6) demonstram que

(x X )

14, que menor que somas quando os desvios individuais so tomados a partir do nmero
2 e do nmero 5, respectivamente.

(1)

(2)

(3)

(4)

(5)

(6)

(x - x)

(x - x) 2

(x - 2) 2

(x -5) 2

-2

16

-1

+3

16

Soma 9

14

17

26

2.5.3 A Mdia Aritmtica Ponderada


No clculo da mdia aritmtica no ponderada todos os valores observados foram
somados atribuindo-se o mesmo peso a todas as observaes. Agora veremos uma nova
forma de calcular a mdia. Consideremos um exemplo familiar de clculo da mdia de
notas de estudantes, quando o exame final vale duas vezes mais do que as duas provas
comuns realizadas no decorrer do semestre. Se um determinado aluno obtiver as notas 7,
5 e 8 a sua mdia ponderada final ser:

19

1 (7) +1 (5) + 2 8
=7
1+1+ 2
Em termos gerais, a frmula para a mdia aritmtica ponderada :

X w = wi xi = wx
i =1

onde wi o peso da observao i


e n o nmero de observaes.
A soma dos pesos no pode ser igual a zero. Fora disto, no existe restrio para os
valores dos pesos. Se todos os pesos forem iguais a 1, a mdia ponderada recai em seu
caso particular, a mdia aritmtica no ponderada. O mesmo ocorre se todos os pesos
forem iguais a uma constante c. Portanto, a mdia aritmtica no ponderada na realidade
uma mdia aritmtica ponderada com pesos iguais.

2.5.4 Propores como Mdias


Freqentemente encontramos populaes cujas unidades elementares podem ser
classificadas em duas categorias: uma que tem certo atributo e outra que no tem esse
atributo. Nesse caso, estamos interessados na proporo de casos que possuem esse
atributo. Uma proporo comumente pensada como uma frao ou porcentagem, mas
tambm pode ser pensada como um caso especial de mdia.
Suponha que queremos determinar a proporo de votantes entre os cidados brasileiros.
Devemos primeiro designar um valor 1 para cada pessoa qualificada como eleitor e um
valor 0 para cada pessoa no qualificada como eleitor. Ento, a soma dos 1s seria

a mdia seria a mdia seria obtida pela diviso da soma pelo nmero N total de pessoas
no Brasil.
A mdia da varivel x = x N . No entanto essa mdia tambm uma proporo, a
proporo de eleitores na populao brasileira.

20

2.5.5 A Mdia Geomtrica


A mdia geomtrica de uma amostra definida como a raiz ensima do produto nos n
valores amostrais.

G = n ( x1 )( x2 )...( xn )

Por exemplo, a mdia geomtrica de 5, 9 e 13 :

G = 3 (5)(9)(13) = 8,36
Para a mesma srie de dados a mdia 9. sempre verdade que a mdia aritmtica
maior do que a mdia geomtrica para qualquer srie de valores positivos, com exceo
do caso em que os valores da srie so todos iguais, quando as duas mdias coincidem.
clculo da mdia geomtrica muito simples. Mas a sua interpretao e as sua
propriedades tornam-se mais evidentes quando reduzimos a frmula a sua
forma logartmica. Tomando logaritmos de ambos os lados da equao anterior
teremos:

logG = log( n ( x1 )( x2 )...( xn ) ) =

log x1 + log x2 +...+ log xn


=
n

log x
n

A concluso que chegamos que o logaritmo da mdia geomtrica igual mdia


aritmtica dos logaritmos dos valores da srie. Verifica-se que a mdia geomtrica
somente tem significado quando todos os valores da srie so todos positivos.
Suponhamos como exemplo de aplicao de clculo da mdia geomtrica os dados da
tabela seguinte que mostram as mudanas de preos de duas mercadorias, A e B, de 1980
a 1985. Durante esse perodo o preo de A subiu 100 % e o preo de B decresceu 50 %.
Qual foi a mudana mdia relativa de preos? Em outras palavras, qual foi o percentual
mdio de mudana de preos?

21

Preos das Mercadorias A e B em 1980 e 1985


Preo

Relativo de Preos
1980 = 100

1985 = 100

Mercadoria

1980

1985

1980

1985

1980

1985

R$ 50

R$ 100

100

200

50

100

R$ 20

R$ 10

100

50

200

100

Mdia Aritmtica

100

125

125

100

Mdia Geomtrica

100

100

100

100

A mdia aritmtica fornece uma resposta incorreta para essa questo. Como indicado
pelos clculos da tabela acima leva a duas concluses opostas. Se 1980 tomado como
base para o relativo de preos, os preos so em mdia 25 % maiores em 1985 do que em
1980. Se 1985 tomado como base, os preos de 1980 so 25 % maiores do que os
preos de 1985. Portanto, a mdia aritmtica dos relativos de preos conduz a resultados
inconsistentes.
No entanto, um resultado consistente obtido quando a mdia geomtrica aplicada:

1. Se 1980 escolhido como a base, os preos de 1985 so 100 % dos preos de 1980, ou
seja:
g = 200 50 = 10.000 = 100

2. Se 1985 escolhido como a base, os preos de 1980 sero tambm 100 % dos preos
em 1985, ou seja:
g = 50 200 = 100

A mais importante aplicao da mdia geomtrica refere-se talvez ao clculo de taxas de


crescimento mdias, desde que essas podem ser corretamente medidas somente por esse
mtodo. Para exemplificar, no campo da economia, esse ponto, suponha que a produo
anual de um setor industrial cresceu de 10.000 para 17.280 unidades durante o perodo
1985-1988 como mostrado na tabela a seguir; qual a taxa mdia de crescimento anual?
A taxa mdia anual de crescimento pode ser calculada a partir dos valores em

22

porcentagem da produo em relao aos anos anteriores. Se calcularmos a mdia


aritmtica desses valores teramos:
x = (60 + 96 + 300) / 3 = 152
implicando uma taxa de crescimento mdia de 152 -100 = 52 %. Se a produo cresce 52
% ao ano, comeando da produo de 1985 de 10.000 unidades, ento a produo de
1986 seria de

23.0 + 0,52 (10.000) = 15.200;


a produo de 1987 seria de
15.200+ 0,52(15.200) = 23.104;
a produo de 1988 seria de

23.104 + 0,52(23.104) = 35.118,08

Ano

1985

1986

1987

1988

Produo

10.000

6.000

5.760

17.280

60

96

300

Porcentagem
do ano anterior

Observe-se que este ltimo valor quase 200 % do valor efetivamente observado
em 1988, de 17.200.
A mdia geomtrica, por sua vez, :

g = 3 (60)(96)(300) = 120
implicando uma taxa anual mdia de crescimento de 120 - 100 = 20 %. Verificando,
teremos:
no ano de 1986: 10.000 + 0,20(10.000) = 12.000;
no ano de 1987: 12.000 + 0,20(12.000) = 14.400;
no ano de 1988: 12.000 + 0,20(14.400) = 17.280 que coincide com o valor observado
efetivamente em 1988.

23

Se o valor da mdia geomtrica das porcentagens de crescimento for menor do que 100,
implica em uma porcentagem mdia de crescimento negativa, o que indica uma taxa
mdia de declnio ao invs de uma taxa mdia de crescimento.7 Atente tambm para o
fato de que as trs porcentagens a partir das quais a mdia geomtrica calculada so
percentuais do ano anterior ao invs de mudana percentual do ano anterior.8
clculo da taxa mdia de crescimento baseado principalmente na hiptese de

uma taxa constante de crescimento ou de que os valores individuais formam


uma progresso geomtrica. Quando o clculo envolve um nmero
considervel de perodos, utiliza-se com mais freqncia uma frmula que se
relaciona com a mdia geomtrica, que :
xf
1
R = n

x
i

onde:
R = taxa de crescimento geomtrica mdia,
n = nmero de perodos de tempo,
xf = valor no perodo final,
xi = valor no perodo inicial.

Para os dados da tabela anterior, teremos:

17.280
1 = 0,20 ou 20 % , como obtido anteriormente.9 Note que R = G -1.
R = 3
10.000

Se, por exemplo, ao invs de 60, 96 e 300 %, como anteriormente, tivermos 60, 96 e 78 %, a taxa de

crescimento geomtrica mdia ser de

g = 3 (60)(96)(78) = 76,59 , o que indica um decrscimo mdio

de 76,59 - 100 = - 23,41 %.


8

Essas ltimas porcentagens, referentes ao exemplo da tabela anterior, seriam (6.000 - 10.000)/10.000= 0,40, ou seja - 40 %; (5.760 - 6.000)/6.000 = -0,04 , ou seja, - 4 %; e (17.280 - 5.760)/5760 = 2, ou seja +
200 %.
9

- interessante notar que pelo clculo anterior empregam-se os valores dos anos intermedirios, ao passo
que nesse ltimo, apenas empregam-se os valores do perodo inicial e final, no importando o que ocorreu
nos perodos intermedirios.
24

2.5.6 A Mdia Harmnica


A mdia harmnica o inverso da mdia aritmtica dos inversos dos valores observados.
Simbolicamente, para uma amostra, temos:

1
1
H=

1
1
x1 + x2 +...+ xn
=
n

1
(1 / x ) =
n

n
(1 / x)

Para clculos mais simples, a frmula anterior pode ser reescrita como:

1
1

H=

x1 +

x2 +...+
n

xn

(1 / x )
n

A mdia harmnica dos trs valores 4, 10 e 16 :

1 +1 +1
4 10 16 = 0,1375
H=
3
H = 7,27
1

Para os mesmos dados a mdia aritmtica 10 e a mdia geomtrica 8,62. Para


qualquer srie de dados cujos valores no so todos os mesmos e que no incluem o zero,
a mdia harmnica sempre menor que tanto a mdia aritmtica como a mdia
geomtrica.

2.5.7 A Mediana
A mediana o valor do item central da srie quando estes so arranjados em ordem de
magnitude. Para a srie R$ 2, R$ 4, R$ 5, R$ 7 e R$ 8, a mediana o valor do terceiro

25

item, R$ 5. No caso do nmero de itens na srie ser par, a mediana a semi-soma dos
dois valores mais centrais. Por exemplo, para a srie 3, 5 ,8 ,10, 15 e 21 kg, a mediana a
media dos valores 8 e 10, ou seja 9.
A mediana pode ser formalmente definida como o valor que divide a srie de tal forma
que no mnimo 50 % dos itens so iguais ou menores do que ela, e no mnimo 50 % dos
itens so iguais ou maiores do que ela. Mais rigorosamente, estabelecemos que:

X.5 = o valor do [(n+1)/2] -simo item

Por exemplo, para uma srie formada pelos valores 3,5,8,10,15 e 21 a mediana
ser o valor do [(6+1)/2] = 3,5 simo item, ou seja, a semi soma do item de posto 3 e do
item de posto 4, que so 8 e 10.
O valor da mediana no influenciado pelos valores nas caudas de uma
distribuio. Por exemplo, se temos a srie de dados 1,2,3,4,5 a mediana 3. Se
substituirmos os valores das caudas dessa distribuio por quaisquer valores uma nova
distribuio formada poderia ser formada pela srie -1000,-100,3,500,5000 e a mediana
permanece sendo 3. Portanto, ela uma medida de posio da distribuio bem adequada
para distribuies assimtricas, tais como a distribuio de renda, j que no sabemos se a
famlia mais rica ganha R$7.000.000 ou R$ 500.000.000. Veremos, mais a frente que ela
possui vantagens em relao a mdia aritmtica, como medida de posio (ou medida de
tendncia central) para dados agrupados em classes de freqncia, quando a ltima classe
tem limite superior indeterminado.
A mediana tambm tem a interessante propriedade de que a soma dos desvios absolutos
das observaes em relao a mediana menor do que a soma dos desvios absolutos a
partir de qualquer outro ponto na distribuio. Simbolicamente:

x X

.5

26

= um mnimo

2.5.8 A Mdia para Dados Agrupados


Quando estamos tratando de amostras ou populaes muito grandes conveniente
calcular as medidas descritivas a partir das distribuies de freqncia. A mdia no pode
ser determinada exatamente a partir de distribuies de freqncia, mas uma boa
aproximao pode ser obtida pela hiptese do ponto mdio. A aproximao quase
sempre muito satisfatria se a distribuio bem construda.10 A hiptese do ponto mdio
refere-se a considerar-se de que todas as observaes de uma dada classe esto centradas
no ponto mdio daquela classe. Conseqentemente, o valor total da freqncia da classe
da i-sima classe simplesmente o produto fi mi, onde fi a freqncia (absoluta simples)
da classe i e mi ponto mdio da classe i. Sob essa hiptese, a mdia aproximada para
uma distribuio de uma amostra com k classes vem a ser:
X

f 1m1 + f 2 m2 +...+ f k mk

f 1 + f 2 +...+ f k

fm
f

fm
n

importante notar que todos os somatrios na equao acima referem-se s


classes e no s observaes individuais. Consideremos a seguinte tabela de distribuio
de freqncia para dados de gasto com alimentao extrados de uma pesquisa de
oramentos familiares.

Classe

R$ 120,00 - R$139,99

fm

130,0

650,0

140,00 -

159,99

26

150,0

3900,0

160,00 -

179,99

24

170,0

4080,0

180,00 -

199,99

15

190,0

2850,0

200,00 -

219,99

210,0

1680,0

10

Isto , principalmente se no agrupamento dos dados originais em uma tabela de distribuio de


freqncia, empregou-se um nmero adequado de classes de freqncia.

27

220,00 -

239,99

Total

230,0

80

x=

460,0
13620,0

13620,00
= R$170,25
80

Ao utilizar essa aproximao estamos considerando a hiptese de que todas as


observaes em cada classe esto uniformemente distribudas nessa classe. Por exemplo,
se tivermos um intervalo de tamanho 100 e com freqncia igual a 6 observaes, a
localizao dessas observaes seria 0,20,40,60,80 e 100, com distncia constante entre
cada par de observaes, de forma que:

0+20+40+60+80+100 = 300 = m x 6 e m = 50, ou seja, o ponto mdio do


intervalo de 0 a 100. Conclui-se que se a distribuio das observaes for uniforme em
cada intervalo, o somatrio dos valores das observaes de cada intervalo igual ao
produto da freqncia no intervalo pelo valor do ponto mdio desse intervalo. Supe-se
que com uma conveniente construo de intervalos de classe os eventuais erros nos
intervalos compensam-se mutuamente.

2.5.9 A Mediana para dados Agrupados


Assim como possvel estabelecer uma aproximao da mdia aritmtica para
dados agrupados, o mesmo pode ser feito para a mediana. O mtodo usado o da
interpolao utilizando-se a distribuio de freqncia acumulada ou ogiva. Inicialmente
determina-se a classe que contem a mediana. Essa ser a classe cuja freqncia
acumulada relativa correspondente a seu limite inferior menor que 0,50 (ou 50 %) e a
freqncia acumulada relativa correspondente a seu limite superior maior que 0,50 (ou
50 %). O prximo passo a determinao do ponto exato onde se localiza a mediana
naquela classe. Para o exemplo anterior de gastos com alimentao de famlias, temos:

28

Classe

freq.
absoluta freq.acumulada
simples

R$ 120,00 - R$139,99

freqncia
relativa
acumulada
0,0625

140,00 -

159,99

26

31

0,3875

160,00 -

179,99

24

55

0,6875

180,00 -

199,99

15

70

0,8750

200,00 -

219,99

78

0,9750

220,00 -

239,99

80

1,0000

Total

80

A classe que contm a mediana a terceira classe, pois a freqncia relativa


acumulada da classe anterior (segunda classe) menor que 0,5 e a freqncia relativa
acumulada da terceira classe maior do que 0,5.11 Na figura a seguir, F a freqncia
acumulada (representada no eixo vertical) e X o valor da varivel (representada no eixo
horizontal).

55
n + 1 80 + 1
=
= 40,5
2
2

31

160

X.5

11

180

- A freqncia relativa acumulada da classe anterior classe corrente a freqncia relativa acumulada
do limite inferior da classe corrente. A freqncia relativa acumulada da classe corrente a freqncia
relativa acumulada do limite superior dessa mesma classe.
29

Por semelhana de tringulos, verifica-se que:


X .5 160 40,5 31
=
180 160 55 31
X .5 = 167,92

Este procedimento o mesmo que a seguinte frmula de interpolao:

(n + 1) / 2 Fa
X .5 = LI .5 +
c
f .5

onde:

LI.5 = limite de classe inferior da classe da mediana,


Fa = freqncia acumulada da classe imediatamente anterior classe da
mediana,

f.5 = freqncia absoluta simples da classe da mediana,


c = amplitude (tamanho) da classe da mediana.

2.5.10 A Moda para dados Agrupados


A moda de uma distribuio de freqncia pode muitas vezes ser aproximada pelo
ponto mdio da classe modal - a classe com maior densidade de freqncia.12 Ento, para
os dados de gastos com alimentao do exemplo anterior, xm = R$ 150, o ponto mdio da
segunda classe, que possui a maior freqncia. Esse mtodo de localizar a moda
totalmente satisfatrio quando as densidades de freqncia da classe imediatamente
12

Definimos densidade de freqncia de um intervalo de classe como sendo o quociente entre a freqncia
absoluta simples desse intervalo e o seu tamanho (amplitude). Quando os intervalos de classe possuem
amplitudes desiguais, existe uma tendncia de os intervalos maiores apresentarem maiores freqncias.
Dessa forma a classe modal no a classe de maior freqncia mas a classe de maior densidade de
freqncia. Naturalmente, quando todos os intervalos tm a mesma amplitude, como no caso do exemplo
anterior e como geralmente so construdos para no distorcer a distribuio, a classe modal a classe de
maior densidade de freqncia assim como tambm a classe de maior freqncia. Esse conceito de
densidade de freqncia ser muito til, quando definirmos, mais adiante, a funo densidade de
probabilidade e para a sua compreenso intuitiva.

30

anterior classe modal (a classe premodal) e da classe imediatamente posterior classe


modal (classe posmodal) so aproximadamente iguais. Quando isso no ocorre, como
sugerido pela figura a seguir, resultados mais precisos podem ser obtidos com a seguinte
frmula, para uma amostra:
X m Lm + (

1
)c
1 + 2

onde:

Lm = o verdadeiro13 limite inferior de classe da classe modal


1

= da diferena entre das densidades de freqncia da classe modal e classe

premodal.
2 = da diferena entre das densidades de freqncia da classe modal e classe
posmodal.

C = a verdadeira amplitude de classe da classe modal.


Interpretao geomtrica da interpolao
algbrica para a determinao da moda
Densidade de
freqncia

xm

13

Para determinar os limites de classe verdadeiros para uma varivel contnua, temos que escrever os
limites de classe com uma casa decimal a mais do que os dados originais. Por exemplo, se o conjunto de
dados consiste de medidas de peso arredondadas para um dcimo de grama, os limites nominais de classe
(tambm chamados de limites aparentes podem ser 11,0 - 11,2; 11,3 - 11,5;11,6 - 11.8; ... Os limites

31

No exemplo anterior de gastos com alimentos de 80 famlias, como a amplitude


de todos os intervalos so iguais, podemos utilizar as freqncias absolutas de
classe no lugar das densidades de freqncia, para o clculo do valor aproximado
da mediana.
1 = 26 - 15 = 11

Lm = 140,00
c = 20

2 = 26 - 24 = 2

xm 140,00 + (

11
)20 = 156,92
11 + 2

Uma observao aqui necessria. possvel calcular os valores aproximados da


mediana e da moda para dados agrupados quando o ltimo intervalo de classe tem
limite superior indeterminado. No caso da mediana isso imediato e no caso da
moda, o seu clculo somente pode ser feito se a ltima classe no for a classe
modal e preciso primeiramente calcular as densidades de freqncia. Como
exemplo, suponhamos que a distribuio de renda de uma certa regio dada pela
seguinte distribuio de freqncia:

renda (R$)

limites reais

limites nominais

densidade de

absoluta

freqncia

- 120

121

- 605

120,50

- 605,50

170

170/485

= 0,350

606

- 1200

605,50

- 1200,50

220

220/595

= 0,370

1201

- 2400

1250,50

- 2400,50

15

15/1150

= 0,013

2400

mais de

2450,50

97

indeterminado

mais de

0 - 120,50

freqncia

Total

40

40/120,50 = 0,332

542

verdadeiros de classe (tambm conhecidos como limites reais ou efetivos) seriam 10,95 - 11,25; 11,25 11,55; 11,55 - 11,85;...

32

A mediana est localizada na terceira classe:14

(542 + 1) 210
2
(1200,50 605,50) = 772
x.5 605,50 +

220

A classe modal tambm a terceira classe:15


xm = 605,50 +

(0,370 0,350)
(1200,50 605,50) = 637
(0,370 0,350) + (0,370 0,013)

Infelizmente, para esse exemplo no possvel o clculo da mdia, o que


demonstra que para algumas situaes temos que contar com a mediana como
medida de posio (ou de tendncia central) de uma distribuio estatstica.
Discutiremos agora comparativamente algumas das caractersticas das trs
principais medidas de posio:

A Mdia Aritmtica

1) Ela afetada por todas as observaes e influenciada pelas magnitudes

absolutas dos valores extremos na srie de dados.


2) Ela das trs medidas de posio a que possibilita maiores manipulaes

algbricas, dadas as caractersticas de sua frmula.


3) Em amostragem, a mdia uma estatstica estvel. Isso ser aprofundado

posteriormente.

14

Observe-se que os dados originais esto, de acordo com o sugerido pela tabela acima, com aproximao
igual a unidades de gramas. Os limites verdadeiros (ou reais) de classe) passam, portanto, a ter aproximao
de uma casa decimal de grama. O valor final dos clculos da mediana e da moda so aproximados para
unidades de grama, j que essa a aproximao dos dados originais (que se refere ao instrumento de
medida).

15

J que esta classe a que apresenta maior densidade de freqncia. Como a ltima classe no tem limite
superior definido no foi possvel calcular sua densidade de freqncia, j que no podemos determinar sua
amplitude. Dependendo dessa amplitude ela poderia ter uma densidade de freqncia maior que a da

33

A Mediana

1) Seu valor afetado pelo nmero de observaes e como elas esto distribudas
mas ela no afetada pelos valores das observaes extremas.

2) Sua frmula no passvel de manipulao algbrica.


3) Seu valor pode ser obtido, como vimos, em distribuies, com limites
superiores indeterminados para a sua ltima classe.

4) A mediana a estatstica mais adequada para descrever observaes que so


ordenadas ao invs de medidas.

A Moda

1) A moda o valor mais tpico e representativo de uma distribuio. Ela


representa o seu valor mais provvel.

2) Como a mediana, a moda tambm no influenciada pelos valores extremos da


distribuio e no permite manipulaes algbricas como a frmula da mdia.

Existem algumas relaes entre as diversas medidas de posio:

1) Para qualquer srie, exceto quando no caso de todas as observaes


coincidirem em um nico valor, a mdia aritmtica sempre maior que a
mdia geomtrica, a qual, por sua vez, maior que a mdia harmnica.

2) Para uma distribuio simtrica e unimodal, mdia = mediana = moda.


3) Para uma distribuio positivamente assimtrica, mdia > mediana > moda.
A distncia entre a mediana e a mdia cerca de um tero da distncia entre
a moda e a mdia.

terceira classe. Mas mesmo nesse caso, a terceira classe ainda seria modal, j que sua densidade de
freqncia maior que a das suas classes vizinhas, e a distribuio passaria a ser bimodal.

34

4) Para uma distribuio negativamente assimtrica, mdia < mediana < moda.
A distncia entre a mediana e a mdia cerca de um tero da distncia entre
a moda e a mdia.
Essas ltimas caractersticas so apresentadas graficamente, a seguir

POSIES RELATIVAS DA MDIA, MEDIANA E MODA EM FUNO


DA ASSIMETRIA DAS DISTRIBUIES

Assimetria positiva

Assimetria negativa

Distribuio simtrica

35

Medidas de Disperso, Assimetria e Curtose


Muitas sries estatsticas podem apresentar a mesma mdia, mas no entanto, os dados de
cada uma dessas sries podem distribuir-se de forma distinta em torno de cada uma das
mdias dessas sries. Na anlise descritiva de uma distribuio estatstica fundamental,
alm da determinao de uma medida de tendncia central, conhecer a disperso dos
dados e a forma da distribuio. Duas sries de dados podem possuir a mesma mdia, mas
uma pode apresentar valores mais homogneos (menos dispersos em relao a mdia) do
que a outra. Um pas, por exemplo, com uma distribuio de renda mais equnime, ter
uma disperso de suas rendas menor do que um pas com estrutura de renda mais
diferenciada em diversos estratos ou categorias sociais. Uma mquina que produz
parafusos e que estiver menos ajustada do que outra produzir medidas de parafusos com
distribuio mais dispersa em torno de sua mdia.

A inadequao das mdias


A importncia das mdias com freqncia exagerada. Se dizemos que a renda familiar
mdia de um determinado pas de US$ 5.000 por ano no sabemos muita coisa sobre a
distribuio de renda desse pas. Uma mdia, como um simples valor adotado para
representar a tendncia central de uma srie de dados uma medida muito til. Porm, o
uso de um simples e nico valor para descrever uma distribuio abstrai-se de muitos
aspectos importantes.
Em primeiro lugar, nem todas as observaes de uma srie de dados tem o mesmo valor
da mdia. Quase sem exceo, as observaes includas em uma distribuio distanciamse do valor central, embora o grau de afastamento varie de uma srie para outra. Muito
pouco pode ser dito a respeito da disperso mesmo quando diversas medidas de tendncia
central so calculadas para a srie. Por exemplo, no podemos dizer qual distribuio tem
maior ou menor grau de disperso da informao dada pela tabela abaixo.

36

Distribuio A

Distribuio B

Mdia

15

15

Mediana

15

12

Moda

15

Uma segunda considerao que as formas de distribuio diferem de um conjunto de


dados para outro. Algumas so simtricas; outras no. Assim, para descrever uma
distribuio precisamos tambm de uma medida do grau de simetria ou assimetria. A
estatstica descritiva para esta caracterstica chamada de medida de assimetria.
Finalmente, existem diferenas no grau de achatamento entre as diferentes distribuies.
Esta propriedade chamada de curtose (em ingls, kurtosis). Medir a curtose de uma
distribuio significa comparar a concentrao de observaes prximas do valor central
com a concentrao de observaes prximas das extremidades da distribuio.

2.5.11 O Intervalo (ou amplitude)


A medida de disperso mais simples a amplitude, a diferena entre o maior e o menor
valor nos dados. Para uma distribuio de freqncia que usa intervalos de classe, a
amplitude pode ser considerada como a diferena entre o maior e o menor limite de classe
ou a diferena entre os pontos mdios dos intervalos de classe extremos. Os preos de
aes e de outros ativos financeiros so freqentemente descritos em termos de sua
amplitude, com a apresentao pelas Bolsas de Valores do maior valor e do menor valor
da ao em um determinado perodo de tempo.
Para algumas distribuies simtricas a mdia pode ser aproximada tomando-se a semisoma dos dois valores extremos,16 que freqentemente chamada de semi-amplitude. Por
exemplo, prtica entre os meteorologistas derivar a mdia diria de temperatura

16

Foi o que fizemos ao calcular a mdia para valores agrupados em classes de freqncia. Nesse caso
utilizamos o ponto mdio de cada intervalo de classe como representativo da mdia de cada intervalo.
Assim, ao multiplicarmos a freqncia de cada classe pelo valor do ponto mdio, estamos calculando
aproximadamente a soma das observaes em cada intervalo, admitindo como hiptese que a distribuio
dos dados em todos os intervalos simtrica.

37

tomando a mdia somente dos valores mximo e mnimo de temperatura ao invs, de


digamos, a mdia das 24 leituras horrias do dia.
A amplitude tem alguns defeitos srios. Ela pode ser influenciada por um valor atpico na
amostra. Alm disso, o seu valor independe do que ocorre no interior da distribuio, j
que somente depende dos valores extremos. Este defeito ilustrado na figura a seguir:

f(X)

X
Na figura acima so mostradas duas distribuies com diferentes variabilidade, mas com
mesma amplitude. A amplitude tende a crescer, embora no proporcionalmente, a medida
que o tamanho da amostra cresce. Por esta razo, no podemos interpretar a amplitude
corretamente sem conhecer o nmero de informaes dos dados.

2.5.12 Percentis, Decis e Quartis


Podemos tentar responder a seguinte pergunta: que proporo dos valores de uma
varivel menor ou igual a um dado valor? Ou maior ou igual a um dado valor? Ou entre
dois valores? Quando construmos uma distribuio de freqncia acumulada, tais
questes somente podem ser respondidas com relao aos limites de classe exatos. Por
exemplo, a partir da distribuio de freqncia relativa acumulada da pgina 28, podemos
dizer que 38,75 % das observaes so menores do que 159,99. Mas no podemos
responder a pergunta: qual o gasto familiar tal que a proporo da amostra tendo este
valor ou menos 35 %?. Mas visvel da tabela que 6,25 % das famlias gastam com
alimentao at R$ 139,99 e 38,75 % das famlias gastam at R$ 159,99. Portanto, como
35 % est entre estes dois valores, o gasto familiar tal que a proporo da amostra tendo

38

este valor ou menos 35 % est situado entre R$ 139,99 e R$ 159,99. Este valor
chamado de percentil 35.
O percentil 40 o valor da varivel que maior do que 40 % das observaes.
Generalizando, o percentil x, o valor da varivel que maior do que x % das
observaes. Em outras palavras, o percentil x o valor da varivel correspondente ao
valor de freqncia relativa acumulada de x %.17 O primeiro decil o valor da varivel
que supera um dcimo (ou 10 %) do total de observaes. Se tivermos 200 observaes, o
segundo decil ser aproximadamente a observao de posto 40.
O primeiro quartil o valor da varivel cuja freqncia relativa acumulada 0,25 (ou 25
%). O terceiro quartil o valor da varivel cuja freqncia relativa acumulada 0,75 (ou
75 %). O primeiro quartil maior do que um quarto dos valores observados e menor do
que trs quartos destes valores. O terceiro quartil maior do que trs quartos dos valores
observados e menor do que um quarto destes valores. O segundo quartil confunde-se com
a mediana.
Uma medida de disperso o chamado desvio interquartlico que a diferena entre o
terceiro e o primeiro quartis.

2.5.13 Varincia e Desvio Padro


A varincia definida como a mdia dos desvios ao quadrado em relao mdia da
distribuio. Para uma amostra,

(x X )
=

n 1

17

Para o clculo do valor exato do percentil x para dados agrupados utiliza-se o mesmo mtodo para a
determinao da mediana, ou seja, a interpolao linear. Como no caso da mediana, podemos empregar uma
frmula de interpolao

p (n + 1) / 100 Fa
X p = LI p +
c
fp

onde Xp o percentil p, Lip o limite inferior real da classe que contem o percentil, Fa a freqncia
relativa acumulada da classe anterior classe que contem o percentil, fp a freqncia relativa (simples) da
classe que contem o percentil, c a amplitude do intervalo de classe que contem o percentil e o nmero
de observaes. O mesmo mtodo pode ser empregado tambm para os decis e quartis.

39

Para uma populao finita,

(x )
=

Na penltima equao, n-1 chamado de nmero de graus de liberdade de S2 , um


conceito a ser definido mais tarde. Existe uma restrio para esta equao: n > 1 (no se
pode calcular a varincia para uma amostra de uma observao apenas). O desvio padro
a raiz quadrada da varincia, e denotado S (para amostra) e (para populao).
Existem frmulas que facilitam os clculos para

S2 e 2 :
n x 2 ( x ) 2
S =
n(n 1)
2

x
=
N

Com estas duas ltimas frmulas, podemos calcular a varincia somente com a soma dos
valores ( x ) e a soma dos quadrados dos valores ( x 2 ); no mais necessrio
calcular a mdia, em seguida os desvios em relao s mdias e finalmente os quadrados
destes desvios.
Para ilustrar o processo de clculo da varincia e desvio padro e para mostrar o uso
destas medidas, considere o seguinte exemplo. Dois tipos diferentes de mquina, X e Y
so projetadas para produzir o mesmo produto. Elas tm o mesmo preo de venda. Um
fabricante est tentando decidir qual delas comprar e observou 10 mquinas distintas de
cada tipo em operao por uma hora. A tabela seguinte mostra as produes horrias nas
primeiras duas colunas. As mdias so x = 40310 = 40,3 unidades por hora e

y = 408 10 = 40,8 unidades por hora. Portanto, com base nestes dados, o tipo Y um
pouco mais rpida. Podemos retirar mais alguma informao a partir destes dados?

40

Podemos medir e comparar as disperses das produes horrias dos dois tipos de
mquina. Usando a penltima frmula para os dados da tabela, obtemos:

10(16.405) (403) 2
= 18,23
S =
10(10 1)
2
X

S X = 18,23 = 4,27 unidades por hora


10(17.984) (408) 2
= 135,11
S =
10(10 1)
2
Y

SY = 135,12 = 11,62 unidades por hora

x2

y2

35

25

1.225

625

36

26

1.296

676

49

55

2.401

3.025

44

52

1.936

2.704

43

48

1.849

2.304

37

24

1.369

576

38

34

1.444

1.156

42

47

1.764

2.209

39

50

1.521

2.500

40

47

1.600

2.209

Soma 403

408

16.405

17.984

O tipo X tem menor disperso que o tipo Y. Apesar de ter maior preo que o tipo Y, a
mquina X mais precisa.

41

2.5.14 Varincia e Desvio Padro para Dados Agrupados


A varincia e o desvio padro (como a mdia, mediana, moda, quartis, percentis, decis)
podem ser calculados para dados agrupados, ou seja, distribuies de freqncia com
intervalos de classe. Entretanto, os resultados podem ser apenas aproximadamente
precisos. Utiliza-se, como no caso da mdia, a hiptese do ponto mdio: a de que toda
observao est localizada no ponto mdio de sua classe. Cada ponto mdio entra nos
clculos quantas vezes so as observaes naquele intervalo de classe. As equaes para
as varincias so:
S2 =

2 =

f (m X )

, para a amostra;

n 1

f (m )
N

, para a populacao.

Os smbolos utilizados nestas equaes j foram definidos anteriormente. Para facilitar os


clculos podemos utilizar as seguintes frmulas mais convenientes para as varincias:
S2 =

fm

( fm) 2 / n
n 1

2 =

fm

( fm) 2 / N
N

para a amostra e populao, respectivamente. Aqui, como antes, assumimos que a


populao finita.
Os somatrios em todas estas equaes so para todas as k classes, no para as
observaes individuais. Estas equaes podem ser aplicadas tanto para intervalos de
classe iguais como para intervalos de classe desiguais. Entretanto, elas no podem ser
empregadas quando existem um ou mais intervalos sem limites. Como para os dados no

42

agrupados, a raiz quadrada destas equaes so os desvios padres para a amostra e para a
populao, respectivamente.
Aplicando as ltimas equaes para o exemplo de consumo de alimentos, temos:
Classe

(1)
m

R$ 120,00 - R$139,99

(2)
f

130

(3)
fm
(2)(1)
650

(4)
fm2
(3)(1)
84.500

140,00 -

159,99

150

26

3.900

585.000

160,00 -

179,99

170

24

4.080

693.000

180,00 -

199,99

190

15

2.850

541.500

200,00 -

219,99

210

1.680

352.800

220,00 -

239,99

230

460

105.800

80

13.620

2.363.200

Total

fm
=

( fm) 2 / n 2.363.200 (13.620) 2 / 80


=
= 561,96
80 1
n 1

S = 561,96 = 23,71

2.5.15 Interpretando e Aplicando o Desvio Padro


O desvio padro mais a mais usada das medidas de variabilidade. Infelizmente,
o desvio padro no tem uma interpretao intuitivamente bvia. Por exemplo, no
exemplo anterior das mquinas, SX = 4,27 unidades por hora, mas no bvio o que isto
quer dizer para a mquina X. Para muitas sries de dados h dois teoremas para a
interpretao do desvio padro que so muito teis. Eles so chamados de Desigualdade
de Chebyshev e a Regra de Gauss, as quais introduzimos a seguir.

Teorema: Desigualdade de Chebyshev. Para qualquer conjunto de dados e qualquer


constante h > 1, no mnimo 1 1 / h 2 dos dados estaro situados dentro de um intervalo
formado por h desvios padres abaixo e acima da mdia.

43

Por este teorema temos certeza de que no mnimo , ou 75 % dos dados iro situar-se
dentro do intervalo X 2 S . Neste caso h = 2 e 1 1 / h 2 = 1 1 / 2 2 = 3 / 4 . No mnimo
8/9, ou 88,9 % dos dados estaro no intervalo X 3S ; e no mnimo 15/16, ou cerca de
94 % dos valores de qualquer varivel estaro includos dentro do intervalo X 4 S .
Considere o exemplo anterior das mquinas. Temos X = 40,3 e S X = 4,27 . Que
percentagem das mquinas ter produo entre X 1,5S X = 40,3 1,5 4,27 , ou seja,
entre 33,9 e 46,7? Resposta: no mnimo 1 1 2 = 0,56 , ou aproximadamente 56 %. Da
1,5
tabela anterior encontramos 9 das 10 mquinas tipo X que esto dentro deste intervalo e
claramente 9/10 maior do que 56 %.
A vantagem da Desigualdade de Chebyshev que ela pode ser aplicada variveis com
qualquer padro de distribuio (no importa que sejam simtricas, assimtricas,
mesocrticas, platicrticas, leptocticas, etc.). Entretanto, ela tem a desvantagem de no
ser muito precisa, j que a porcentagem efetiva que caem dentro do intervalo em torno da
mdia quase sempre muito maior do que o mnimo dado por 1 1 / h 2 , especialmente
quando as amostras so pequenas, como no nosso exemplo anterior.

Teorema: A Regra de Gauss. Se os dados so amostrais e se so, de forma aproximada,


distribudos normalmente, ou seja, o histograma dos dados aproximadamente simtrico
e tem a forma de um sino, ento:
1. X 1S incluir aproximadamente 68 % dos dados
2. X 2 S incluir aproximadamente 95 % dos dados
3. X 3S incluir aproximadamente 100 % dos dados
Chamamos isto de Regra de Gauss, porque baseada na distribuio de probabilidade
gaussiana (ou distribuio de probabilidade normal). Esta distribuio ser discutida em
detalhe em um captulo posterior.

44

2.5.16 Coeficiente de Variao


Com freqncia, como no caso do exemplo das duas mquinas, queremos comparar a
variabilidade de dois ou mais conjuntos de dados. Podemos fazer isto facilmente usando
as varincias ou os desvios padres quando, primeiro, todas as observaes individuais
tm a mesma unidade de medida e, segundo, as mdias dos conjuntos de dados so
aproximadamente iguais. Quando qualquer uma destas condies no satisfeita, uma
medida relativa de disperso deve ser usada. Uma medida relativa de variabilidade
freqentemente usada chamada de coeficiente de variao, denotada por CV para uma
amostra. Esta medida o valor do desvio padro em relao mdia:

CV =

S
X

Suponha que um cientista na ndia obteve os seguintes dados referentes aos pesos de
elefantes e ratos.
Elefantes

Ratos

x E = 6.000 kg

x R = 0,150 kg

sE = 300 kg

sR = 0,04 kg

Se calcularmos os respectivos coeficientes de variao, teremos:


cv(X E ) =

300
sE
=
= 0,050 ou 5,0 %
x E 6000

cv(X R ) =

0,04
sR
=
= 0,266 ou 26,7 %
x R 0,150

Portanto, a variabilidade relativa dos pesos dos ratos mais do que 5 vezes maior do que
a variabilidade dos pesos dos elefantes. Para o exemplo anterior das mquinas, teremos:

45

4,27
= 0,1060 ou 10,60 %
40,30
11,62
cv(Y) =
= 0,2848 ou 28,48 %
40,80
cv(X) =

Assim, a disperso relativa da produo da mquina Y quase trs vezes maior do que a
disperso relativa da mquina X.

2.6 Medidas de Assimetria


Duas distribuies tambm podem diferir uma da outra em termos de assimetria ou
achatamento, ou ambas. Como veremos, assimetria e achatamento (o nome tcnico
utilizado para esta ltima caracterstica de forma da distribuio curtose) tm
importncia devido a consideraes tericas relativas inferncia estatstica que so
freqentemente baseadas na hiptese de populaes distribudas normalmente. Medidas
de assimetria e de curtose so, portanto, teis para se precaver contra erros aos estabelecer
esta hiptese.
Diversas medidas de assimetria so disponveis, mas introduziremos apenas uma, que
oferece simplicidade no conceito assim como no clculo. Esta medida, a medida de
assimetria de Pearson, baseada nas relaes entre a mdia, mediana e moda. Recorde
que estas trs medidas so idnticas em valor para uma distribuio unimodal simtrica,
mas para uma distribuio assimtrica a mdia distancia-se da moda, situando-se a
mediana em uma posio intermediria, a medida que aumenta a assimetria da
distribuio. Conseqentemente, a distncia entre a mdia e a moda poderia ser usada
para medir a assimetria. Precisamente,

Assimetria = mdia - moda


Quanto maior a distncia, seja negativa ou positiva, maior a assimetria da distribuio.
Tal medida, entretanto, tem dois defeitos na aplicao. Primeiro, porque ela uma
medida absoluta, o resultado expresso em termos da unidade original de medida da
distribuio e, portanto, ela muda quando a unidade de medida muda. Segundo, a mesma
grandeza absoluta de assimetria tem diferentes significados para diferentes sries de
dados com diferentes graus de variabilidade. Para eliminar estes defeitos, podemos medir

46

uma medida relativa de assimetria. Esta obtida pelo coeficiente de assimetria de


Pearson, denotado por SKP e dado por:

SK P =

X Xm
S

A aplicao desta expresso envolve outra dificuldade, que surge devido ao fato de que o
valor modal da maioria das distribuies ser somente uma distribuio, enquanto que a
localizao da mediana mais satisfatoriamente precisa. Contudo, em distribuies
moderadamente assimtricas, a expresso

X m = X 3( X X .5 )
adequada (no envolve impreciso muito grande). A partir disto, vemos que:

X X m = X [ X 3( X X .5 )] = 3( X X .5 )
Com este resultado, podemos rescrever o coeficiente de assimetria de Pearson como:
SK P =

3( X X .5 )
S

Esta medida igual a zero para uma distribuio simtrica, negativa para distribuies
com assimetria para a direita e positiva para distribuies com assimetria para a esquerda.
Ela varia dentro dos limites de 3. Aplicando SKP aos dados agrupados de gastos com
consumo de alimentos das famlias, temos:
SK P =

3(170,25 167,92)
= +0,295
23,71

Este resultado revela que a distribuio de gastos com consumo de alimentos tem
assimetria moderadamente positiva (o que significa maior concentrao de famlias nas
classes de menor gasto). muito comum encontrar distribuies positivamente
assimtricas em dados econmicos, particularmente na produo e sries de preos, os

47

quais podem ser to pequenos quanto nulos mas podem ser infinitamente grandes.
Distribuies assimetricamente negativas so raras em cincias sociais.

2.7 Curtose: uma medida de achatamento


Apresentaremos agora uma medida de achatamento das distribuies, o coeficiente de
curtose, denotado por K. Esta medida algebricamente tratvel e geometricamente
interpretvel. definida como a relao entre o desvio semi-interquartlico, ou seja, a
metade do valor do desvio interquertlico, e o intervalo entre o decil 9 e o decil 1:

1
(Q3 Q1 )
K= 2
D9 D1
Por meio do coeficiente de curtose, classificamos diferentes graus de achatamento em trs
categorias: leptocrtica, platicrtica e mesocrtica (ver figura, a seguir). Uma
distribuio leptocrtica (curva a) tem a maior parte de suas observaes concentrada no
centro. Conseqentemente, a diferena entre as duas distncias, (Q3 - Q1) e (D9 - D1)
tende a ser muito pequena. Para um dado grau de disperso, quanto menor for o
achatamento da distribuio, menor ser diferena entre estas duas distncias. Desde que

(Q3 - Q1) < (D9 - D1) para uma distribuio com forma muito pontiaguda, K aproximase de 0,5 no limite, quando Q3 - Q1 = D9 - D1. Ao contrrio, quanto mais platicrtica a
distribuio (curva b), mais o intervalo entre os decis 9 e 1 tende a exceder o intervalo
interquartlico. Portanto, quando o intervalo de uma varivel tende ao infinito e para uma
curva completamente achatada, K tende a zero. Em vista destas consideraes, parece
razovel estabelecer valores prximos de 0,25 para representar distribuies mesocrticas
(curva c). Esta escolha reforada pelo fato de que para a varivel normal padronizada, k
= 0,2630 (veremos este ponto em captulo posterior).

48

Na figura acima se compara a curtose de duas distribuies com a curtose de uma


distribuio mesocrtica (em linha tracejada). Na figura da direita temos uma distribuio
platicrtica (linha cheia) e na figura da esquerda temos uma distribuio leptocrtica
(linha cheia).

Aps o clculo dos quartis e decis a partir dos dados agrupados para a distribuio de
gastos com alimentao, temos que:

1
(Q3 Q1 ) (1 / 2)(188.39 154,83)
=
K= 2
209,78 146,58
D9 D1
= 0,2655
Este resultado indica que a distribuio de gastos com alimentos aproximadamente
mesocrtica, j que muito prximo de 0,25.

49

3. Probabilidade
Objetivos do captulo:

Definir o termo probabilidade.

Descrever as abordagens clssica, da freqncia relativa e subjetiva da probabilidade.

Entender os termos experimento, espaos amostral e evento.

Definir os termos probabildade condicional e probabilidade conjunta

Calcular probabilidades aplicando as regras da adio e da multiplicao

Determinar o nmero de possveis permutaes e combinaes

Calcular uma probabilidade usando o Teorema de Bayes

Probabilidade: uma medida de possibilidade de ocorrncia de um determinado


evento; ela pode assumir um valor entre 0 e 1

Evento: Uma coleo de um ou mais resultados de um experimento

Exemplo: Experimento  jogar uma moeda duas vezes

Possveis resultados (espao amostral)  { KK, KC, CK, CC }


Evento: no mnimo uma cara = {CC, CK, KC}

Como uma probabilidade expressa?

Uma probabilidade expressa como uma nmero decimal, tal como 0,70 ; 0,27 ; ou 0,50.
Entretanto ela pode ser representada como uma percentagem tal com 70 %, 27 % ou 50
%. O valor de uma probabilidade est localizado no intervalo de nmero reais que vai de

0 a 1, inclusive as extremidades deste intervalo.

50

Quanto mais uma probabilidade prxima de 0, o evento a ela associado mais


improvvel de ocorrer.

Quanto mais uma probabilidade prxima de 1, o evento a ela associado mais


provvel de ocorrer.

3.1 Definio Clssica de Probabilidade


Probabildade Clssica: baseada na hiptese de que os resultados de um experimento
so igualmente provveis.

Usando o ponto de vista clssico:

Probabilidade de um evento =

nmero de resultados favorveis


nmero total de possveis resultados

Considere o experimento de jogar duas moedas.

O espao amostral deste experimento S = { CC,CK,KC,KK}

Considere o evento: uma cara

Probabilidade de um evento =

nmero de resultados favorveis


2
= =1
2
nmero total de possveis resultados 4

Definies

Eventos mutuamente exclusivos: a ocorrncia de qualquer um evento significa que

nenhum dos outros pode ocorrer ao mesmo tempo.

No caso do experimento de jogar duas moedas, os quatro possveis resultados so


mutuamente exclusivos.

51

CC

CK

KC

KK

Eventos Coletivamente Exaustivos: no mnimo um dos eventos deve ocorrer quando o


experimento conduzido.

No experimento de jogar 2 moedas, os quatro possveis resultados so coletivamente


exaustivos.

Soma das probabilidades = 1

Desde que cada resultado no experimento de jogar 2 moedas tem probabilidade igual
a , ento a soma das probabilidades dos resultados possveis + + + = 1

3.2 Conceito da Freqncia Relativa

A probabilidade de um evento ocorrer no longo prazo determinada pela


observao de que frao de vezes o evento ocorreu no passado.

A probabilidade pode ser calculada pela frmula:

Pr obabilidade do evento =

nmero de vezes em que o evento ocorreu no passado


nmero total de observaes

52

Exemplo 2

A questo de ser ou no um ru culpado: em uma amostra de 500 estudantes em um


determinado campus, 275 indicaram que o ru era culpado. Qual a probabilidade de
que um estudante neste campus indicar que o ru neste caso era culpado?

Nota: Neste problema podemos aplicar a frmula para a probabilidade baseada na


frequncia relativa.

Assim, P(culpado) = 275/500 = 0,55

3.3 Probabilidade Subjetiva


Probabilidade Subjetiva : a probabilidade de que um particular evento ocorra
atribuda por um indivduo e baseada em um conjunto de informao disponvel.

Exemplos de probabilidade subjetiva so:


Estimar a probabilidade de que o time de futebol da Ponte Preta disputar a final do
campeonato nacional.
Estimar a probabilidade de que voc obtenha conceito A neste curso.

3.4 Algumas Regras Bsicas de Probabilidade

Regra da Adio: Se dois eventos A e B so mutuamente exclusivos, a regra especial


da adio estabelece que a probabilidade de que A ou B ocorram igual a soma de
suas respectivas probabilidades. A regra dada pela seguinte frmula:

P(A ou B) = P(A) + P(B)

53

Exemplo 3
A companhia de aviao X recentemente forneceu a seguinte informao para o
Departamento de Aviao Civil (DAC) sobre os vos da origem A ao destino B

Chegada

Frequncia

Adiantada

100

No horrio

800

Atrasada

75

Cancelado

25

Total

1000

Seja A o evento: o vo chega adiantado

Ento P(A) = 100 / 1000 = 0,1

Seja B o evento: o vo chega atrasado

Ento P(B) = 75 / 1000 = 0,075


Nota: os eventos A e B so mutuamente exclusivos. Por qu?

Qual a probabilidade de que um vo chegue adiantado ou atrasado?

P(A ou B) = P(A) + P(B) = 0,1 + 0,075 = 0,175

54

3.5 A Regra do Complemento


A regra do complemento usada para determinar a probabilidade de um evento ocorrer
subtraindo-se a probabilidade do evento no ocorrer de 1.
Seja P(A) a probabilidade do evento A e P ( A ) a probabilidade do evento no A
(complemento de A).

P( A) + P( A ) = 1
P( A) = 1 P( A )
Um diagrama de Venn pode ilustrar a Regra do Complemento:

Exemplo 3

Reconsidere os dados do exemplo 2. Seja C o evento: o vo chega no horrio. Ento


P(C) = 800 / 1000 = 0,8

Seja D o evento: o vo cancelado.

Ento P(D) = 25 / 1000 = 0,025


Nota: os eventos C e D so mutuamente exclusivos. Por qu?

55

Use a regra do complemento para mostrar que a probabilidade do vo chegar adiantado


(A) ou atrasado (B) 0,175
P(A ou B) = 1 P(C ou D) = 1 [0,8 + 0,025] = 0,175

O diagrama de Venn abaixo ilustra esta situao:

0,8

0,025

(C ou D) = (A ou B) =
0,175

A regra do complemento muito importante no estudo de probabilidade. Com


freqncia, mais eficiente calcular a probabilidade de um evento ocorrer
determinando-se a probabilidade do evento no ocorrer e subtraindo o resultado de 1.

3.6 A Regra Geral da Adio


Sejam A e B dois eventos que no so mutuamente exclusivos. Ento P(A ou B)
dado pela seguinte frmula:

P(A ou B) = P(A) + P(B) P(A e B)

56

O Diagrama de Venn abaixo ilustra esta regra:

Exemplo 5

Em uma amostra de 150 estudantes, 70 disseram que somente tm um aparelho de


CD, 50 disseram que somente tm uma TV e 25 disseram que tm ambos.
Diagrama de Venn a seguir descreve esta situao.

TV
50
Ambos
CD

25

70

57

Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha somente


um aparelho de CD ? De somente uma TV ? De tanto uma TV como um aparelho de
CD?

Seja C o evento o estudante tem um aparelho de CD e T o evento o estudante tem


uma TV

P(C) = 70 / 150 = 0,4667

P(T) = 50 / 150 = 0,3333

P(C e T) = 25 / 150 = 0,1667

Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha tanto


um aparelho de CD ou uma TV? (Nota: isto inclui a probabilidade de ter ambos os
aparelhos).

Desde que:

P(C ou T) = P(C) + P(T) P(C e T)

Ento, P(C ou T) = 0,4667 + 0,3333 0,1667 = 0,6333

3.7 Regras de Multiplicao


Regra Especial de Multiplicao

A regra especial de multiplicao requer que dois eventos A e B sejam independentes.

58

Definio: Dois eventos A e B so independentes se a ocorrncia de um no tem


efeito sobre a probabilidade de ocorrncia do outro.
A regra especial escrita simbolicamente como:

P(A e B) = P(A). P(B)


Para trs eventos independentes A,B e C, a regra especial da multiplicao usada para
determinar a probabilidade de que todos os eventos ocorram :

P(A e B e C) = P(A).P(B).P(C)

Exemplo 6
Um investidor possui duas aes. Uma de uma companhia de produo de petrleo e a
outra de uma cadeia de supermercados, de forma que podemos assumir que suas
cotaes so independentes. A probabilidade de que a ao da companhia de petrleo
suba no prximo ano 0,50. A probabilidade de que a cotao da cadeia de
supermercados aumente em valor no prximo ano 0,70.

Qual a probabilidade de que ambas as aes cresam em valor no prximo ano?

Seja A o evento: a cotao da companhia de petrleo cresce no prximo ano e seja B


o evento: a cotao da cadeia de supermercados cresce no prximo ano.

P(A e B) = (0,50).(0,70) = 0,35


Qual a probabilidade de que ao menos uma destas aes aumentem em valor no
prximo ano?
Isto implica que tanto uma pode aumentar (sem que a outra aumente) assim como ambas.
Portanto,
P(no mnimo uma) = (0,50).(0,30) + (0,50).(0,70) + (0,70).(0,50) = 0,85

59

Exemplo 7
Um estudo recente constatou que 60 % das mes com crianas de idade de at 10 anos
empregam-se em tempo integral. Trs mes so selecionadas aos acaso. Assumiremos
que as mes so empregadas de forma independente umas das outras.

Qual a probabilidade de que todas sejam empregadas em perodo integral?

P( todas as trs empregadas em perodo integral) = (o,60).(0,60).(0,60) = 0,216


Qual a probabilidade de que no mnimo umas das mes sejam empregadas em
perodo integral?

P(no mnimo uma) = 1 P(nenhuma empregada em perodo integral) =

1 [(0,40).(0,40).(0,40)] = 0,936

3.8 Probabilidade Condicional


a probabilidade de que um evento particular ocorra, dado que outro evento tenha
ocorrido.

Notao: A probabilidade do evento A dado que o evento B ocorreu denotada por


P(A/B)

Regra Geral da Multiplicao

A Regra Geral da Multiplicao usada para encontrar a probabilidade conjunta de


que dois eventos ocorram.

60

A regra estabelece que para dois eventos A e B, a probabilidade conjunta de que os


dois eventos ocorram obtida pela multiplicao da probabilidade de que o evento A
ocorra pela probabilidade condicional de B dado que A ocorreu.

A probabilidade conjunta, P(A e B) dada pela seguinte frmula:

P(A e B) = P(A) . P(B/A)

Alternativamente, podemos tambm escrever:

P(A e B) = P(B) . P(A/B)

Exemplo 8
Uma faculdade coletou a seguinte informao sobre seus estudantes de graduao:

Curso

Homens

Mulheres

Total

Contabilidade

120

80

200

Finanas

110

70

180

Marketing

70

50

120

Administrao

110

100

210

Estatstica

50

10

60

Computao

140

90

230

Total

600

400

1000

Um estudante selecionado ao acaso. Qual a probabilidade de que o(a) estudante seja


mulher e que esteja cursando Contabilidade?

Seja A o evento: o(a) estudante est cursando Contabilidade e F o evento: o(a)


estudante mulher.

61

P(A e F) = 80 / 1000

Qual a probabilidade de selecionar uma mulher ?

P(F) = 400 / 1000

Dado que o(a) estudante mulher, qual a probabilidade de que esteja cursando
Contabilidade ?

Precisamos calcular P(A / F).

P(A / F) = P(A e F) / P(F) = [80 / 1000] / [400 / 1000] = 0,20

3.9 Diagramas em rvore

Um diagrama em rvore muito til para representar probabilidades conjuntas e


probabilidades condicionais. Ele particularmente til para analisar decises quando
h diversos estgios no problema.

Exemplo: Suponha que h 7 peas vermelhas e 5 peas azuis em uma sacola. Suponha
que voc selecione duas peas, uma aps a outra e sem reposio. Construa um
diagrama em rvore para esta informao.

62

6/11

V2

 (7/12) (6/11)

B2

 (7/12) (5/11)

V2

 (5/12) (7/11)

V1
7/12
5/11
7/11
5/12

B1
4/11

 (5/12) (4/11)

B2

Probabilidades
Condicionais

Probabilidades
Conjuntas

63

3.10 Teorema de Bayes

Considere o seguinte diagrama com as parties A1 e A2 :

Espao Amostral

A2

A1
B
A1 e B

A2 e B

P(A1 / B) = P(A1 e B) / P(B); P(A1 e B) = P(A1) . P(B / A1)

P(B) = P(A1 e B) + P(A2 e B);


P(A2 e B) = P(A2) P(B / A2)

A partir disto, temos a frmula seguinte (Teorema de Bayes):

P ( A1 / B ) =

P ( A1 ) P ( B / A1 )
P ( A1 ) P ( B / A1 ) + P ( A2 ) P ( B / A2 )

Nota: Este teorema pode ser estendido para diversas parties do espao amostral ( A1,
A2, A3, etc.)

64

Exemplo 9:

A Companhia C & W tem recebido recentemente diversas reclamaes de que suas


garrafas esto sendo preenchidas com contedo abaixo do especificado. Uma reclamao
foi recebida hoje mas o administrador da produo no capaz de identificar qual das
duas plantas (A ou B) preencheu a garrafa. Qual a probabilidade de que a garrafa com
pouco preenchimento provenha da planta A? Seja S o evento: a garrafa foi preenchida
com contedo abaixo do especificado.

% da Produo Total

% de garrafas com pouco


preenchimento

55

45

P( A / S ) =

0, 55 0, 03
= 0, 4783
0,55 0, 03 + 0, 45 0, 04

Anexo 1 Recordando Definies e Conceitos


Uma moeda mostra cara 50% do tempo, em mdia. Depois de muitos lances, o nmero de
caras aproximadamente igual ao nmero de coroas.

Um conceito de Probabilidade
No limite quando o nmero de lances -> infinito

nmero de caras
0,5
nmero de lanamenos

Dizemos que a probabilidade de aparecer uma cara em qualquer lance 1/2. Isto ilustra o
conceito de probabilidade que ser usada neste curso.

Exemplo - 10 000 lances de moeda


John Kerrich, um matemtico sul africano estava visitando Copenhague quando a
Segunda Guerra Mundial comeou. Dois dias antes de seu vo marcado para a Inglaterra,

65

os alemes invadiram a Dinamarca. Kerrich passou o resto da guerra internado em um


acampamento em Jutland e para passar o tempo ele levou a cabo uma srie de
experimentos em teoria da probabilidade. Em um destes experimentos, lanou uma
moeda 10.000 vezes. Seus resultados so mostrados no grfico seguinte.

10

% de
caras
50 %

0
-5
-10
10

100

100
1000
0
0
Nmero de lanamentos

(O eixo horizontal est em uma escala logartmica)


O lanamento de uma moeda 10 vezes um exemplo de um experimento aleatrio. A
maioria dos experimentos est sujeito a Variao Aleatria. A Teoria de probabilidade
a aproximao matemtica que busca quantificar em temos de modelos o que ocorre com
estes experimentos.

Exemplo - 2 lanamentos de uma moeda


Lance uma moeda duas vezes e registre para cada lance se o resultado era uma cara (C)
ou uma coroa (K). Exerccio: Liste os possveis resultados.
Seja A o evento deu uma ou mais caras. Quais resultados pertencem ao evento A? (CK,
KC, CC).
Seja B o evento no aparece nenhuma cara. (KK)

66

Neste exemplo, os eventos A e B so ditos disjuntos ou mutuamente exclusivos, pois eles


no tm nenhum resultado em comum. Eles tambm so exaustivos, j que eles cobrem
todos os possveis resultados do experimento.
Exerccio: Defina um evento C que no disjunto em relao a A.

DEFINIES
Um espao amostral o conjunto de todos os possveis resultados de um experimento.
Um evento um conjunto de um ou mais resultados no espao amostral.
Dois eventos so disjuntos ou mutuamente exclusivos se eles no tm nenhum resultado
em comum.

A variao aleatria ocorre quando impossvel predizer com certeza o resultado exato
de um experimento individual, mas como o experimento repetido um nmero grande de
vezes uma distribuio regular de freqncias relativas surge.
A probabilidade de um resultado ou evento pode ser determinada tanto

empiricamente (baseado em dados) ou teoricamente (baseado em um modelo


matemtico do processo). A definio emprica a seguinte: Suponha que um resultado
(ou evento) A ocorre f vezes em n observaes. Ento

frequncia relativa de A =

nmero de vezes em que A ocorre f


=
nmero de observaes
n

O conceito da probabilidade de um evento A um idealizao da freqncia relativa. o


valor limite da freqncia relativa quando n fica muito grande, i.e. quando n =>

f
P ( A) quando n
n
(P(A) denota a probabilidade de A ocorrer).
Estimativas tericas de probabilidade esto baseadas em suposies plausveis. A
suposio mais comum a de que todos os possveis resultados so igualmente provveis.
Ento

67

P ( A) =

nmero de resultados correspondendo a A


nmero total de resultados no espao amostral

Por analogia com freqncias relativas, as probabilidades tm as seguintes propriedades:


1. P(A) um valor entre 0 e 1.
2. P(A) = 0 significa A nunca acontece (correspondendo a f = 0)
3. P(A) = 1 significa A sempre acontece (correspondendo a f = n)
4. O conjunto S de todos os possveis resultados tem probabilidade 1. P(S) = 1, os
quais se agrupam em 5 eventos.

Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades


Se eventos X e Y so mutuamente exclusivos, ento,
P(X ou Y) = P(X) + P(Y)

Em geral, se eventos X e Y no so mutuamente exclusivos ento


P(X ou Y) = P(X) + P(Y) - P(X e Y).
Exemplo - Fruta em 2 distritos
Um certo tipo de fruta produzido em 2 distritos, A e B. Ambas as reas s vezes so
atacadas por uma praga (mariposa que ataca as frutas).
Suponha que as probabilidades so
P(A) = 1/10, P(B) = 1/20, P(A e B) = 1/50
Qual a probabilidade de que um ou outro (ou ambos) distrito esto infetados em um
determinado momento?
P(A ou B) = P(A) + P(B) - P(A e B)
= 0.1 + 0.05 - 0.02
= 0.13

68

Alternativamente, considere partes mutuamente exclusivas

P(A
somente)
= 0,1 0,02
= 0,08

P(A e B)
= 0,02

P(B somente)
= 0,05 0,02
= 0,03

A ou B consiste em 3 partes mutuamente exclusivas: A somente, B somente, A e B.


P(A ou B) = P(A somente) + P(B somente) + P(A e B)
= 0.08 + 0.02 + 0.03 = 0.13 .
Dois eventos X e Y so ditos independentes se a probabilidade de que X acontece no
afetada pelo fato de Y acontecer ou no. Pode ser mostrado que isto implica:
P(X e Y) = P(X)P(Y)
Esta chamado a regra de multiplicao para eventos independentes.

Exemplo - 2 guardas de segurana e o seus aparelhos de controle


H dois guardas de segurana para um grande estabelecimento. Cada um carrega um
aparelho de controle ativado por detectores nos edifcios. O Guarda 1 consciencioso e
est atento ao aparelho 80% do tempo. O Guarda 2 no to confivel e s responde ao
aparelho 50% do tempo.
Se os guardas relatam independentemente qualquer alerta para a polcia ou o corpo de
bombeiros, qual a probabilidade de que pelo menos um informar um alerta?
Seja X o evento o Guarda 1 relata o alerta. P(X) = 0.8
Seja Y o evento o Guarda 2 relata o alerta. P(Y) = 0.5
So os eventos X e Y mutuamente exclusivos? - No, ambos podem informar.
X e Y so independentes? - Considere por hiptese que Sim.
P(no mnimo um Guarda informa)

69

= P(X ou Y)
= P(X) + P(Y) - P(X e Y)
Mas P(X e Y) = P(X) P(Y) (independentes)
= 0.8 x 0.5 = 0.4
assim P(X ou Y) = 0.8 + 0.5 - 0.4 = 0.9
Assim embora Y s fidedigno 50% do tempo, empreg-lo aumenta a probabilidade de
informar um alerta.
Diagramas de rvore so teis em clculos que envolvem vrias fases. Cada segmento na
rvore uma fase do problema e as probabilidades nos ramos a partir de cada ponto tem
que somar 1. A probabilidade de alcanar o fim de qualquer caminho completo o
produto das probabilidades escritas em seus ramos.

Exemplo - Meninos e meninas em uma famlia de 3 filhos


Modelo de rvore para meninos (B) e meninas (G) em uma famlia de tamanho 3.
(ver figura a seguir)

70

Figura 1

Cada caminho representa um resultado ( famlia de 3 filhos). H 8 resultados. Se voc


assume que estes so igualmente provveis ento a probabilidade de cada 1/8.
por exemplo P(BGB) = 1/8.
Outro modo de calcular isto assumir que para cada nascimento
P(B) = P(G) = 1/2.
Ento por exemplo P(BGB) = 1/2 x 1/2 x 1/2 = 1/8 = 0.125
i.e. assumindo que sexo independente dos nascimentos prvios e multiplicando
probabilidades ao longo dos ramos da rvore.
Modelos de rvore so teis para analisar qualquer processo "passo por passo".

Exemplo - Gnero em populaes humanas


Em populaes humanas aproximadamente 52% de nascimentos so meninos e 48% so
meninas. Assim um modelo mais realista usar

71

P(B) = 0.52 P(G) = 0.48

Figura 2 - modelo mais realista

por exemplo P(BGB) = 0.52 x 0.48 x 0.52 = 0.13


Um evento qualquer subconjunto de resultados.
Calcule probabilidades para os eventos seguintes que usam o " modelo realista ".
C: todas as crianas tm o mesmo sexo
D: menos de 2 meninos
E: C e D ==> todas meninas
F: C ou D ==> no 2 meninos

72

GGG GGG GGG

GGG

GGB

GGB

GGB

GGB

GBG

GGB

GGB

GGB

GBB

GBB

GBB

GBB

BGG

BGG

BGG

BGG

BGB

BGB

BGB

BGB

BBG

BBG

BBG

BBG

BBG

BBG

BBG

BBG

BBB

BBB

BBB

BBB

P(C) = P(GGG) + P(BBB) = 0.11 + 0.14 = 0.25


P(D) = 0.11 + 3 x 0.12 = 0.47
P(E) = P(C e D) = P(GGG) = 0.11
P(F) = P(C ou D) = 0.11 + 3 x 0.12 + 0.14 = 0.61
Os eventos C e D no so mutuamente exclusivos (disjuntos) porque o resultado GGG
est em ambos. C e D podem acontecer simultaneamente.
Ento P(C ou D) = P(F) no igual a P(C)+P(D), porque isto contaria o resultado comum
(GGG) duas vezes.
[compare isto com a regra de adio para probabilidades de eventos mutuamente
exclusivos].
Ao invs, use a regra mais geral para P(C ou D)

= 0.25 + 0.47 - 0.11


= 0.61 como requerido

73

Anexo 3 - Probabilidade Condicional


A probabilidade de um evento A pode ter que ser recalculada se ns sabemos com certeza
que outro evento B j aconteceu e A e B no so independentes.

Exemplo - Uma famlia de 3 crianas


Em uma famlia de 3 crianas suponha se sabe que h menos que 2 meninos. Qual a
probabilidade que todas as 3 crianas so do mesmo sexo?
Usando a anotao prvia
C: todas as crianas do mesmo sexo
D: menos que 2 meninos.
Ns queremos a probabilidade de C dado que D aconteceu. Usaremos notao P(C|D)
descrever isto.

' C'

' D'

GGG GGG
GGB GGB
Cada coluna lista todo os resultados.

GBG GBG

Aqueles que incluem o eventos

GBB GBB

C e D esto em negrito.

BGG BGG
BGB BGB
BBG BBG

BBB BBB

Como D aconteceu, s 4 resultados so agora possveis: GGG, GGB, GBG e BGG. As


sua probabilidades devem somar 1. Para obter estas probabilidades calculadas
previamente elas precisam ser "recalculadas" dividindo pelo seu total que era P(D) = 0.47.
A probabilidade de C, dado que D aconteceu, chamada de probabilidade condicional e
escrita como P(C|D). Lembre-se que a probabilidade de GGG era 0.11:

74

P(C / D ) =

P(C ou D) 0,11
=
= 0,23
P ( D)
0,47

Em geral para eventos X e Y a probabilidade condicional de X dado que Y aconteceu

P( X / Y ) =

P( X e Y)
P(Y)

P(X|Y) = P(X e Y)/P(Y) Isto pode ser rearranjado como:


P(X e Y) = P(X|Y)P(Y)
P(X e Y) = P(Y|X) P(X)

Exemplo - Gnero de empregados


A tabela abaixo mostra as probabilidades de homens (M) e mulheres (F) sendo
empregados (E) ou desempregados (U) em alguma populao (exclui aqueles que no
desejam ser empregado).

0.52

0.41

0.93

0.05

0.02

0.07

0.57

0.43

1.00

Ache
(a) P(E|M), a probabilidade condicional de emprego dado que a pessoa masculina
(b) P(M|E), a probabilidade condicional de ser masculino dado que a pessoa
empregada.
Respostas:

75

P( E / M ) =

P( E e M) 0,52
=
= 0,91
P(M)
0,57

Figure 3: Modelo de rvore que mostra probabilidades condicionais

por exemplo P(E) = P(E e M) + P(E e F)


= P(E|M)P(M) + P(E|F)P(F)
= 0.91 x 0.57 + 0.95 x 0.43 = 0.93

P ( M e E)
P( E )
P( E / M ) P( M )
=
P( E / M ) P( M ) + P( E / F ) P( F )
0,52
=
= 0,56
0,93
P( M / E ) =

Independncia Revisitada
A regra para a interseo de dois eventos
P(X e Y) = P(X)P(Y|X) = P(Y)P(X|Y)
Se P(X|Y) = P(X), ento diramos que X independente de Y que a probabilidade de X
ocorrer no afetada se Y acontece ou no. Substituindo isto na equao acima d P(X e
Y) = P(X) .P(Y), a regra para eventos independentes.

76

Anexo 4 Revisando os conceitos


Vimos at o momento alguns conceitos referentes Teoria das Probabilidades. Vamos
recordar alguns deles.

A definio clssica de probabilidade diz que a probabilidade de um evento calculada


como a razo existente entre o nmero de eventos favorveis a este particular evento e o
numero de eventos possveis e equiprovveis. Nesta definio temos que contar com uma
situao em que podemos desdobrar o evento (aquele para o qual queremos calcular a sua
probabilidade) em diversos sub-eventos. Por exemplo, queremos calcular a probabilidade
de que saia um numero par em uma jogada de um dado. Temos 3 sub-eventos favorveis
ao resultado (evento) par: 2, 4 e 6 e temos 6 eventos possveis e equiprovveis: 1,2,3,4,5,
e 6. Neste caso a probabilidade do evento par :

Pr ob( E ) =

3
numero de eventos favoraveis a E
= = 0,5
numero de eventos possiveis e equiprovaveis 6

Se quisssemos calcular a probabilidade de ocorrncia de 2 nmeros pares na jogada


(simultnea ou no) de dois dados, o numero de eventos favorveis ao evento E = {saem
dois pares} 3: os eventos (2,2), (4,4) e (6,6). E temos neste casos 36 eventos possveis e
equiprovveis, pois na jogada de 2 dados podemos ter 36 combinaes possveis dentro
de dois conjuntos de 1 a 6, ou seja 6 vezes 6 = 36 combinaes. O espao amostral de
um experimento aleatrio definido como o conjunto de todos os possveis resultados
deste experimento. No experimento de jogar apenas um dado o especo amostral S =
{1,2,3,4,5,6} e no experimento de jogar dois dados o espao amostral S =
{(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3)........(6,6)}.
A probabilidade de sair dois nmeros pares no lanamento de dois dados , portanto:

77

Prob(E)=

numero de eventos favoraveis a E


9 1
= = =0,25=25%
numero de eventos possiveis e equiprovaveis 36 4

Nos dois exemplos anteriores de lanamentos de dados no precisamos realizar os


experimentos para calcular as probabilidades. Estas foram calculadas de uma forma a
priori e para isto s precisamos definir os eventos e fazer algumas contagens, tomandose o cuidado de enumerar completamente o espao amostral, sem esquecer nenhum
evento. Outro cuidado que devemos tomar que o espao amostral seja definido em
termos de eventos possveis e equiprovveis, ou seja, todos os eventos que esto no
espao amostral devem ser equiprovveis. Muitas vezes um espao amostral pode ser
definido em termos de uma relao de eventos no equiprovveis. Por exemplo,
realizamos o experimento de uma famlia com duas crianas e contamos o numero de
meninas. O espao amostral pode ser definido neste caso de duas formas. A primeira S1
= {0 meninas, 1 menina, 2 meninas} e a segunda S2 = {(menino,menino),
(menino,menina),(menina,menina),(menina,menino). Observe que no segundo espao
amostral todos os eventos tem a mesma probabilidade que igual a (supondo-se que a
probabilidade de nascer um menino igual a probabilidade de nascer uma menina).
Se a probabilidade de nascer um menino igual a probabilidade de nascer uma menina
so iguais, ambas so iguais a . Agora, para nascer duas meninas em dois nascimentos
seguidos (e supondo-se que os resultados destes nascimentos so independentes, um
conceito que iremos definir mais precisamente mais adiante) a probabilidade deve ser
vezes = . O mesmo podemos dizer para qualquer um dos eventos do espao amostral
S2, todos tendo probabilidade igual a . Desta forma podemos dizer que os eventos do
espao amostral S2 so equiprovveis. No podemos dizer o mesmo a respeito do espao
amostral S1, pois, por exemplo, a probabilidade do evento {0 meninas} igual a , mas a
probabilidade do evento {1 menina} igual a . O espao amostral S1 no , portanto,
definido em termos de eventos equiprovveis.

Na segunda definio de probabilidade consideramos que a mesma tambm uma frao,


mas neste caso realizamos o experimento para calcular esta probabilidade. Por exemplo,

78

se desejarmos calcular a probabilidade de sair um nmero par em um lanamento de um


dado, lanamos este dado um numero bastante grande de vezes e contamos quantas vezes
saiu resultado par. medida que o numero de repeties do experimento vai se tornando
maior o resultado da diviso entre o numero de resultados favorveis ao evento (o dado
saiu par) e o numero de lanamentos (numero repeties do experimento) vai se
aproximando da probabilidade terica . Podemos enunciar esta definio de forma
rigorosa atravs da seguinte relao:

Pr ob( E ) = lim
n

f (E)
= lim f R ( E )
n
n

onde f(E) a freqncia de ocorrncias do evento E (o numero de vezes em que o evento


E ocorre em n repeties do experimento) e n o numero de repeties do experimento.
fr(E) a freqncia relativa do evento E, ou seja, a proporo de vezes em que o evento E
ocorre (em relao ao numero de repeties do experimento). A definio diz a
probabilidade de um evento E o limite, quanto n tende ao infinito, da razo entre a
freqncia de ocorrncia do evento E e o numero de realizaes do experimento.

medida que o numero de repeties do experimento vai se tornando maior a razo

f ( E ) / n vai se aproximando tendencialmente do verdadeiro valor (obtido atravs da


primeira definio) da probabilidade.
Podemos ver, portanto que probabilidade pode ser calculada de duas formas, uma forma
terica e uma forma emprica. Na primeira no precisamos realizar o experimento
para calcul-la. Na segunda, aguardamos o resultado da realizao do experimento com
uma repetio considervel de vezes para calcular a probabilidade. Qual deve ser o
numero de repeties necessrio para chegarmos a um valor bem aproximado da
probabilidade? Esta uma questo que no tem uma resposta terica. Apenas podemos
dizer que quanto maior o numero de repeties do experimento mais tendemos a nos
aproximar do valor terico obtido pela primeira definio. Pode ser que a verdadeira
probabilidade de um evento seja, digamos, 0,2 e ao repetirmos o experimento 1000 vezes
tenhamos como resultado 0,21 e ao repetirmos o experimento 10000 vezes tenhamos

79

0,18. Isto no quer dizer que na tendncia no estejamos nos aproximando do verdadeiro
valor. Tal situao muito difcil de ocorrer.

Axiomas da Teoria das Probabilidades


1) 0 P ( E ) 1
2) P(S)=1
3) P( ) = 0
4) P( A) = 1 P( A )

Regras da Teoria das Probabilidades


1) P( A B) = P( A) + P( B ) P ( A B )
Uma ampliao desta regra para 3 eventos :

P( A B C ) = P ( A) + P ( B) + P(C ) P( A B ) P ( A C ) P( B C )
+ P( A B C )
2) P( A B ) = P ( A) P ( B A) = P ( B ) P ( A B)
Onde P( B A) a probabilidade do evento B condicionada a ocorrncia do evento A. Por
exemplo, queremos calcular a probabilidade de que um aluno tire nota maior do que 7 se
ele estudar. O evento A neste caso A = {o aluno tira nota maior do que 7} e o evento B
B={o aluno estuda}. Temos neste exemplo um tpico caso de eventos dependentes, pois
certamente a ocorrncia de A ira depender da ocorrncia de B. A probabilidade do evento
A depende da ocorrncia (ou no ocorrncia) do evento B. De forma corriqueira, a
probabilidade do evento A (o aluno tirar nota maior do que 7) ter um valor caso ocorra o
evento B (o aluno estuda) e ter outro valor caso no ocorra B (o aluno no estuda). Se os
dois eventos A e B so independentes a probabilidade do evento A no depende da
ocorrncia do evento B, e vice versa, a probabilidade do evento B no depende da

80

ocorrncia do evento A. No conhecido exemplo do efeito borboleta suponhamos que


uma borboleta bata asas no corao do Estado de Minas Gerais e ocorra um terremoto em
Tquio. Certamente estes dois eventos so independentes e sua ocorrncia depende
unicamente da vontade divina.
Se quisermos calcular a probabilidade da ocorrncia simultnea de dois eventos
independentes basta multiplicar as probabilidades dos dois eventos individuais. Por
exemplo, suponhamos que um avio tem 4 motores e desejamos calcular a probabilidade
de que ocorra uma falha simultnea em todos os motores. Se supusermos que a ocorrncia
de falhas nos quatro motores so eventos independentes, podemos dizer que a ocorrncia
de falha simultnea nos 4 ser igual ao produto de suas probabilidades individuais (que
neste caso iremos supor que so todas as mesmas). Se a probabilidade de qualquer um
dos 4 motores falhar igual a 0,001, a probabilidade dos quatro motores falharem
simultaneamente ser 0,0014 = (10-3)4 = 10-12.

A suposio de independncia entre dois eventos uma hiptese bastante forte. Muitas
vezes podemos estar lidando com uma quase independncia, mas que no na pratica
independncia. No exemplo anterior, bastaria que a mesma equipe de mecnicos
realizasse a manuteno dos 4 motores para que no houvesse uma independncia perfeita
entre os 4 eventos.

Vimos anteriormente que pode ocorrer que dois eventos A e B no tenham interseco,
ou seja, A B = . Neste caso, dizemos que os dois eventos A e B so eventos
mutuamente exclusivos ou eventos disjuntos. Uma confuso freqente em teoria das
probabilidades assumir que dois eventos mutuamente exclusivos so necessariamente
independentes. Independncia de dois eventos no implica necessariamente a condio de
serem mutuamente exclusivos. E vice-versa, a condio de dois eventos serem
mutuamente exclusivos no implica necessariamente os mesmos eventos serem
independentes. Se dois eventos A e B so mutuamente exclusivos ento podemos dizer
que P( A B) = P() = 0 . Mas no podemos dizer que P( A B) = P( A) P ( B ) .
Seria assim se pelo menos uma das probabilidades dos dois eventos fossem nulas, ou seja,

81

P(A)=P(B)=0. Certamente existe um nico caso em que os dois eventos A e B so iguais


ao conjunto vazio e assim P( A B) = P( A) P ( B ) .
Podemos dizer tambm que existem muitos casos de eventos independentes para os quais

A B , ou seja, estes eventos tm uma interseco no vazia. O exemplo da


borboleta e do terremoto um caso tpico. Os dois eventos podem ocorrer
simultaneamente e tambm so independentes. Mas tambm podemos dizer que existem
eventos mutuamente exclusivos e que so tambm independentes. Neste caso a
probabilidade da ocorrncia simultnea dos dois eventos ser nula, pois sua interseco
o

conjunto

vazio.

se

so

tambm

independentes

necessariamente

P( A B) = P( A) P ( B ) e para que isto ocorra pelo menos um dos dois eventos (ou
ambos) tem probabilidade nula.
De fato, a nica maneira que dois eventos podem ser ambos mutuamente exclusivos e
independentes se no mnimo um deles tem probabilidade igual zero. Se A e B so
mutuamente exclusivos, sabendo-se que B ocorreu podemos dizer que A no ocorreu. Isto
bastante claro: a probabilidade condicional de A dado B zero! Isto muda a
probabilidade (condicional) de A a no ser que sua probabilidade (no condicional) seja
zero. Podemos concluir esta distino entre eventos mutuamente exclusivos e eventos
independentes com duas afirmativas:
1) Se dois eventos so mutuamente exclusivos, eles no podem ocorrer na mesma
tentativa: a probabilidade de sua interseco zero. A probabilidade de sua unio a
soma de suas probabilidades.
2) Se dois eventos so independentes, ambos podem ocorrer na mesma tentativa (exceto
possivelmente, se no mnimo um deles tem probabilidade zero). A probabilidade de sua
interseco o produto de suas probabilidades. A probabilidade de sua unio menos que
a soma de suas probabilidades, a menos que no mnimo um dos eventos tenha
probabilidade igual zero.

82

Um ultimo ponto sobre a interpretao de uma probabilidade condicional. Quando


dizemos P( A B ) estamos nos referindo a probabilidade de ocorrer o evento A sabendose que ocorreu o evento B. Se A e B so eventos mutuamente exclusivos evidente que

P( A B ) = 0, pois A e B no podem ocorrer simultaneamente. A probabilidade


condicional pode ser interpretada como uma probabilidade calculada em um espao
amostral restrito. Quando dizemos P( A B ) o espao amostral passa a ser B
(anteriormente quando dizamos simplesmente P ( A) , ou seja, uma probabilidade no
condicional, o especo amostral para o calculo desta probabilidade era S, o espao
amostral original do experimento que estamos considerando). Vamos supor um exemplo
numrico em que S = {1,2,3,4,5,6,7,8,9,10}, A = {3,4,5,6} B = {5,6,7,8}. Suponhamos
que todos os algarismos de S possam ser selecionados com a mesma probabilidade de
1/10. Portanto neste caso P(A) = 4/10, P(B) = 4/10, A B = {5,6}, P( A B ) =2/10.
Pela regra do produto P( A B ) =

P( A B ) 2 /10
=
= 1/ 2
4 /10
P( B )

Mas podemos interpretar a coisa da seguinte forma: quando calculamos P( A B ) o novo


espao amostral passa a ser B. Se aplicarmos a definio clssica de probabilidade temos
que:

P( A B ) =

numero de eventos favoraveis a A e que pertecem tambem a B 2


= = 1/ 2
numero de eventos possiveis e equiprovaveis de B
4

J P ( A) , a probabilidade de A no condicional calculada como:

P( A B ) =

numero de eventos favoraveis a A


4
=
numero de eventos possiveis e equiprovaveis de S 10

Se dois eventos A e B so independentes ento P( A B ) = P ( A) , P( B A) = P ( B) e

P( A B ) = P( A).P ( B)

83

Podemos generalizar isto dizendo que se k eventos Ai , i =1,2,..k so todos independentes


entre si, ento:

P( A1 A2 ... Ak ) = P( A1 ).P ( A2 )....P ( Ak )


Se os eventos no fossem independentes a probabilidade simultnea de todos os k eventos
seria:

P( A1 A2 ... Ak ) = P ( A1 ).P( A2 A1 ).P( A3 A1 A2 )...P ( Ak A1 A2 ... Ak 1 )


Soluo de Exerccios de Probabilidade

1) Durante o ms de agosto a probabilidade de chuva em um dia determinado de 4/10.


O Fluminense ganha um jogo em um dia com chuva com probabilidade de 6/10 e em
um dia sem chuva com probabilidade de 4/10. Sabendo-se que o Fluminense ganhou
um jogo naquele dia de agosto, qual a probabilidade de que choveu neste dia?

Enumeramos os seguintes passos metodolgicos para a soluo de um problema de


probabilidades:

a) Enunciar o experimento aleatrio que est sendo tratado.


b) Definir o espao amostral referente ao experimento aleatrio.
c) Definir os eventos relevantes do problema e apresentar os dados do problema e as
perguntas em termos de expresses de probabilidades
d) Aplicar as regras e princpios da Teoria das Probabilidades

No caso deste exerccio, o experimento aleatrio refere-se a jogos de futebol com um


determinado time observando-se as condies de tempo (se chove ou no) e qual o
resultado observado do jogo. O espao amostral deste experimento pode ser definido
como segue:

S = {F C , F C , F C , F C }
84

onde os eventos relevantes do problema so:


F = {o Fluminense ganha o jogo}
C = {chove no dia do jogo}
Os dados deste problema (apresentados no enunciado) so:

P(C ) = 0,4
P(F/C)=0,6
P(F/C)=0,4
E a pergunta feita no enunciado do problema :

P(C / F ) = ?
Faamos um Diagrama de Venn para auxiliar na compreenso do problema:

Podemos ver que a figura oval corresponde ao evento F e a parte desta figura que est a
esquerda do trao vertical (que divide o evento C e C ) representa o evento C F , ou
seja o conjunto de resultados do espao amostral em que o Fluminense ganha o jogo em
um dia de chuva. A direita do trao vertical, temos a parcela da superfcie oval que
corresponde ao evento C F , ou seja, o conjunto de resultados em que o Fluminense
ganha o jogo em dias que no chove. Observe que devemos fazer uma importante

85

distino entre dois eventos diferentes: F C e F / C . No primeiro caso temos o


evento que corresponde a ocorrncia simultnea dos eventos F e C. No segundo caso
temos um evento a ocorrncia do evento F condicionado a ocorrncia do evento C.
Podemos perguntar qual a probabilidade de que o Fluminense ganhe em um dia de
chuva. Neste caso queremos saber P( F C ) . Outra coisa perguntarmos qual a
probabilidade de que o Fluminense ganhe caso ocorra um dia de chuva. Neste caso,
estamos perguntado o valor de P( F / C ) . A diferena bastante sutil, mas ela mostra a
distino entre uma probabilidade de um evento simultneo e a probabilidade de um
evento condicional.
Podemos perguntar, por exemplo, qual a probabilidade de que o pneu do meu carro fure
se ele novo (neste caso a probabilidade de um evento conjunto ou simultneo) e qual
a probabilidade de que ele fure sabendo-se que ele novo (neste caso temos a
probabilidade de um evento condicional).
Continuemos o exemplo do jogo de futebol. O que significa a expresso P(C ) = 0,4 ?
Significa que de cada cem partidas que o Fluminense joga aproximadamente em 40
chovem. O que significa a expresso P(F/C)=0,6 ? Significa que de cada 100 partidas
em que o Fluminense joga com chuva, em 60 destas partidas chuvosas ele ganha. O que
significa a expresso P(F/C)=0,4 . Significa que em 100 partidas que o Fluminense joga
em dias no chuvosos, em aproximadamente 40 ele ganha. Agora, se quisermos calcular

P( F C ) , procedemos da seguinte forma. Aplicando a regra do produto temos que:


P( F C ) = P (C ).P ( F / C ) = 0, 4 0,6 = 0, 24
O que significa esta ultima expresso? Significa que em cada cem partidas que o
Fluminense joga (incluindo-se nestas 100 partidas dias chuvosos e no chuvosos) em
aproximadamente 24 partidas o Fluminense ganha em dias chuvosos. Repare que esta
probabilidade bem distinta de P(F/C)=0,6 , pois aqui estamos afirmando que em cada
100 partidas que o Flu joga em dias chuvosos (estamos condicionando a este tipo de dia)
em aproximadamente 60 destas partidas o time ganha.

86

Continuemos a soluo do problema. Reparem que a metade esquerda do ovo mais a


metade direita formam o evento F (o Flu ganha o jogo). Isto pode ser dito assim:

F = (F C) (F C )
Esta expresso diz que o evento {o Flu ganha} formado pela unio de dois eventos: o
Flu ganha em dia com chuva e o Flu ganha em dia sem chuva. Observem pelo Diagrama
de Venn que estes dois eventos so disjuntos, ou seja, eles tem interseco igual ao
conjunto vazio. Isto ocorre porque ou o Flu ganha em um dia chuvoso ou ele ganha em
um dia no chuvoso e no existe meio-termo. Se dois eventos so iguais as suas
probabilidades tambm sero iguais. Ento podemos dizer que:

P( F ) = P (( F C ) ( F C ))
Sabemos que a probabilidade do conjunto unio de dois eventos disjuntos a soma das
probabilidades de cada um dos eventos unidos. Ento:

P( F ) = P ( F C ) + P ( F C )
Vamos aplicar o teorema do produto aos dois termos do lado direito da expresso acima.

P( F ) = P (C ).P ( F / C ) + P (C ).P ( F / C )
Todas as probabilidades do lado direito da expresso acima so dados do problema.

P( F ) = 0, 4 0,6 + 0,6 0, 4 = 0, 48
Ento temos aqui que de cada 100 partidas (no importando se chove ou no, pois neste
caso estamos lidando com uma probabilidade no condicional) em aproximadamente 48 o
Flu ganha.

87

Agora, estamos em condio de dar uma resposta a pergunta do problema. Pelo teorema
do produto, sabemos que:

P ( F C ) = P ( F ) P (C / F )
Portanto, manipulando os termos desta equao, temos que:

P (C / F ) =

P ( F C ) 0,24
=
= 0,50
P( F )
0,48

que a resposta do problema. Um dos segredos para um bom entendimento da Teoria das
Probabilidades no nos contentarmos simplesmente com a soluo de um problema,
mas continuarmos a esmiuar o seu resultado tentando melhor compreende-lo e
interpretar o que conseguimos alcanar. Descobrimos que P(C / F ) = 0,50 o que
significa que de cada 100 partidas e que o Flu ganha o jogo, em aproximadamente 50
destas partidas chove. Isto bem diferente de dizer que P( F / C ) = 0,6 , pois aqui
estamos afirmando que em 100 partidas em dia chuvosos o Flu ganha em
aproximadamente 60 partidas. Poderamos tambm no satisfeitos com a simples soluo
do problema, perguntarmos qual o valor de P(C / F ) , P(C / F ) e P(C F ) .
Observe que C / F e C / F so dois eventos complementares. Quando consideramos um
evento C condicionado a um evento F estamos considerando que C ocorreu se F ocorreu.
O espao amostral aqui deixa de ser S (o espao amostral original do problema) e passa a
ser F. Agora estamos apenas considerando os jogos em que o Fluminense ganha (e nos
abstraindo retirando fora dos jogos em ele perde). Ento, quando estamos dizendo

C / F e C / F estamos nos referindo a duas possibilidades que perfazem todos os


resultados em que o Flu ganha. Em uma parte destas possibilidades (eventos) o jogo em
dia de chuva e em outra parte em dia sem chuva. Vimos pela soluo do problema que o
Flu ganha em 48 % dos jogos. Destes 48 jogos em 100, uma parte deles ocorre em dias de
chuva e outra parte ocorre em dias sem chuva. Ento quando dizemos C / F estamos nos
referindo aos eventos que so parte das 48 partidas que o Flu ganha e nas quais ocorre

88

chuva. A outra parcela corresponde aos dias no chuvosos em que o Flu ganha o jogo.
Desta forma podemos compreender que estes dois eventos so complementares, ou seja,

(C / F ) (C / F ) = F . Quando dois eventos unidos perfazem a totalidade do espao


amostral dizemos que eles so complementares em relao a este espao amostral. Da
mesma forma podemos dizer que F e F so complementares em relao ao espao
amostral S como tambm o so C e C . J que C / F e C / F so complementares, temos
que:

P(C / F ) = 1 P(C / F ) = 1 0,50 = 0,50


Observando o Diagrama de Venn podemos dizer que:

C = (F C ) (F C )
Em linguagem corriqueira, a expresso acima diz que as partidas que o Flu joga em dias
no chuvosos so constitudas por dois grupos: o grupo das partidas em dias no
chuvosos em que ele ganha e o grupo das partidas em dias no chuvosos em que ele
perde. Fazendo o mesmo procedimento j utilizado de tomar probabilidades de ambos os
termos da equao, temos:

P(C ) = P (( F C ) ( F C ))
Aplicando a regra da soma das probabilidades, temos:

P (C ) = P ( F C ) + P ( F C )
Aplicando agora a regra do produto aos dois termos do membro direito da equao acima,
temos:

89

P(C ) = P ( F ).P (C / F ) + P ( F C )
ou P ( F C ) = P (C ) P ( F ).P (C / F ) = 0,60 0, 48 0,50 = 0,36

Novamente, pelo teorema do produto temos que:

P (C / F ) =

P (C F ) 0,36
=
= 0,6923
P( F )
0,52

Ou seja, em aproximadamente 70 % dos jogos em que o Flu perde ocorre de no chover.

Ento temos a seguinte contabilidade final para o problema. De cada 1000 partidas em
que o Flu joga, em 400 chove e em 600 no chove, pois P (C ) = 0,4 . Em 480 o Flu
ganha e em 520 ele perde, pois P ( F ) = 0, 48 . Das 400 partidas chuvosas, em 400x0,6 =
240 partidas o Flu ganha, pois P ( F / C ) = 0,6 e das 600 partidas no chuvosas, em
600x0,4=240 partidas ele ganha pois P ( F / C ) = 0,6 . Das 480 partidas em que o Flu
ganha em 240 chove, pois P (C / F ) = 0,5 . Ento temos o seguinte esquema:

240

160

400

240

360

600

480

520

1000

Veja no quadro acima que todas as probabilidades discutidas e resolvidas no problema


esto representadas. Por exemplo, a probabilidade do Flu ganhar est representada pelos
480 em 1000, ou seja, 0,48. A probabilidade condicional do Flu ganhar em um dia
chuvoso est representada pelas 240 partidas que o Flu ganha em dias chuvosos em um
total de 400 dias chuvosos (primeira clula a esquerda da tabela) o que d 240 / 400 = 0,6

90

que P(F/C), um dado do problema. Podemos ver tambm que P (C F ) = 0,36 pois o
cruzamento da linha C e F representam 360 partidas em que ocorre simultaneamente do
Flu ganhar e chover ao mesmo tempo em um total de 1000 partidas jogadas pelo Flu. Em
resumo, na tabela acima as probabilidades dos eventos conjuntos (interseco de dois
eventos) podem ser calculadas como a diviso das clulas correspondentes e o total geral
de partidas jogadas pelo Flu (1000) e as probabilidades condicionais podem ser vistas
pela diviso de cada clula e o total das linhas ou colunas. Por exemplo, se quisermos ver
quanto P (C / F ) basta vermos a diviso do elemento linha C com a coluna F que
360 com o total da coluna F que 520 o que d 0,6923. Finalmente as probabilidades
no condicionais so obtidas atravs da diviso entre os totais das linhas ou colunas pelo
total geral (1000). Por exemplo, se quisermos calcular a probabilidade de no chover
basta dividirmos o total da linha C por 1000 o que d 0,6.
2) Num exame h 3 respostas para cada pergunta e apenas uma delas certa. Portanto,
para cada pergunta, um aluno tem probabilidade de 1/3 de escolher a resposta certa se ele
est adivinhando e 1 se sabe a resposta. Um estudante sabe 30 % das respostas do exame.
Se ele deu a resposta correta para uma das perguntas, qual a probabilidade de que a
adivinhou?

No caso deste problema qual o experimento? O experimento pode ser enunciado da


seguinte forma: Um aluno vai responder as perguntas de um exame de trs respostas
para cada pergunta sendo apenas uma certa e ele pode tentar adivinhar ou ele sabe
com inteira confiana a resposta certa para cada pergunta. Este experimento tem muitos
resultados para cada uma de suas realizaes. Vamos enumerar estes resultados:
S={ V A , V A , A }

Onde:
V = {o estudante acerta a questo}
A = {o estudante tenta adivinhar a questo}

91

Observem que quando ocorre o evento A , ou seja, o estudante sabe com segurana a
resposta certa da pergunta no existe nenhuma possibilidade dele errar. Isto quer dizer
que A V = . Por isso, no espao amostral acima somente colocamos A e no
desmembramos este evento como fizemos com o evento A. Vejamos agora a coisa em
termos de uma representao espacial atravs do Diagrama de Venn:

A V
A

A V
S

Quais so os dados do problema? Se em cada questo do exame h apenas uma resposta


certa em cada trs afirmativas, ento P (V / A) = 1/ 3 . Se o estudante sabe 30 % das
respostas do exame, ento P ( A) = 0,30 . E se existe certeza absoluta quando ele sabe a
resposta podemos dizer que P (V / A) = 1 . A pergunta do problema : P ( A / V ) = ? .

Tentando resolver este problema de forma intuitiva, isto , sem apelar para nossos
conhecimentos de Teoria das Probabilidades (sem aplicar as regras, teoremas e princpios
discutidos em sala de aula) podemos perceber que de 100 questes do exame, supondo-se
que seja um super-exame, 70 questes o aluno tenta adivinhar e 30 questes ele sabe. Das
70 questes que ele tenta adivinhar 1/3 que 23,33 ele acerta e 70 23.33 = 46.67 ele

92

erra. Portanto, no total ele acerta 30 + 23.33 = 53.33 questes e erra 46.67 questes. Se eu
quero saber quanto P ( A / V ) basta saber quantas respostas adivinhadas corresponde
em percentagem do total que ele acerta. Do total que ele acerta (53.33) em 23.33 ele
tentou (com final feliz) adivinhar. Portanto, P ( A / V ) =

23.33
= 0,4375 = 43,75% .
53.33

Mas o professor de estatstica um esprito de porco engarrafado e no dar o gostinho


ao aluno para que ele exercite a sua poderosa intuio e vai exigir que ele resolva
formalmente o problema.

Sabemos pelo teorema do produto que P ( A / V ) =

P( A V )
. Sabemos tambm, ao
P (V )

observar o diagrama de Venn acima que V = ( A V ) A . E que portanto,

P(V ) = P( A V ) + P ( A)
Aplicando novamente o Teorema do Produto para a expresso acima, temos que:

P(V ) = P ( A) P (V / A) + P ( A) = 0,70 1/ 3 + 0,30 = 0,5333

Portanto P ( A / V ) =

P( A V ) 0,70 1/ 3
=
= 0, 4375
0,5333
P(V )

No satisfeitos novamente com a simples soluo do problema (porque somos insaciveis


estudantes de Estatstica) vamos tentar responder a outras probabilidades de eventos e
interpretar mais profundamente tudo que fizemos. Qual a probabilidade do aluno saber
a questo dado que ele acertou, ou seja, P ( A / V ) ?

E qual a probabilidade de

ocorrerem simultaneamente os eventos A e V? E os eventos A e V ? Como poderamos


interpretar estas duas probabilidades e como poderamos distingui-las de probabilidades
condicionais semelhantes a elas? Como poderamos construir uma tabela semelhante ao
93

exerccio anterior em que fosse mais fcil, visualizar as diversas probabilidades de


eventos conjuntos, de eventos condicionais e eventos no condicionais? Deixo ao aluno
criativo e amante da Estatstica a resposta a estas questes que discutiremos em sala de
aula. Talvez esta cincia no tenha a forma concreta de um objeto comum de amor, mas
dada a sua coerncia e lgica ela atrai muito aqueles que sempre procuram verdade.
Scrates, Plato e muitos outros pensadores que no tiveram a oportunidade de virem
tudo isto, talvez hoje estejam no seu Hades observando com imenso prazer as nossas
belas tentativas.

2) Um simples mssil de certa variedade tem uma probabilidade de de derrubar um


bombardeiro, uma probabilidade de de danific-lo e uma probabilidade de de
err-lo. Alm disso, dois tiros danificadores derrubaro o avio. Se quatro destes
msseis so lanados, qual a probabilidade de derrubar um avio?

Podemos definir diversas seqncias de quatro lanamentos. Se chamarmos o evento D =


{o mssil derruba o bombardeiro}, o evento B = {o mssel danifica o bombardeiro} e o
evento E = {o missel erra o bombardeiro} teoricamente temos 34 seqncias de 4 tiros,
ou, seja 81 seqncias. As seqncias que tiverem dois ou mais tiros danificadores ou
apenas um tiro que derruba o avio so consideradas os eventos favorveis a derrubar o
avio.

94

D1
B1

D2
D3

B2
E2

B3

D4

E3

B4
E4

D2

D3

E1
B2

B3
E3

D4
B4
E4

E2

D3
B3

D4
B4

E3

E4

Ento, para este experimento temos o seguinte espao amostral:


S = {D1, B1D2, B1B2, B1E2D3, B1E2B3, B1E2E3D4, B1E2E3B4,
B1E2E3E4,E1D2,E1B2D3,E1B2B3,E1B2E3D4,E1B2E3B4,E1B2E3E4,E1E2D3,
E1E2B3D4,E1E2B3B4,E1E2B3E4,E1E2E3D4,E1E2E3B4,E1E2E3E4}

Com exceo das seqncias B1E2E3E4, E1B2E3E4, E1E2B3E4, E1E2E3B4 e E1E2E3E4, todas
as demais derrubam o avio. Portanto, utilizando o evento complementar e considerando
os resultados de cada tiro independentes, temos:
P(derrubar) = 1
(1/4x1/2x1/2x1/2+1/2x1/4x1/2x1/2+1/2x1/2x1/4x1/2+1/2x1/2x1/2x1/4+1/2x1/2x1/2x1/2
) = .....

95

Resumo do Clculo de Probabilidades

96

Exerccios de Probabilidade

3) Trs moedas so jogadas simultaneamente. Qual a probabilidade de obter 2 caras?


Qual a probabilidade de obter pelo menos 2 caras?
4) Dois dados so jogados simultaneamente. Calcular a probabilidade de que a soma dos
nmeros mostrados nas faces de cima seja 7.
5) Dois dados so jogados simultaneamente. Calcular a probabilidade de que o mximo
seja maior ou igual a 3.
6) Para a Copa do Mundo 24 pases so divididos em seis grupos, com 4 pases cada um.
Supondo que a escolha do grupo de cada pas feita ao acaso, calcular a
probabilidade de que dois pases determinados A e B se encontrem no mesmo grupo. (
Na realidade a escolha no feita de forma completamente aleatria).
7) Uma loteria tem N nmeros e s um prmio. Um jogador compra n bilhetes em uma
extrao. Outro compra s um bilhete em n extraes diferentes. ( Ambos os
jogadores apostam portanto a mesma importncia). Qual deles tem maior
probabilidade de ganhar o prmio?
8) Seis bolas so colocadas em trs urnas diferentes. Qual a probabilidade de que todas
as urnas estejam ocupadas?
9) Um nmero entre 1 e 300 escolhido aleatoriamente. Calcular a probabilidade de que
ele seja divisvel por 3 ou por 5.
10) Um torneio disputado por 4 times A,B, C e D. 3 vezes mais provvel que A vena
do que B, duas vezes mais provvel que B vena do que C e 3 vezes mais provvel
que C vena do que D. Quais as probabilidades de ganhar para cada um dos times?
11) Uma caixa contem 20 peas em boas condies e 15 em ms condies. Uma amostra
de 10 peas extrada. Calcular a probabilidade de que ao menos uma pea na
amostra seja defeituosa.
12) Uma cidade tem 30 000 habitantes e trs jornais A, B e C. Uma pesquisa de opinio
revela que:
12 000 lem A;
8 000 lem B;
7 000 lem A e B;
6 000 lem C;
4 500 lem A e C;

97

1 000 lem B e C;
500 lem A,B e C.
Qual a probabilidade de que um habitante leia:
a)Pelo menos um jornal;
b)S um jornal.
13) Os algarismos 1,2,3,4,5 so escritos em 5 cartes diferentes. Estes cartes so
escolhidos (sem reposio) aleatoriamente e os algarismos que vo aparecendo so
escritos da esquerda para a direita, formando um nmero de 5 algarismos.
a)calcular a probabilidade de que o nmero escrito seja par
b)Se a escolha fosse com reposio qual seria a probabilidade?
14) Colocam-se aleatoriamente b bolas em b urnas. Calcular a probabilidade de que
exatamente uma urna seja deixada desocupada.
15) Dez pessoas so separadas em dois grupos de 5 pessoas cada um. Qual a
probabilidade de que duas pessoas determinadas A e B faam parte do mesmo grupo?
16) 5 homens e 5 mulheres compram 10 cadeiras consecutivas na mesma fila de um
teatro. Supondo que se sentaram aleatoriamente nas 10 cadeiras, calcular:
a)a probabilidade de que homens e mulheres se sentem em cadeiras alternadas;
b)A probabilidade de que as mulheres se sentem juntas.
17) Um nmero entre 1 e 200 escolhido aleatoriamente. Calcular a probabilidade de
que seja divisvel por 5 ou por 7.
18) Uma moeda foi cunhada de tal forma que 4 vezes mais provvel de dar cara do que
coroa. Calcular as probabilidades de cara e coroa.
19) Aos nmeros inteiros entre 1 e n so designadas probabilidades proporcionais aos
seus valores. Calcular P(i) para 1 i n
20) Trs dados so jogados simultaneamente. Calcular a probabilidade de obter 12 como
a soma dos resultados.
21) Sejam A e B eventos tais que

98

1
1
1
P ( A) = , P(B) = e P(A B) =
2
4
5
Calcular :
a) P ( A B )
b) P(A)
c) P( B)
d) P(A B)
e) P(A B)
f) P(A B)
g) P(A B)
22) No jogo da Sena so sorteadas 6 dezenas distintas entre as dezenas 01 02 - ...- 50. O
apostador escolhe 6 dessas 50 dezenas e premiado se so sorteadas 4 (quadra), 5
(quina), 6 (Sena Principal) das dezenas por ele escolhidas ou se as dezenas sorteadas
so escolhidas aumentadas (Sena Anterior) ou diminudas (Sena Posterior) de uma
unidade (50 +1 = 01, 01 1 = 50). Determine a probabilidade de uma apostador fazer:
a)
b)
c)
d)

uma quadra
uma quina
a Sena Principal
A Sena Anterior ou a Posterior.

23) No jogo da Loto so sorteadas 5 dezenas distintas entre as dezenas 01 02 - ...- 99 00. O apostador escolhe 6,7,8,9 ou 10 dezenas e premiado se so sorteadas 3 (terno),
4 (quadra) ou 5 (quina) das dezenas escolhidas. Determine a probabilidade de uma
apostador que escolheu 10 dezenas fazer:
a) um terno
b) uma quadra
c) a quina
24) Na Loteria Esportiva h 13 jogos e o apostador deve indicar em cada um deles a
vitria do time 1, a vitria do time 2 ou o empate. Um jogador premiado:
a) com 10 pontos, se acerta os resultados dos 10 primeiros jogos e erra os dos 3 ltimos;
b) com 11 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas um dos
resultados dos 3 ltimos;
c) com 12 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas 2 dos
resultados dos 3 ltimos;

99

d) com 13 pontos, se acerta os resultados dos 13 jogos.


Supondo que em cada jogo os resultados possveis tenham probabilidades iguais,
determine a probabilidade de um apostador ser premiado:
a)
b)
c)
d)

com 10 pontos;
com 11 pontos;
com 12 pontos;
com 13 pontos.

25) Escolhem-se ao acaso duas peas de um domin. Qual a probabilidade delas


possurem um nmero comum?
26) Em um armrio h n pares de sapatos. Retiram-se ao acaso p pares de sapatos desse
armrio. Qual a probabilidade de haver entre esses ps exatamente k pares de sapatos?
27) Colocam-se ao acaso n botes em um tabuleiro n x n, no sendo permitido haver dois
botes em uma mesma casa. Qual a probabilidade de no haver dois botes nem na
mesma linha nem na mesma coluna?
28) Um polgono regular de 2n + 1 lados est inscrito em um crculo. Escolhem-se 3 dos
seus vrtices, formando-se um tringulo. Qual a probabilidade do centro do crculo
ser interior ao tringulo?
29) Tem-se n urnas. Bolas so colocadas ao acaso nas urnas, uma de cada vez, at que
alguma urna receba duas bolas. Qual a probabilidade de colocarmos exatamente p
bolas nas urnas?
30) Joo e Pedro lanam, cada um, um dado no-tendencioso. Qual a probabilidade do
resultado de Joo ser maior ou igual ao resultado de Pedro?
31) Numa prova h 7 perguntas do tipo verdadeiro-falso. Calcular a probabilidade de
acertarmos todas as 7 se:
a) escolhermos aleatoriamente as 7 respostas,
b) escolhermos aleatoriamente as respostas mas sabendo que h mais respostas
verdadeiro do que falso.
32) Sabe-se que 80 % dos pnaltis marcados a favor do Brasil so cobrados por jogadores
do Flamengo. A probabilidade de um pnalti ser convertido 40 % se o cobrador for
do Flamengo e de 70 % em caso contrrio. Um pnalti a favor do Brasil acabou de ser
marcado:
a) Qual a probabilidade do pnalti ser cobrado por um jogador do Flamengo e ser
convertido?

100

b) Qual a probabilidade do pnalti ser convertido?


c) Um pnalti foi marcado a favor do Brasil e acabou de ser desperdiado. Qual a
probabilidade de que o cobrador tenha sido um jogador do Flamengo?
33) Marina quer enviar uma carta a Vernica. A probabilidade de que Marina escreva a
carta de 8/10. A probabilidade de que o correio no perca de 9/10. A probabilidade
de que o carteiro entregue de 9/10. Dado que Vernica no recebeu a carta, qual a
probabilidade condicional de que Marina no a tenha escrito?
34) Durante o ms de agosto a probabilidade de chuva em um dia determinado de 4/10.
O Fluminense ganha um jogo em um dia com chuva com probabilidade de 6/10 e em
um dia sem chuva com probabilidade de 4/10. Sabendo-se que o Fluminense ganhou
um jogo naquele dia de agosto, qual a probabilidade de que choveu neste dia?
35) Num exame h 3 respostas para cada pergunta e apenas uma delas certa. Portanto,
para cada pergunta, um aluno tem probabilidade de 1/3 de escolher a resposta certa se
ele est adivinhando e 1 se sabe a resposta. Um estudante sabe 30 % das respostas do
exame. Se ele deu a resposta correta para uma das perguntas, qual a probabilidade
de que a adivinhou?
36) Um jogador deve enfrentar, em um torneio, dois outros A e B. Os resultados dos
jogos so independentes e as probabilidades dele ganhar de A e de B so 1/3 e 2/3
respectivamente. O jogador vencer o torneio se ganhar dois jogos consecutivos, de
uma srie de 3. Que srie de jogos mais favorvel ao jogador: ABA ou BAB?
37) A probabilidade de fechamento de cada rel do circuito apresentado na figura abaixo
igual a p, 0 < p < 1.

2
3

Se todos os rels funcionam independentemente, qual a probabilidade de que haja


corrente circulando entre os terminais A e B?
38) Escolhe-se ao acaso um nmero entre 1 e 50. Se o nmero primo qual a
probabilidade de que seja mpar?

101

39) Uma moeda jogada 6 vezes. Sabendo-se que no primeiro lanamento deu coroa,
calcular a probabilidade condicional de que o nmero de caras nos 6 lanamentos
supere o nmero de coroas.
40) Uma moeda jogada 4 vezes. Sabendo que o primeiro resultado foi cara, calcular a
probabilidade condicional de obter pelo menos 2 caras.
41) Joga-se um dado duas vezes. Calcule a probabilidade condicional de obter 3 na
primeira jogada, sabendo que a soma dos resultados foi 7.
42) Duas mquinas A e B produzem 3000 peas em um dia. A mquina A produz 1000
peas, das quais 3 % so defeituosas. A mquina B produz as restantes 2000, das
quais 1 % so defeituosas. Da produo total em um dia uma pea escolhida ao
acaso e, examinando-a, constata-se que defeituosa. Qual a probabilidade de que a
pea tenha sido produzida pela mquina A?
43) Um estudante resolve um teste do tipo verdadeiro-falso. Ele sabe dar a soluo
correta para 40 % das questes. Quando ele responde uma questo cuja soluo
conhece, d a resposta correta, e nos outros casos decide na cara ou coroa. Se uma
questo foi respondida corretamente, qual a probabilidade que ele sabia a resposta?
44) Sejam A e B dois eventos independentes tais que
P(A) = 1/3 e P(B) =
Calcule

P ( A B ), P(A B) e P(A B)

45) Sejam A e B dois eventos independentes tais que

P ( A) = 1 / 4 e P(A B) = 1/3
Calcule P(B)
46) Uma moeda equilibrada jogada duas vezes. Sejam A e B os eventos:
A: cara na primeira jogada;
B: cara na segunda jogada
Verifique que A e B so independentes
47) Jogue um dado duas vezes. Considere os eventos:
A = o resultado do 1 lanamento par;
B = o resultado do 2 lanamento par;

102

C = a soma dos resultados par.


A e B so independentes? e A e C? e B e C? e A, B e C?
48) Uma pessoa com um molho de n chaves tenta abrir uma porta. Apenas uma das
chaves consegue abrir a porta. Qual a probabilidade dela s conseguir abrir a porta
na k-sima tentativa:
a) supondo que aps cada tentativa mal sucedida ela descarta a chave usada;
b) supondo que ela no faz isso.
49) (Problema de Chevalier de Mr) Determine a probabilidade de obter:
a) ao menos um 6 em 4 lanamentos de um dado;
b) ao menos um duplo 6 em 24 lanamentos de um par de dados.
50) A probabilidade de um homem ser canhoto 1/10. Qual a probabilidade de, em um
grupo de 10 homens, haver pelo menos um canhoto?
51) Sacam-se, sucessivamente e sem reposio, duas cartas de um baralho comum (52
cartas). Calcule a probabilidade de a 1 carta ser uma dama e a 2 ser de copas.
52) Um exame de laboratrio tm eficincia de 95 % para detectar uma doena quando
essa doena existe de fato. Entretanto o teste aponta um resultado falso positivo
para 1 % das pessoas sadias testadas. Se 0,5 % da populao tem a doena, qual a
probabilidade de uma pessoa ter a doena dado que seu exame foi positivo?
53) A lana uma moeda n+ 1 vezes e B lana a mesma moeda n vezes. Qual a
probabilidade de A obter mais caras que B?
54) Quantas pessoas voc deve entrevistar para ter probabilidade igual ou superior a 0,5
de encontrar pelo menos uma que aniversarie hoje?
55) Uma urna contm 3 bolas vermelhas e 7 bolas brancas. A e B sacam alternadamente,
sem reposio, bolas dessa urna at que uma bola vermelha seja retirada. A saca a
primeira bola. Qual a probabilidade de A sacar a bola vermelha?
56) Em uma cidade com n+ 1 habitantes, uma pessoa conta um boato para outra pessoa, a
qual por sua vez conta para uma terceira pessoa, etc. Calcule a probabilidade do boato
ser contado m vezes:
a) sem retornar primeira pessoa;
b) sem repetir nenhuma pessoa.

103

57) Sacam-se, com reposio, n (n > 1) bolas de uma urna que contem 9 bolas
numeradas de 1 a 9. Qual a probabilidade do produto dos nmeros das n bolas
extradas ser divisvel por 10?
58) Quantas vezes, no mnimo, se deve lanar um dado no tendencioso para que a
probabilidade de obter algum 6 seja superior a 0,9?
59) Um jri de 3 pessoas tem dois jurados que decidem corretamente (cada um) com
probabilidade p e um terceiro jurado que decide por cara ou coroa. As decises so
tomadas por maioria. Outro jri tem probabilidade p de tomar uma deciso correta.
Qual dos jris tem maior probabilidade de acerto?
60) Um dia voc captura 10 peixes em um lago, marca-os e coloca-os no lago
novamente. Dois dias aps, voc captura 20 peixes no mesmo lago e constata que 2
desses peixes haviam sido marcados por voc.
a) se o lago possui k peixes, qual era a probabilidade de, capturando 20 peixes, encontrar
dois peixes marcados?
b) para que valor de k essa probabilidade mxima?
61) Qual a probabilidade de, em um grupo de 4 pessoas:
a)
b)
c)
d)
e)

haver alguma coincidncia de signos zodiacais?


as quatro terem o mesmo signo?
duas terem o mesmo signo, e as outras duas, outro signo?
trs terem o mesmo signo e, a outra, outro signo?
todas terem signos diferentes?

62) Deseja-se estimar a probabilidade p de um habitante de determinada cidade ser um


consumidor de drogas. Para isso realizam-se entrevistas com alguns habitantes da
cidade. No se deseja perguntar diretamente ao entrevistado se ele usa drogas, pois ele
poderia se recusar a responder ou, o que seria pior, mentir. Adota-se ento o seguinte
procedimento: prope-se ao entrevistado duas perguntas do tipo SIM-NO:
I)
II)

Voc usa drogas?


Seu aniversrio anterior ao dia 2 de julho?

Pede-se ao entrevistado que jogue uma moeda, longe das vistas do entrevistador, e que se
o resultado for cara, responda primeira pergunta e, se for coroa, responda segunda
pergunta.
a) sendo p1 a probabilidade de um habitante da cidade responder sim, qual a relao
entre p e p1 ?
b) se forem realizadas 1000 entrevistas e obtidos 600 sim razovel imaginar que
p1 0,6. Qual seria, ento, sua estimativa de p?

104

63) Uma firma fabrica chips de computador. Em um lote de 1000 chips, uma
amostra de 10 chips revelou 1 chip defeituoso. Supondo que no lote houvesse k
chips defeituosos:
a) Calcule a probabilidade de em uma amostra de 20 chips haver exatamente 1
chipdefeituoso.
b) Determine o valor de k que maximiza a probabilidade calculada no item a).
64) Jogamos uma moeda no viciada 10 vezes. Qual a probabilidade de obtermos
exatamente 5 caras?
65) Um aluno marca ao acaso as respostas em um teste mltipla-escolha com 10 questes
e 5 alternativas por questo. Qual a probabilidade dele acertar exatamente 4
questes?
66) Joga-se uma moeda no viciada. Qual a probabilidade de serem obtidas 5 caras
antes de 3 coroas?
67) Lana-se um dado no viciado at a obteno do terceiro 6. Seja X o nmero do
lanamento em que isto ocorre. Calcule:
a) P(X = 10); b) P(X > 10); c) P(X = 10).
68) Dois adversrios A e B disputam uma srie de partidas. A probabilidade de A ganhar
uma partida 0,6 e no h empates. Qual probabilidade de A ganhar a srie?
69) Dois adversrios A e B disputam uma srie de partidas. O primeiro que obtiver 12
vitrias ganha a srie. No momento o resultado 6 x 4 a favor de A. Qual a
probabilidade de A ganhar a srie sabendo que em cada partida as probabilidades de
A e B vencerem so respectivamente 0,4 e 0,6?
70) Motores de avio funcionam independentemente e cada motor tem uma
probabilidade p de falhar durante o vo. Um avio voa com segurana se a maioria de
seus motores funciona. Para que valores de p um avio com 3 motores prefervel a
um avio com 5 motores?
69) Suponha que uma caracterstica (como a cor dos olhos, por exemplo) dependa de um
par de genes. Representemos por A um gen dominante e por a um gen recessivo.
Assim um indivduo com genes AA dominante puro, um com genes aa um
recessivo puro e um com genes Aa um hbrido. Dominantes puros e hbridos so
semelhantes em relao caracterstica. Filhos recebem um gen do pai e um da me.
Suponha que pai e me sejam hbridos e tenham 4 filhos.
a) Qual a probabilidade do primeiro filho ser um recessivo puro?
b) Qual a probabilidade de exatamente um dos 4 filhos ser um recessivo puro?

105

70) (O problema das caixas de fsforos de Banach18) Um matemtico sai de casa todos os
dias com duas caixas de fsforos, cada uma com n palitos. Toda vez que ele que
acender um cigarro, ele pega (ao acaso) uma das caixas e retira da um palito. O
matemtico meio distrado, de modo que quando ele retira o ltimo palito de uma
caixa, ele no percebe que a caixa est vazia. Como ele fuma muito, em certa hora
ele pega uma caixa e constata que ela est vazia. Qual a probabilidade de nesse
momento a outra caixa conter exatamente k ( 0 k n ) palitos?
71) Lana-se repetidamente um par de dados no tendenciosos. Qual a probabilidade de
obtermos duas somas iguais a 7 antes de obtermos trs somas iguais a 3?
72) Uma moeda tem probabilidade 0,4 de dar cara. Lanando-a 12 vezes qual o mais
provvel valor do nmero de caras obtidas?
73) Suponha que uma varivel aleatria T tem a seguinte distribuio de probabilidade

T
P(T=t)

0
0,5

1
0,3

2
0,2

a. Ache P(T <= 0)


b. Ache P(T >= 0 and T < 2)
c. Calcule E(T), a mdia da varivel aleatria T.
74) Suponha que voc escolha uma bola de uma urna contendo 7 bolas vermelhas, 6 bolas
brancas , 5 bolas azuis e 4 bolas brancas. Qual a probabilidade de que voc escolha
uma bola vermelha?
75) Suponha que voc escolha uma bola aleatoriamente de uma urna 7 bolas vermelhas, 6
bolas brancas, 5 bolas azuis e 4 bolas amarelas. Qual a probabilidade de que voc
escolha uma bola branca?
76) Um dado no viciado jogado duas vezes. Ache a probabilidade de sair um 5 ou 6 no
primeiro lance e um 1, 2 ou 3 no segundo lance.
77) Ache a probabilidade de no sair um 5 ou 6 em qualquer uma de duas jogadas de um
dado no viciado.
78) Voc tem um baralho de 52 cartas bem embaralhadas. Qual a probabilidade de
escolher dois valetes consecutivos se a primeira carta no recolocada no baralho?

18 Stefan Banach (1892-1945), matemtico polons

106

79) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a
probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado
que cada bola recolocada na urna depois de escolhida.
80) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a
probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado
que cada bola no recolocada na urna depois que ela escolhida.
81) A urna A contem 2 bolas vermelhas e 3 azuis. A urna B contem 8 bolas
vermelhas e 2 azuis. Voc joga uma moeda honesta. Se amoeda mostra cara voc
escohe uma bola da urna A. Se a moeda mostra coroa voc escolhe uma bola da urna
B. Determine a probabilidade de que voc escolha uma bola vermelha.
82) Voc tem 6 bolas, cada uma de cor diferente. De quantas maneiras distintas voc
pode dispo-las em uma fila?
83) De quantas maneiras possveis 8 pessoas podem sentar-se em um banco se apenas
esto disponveis 3 assentos?
84) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos
0,1,2,..,9 se repeties so permitidas?
85) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos
0,1,2,..,9 se repeties no so permitidas?
86) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de
Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los
se todos os livros de cada assunto precisam ficar juntos?
87) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de
Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los
se somente os livros de Cincias precisam ficar juntos?
88) Calcule C(8,3)
89) De quantas maneiras pode um comit de 6 pode ser escolhido de 10 pessoas?
90) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3 mdicos e 4
enfermeiras precisa ser formado. De quantas maneiras isto pode ser feito se um
particular mdico deve ser includo e se qualquer enfermeira pode ser includa?
91) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3 mdicos e 4
enfermeiras precisa ser formado. De quantas maneiras isto pode ser feito se uma
particular enfermeira no pode ser includa no comit?
92) De quantas maneiras diferentes saladas de frutas podem ser feitas de ma, laranja,
tangerina e banana?

107

93) A partir de 6 consoantes e 4 vogais, quantas combinaes distintas de letras podem


ser feitas?
94) Quais dos seguintes pares de eventos so mutuamente exclusivos?
a. A: os nmeros pares ;

B: o nmero 5;

b. A: os nmeros mpares;

B: os nmeros maiores do que


10;

c. A: os nmeros menores que 5;

B: todos os nmeros negativos

d. A: os nmeros maiores do que 100;

B: os nmeros menores do que


200;

e. A: os nmeros negativos;

B: os nmeros pares

95) Uma carta escolhida de um baralho padro de 52 cartas. Ao descrever a ocorrncia


de dois possveis eventos, um s e um Rei, estes dois eventos so:
(a) independentes
(b) mutuamente exclusivos
(c) variveis aleatrias
(d) aleatoriamente independentes.
96) Suponha que certa caracterstica oftalmolgica associada com a cor dos olhos. 300
indivduos selecionados aleatoriamente so estudados e apresentam os seguintes
resultados:
Cor dos olhos
Caracterstica
Azuis

Castanhos

Outra

Total

Sim

70

30

20

120

No

20

110

50

180

Total

90

140

70

300

A. Qual a probabilidade de que uma pessoa tenha olhos azuis ?

108

B. O que voc espera que seja o valor de P(Ter a caracterstica e olhos azuis) se a
cor dos olhos e a existncia da caracterstica so independentes ?
C. Quais das seguintes expresses descrevem a relao entre os eventos A = a pessoa
tem olhos castanhos e B = a pessoa tem olhos azuis ? (marque a resposta
correta).
i. independente
iii. simples

ii. exaustivo
iv. mutuamente exclusivos

97) Uma amostra de 1000 pessoas diagnosticada com certa doena distribuda de acordo
com a altura e o status (evoluo) da doena a partir de um exame clnico de acordo
com a seguinte tabela:

Sem
doena

a Fraca

Moderada

Severa

Totais

Alta

122

78

139

61

400

Mdia

74

51

90

35

250

Baixa

104

71

121

54

350

Totais

300

200

350

150

1000

Como voc estimaria, a partir dessa tabela, a probabilidade de ser mdia ou


baixa em altura e ter moderado ou severo grau de evoluo da doena ?
a. 600/1000 * 500/1000

d. 300/600

b. 300/500

e. 800/1000

c. 300/1000

98) De cerca de 25 artigos, nove so defeituosos, seis tem defeitos superficiais e trs tem
defeitos importantes. Determine a probabilidade de que um artigo selecionado
aleatoriamente tenha defeitos importantes dado que ele tem defeito.
a. 1/3
b. 0,25

109

c. 0,24
d. 0,08
99) A seguinte tabela de duas entradas mostra as frequncias de ocorrncia de uma
exposio hipottica e a doena em um grupo de 1000 pessoas.

Doena
Exposio

Presente

Ausente

Totais

Presente

75

325

400

Ausente

25

575

600

Totais

100

900

1000

a. Qual a probabilidade de exposio no grupo ?


b. Qual a probabilidade conjunta de tanto exposio como de doena estar
presente no grupo ?
c. Calcule a probabilidade de doena estar presente condicionada a presena de
exposio e condicionada a ausncia de exposio.
100) Um epidemiologista acredita que as rodovias tm alguma relao com o
desenvolvimento de uma nova doena porque a probabilidade de uma pessoa estar
morando a menos de uma milha das rodovias, dado que ela tem a doena, 0,80.
Voc concorda com ele ? Porque ou porque no ?
101) Um dormitrio de um campus universitrio abriga 200 estudantes. 120 so homens,
50 so dos graus mais avanados e 40 so homens dos graus mais avanados. Um
estudante selecionado ao acaso. A probabilidade de selecionar um estudante de
grau menos elevado, dado que o estudante mulher, :
(a) 7/8

(d) 7/20

(b) 7/15

(e) 1/4

(c) 2/5
102) Uma amostra de 2000 indivduos distribuda de acordo com a cor de olho
e a presena ou ausncia de uma certa caracterstica oftalmolgica como segue:

110

Caracterstica
Sim
No
Total

Cor dos olhos


Castanho
Azul
400
270
200
650
600
920

Outro
130
350
480

800
1200
2000

Em uma seleo aleatria de um indivduo da populao em estudo,


Qual sua estimativa da probabilidade de:
a. a pessoa tem olhos azuis? ___________
b. a caracterstica est presente e a pessoa tem castanhos? ____________
c. a pessoa nem no tem olhos castanhos nem olhos azuis dados
que a caracterstica est ausente? _______________
d. a pessoa nem no tem olhos de outra cor nem olhos azuis e a
caracterstica est presente _______________
e. a pessoa no tem olhos castanhos? _______________
f. a pessoa tem olhos azuis ou nem no tem olhos azuis nem olhos castanhos?
__________
g. a pessoa no tem a caracterstica ou no tem olhos castanhos? ________
103) Um sindicato de trabalhadores local consiste de associados encanadores e
eletricistas, classificado de acordo com grau:

Encanadores
Eletricistas

Aprendiz
25
15
40

Jornaleiro
20
40
60

Oficial
30
20
50

75
75

Um associado do sindicato selecionado ao acaso. Dado que o


pessoa selecionada um encanador, a probabilidade de que ele um
jornaleiro :
a. 1/2
b. 1/3
c. 4/15
d. 2/15
e. nenhuma das anteriores.
104) Entre vinte e cinco artigos, nove so defeituosos, seis tem somente um defeito no
importante e trs tm um defeito importante. Determine a probabilidade de que

111

um artigo selecionado ao acaso tenha defeitos importantes dado que ele tenha
defeitos.
a.
b.
c.
d.

1/3
0,25
0,24
0,08

105) Os depositantes do Banco X so categorizados por idade. Selecionaremos


aleatoriamente um indivduo desse grupo de 2.000 depositantes
Sexo
Idade
| Homem | Mulher
----------------------------------------------30 ou menos | 800
| 600
31 ou mais
| 400
| 200
----------------------------------------------i) Ento P(mulher de 30 ou menos) =
a) 2/5 b) 3/4 c) 3/7 d) 3/10 e) nenhuma das anteriores
ii) Ento P[homem ou (31 ou mais)] =
a) 1/5 b) 3/10 c) 1/2 d) 7/10 e) nenhuma das anteriores
iii) Ento P(mulher) =
a) 3/10 b) 2/5 c) 3/5

d) 2/3

e) nenhuma das anteriores

iv) Qual a probabilidade condicional de que um depositante escolhido


idade de 30 anos ou menos, dado que ele homem?
a) 2/3

b) 7/10

c) 4/7

d) 2/5

tenha

e) nenhuma das anteriores

v) So as idades e sexos dos depositantes independentes para o Banco X? Porque?

105) Um epidemiologista sente que as rodovias tem alguma relao com o


desenvolvimento de uma nova doena porque a probabilidade de que uma pessoa
esteja morando a uma milha ou menos da rodovia, dado que ela tem a doena
0,80. Voc concorda com ele? Explique porque.
106) Existem duas urnas marcadas com H e T. A urna H contem 2 bolas vermelhas e 1
bola azul. A urna T contem 1 bola vermelha e 2 azuis. Uma moeda jogada ao
acaso. Se sai cara escolhida uma bola da urna H. Se sai coroa, uma bola
escolhida da urna T. Ache as seguintes probabilidades.

112

a. P(cara e vermelha)
d. P(azul)

b. P(coroa)
c. P(vermelha)
e. P(cara|vermelha)

107) O nmero de paradas de mquinas em uma grande fbrica durante uma semana tem
a seguinte distribuio de probabilidade:
B
P(B = b)

5
0,25

10
0,30

15
0,25

20
0,15

25
0,05

Usando essa distribuio, Calcule E[B] e V[B]

108) A Companhia Beta comprou 80 componentes eletrnicos de um fornecedor que


declara que somente 2 % dos componentes que ele vende so defeituosos e que os
componentes defeituosos so misturados aleatoriamente com os componentes bons.
Cada componente defeituoso custar a Beta US$ 250 em custos de reparo. Se o
fornecedor est certo, qual ser o nmero esperado de componentes defeituosos ? E
qual o custo esperado de reparo?
109) Um vendedor de carros oferece a todos os seus clientes potenciais uma corrida de 30
milhas no tipo de carro que o cliente est interessado em comprar, mais um almoo
ou jantar gratuitos. Todos estes custos so cerca de US$ 50. Se o cliente no
compra o carro, o vendedor perde US$ 50, mas se o cliente comprar o carro, o lucro
mdio do vendedor de cerca de US$ 500 (dos quais os custos da corrida e da
refeio devem ser deduzidos). No passado, 20 % dos clientes compraram o carro
depois da corrida e da refeio gratuita. Qual o lucro esperado para o vendedor
nessa situao?
110) Um processo de produo paralisado para ajuste toda vez que uma amostra
aleatria de cinco itens, selecionada com reposio, apresenta dois ou mais
defeituosos. Ache a probabilidade de que o processo ser paralisado aps uma
inspeo se ele est produzindo:
a) 20 % de defeituosos
b) 10 % de defeituosos
c) 5 % de defeituosos
111) Um simples mssil de certa variedade tem uma probabilidade de de derrubar um
bombardeiro, uma probabilidade de de danific-lo e uma probabilidade de de
err-lo. Alm disso, dois tiros danificadores derrubaro o avio. Se quatro destes
msseis so lanados, qual a probabilidade de derrubar um avio?

113

112) De acordo com um cientista poltico, a populao votante de certa cidade consiste de
46 % do candidato A, 40 % do candidato B, 11 % do candidato C e 3 % do
candidato D. Em uma amostra aleatria de 5 votantes, qual a probabilidade de que
a amostra contenha:
a) Dois votantes para o candidato A e um de cada das outras categorias?
b) Trs votantes para o candidato A e dois para o candidato B?
c) Nenhum votante para o candidato D?

4. Variveis Aleatrias Discretas


Objetivos do Captulo:

Distinguir entre uma distribuio de probabilidade discreta e contnua

Calcular a mdia, a varincia e o desvio padro de uma distribuio de probabilidade


discreta.

Definir os termos Distribuio de Probabilidade e Varivel Aleatria

Descrever as caractersticas das distribuies Binomial, Hipergeomtrica e de


Poisson.

Definio: Uma varivel aleatria um valor numrico determinado pelo resultado


de um experimento ( uma quantidade resultante de um experimento aleatrio que,
por acaso, pode assumir diversos valores).

Exemplo 1: Considere um experimento aleatrio no qual uma moeda jogada 3 vezes.


Seja X o nmero de caras. Seja H o resultado cara e T o resultado coroa.

O espao amostral para este experimento ser:

TTT, TTH, THT, THH, HTT, HTH, HHT, HHH

114

Assim, os possveis valores de X (nmero de caras) sero:


X = 0, 1, 2, 3.

Nota: Neste experimento, h 8 possveis resultados no espao amostral. Desde que


eles so todos igualmente provveis de ocorrer, cada resultado tem uma probabilidade
de 1/8 de ocorrer.

A figura a seguir ilustra a associao existente entre resultados do experimento (no


espao amostral) e os valores assumidos pela varivel X.

TTT

TTH

THT

THH

HTT

HTH

HHT

HHH

Espao Amostral

X = Nmero de Caras

O resultado zero caras ocorre o corre somente uma vez


O resultado 1 cara ocorre trs vezes
O resultado 2 caras ocorre trs vezes

115

O resultado 3 caras ocorre somente uma vez

Da definio de uma varivel aleatria, X, tal como definida neste experimento,


uma varivel aleatria. Seus valores so determinados pelos resultados do
experimento.

Nota: A varivel aleatria X uma associao de pontos no espao amostral com


pontos na reta dos nmeros reais (0,1, 2,3). Na realidade, uma varivel aleatria
definida atravs de uma funo em que o domnio o conjunto de todos os resultados
possveis do experimento e a imagem o conjunto de todos os valores assumidos
pela varivel aleatria. Note que a varivel aleatria no resultado do experimento,
mas sim um valor associado a este.

Definio: Uma Distribuio de Probabilidade uma lista de todos os resultados de


um experimento e suas probabilidades associadas. De forma mais rigorosa, uma
funo matemtica em que o domnio so os valores possveis de uma varivel
aleatria e a imagem so as suas probabilidades associadas.

A distribuio de probabilidade de uma varivel aleatria X (nmero de caras) nas trs


jogadas de uma moeda mostrada a seguir.

Distribuio de Probabilidade para Trs Jogadas de uma Moeda

Nmero

de Probabilidade

Caras
0

1/8 = 0,125

3/8 = 0,375

3/8 = 0,375

1/8 = 0,125

116

Total

8/8 = 1

probabilidade

3/8

1/8

Nmero de
caras

CARACTERSTICAS DE UMA DISTRIBUIO DE PROBABILIDADE

A probabilidade de um resultado deve estar sempre situada entre 0 e 1.

Exemplo: P(0 caras) = 0,125, P(1 cara) = 0,375 , etc. no experimento de jogar 3 moedas.

A soma das probabilidades de todos os resultados mutuamente exclusivos sempre 1


(veja a tabela de distribuio de probabilidade no texto).

VARIVEL ALEATRIA DISCRETA

Definio: Uma varivel aleatria discreta uma varivel que pode assumir somente
certos valores claramente separados (em descontinuidade) resultantes, por exemplo,
de uma contagem de algum item de interesse.

117

Exemplo: Seja X o nmero de caras quando uma moeda jogada 3 vezes. Aqui os
valores de X so 0,1,2 ou 3 (so claramente separados, em descontinuidade).

Nota: uma varivel aleatria discreta no precisa necessariamente assumir apenas valores
inteiros. Poderia, por exemplo, ser uma varivel que apresentasse os seguintes valores: 0,
23/7 , 72/25, etc. A condio que deve ser cumprida seus valores sejam descontnuos.

VARIVEL ALEATRIA CONTNUA

Definio: Uma varivel aleatria contnua uma varivel que pode assumir um
nmero infinitamente grande de valores (com certas limitaes prticas).

Exemplo: (a) Peso de um estudante


(b) comprimento de um carro

4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta

A mdia refere-se a localizao central de um conjunto de dados. Ela pode ser


considerada como um valor de longo prazo de uma varivel aleatria e tambm
chamada de valor esperado (ou esperana matemtica), E(X).

A mdia de uma distribuio de probabilidade discreta determinada pela frmula:

= E ( X ) = [ X .P ( X )]
onde

(letra grega, mi) representa a mdia (ou valor esperado) e P(X) a probabilidade

dos vrios resultados de X.

118

4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta

A varincia mede a quantidade de disperso ou variabilidade de uma distribuio. Ela


denotada pela letra grega

(sigma ao quadrado).

O desvio padro obtido atravs da raiz quadrada de

A varincia de uma distribuio de probabilidade discreta calculada atravs da

frmula:

2 = [(X )2 P( X )]
O desvio padro :

= 2
Exemplo 2
Uma empresa especializa-se no aluguel de carros para famlias que necessitam de um
carro adicional para um perodo curto de tempo. O presidente da empresa tem estudado
seus registros para as ltimas 20 semanas e apresentou os seguintes nmeros de carros
alugados por semana.

Nmero de Carros Semanas


alugados
10

11

12

13

Os dados acima podem ser considerados como uma distribuio de probabilidade?


Porque ou porque no?

119

Converta o nmero de carros alugados por semana em uma distribuio de


probabilidade.

Nmero de carros Probabilidade


alugados

P(X)

10

0,25

11

0,30

12

0,35

13

0,10

Total

1,00

Calcule o nmero mdio de carros alugados por semana.

A mdia

= E ( X ) = [ X .P ( X )] = (10) (0,25) + (11) (0,30)


+ (12) (0,35) + (13) (0,10) = 11,3

Calcule a varincia do nmero de carros alugados por semana.

A varincia

2 = [( X ) 2 .P ( X )] =
(10 11,3) 2 0,25 + (11 11,3) 2 0,30 + ... + (13 11,3) 2 0,10 = 0,91
Clculo de E(X):

120

Nmero

de

Carros Probabilidade, P(X)

XP(X)

alugados
10

0,25

2,5

11

0,30

3,3

12

0,35

4,2

13

0,10

1,3

Total

1,00

E(X) = 11,3

Clculo de

Nmero
Carros

de Prob.

(X )

( X )2

( X ) 2 P( X )

P(X)

Alugados
10

0,25

10-11,3

1,69

0,4225

11

0,30

11-11,3

0,09

0,0270

12

0,35

12-11,3

0,49

0,1715

13

0,10

13-11,3

2,89

0,2890

2 = 0,9135

Total

= 0,9135 = 0,9558

4.3 A Distribuio de Probabilidade Binomial


A Distribuio Binomial tem as seguintes caractersticas:

Considere um experimento que apresenta apenas dois resultados possveis que so


categorias mutuamente exclusivas: sucesso e falha.

So repetidos diversas vezes este mesmo experimento.

121

probabilidade

de

sucesso

permanece

constante

para

cada

tentativa

(consequentemente, a probabilidade de falha tambm permanece constante).

As tentativas so independentes, significando que o resultado de uma tentativa no


afeta o resultado de qualquer outra tentativa.

Para construir uma distribuio binomial, consideremos:


n o nmero de tentativas
r o nmero de sucessos observados
p a probabilidade de sucesso em cada tentativa
q a probabilidade de falha em cada tentativa, que igual a 1-p

FRMULA PARA A DISTRIBUIO DE PROBABILIDADE BINOMIAL

P( X = r ) =

n!
p q
r!(n r )!
r

nr

onde n! lido como n fatorial. Por exemplo, 4! = (4).(3).(2).(1)=24.


0! igual a 1, por definio e 1! = 1.

Exemplo 3

O Departamento de Estatstica do Trabalho de um municpio estimou que 20 % da fora


de trabalho est desempregada. Uma amostra de 14 trabalhadores obtida deste
municpio. Calcule as seguintes probabilidades:

Trs esto desempregados na amostra. (Nota: n = 14 e p = 0,2)

P( X = 3) =

14!
0,2 3 0,814 3 = 0,250
3!(14 3)!

No mnimo um dos trabalhadores da amostra esto desempregados.

122

P( X 1) = 1 P( X = 0) = 1

14!
0,2 0 0,814 0 = 0,956
0!(14 0)!

No mximo dois dos trabalhadores esto desempregados.

P ( X 2) = 0,044 + 0,154 + 0,250 = 0,448


Exemplo 4

Uma companhia fabrica rolamentos para serem usados em bicicletas. Sabe-se que 5 %
dos dimetros dos rolamentos estaro fora dos limites de aceitao (defeituosos). Se 6
rolamentos so selecionados ao acaso, qual a probabilidade de que:

Exatamente zero sejam defeituosos? Exatamente um seja defeituoso? Exatamente dois


sejam defeituosos? Exatamente trs sejam defeituosos? Exatamente quatro sejam
defeituosos? Exatamente cinco sejam defeituosos? Exatamente seis sejam defeituosos?
Note que as condies de uma distribuio binomial esto satisfeitas neste exemplo:

H uma probalidade constante de sucesso (0,05)

H um nmero fixo de tentativas (6)

As tentativas so independentes (Por qu?)

H somente dois possveis resultados (um rolamento defeituoso ou no defeituoso).

123

DISTRIBUIO DE PROBABILIDADE BINOMIAL para n = 6 e p = 0,05

Nmero de rolamentos defeituosos, X

Probabilidade de ocorrncia, P(X)

0,735

0,232

0,031

0,002

0,000

0,000

0,000

Verifique os clculos para os valores da tabela acima

Mostre a representao grfica para a Distribuio de Probabilidade Binomial com n


= 6 e p = 0,05

Para um n fixo (10) e p pequeno (0,05), a distribuio positivamente assimtrica

Para um n fixo (10) e p aproximando-se de 0,5, a distribuio torna-se simtrica.

Para um n fixo (10) e p grande (0,95), a distribuio torna-se negativamente


assimtrica.

Para um p fixo e para valores cada vez maiores de n, a distribuio torna-se cada vez
mais simtrica

Nota: Como os procedimentos de clculo tornam-se repetitivos (e montonos) faremos a


seguir uma simulao no computador para diversos valores dos parmetros n e p de uma
distribuio binomial.

124

4.4 A Mdia e Varincia De Uma Distribuio Binomial

A mdia dada por:

= np

A varincia dada por:

2 = np (1 p )
Nota: A demonstrao terica para estes valores ser desenvolvida em sala de aula e
encontra-se na maioria dos livros de Introduo a Estatstica.

Para o exemplo anterior:

p = 0,05 e n = 6

= np = 6 0,05 = 0,3
2 = np (1 p ) = 6 0,05 0,95 = 0,285
Distribuio Cumulativa de Probabilidade

Um engenheiro estimou que 60 % das pontes de um Estado necessitam de reparos. Uma


amostra de 10 pontes no Estado foi aleatoriamente selecionada.

Qual a probabilidade de que exatamente 6 destas pontes necessitem de reparos? Esta


situao (deste exemplo) satisfaz as condies para uma distribuio binomial ?
Porque?

Verificar:

125

n = 10, p = 0,6 P(X = 6) = 0,251


Qual a probabilidade de que 7 ou menos destas pontes necessitem de reparos ?

P ( X 7) = P ( X = 0) + P ( X = 1) + ... + P ( X = 7) = 0,833 (verificar)


Este um exemplo de probabilidade cumulativa.

Apndice 1 (Recordao)
Uma varivel aleatria (v.a.) um valor numrico que definido em ou determinado
pelos resultados ou eventos de um experimento. Variveis aleatrias normalmente so
denotadas por letras maisculas, X, Y etc e podem ser discretas ou contnuas.
Seja a v.a. X o nmero de sementes que germinam em 100 plantadas. Possveis valores
para X so 0,1,2,100, (discreta)
Seja a v.a. X a temperatura mxima diria em Uberlndia. Possveis valores so 0 - 50 C
por exemplo 26.1276(contnua).
Seja X a resposta a uma questo com ' Sim', ' No', 'No Sei'. X no uma v.a (no
numrica).
Seja Y o nmero de 'Sim's. Y uma v.a. discreta.

Distribuio de probabilidade de um v.a. Discreta.


Esta uma lista dos possveis valores da v.a. e as probabilidades correspondentes (que
tem que somar 1). As probabilidades podem ser escritas:

P ( X = xi ) = p i para i = 1,2,..., k e 0 p i 1
k

p =1
i =1

126

Apendice 2 (Recordao)

Varivel Aleatria discreta


Uma varivel aleatria discreta uma varivel aleatria que toma valores discretos com
probabilidades especificadas.

Exemplo - uma Famlia de 3 crianas.


Seja X uma Varivel Aleatria (VA) = nmero de meninas
Possveis valores:
X=3

GGG

X=2

GGB

GBG

BGG

X=1

BBG

BGB

GBB

X=0

BBB

Considere que os 8 resultados so igualmente provveis de forma que

x
Probabilidade
P(X = x)

1/8

3/8

3/8

1/8

A lista de valores que X pode assumir e as suas probabilidades chamada


de distribuio de probabilidade discreta para X.
Conveno de notao - use letras maisculas para variveis aleatrias e letras minsculas
para valores especficos

Exemplo - tentativas de Bernoulli


Cada tentativa um 'experimento' com exatamente 2 possveis resultados, "sucesso " e "
fracasso " com probabilidades p e 1-p.
Seja X = 1 se sucesso, 0 se fracasso
A Distribuio de probabilidade

127

P(X = x)

1-p

Exemplo - so lanados 2 dados


Seja X a soma dos resultados.
Resultados:
11

21

31

41

51

61

12

22

32

42

52

62

13

23

33

43

53

63

14

24

34

44

54

64

15

25

35

45

55

65

16

26

36

46

56

66

Considere que os 36 resultados so igualmente provveis. Portanto cada um tem


probabilidade = 1/36.
Possveis valores de X so 2, 3,... , 12
por exemplo P(X = 4) = P(1,3 ou 2,2 ou 3,1) = 3/36.
A distribuio de probabilidade

...

10

11

12

P(X=x)

1/36

2/36

3/36

...

3/36

2/36

1/36

Apndice 3 (Recordao)
A distribuio Binomial
Considere n tentativas Bernoulli.
Assuma que a probabilidade de sucesso (S) o mesma para todas as tentativas, P(S) =
p.
Assuma que as tentativas so independentes e portanto a probabilidade para qualquer
determinada combinao de sucessos e fracassos, por exemplo para 5 tentativas, a

128

probabilidade do resultado SSFSF, pode ser obtida multiplicando as probabilidades


para cada resultado de tentativa.
por exemplo P(SSFSF) = p.p. (1-p) .p.(1-p) = p3(1-p)2
De fato, a probabilidade de obter trs sucessos e dois fracassos em cinco tentativas p3(1p)2 para cada um dos modos diferentes que isto poderia acontecer, isto , SSSFF,
SSFSF,... etc.
O nmero de arranjos "distintos" de 3 sucessos e 2 fracassos pode ser facilmente
calculado usando o coeficiente binomial

n
onde
x

n o nmero de tentativas e x o

nmero de sucessos requerido.


O coeficiente binomial (leia-se como "binomial de x em n") definido como

n

x

n
n!
=
x x!(n x)!
5
5!
5.4.3.2.1
Neste exemplo, =
=
= 10, portanto
3
3!2!
(3.2.1)(2.
1)

h 10 maneiras distintas de se obter 3 sucessos em 5 tentativas, com cada arranjo
tendo uma probabilidade p 3 (1 - p) 2

Seja X a V.A. igual ao nmero total de sucessos em n tentativas .


Para calcular a probabilidade de obter x sucessos, pode ser mostrado que

129

n
P ( X = x) =
x

px

nmero de arranjos

prob. de

de x Ss e (n-x) Fs

x Ss

(1 - p) n - x

prob. de
(n-x) Fs

onde o nmero mnimo de sucessos 0 e o mximo n.


A distribuio do nmero de sucessos chamada distribuio binomial com dois
parmetros, n e p, necessrios para determinar P(X=x). Dizemos, de forma abreviada, X ~
B(n,p)

Exemplo - Um time de futebol joga 3 jogos


Assuma que cada jogo uma tentativa Bernoulli com prob(ganhar) = 0,5
Seja X a V.A. = nmero de vitrias
Ento X tem distribuio binomial com n=3 e p=0,5, com resultado vitria (W) ou derrota
(L) em cada tentativa.
(Isto abreviado como X ~ B(3;0,5))
Qual a probabilidade de que o time ganhe 2 jogos exatamente?
P(X=2) = P(WWL) + P(WLW) + P(LWW)
= 3/8 (desenhe um diagrama de rvore)
ou usando a frmula para probabilidades binomiais, a prob(WWL) = p2(1-p) e o nmero
de distintos arranjos de 2 vitrias em trs jogos

3p2(1-p). Assim

3 3!
=
= 3 . Portanto a resposta
2
2
!
1
!

3
P ( X = 2) = (0,5) 2 (1 0,5) 1 usando n = 3, x = 2, p = 0,5
2
3
=
8

130

As distribuies binomiais so usadas para modelar situaes que podem ser pensadas
como tentativas repetidas e " independentes " cada uma com somente 2 possveis
resultados. Ns os usaremos posteriormente para fazer inferncias estatsticas sobre
propores.

Exemplo - Um Sistema de Controle de Qualidade


Um Sistema de Controle de Qualidade requer que de cada lote de itens uma amostra de
10 selecionada e testada. Se 2 ou mais itens da amostra so defeituosos o lote inteiro
rejeitado.
Se a probabilidade de um item ser defeituoso 0,05
(i) qual a probabilidade de 2 defeituosos na amostra?
(ii) Qual a probabilidade do lote ser rejeitado?
Seja X a V.A. = nmero de defeituosos na amostra de n = 10 itens.
Portanto, X ~ Binomial (10; 0,05)
(i)

10
P ( X = 2) = (0,05) 2 (0,95) 8 = 0,0746
2

(ii)

P(rejeitar o lote) =

10 10
P ( X 2) = (0,05) x (0,95) 10 x
x=2 x

trabalhoso de calcular. Mas:

P ( X 2) = 1 P ( X < 2) = 1 P ( X = 0 ou X = 1)
= 1 - [P(X = 0) + P(X = 1)] mutuamente exclusivos
10
10
= 1 - [ (0,05) 0 (0,95) 10 + (0,05) 1 (0,95) 9 ]
0
1
= 0,0862

131

o que muito

Apndice 4 (Recordao) Valor Esperado e Varincia de uma Varivel Aleatria

Anlise de deciso
Exemplo - explorao de petrleo
Uma companhia de explorao de petrleo tem um arrendamento para o qual precisa
decidir se:
(i) vende agora,
(ii) segura durante um ano e ento vende, ou
(iii) perfura agora.
O custo de perfurar $200,000 ($200K).
Perfurando conduzir a um dos resultados seguintes
Resultado

Probabilidade

Receita

Poo Seco

0.5

$0

Poo com pouco petrleo

0.4

$400K

Poo com jorro

0.1

$1500K

Se vende agora, a companhia pode adquirir $125K.

Se segura durante um ano e os preos do petrleo sobem (probabilidade =0.6) pode


vender por $300K ou se os preos do petrleo caem (probabilidade = 0.4) pode adquirir
$100K. O que deveria fazer?

132

Valor
esperado
Vende agora

125 K

$ 125 K

Preos do
petrleo sobem
Vende

0,6

$ 300 K

depois

Deciso

Preos do
petrleo caem
0,4

300 x 0,6 +
100 x 0,4 =
$ 220 K

$ 100 K

Seco
$0 200 K
0,5

Perfura

0,4

Pouco petrleo
$400 200 K

-200 x 0,5
+ 200 x 0,4
+ 1300 x 0,1
= $ 110 K

0,1
Jorro
$1500-200 K

A melhor deciso segurar durante um ano e ento vender. Este um exemplo de usar
um diagrama de rvore para Anlise de Deciso. Tambm ilustra o conceito do valor
esperado de uma varivel aleatria .

133

Se a distribuio de probabilidade de uma varivel aleatria X


Valores de X

x1

x2

...

xk

Probabilidades

p1

p2

...

pk

seu valor esperado

E ( X ) = x p + x p + ... + x p = x p
1

i =1

exemplo Perfurao de Petrleo


Resultado

Probabilidade

Receita

Poo seco

0.5

Poo com pouco petrleo

0.4

$400K

Poo com jorro

0.1

$1500K

Seja X a varivel aleatria lucro financeiro


= Receita custo de perfurao
= Receita - $200K
A distribuio de probabilidade para X
x

-200

200

1300

P(X=x)

0.5

0.4

0.1

Portanto, o valor esperado (mdia) de X


E(X) = -200 x 0.5 + 200 x 0.4 + 1300 x 0.1 = $110K
Isto diretamente anlogo mdia amostral.
E(X) pode ser considerada como uma idealizao de, ou um valor terico para, a mdia
da amostra.
E(X) denotado freqentemente pela letra grega

134

(pronuncia-se mu).

Varincia de uma Varivel Aleatria


Recorde que a varincia uma medida de disperso. Para uma amostra de observaes de
uma populao a varincia ao redor da mdia definida como
n

s =
2

(x x)

i =1

n 1

A varincia de uma Varivel Aleatria X definida como

var( x) = p1 ( x1 ) 2 + p 2 ( x 2 ) 2 + ... + p K ( x K ) 2
ou
K

var( x) = p i ( x i ) 2 = E ( x ) 2
i =1

Ela representa o limite terico da varincia amostral s2 quando o tamanho da amostra (n)
fica muito grande.
var(X) denotada freqentemente por

2 (sigma quadrado).

Uma frmula mais simples para var(X)

var( X ) = ( p1 x12 + ... + p K x K2 ) 2


= E ( X 2 ) [ E ( X )] 2

Exemplo - Gnero em uma classe de 5


Assuma que a probabilidade de um estudante em uma classe ser masculino um meio.
Seja a varivel aleatria X o nmero de estudantes masculinos em um grupo da classe de
tamanho 5.
Qual o valor de E(X), o nmero esperado de homens no grupo, e qual a varincia de
X?
Considere X ~ binomial (5;0,5).

135

Ento a distribuio de probabilidade de X


x

P(X=x)

1/32

5/32

10/32

10/32

5/32

1/32

(Confira isto usando a frmula para probabilidades binomiais e desenhe um diagrama de


rvore para analisar a estrutura dos resultados.)

1
5
10
10
+ 1 + 2 + 3
32
32
32
32
5
1 80
+ 4 + 5
=
= 2,5 =
32
32 32

E ( X ) = xp( x) = 0

isto , em mdia tais grupos tm 2,5 homens.

var( X ) = x 2 p ( x) 2 = 0 2

1
1
+ ... + 5 2 (2,5) 2
32
32

= 7,5 - (2,5) 2
= 1,25
Portanto, = var( X ) = 1,25 = 1,12
Esta uma medida da variabilidade de X.

Em geral se X ~ binomial (n,p) pode ser mostrado que


E(X) = np e var(X) = npq
onde q = 1 - p
[Confira os valores de E(X) e var(X) calculados acima para X ~ binomial (5;0,5) usando
estas frmulas.]

136

EMPRICO
(baseado

TERICO
nos

dados) (MATEMTICO)

QUANTIDADE

QUANTIDADE

(a) Freqncia relativa

f
xi = i
n
(b)
i

fi
=1
n

(c) mdia x =
1
xi f i
n i

PROB[X = xi] = pi

fi

n
quando
n0

p
i =1

=1

ESPERANA, =

x E( X )

E(X) = p i x i

quando
n

(d ) VARINCIA S 2 =
VAR ( X ) =
2
n (x x) f
n
i
i
2

(
x

x
)
pi

i
i =1
n 1
ii =1

S 2 VAR( X )
quando
n

Valor esperado e Varincia para uma Funo de Variveis Aleatrias


Se Y = aX + b
onde X uma varivel aleatria e a e b so valores constantes conhecidos, ento,
E(Y) = a E(X) + b
var(Y ) = a 2 var( X )
Portanto, Y = a 2 var( X ) = a 2 x2 = a X

137

e
Semelhantemente se T = a X + b Y + c onde X e Y so variveis aleatrias e a, b e c so
constantes conhecidas, ento,
E(T) = a E (X) + b E (Y) + c.
e

Var (T ) = a 2 var( X ) + b 2 var(Y ) + 2ab cov( X , Y )

Em particular, se X e Y so independentes ento a covarincia cov(X,Y) zero. Portanto

Var (T ) = a 2 var( X ) + b 2 var(Y )

Prova: Segue das definies de E(X) e var(X).

Exemplo - Lucro previsto estimado


Uma companhia faz produtos para mercados locais e de exportao.
O nmero de vendas do prximo ano no pode ser predito exatamente mas estimativas
podem ser feitas como a seguir
unidades de X,local

1,000

3,000

5,000

10,000

Probabilidade

0.1

0.3

0.4

0.2

unidades Y, export.

300

500

700

Probabilidade

0.4

0.5

0.1

Conseqentemente E(X) = 1000 x 0.1 + 3000 x 0.3 + 5000 x 0.4 + 10000 x 0.2
= 5000 (= esperou vendas locais)
E(Y) = 300 x 0.4 + 500 x 0.5 + 700 x 0.1
= 440 (= vendas de exportao esperadas)
A companhia lucra $2000 em cada unidade vendida no mercado local e $3500 em cada
unidade exportada.

138

Consequentemente o lucro total


T = 2000 X + 3500 Y
Usando a frmula acima
E(T) = 2000 E(X) + 3500 E(Y)
= 2000 x 5000 + 3500 x 440
= $11,540,000
- este o lucro estimado (previsto) durante o prximo ano.
Exemplo - Fabricao de um componente de metal
Um componente feito cortando um pedao de metal de comprimento X e reduzindo este
valor da quantidade Y. Ambos estes processos so um pouco imprecisos.
O comprimento lquido ento
T = X - Y.
Isto pode ser escrito na forma T = a X + b Y com a = 1 e b = -1
assim
E(T) = a E (X) + b E (Y) = 1 E(X) + (-1)E(Y)
= E(X) - E(Y)

Var (T ) = a 2 var( X ) + b 2 var(Y )


Por tan to var(T) = 12 var( X ) + (1) 2 var(Y )
= var(X) + var(Y)
ou seja, var(T) maior tanto que var(X) ou var(Y), embora T = X - Y, porque X e Y
contribuem variabilidade em T.

139

Variveis Aleatrias Independentes


Lembremos que dois eventos A e B so independentes se e somente se P(A e B) =
P(A)P(B) se a probabilidade da interseo de A e B o produto das probabilidades de A
e de B. Podemos relacionar variveis aleatrias a eventos, ou seja, podemos definir
eventos em termos de valor(es) que uma varivel aleatria assume. Por exemplo, o evento
A = {a < X b) ocorre se X maior do que a e menor do que b. Duas variveis aleatrias,
X e Y,

so independentes se e somente se todo evento da forma {a < X b}

independente de todo evento da forma {c < Y d}. Duas variveis aleatrias so


independentes se conhecendo o valor de uma no ajuda a predizer o valor da outra.

Exemplos: Considere a jogada de uma moeda 10 vezes.

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas
4 jogadas. Portanto X e Y so independentes. Conhecer o valor de X no ajuda a predizer
o valor de Y e vice-versa.

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas
5 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X 6) e o
evento {-1 < Y 0} so dependentes (e mutuamente exclusivos).

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de coroas nas
primeiras 2 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X
6} e o evento {2 < Y 3} so dependentes (e mutuamente exclusivos).

Que espcies de experimentos conduzem a variveis aleatrias independentes? Somas e


mdias de seqncias que no se sobrepem seja de jogadas de moedas, de jogadas de

140

dados so alguns exemplos. O segundo e terceiro exemplo acima mostram porque existe a
necessidade das seqncias serem no sobrepostas (ou seja, no tenham interseco).

Valor Esperado do Produto de Variveis Aleatrias Independentes


Se as variveis aleatrias X e Y so independentes, Ento E[ X Y ] = E[ X ] E[Y ]
O inverso (recproca) no verdadeiro em geral: E[ X Y ] = E[ X ] E[Y ] no implica
que X e Y sejam independentes.

Apndice 4 (recordao)
A DISTRIBUIAO BINOMIAL DE PROBABILIDADE
Suponhamos que um experimento consista de tentativas repetidas, cada uma com
dois possveis resultados que podem ser vistos como sucesso ou fracasso. Uma aplicao
obvia na rea de cincias sociais aplicadas refere-se a um experimento que se refere a
selecionar repetidas vezes um elemento de amostra de uma populao que contenha
apenas duas categorias, por exemplo, pessoas que votaro em um determinado candidato
ou no. Consideremos que se a pessoa for votar no candidato teremos um resultado de
sucesso e se no for votar teremos um resultado de fracasso. Outro exemplo seria um jogo
de baralho em que extramos repetidas vezes uma carta do conjunto de 52 cartas. Neste
caso poderemos considerar como sucesso o resultado ser uma carta numrica e fracasso o
resultado ser uma carta de figura. A um experimento definido desta forma damos o nome
de processo Bernoulli. Podemos tambm definir uma varivel aleatria que ter valor X
= 1 se ocorrer sucesso e valor X = 0 se ocorrer fracasso. Desta forma tambm podemos
chamar tal varivel de varivel aleatria Bernoulli. Cada tentativa do experimento
denominada tentativa Bernoulli.
Podemos observar que tanto no exemplo do candidato como no exemplo das
cartas se a pessoa selecionada da populao de eleitores ou se a carta selecionada do
baralho no for reposta a probabilidade de um sucesso para as repetidas tentativas muda.
Suponhamos que a nossa populao de eleitores tenha 1000 pessoas e dentro desta

141

populao 300 votaro no candidato e 700 no votaro. Na primeira tentativa do


experimento (seleo da primeira pessoa) temos uma probabilidade de sucesso igual a
300 / 1000 = 0,3. Na segunda tentativa, se no for feita a reposio da primeira pessoa na
populao de origem, teremos uma probabilidade de sucesso igual a 299/999 caso tenha
ocorrido sucesso na primeira tentativa e igual a 300/299 caso tenha ocorrido fracasso na
primeira tentativa. Fica mais complicado de ver o que ocorrer na terceira tentativa, pois
o resultado ir depender do que ocorreu na primeira e na segunda tentativas. Neste caso
no teremos tentativas Bernoulli porque a probabilidade de sucesso no se mantm
constante no decorrer das tentativas seqenciais.
Iremos definir um processo Bernoulli da forma como segue. Estritamente falando, um
processo Bernoulli dever ter as seguintes propriedades:

1) O experimento consiste de n tentativas repetidas.


2) Cada tentativa tem um resultado que pode ser classificado como um sucesso ou um
fracasso.
3) A probabilidade de sucesso, denotada por p, permanece constante de tentativa para
tentativa.
4) As tentativas repetidas so independentes.

Considere um conjunto de tentativas Bernoulli onde trs itens so selecionados


aleatoriamente de um processo de fabricao. A seguir eles so inspecionados e
classificados como defeituosos ou no defeituosos. Um item defeituoso designado como
um sucesso. O numero de sucesso uma varivel aleatria X com valores de 0 a 3. O
espao amostral destes experimento definido por oito eventos:
S = {NNN, NDN, NND, DNN, NDD, DND, DDN, DDD}
Temos ento a seguinte tabela de resultados para esta varivel aleatria:

Resultado

NNN

NDN

142

NND

DNN

NDD

DND

DDN

DDD

Como os itens so selecionados independentemente de um processo que digamos, produz


25 % de defeituosos, teremos, por exemplo:

3 1 3 9
= 0,14
. . =
4 4 4 64

P(NDN) = P(N).P(D).P(N) =

Se no houvesse independncia estatstica entre as tentativas Bernoulli e se tivssemos


um lote de produo de 1000 pecas, teramos o seguinte resultado:

P( NDN ) = P ( N1 ).P ( D2 / N1 ).P ( N 3 / N1 D2 ) =

750 250 749

= 0,14086
1000 999 998
Como pode ser visto, existe uma pequena diferena no valor da probabilidade quando
calculamos considerando como tentativas Bernoulli (tentativas independentes e com
probabilidade de sucesso constante) e quando consideramos que as tentativas no so
independentes (neste ultimo caso no so tentativas Bernoulli).

Vamos agora calcular o valor das probabilidades para cada valor da varivel aleatria X
(numero de sucessos). Para isto construmos a seguinte tabela de distribuio de
probabilidades:

f(x) = P(X=x)

27/64

27/64

9/64

143

1/64

A varivel aleatria X que definida como o numero de sucessos chamada de varivel


aleatria Binomial. A distribuio de probabilidade chamada de distribuio binomial.
Podemos generalizar este resultado com a seguinte definio:

Distribuio binomial
Uma tentativa Bernoulli pode resultar em um sucesso com probabilidade p e com
fracasso com probabilidade q = 1- p. Ento a distribuio de probabilidade de uma
varivel aleatria binomial X, o numero de sucessos em n tentativas independentes,

n
b( x; n, p ) = p x q n x , x = 0,1,2,...,n.
x

5. Variveis Aleatrias Contnuas e Distribuio Normal

5.1 Variveis Aleatrias Contnuas


Diferentemente de uma varivel aleatria discreta, para uma varivel aleatria contnua
no podemos definir uma funo de distribuio de probabilidade (f.d.p.). No entanto,
podemos definir o que se chama de uma funo densidade de probabilidade para as
variveis aleatrias contnuas. Por exemplo, suponhamos uma distribuio uniforme do
tipo:

144

f(X)

1/10

15

Observe que f(X) uma funo constante assumindo sempre o valor 1/10 no intervalo
fechado

5 X 10 . Essa funo goza das seguintes propriedades:


f ( X ) 0 para qualquer valor de X.

1) ela sempre positiva ou nula. Ou seja,


2) se integrarmos esta funo no intervalo

5 X 10 o valor desta integral definida

ser igual a 1. Ou seja,


15

15

f ( X )dx = 1 / 10dx = [ x / 10]155 =


5

15 5
=1
10 10

Toda funo que satisfizer essas duas propriedades chamaremos de funo densidade de
probabilidade. Essa funo apenas um instrumento matemtico para que possamos
calcular probabilidades para variveis aleatrias contnuas (assim como utilizamos a
funo distribuio de probabilidade para as variveis aleatrias discretas). Por exemplo,
para o exemplo acima, se quisermos calcular a probabilidade da varivel aleatria
contnua X estar contida no intervalo 10

P (10 X 12) =

12

10

X 12 ser:

12

f ( X )dx = (1 / 10)dx = [ x / 10]1210 =


10

12 10

= 2 / 10
10 10

Dessa forma, podemos calcular a probabilidade para qualquer intervalo sendo esta
probabilidade o valor da integral definida da funo densidade de probabilidade sendo
145

que os limites de integrao so as extremidades do intervalo. De uma forma geral,


podemos dizer que se f(X) a funo densidade de probabilidade de uma varivel
aleatria contnua, ento:

P (a X b) = f ( X )dx
a

5.2 Mdia e Varincia de uma Varivel Aleatria Contnua


A mdia (ou valor esperado) de uma varivel aleatria contnua dada pela expresso:
+

E[ X ] =

Xf ( X )dx

No exemplo anterior, o valor esperado da varivel aleatria X ser:


+

15

x2
E[ X ] = Xf ( X )dx = X (1 / 10)dx = =
20 5

5
225 25

= 10
20 20
15

A varincia de uma varivel aleatria contnua dada pela expresso:

V[X ] =

( X E[ X ])

f ( X )dx

No exemplo anterior, a varincia da varivel aleatria X ser:


+

V[X ] =

( X E[ X ])

15

15

X2
(
5 10 2 X + 10)dx =

f ( X )dx = ( X 10) 2 (1 / 10)dx =


5

15

X3

X 2 + 10 X = 8,333

30
5

146

COVARIANCIA ENTRE DUAS VARIAVEIS ALEATORIAS

Covarincia uma medida de associao (relao) linear entre duas variveis aleatrias.
Se X e Y so duas v.a., a covarincia entre elas definida por:
Cov(X,Y) = E[(X-E(X))(Y-E(Y))]
Desta forma a covarincia entre duas variveis X e Y igual a mdia de uma varivel
aleatria Z que por sua vez o produto dos desvios de cada uma das duas variveis X e Y
em relao as suas respectivas medias.
Exemplifiquemos com o seguinte quadro de distribuio conjunta de duas variveis
aleatrias discretas X e Y:

X
Y
1
2
3
P(x)

P(y)

3/20
1/20
4/20
8/20

3/20
1/20
1/20
5/20

2/20
2/20
3/20
7/20

8/20
4/20
8/20
1

Para interpretar este quadro, podemos dizer que a probabilidade conjunta de X = 1 e Y =


2 P(X=1,Y=2) = 1/20. A probabilidade marginal de X = 1 P(X=1) = 5/20. A
probabilidade condicional de X = 2 dado que Y = 1
P(Y = 2 / X = 1) =

P( X = 1, Y = 2) 1/ 20 1
=
=
5 / 20 5
P ( X = 1)

A distribuio de probabilidade da varivel aleatria Z = (X-E(X))(Y-E(Y)) a prpria


distribuio de probabilidade conjunta dada no quadro acima para as variveis X e Y.
Como a covarincia uma esperana temos que:
Cov ( X , Y ) = E[( X E ( X ))(Y E (Y )] =

( X E ( X ))(Y E (Y )) p( X , Y )

Ou seja, a covarincia o somatrio do produto da varivel Z = (X-E(X))(Y-E(Y)) pelas


probabilidades conjuntas. Para calcular a covarincia devemos calcular as esperanas
(medias) de X e Y. Estas so:

147

8
5
7 19
+ 1
+ 2
=
20
20
20 20
8
4
8
E (Y ) = 1
+ 2
+ 3
=2
20
20
20
E( X ) = 0

No exemplo do quadro acima a covarincia igual a:


19
3
19
3
19
2
) (1 2)
+ (1 ) (1 2)
+ (2 ) (1 2)
20
20
20
20
20
20
19
1
19
1
19
2
+ (0 ) (2 2)
+ (1 ) (2 2)
+ (2 ) (2 2)
20
20
20
20
20
20
19
4
19
1
19
3
+ (0 ) (3 2)
+ (1 ) (3 2)
+ (2 ) (3 2)
=0
20
20
20
20
20
20

Cov( X , Y ) = (0

Um outro mtodo (mais fcil) de se calcular a covarincia dado pela expresso:


Cov ( X , Y ) = E ( XY ) E ( X ).E (Y )

Exerccio: Demonstre a validade da expresso acima


Sabemos que a definio de covarincia :
Cov(X,Y) = E[(X-E(X))(Y-E(Y))]
Podemos desenvolver o segundo termo desta expresso da seguinte forma:
Cov( X , Y ) = E ( XY E ( X )Y E (Y ) X + E ( X ) E (Y )) =
E ( XY ) E ( X ).E (Y ) E (Y ).E ( X ) + E ( X ).E (Y ) = E ( XY ) E ( X ) E (Y )

Apliquemos esta expresso aos dados do quadro acima para calcular a covarincia:
Para isto precisamos calcular E(XY). Para fazer isto devemos para cada valor do quadro
(para cada dupla de valores de X e Y) calculamos o valor do produto XY e multiplicamos
pela probabilidade conjunta.
E ( XY ) = 0.1.3 / 20 + 1.1.3 / 20 + 2.1.2 / 20 + 0.2.1/ 20 + 1.2.1/ 20 + 2.2.2 / 20
+0.3.4 / 20 + 1.3.1/ 20 + 2.3.3 / 20 = 1,9

Portanto a covarincia ser:


Cov ( X , Y ) = 1,9 (0,95).(2) = 0

Conclumos que as duas variveis aleatrias X e Y so no correlacionadas.

Se X e Y so duas variveis aleatrias independentes, ento Cov(X,Y) = 0

148

Mas a recproca no verdadeira. O fato de Cov(X,Y) = 0 no implica


necessariamente que X e Y sejam independentes.

Para o ultimo exemplo, verificamos que Cov(X,Y) = 0. No entanto vamos verificar que
estas duas variveis no so independentes. Para que X e Y sejam independentes
estritamente necessrio que P(X,Y) = P(X).P(Y) para todos os valores de X e Y. Ou seja,
para todas as clulas da distribuio de probabilidade conjunta, o valor da probabilidade
conjunta deve ser igual ao produto das probabilidades marginais respectivas.
Verifiquemos esta propriedade para o quadro de distribuio de probabilidade conjunta
anterior.

X
Y
1

P(x)

3/20
8/20.8/20
16/400
1/20
4/20.8/20
32/400
4/20
8/20.8/20
56/400
8/20

3/20
= 8/20.5/20
40/400
1/20
= 4/20.5/20
20/400
1/20
= 8/20.5/20
40/400
5/20

2/20
8/20.7/20
56/400
2/20
4/20.7/20
28/400
3/20
8/20.7/20
56/400
7/20

P(y)
8/20
=
4/20
=
8/20
=
1

No quadro acima os valores em negrito so as probabilidades conjuntas e logo em seguida


vem o calculo do produto das probabilidades marginais respectivas. Observe-se que para
a primeira clula temos P(X=0,Y=1) = 3/20 = 0,15 e P(X=0).P(Y=1) = 16/400 = 0,04. Na
segunda clula da primeira linha temos P(X=1,Y=1) = 3/20 = 0,15 e P(X=1).P(Y=1) =
40/400 = 0,1. Portanto em nenhuma destas duas clulas a probabilidade conjunta coincide
com o produto das probabilidades marginais respectivas. Bastava que para apenas uma
das clulas no ocorresse a igualdade de probabilidades e as variveis aleatrias j seriam
dependentes. Para que ocorra independncia perfeita entre as variveis aleatrias
necessrio que para todas as clulas da distribuio de probabilidade conjunta ocorra a
igualdade entre a probabilidade conjunta e o produto das probabilidades marginais
respectivas.

149

Sejam X e Y duas variveis quaisquer. Ento


Var(X + Y) = Var(X) + Var(Y) + 2 Cov(X,Y)
No caso de X e Y serem independentes temos o caso particular de
Var(X + Y) = Var(X) + Var(Y) j que Cov(X,Y) = 0

Exerccio: Demonstre teoricamente a expresso acima. Var(X + Y) = Var(X) + Var(Y) +


2 Cov(X,Y)

Para mais de duas variveis independentes:


Var(X1+ X2 + ......+ Xn) = Var(X1)+ Var(X2)+...+ Var(Xn)

COVARIANCIA PARA VARIAVEIS ALEATORIAS CONTINUAS


Se X e Y so duas variveis aleatrias continuas a covarincia dada pela seguinte
expresso:

Cov( X , Y ) = E[( X E ( X )).(Y E (Y ))] =

(x

)( y Y )dxdy

Exemplo: suponhamos que duas variveis aleatrias continuas X e Y tenham a seguinte


funo de densidade conjunta.
8 xy,
f ( x, y ) =
0,

0 x 1,0 y x
para outros valores

Em primeiro lugar calculamos as funes de densidade marginais.

g ( x) =

f ( x, y )dy =

8 xydy =8 x ydy =8 x.
0

x2
= 4 x3
2

Portanto a funo de densidade de probabilidade marginal para a varivel aleatria X :


4 x3
g ( x) =
0

0 x 1
para outros valores

150

Da mesma forma podemos determinar a funo de densidade de probabilidade marginal


de Y da seguinte forma:

h( y ) =

f ( x, y )dx =

8 xydx =8 y xdx =8 y.

12 y 2
= 4 y (1 y 2 )
2

Portanto a funo de densidade de probabilidade marginal para a varivel aleatria Y :


4 y (1 y 2 )
0 y 1
g ( y) =
para outros valores
0

As esperanas matemticas (medias) de X e Y so calculadas como:


1

X = E ( X ) = x.4 x3 dx = 4 / 5
0

Y = E (Y ) = y.4 y (1 y 2 )dy = 8 /15


0

1 1

E ( XY ) =

8x y dxdy = 9
3 2

0 y

Cov ( X , Y ) = XY = E ( XY ) X Y =

4 4 8
4
=
9 5
15 225

importante destacar que a varincia de uma varivel aleatria pode ser interpretada
como a covarincia desta varivel com relao a ela mesma. Ou seja,
Cov( X , X ) = E[( X X )( X X )] = E[( X X ) 2 ] = Var ( X )

Qual a interpretao pratica da covarincia?


A covarincia serve para verificar se duas variveis aleatrias movimentam-se ou no no
mesmo sentido. Por exemplo, se quando uma varivel X aumenta a varivel Y tambm
aumenta e se quando X diminui, Y tambm diminui (as variveis) movimentam-se,
covariam no mesmo sentido, a covarincia positiva. Ao contrario, quando X aumenta, Y
diminui ou quando X diminui, Y aumenta, ou seja, as variveis covariam em sentidos
opostos, a covarincia negativa.
Podemos calcular a covarincia, quando temos a distribuio de probabilidade conjunta
como foi mostrado anteriormente. Mas podemos tambm calcular a covarincia se

151

tivermos um conjunto de dados observados para as variveis X e Y. Por exemplo,


utilizemos o exemplo 4.4 da pagina 81 do Morettin.

Na figura a seguir temos o grfico de disperso das variveis X e Y referente a tabela a


seguir. Neste grfico temos os pares de valores (x,y).
Agente
A
B
C
D
E
F
G
H
I
J

Anos de servio (X)


2
3
4
5
4
6
7
8
8
10

Nmero de clientes (Y)


48
50
56
52
43
60
62
58
64
72

40

Nmero de clientes (Y)


50
60

70

Diagrama de disperso para as variveis X (anos de servio) e Y (numero de clientes)

6
Anos de servio (X)

152

10

Na figura a seguir apresentamos a planilha Excel para o calculo da covarincia e do


coeficiente de correlao. Na quarta e quinta colunas da planilha temos os valores das
variveis subtrados das suas medias. Na sexta coluna temos o produto destas duas
ultimas colunas. A media desta ultima coluna o valor da covarincia. Finalmente nas
duas ultimas colunas calculamos os desvios ao quadrado das variveis em relao as suas
medias (para podermos calcular a varincia e o desvio padro de cada uma delas).
Finalmente, calculamos o coeficiente de correlao como sendo a diviso entre a
covarincia e o produto dos desvios padres de X e de Y.

153

154

Problemas Resolvidos
Problema 31, pg 228 (Morettin)
Casal
1
2
3
4
5
6
7
8
9
10

Rendimento
(X)
10
10
5
10
15
10
5
15
10
5

do Homem Rendimento da Mulher (Y)


5
10
5
5
5
10
10
10
10
10

(a) Construa a distribuio de probabilidade conjunta de X e Y


(b) Determine as distribuies marginais de X e Y
(c) X e Y so v.a. Independentes? Justifique.
(d) Calcule as medias e varincias de X e Y e a covarincia entre elas.
(e) Considere a varivel aleatria Z igual a soma dos rendimentos de cada homem e cada
mulher. Calcule a media e varincia de Z.
(f) Supondo que todos os casais tenham a renda de um ano disponvel, e que se oferecera
ao casal escolhido a possibilidade de comprar uma casa pelo preo de 20, qual a
probabilidade de que o casal escolhido possa efetuar a compra?

Soluo
(a) Para a varivel X temos a ocorrncia de 3 valores (5, 10 e 15) e para a varivel Y
temos a ocorrncia de 2 valores (5 e 10). Iremos construir a distribuio de
probabilidade conjunta de acordo com a freqncia relativa de ocorrncia destes
valores conjuntos. Por exemplo, em 10 observaes (casais) vemos que o par
(X=10, Y = 5) ocorre 2 vezes. Portanto a freqncia relativa 2 /10 = 0,2 e este
o valor da probabilidade conjunta de X = 10 e Y = 5. Desta forma a nossa
distribuio de probabilidade conjunta :\
(b)

155

X
Y
5
10
p(X)

10

15

p(Y)

1/10
2/10
3/10

2/10
3/10
5/10

1/10
1/10
2/10

4/10
6/10
1

(b) As distribuies marginais j foram calculadas na Tabela acima


(c) Para verificar se X e Y so independentes, verifiquemos se o produto das
probabilidades marginais igual a probabilidade conjunta para todas as clulas. Para a
primeira clula no canto superior esquerdo, temos P(X=5).P(Y=5) = 3/10 . 4/10 = 12
/100 que diferente de 1/10 e desta forma j constatamos a no independncia entre X e
Y.
(d) A mdia de X E[X] = 5. 3/10 + 10. 5/10 + 15 . 2/10 = 15/10 + 50/10 + 30/10 =
95/10 = 9,5. A media de Y E[Y] = 5. 4/10 + 10 . 6/10 = 20/10 + 60/10 = 8.
A varincia de X pode ser calculada como E[X2] (E[X])2
= 52.

3
5
2
+ 102. + 152. 9,52 = 12, 25
10
10
10

A Varincia de Y E[Y 2 ] ( E[Y ])2 = 52.4 /10 + 102.6 /10 82 = 10 + 60 64 = 6


A covarincia pode ser calculada de trs formas. Na primeira forma, consideramos a
expresso da prpria definio de covarincia.
Cov ( X , Y ) = E[( X X )(Y Y )] =
= (5 9,5)(5 8)

Na

)(Y Y ) p XY

1
2
1
+ (10 9,5)(5 8) + ... + (15 9,5)(10 8) = 1
10
10
10

segunda

Cov ( X , Y ) = E ( XY ) E ( X ) E (Y ) =
5.5.

(X
forma,

XYp

XY

utilizamos
E ( X ) E (Y ) =

1
2
1
2
3
1
+ 5.10. + 5.15. + 10.5. + 5.10. + 10.15. 9,5 8 = 1
10
10
10
10
10
10

O coeficiente de correlao calculado como:

156

expresso

cov( X , Y )

X Y

1
12, 25 6

= 0,1166

10

Diagrama de disperso para as variveis X e Y

10
X

157

15

Planilha Excel para o calculo da covarincia pelos 3 metodos:

158

Problema 35 pagina 229 do MORETTIN

Se E[X] = e Var(X) = 2 , escreva em funo de e 2 as seguintes expresses:


(a) E(X2)

(b) E[(X(X-1)]

Soluo:
(a) E ( X 2 ) = Var ( X ) + ( E ( X ) )2 = 2 + 2
(b)

E[ X ( X 1)] = E[ X 2 X ] = E[ X 2 ] E[ X ] = Var ( X ) + ( E[ X ])2 E[ X ] =

2 + 2 = 2 + ( 1)

Problema 39 pagina 229 do MORETTIN


Se ( X , Y ) for o coeficiente de correlao entre X e Y, e se tivermos Z = AX + B, W = CY + D,
com A > 0, C > 0, prove que ( X , Y ) = ( Z , W )

Soluo:
Cov( Z , W ) = Cov( AX + B, CY + D) = E[( AX + B )(CY + D)] E[ AX + B].E[CY + D ]
= E[ ACXY + ADX + BCY + BD] ( E[ AX ] + E[ B]).( E[CY ] + E[ D]) =
cov( Z , W )
( Z ,W ) =
Mas AC.E[ XY ] + AD.E[ X ] + BC.E[Y ] + E[ BD] ( A.E[ X ] + B).(C.E[Y ] + D) =
Z W
AC.E[ XY ] + AD.E[ X ] + BC.E[Y ] + BD ( AC.E[ X ].E[Y ] + AD.E[ X ] + BC.E[Y ] + BD) =
AC.E[ XY ] ACE[ X ].E[Y ] = AC.Cov( X , Y )

Z = AX + B = A X pois Var(AX+B)=A 2Var ( X ) e da mesma forma W = C Y

Portanto ( Z , W ) =

cov( Z , W )

Z W

AC cov( X , Y )
= ( X ,Y )
A X C Y

interessante notar que a condio imposta pelo MORETTIN de que A > 0 e C > 0 no
necessria.

Problema 41 pagina 230 do MORETTIN


Suponha que X e Y sejam v.a. com Var(X) = 1, Var(Y) = 2 e ( X , Y ) = 1/ 2 . Determine Var(X2Y)
Soluo:

159

Var ( X 2Y ) = Var ( X ) + Var (2Y ) 2Cov( X , 2Y ) =


Var ( X ) + 4Var (Y ) 2( E[2 XY ] E[ X ].E[2Y ]) =
Var ( X ) + 4Var (Y ) 2(2 E[ XY ] 2 E[ X ].E[Y ]) =
Var ( X ) + 4Var (Y ) 4Cov ( X , Y ) =
Var ( X ) + 4Var (Y ) 4 ( X , Y ). X Y =
1
1 + 4.2 4. .1. 2 = 11,83
2

Recordao: VARIANCIA E COVARIANCIA


A media ou valor esperado de uma varivel aleatria X de especial importncia na
estatstica porque ela descreve onde a distribuio de probabilidade est centrada. Por ela
mesma, entretanto, a media no d nenhuma noo adequada da distribuio ou da forma
da distribuio da varivel aleatria. Precisamos caracterizar a variabilidade da
distribuio.
Definio
Seja X uma varivel aleatria com distribuio de probabilidade f(x) e media . A
variancia de X
2 = E[( X ) 2 ] = ( x ) 2 f ( x)
se X uma variavel aleatoria discreta
x

2 = E[( X ) 2 ] = ( x ) 2 f ( x)dx se X uma variavel aleatoria continua

A raiz quadrada da varincia, , chamada de desvio padro de X.


Estas so as definies de varincia quando estamos considerando a estatstica antes da
realizao do experimento aleatrio, ou seja, trata-se de um calculo baseado em um
modelo probabilstico (a distribuio de probabilidade no caso de varivel aleatria
discreta ou a funo de densidade de probabilidade no caso de varivel aleatria
continua). Quando estamos enfocando a estatstica aps a realizao do experimento
aleatrio temos uma formula distinta para a varincia que :
N

2 =

(x )

i =1

para o caso de uma populao

N
n

s2 =

(x )
i =1

n 1

para o caso de uma amostra

160

A quantidade x chamada desvio de uma observao em relao a media da


distribuio. Como estes desvios so elevados ao quadrado e depois calculada a media
destes valores ao quadrado. 2 ser menor se os valores de x estiverem mais prximos
da media e ser maior de os valores de x estiverem mais afastados desta media .
Exemplo:
Seja X uma varivel aleatria representada pelo numero de automveis que so usados
para propsitos de negcios oficiais em qualquer dia da semana. A distribuio de
probabilidade para a companhia A dada por
x
f(x)

1
0,3

2
0,4

3
0,3

e para a companhia B dada por


x
f(x)

0
0,2

1
0,1

2
0,3

3
0,3

4
0,1

Mostre a companhia A, a mdia dada por

= E ( X ) = (1)(0,3) + (2)(0,4) + (3)(0,3) = 2,0


E a varincia dada por
3

2 = ( x 2) 2 f ( x) = (1 2) 2 (0,3) + (2 2) 2 (0,4) + (3 2) 2 (0,3) = 0,6


i =1

Para a companhia A, temos

= E ( X ) = (0)(0,2) + (1)(0,3) + (2)(0,3) + (3)(0,3) + (4)(0,1) = 2,0


E a varincia dada por
4

2 = ( x 2) 2 f ( x) = (0 2) 2 (0,2) + (1 2) 2 (0,1) + (2 2) 2 (0,3) + (3 2) 2 (0,3) + (4 2) 2 (0,1) = 1,6


i =1

A varincia para o numero de automveis maior para a companhia B do que para a


companhia A.
A varincia pode ser obtida tambm atravs de uma formula mais simples.

161

2 = ( x ) 2 f ( x) = ( x 2 2 x + 2 ) f ( x) = x 2 f ( x) 2 xf ( x) + 2 f ( x)
x

Como = xf ( x) por definio e


x

f ( x) = 1 para qualquer distribuio de


x

probabilidade discreta, segue-se que

2 = x 2 f ( x) 2 = E ( X 2 ) 2
x

Exemplo: Seja a varivel aleatria X que representa o numero de peas defeituosas para
uma maquina quando 3 peas so selecionadas da linha de produo e testadas. Temos
ento a seguinte distribuio de probabilidade para X:
x
f(x)

0
0,51

1
0,38

2
0,10

3
0,01

Utilizando a ultima expresso, calcule 2 .


Soluo:

= (0)(0,51) + (1)(0,38) + (2)(0,10) + (3)(0,01) = 0,61


E ( X 2 ) = (0)(0,51) + (1)(0,38) + (4)(0,10) + (9)(0,01) = 0,87

Portanto: 2 = 0,87 (0,61) 2 = 0,4979


Exemplo: A demanda semanal por uma marca de refrigerante, em milhares de litros uma
varivel aleatria continua X com densidade de probabilidade
2( x 1), 1 < x < 2
f ( x) =
0, para quaisquer outros valores
Ache a media e a varincia de X.

Soluo:
2

= E ( X ) = 2 x( x 1)dx =
1

5
3

e
2

E ( X 2 ) = 2 x 2 ( x 1)dx =
1

17
6

162

Portanto:
2

17 5
7
= =
6 3
18
2

Neste ponto a varincia ou desvio padro somente tem significado quando comparamos
duas ou mais distribuies que tem as mesmas unidades de medida. Portanto, podemos
comparar as varincias das distribuies dos contedos, medidos em litros, para duas
companhias engarrafadoras de suco de laranja e o maior valor indicar a companhia cujo
produto mais varivel ou menos uniforme. No tem significado comparar a varincia da
distribuio de alturas de pessoas com a varincia da distribuio dos coeficientes de
inteligncia (Q.I.).
Agora vamos estender nosso conceito de varincia de uma varivel aleatria X para
tambm incluir variveis aleatrias relacionadas a X. Para a varivel aleatria g(X), a
varincia ser denotada por g2( X ) e calculada por meio dos seguintes teoremas.
Teorema: Seja X uma varivel aleatria com distribuio de probabilidade f(x). A mdia
ou valor esperado da varivel aleatria g(X)

g ( X ) = E [ g ( X ) ] = g ( x ) f ( x ) se X discreta, e
x

g ( X ) = E [ g ( X ) ] =

g ( x ) f ( x )dx

se X contnua

Exemplo: Suponha que o numero de carros, X, que passam atravs de uma lavadora de
carros entre 4 hs e 5 hs da tarde em qualquer sexta-feira ensolarada tem a seguinte
distribuio de probabilidade:

x
P(X=x)

4
1/12

5
1/12

6
1/4

7
1/4

8
1/6

9
1/6

Seja g(X) = 2X 1 que representa a quantidade de dinheiro em reais, paga ao lavador


pelo proprietrio. Encontre o ganho esperado do lavador para este perodo de tempo
particular.
Soluo:

163

g ( X ) = E [ g ( X ) ] = E [ 2 X 1 ] = (2 x 1) f ( x ) = (7)(
4

1
1
1
) + (9)( ) + (11)
12
12
4

1
1
1
(13)( ) + (15) + (17)( ) = R$12, 67
4
6
6

Teorema.
Seja X uma varivel aleatria com distribuiao de probabilidade f(x). A varincia da
varivel aleatria g(X)

g2( X ) = E g ( X ) g ( X )

} = g ( X )

g( X )

f ( x )

Se X discreta, e

g2( X ) = E g ( X ) g ( X )

g ( X )

g( X )

f ( x )dx

Se X contnua.
No vamos nos preocupar com a demonstrao deste teorema.

Exemplo: Calcule a varincia de g(X) = 2X + 3, onde X uma varivel aleatria com


distribuio de probabilidade
x
f(x)

0
1/4

1
1/8

2
1/2

3
1/8

Soluo:
3

2 X + 3 = E [ 2 X + 3 ] = (2 x + 3) f ( x ) = 6
x =0

2
2 X +3

=E

{ [(2 X + 3)

2 X +3

]2

} = E { [ 2 X + 3 6 ] } = E 4 X
2

= (4 x 2 12 x + 9) f ( x ) = 4
x =0

Exemplo: Seja X uma varivel aleatria que tem funao densidade


x3
, -1 < x < 2
f ( x) = 3
0, para quaisquer outros valores

164

12 X + 9

Ache a varincia da varivel aleatria g(X) = 4X+3


2

E (4 X + 3) =

2
4 X +3

=E

(4 x + 3) x 2
1
3
2
1 3 dx = 3 1 (4 x + 3x )dx = 8

{ [ (4 X + 3) 8 ] }
2

2
2
2 x

= E (4 X 5) = (4 x 5)
dx
2
1

1
51
(16 x 4 40 x 3 + 25 x 2 )dx =

3 1
5

5.3 Varivel Aleatria Normal

A mais importante (e mais utilizada na prtica) varivel aleatria contnua a varivel


aleatria normal.

A varivel aleatria normal tem uma funo densidade de probabilidade (chamada de


curva normal) que apresenta a forma de um sino e unimodal no centro exato da
distribuio.

A mdia, mediana e a moda da distribuio normal so iguais e localizadas no pico da


distribuio.

Metade da rea sob a curva est acima do ponto central (pico) e a outra metade est
acima dele.

A distribuio de probabilidade normal simtrica em relao a sua mdia.

Ela assinttica  acurva aproxima-se cada vez mais do eixo X mas nunca toca
efetivamente ele.

Figura 1 Caractersticas de uma Funo Densidade de Probabilidade Normal


(Distribuio Normal)

165

Figura 2 Duas Distribuies Normais com mesma mdia mas distintos desvios padres

Podemos tambm ter distribuies normais com o mesmo desvio padro, mas com
distintas mdias ou com mdias e desvios padres distintos. Na realidade a distribuio
normal um nome genrico para definir uma famlia de infinitas distribuies normais
particulares, cada uma com os seus valores especficos de mdia e desvio padro. O que
caracteriza, portanto, e diferencia uma distribuio normal de outra so os valores destes
dois parmetros: a sua mdia e o seu desvio padro. A funo densidade de probabilidade
de uma varivel aleatria normal dada por:

f (X ) =

( X ) 2

1
2

2 2

possvel demonstrar matematicamente que a mdia (ou valor esperado) dessa varivel
aleatria igual ao seu parmetro
parmetro (da equao acima)

e o seu desvio padro igual ao seu segundo

. O que quer dizer que se aplicarmos as definies de

valor esperado e de varincia de uma varivel aleatria contnua a expresso acima

166

chegaremos aos resultados e 2 . O problema recamos em integrais mais difceis de


serem resolvidas:

E[ X ] =

Xf ( X )dx = X

( X ) 2

1
2

2 2

dx =

e
+

V[X ] =

( X E[ X ])

+
2

f ( X )dx =

( X )

( X ) 2

2 2

dx = 2

(talvez um bom matemtico possa fazer essa demonstrao, mas no o nosso caso pois
pretendermos ser bons em estatstica aplicada to somente).
possvel tambm demonstrar matematicamente que as duas abscissas no eixo X de
valor + e - correspondem a pontos de inflexo da curva normal. Para isto basta
obter a segunda derivada da funo densidade e provar que o seu valor muda de sinal no
ponto de inflexo mostrando que a a curvatura muda de sentido de cncava para convexa
ou vice-versa.

5.4 Distribuio Normal Padro


muito difcil ficarmos calculando probabilidades para distribuies normais atravs de
clculos de integrao. Para evitar este trabalho foi definida uma distribuio normal
particular chamada de distribuio normal padro. Esta distribuio tem as caractersticas
de ser uma distribuio normal com mdia (valor esperado) igual a zero e desvio padro
igual a 1. Em notao matemtica dizemos que:

Z ~ N(0,1)

Se X uma varivel aleatria normal com mdia diferente de zero e desvio padro
diferente de 1 podemos converter essa distribuio em uma distribuio normal padro
atravs da transformao linear:

167

Z=

Para que serve essa distribuio Z? Nada melhor que um exemplo para explicar isso.

Exemplo: As rendas mensais dos graduados em um curso de especializao em uma


grande empresa so normalmente distribudas com uma mdia de R$ 2000 e um desvio
padro de R$ 200. Qual o valor de Z para uma renda X de R$ 2200? R$ 1700?
X

2200 2000
=1
200

1700 2000
= 1,5
200

Para X = 2200  Z =

Para X = 1700  Z =

Um valor de Z = 1 indica que o valor de R$ 2200 est localizado 1 desvio padro

acima da mdia de R$ 2000.

Um valor de Z = -1,5 indica que o valor de R$ 1700 est localizado 1,5 desvio padro
abaixo da mdia de R$ 2000.

5.5 reas Abaixo da Curva Normal

Cerca de 68 % da rea sob a curva normal est entre menos um e mais um desvio
padro da mdia. Isto pode ser escrito como 1 .

Cerca de 95 % da rea sob a curva normal est entre menos dois e mais dois desvios
padres da mdia, escrito como 2 .

Praticamente toda (99,74 %) a rea sob a curva normal est entre menos trs e mais
trs desvios padres da mdia, escrito como 3 .

168

Exemplo 2:
O uso dirio de gua por pessoa em uma determinada cidade normalmente distribudo
com mdia igual a 20 litros e desvio padro igual a 5 litros. O uso dirio de cerca de
68 % das pessoas nesta cidade caem entre que valores?

1 = 20 1 (5) . Ou seja, cerca de 68 % das pessoas usam de 15 a 25 litros de


gua por dia.

Similarmente, para 95 % e 99 %, os intervalos sero de 10 a 30 litros e 5 a 35 litros.

Qual a probabilidade de que uma pessoa selecionada ao acaso usar menos do que 20
litros por dia ?

O valor de Z Z = (20 20) / 5 = 0. Portanto P(X < 20) = P(Z < 0) = 0,5.
169

Qual a probabilidade de que uma pessoa selecionada ao acaso use mais do que 20 litros
por dia ?

O valor de Z Z = (20 20) / 5 = 0. Portanto P(X > 20) = P(Z > 0) = 0,5.

Que percentagem da populao usa entre 20 e 24 litros por dia ?

X = 20

 Z=0

X = 24

 Z=

24 20
= 0,8
5

P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).

Que percentagem usa entre 16 e 20 litros ?

X = 16

 Z=

X = 20

16 20
= 0,8
5

Z=0

P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P(0 < Z < 0,8) = 0,2881 = 28,81

Para a obteno das probabilidades para a curva normal padro Z consulta-se uma tabela
que pode ser encontrada em anexo em praticamente todos os livros de estatstica.
Reproduziremos a seguir integralmente essa tabela (para que possa ser mostrado para os
exemplos anteriores como foram obtidas as reas (que so probabilidades) abaixo da
curva norma Z. Resolvemos colocar a tabela no corpo do texto devido a sua grande
importncia em estatstica aplicada (e achamos que ela no deve ser relegada a um anexo
que poucos alunos tem a curiosidade de consultar).

170

Tabela 1 Valor de P(0 < Z < Z0) onde Z varivel normal padro
Z0

Segunda decimal de Z0
0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,0000

0,0040

0,0080

0,0120

0,0160

0,0199

0,0239

0,0279

0,0319

0,0359

0,1

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753

0,2

0,0793

0,0832

0,0871

0,1103

0,1141

0,3

0,1179

0,1217

0,1255

0,1480

0,1517

0,4

0,1554

0,1591

0,1628

0,1844

0,1879

0,5

0,1915

0,1950

0,1985

0,2190

0,2224

0,6

0,2257

0,2291

0,2324

0,2517

0,2549

0,7

0,2580

0,2611

0,2642

0,2823

0,2852

0,8

0,2881

0,2910

0,2939

0,3106

0,3133

0,9

0,3159

0,3186

0,3212

0,3365

0,3389

1,0

0,3413

0,3438

0,3461

0,3599

0,3621

1,1

0,3643

0,3665

0,3686

0,3810

0,3830

1,2

0,3849

0,3869

0,3888

0,3997

0,4015

1,3

0,4032

0,4049

0,4066

0,4162

0,4177

1,4

0,4192

0,4207

0,4222

0,4306

0,4319

1,5

0,4332

0,4345

0,4357

0,4429

0,4441

1,6

0,4452

0,4463

0,4474

0,4535

0,4545

1,7

0,4554

0,4564

0,4573

0,4625

0,4633

1,8

0,4641

0,4649

0,4658

0,4699

0,4706

1,9

0,4713

0,4719

0,4726

0,4761

0,4767

2,0

0,4772

0,4778

0,4783

0,4812

0,4817

2,1

0,4821

0,4826

0,4830

0,4854

0,4857

2,2

0,4861

0,4864

0,4868

0,4887

0,4890

2,3

0,4893

0,4896

0,4898

0,4913

0,4916

2,4

0,4918

0,4920

0,4922

0,4934

0,4936

2,5

0,4938

0,4940

0,4941

0,4951

0,4952

2,6

0,4953

0,4955

0,4956

0,4963

0,4964

2,7

0,4965

0,4966

0,4967

0,4973

0,4974

2,8

0,4974

0,4975

0,4976

0,4980

0,4981

2,9

0,4981

0,4982

0,4982

0,4986

0,4986

171

3,0

0,4987

0,4987

0,4987

0,4990

0,4990

Qual a probabilidade de que uma pessoa selecionada ao acaso use mias do que 28 litros ?

X = 28  Z = (28 20 )/ 5 = 1,6
P( X > 28) = P (Z > 1,6) = 0,5 - 0,4452 = 0,0548

172

Qual a porcentagem entre 18 e 26 litros ?

X = 18  Z =

18 20
= 0,4
5

X = 26  Z =

26 20
= 1,2
5

P(18 < X < 26) = P(-0,4 < Z < 1,2) = 0,1554 + 0,3849 = 0,5403

Quantos litros ou mais 10 % da populao usam ? Em outras palavras,para os 10 % da


populao que mais consomem gua qual o valor mnimo desse consumo ?
Seja X a quantidade mnima. Portanto, precisamos encontrar X tal que P ( X X ' ) = 0,1
. Para achar o valor de Z correspondente veja no corpo (miolo) da tabela o valor de Z0 que
deixa uma rea entre 0 e Z0 igual a (0,5 0,1) = 0,4. O valor correspondente de Z0 1,28
(aproximadamente). Portanto, temos:
X '20
= 1,28
5

 X = 26,4. Ou seja, 10 % da populao usa no mnimo 26,4 litros por

dia (ver figura).

173

Exemplo 4

Um professor verificou que as mdias finais em seu curso de Estatstica tem distribuio normal
com uma mdia igual a 72 e desvio padro 5. Ele decide atribuir conceitos para o seu curso tal
que os melhores 15 % recebem grau A . Qual a mnima mdia que o estudante precisa receber
para obter um A ?
Seja X a mnima mdia. P ( X X ' ) = 0,15
O Z correspondente 1,04 (aproximadamente)
X '72
= 1,04 X' = 77,2
5

174

6. Mtodos de Amostragem e Distribuies Amostrais

OBJETIVOS DO CAPTULO:

Explicar porque em muitas situaes uma amostra a nica forma plausvel de


aprender alguma coisa sobre uma populao.

Explicar os mtodos de selecionar uma amostra

Distinguir entre amostragem probabilstica e amostragem no probabilstica

Definir e construir uma distribuio amostral de mdias amostrais

Explicar o Teorema do Limite Central e sua importncia para a Inferncia Estatstica

Calcular Intervalos de Confiana para Mdias e Propores

Determinar que tamanho uma amostra deve ter para estimar mdias e propores

Porque amostrar uma populao

Natureza destrutiva de certos testes

A impossibilidade fsica de checar todos os itens na populao

O custo de estudar todos os itens em uma populao freqentemente proibitivo

Muitas vezes as estimativas baseadas em uma amostra so mais precisas do que os


resultados obtidos atravs de um levantamento censitrio

Tempo muito elevado para a apurao de resultados em censos

INFERENCIA ESTATISTICA

O nome inferncia refere-se a operaes estatsticas em que com base em uma amostra
estabelecem-se afirmaes sobre uma populao. Uma populao qualquer conjunto de
objetos (pessoas, animais, coisas no querendo naturalmente coisificar os seres
humanos). Geralmente um conjunto bastante amplo de objetos, por exemplo as pessoas
de um determinado pais ou regio, os representantes de uma espcie animal no planeta e
assim por diante. Os elementos de uma populao podem ser enumerveis ou no

175

enumerveis. So enumerveis quando podemos identificar cada um dos elementos e


relacionar, por exemplo, um numero inteiro a cada um deles. Assim se por exemplo
estivermos estudando uma varivel X, a renda pessoal de cada uma das pessoas desta
populao, a renda da primeira pessoa ser X1, a renda da pessoa ser X2 e a renda da
ultima pessoa da populao ser XN se a populao tiver N elementos.
Muitas vezes, na maior parte dos casos no se examinam todos os elementos da
populao, por razoes de custo da pesquisa e de tempo. Ento seleciona-se uma amostra
de elementos da populao. No caso em que investigamos todos os elementos da
populao a pesquisa comumente chamada de censo, como o caso do Censo
Demogrfico do IBGE que realizado de 10 em 10 anos.
Os levantamentos por amostragem esto sujeitos a um erro denominado erro de
amostragem ou erro amostral. Estes erros tem natureza probabilstica, pois no podemos
prever ou antecipar qual ser o erro exato da amostra mas podemos calcular
probabilidades de que o erro seja de um determinado valor. E mesmo isto s possvel
quando nossa amostra probabilstica. Uma amostra probabilstica uma amostra cuja
seleo definida em termos de probabilidades de seleo dos elementos da populao.
Se definimos um regra de seleo da amostra a partir dos elementos da populao
atribuindo valores bem precisos de probabilidades de seleo para todos os elementos da
populao, dizemos que a amostra probabilstica. Por exemplo, podemos dizer que a
probabilidade de seleo de cada elemento da populao na amostra um numero que
deve ser diretamente proporcional a idade dos elementos. Ento se um individuo tiver 30
anos ele ter o dobro da chance de ser selecionado que um individuo de 15 anos. Alem
disto as probabilidades somadas de todos os indivduos da populao deve perfazer um
total exatamente igual a 1. Dizemos ento que P(Xi) = k . Idadei

P( X ) = 1 . Se tivermos uma populao com 10 indivduos com as seguintes idades


i

i =1

(10,20,30,40,50,60,70,80,90,100) a probabilidade de seleo do primeiro individuo ser


igual a k.10, a probabilidade de seleo do segundo individuo ser k.20 e ento
k.10 + k.20 +....+ k.100 = 1 e portanto k = 1/550 e a probabilidade de seleo do primeiro
individuo ser igual a 10/550 = 0,01818 ,

176

a probabilidade de seleo do segundo

individuo ser 20/550 = 0,03636 e a probabilidade de seleo do ultimo individuo cuja


idade de 100 anos ser de 100/550 = 0,1818.
A amostra probabilstica mais comumente utilizada aquela chamada de amostra aleatria
simples que doravante chamaremos de AAS. Nesta todos os elementos da populao tem
a mesma probabilidade de serem selecionados. Por exemplo, suponhamos que temos uma
populao com N = 100 e desejamos selecionar uma amostra de tamanho n = 30. Se cada
elemento da populao tem a mesma chance de entrar na amostra ento a probabilidade
de seleo de cada um deles ser um numero constante e igual a 1/100. Esta ser a
probabilidade do elemento Xi ser selecionado na primeira extrao da amostra. Como a
seleo da amostra envolve 30 extraes aleatrias e independentes temos aqui um
problema mais complexo. Dizemos com maior rigor que uma amostra AAS se para cada
uma das extraes todos os elementos da populao tem idntica probabilidade.
Aprofundemos esta questo para o caso mais simples, uma AAS selecionada com
reposio. Neste exemplo de N = 100 e n = 30 a probabilidade do numero de vezes em
que cada um dos elementos da populao est contido na amostra uma varivel aleatria
binomial com parmetros p = 100 e n = 30. Por exemplo, qual a probabilidade de que o
dcimo elemento da populao (poderia ser qualquer um) ser selecionado 3 vezes na
amostra de 30 elementos? Esta probabilidade igual a

10 1
1
P ( X = 3) =
1

3 100 100

30 3

= 0,00009148

No vamos complicar para o caso de uma AAS selecionada sem reposio. Fica a cargo
do aluno interessado e curioso tentar calcular qual seria a probabilidade de selecionar ao
menos uma vez um dos 100 elementos da populao em uma amostra de 30 elementos.
Fica apenas a sugesto de utilizar a distribuio hipergeomtrica (deve ser justificada).
Qual a vantagem de uma amostra ser aleatria, frente a amostras no aleatrias,
escolhidas por critrios subjetivos e ao gosto do pesquisador. Em primeiro lugar, porque
como veremos adiante, uma amostra escolhida por critrios rigorosamente objetivos tende
a no introduzir vieses que ocorrem quando a seleo obtida por critrios discutveis.

177

Um pesquisador de campo pode selecionar apenas domiclios que tem menos quantidade
de pessoas para facilitar o seu trabalho e pode tambm evitar os domiclios de difcil
acesso. Mas a principal vantagem de uma amostra probabilstica (frente a uma amostra
subjetivista) que atravs de seus resultados possvel realizar clculos
probabilsticos.
Uma boa amostra deve apresentar 3 virtudes: 1) deve ser aleatria (pelos motivos que j
introduzimos e que iremos aprofundar mais adiante). 2) deve ser precisa e 3) deve ser
representativa e no geradora de vieses para as suas estimativas de parmetros da
populao. A preciso de uma amostra ira depender de seu tamanho. Geralmente quanto
maior o tamanho de uma amostra maior ser a sua preciso. A representatividade da
amostra depender no de seu tamanho, mas da maneira como os elementos so
selecionados da populao. Por exemplo, se tivermos uma populao constituda de 30
% de mulheres e 70 % de homens e estivermos interessados em estimar a quantidade
media de horas de estudo. Se selecionarmos uma amostra com 50 % de homens e 50 % de
mulheres a quantidade media de horas de estudo desta amostra no ser um bom
estimador da quantidade media de horas de estudo da populao (parmetro), se a
quantidade de horas de estudo for uma varivel que depende do sexo da pessoa. Se as
mulheres tenderem a estudar mais do que os homens esta amostra no representativa ir
conduzir a um valor superestimado da quantidade de horas de estudo media.

J uma

amostra que tenha o mesmo percentual de homens e de mulheres que existe na populao
ser considerada representativa desta populao e a media de horas estudo obtida desta
amostra ser uma estimativa no viesada da media de horas de estudo da populao
(parmetro).
Podemos neste momento fazer uma importante distino entre: 1) parmetro; 2)
estimador e 3) estimativa. Parmetro uma grandeza fixa e que se refere a uma
populao. No nosso exemplo anterior, o numero de horas de estudo mdio na populao
nosso parmetro. O valor deste parmetro na maior parte dos casos um valor
desconhecido, pois raramente podemos medir toda uma populao. Geralmente
desconhecemos o valor deste parmetro e tentamos estim-lo. Para estim-lo utilizamos
um estimador que se refere a uma formula matemtica que ser aplicada aos dados de

178

uma amostra. A media de uma amostra um estimador do parmetro media da


populao. A estimativa o valor que o estimador assume para uma dada amostra
particular e somente para aquela amostra. As estimativas variam de amostra para amostra.
Para cada amostra diferente temos diferentes estimativas e estas so calculadas de acordo
com uma mesma frmula, que o estimador. No caso do numero de horas de estudo
mdio, podemos selecionar de uma populao de 1000 estudantes diversas amostras de
tamanho n = 50. Em uma primeira amostra, temos uma estimativa de media da amostra,
em uma segunda amostra temos outro valor para a estimativa. Este valor da estimativa
que oscilar de amostra para amostra poder ser considerado resultado (valores
observados) de uma mesma varivel aleatria que justamente o estimador. Ento de
forma geral podemos dizer que um estimador da media populacional ( X ) a media da
amostra ( X ) e este estimador se comporta como uma varivel aleatria sendo que cada
um de seus valores de amostra para amostra uma estimativa.
A seguir mostramos uma tabela com uma listagem de diversos estimadores e parmetros.

Nome do estimador

Estimador

Media amostral

Nome do parmetro
Media populacional

X =
Varincia amostral

Xi
n
n

s2 =
Proporo amostral

X )2

i =1

n 1

p =

i =1

populacional

onde populacional

Xi = 0 ou 1
Total
expandido

amostral

N n
T = X i
n i =1

i =1

Varincia

2 =

Proporo

i =1

(X

Parmetro

(X

)2

i =1

N
N

p=

i =1

onde Xi

= 0 ou 1
Total populacional

T = Xi
i =1

Na primeira linha desta tabela temos a media amostral que um estimador da media
populacional. Na segunda linha temos a varincia amostral que um estimador da

179

varincia populacional. Observe o detalhe que o denominador da formula da varincia


amostral n-1 e no n (ao contrario o denominador da formula da varincia populacional
N e no N-1). Isto porque necessrio que o estimador seja no viesado o que quer
dizer que E[s2] = 2 . Para entender melhor este conceito suponhamos que de uma
populao de tamanho N = 1000 selecionemos todas as amostras possveis de tamanho n
= 50. Para cada uma destas amostras calculamos o valor de s2 (utilizando a formula da
segunda linha, segunda coluna da tabela acima). Os valores de s2 iro variar de amostra
para amostra e podemos assim considerar que s2 uma varivel aleatria pois depende de
cada amostra selecionada (sendo que todas estas amostras tem o mesmo tamanho n = 50).
A media de todos estes valores de s2 dever ser igual ao valor de 2 (calculado
utilizando-se a formula da segunda linha, quarta coluna). Caso no ocorresse isto o
estimador seria viesado.
Vamos supor uma populao de 4 elementos {2,3,4,5} tendo media = 3,5 e varincia

2 = 1,25

6.1 Amostragem Probabilstica

O que uma amostragem probabilstica ?

uma amostra selecionada de tal forma que cada item ou pessoa na populao
estudada tm uma probabilidade (no nula) conhecida de ser includa na amostra.

Mtodos de Amostragem Probabilstica:

Amostragem Aleatria Simples (AAS)

Uma amostra escolhida de tal forma que cada item ou pessoa na populao tem a mesma
probabilidade de ser includa.
Se a populao tem um tamanho N, cada pessoa desta populao tem a mesma
probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela de nmeros
aleatrios para sortear (com mesma probabilidade) os elementos da amostra. Tambm
180

pode ser utilizada uma funo randmica: No Excel, por exemplo, temos a funo
ALEATRIO ENTRE.

Amostragem Aleatria Sistemtica

Os itens ou indivduos da populao so ordenados de alguma forma alfabeticamente ou


atravs de algum outro mtodo. Um ponto de partida aleatrio sorteado, e ento cada ksimo membro da populao selecionado para a amostra.
Amostragem Aleatria Estratificada

A populao inicialmente dividida em subgrupos (estratos) e uma subamostra


selecionada a partir de cada estrato da populao

Amostragem aleatria Estratificada com Repartio Proporcional

Suponhamos que a populao subdividida em k estratos. Sejam:

N = o nmero de indivduos na populao


n = o nmero de indivduos na amostra
Ni = o nmero de indivduos contidos no i-simo estrato da populao
ni = o nmero de indivduos contidos no i-simo estrato na amostra

ni =n

Ni
N

i = 1,2,....,k

os estratos devem ser o mais homogneos possveis com relao s caractersticas


relevantes da pesquisa (variveis que se correlacionam fortemente com a varivel
estudada) para um mesmo tamanho amostral, a amostragem aleatria estratificada com

181

repartio proporcional mais precisa (menor varincia do estimador) do que a


amostragem aleatria simples (AAS).

Amostragem Aleatria Estratificada com Repartio de Neyman (ou repartio

tima)

Se conhecermos a varincia de cada estrato populacional referente a varivel que estamos


desejando estimar o seu parmetro, um mtodo mais adequado o da repartio de
Neyman.

ni = n

wi i

= n

W
i

i =1

Ni i
k

N
i

i =1

para um mesmo tamanho amostral a preciso maior para amostra aleatria estratificada
com repartio de Neyman (repartio tima) do que para a amostra aleatria estratificada
com repartio proporcional que por sua vez maior do que a amostra aleatria simples

Amostragem por Conglomerados

A populao inicialmente subdividida inicialmente em subgrupos (estratos) e uma


amostra de estratos selecionada (por exemplo, com probabilidade proporcional ao
tamanho de cada estrato). A seguir, amostras so selecionadas dos estratos selecionados
previamente.

182

A principal vantagem da amostra por conglomerados a de possibilitar considervel


reduo de custos (em relao, por exemplo, a uma amostragem aleatria estratificada)
para um mesmo tamanho amostral.

O mtodo costuma ser empregado quando no dispomos de um cadastro da populao


(como no caso da amostragem sistemtica) e os custos de ser elaborado um cadastro para
toda a populao muito elevado.

Erro amostral: A diferena entre a estatstica amostral e seu correspondente


parmetro.

Uma distribuio de probabilidade consiste de uma lista de todos os possveis valores


das mdias amostrais de um dado tamanho amostral constante selecionado da
populao e a probabilidade de ocorrncia associada a cada mdia amostral.

Exemplo 1 Uma empresa tem 5 scios. Semanalmente, os scios relatam o nmero


de horas de atendimento a clientes
Scio
1
2
3
4
5

Horas
22
26
30
26
22

Dois scios so selecionados aleatoriamente. Quantas amostras distintas so


possveis?

O nmero de amostras distintas de dois elementos tomados em 5 objetos corresponde


a:

5C2 =

5!
= 10
( 2! )( 3! )
183

Scios
1,2
1,3
1,4
1,5
2,3
2,4
2,5
3,4
3,5
4,5

Mdia
24
26
24
22
28
26
24
28
26
24

Organize as mdias amostrais em uma distribuio de freqncias.


Mdia
Amostral
22
24
26
28

Total
48
52
48
44
56
52
48
56
52
48

freqncia
1
4
3
2

Freqncia Relativa
(Probabilidade)
1/10
4/10
3/10
2/10

Calcule a mdia das mdias amostrais e compare-a com a mdia da populao.

A mdia da populao :
22 + 26 + 30 + 26 + 22
= 25,2
=
5

A mdia das mdias amostrais :

(22)(1) + (24)(4) + (26)(3) + (28)(2)


= 25,2
10

Observe que a mdia das mdias amostrais igual a mdia populacional

6.2 Teorema do Limite Central

Para uma populao com mdia e uma varincia 2 , a distribuio amostral das
mdias de todas as possveis amostras de tamanho n, geradas a partir da populao,

184

ser aproximadamente normalmente distribuda com a mdia da distribuio


amostral igual e varincia igual 2 / n

- assumindo que o tamanho amostral

suficientemente grande, ou seja, n 30 .

Em outras palavras, se a populao tem qualquer distribuio (no precisa ser

necessariamente normal) com mdia igual a e varincia igual a 2 , ento a


distribuio amostral dos valores mdios amostrais normalmente distribuda com

a mdia das mdias (

X ) igual a mdia da populao ( X ) e o erro

padro das mdias amostrais igual a

, desde que n 30 .

Note que o erro padro das mdias amostrais mostra quo prximo da mdia da
populao a mdia amostral tende a ser.

O erro padro das mdias amostrais calculado por:

X =

X
n

o smbolo para o erro padro das mdias amostrais

o desvio padro da populao

Se

o tamanho da amostra

no conhecido e n 30 (considerada uma amostra grande), o desvio padro da

amostra, designado por s, usado para aproximar o desvio padro da populao,


frmula para o erro padro torna-se:

185

.A

sX =

s
n
n

onde s =

(X

X )2

i =1

n 1

6.3 Estimativa de Ponto

Estimativa de ponto um valor (chamado um ponto) que usado para estimar um


parmetro populacional

Exemplos de estimativas de ponto so a mdia amostral, o desvio padro amostral, a


varincia amostral, a proporo populacional, etc.

Exemplo: O nmero de itens defeituosos produzidos por uma mquina foi registrado em
cinco horas selecionadas aleatoriamente durante uma semana de trabalho de 40 horas. O
nmero observado de defeituosos foi 12,4,7,14 e 10. Portanto, a mdia amostral 9,4.
Assim a estimativa de ponto para a mdia semanal do nmero de defeituosos 9,4.

6.4 Estimativa de Intervalo

Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um


parmetro populacional provavelmente cai.
O intervalo dentro do qual um parmetro populacional esperado ocorrer chamado
de intervalo de confiana.
Os intervalos de confiana que so extensivamente usados so os de 95 % e 99 %.

Um intervalo de confiana de 95 % significa que cerca de 95 % dos intervalos


construdos similarmente contero o parmetro que est sendo estimado.

186

Outra interpretao do intervalo de confiana de 95 % que 95 % das mdias


amostrais para um tamanho de amostra especificado cairo a uma distncia mxima
de 1,96 desvios padres da mdia populacional.

Para o intervalo de confiana de 99 %, 99 % das mdias amostrais para um tamanho


amostral especificado cairo a uma distncia mxima de 2,58 desvios padres da
mdia populacional.

Os intervalos de confiana para 95 % e 99 % so construdos como segue, para n 30:


O IC de 95 % para a mdia populacional

X 1,96

dado por:

dado por:

s
n

O IC de 99 % para a mdia populacional

X 2,58

s
n

Em geral, um intervalo de confiana para a mdia, calculado por:

X Z

s
n

onde Z obtido da tabela de distribuio normal padro.

Exemplo 2
Uma universidade quer estimar o nmero mdio de horas trabalhadas por semana por
seus estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas com um
desvio padro de 4 horas.

A estimativa de ponto do nmero mdio de horas trabalhadas por semana 24 horas


(mdia amostral).

187

Qual o intervalo de confiana de 95 % para o nmero mdio de horas trabalhadas por


semana ?
s
4
) temos 24 1,96
ou 22,88 a 25,12. O
n
49
limite de confiana inferior 22,88. O limite superior de confiana 25,12. O grau de
confiana (nvel de confiana) utilizado 0,95.
Usando a frmula anterior ( X 1,96

Interprete os resultados
Se ns tivssemos tempo para selecionar aleatoriamente 100 amostras de tamanho 49
da populao de alunos do campus e calcular as mdias amostrais e os intervalos de
confiana para cada uma destas 100 amostras, a mdia populacional (parmetro) do
nmero de horas trabalhadas estaria contida em cerca de 95 dos 100 intervalos de
confiana. Cerca de 5 dos 100 intervalos de confiana no conteriam a mdia
populacional.

6.5 Intervalo de Confiana para Uma Proporo Populacional

Um intervalo de confiana para uma proporo populacional dado por:

p Z p
onde:

a proporo amostral
o erro padro da proporo amostral e dado por:

p =

p (1 p )
n

O intervalo de confiana construdo por:

p Z

p (1 p )
n

onde:

188

p a proporo amostral
Z o valor da varivel normal padro para o grau de confiana adotado.
n o tamanho amostral

Exemplo 3
Um planejador financeiro est estudando os planos de mudana de jovens executivos.
Uma amostra de 500 jovens executivos que possuem suas prprias casas revelou que 175
planejam vend-las e retirarem-se para o interior do Pas. Construa um intervalo de
confiana de 98 % para o parmetro proporo populacional de executivos que planejam
mudar para o interior.

Aqui n = 500, p = 175

= 0, 35
500
e Z = 2,33 (para = 0,98 nvel de confiana adotado )

O CI de 98 % 0,35 2,33

(0,35) (0,65)
ou 0,35 0,0497
500

Interprete a resposta
6.6 Fator de Correo de Populao Finita

Uma populao que tem um limite superior definido chamada de finita. Em


estatstica, considera-se como populao finita quando n

> 0,05 (ou seja, quando a

frao amostral maior do que 5 %).

Para uma populao finita, onde o nmero total de objetos N e o tamanho da


amostra n, o seguinte ajuste feito para os erros padres da mdia amostral e da
proporo amostral.
Erro padro da mdia amostral:

189

X =

N n
N 1

Erro padro da proporo amostral:

p =

p (1 p ) N n
n
N 1

Este ajuste chamado de Fator de Correo de Populao Finita (FCPF)

Nota: se n

0, 05 , o fator de correo de populao finita ignorado.

Exemplo 4

A universidade do exemplo 2 quer estimar o nmero mdio de horas trabalhadas por


semana pelos estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas
e um desvio padro de 4 horas. Construa um intervalo de confiana para o nmero mdio
de horas trabalhadas se h somente 500 estudantes no campus.

Agora

n
49
=
= 0, 098 > 0, 05 . Portanto, temos que usar o FCPF
N 500

24 1,96

4
500 49

= [ 22,93 ; 25,11]
500 1
49

6.7 Selecionando uma Amostra

H 3 fatores que determinam o tamanho de uma amostra, nenhum dos quais tendo
uma relao direta com o tamanho da populao. Eles so:

1. O grau de confiana adotado


2. O mximo erro permissvel
3. A variabilidade da populao

190

Uma frmula de clculo conveniente para determinar o tamanho amostral n :

Zs
n=
E

onde:
E o erro permissvel
Z o valor da varivel normal padro associado ao grau de confiana adotado
s o desvio padro da amostra piloto

Exemplo 5
Um grupo de consumidores deseja estimar a mdia de gasto mensal em eletricidade para
um domiclio familiar simples em Julho. Baseado em estudos similares o desvio padro
estimado como sendo R$ 20,00. Deseja-se construir um intervalo de confiana de 99 %
com um erro mximo admissvel de R$5, 00 . Qual deve ser o tamanho da amostra?
( 2,58 ) ( 20 )
n=
= 106, 50 107
5

6.8 Tamanho Amostral para Estimativa de Propores


A frmula para determinar o tamanho amostral no caso de estimativa de propores :

Z
n = p (1 p )
E
p

2
onde

a proporo estimada, baseada na experincia passada ou em uma amostra piloto

Z o valor da varivel normal padro associado ao grau de confiana adotado.


E o mximo erro permissvel que o pesquisador tolera.

191

Exemplo 6
Um clube deseja estimar a proporo de crianas que tem um cachorro. Se o clube
deseja que a estimativa esteja no mximo afastada 3 % da proporo populacional,
quantas crianas devem conter a amostra? Assuma um intervalo de confiana de 95
% e que o clube estimou, com base em experincia anterior, que aproximadamente
30 % das crianas tm um cachorro.
2

1,96
n = ( 0,30 )( 0, 70 )
= 893, 4 893
0, 03

7. Teste de Hipteses Amostras Grandes


OBJETIVOS:

Definir hipteses e Testes de Hipteses

Descrever os 5 passos do procedimento de Teste de Hipteses

Distinguir entre Teste de Hipteses Unicaudal e Bicaudal

Realizar um teste para a mdia populacional

Realizar um teste para a diferena entre duas mdias ou propores populacionais

Descrever os erros estatsticos associados aos testes de hipteses

Nota:
Se nada conhecido acerca da populao, a estimao usada para fornecer uma
estimativa de ponto e de intervalo acerca da populao.
Se alguma informao acerca da populao proposta ou suspeitada, o Teste de
Hipteses usado para determinar a plausibilidade desta informao.

O que uma hiptese?

Hiptese: uma sentena sobre o valor de um parmetro populacional desenvolvida


para o propsito de teste.

Exemplos de hipteses, ou sentenas, feitas acerca de um parmetro populacional so:


192

A renda mdia mensal proveniente de todas as fontes para os analistas de sistemas


de US 3625

Vinte por cento de todos os transgressores juvenis so presos e sentenciados a priso.

O que um Teste de Hipteses?

Teste de Hipteses: um procedimento, baseado na evidncia amostral e na teoria da


probabilidade, usado para determinar se a hiptese uma afirmao razovel e no
seria rejeitada, ou no razovel e seria rejeitada.

A seguir so propostos 5 passos para um teste de hipteses:

Passo 1: Estabelea a Hiptese Nula e a Hiptese Alternativa


Passo 2: Selecione um nvel de significncia
Passo 3: Identifique a Estatstica de teste
Passo 4: Formule uma regra de deciso
Passo 5: Tome uma amostra e obtenha uma deciso: No rejeitar H0 ou rejeitar H0 e
aceitar H1

Hiptese Nula H0: Uma afirmao (sentena) sobre o valor de um parmetro


populacional

Hiptese Alternativa H1: Uma afirmao (sentena) que aceita se os dados amostrais
fornecem evidncia de que a hiptese nula falsa.

Nvel de Significncia: A probabilidade de rejeitar a hiptese nula quando ela


efetivamente verdadeira, ou seja, valor de (alfa)

Erro Tipo I: Rejeitar a Hiptese Nula, H0, quando ela efetivamente verdadeira. A
probabilidade do erro tipo I igual ao nvel de significncia, (alfa).

Erro Tipo II: Aceitar a Hiptese Nula, H0, quando efetivamente falsa. A
probabilidade do erro tipo II igual a (beta)

193

Tipos de Erros

Aceita H0

Rejeita H0

H0 verdadeira

Deciso Correta

Erro Tipo I

H0 falsa

Erro Tipo II

Deciso Correta

Alfa = erro tipo IBeta = erro tipo II


Estatstica de Teste (ou z efetivo ou valor de t): Um valor, determinado a partir da
informao amostral, usado para determinar se devemos ou no rejeitar a hiptese nula.
Valor Crtico (ou z crtico ou valor de t): O ponto divisor entre a regio onde a
hiptese nula rejeitada e a regio onde ela no rejeitada. Este valor obtido a
partir da tabela de z (normal padro) ou da tabela de t (t de Student).

7.1 Testes de Significncia Unicaudais

Um teste unicaudal quando a hiptese alternativa, H1, estabelece uma direo tal
como:

H0: A renda mdia das mulheres menor que ou igual a renda mdia dos homens.

H1: A renda mdia das mulheres maior que a renda mdia dos homens.

A regio de rejeio neste caso a cauda direita (superior) da curva.

Figura com distribuio normal mostrando a regio de rejeio para um teste unicaudal

7.2 Testes de Significncia Bicaudais

Um teste bicaudal quando no existe uma direo especificada para a hiptese


alternativa H1, tal com:
194

H0: A renda mdia das mulheres igual a renda mdia dos homens.

H1: A renda mdia das mulheres no igual a renda mdia dos homens.

A regio de rejeio neste caso dividida igualmente em duas caudas da curva.

Figura com distribuio normal mostrando a regio de rejeio para um teste bicaudal

(distribuio amostral para a estatstica z para um teste bicaudal, 0.05 de nvel de


significncia

Testando a Mdia Populacional: Amostra Grande, Desvio Padro da Populao


conhecido.
Neste caso a estatstica de teste (z efetivo) dado por:

z =

Exemplo 1

Os processadores de uma indstria indicam o ponto (marca) que a garrafa contem 16


onas (medida inglesa de peso)

do produto. O Departamento de Controle de

Qualidade responsvel pelo controle da quantidade includa na garrafa. Uma


amostra de 36 garrafas selecionada por hora e o seu contedo pesado. Na ltima
hora uma amostra de 36 garrafas apresentou um peso mdio de 16,12 onas com um
desvio padro de 0,5 onas.

Ao nvel de significncia de 0,05 podemos concluir que o processo est fora de


controle?

195

Passo 1: Estabelecer a Hiptese Nula e a Hiptese Alternativa:

H:1 16

H:
0 =16

Passo 2: Estabelecer a regra de deciso:


H0 rejeitado se o z (efetivo calculado com base nos valores amostrais) < -1,96 ou z >
1,96.

Passo 3: calcule o valor da estatstica de teste ( z efetivo)

z = [16,12 16]
[0,5

= 1,44
36

Passo 4: Qual a deciso sobre H0?


H0 no rejeitada, porque 1,44 menor que o valor crtico de 1,96.

7.3 P-value de um Teste de Hiptese

P-value: Esta a probabilidade (considerando que a hiptese nula verdadeira) de ter


um valor para a estatstica de teste no mnimo to extremo como o valor calculado
(efetivo) para o teste.

Se o p-value menor que o nvel de significncia (alfa), H0 rejeitada.


Se o p-value maior que o nvel de significncia (alfa), H0 no rejeitada.

7.4 Clculo do p-value

Teste Unicaudal (para a direita ou cauda superior):

p-value = P{z valor da estatstica de teste calculada}

Teste Unicaudal (para a esquerda ou cauda inferior):

196

p-value = P{z valor da estatstica de teste calculada}

Teste Estatstico Bicaudal

p-value = 2P{z valor absoluto do valor da estatstica de teste calculado}


Para o exemplo anterior, z = 1,44, e desde que era um teste bicaudal, ento o
p-value = 2 P{z 1,44} = 2(0,5 0,4251) = 0,1498 . Desde que 0,1498 > 0,05, no
rejeitada H0.

Testando para a Mdia Populacional: Grandes Amostras, Desvio Padro Populacional


desconhecido

Aqui desconhecido, portanto o estimamos com o desvio padro amostral s.

Quanto maior for o tamanho amostral for n 30, o z efetivo pode ser aproximado
com

z=

X
s
n

Exemplo 2

A cadeia de Lojas Arjo emite o seu prprio carto de crdito. O administrador de


crdito quer verificar se o saldo no pago mensal maior do que US$ 400. O nvel de
significncia fixado em 0,05. Uma amostra aleatria de 172 saldos no pagos
revelou uma mdia amostral de US$ 407 e o desvio padro amostral de US$ 38. O
admistrador de crdito pode concluir que a mdia populacional maior que US$ 400,
ou razovel assumir que a diferena de US$ 7 (US$ 407 US$ 400 devido a
chance (variao aleatria)?
Etapa 1: Estabelea a Hiptese Nula e a Hiptese Alternativa.

197

H:0 400
contra
H:1 > 400

Etapa 2: Estabelea a regra de deciso.

H0 rejeitada se o z (efetivo) > 1,645.

z=

Etapa 3: Calcule o valor da estatstica de teste.


407 400
= 2,42
38
172

Etapa 4: Qual a deciso sobre H0?

H0 rejeitada. O administrador conclui que a mdia dos saldos no pagos maior do que
US$ 400.

Figura ilustrando a regio de rejeio do exemplo

7.5 Teste de Hipteses: Duas Mdias Populacionais

Assuma que os parmetros para duas populaes so:

Caso I: Quando

1,2,1 e2.

1, 2 so conhecidos, a estatstica de teste (Z efetivo) :

198

z =

X1 X 2

12
n1

22

Caso II: Quando

n2

1, 2 no so conhecidos mas os tamanhos amostrais n e n


1

so

maiores ou iguais a 30, a estatstica de teste (Z efetivo) :

z =

X1 X 2
s12
s 22
+
n1
n2

Exemplo 3

Na indstria X foi realizado um estudo para comparar o nmero mdio de anos de


servio para aqueles que se aposentaram em 1975 com aqueles que se aposentaram no
ltimo ano. Os seguintes dados amostrais foram obtidos. A um nvel de significncia
de 0,01 podemos concluir que os trabalhadores que se aposentaram no ltimo ano
tiveram mais anos de servio?

Caracterstica

1975

ltimo ano

Mdia Amostral

25,6

30,4

Desvio Padro Amostral

2,9

3,6

Tamanho amostral

40

4,5

Estabelea a Hiptese Nula e a Hiptese Alternativa

Considere que a populao 2 aquela dos que se aposentaram no ltimo ano.

H0 : 2 1

H1 : 2 > 1

199

Estabelea a regra de deciso

Rejeitar H0 se o z (efetivo) > 2,33.

Calcule o valor da estatstica de teste (valor de z efetivo):

z =

30 , 4 25 , 6
2

3, 6
2 .9
+
45
40

= 6 ,80

Nota: Desde que neste problema estamos testando para:

H0 :

2 1

Precisamos trocar as posies das variveis na equao do z efetivo (a seguinte equao).

z =

s 12
s 22
+
n1
n2

z efetivo

Qual a deciso sobre a hiptese nula? Interprete os resultados?

Desde que o Z efetivo = 6,80 > Z crtico = 2,33, H0 rejeitada. Aqueles que se
aposentaram no ltimo ano tiveram mais anos de servio.

200

7.6 Testes Referentes Proporo

Proporo: Uma frao ou porcentagem que indica uma parte da populao ou


amostra que tem um particular trao de interesse.

A proporo amostral denotada por p onde:

p=

nmero de sucessos na amostra


tamanho da amostra

Estatstica de teste para testar uma Proporo Simples de uma Populao

z =

p p
p (1 p )
n

p proporo populacional
p proporo amostral

Exemplo 4

No passado, 15 % das solicitaes postais feitas por uma instituio de caridade


resultaram em contribuio financeira. Uma nova carta de solicitao foi redigida.
Esta nova carta elevou a taxa de contribuio? A nova carta enviada a uma amostra
de 200 pessoas e 45 responderam com uma contribuio.

Ao nvel de significncia de 0,05 pode-se concluir que a nova carta mais efetiva?

Estabelea a Hiptese Nula e a Hiptese Alternativa:

201

H 0 : p 0,15

H1 : p > 0,15

Estabelea a regra de deciso

H0 rejeitada se o Z (efetivo) > 1,645.

Calcule o valor da estatstica de teste ( valor do Z efetivo):

z=

45
0 ,15
200
= 2 ,97
( 0,15 )( 0 ,85 )
200

Qual a deciso sobre a hiptese nula? Interprete os resultados.

Desde que o z efetivo = 2,97 > z crtico (1,645), H0 rejeitada. A nova carta mais
efetiva.

Um Teste envolvendo a Diferena entre duas Propores Populacionais

A Estatstica de teste (Z efetivo) neste caso :

z=

p1 p 2
pc (1 pc ) pc (1 pc )
+
n1
n2

n1 o tamanho da amostra da populao 1.

n2 o tamanho da amostra da populao 2.

202

pc

a mdia ponderada das duas propores amostrais, calculada por:

pc =

nmero total de sucessos


tamanho total das duas amostras

X1 + X 2
n1 + n 2

X1 o nmero de sucessos em n1.


X2 o nmero de sucessos em n2.

Exemplo 5

Os trabalhadores solteiros so mais provveis de faltar ao trabalho do que os


trabalhadores casados?

Uma amostra de 250 trabalhadores casados mostrou que 22 faltaram mais do que 5 dias
no ltimo ano por alguma razo. Uma amostra de 300 trabalhadores solteiros mostrou que
35 faltaram mais do que 5 dias. Use o nvel de significncia de 0,05.
Estabelea a hiptese nula.

H 0 : p2 p1 H1 : p2 > p1
onde o subscrito 2 refere-se a populao dos trabalhadores solteiros.
Estabelea a regra de deciso.

Rejeitar H0 se z > 1,645.

Calcular o valor da estatstica de teste, Z efetivo:

203

22 + 35
= 0,1036
250 + 300
22 35

250
300
Z=
= 1,10
0,1036(1 0,1036) 0,1036(1 0,1036)
+
300
250
pc =

Nota: Novamente, trocamos a posio das duas variveis

Qual a deciso referente a hiptese nula?

H0 rejeitada. No h diferena na proporo de ausncias para trabalhadores casados e


solteiros.

Qual o p-value?

p-value = P{z > 1,1} = 0,1357 , ( a hiptese nula no rejeitada).

EXERCCIOS :
(incluem recordao de tpicos anteriores)

1. A Associao Nacional de Educao coleta e publica dados sobre o nmero de anos


de experincia em sala de aula dos professores do curso secundrio. Uma amostra
obtida neste ano de 10 professores de curso secundrio e foram publicados os
seguintes dados sobre o nmero de anos de experincia.
33

18

21

12

18

16

15

17

a.Calcule a mdia amostral, X , dos dados.

204

b.Calcule a amplitude dos dados.


c.Calcule o desvio padro amostral, , s, dos dados.
d.Pelo Teorema de Chebychev, no mnimo _________ % dos dados caem dentro de
dois desvios padres de cada lado da mdia.

2. A seguinte tabela de contingncia fornece uma distribuio de freqncias conjunta


para os votos populares apurados na eleio presidencial de 1984 por regio e por
partido poltico. Os dados esto em milhares, arredondados para o mais prximo
milhar.
Democrata

Republicano

Outros

P1

P2

P3

Total

9,056

11,336

101

20,493

Meio Oeste R2

10,511

14,761

169

25,441

Sul

R3

10,998

17,699

136

28,833

Oeste

R4

7,022

10,659

214

17,895

37,587

54,455

620

92,662

Nordeste

R1

Total

a.Quantos pessoas votaram no partido Republicano?


b.Quantas pessoas no Meio Oeste votaram?
c.Quantas pessoas no Sul votaram no partido Democrata?
d.Determine a probabilidade dos eventos R3 e P2 (simultneos).
e.Calcule Pr(R3 ou P2), usando a tabela de contingncia diretamente
f.Calcule Pr(R3 ou P2), usando a regra geral da adio de probabilidade, isto , Pr(A
ou B) = Pr(A) + Pr(B) - Pr (A e B).
g.Ache Pr(R3 | P2).
h.Calcule Pr(P1) e Pr(P1 | R4).
i.

So os eventos P1 e R4 independentes? Explique sua resposta.


So os eventos P1 e R4 mutuamente exclusivos? Explique sua
resposta.

205

3. Em um levantamento recente, a probabilidade de que um acidente de carro causado


por um motorista embriagado cerca de 0,229. Nos prximos trs acidentes, qual a
probabilidade de que:
a.exatamente um acidente seja causado por um motorista embriagado?
b.No mnimo um acidente seja causado por um motorista embriagado?
c.Se voc6e tem os seguintes resultados de probabilidade de acidentes causados por
motoristas embriagados nos 10 prximos acidentes

pdf (*)

Cdf (**)

0,0742

0,0742

0,2205

0,2947

0,2947

0,5893

0,2334

0,8227

0,1213

0,9440

0,0432

0,9873

0,0107

0,9980

0,0018

0,9998

0,0002

1,0000

0,0000

1,0000

10 0,0000

1,0000

(*) Pdf = Probability Distribution Function (Funo de Distribuio de Probabilidade)


(**) Cdf = Cumulative Distribution Function (Funo de Distribuio Cumulativa)
1.Ache Pr(x = 3).
2.Ache Pr(5 < x 9).
3.Qual a mdia e a varincia da distribuio tabulada acima?

206

4. Um dentista tem 5 cadeiras disponveis para pacientes em sua sala de espera. A


distribuio de probabilidade do nmero de cadeiras ocupadas, x, dada por
x

p(x)

0,304

0,228

0,171

0,128

0,096

0,073

a. Ache a mdia da varivel aleatria x.


b. Calcule o desvio padro, , da varivel aleatria x.
c. Calcule Pr(2 x 5).
d. Desenvolva (no formato tabular a cdf (Cumulative Distribution Function - Funo de
Distribuio Acumulada) dessa distribuio.

5. Seja X normalmente distribuda com mdia = 100 e desvio padro = 7 (daqui em


diante indicaremos tal distribuio como X ~ N(100;7) ). Determinar:

a. P(X = 80)
b. P(X > 100)
c. P( X 95 < 5)
d. P( X 100 < 10
6. Dado que X uma varivel aleatria normal com mdia = 10 e
P(X > 12) = 0,1587, qual a probabilidade de que X esteja includo no intervalo (9,11) ?

207

7. Os pesos de certos produtos em quilogramas so normalmente distribudos com


mdia = 180 e desvio padro 2 = 4. Se uma unidade deste produto escolhida
aleatoriamente, qual o peso desta unidade se a probabilidade de ocorrncia :

a. De um peso maior igual a 0,10 ?


b. De um peso menor igual a 0,05 ?
8. Se W uma varivel aleatria normal e se P(W < 10) = 0,8413 e
P(W < -10) = 0,0668, qual E(W) e V(W) respectivamente ?

9. H dois procedimentos para possibilitar que um determinado tipo de avio esteja


pronto para a decolagem. O procedimento A requer um tempo mdio de 27 minutos
com desvio padro de 5 minutos. Para o procedimento B, = 30 e = 2 minutos,
respectivamente. Qual procedimento deve ser utilizado se o tempo disponvel de 30
minutos? 34 minutos?

10. Suponha que os dividendos anuais de quatro aes sejam respectivamente $ 2,00, $
4,00, $ 6,00 e $ 8,00. Deduza a distribuio amostral de X considerando as seguintes
hipteses :

1. tamanho amostral n = 2.
2. mtodo de amostragem: amostragem aleatria simples com reposio
Para a distribuio amostral deduzida de X , verifique por demonstrao que

a. E( X ) =
b. V( X ) = 2 /n
c. Se a amostragem for sem reposio deduza a distribuio de X e demonstre que

E( X ) = e V( X ) =
n

( N n) / ( N 1)

d. Se a amostragem fosse realizada com reposio, qual o valor de V( X )?

208

11. Uma populao consta de 4 nmeros: 3, 7, 11 e 15. Considerar todas as amostras


possveis que podem ser retiradas com reposio. Determinar: a) a mdia
populacional; b) o desvio padro da populao; c) a mdia da distribuio amostral
das mdias; d) o desvio padro da distribuio amostral das mdias. Verificar (c) e (d)
diretamente e por meio de (a) e (b) atravs das frmulas apropriadas.

12. Certas vlvulas fabricadas por uma companhia tm uma vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria de
16 vlvulas, retiradas do grupo, ter a vida mdia: (a) entre 790 e 810 horas; (b)
inferior a 785 horas. Para realizar esses clculos, o que necessrio supor? Explique a
razo de sua afirmativa.

13. De acordo com o exerccio 8. Se for tomada uma amostra de 64 vlvulas, como ser
resolvido? Explicar a diferena.

14. Os pesos de fardos recebidos por um depsito tm mdia de 150 kg e um desvio


padro de 25 kg. Qual a probabilidade de 25 fardos, recebidos ao acaso e carregados
em um elevador, no exceder o limite especfico desse ltimo , que de 4100 kg ?
Neste caso, para a soluo do problema, necessrio especificar a forma da
distribuio estatstica (funo densidade de probabilidade) dos pesos dos fardos na
populao ?

15. Questo terica. Demonstre que s 2 =

(X
i =1

X )2

um estimador viesado para a

varincia populacional 2 =

(X
i =1

) 2
, onde n o tamanho da amostra e N o

tamanho da populao. Calcule o valor do vis. O que ocorre com esse valor quando n

de um parmetro dito no
tende ao infinito. (Lembrar que um estimador
]=
viesado se E[

209

16. Questo terica

a. Enuncie o Teorema do Limite Central e o interprete da melhor forma possvel

b. O que considerado populao finita (e infinita) para fins estatsticos ?


c. Assinale as condies em que necessrio realizar a correo de
populao finita, justificando a resposta:

 quando a populao infinita, no importando se a amostragem feita com ou


sem reposio

 quando a populao finita, no importando se a amostragem feita com ou


sem reposio

 quando a populao finita e a amostragem feita com reposio


 quando a populao finita e a amostragem feita sem reposio
 quando a populao infinita e a amostragem feita com reposio
 quando a populao infinita e a amostragem feita sem reposio
 quando a populao finita ou a amostragem feita com reposio
 existem outras alternativas no enumeradas acima
17. Uma funo de probabilidade uma regra de correspondncia ou uma equao que:

a) Acha o valor mdio da varivel aleatria


b) Atribui valores de x a eventos de um experimento probabilstico
c) Atribui probabilidades para valores de x
d) Define a variabilidade no experimento
e) Nenhuma das anteriores correta

18. Suponha que a varivel aleatria T tenha a seguinte distribuio de probabilidade:

| 0 1 2

210

---------------------P(T = t) | .5 .3 .2

a. Ache P(T <= 0)


b. Ache P(T >= 0 e T < 2)
Calcule E(T), a mdia da varivel aleatria T.

19. Uma centena de estudantes realizou um teste no qual o escore mdio foi de 73 com
uma varincia de 64. Um grau A foi dado para quem obteve um escore de 85 ou
mais. Quantos As foram obtidos aproximadamente, assumindo que os escores So
normalmente distribudos? (escolha o mais prximo)

1. 42
2. 7
3. 58
4. 5
5. 22

20. Se uma distribuio normal tem mdia 200 e desvio padro 20, ache K tal que a
probabilidade de que um valor amostral seja menor do que K 0,975.

a. 239

b. 204

c. 210

f. 230

g. 239

h. 250

d. 215

e. 220

21. Se X a mdia de uma amostra extrada de uma distribuio normal com = 10,

2 X = 25 e n = 9, ento P( X > 15) :


(a) 0,001350

(c) 0,98778

(b) 0,998650

(d) 0,15866

211

22. A distribuio do tempo de vida de certo tipo de lmpada eltrica normalmente


distribuda com mdia de 1000 horas e um desvio padro de 100 horas. Ache o 33
Percentil da distribuio de tempo de vida.

a. 560
b. 330
c. 1044
d. 1440
e. nenhuma das anteriores
23. O valor de Z correspondente ao 52 percentil :
a. 2,06
b, 2,05
c, 1,99
d, 0,48
e, 0,05

24. Pr(Z > +1.96 ou Z < -1.65)

1) 0,025
2) 0,05
3) 0,0745
4) 0,0495
5) Nenhuma das anteriores

25. Em uma distribuio normal com mdia 3 e varincia 49, quais so o limite superior
e inferior para os 50 % dos dados centrais?

a. -29,83 e 35,83

212

b. -1,31 e 7,69
c. -1,69 e 7,69
d.

3,00 e 24,00

e. nenhuma das anteriores

26. Uma amostra aleatria de tamanho 25 escolhida de uma populao com mdia 7 e
varincia 4. A mdia amostral calculada como 8. Qual o valor da varivel normal
padro (z) correspondente a mdia amostral?

a. 25
b. 1,25
c. 1,25
d. +2,5
e. nenhuma das anteriores

27. Suponha que para uma amostra de 36 Auxiliares de Enfermagem de diversos


hospitais similares, uma avaliao de competncia com intervalo entre 0 e 100 foi
obtida a partir de um teste clnico. Suponha que a mdia populacional da avaliao
para todas as Auxiliares de Enfermagem destes hospitais foi de 80 e a varincia
populacional foi de 100. Para uma amostra de 36 Auxiliares de Enfermagem, qual a
probabilidade de que a nota mdia esteja entre 75 e 80?

a. 0,4987 b. 0,1915 c. 0,5013 d. 0,2287 e. 0,5115

28. Uma companhia fabrica cilindros que tem uma mdia de 2 polegadas de dimetro. O
desvio padro dos dimetros dos cilindros de 10 polegadas. Os dimetros de uma
amostra de 4 cilindros so medidos todas as horas. A mdia amostral usada para
decidir se o processo de fabricao est operando satisfatoriamente ou no. A seguinte

213

regra de deciso aplicada: se dimetro mdio da amostra de 4 cilindros maior ou


igual a 2,15 polegadas, ou menor ou igual a 1,85 polegadas, interrompe-se o processo.
a. Qual a probabilidade de parar o processo se a mdia do processo permanece
constante no valor de 2,00 polegadas ?
b. Qual a probabilidade de parar o processo se a mdia do processo muda para =
2,10 polegadas ?
c. Qual a probabilidade do processo continuar operando se a mdia do processo mudar
para = 2,15 polegadas ?

29. Qual (ou quais) das seguintes sentenas descreve inferncia estatstica ?

a. uma sentena verdadeira sobre uma populao feita atravs de uma informao
amostral de uma populao
b. uma conjectura acerca de uma populao feita a partir da informao contida em uma
amostra daquela populao
c. uma sentena verdadeira acerca de uma amostra feita a partir da informao contida
em uma populao.

30. Para uma certa populao normalmente distribuda, o valor do desvio padro
conhecido, mas o valor da mdia desconhecido. Qual ser o efeito de mudanas no
tamanho amostral e do grau de confiana no comprimento do intervalo de confiana
da estimativa da mdia populacional?
a. Aumentando o tamanho amostral aumenta o comprimento dado um grau de confiana
fixo.
b. Aumentando o grau de confiana reduz o comprimento, dado um tamanho amostral
fixo.
c. Aumentando o tamanho amostral reduz o comprimento, dado um grau de confiana
fixo.

214

d. Nenhuma das anteriores.

31. A distribuio das mdias de todas as possveis amostras de tamanho (n) escolhidas
de uma populao se aproximar de uma curva normal se

a. n grande o bastante
b. a populao grande
c. a populao simtrica
d. a mdia de cada amostra igual a mdia da populao
e. nenhuma das anteriores correta

32. A distribuio amostral das mdias de amostras aleatrias de tamanho n extradas de


uma populao se aproximar de uma distribuio normal se

a. somente se a populao normalmente distribuda e se n grande

b. somente se a populao normalmente distribuda no importando o valor de n

c. se n grande no importando a forma da distribuio da populao

d. no importa o valor de n e no importa a forma da distribuio da populao original

33. Em um estudo sobre que relao existente entre uma atitude de criana e a idade na
qual ela fala primeiro, os pesquisadores registraram a idade (em meses) da primeira
fala da criana e o nmero de pontos (escore) obtido pela criana em um teste sobre
a atitude. Seguem-se os dados para 21 crianas:

criana

10

11

Idade

15

10

15

20

18

11

20

Escore

95

71

83

91

102

87

93

100

104

94

113

215

Criana

12

13

14

15

16

17

18

19

20

21

Idade

10

11

11

10

12

42

17

11

10

Escore

96

83

84

102

100

105

57

121

86

100

A linha de mnimo quadrado para a predio do scorea partir da idade da


primeira fala :

escore = 110 1,13 * idade ; o valor do coeficiente de correlao 0,640.

a.Que proporo da variabilidade nos escores da atitude explicada pela reta


de mnimos quadrados ?
b.Qual seria a predio de mnimos quadrados para os escore de uma criana
que fala primeiro aos 20 meses ?
c.Calcule o resduo para a criana 6.
d.A partir do diagrama de disperso, qual criana tem o maior (em valor
absoluto) resduo? O que incomum para esta criana?
e.Qual criana tem o menor valor ajustado?

34. Uma amostra no ano de 1989 de 130 mulheres que visitaram um ginecologista em
uma determinada universidade do Noroeste dos EUA indicou que 113 tiveram
experincia sexual.

a. Assumindo que essas mulheres so uma amostra aleatria simples da


populao de todas as mulheres daquela universidade, calcule um intervalo de
confiana para a proporo da populao que sexualmente ativa.
b. O intervalo seria mais largo, mais estreito ou da mesma largura se 520
mulheres fossem amostradas? (Voc no precisa fazer nenhum clculo)
Explique.

216

c. O intervalo seria mais largo, mais estreito ou da mesma largura se resultassem


73 mulheres com experincia sexual 130 mulheres amostradas? (Voc no
precisa fazer nenhum clculo) Explique.
d. Voc acha que razovel assumir que essas mulheres formam uma amostra
aleatria? Explique.

35. No execute nenhum clculo para responder o seguinte. Explique seu raciocnio em
cada caso.

a. Tres pesquisadores Alex, Bob e Chuck selecionam de maneira independente amostras


aleatrias da mesma populao. Os tamanhos amostrais so 1000 para Alex, 4000
para Bob e 250 para Chuck. Cada pesquisador constri um intervalo de confiana de
95 % para

a partir de seus dados. A semi-amplitude dos trs intervalos so 0,015;

0,031 e 0,062. Relacione cada semi-amplitude com o pesquisador.


b. Cada um dos dois pesquisadores Donna e Eileen selecionam amostras aleatrias de
tamanho 1000 de populaes diferentes e constrem intervalos de confiana de 95 %
para p (a proporo populacional). A semi-amplitude do intervalo de Donna 0,030 e
a de Eileen 0,025. Dado que as propores amostrais foram p1 =.20 e p2 =.40,
relacione cada pesquisadora com a sua proporo amostral.
c. Um pesquisador de nome Fran seleciona 100 indivduos aleatoriamente de uma
populao, observa 50 sucessos e calcula 5 intervalos de confiana. Os nveis de
confiana so 80 %, 90 %, 95 %, 98 % e 99 % e os cinco intervalos so (0,402 ;
0,598), (0,371 ; 0,629), (0,418 ; 0,582), (0,436 ; 0,564) e (0,384 ; 0,616). Relacione
cada intervalo com o seu nvel de confiana.

36. Suponha que 80 % de todos os habitantes da Pensilvnia comam Peru no Dia de Ao


de Graas. Suponha alm disso que voc planeja selecionar uma amostra aleatria
simples (AAS) de 300 habitantes da Pensilvnia visando determinar a sua proporo
que come peru no Dia de Ao de Graas.

217

a. 80 % uma parmetro ou uma estatstica? Que smbolo voc deve usar para representlo?
b. De acordo com o Teorema do Limite Central, como a proporo amostral de quem
come peru no Dia de Ao de Graas varia de amostra para amostra ?
c. Determine a probabilidade de que menos do que 3 quartos da amostra comam peru no
Dia de Ao de Graas.
d. Seria a resposta a (c) menor, maior ou a mesma se o tamanho amostral de 800 fosse
usado? (voc no precisa executar o clculo). Explique.
d. Podemos mostrar que nesse contexto P ( p 0,80) = 0.15. Se essa afirmativa no
estiver correta escreva uma verdadeira que a substitua. Escreva uma ou duas sentenas
explicando para um leigo o que essa afirmativa significa.

37. A seguinte tabela lista a temperatura mdia mensal e minha conta de eletricidade para
aquele ms.
ms

temp

conta

ms

temp

Conta

Abr-91

51

$41.69

Jun-92

66

$40.89

Mai-91

61

$42.64

Jul-92

72

$40.89

Jun-91

74

$36.62

Ago-92

72

$41.39

Jul-91

77

$40.70

Set-92

70

$38.31

Ago-91

78

$38.49

Out-92

Set-91

74

$37.88

Nov-92

45

$43.82

Out-91

59

$35.94

Dez-92

39

$44.41

Nov-91

48

$39.34

Jan-93

35

$46.24

Dez-91

44

$49.66

Fev-93

Jan-92

34

$55.49

Mar-93

30

$50.80

Fev-92

32

$47.81

Abr-93

49

$47.64

Mar-92

41

$44.43

Mai-93

Abr-92

43

$48.87

Jun-93

68

$38.70

218

Mai-92

57

$39.48

Jul-93

78

$47.47

A linha de mnimos quadrados desenhada no diagrama de disperso; a equao dessa


reta : conta = 55,1 0,214 temp. mdia

a. Estime o valor do coeficiente de correlao entre a conta de eletricidade e


a temperatura mdia.
b.

Qual a predio de mnimos quadrados para a conta de energia eltrica


em uma temperatura mdia de 60 graus F?

c. Sem fazer clculos, identifique que ms tem o maior (em valor absoluto)
resduo.
d.Que

ms

tem

menor

valor

ajustado?

Exerccios Resolvidos

EXERCICIOS

1) Em quatro leituras experimentais de um comercial de 30 segundos, um locutor levou


em media 29,2 segundos com desvio padro de 5,76 segundos. Construir os limites de
confiana para a media, dado = 10 %, supondo que a populao tem distribuio
normal. Resp. (22,42; 35,98)

Soluo:

Os limites de confiana para a estimativa por intervalo do parmetro media populacional

dado pela seguinte expresso:

X Z .

X
n

< < X + Z .

X
n

219

No caso n = 4 (o tamanho da amostra), a media amostral X = 29,2 e o desvio-padrao


amostral s = 5,76 (que utilizamos na expressao acima no lugar do X , o desvio padro
da populao, j que s um estimador no viesado para este parmetro da populao).
Para = 10 % vemos que o valor de z correspondente 1,6448. Assim o intervalo de
confiana de 90 % de probabilidade (1 - = 0,90) ser:

5,76
5,76
< < 29,2 + 1,6448.
4
4
24,46 < < 33,94

29,2 1,6448.

2) De 50.000 vlvulas fabricadas por uma companhia, retira-se uma amostra aleatria de
400 vlvulas e obtem-se a vida media de 800 horas, sendo o desvio padro populacional
de 100 horas.

a) Qual o intervalo de confiana de 99 % para a estimativa da media populacional?


b) Com que confiana dir-se-ia que a vida media de 800 9,8 ?

c) Que tamanho deve ter a amostra para que seja de 95 % a confiana na estimativa do
intervalo de 800 7,84 ?

Resp. a) (787,1; 812,9) b) 95 % c) 625

Soluo:

X = 800 2 = 100 n = 400 N = 50.000


a) 1- = 0,99

220

X Z .

X
n

N n
N n

< < X + Z . X .
N 1
n N 1

100
5000 400
100
5000 400

< < 800 + 2,5758

5000 1
5000 1
400
400
787,6 < < 812,3

800 2,5758

b) 800 9,8

Portanto:

100
5000 400

= 9,8
5000 1
400
z = 2,0432
z

1- = 0,9590

3) Uma amostra aleatria de 625 donas de casa revelou que 70 % delas preferem a marca
X de detergente. Construir um intervalo de confiana para p = proporo das donas de
casa que preferem X, com uma confiana de 90 %.

Resp. (67 %, 73 %)

4) Antes de uma eleio, um determinado partido poltico est interessado em estimar a


proporo p de eleitores favorveis a seu candidato. Uma amostra piloto de tamanho 100
revelou que 60 % dos eleitores eram favorveis ao candidato em questo.

a) Determine o intervalo de confiana para a proporo de votos favorveis para o


conjunto dos eleitores, com uma confiana de 95 %.

b) Determine o tamanho da amostra necessrio para que o erro cometido na estimao


seja de, no maximo, 0,01 com probabilidade de 80 %.

Resp. a) (0,504; 0,696) b) n = 3933

221

5) Suponha que estamos interessados em estimar a percentagem de consumidores de certo


produto. Se uma amostra de tamanho 300 forneceu 100 indivduos que consomem o dado
produto, determine:

a) O intervalo de confiana de p, com coeficiente de 95 %.


b) O tamanho da amostra para que o erro da estimativa no exceda a 0,02 unidade com
probabilidade de 95 %.

Resp. a) 0,2800; 0,3866) b) n = 2134

EXERCICIOS RESOLVIDOS

1) Considere a funo dada por:

0 se x < 1,5
x se 1,5 x 2

f (x)
0,25 se 2 x 2,5
0 se x > 2,5

a. Mostre que f(x) uma funo densidade de probabilidade.


b. Escolhido um valor ao acaso para x, qual a probabilidade de x pertencer ao intervalo
[1,5;2]?
Soluo:
a) f(x) uma funo densidade de probabilidade se
+

f (x) 0 para qualquer x e f(x)dx = 1


-

dessa forma:

222

2,5

xdx + 0,25dx = x

1, 5

2 1,5

2,5

+ 0,25 x 2 = 4 / 2 2,25 / 2 + 0,25 2,5 0,25 2 = 2 1,125 + 0,625 0,5 = 1

Portanto f(x) uma funo densidade de probabilidade


2

b) P (1,5 x 2) =

1, 5

2
f ( x)dx = xdx = x
1, 5

= 4 2,25 = 0,875
2
2

2
1, 5

2) Uma pessoa dispe de R$ 100.000 e pode comprar terrenos ou investir no mercado


financeiro. Uma avaliao preliminar mostrou que:

a. O cenrio futuro para os terrenos indica que eles devero valorizar em mdia 25 % em
dois anos, mas fatores no controlveis transferem grande variabilidade para esta
previso. Acredita-se que a valorizao tenha uma varincia de 12 %.
b. O mercado financeiro mais estvel e acena com uma taxa de ganho de 20 %, com
varincia de 4 % em dois anos.

O investidor se satisfaz com um ganho de 16 % nessa operao e pretende decidir pelo


investimento mais confivel neste sentido. Qual deve ser sua deciso, se supe as
distribuies normais?

Soluo:

Seja X1 a varivel aleatria que representa a taxa de valorizao dos terrenos e X2 a taxa
de valorizao do mercado financeiro.

X 1 ~ N(25;12) e X 2 ~ N(20;4)
16 25
) = P ( z 2,598) = 1 0,0047 = 0,9953
12
16 20
) = P ( z 2) = 1 0,0227 = 0,9773
P ( X 2 16) = P ( z
4

P ( X 1 16) = P ( z

223

O investidor deve escolher pela compra dos terrenos pois P( X 1 16) > P( X 2 16)

3) Com a finalidade de estabelecer o custo de um novo produto, o encarregado de custos


levantou os possveis fornecedores de um componente desse produto. Dos 60
fornecedores cadastrados foram sorteados e consultados 6 deles. Os preos fornecidos
apresentam uma mdia de 4,83 u.m. A experincia do encarregado indica que o desvio
padro para o preo mdio de 10 % deste preo. Qual deve ser o intervalo de confiana
de 93 % para o preo mdio desse componente?

Soluo:

X = 4,83 X = 0,10 X = 0,10 4,83 = 0,0483 n = 6 N = 60


Observe que a amostragem realizada considerando-se populao finita j que n/N >
0,05. Alm disso como n menor que 30 e como no enunciado nada dito sobre a
distribuio de X no podemos aplicar o Teorema do Limite Central. Dessa forma, para
solucionarmos o problema, temos que supor que o custo tem distribuio normal (caso
contrrio teramos que trabalhar com a teoria das amostras pequenas e aplicar uma outra
distribuio chamada "t" de Student). No clculo do intervalo de confiana temos que
fazer a correo de populao finita.
O intervalo de confiana para um nvel de confiana de 1 - % dado por:

P ( X z X

N n
N n
) = 1
X + z X
N 1
N 1

Para 1- = 93 % temos:

60 6
60 6
4,83 + 1,48 0,483
) = 0,93
60 1
60 1
P (4,146 5,514) = 0,93
P (4,83 1,48 0,483

224

4) Uma amostra de 50 elementos foi retirada de uma populao de 500 elementos, para a
avaliao da mdia populacional, fornecendo s(x) = 4. Qual deve ser o tamanho de uma
amostra que avalie a mdia com erro mximo de 2 unidades, ao nvel de confiana de 90
%?

Soluo:

N= 500 n = 50 sx = 4

O tamanho da amostra (sem considerar correo de populao finita) para a


estimativa da mdia populacional dado pela expresso:
Z X = erro

Como

X =

x
n

sx
n

Temos:

s
Z s 1,64 4
Z x = erro ou n = x =
= 10,758 11
n
erro 2
Como n/N > 0,05 temos que considerar a correo de populao finita, ou seja,

temos que empregar a seguinte relao:

Z X

N n
= erro
N 1

225

elevando ao quadrado ambos os termos da equao acima temos:

Z X
2

N n
= erro 2
N 1

sx2
( N n) = erro 2 ( N 1)
n

isolando n no primeiro membro temos:

z2 s x2 N
1,64 2 16 500
n= 2
=
=
e N e 2 + z2 s x2 4 500 4 + 1,64 2 16
10,55 11

Portanto observa-se que mesmo com a correo de populao finita o tamanho


amostral necessrio no se altera.

226