Escolar Documentos
Profissional Documentos
Cultura Documentos
APLICADA
1. Introduo ....................................................................................................4
2. Estatstica Descritiva .........................................................................................8
2.1 Tipos de Variveis ...........................................................................................8
2.2 Tabelas e Distribuies de Freqncia .............................................................10
2.3 Histogramas ..................................................................................................12
2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas .......................13
2.5 Medidas de Posio e de Disperso .................................................................16
2.5.1 Uma Nota sobre Notao Estatstica ..........................................................17
2.5.2 A Mdia Aritmtica No Ponderada...........................................................18
2.5.3 A Mdia Aritmtica Ponderada .................................................................19
2.5.4 Propores como Mdias ..........................................................................20
2.5.5 A Mdia Geomtrica ................................................................................21
2.5.6 A Mdia Harmnica .................................................................................25
2.5.7 A Mediana ..............................................................................................25
2.5.8 A Mdia para Dados Agrupados ................................................................27
2.5.9 A Mediana para dados Agrupados .............................................................28
2.5.10 A Moda para dados Agrupados ................................................................30
2.5.11 O Intervalo (ou amplitude) ......................................................................37
2.5.13 Varincia e Desvio Padro ......................................................................39
2.5.14 Varincia e Desvio Padro para Dados Agrupados .....................................42
2.5.15 Interpretando e Aplicando o Desvio Padro ..............................................43
2.5.16 Coeficiente de Variao ..........................................................................45
2.6 Medidas de Assimetria ...................................................................................46
2.7 Curtose: uma medida de achatamento ..............................................................48
3. Probabilidade ..................................................................................................50
3.1 Definio Clssica de Probabilidade ...............................................................51
3.2 Conceito da Freqncia Relativa .....................................................................52
3.3 Probabilidade Subjetiva.................................................................................53
3.4 Algumas Regras Bsicas de Probabilidade .......................................................53
3.5 A Regra do Complemento ..............................................................................55
3.6 A Regra Geral da Adio................................................................................56
3.7 Regras de Multiplicao ................................................................................58
3.8 Probabilidade Condicional..............................................................................60
3.9 Diagramas em rvore ....................................................................................62
3.10 Teorema de Bayes........................................................................................64
Anexo 1 Recordando Definies e Conceitos ......................................................65
Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades ............68
Anexo 3 - Probabilidade Condicional ....................................................................74
Anexo 4 Revisando os conceitos ........................................................................77
Resumo do Clculo de Probabilidades...................................................................96
Exerccios de Probabilidade .................................................................................97
4. Variveis Aleatrias Discretas.......................................................................114
2
4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta .......118
4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta ..119
4.3 A Distribuio de Probabilidade Binomial .....................................................121
4.4 A Mdia e Varincia De Uma Distribuio Binomial ......................................125
Apndice 1 (Recordao) ...................................................................................126
Apendice 2 (Recordao) ...................................................................................127
Apndice 3 (Recordao) ...................................................................................128
Apndice 4 (Recordao) Valor Esperado e Varincia de uma Varivel Aleatria ....132
Variveis Aleatrias Independentes.....................................................................140
Apndice 4 (recordao) ....................................................................................141
5. Variveis Aleatrias Contnuas e Distribuio Normal .........................................144
5.1 Variveis Aleatrias Contnuas .....................................................................144
5.2 Mdia e Varincia de uma Varivel Aleatria Contnua ...................................146
5.3 Varivel Aleatria Normal............................................................................165
5.4 Distribuio Normal Padro..........................................................................167
5.5 reas Abaixo da Curva Normal ....................................................................168
6. Mtodos de Amostragem e Distribuies Amostrais ............................................175
6.1 Amostragem Probabilstica ...........................................................................180
6.2 Teorema do Limite Central ...........................................................................184
6.3 Estimativa de Ponto .....................................................................................186
6.4 Estimativa de Intervalo.................................................................................186
6.5 Intervalo de Confiana para Uma Proporo Populacional ...............................188
6.6 Fator de Correo de Populao Finita ...........................................................189
6.7 Selecionando uma Amostra ..........................................................................190
6.8 Tamanho Amostral para Estimativa de Propores ..........................................191
7. Teste de Hipteses Amostras Grandes .....................................................192
7.1 Testes de Significncia Unicaudais ................................................................194
7.2 Testes de Significncia Bicaudais ..................................................................194
7.3 P-value de um Teste de Hiptese ...................................................................196
7.4 Clculo do p-value.......................................................................................196
7.5 Teste de Hipteses: Duas Mdias Populacionais .............................................198
7.6 Testes Referentes Proporo.......................................................................201
EXERCCIOS : ................................................................................................204
3
1.Introduo
4
De fato, a estatstica tornou-se uma ferramenta cotidiana para todos os tipos de
profissionais que entram em contato com dados quantitativos ou tiram concluses a partir
destes.
O que Estatstica?
Estatstica Descritiva
5
informao fornecida pelos dados possa ser observada com grande facilidade e
preciso.
3) Apresentar dados numricos, seja organizados ou no, de forma que as caractersticas e
o comportamento dos dados so clara e facilmente revelados. Tais apresentaes So
feitas por meio de mtodos grficos.
4) Sumarizar ou descrever cada caracterstica ou propriedade dos dados por um simples
nmero, tal como uma mdia, uma porcentagem ou alguma outra medida apropriada, a
qual calculada a partir dos dados por meio de uma frmula derivada a partir de algum
princpio vlido.
Estatstica Indutiva
A Estatstica Indutiva, que tambm freqentemente chamada de inferncia estatstica ou
estatstica inferencial, em contraste com a estatstica descritiva, essencialmente analtica
em sua natureza. Consiste de um conjunto de princpios ou teoremas que nos permitem
generalizar acerca de alguma caracterstica de uma populao a partir das caractersticas
observadas de uma amostra. Nessa definio, uma populao o conjunto de todos os
itens, objetos, coisas ou pessoas a respeito das quais a informao desejada para a
soluo de um problema. Uma amostra um grupo de itens selecionados por um mtodo
cuidadosamente concebido e projetado a partir de uma populao. Existem diferentes
tipos de amostras, dependendo dos diferentes mtodos de seleo disponveis. Uma
amostra aleatria simples, falando em termos simplificados, aquela que selecionada de
tal forma que cada e todos os itens na populao tm a mesma chance de serem includos
na amostra.
Se uma medida descritiva calculada a partir dos dados da populao ela chamada de
parmetro populacional, ou simplesmente parmetro; se calculada a partir dos dados
da amostra ela chamada de estatstica amostral, ou simplesmente estatstica.
Considerando esses conceitos podemos definir estatstica indutiva como o processo de
generalizar acerca de do valor de um parmetro a partir do valor de uma estatstica.
Existem dois procedimentos de inferncia distintos mas relacionados: estimao e teste
de hipteses. Estimao processo de usar o valor de uma estatstica amostral para
6
estimar o valor de um parmetro que desconhecido, mas uma constante. Como um
exemplo, suponhamos que temos uma populao de 100.000 bolas de gude em um saco,
todas as quais so idnticas exceto pela cor, e que no podemos v-las embora saibamos
que uma parte delas so brancas e o restante so pretas. Suponha que desejamos ter uma
idia da proporo de, digamos, bolas brancas nessa populao. Suponha que para
conseguir isso selecionamos 1.000 bolas aleatoriamente do saco e verificamos que 350
so brancas. Isso significa que nossa proporo amostral de bolas brancas 35 %. A partir
disso conclumos que a proporo populacional de bolas brancas tambm 35 %.
Fazendo isso ns realizamos o que chamado de estatstica pontual.
Mas afirmar que a proporo de bolas brancas em toda a populao exatamente
igual a proporo daquela amostra particular como dar um tiro no escuro: o valor da
proporo amostral um resultado aleatrio e depende de cada amostra de 1.000 bolas
escolhida da populao. Pode ser que por uma enorme casualidade o resultado daquela
amostra que escolhemos coincida exatamente com o valor da proporo de bolas brancas
em toda a populao. Mas as chances de que isso no ocorra so muito grandes. Uma
forma de contornarmos esse problema afirmarmos que as chances so de 95 em 100 (ou
de 95 %) de que o intervalo formado pela proporo amostral acrescida e diminuda de 3
pontos percentuais contenha o verdadeiro valor da proporo populacional desconhecido.
Ou seja, construmos um intervalo com limites 35 + 0,03 x 35 = 36,05 e 35 - 0,03 x 35 =
33,95 e afirmamos (com base em algum princpio obtido a partir da teoria estatstica) que
as chances so de 95 em 100 de que o verdadeiro valor da proporo populacional esteja
localizado dentro desse intervalo. Quando uma afirmativa dessa natureza feita estamos
realizando o que se chama de estimativa por intervalo.
Quanto ao segundo procedimento da estatstica inferencial deixaremos para
coment-lo quando for abordado em sua ntegra. E o terceiro campo de estudos da
Estatstica, a Teoria da Deciso Estatstica no ser discutido nessa apresentao.
7
2. Estatstica Descritiva
1
Uma varivel quantitativa discreta no precisa assumir necessariamente apenas valores
de contagem, ou seja nmeros inteiros ou nmeros naturais em seqncia. Um exemplo de
varivel quantitativa discreta seria, por exemplo, uma que assumisse apenas os seguintes valores : { 1; 3,5 ;
8
variveis quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua e
no apresentam saltos de descontinuidade. Exemplos dessas variveis so o peso de
pessoas, a renda familiar, o consumo mensal de energia eltrica, o preo de um produto
agrcola.2 As variveis quantitativas contnuas referem-se ao conjunto dos nmeros reais
ou a um de seus subconjuntos contnuos.
5,75 ; 10 }. Apesar dessa varivel abranger valores no inteiros ela apresenta saltos de descontinuidade:
nesse exemplo ela no pode assumir nenhum valor intermedirio entre 1 e 3,5 ou entre 5,75 e 10.
2
Seria impossvel obter na prtica uma varivel perfeitamente contnua j que os instrumentos de medida
no tem preciso infinita. Por exemplo., o peso de pessoas medido com uma balana com preciso,
digamos, de dcimos de gramas. Ento jamais conseguiremos obter um valor para essa varivel que se
localize entre 50.000,1 e 50.000,2 gramas, por exemplo, 50.000,15 gramas. Ocorre portanto um salto de
descontinuidade entre os dois valores possveis de serem medidos e a varivel, do ponto de vista terico,
no pode ser considerada como varivel quantitativa contnua, mas varivel quantitativa discreta. Mas do
ponto de vista prtico, acabamos freqentemente por consider-la e trat-la como sendo uma varivel
quantitativa contnua, apesar dessa falta de preciso absoluta. O mesmo podemos dizer para o caso da
renda ou qualquer outra varivel econmica medida em unidades monetria: no existe uma renda de por
exemplo R$ 200,345 j que o centavo a menor diviso do sistema monetrio. Mas de qualquer forma,
costuma-se tratar a renda como varivel quantitativa contnua e no discreta.
3
muito comum considerar-se que a estatstica apenas abrange os estudos que utilizam as variveis
quantitativas. Nada mais equivocado. Existe um vasto campo de aplicaes estatsticas em que so
empregadas as variveis qualitativas, tanto isoladamente como em conjunto com variveis quantitativas.
4
No podemos dizer que a cor X superior a cor Y mas podemos afirmar que o terceiro ano do segundo
grau superior hierarquicamente ao primeiro ano do primeiro grau.
9
dessa varivel codificada no podemos consider-la como sendo quantitativa. Ela
continua sendo uma varivel qualitativa (pois o em sua essncia e natureza) apesar de
sua codificao numrica que tem como finalidade uma maior finalidade de tabulao de
resultados.
No podemos dizer que para qualquer uma destas categorias qualquer mtodo estatstico
pode ser adequadamente aplicado. As variveis quantitativas contnuas so aquelas que
permitem a utilizao de um conjunto maior e superior de mtodos estatsticos e so, sem
dvida, as variveis mais passveis de um rico tratamento estatstico. Em seguida vm,
nessa ordem, as variveis quantitativas discretas, as variveis qualitativas ordinais e por
ltimo, as variveis qualitativas nominais. Essas ltimas so as que permitem a utilizao
de um menor e menos poderoso arsenal de instrumentos estatsticos de anlise.
141213111213
161414151714
111314151312
141314131516
1212
10
Para montarmos uma distribuio de freqncias desses dados verificamos quais so os
valores no repetidos que existem e em uma primeira coluna de uma tabela colocamos
esses valores e na segunda coluna colocamos o nmero de repeties de cada um desses
valores. Para o exemplo acima, a distribuio de freqncias ser:
Varivel freqncia
11 2
12 5
13 6
14 7
15 3
16 2
17 1
11
16 2 2/26 = 0,0769
17 1 1/26 = 0,0385
TOTAL 26 1,0000
Podemos tambm calcular as freqncias acumuladas. Nesse caso existem as freqncias
absolutas acumuladas e as freqncias relativas acumuladas. 5
2.3 Histogramas
5
Observe que os valores da ltima coluna (freqncia relativa acumulada) podem ser calculados de duas
maneiras. Na primeira, tal como feito na tabela a seguir, dividimos o valor da freqncia absoluta
acumulada pelo total de observaes. Na segunda maneira, acumulamos o valor da freqncia relativa. Este
ltimo mtodo pode levar a acmulos de erros, de forma que o ltimo valor de freqncia relativa
acumulado se distancie consideravelmente de 1.
12
Histograma
7
6
Freqncia
5
4
Freqncia
3
2
1
0
Mais
11
12
13
14
15
16
17
Bloco
Histograma
7 100,00%
6
80,00%
Freqncia
5
4 60,00% Freqncia
3 40,00% % cumulativo
2
20,00%
1
0 ,00%
Mais
11
12
13
14
15
16
17
Bloco
13
adequada. Suponhamos que as safras agrcolas de um determinado produto, em uma
determinada regio, sejam dadas pela tabela a seguir:
Devem ser seguidos alguns passos para a tabulao de freqncias de dados que se
referem a uma varivel quantitativa contnua, como o caso de nosso exemplo.
1. Definir o nmero de classes. O nmero de classes no deve ser muito baixo nem
muito alto. Um nmero de classes pequeno gera amplitudes de classes grandes o que
pode causar distores na visualizao do histograma. Um nmero de classes grande
gera amplitude de classes muito reduzidas. Foram definidas regras prticas para a
determinao do nmero de classes, sendo que este deve variar entre 5 e 20 (5 para um
nmero muito reduzido de observaes e 20 para um nmero muito elevado). Se n
representa o nmero de observaes (na amostra ou na populao, conforme for o
caso) o nmero aproximado de classes pode ser calculado por Nmero de Classes =
n arredondando os resultados. No caso do exemplo anterior temos n = 18
14
Valor Maximo - Valor Minimo
Amplitude de classe =
nmero de classes
430 - 280
Amplitude de Classe = = 30
5
Observa-se na tabela acima que o limite superior de cada classe coincide com o limite
inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observao
seja exatamente igual ao valor do limite de classe deve-se estabelecer um critrio de
incluso. Para evitar esse tipo de dificuldade normalmente se estabelece que o limite
superior de cada classe aberto (e conseqentemente, o limite inferior de cada classe
fechado), ou seja, cada intervalo de classe no inclui o valor de seu limite superior, com
exceo da ltima classe.
15
Classe Freqncia Absoluta Freqncia Relativa
Simples Simples
280 - 310 3 0,12 (12 %)
310 - 340 4 0,16 (16 %)
340 - 370 6 0,24 (24 %)
370 - 400 7 0,28 (28 %)
400 - 430 5 0,20 (20%)
Total 25 1,00 (100 %)
1. Medidas de Tendncia Central (ou medidas de posio). Essa propriedade dos dados
refere-se a localizao do centro de uma distribuio. Elas nos indicam qual a
localizao dos dados ( no eixo que representa o conjunto dos nmeros inteiros se
estivermos tratando de uma varivel quantitativa contnua).
2. Medidas de Disperso. Essa propriedade revela o grau de variao dos valores
individuais em torno do ponto central.
16
3. Assimetria. a propriedade que indica a tendncia de maior concentrao dos dados
em relao ao ponto central.
4. Curtose. a caracterstica que se refere ao grau de achatamento, ou a taxa na qual a
distribuio cresce ou cai da direita para a esquerda.
moda ~
xm Xm xm
17
2.5.2 A Mdia Aritmtica No Ponderada
A mdia definida como a soma das observaes dividida pelo nmero de observaes.
Se tivermos, por exemplo, n valores, temos:
n
x1 + x 2 +...+ x n
x
i =1
i
X = =
n n
Propriedades da mdia aritmtica no ponderada:
n( X ) = x (6)
(x X ) = 0
(x X ) 2
= um mnimo.
A idia bsica de selecionar um nmero tal que a soma dos quadrados dos desvios em
relao a este nmero minimizada tem grande importncia na teoria estatstica. Ela
chega a ter um nome especial: o princpio dos mnimos quadrados. Ela , por exemplo,
a base racional do mtodo dos mnimos quadrados que usado para ajustar a melhor
n
6
- Utilizaremos muito freqentemente a notao x simplificadamente para representar x
i =1
i .
18
curva atravs de um conjunto de pontos em um sistema de eixos cartesianos, como
veremos adiante. Esta propriedade tambm a base para o clculo de uma importante
medida de disperso, que veremos logo a seguir.
A validade dessas tr6es propriedades pode ser facilmente demonstrada por um exemplo
numrico simples, mostrado na tabela a seguir. Nesta tabela, a coluna (1) contem o
conjunto de dados cuja soma 9 e cuja mdia 3. A coluna (2) demonstra a primeira
propriedade da mdia, ou seja, se cada uma das observaes individuais dos dados
substituda pela mdia, a soma permanece igual a 9. A coluna (3) verifica que de fato
14, que menor que somas quando os desvios individuais so tomados a partir do nmero
2 e do nmero 5, respectivamente.
1 3 -2 4 1 16
2 3 -1 1 0 9
6 3 +3 9 16 1
Soma 9 9 0 14 17 26
19
1 (7) +1 (5) + 2 8
=7
1+1+ 2
Em termos gerais, a frmula para a mdia aritmtica ponderada :
n
X w = wi xi = wx
i =1
valor 0 para cada pessoa no qualificada como eleitor. Ento, a soma dos 1s seria x e
a mdia seria a mdia seria obtida pela diviso da soma pelo nmero N total de pessoas
no Brasil.
20
2.5.5 A Mdia Geomtrica
A mdia geomtrica de uma amostra definida como a raiz ensima do produto nos n
valores amostrais.
G = n ( x1 )( x2 )...( xn )
G = 3 (5)(9)(13) = 8,36
Para a mesma srie de dados a mdia 9. sempre verdade que a mdia aritmtica
maior do que a mdia geomtrica para qualquer srie de valores positivos, com exceo
do caso em que os valores da srie so todos iguais, quando as duas mdias coincidem.
clculo da mdia geomtrica muito simples. Mas a sua interpretao e as sua
propriedades tornam-se mais evidentes quando reduzimos a frmula a sua
forma logartmica. Tomando logaritmos de ambos os lados da equao anterior
teremos:
21
Preos das Mercadorias A e B em 1980 e 1985
Preo Relativo de Preos
1980 = 100 1985 = 100
Mercadoria 1980 1985 1980 1985 1980 1985
A R$ 50 R$ 100 100 200 50 100
B R$ 20 R$ 10 100 50 200 100
Mdia Aritmtica 100 125 125 100
Mdia Geomtrica 100 100 100 100
A mdia aritmtica fornece uma resposta incorreta para essa questo. Como indicado
pelos clculos da tabela acima leva a duas concluses opostas. Se 1980 tomado como
base para o relativo de preos, os preos so em mdia 25 % maiores em 1985 do que em
1980. Se 1985 tomado como base, os preos de 1980 so 25 % maiores do que os
preos de 1985. Portanto, a mdia aritmtica dos relativos de preos conduz a resultados
inconsistentes.
No entanto, um resultado consistente obtido quando a mdia geomtrica aplicada:
1. Se 1980 escolhido como a base, os preos de 1985 so 100 % dos preos de 1980, ou
seja:
g = 200 50 = 10.000 = 100
2. Se 1985 escolhido como a base, os preos de 1980 sero tambm 100 % dos preos
em 1985, ou seja:
g = 50 200 = 100
22
porcentagem da produo em relao aos anos anteriores. Se calcularmos a mdia
aritmtica desses valores teramos:
x = (60 + 96 + 300) / 3 = 152
implicando uma taxa de crescimento mdia de 152 -100 = 52 %. Se a produo cresce 52
% ao ano, comeando da produo de 1985 de 10.000 unidades, ento a produo de
1986 seria de
Observe-se que este ltimo valor quase 200 % do valor efetivamente observado
em 1988, de 17.200.
A mdia geomtrica, por sua vez, :
g = 3 (60)(96)(300) = 120
23
Se o valor da mdia geomtrica das porcentagens de crescimento for menor do que 100,
implica em uma porcentagem mdia de crescimento negativa, o que indica uma taxa
mdia de declnio ao invs de uma taxa mdia de crescimento.7 Atente tambm para o
fato de que as trs porcentagens a partir das quais a mdia geomtrica calculada so
percentuais do ano anterior ao invs de mudana percentual do ano anterior.8
clculo da taxa mdia de crescimento baseado principalmente na hiptese de
uma taxa constante de crescimento ou de que os valores individuais formam
uma progresso geomtrica. Quando o clculo envolve um nmero
considervel de perodos, utiliza-se com mais freqncia uma frmula que se
relaciona com a mdia geomtrica, que :
xf
R = n 1
i
x
onde:
R = taxa de crescimento geomtrica mdia,
n = nmero de perodos de tempo,
xf = valor no perodo final,
xi = valor no perodo inicial.
17.280
R = 3 1 = 0,20 ou 20 % , como obtido anteriormente.9 Note que R = G -1.
10.000
7
Se, por exemplo, ao invs de 60, 96 e 300 %, como anteriormente, tivermos 60, 96 e 78 %, a taxa de
crescimento geomtrica mdia ser de g = 3 (60)(96)(78) = 76,59 , o que indica um decrscimo mdio
de 76,59 - 100 = - 23,41 %.
8
Essas ltimas porcentagens, referentes ao exemplo da tabela anterior, seriam (6.000 - 10.000)/10.000= -
0,40, ou seja - 40 %; (5.760 - 6.000)/6.000 = -0,04 , ou seja, - 4 %; e (17.280 - 5.760)/5760 = 2, ou seja +
200 %.
9
- interessante notar que pelo clculo anterior empregam-se os valores dos anos intermedirios, ao passo
que nesse ltimo, apenas empregam-se os valores do perodo inicial e final, no importando o que ocorreu
nos perodos intermedirios.
24
2.5.6 A Mdia Harmnica
A mdia harmnica o inverso da mdia aritmtica dos inversos dos valores observados.
Simbolicamente, para uma amostra, temos:
1 1
1 1 1
x1 + x2 +...+ xn (1 / x ) = n
H= =
n n (1 / x)
Para clculos mais simples, a frmula anterior pode ser reescrita como:
1 1 1
1 x1 + x2 +...+ xn (1 / x )
H= n
=
n
1 +1 +1
1 4 10 16 = 0,1375
H= 3
H = 7,27
Para os mesmos dados a mdia aritmtica 10 e a mdia geomtrica 8,62. Para
qualquer srie de dados cujos valores no so todos os mesmos e que no incluem o zero,
a mdia harmnica sempre menor que tanto a mdia aritmtica como a mdia
geomtrica.
2.5.7 A Mediana
25
item, R$ 5. No caso do nmero de itens na srie ser par, a mediana a semi-soma dos
dois valores mais centrais. Por exemplo, para a srie 3, 5 ,8 ,10, 15 e 21 kg, a mediana a
media dos valores 8 e 10, ou seja 9.
A mediana pode ser formalmente definida como o valor que divide a srie de tal forma
que no mnimo 50 % dos itens so iguais ou menores do que ela, e no mnimo 50 % dos
itens so iguais ou maiores do que ela. Mais rigorosamente, estabelecemos que:
Por exemplo, para uma srie formada pelos valores 3,5,8,10,15 e 21 a mediana
ser o valor do [(6+1)/2] = 3,5 simo item, ou seja, a semi soma do item de posto 3 e do
item de posto 4, que so 8 e 10.
O valor da mediana no influenciado pelos valores nas caudas de uma
distribuio. Por exemplo, se temos a srie de dados 1,2,3,4,5 a mediana 3. Se
substituirmos os valores das caudas dessa distribuio por quaisquer valores uma nova
distribuio formada poderia ser formada pela srie -1000,-100,3,500,5000 e a mediana
permanece sendo 3. Portanto, ela uma medida de posio da distribuio bem adequada
para distribuies assimtricas, tais como a distribuio de renda, j que no sabemos se a
famlia mais rica ganha R$7.000.000 ou R$ 500.000.000. Veremos, mais a frente que ela
possui vantagens em relao a mdia aritmtica, como medida de posio (ou medida de
tendncia central) para dados agrupados em classes de freqncia, quando a ltima classe
tem limite superior indeterminado.
A mediana tambm tem a interessante propriedade de que a soma dos desvios absolutos
das observaes em relao a mediana menor do que a soma dos desvios absolutos a
partir de qualquer outro ponto na distribuio. Simbolicamente:
x X .5 = um mnimo
26
2.5.8 A Mdia para Dados Agrupados
X
f 1m1 + f 2 m2 +...+ f k mk
fm
f 1 + f 2 +...+ f k f
fm
=
n
Classe f m fm
R$ 120,00 - R$139,99 5 130,0 650,0
140,00 - 159,99 26 150,0 3900,0
160,00 - 179,99 24 170,0 4080,0
180,00 - 199,99 15 190,0 2850,0
200,00 - 219,99 8 210,0 1680,0
10
Isto , principalmente se no agrupamento dos dados originais em uma tabela de distribuio de
freqncia, empregou-se um nmero adequado de classes de freqncia.
27
220,00 - 239,99 2 230,0 460,0
Total 80 13620,0
13620,00
x= = R$170,25
80
28
Classe freq. absoluta freq.acumulada freqncia
simples relativa
acumulada
R$ 120,00 - R$139,99 5 5 0,0625
140,00 - 159,99 26 31 0,3875
160,00 - 179,99 24 55 0,6875
180,00 - 199,99 15 70 0,8750
200,00 - 219,99 8 78 0,9750
220,00 - 239,99 2 80 1,0000
Total 80
55
n + 1 80 + 1
= = 40,5
2 2
31
11
- A freqncia relativa acumulada da classe anterior classe corrente a freqncia relativa acumulada
do limite inferior da classe corrente. A freqncia relativa acumulada da classe corrente a freqncia
relativa acumulada do limite superior dessa mesma classe.
29
Por semelhana de tringulos, verifica-se que:
X .5 160 40,5 31
=
180 160 55 31
X .5 = 167,92
(n + 1) / 2 Fa
X .5 = LI .5 + c
f .5
onde:
LI.5 = limite de classe inferior da classe da mediana,
Fa = freqncia acumulada da classe imediatamente anterior classe da
mediana,
f.5 = freqncia absoluta simples da classe da mediana,
c = amplitude (tamanho) da classe da mediana.
12
Definimos densidade de freqncia de um intervalo de classe como sendo o quociente entre a freqncia
absoluta simples desse intervalo e o seu tamanho (amplitude). Quando os intervalos de classe possuem
amplitudes desiguais, existe uma tendncia de os intervalos maiores apresentarem maiores freqncias.
Dessa forma a classe modal no a classe de maior freqncia mas a classe de maior densidade de
freqncia. Naturalmente, quando todos os intervalos tm a mesma amplitude, como no caso do exemplo
anterior e como geralmente so construdos para no distorcer a distribuio, a classe modal a classe de
maior densidade de freqncia assim como tambm a classe de maior freqncia. Esse conceito de
densidade de freqncia ser muito til, quando definirmos, mais adiante, a funo densidade de
probabilidade e para a sua compreenso intuitiva.
30
anterior classe modal (a classe premodal) e da classe imediatamente posterior classe
modal (classe posmodal) so aproximadamente iguais. Quando isso no ocorre, como
sugerido pela figura a seguir, resultados mais precisos podem ser obtidos com a seguinte
frmula, para uma amostra:
1
X m Lm + ( )c
1 + 2
onde:
Lm = o verdadeiro13 limite inferior de classe da classe modal
1 = da diferena entre das densidades de freqncia da classe modal e classe
premodal.
2 = da diferena entre das densidades de freqncia da classe modal e classe
posmodal.
C = a verdadeira amplitude de classe da classe modal.
xm X
13
Para determinar os limites de classe verdadeiros para uma varivel contnua, temos que escrever os
limites de classe com uma casa decimal a mais do que os dados originais. Por exemplo, se o conjunto de
dados consiste de medidas de peso arredondadas para um dcimo de grama, os limites nominais de classe
(tambm chamados de limites aparentes podem ser 11,0 - 11,2; 11,3 - 11,5;11,6 - 11.8; ... Os limites
31
No exemplo anterior de gastos com alimentos de 80 famlias, como a amplitude
de todos os intervalos so iguais, podemos utilizar as freqncias absolutas de
classe no lugar das densidades de freqncia, para o clculo do valor aproximado
da mediana.
Lm = 140,00 1 = 26 - 15 = 11
c = 20 2 = 26 - 24 = 2
11
xm 140,00 + ( )20 = 156,92
11 + 2
Uma observao aqui necessria. possvel calcular os valores aproximados da
mediana e da moda para dados agrupados quando o ltimo intervalo de classe tem
limite superior indeterminado. No caso da mediana isso imediato e no caso da
moda, o seu clculo somente pode ser feito se a ltima classe no for a classe
modal e preciso primeiramente calcular as densidades de freqncia. Como
exemplo, suponhamos que a distribuio de renda de uma certa regio dada pela
seguinte distribuio de freqncia:
verdadeiros de classe (tambm conhecidos como limites reais ou efetivos) seriam 10,95 - 11,25; 11,25 -
11,55; 11,55 - 11,85;...
32
A mediana est localizada na terceira classe:14
(542 + 1) 210
x.5 605,50 + (1200,50 605,50) = 772
2
220
A Mdia Aritmtica
14
Observe-se que os dados originais esto, de acordo com o sugerido pela tabela acima, com aproximao
igual a unidades de gramas. Os limites verdadeiros (ou reais) de classe) passam, portanto, a ter aproximao
de uma casa decimal de grama. O valor final dos clculos da mediana e da moda so aproximados para
unidades de grama, j que essa a aproximao dos dados originais (que se refere ao instrumento de
medida).
15
J que esta classe a que apresenta maior densidade de freqncia. Como a ltima classe no tem limite
superior definido no foi possvel calcular sua densidade de freqncia, j que no podemos determinar sua
amplitude. Dependendo dessa amplitude ela poderia ter uma densidade de freqncia maior que a da
33
A Mediana
1) Seu valor afetado pelo nmero de observaes e como elas esto distribudas
mas ela no afetada pelos valores das observaes extremas.
2) Sua frmula no passvel de manipulao algbrica.
3) Seu valor pode ser obtido, como vimos, em distribuies, com limites
superiores indeterminados para a sua ltima classe.
4) A mediana a estatstica mais adequada para descrever observaes que so
ordenadas ao invs de medidas.
A Moda
terceira classe. Mas mesmo nesse caso, a terceira classe ainda seria modal, j que sua densidade de
freqncia maior que a das suas classes vizinhas, e a distribuio passaria a ser bimodal.
34
4) Para uma distribuio negativamente assimtrica, mdia < mediana < moda.
A distncia entre a mediana e a mdia cerca de um tero da distncia entre
a moda e a mdia.
Essas ltimas caractersticas so apresentadas graficamente, a seguir
POSIES RELATIVAS DA MDIA, MEDIANA E MODA EM FUNO
DA ASSIMETRIA DAS DISTRIBUIES
Assimetria positiva
Assimetria negativa
Distribuio simtrica
35
Medidas de Disperso, Assimetria e Curtose
Muitas sries estatsticas podem apresentar a mesma mdia, mas no entanto, os dados de
cada uma dessas sries podem distribuir-se de forma distinta em torno de cada uma das
mdias dessas sries. Na anlise descritiva de uma distribuio estatstica fundamental,
alm da determinao de uma medida de tendncia central, conhecer a disperso dos
dados e a forma da distribuio. Duas sries de dados podem possuir a mesma mdia, mas
uma pode apresentar valores mais homogneos (menos dispersos em relao a mdia) do
que a outra. Um pas, por exemplo, com uma distribuio de renda mais equnime, ter
uma disperso de suas rendas menor do que um pas com estrutura de renda mais
diferenciada em diversos estratos ou categorias sociais. Uma mquina que produz
parafusos e que estiver menos ajustada do que outra produzir medidas de parafusos com
distribuio mais dispersa em torno de sua mdia.
A importncia das mdias com freqncia exagerada. Se dizemos que a renda familiar
mdia de um determinado pas de US$ 5.000 por ano no sabemos muita coisa sobre a
distribuio de renda desse pas. Uma mdia, como um simples valor adotado para
representar a tendncia central de uma srie de dados uma medida muito til. Porm, o
uso de um simples e nico valor para descrever uma distribuio abstrai-se de muitos
aspectos importantes.
Em primeiro lugar, nem todas as observaes de uma srie de dados tem o mesmo valor
da mdia. Quase sem exceo, as observaes includas em uma distribuio distanciam-
se do valor central, embora o grau de afastamento varie de uma srie para outra. Muito
pouco pode ser dito a respeito da disperso mesmo quando diversas medidas de tendncia
central so calculadas para a srie. Por exemplo, no podemos dizer qual distribuio tem
maior ou menor grau de disperso da informao dada pela tabela abaixo.
36
Distribuio A Distribuio B
Mdia 15 15
Mediana 15 12
Moda 15 6
16
Foi o que fizemos ao calcular a mdia para valores agrupados em classes de freqncia. Nesse caso
utilizamos o ponto mdio de cada intervalo de classe como representativo da mdia de cada intervalo.
Assim, ao multiplicarmos a freqncia de cada classe pelo valor do ponto mdio, estamos calculando
aproximadamente a soma das observaes em cada intervalo, admitindo como hiptese que a distribuio
dos dados em todos os intervalos simtrica.
37
tomando a mdia somente dos valores mximo e mnimo de temperatura ao invs, de
digamos, a mdia das 24 leituras horrias do dia.
A amplitude tem alguns defeitos srios. Ela pode ser influenciada por um valor atpico na
amostra. Alm disso, o seu valor independe do que ocorre no interior da distribuio, j
que somente depende dos valores extremos. Este defeito ilustrado na figura a seguir:
f(X)
X
Na figura acima so mostradas duas distribuies com diferentes variabilidade, mas com
mesma amplitude. A amplitude tende a crescer, embora no proporcionalmente, a medida
que o tamanho da amostra cresce. Por esta razo, no podemos interpretar a amplitude
corretamente sem conhecer o nmero de informaes dos dados.
Podemos tentar responder a seguinte pergunta: que proporo dos valores de uma
varivel menor ou igual a um dado valor? Ou maior ou igual a um dado valor? Ou entre
dois valores? Quando construmos uma distribuio de freqncia acumulada, tais
questes somente podem ser respondidas com relao aos limites de classe exatos. Por
exemplo, a partir da distribuio de freqncia relativa acumulada da pgina 28, podemos
dizer que 38,75 % das observaes so menores do que 159,99. Mas no podemos
responder a pergunta: qual o gasto familiar tal que a proporo da amostra tendo este
valor ou menos 35 %?. Mas visvel da tabela que 6,25 % das famlias gastam com
alimentao at R$ 139,99 e 38,75 % das famlias gastam at R$ 159,99. Portanto, como
35 % est entre estes dois valores, o gasto familiar tal que a proporo da amostra tendo
38
este valor ou menos 35 % est situado entre R$ 139,99 e R$ 159,99. Este valor
chamado de percentil 35.
O percentil 40 o valor da varivel que maior do que 40 % das observaes.
Generalizando, o percentil x, o valor da varivel que maior do que x % das
observaes. Em outras palavras, o percentil x o valor da varivel correspondente ao
valor de freqncia relativa acumulada de x %.17 O primeiro decil o valor da varivel
que supera um dcimo (ou 10 %) do total de observaes. Se tivermos 200 observaes, o
segundo decil ser aproximadamente a observao de posto 40.
O primeiro quartil o valor da varivel cuja freqncia relativa acumulada 0,25 (ou 25
%). O terceiro quartil o valor da varivel cuja freqncia relativa acumulada 0,75 (ou
75 %). O primeiro quartil maior do que um quarto dos valores observados e menor do
que trs quartos destes valores. O terceiro quartil maior do que trs quartos dos valores
observados e menor do que um quarto destes valores. O segundo quartil confunde-se com
a mediana.
Uma medida de disperso o chamado desvio interquartlico que a diferena entre o
terceiro e o primeiro quartis.
S 2
=
(x X ) 2
n 1
17
Para o clculo do valor exato do percentil x para dados agrupados utiliza-se o mesmo mtodo para a
determinao da mediana, ou seja, a interpolao linear. Como no caso da mediana, podemos empregar uma
p (n + 1) / 100 Fa
frmula de interpolao X p = LI p + c
fp
onde Xp o percentil p, Lip o limite inferior real da classe que contem o percentil, Fa a freqncia
relativa acumulada da classe anterior classe que contem o percentil, fp a freqncia relativa (simples) da
classe que contem o percentil, c a amplitude do intervalo de classe que contem o percentil e o nmero
de observaes. O mesmo mtodo pode ser empregado tambm para os decis e quartis.
39
Para uma populao finita,
2
=
(x ) 2
n x 2 ( x ) 2
S =
2
n(n 1)
x x
2
2
2 =
N N
Com estas duas ltimas frmulas, podemos calcular a varincia somente com a soma dos
y = 408 10 = 40,8 unidades por hora. Portanto, com base nestes dados, o tipo Y um
pouco mais rpida. Podemos retirar mais alguma informao a partir destes dados?
40
Podemos medir e comparar as disperses das produes horrias dos dois tipos de
mquina. Usando a penltima frmula para os dados da tabela, obtemos:
10(16.405) (403) 2
S =2
= 18,23
X
10(10 1)
S X = 18,23 = 4,27 unidades por hora
10(17.984) (408) 2
S =2
= 135,11
Y
10(10 1)
SY = 135,12 = 11,62 unidades por hora
x y x2 y2
35 25 1.225 625
36 26 1.296 676
49 55 2.401 3.025
44 52 1.936 2.704
43 48 1.849 2.304
37 24 1.369 576
38 34 1.444 1.156
42 47 1.764 2.209
39 50 1.521 2.500
40 47 1.600 2.209
O tipo X tem menor disperso que o tipo Y. Apesar de ter maior preo que o tipo Y, a
mquina X mais precisa.
41
2.5.14 Varincia e Desvio Padro para Dados Agrupados
A varincia e o desvio padro (como a mdia, mediana, moda, quartis, percentis, decis)
podem ser calculados para dados agrupados, ou seja, distribuies de freqncia com
intervalos de classe. Entretanto, os resultados podem ser apenas aproximadamente
precisos. Utiliza-se, como no caso da mdia, a hiptese do ponto mdio: a de que toda
observao est localizada no ponto mdio de sua classe. Cada ponto mdio entra nos
clculos quantas vezes so as observaes naquele intervalo de classe. As equaes para
as varincias so:
S2 =
f (m X ) 2
, para a amostra;
n 1
2 =
f (m ) , para a populacao.
N
S2 =
fm 2
( fm) 2 / n
n 1
e
2 =
fm 2
( fm) 2 / N
N
42
agrupados, a raiz quadrada destas equaes so os desvios padres para a amostra e para a
populao, respectivamente.
Aplicando as ltimas equaes para o exemplo de consumo de alimentos, temos:
Classe (1) (2) (3) (4)
m f fm fm2
(2)(1) (3)(1)
R$ 120,00 - R$139,99 130 5 650 84.500
140,00 - 159,99 150 26 3.900 585.000
160,00 - 179,99 170 24 4.080 693.000
180,00 - 199,99 190 15 2.850 541.500
200,00 - 219,99 210 8 1.680 352.800
220,00 - 239,99 230 2 460 105.800
Total 80 13.620 2.363.200
S 2
=
fm 2
( fm) 2 / n 2.363.200 (13.620) 2 / 80
= = 561,96
n 1 80 1
S = 561,96 = 23,71
43
Por este teorema temos certeza de que no mnimo , ou 75 % dos dados iro situar-se
dentro do intervalo X 2 S . Neste caso h = 2 e 1 1 / h 2 = 1 1 / 2 2 = 3 / 4 . No mnimo
8/9, ou 88,9 % dos dados estaro no intervalo X 3S ; e no mnimo 15/16, ou cerca de
94 % dos valores de qualquer varivel estaro includos dentro do intervalo X 4 S .
Considere o exemplo anterior das mquinas. Temos X = 40,3 e S X = 4,27 . Que
percentagem das mquinas ter produo entre X 1,5S X = 40,3 1,5 4,27 , ou seja,
44
2.5.16 Coeficiente de Variao
Com freqncia, como no caso do exemplo das duas mquinas, queremos comparar a
variabilidade de dois ou mais conjuntos de dados. Podemos fazer isto facilmente usando
as varincias ou os desvios padres quando, primeiro, todas as observaes individuais
tm a mesma unidade de medida e, segundo, as mdias dos conjuntos de dados so
aproximadamente iguais. Quando qualquer uma destas condies no satisfeita, uma
medida relativa de disperso deve ser usada. Uma medida relativa de variabilidade
freqentemente usada chamada de coeficiente de variao, denotada por CV para uma
amostra. Esta medida o valor do desvio padro em relao mdia:
S
CV =
X
Suponha que um cientista na ndia obteve os seguintes dados referentes aos pesos de
elefantes e ratos.
Elefantes Ratos
x E = 6.000 kg x R = 0,150 kg
sE = 300 kg sR = 0,04 kg
45
4,27
cv(X) = = 0,1060 ou 10,60 %
40,30
11,62
cv(Y) = = 0,2848 ou 28,48 %
40,80
Assim, a disperso relativa da produo da mquina Y quase trs vezes maior do que a
disperso relativa da mquina X.
46
uma medida relativa de assimetria. Esta obtida pelo coeficiente de assimetria de
Pearson, denotado por SKP e dado por:
X Xm
SK P =
S
A aplicao desta expresso envolve outra dificuldade, que surge devido ao fato de que o
valor modal da maioria das distribuies ser somente uma distribuio, enquanto que a
localizao da mediana mais satisfatoriamente precisa. Contudo, em distribuies
moderadamente assimtricas, a expresso
X m = X 3( X X .5 )
adequada (no envolve impreciso muito grande). A partir disto, vemos que:
X X m = X [ X 3( X X .5 )] = 3( X X .5 )
Com este resultado, podemos rescrever o coeficiente de assimetria de Pearson como:
3( X X .5 )
SK P =
S
Esta medida igual a zero para uma distribuio simtrica, negativa para distribuies
com assimetria para a direita e positiva para distribuies com assimetria para a esquerda.
Ela varia dentro dos limites de 3. Aplicando SKP aos dados agrupados de gastos com
consumo de alimentos das famlias, temos:
3(170,25 167,92)
SK P = = +0,295
23,71
Este resultado revela que a distribuio de gastos com consumo de alimentos tem
assimetria moderadamente positiva (o que significa maior concentrao de famlias nas
classes de menor gasto). muito comum encontrar distribuies positivamente
assimtricas em dados econmicos, particularmente na produo e sries de preos, os
47
quais podem ser to pequenos quanto nulos mas podem ser infinitamente grandes.
Distribuies assimetricamente negativas so raras em cincias sociais.
1
(Q3 Q1 )
K= 2
D9 D1
48
Na figura acima se compara a curtose de duas distribuies com a curtose de uma
distribuio mesocrtica (em linha tracejada). Na figura da direita temos uma distribuio
platicrtica (linha cheia) e na figura da esquerda temos uma distribuio leptocrtica
(linha cheia).
Aps o clculo dos quartis e decis a partir dos dados agrupados para a distribuio de
gastos com alimentao, temos que:
1
(Q3 Q1 ) (1 / 2)(188.39 154,83)
K= 2 =
D9 D1 209,78 146,58
= 0,2655
Este resultado indica que a distribuio de gastos com alimentos aproximadamente
mesocrtica, j que muito prximo de 0,25.
49
3. Probabilidade
Objetivos do captulo:
Uma probabilidade expressa como uma nmero decimal, tal como 0,70 ; 0,27 ; ou 0,50.
Entretanto ela pode ser representada como uma percentagem tal com 70 %, 27 % ou 50
%. O valor de uma probabilidade est localizado no intervalo de nmero reais que vai de
0 a 1, inclusive as extremidades deste intervalo.
50
Quanto mais uma probabilidade prxima de 0, o evento a ela associado mais
improvvel de ocorrer.
Quanto mais uma probabilidade prxima de 1, o evento a ela associado mais
provvel de ocorrer.
Definies
51
CC CK
KC KK
Desde que cada resultado no experimento de jogar 2 moedas tem probabilidade igual
a , ento a soma das probabilidades dos resultados possveis + + + = 1
52
Exemplo 2
53
Exemplo 3
Chegada Frequncia
Adiantada 100
No horrio 800
Atrasada 75
Cancelado 25
Total 1000
54
3.5 A Regra do Complemento
P( A) + P( A ) = 1
P( A) = 1 P( A )
Exemplo 3
55
Use a regra do complemento para mostrar que a probabilidade do vo chegar adiantado
(A) ou atrasado (B) 0,175
C D
0,8 0,025
(C ou D) = (A ou B) =
0,175
56
O Diagrama de Venn abaixo ilustra esta regra:
Exemplo 5
TV
50
Ambos
CD 25
70
57
Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha somente
um aparelho de CD ? De somente uma TV ? De tanto uma TV como um aparelho de
CD?
Desde que:
58
Definio: Dois eventos A e B so independentes se a ocorrncia de um no tem
efeito sobre a probabilidade de ocorrncia do outro.
A regra especial escrita simbolicamente como:
Para trs eventos independentes A,B e C, a regra especial da multiplicao usada para
determinar a probabilidade de que todos os eventos ocorram :
P(A e B e C) = P(A).P(B).P(C)
Exemplo 6
59
Exemplo 7
Um estudo recente constatou que 60 % das mes com crianas de idade de at 10 anos
empregam-se em tempo integral. Trs mes so selecionadas aos acaso. Assumiremos
que as mes so empregadas de forma independente umas das outras.
1 [(0,40).(0,40).(0,40)] = 0,936
a probabilidade de que um evento particular ocorra, dado que outro evento tenha
ocorrido.
60
A regra estabelece que para dois eventos A e B, a probabilidade conjunta de que os
dois eventos ocorram obtida pela multiplicao da probabilidade de que o evento A
ocorra pela probabilidade condicional de B dado que A ocorreu.
Exemplo 8
61
P(A e F) = 80 / 1000
Dado que o(a) estudante mulher, qual a probabilidade de que esteja cursando
Contabilidade ?
Precisamos calcular P(A / F).
62
6/11 V2 (7/12) (6/11)
V1
7/12
B2 (7/12) (5/11)
5/11
7/11
V2 (5/12) (7/11)
5/12
B1
4/11
(5/12) (4/11)
B2
Probabilidades Probabilidades
Condicionais Conjuntas
63
3.10 Teorema de Bayes
Espao Amostral
A1 A2
B
A1 e B A2 e B
P ( A1 ) P ( B / A1 )
P ( A1 / B ) =
P ( A1 ) P ( B / A1 ) + P ( A2 ) P ( B / A2 )
Nota: Este teorema pode ser estendido para diversas parties do espao amostral ( A1,
A2, A3, etc.)
64
Exemplo 9:
0, 55 0, 03
P( A / S ) = = 0, 4783
0,55 0, 03 + 0, 45 0, 04
Uma moeda mostra cara 50% do tempo, em mdia. Depois de muitos lances, o nmero de
caras aproximadamente igual ao nmero de coroas.
Um conceito de Probabilidade
nmero de caras
No limite quando o nmero de lances -> infinito 0,5
nmero de lanamenos
Dizemos que a probabilidade de aparecer uma cara em qualquer lance 1/2. Isto ilustra o
conceito de probabilidade que ser usada neste curso.
65
os alemes invadiram a Dinamarca. Kerrich passou o resto da guerra internado em um
acampamento em Jutland e para passar o tempo ele levou a cabo uma srie de
experimentos em teoria da probabilidade. Em um destes experimentos, lanou uma
moeda 10.000 vezes. Seus resultados so mostrados no grfico seguinte.
10
% de
0
caras
50 %
-5
-10
10 100 100 1000
0 0
Nmero de lanamentos
Lance uma moeda duas vezes e registre para cada lance se o resultado era uma cara (C)
ou uma coroa (K). Exerccio: Liste os possveis resultados.
Seja A o evento deu uma ou mais caras. Quais resultados pertencem ao evento A? (CK,
KC, CC).
Seja B o evento no aparece nenhuma cara. (KK)
66
Neste exemplo, os eventos A e B so ditos disjuntos ou mutuamente exclusivos, pois eles
no tm nenhum resultado em comum. Eles tambm so exaustivos, j que eles cobrem
todos os possveis resultados do experimento.
Exerccio: Defina um evento C que no disjunto em relao a A.
DEFINIES
67
nmero de resultados correspondendo a A
P ( A) =
nmero total de resultados no espao amostral
= 0.13
68
Alternativamente, considere partes mutuamente exclusivas
P(A
somente) P(B somente)
P(A e B) = 0,05 0,02
= 0,1 0,02 = 0,02
= 0,08 = 0,03
69
= P(X ou Y)
Modelo de rvore para meninos (B) e meninas (G) em uma famlia de tamanho 3.
(ver figura a seguir)
70
Figura 1
71
P(B) = 0.52 P(G) = 0.48
72
GGG GGG GGG GGG
GGB GGB GGB GGB
GBG GGB GGB GGB
GBB GBB GBB GBB
BGG BGG BGG BGG
BGB BGB BGB BGB
BBG BBG BBG BBG
73
Anexo 3 - Probabilidade Condicional
A probabilidade de um evento A pode ter que ser recalculada se ns sabemos com certeza
que outro evento B j aconteceu e A e B no so independentes.
Em uma famlia de 3 crianas suponha se sabe que h menos que 2 meninos. Qual a
probabilidade que todas as 3 crianas so do mesmo sexo?
Usando a anotao prvia
C: todas as crianas do mesmo sexo
D: menos que 2 meninos.
Ns queremos a probabilidade de C dado que D aconteceu. Usaremos notao P(C|D)
descrever isto.
74
P(C ou D) 0,11
P(C / D ) = = = 0,23
P ( D) 0,47
Em geral para eventos X e Y a probabilidade condicional de X dado que Y aconteceu
P( X e Y)
P( X / Y ) =
P(Y)
P(X|Y) = P(X e Y)/P(Y) Isto pode ser rearranjado como:
P(X e Y) = P(X|Y)P(Y)
M F
E 0.52 0.41 0.93
U 0.05 0.02 0.07
0.57 0.43 1.00
Ache
Respostas:
75
P( E e M) 0,52
P( E / M ) = = = 0,91
P(M) 0,57
= P(E|M)P(M) + P(E|F)P(F)
P ( M e E)
P( M / E ) =
P( E )
P( E / M ) P( M )
=
P( E / M ) P( M ) + P( E / F ) P( F )
0,52
= = 0,56
0,93
Independncia Revisitada
76
Anexo 4 Revisando os conceitos
Vimos at o momento alguns conceitos referentes Teoria das Probabilidades. Vamos
recordar alguns deles.
77
numero de eventos favoraveis a E 9 1
Prob(E)= = = =0,25=25%
numero de eventos possiveis e equiprovaveis 36 4
78
se desejarmos calcular a probabilidade de sair um nmero par em um lanamento de um
dado, lanamos este dado um numero bastante grande de vezes e contamos quantas vezes
saiu resultado par. medida que o numero de repeties do experimento vai se tornando
maior o resultado da diviso entre o numero de resultados favorveis ao evento (o dado
saiu par) e o numero de lanamentos (numero repeties do experimento) vai se
aproximando da probabilidade terica . Podemos enunciar esta definio de forma
rigorosa atravs da seguinte relao:
f (E)
Pr ob( E ) = lim = lim f R ( E )
n n n
79
0,18. Isto no quer dizer que na tendncia no estejamos nos aproximando do verdadeiro
valor. Tal situao muito difcil de ocorrer.
1) 0 P ( E ) 1
2) P(S)=1
3) P( ) = 0
4) P( A) = 1 P( A )
1) P( A B) = P( A) + P( B ) P ( A B )
P( A B C ) = P ( A) + P ( B) + P(C ) P( A B ) P ( A C ) P( B C )
+ P( A B C )
2) P( A B ) = P ( A) P ( B A) = P ( B ) P ( A B)
exemplo, queremos calcular a probabilidade de que um aluno tire nota maior do que 7 se
ele estudar. O evento A neste caso A = {o aluno tira nota maior do que 7} e o evento B
B={o aluno estuda}. Temos neste exemplo um tpico caso de eventos dependentes, pois
certamente a ocorrncia de A ira depender da ocorrncia de B. A probabilidade do evento
A depende da ocorrncia (ou no ocorrncia) do evento B. De forma corriqueira, a
probabilidade do evento A (o aluno tirar nota maior do que 7) ter um valor caso ocorra o
evento B (o aluno estuda) e ter outro valor caso no ocorra B (o aluno no estuda). Se os
dois eventos A e B so independentes a probabilidade do evento A no depende da
ocorrncia do evento B, e vice versa, a probabilidade do evento B no depende da
80
ocorrncia do evento A. No conhecido exemplo do efeito borboleta suponhamos que
uma borboleta bata asas no corao do Estado de Minas Gerais e ocorra um terremoto em
Tquio. Certamente estes dois eventos so independentes e sua ocorrncia depende
unicamente da vontade divina.
Se quisermos calcular a probabilidade da ocorrncia simultnea de dois eventos
independentes basta multiplicar as probabilidades dos dois eventos individuais. Por
exemplo, suponhamos que um avio tem 4 motores e desejamos calcular a probabilidade
de que ocorra uma falha simultnea em todos os motores. Se supusermos que a ocorrncia
de falhas nos quatro motores so eventos independentes, podemos dizer que a ocorrncia
de falha simultnea nos 4 ser igual ao produto de suas probabilidades individuais (que
neste caso iremos supor que so todas as mesmas). Se a probabilidade de qualquer um
dos 4 motores falhar igual a 0,001, a probabilidade dos quatro motores falharem
simultaneamente ser 0,0014 = (10-3)4 = 10-12.
A suposio de independncia entre dois eventos uma hiptese bastante forte. Muitas
vezes podemos estar lidando com uma quase independncia, mas que no na pratica
independncia. No exemplo anterior, bastaria que a mesma equipe de mecnicos
realizasse a manuteno dos 4 motores para que no houvesse uma independncia perfeita
entre os 4 eventos.
Vimos anteriormente que pode ocorrer que dois eventos A e B no tenham interseco,
ou seja, A B = . Neste caso, dizemos que os dois eventos A e B so eventos
mutuamente exclusivos ou eventos disjuntos. Uma confuso freqente em teoria das
probabilidades assumir que dois eventos mutuamente exclusivos so necessariamente
independentes. Independncia de dois eventos no implica necessariamente a condio de
serem mutuamente exclusivos. E vice-versa, a condio de dois eventos serem
mutuamente exclusivos no implica necessariamente os mesmos eventos serem
independentes. Se dois eventos A e B so mutuamente exclusivos ento podemos dizer
que P( A B) = P() = 0 . Mas no podemos dizer que P( A B) = P( A) P ( B ) .
Seria assim se pelo menos uma das probabilidades dos dois eventos fossem nulas, ou seja,
81
P(A)=P(B)=0. Certamente existe um nico caso em que os dois eventos A e B so iguais
ao conjunto vazio e assim P( A B) = P( A) P ( B ) .
Podemos dizer tambm que existem muitos casos de eventos independentes para os quais
A B , ou seja, estes eventos tm uma interseco no vazia. O exemplo da
borboleta e do terremoto um caso tpico. Os dois eventos podem ocorrer
simultaneamente e tambm so independentes. Mas tambm podemos dizer que existem
eventos mutuamente exclusivos e que so tambm independentes. Neste caso a
probabilidade da ocorrncia simultnea dos dois eventos ser nula, pois sua interseco
o conjunto vazio. E se so tambm independentes necessariamente
P( A B) = P( A) P ( B ) e para que isto ocorra pelo menos um dos dois eventos (ou
ambos) tem probabilidade nula.
De fato, a nica maneira que dois eventos podem ser ambos mutuamente exclusivos e
independentes se no mnimo um deles tem probabilidade igual zero. Se A e B so
mutuamente exclusivos, sabendo-se que B ocorreu podemos dizer que A no ocorreu. Isto
bastante claro: a probabilidade condicional de A dado B zero! Isto muda a
probabilidade (condicional) de A a no ser que sua probabilidade (no condicional) seja
zero. Podemos concluir esta distino entre eventos mutuamente exclusivos e eventos
independentes com duas afirmativas:
82
Um ultimo ponto sobre a interpretao de uma probabilidade condicional. Quando
P( A B ) 2 /10
Pela regra do produto P( A B ) = = = 1/ 2
P( B ) 4 /10
P( A B ) = P( A).P ( B)
83
Podemos generalizar isto dizendo que se k eventos Ai , i =1,2,..k so todos independentes
entre si, ento:
S = {F C , F C , F C , F C }
84
onde os eventos relevantes do problema so:
P(C ) = 0,4
P(F/C)=0,6
P(F/C)=0,4
P(C / F ) = ?
C C
Podemos ver que a figura oval corresponde ao evento F e a parte desta figura que est a
85
distino entre dois eventos diferentes: F C e F / C . No primeiro caso temos o
evento que corresponde a ocorrncia simultnea dos eventos F e C. No segundo caso
temos um evento a ocorrncia do evento F condicionado a ocorrncia do evento C.
Podemos perguntar qual a probabilidade de que o Fluminense ganhe em um dia de
chuva. Neste caso queremos saber P( F C ) . Outra coisa perguntarmos qual a
probabilidade de que o Fluminense ganhe caso ocorra um dia de chuva. Neste caso,
estamos perguntado o valor de P( F / C ) . A diferena bastante sutil, mas ela mostra a
em que o Fluminense joga com chuva, em 60 destas partidas chuvosas ele ganha. O que
significa a expresso P(F/C)=0,4 . Significa que em 100 partidas que o Fluminense joga
P( F C ) = P (C ).P ( F / C ) = 0, 4 0,6 = 0, 24
O que significa esta ultima expresso? Significa que em cada cem partidas que o
Fluminense joga (incluindo-se nestas 100 partidas dias chuvosos e no chuvosos) em
aproximadamente 24 partidas o Fluminense ganha em dias chuvosos. Repare que esta
probabilidade bem distinta de P(F/C)=0,6 , pois aqui estamos afirmando que em cada
100 partidas que o Flu joga em dias chuvosos (estamos condicionando a este tipo de dia)
em aproximadamente 60 destas partidas o time ganha.
86
Continuemos a soluo do problema. Reparem que a metade esquerda do ovo mais a
metade direita formam o evento F (o Flu ganha o jogo). Isto pode ser dito assim:
F = (F C) (F C )
Esta expresso diz que o evento {o Flu ganha} formado pela unio de dois eventos: o
Flu ganha em dia com chuva e o Flu ganha em dia sem chuva. Observem pelo Diagrama
de Venn que estes dois eventos so disjuntos, ou seja, eles tem interseco igual ao
conjunto vazio. Isto ocorre porque ou o Flu ganha em um dia chuvoso ou ele ganha em
um dia no chuvoso e no existe meio-termo. Se dois eventos so iguais as suas
probabilidades tambm sero iguais. Ento podemos dizer que:
P( F ) = P (( F C ) ( F C ))
Sabemos que a probabilidade do conjunto unio de dois eventos disjuntos a soma das
probabilidades de cada um dos eventos unidos. Ento:
P( F ) = P ( F C ) + P ( F C )
Vamos aplicar o teorema do produto aos dois termos do lado direito da expresso acima.
P( F ) = P (C ).P ( F / C ) + P (C ).P ( F / C )
P( F ) = 0, 4 0,6 + 0,6 0, 4 = 0, 48
Ento temos aqui que de cada 100 partidas (no importando se chove ou no, pois neste
caso estamos lidando com uma probabilidade no condicional) em aproximadamente 48 o
Flu ganha.
87
Agora, estamos em condio de dar uma resposta a pergunta do problema. Pelo teorema
do produto, sabemos que:
P ( F C ) = P ( F ) P (C / F )
Portanto, manipulando os termos desta equao, temos que:
P ( F C ) 0,24
P (C / F ) = = = 0,50
P( F ) 0,48
que a resposta do problema. Um dos segredos para um bom entendimento da Teoria das
Probabilidades no nos contentarmos simplesmente com a soluo de um problema,
mas continuarmos a esmiuar o seu resultado tentando melhor compreende-lo e
interpretar o que conseguimos alcanar. Descobrimos que P(C / F ) = 0,50 o que
significa que de cada 100 partidas e que o Flu ganha o jogo, em aproximadamente 50
destas partidas chove. Isto bem diferente de dizer que P( F / C ) = 0,6 , pois aqui
88
chuva. A outra parcela corresponde aos dias no chuvosos em que o Flu ganha o jogo.
Desta forma podemos compreender que estes dois eventos so complementares, ou seja,
C = (F C ) (F C )
Em linguagem corriqueira, a expresso acima diz que as partidas que o Flu joga em dias
no chuvosos so constitudas por dois grupos: o grupo das partidas em dias no
chuvosos em que ele ganha e o grupo das partidas em dias no chuvosos em que ele
perde. Fazendo o mesmo procedimento j utilizado de tomar probabilidades de ambos os
termos da equao, temos:
P(C ) = P (( F C ) ( F C ))
P (C ) = P ( F C ) + P ( F C )
Aplicando agora a regra do produto aos dois termos do membro direito da equao acima,
temos:
89
P(C ) = P ( F ).P (C / F ) + P ( F C )
P (C F ) 0,36
P (C / F ) = = = 0,6923
P( F ) 0,52
Ento temos a seguinte contabilidade final para o problema. De cada 1000 partidas em
que o Flu joga, em 400 chove e em 600 no chove, pois P (C ) = 0,4 . Em 480 o Flu
ganha e em 520 ele perde, pois P ( F ) = 0, 48 . Das 400 partidas chuvosas, em 400x0,6 =
240 partidas o Flu ganha, pois P ( F / C ) = 0,6 e das 600 partidas no chuvosas, em
600x0,4=240 partidas ele ganha pois P ( F / C ) = 0,6 . Das 480 partidas em que o Flu
F F
C 240 160 400
90
que P(F/C), um dado do problema. Podemos ver tambm que P (C F ) = 0,36 pois o
360 com o total da coluna F que 520 o que d 0,6923. Finalmente as probabilidades
no condicionais so obtidas atravs da diviso entre os totais das linhas ou colunas pelo
total geral (1000). Por exemplo, se quisermos calcular a probabilidade de no chover
S={ V A , V A , A }
Onde:
V = {o estudante acerta a questo}
A = {o estudante tenta adivinhar a questo}
91
Observem que quando ocorre o evento A , ou seja, o estudante sabe com segurana a
resposta certa da pergunta no existe nenhuma possibilidade dele errar. Isto quer dizer
A V
A V
respostas do exame, ento P ( A) = 0,30 . E se existe certeza absoluta quando ele sabe a
Tentando resolver este problema de forma intuitiva, isto , sem apelar para nossos
conhecimentos de Teoria das Probabilidades (sem aplicar as regras, teoremas e princpios
discutidos em sala de aula) podemos perceber que de 100 questes do exame, supondo-se
que seja um super-exame, 70 questes o aluno tenta adivinhar e 30 questes ele sabe. Das
70 questes que ele tenta adivinhar 1/3 que 23,33 ele acerta e 70 23.33 = 46.67 ele
92
erra. Portanto, no total ele acerta 30 + 23.33 = 53.33 questes e erra 46.67 questes. Se eu
quero saber quanto P ( A / V ) basta saber quantas respostas adivinhadas corresponde
em percentagem do total que ele acerta. Do total que ele acerta (53.33) em 23.33 ele
23.33
tentou (com final feliz) adivinhar. Portanto, P ( A / V ) = = 0,4375 = 43,75% .
53.33
Mas o professor de estatstica um esprito de porco engarrafado e no dar o gostinho
ao aluno para que ele exercite a sua poderosa intuio e vai exigir que ele resolva
formalmente o problema.
P( A V )
Sabemos pelo teorema do produto que P ( A / V ) = . Sabemos tambm, ao
P (V )
observar o diagrama de Venn acima que V = ( A V ) A . E que portanto,
P(V ) = P( A V ) + P ( A)
P( A V ) 0,70 1/ 3
Portanto P ( A / V ) = = = 0, 4375
P(V ) 0,5333
93
exerccio anterior em que fosse mais fcil, visualizar as diversas probabilidades de
eventos conjuntos, de eventos condicionais e eventos no condicionais? Deixo ao aluno
criativo e amante da Estatstica a resposta a estas questes que discutiremos em sala de
aula. Talvez esta cincia no tenha a forma concreta de um objeto comum de amor, mas
dada a sua coerncia e lgica ela atrai muito aqueles que sempre procuram verdade.
Scrates, Plato e muitos outros pensadores que no tiveram a oportunidade de virem
tudo isto, talvez hoje estejam no seu Hades observando com imenso prazer as nossas
belas tentativas.
94
D2
D1
D3
B1 B2
B3 D4
E2
E3 B4
E4
D2
D3
E1
B2 B3
D4
E3
B4
E4
E2 D3
D4
B3
B4
E3
E4
Com exceo das seqncias B1E2E3E4, E1B2E3E4, E1E2B3E4, E1E2E3B4 e E1E2E3E4, todas
as demais derrubam o avio. Portanto, utilizando o evento complementar e considerando
os resultados de cada tiro independentes, temos:
P(derrubar) = 1
(1/4x1/2x1/2x1/2+1/2x1/4x1/2x1/2+1/2x1/2x1/4x1/2+1/2x1/2x1/2x1/4+1/2x1/2x1/2x1/2
) = .....
95
Resumo do Clculo de Probabilidades
96
Exerccios de Probabilidade
6) Para a Copa do Mundo 24 pases so divididos em seis grupos, com 4 pases cada um.
Supondo que a escolha do grupo de cada pas feita ao acaso, calcular a
probabilidade de que dois pases determinados A e B se encontrem no mesmo grupo. (
Na realidade a escolha no feita de forma completamente aleatria).
8) Seis bolas so colocadas em trs urnas diferentes. Qual a probabilidade de que todas
as urnas estejam ocupadas?
10) Um torneio disputado por 4 times A,B, C e D. 3 vezes mais provvel que A vena
do que B, duas vezes mais provvel que B vena do que C e 3 vezes mais provvel
que C vena do que D. Quais as probabilidades de ganhar para cada um dos times?
11) Uma caixa contem 20 peas em boas condies e 15 em ms condies. Uma amostra
de 10 peas extrada. Calcular a probabilidade de que ao menos uma pea na
amostra seja defeituosa.
12) Uma cidade tem 30 000 habitantes e trs jornais A, B e C. Uma pesquisa de opinio
revela que:
12 000 lem A;
8 000 lem B;
7 000 lem A e B;
6 000 lem C;
4 500 lem A e C;
97
1 000 lem B e C;
500 lem A,B e C.
15) Dez pessoas so separadas em dois grupos de 5 pessoas cada um. Qual a
probabilidade de que duas pessoas determinadas A e B faam parte do mesmo grupo?
18) Uma moeda foi cunhada de tal forma que 4 vezes mais provvel de dar cara do que
coroa. Calcular as probabilidades de cara e coroa.
98
1 1 1
P ( A) = , P(B) = e P(A B) =
2 4 5
Calcular :
a) P ( A B )
b) P(A)
c) P( B)
d) P(A B)
e) P(A B)
f) P(A B)
g) P(A B)
22) No jogo da Sena so sorteadas 6 dezenas distintas entre as dezenas 01 02 - ...- 50. O
apostador escolhe 6 dessas 50 dezenas e premiado se so sorteadas 4 (quadra), 5
(quina), 6 (Sena Principal) das dezenas por ele escolhidas ou se as dezenas sorteadas
so escolhidas aumentadas (Sena Anterior) ou diminudas (Sena Posterior) de uma
unidade (50 +1 = 01, 01 1 = 50). Determine a probabilidade de uma apostador fazer:
a) uma quadra
b) uma quina
c) a Sena Principal
d) A Sena Anterior ou a Posterior.
a) um terno
b) uma quadra
c) a quina
a) com 10 pontos, se acerta os resultados dos 10 primeiros jogos e erra os dos 3 ltimos;
b) com 11 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas um dos
resultados dos 3 ltimos;
c) com 12 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas 2 dos
resultados dos 3 ltimos;
99
d) com 13 pontos, se acerta os resultados dos 13 jogos.
a) com 10 pontos;
b) com 11 pontos;
c) com 12 pontos;
d) com 13 pontos.
29) Tem-se n urnas. Bolas so colocadas ao acaso nas urnas, uma de cada vez, at que
alguma urna receba duas bolas. Qual a probabilidade de colocarmos exatamente p
bolas nas urnas?
30) Joo e Pedro lanam, cada um, um dado no-tendencioso. Qual a probabilidade do
resultado de Joo ser maior ou igual ao resultado de Pedro?
32) Sabe-se que 80 % dos pnaltis marcados a favor do Brasil so cobrados por jogadores
do Flamengo. A probabilidade de um pnalti ser convertido 40 % se o cobrador for
do Flamengo e de 70 % em caso contrrio. Um pnalti a favor do Brasil acabou de ser
marcado:
100
b) Qual a probabilidade do pnalti ser convertido?
33) Marina quer enviar uma carta a Vernica. A probabilidade de que Marina escreva a
carta de 8/10. A probabilidade de que o correio no perca de 9/10. A probabilidade
de que o carteiro entregue de 9/10. Dado que Vernica no recebeu a carta, qual a
probabilidade condicional de que Marina no a tenha escrito?
35) Num exame h 3 respostas para cada pergunta e apenas uma delas certa. Portanto,
para cada pergunta, um aluno tem probabilidade de 1/3 de escolher a resposta certa se
ele est adivinhando e 1 se sabe a resposta. Um estudante sabe 30 % das respostas do
exame. Se ele deu a resposta correta para uma das perguntas, qual a probabilidade
de que a adivinhou?
2
3
A 1 4 5 B
101
39) Uma moeda jogada 6 vezes. Sabendo-se que no primeiro lanamento deu coroa,
calcular a probabilidade condicional de que o nmero de caras nos 6 lanamentos
supere o nmero de coroas.
40) Uma moeda jogada 4 vezes. Sabendo que o primeiro resultado foi cara, calcular a
probabilidade condicional de obter pelo menos 2 caras.
42) Duas mquinas A e B produzem 3000 peas em um dia. A mquina A produz 1000
peas, das quais 3 % so defeituosas. A mquina B produz as restantes 2000, das
quais 1 % so defeituosas. Da produo total em um dia uma pea escolhida ao
acaso e, examinando-a, constata-se que defeituosa. Qual a probabilidade de que a
pea tenha sido produzida pela mquina A?
43) Um estudante resolve um teste do tipo verdadeiro-falso. Ele sabe dar a soluo
correta para 40 % das questes. Quando ele responde uma questo cuja soluo
conhece, d a resposta correta, e nos outros casos decide na cara ou coroa. Se uma
questo foi respondida corretamente, qual a probabilidade que ele sabia a resposta?
P ( A) = 1 / 4 e P(A B) = 1/3
Calcule P(B)
102
C = a soma dos resultados par.
A e B so independentes? e A e C? e B e C? e A, B e C?
48) Uma pessoa com um molho de n chaves tenta abrir uma porta. Apenas uma das
chaves consegue abrir a porta. Qual a probabilidade dela s conseguir abrir a porta
na k-sima tentativa:
a) supondo que aps cada tentativa mal sucedida ela descarta a chave usada;
b) supondo que ela no faz isso.
51) Sacam-se, sucessivamente e sem reposio, duas cartas de um baralho comum (52
cartas). Calcule a probabilidade de a 1 carta ser uma dama e a 2 ser de copas.
53) A lana uma moeda n+ 1 vezes e B lana a mesma moeda n vezes. Qual a
probabilidade de A obter mais caras que B?
54) Quantas pessoas voc deve entrevistar para ter probabilidade igual ou superior a 0,5
de encontrar pelo menos uma que aniversarie hoje?
55) Uma urna contm 3 bolas vermelhas e 7 bolas brancas. A e B sacam alternadamente,
sem reposio, bolas dessa urna at que uma bola vermelha seja retirada. A saca a
primeira bola. Qual a probabilidade de A sacar a bola vermelha?
56) Em uma cidade com n+ 1 habitantes, uma pessoa conta um boato para outra pessoa, a
qual por sua vez conta para uma terceira pessoa, etc. Calcule a probabilidade do boato
ser contado m vezes:
103
57) Sacam-se, com reposio, n (n > 1) bolas de uma urna que contem 9 bolas
numeradas de 1 a 9. Qual a probabilidade do produto dos nmeros das n bolas
extradas ser divisvel por 10?
58) Quantas vezes, no mnimo, se deve lanar um dado no tendencioso para que a
probabilidade de obter algum 6 seja superior a 0,9?
59) Um jri de 3 pessoas tem dois jurados que decidem corretamente (cada um) com
probabilidade p e um terceiro jurado que decide por cara ou coroa. As decises so
tomadas por maioria. Outro jri tem probabilidade p de tomar uma deciso correta.
Qual dos jris tem maior probabilidade de acerto?
a) se o lago possui k peixes, qual era a probabilidade de, capturando 20 peixes, encontrar
dois peixes marcados?
b) para que valor de k essa probabilidade mxima?
Pede-se ao entrevistado que jogue uma moeda, longe das vistas do entrevistador, e que se
o resultado for cara, responda primeira pergunta e, se for coroa, responda segunda
pergunta.
104
63) Uma firma fabrica chips de computador. Em um lote de 1000 chips, uma
amostra de 10 chips revelou 1 chip defeituoso. Supondo que no lote houvesse k
chips defeituosos:
66) Joga-se uma moeda no viciada. Qual a probabilidade de serem obtidas 5 caras
antes de 3 coroas?
69) Dois adversrios A e B disputam uma srie de partidas. O primeiro que obtiver 12
vitrias ganha a srie. No momento o resultado 6 x 4 a favor de A. Qual a
probabilidade de A ganhar a srie sabendo que em cada partida as probabilidades de
A e B vencerem so respectivamente 0,4 e 0,6?
69) Suponha que uma caracterstica (como a cor dos olhos, por exemplo) dependa de um
par de genes. Representemos por A um gen dominante e por a um gen recessivo.
Assim um indivduo com genes AA dominante puro, um com genes aa um
recessivo puro e um com genes Aa um hbrido. Dominantes puros e hbridos so
semelhantes em relao caracterstica. Filhos recebem um gen do pai e um da me.
Suponha que pai e me sejam hbridos e tenham 4 filhos.
a) Qual a probabilidade do primeiro filho ser um recessivo puro?
b) Qual a probabilidade de exatamente um dos 4 filhos ser um recessivo puro?
105
70) (O problema das caixas de fsforos de Banach18) Um matemtico sai de casa todos os
dias com duas caixas de fsforos, cada uma com n palitos. Toda vez que ele que
acender um cigarro, ele pega (ao acaso) uma das caixas e retira da um palito. O
matemtico meio distrado, de modo que quando ele retira o ltimo palito de uma
caixa, ele no percebe que a caixa est vazia. Como ele fuma muito, em certa hora
ele pega uma caixa e constata que ela est vazia. Qual a probabilidade de nesse
momento a outra caixa conter exatamente k ( 0 k n ) palitos?
72) Uma moeda tem probabilidade 0,4 de dar cara. Lanando-a 12 vezes qual o mais
provvel valor do nmero de caras obtidas?
73) Suponha que uma varivel aleatria T tem a seguinte distribuio de probabilidade
T 0 1 2
P(T=t) 0,5 0,3 0,2
74) Suponha que voc escolha uma bola de uma urna contendo 7 bolas vermelhas, 6 bolas
brancas , 5 bolas azuis e 4 bolas brancas. Qual a probabilidade de que voc escolha
uma bola vermelha?
75) Suponha que voc escolha uma bola aleatoriamente de uma urna 7 bolas vermelhas, 6
bolas brancas, 5 bolas azuis e 4 bolas amarelas. Qual a probabilidade de que voc
escolha uma bola branca?
106
79) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a
probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado
que cada bola recolocada na urna depois de escolhida.
80) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a
probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado
que cada bola no recolocada na urna depois que ela escolhida.
82) Voc tem 6 bolas, cada uma de cor diferente. De quantas maneiras distintas voc
pode dispo-las em uma fila?
84) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos
0,1,2,..,9 se repeties so permitidas?
85) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos
0,1,2,..,9 se repeties no so permitidas?
86) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de
Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los
se todos os livros de cada assunto precisam ficar juntos?
87) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de
Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los
se somente os livros de Cincias precisam ficar juntos?
92) De quantas maneiras diferentes saladas de frutas podem ser feitas de ma, laranja,
tangerina e banana?
107
93) A partir de 6 consoantes e 4 vogais, quantas combinaes distintas de letras podem
ser feitas?
10;
200;
(a) independentes
96) Suponha que certa caracterstica oftalmolgica associada com a cor dos olhos. 300
indivduos selecionados aleatoriamente so estudados e apresentam os seguintes
resultados:
Sim 70 30 20 120
No 20 110 50 180
108
B. O que voc espera que seja o valor de P(Ter a caracterstica e olhos azuis) se a
cor dos olhos e a existncia da caracterstica so independentes ?
97) Uma amostra de 1000 pessoas diagnosticada com certa doena distribuda de acordo
com a altura e o status (evoluo) da doena a partir de um exame clnico de acordo
com a seguinte tabela:
Mdia 74 51 90 35 250
b. 300/500 e. 800/1000
c. 300/1000
98) De cerca de 25 artigos, nove so defeituosos, seis tem defeitos superficiais e trs tem
defeitos importantes. Determine a probabilidade de que um artigo selecionado
aleatoriamente tenha defeitos importantes dado que ele tem defeito.
a. 1/3
b. 0,25
109
c. 0,24
d. 0,08
Doena Totais
Exposio Presente Ausente
(c) 2/5
102) Uma amostra de 2000 indivduos distribuda de acordo com a cor de olho
e a presena ou ausncia de uma certa caracterstica oftalmolgica como segue:
110
Caracterstica Cor dos olhos
Castanho Azul Outro
Sim 400 270 130 800
No 200 650 350 1200
Total 600 920 480 2000
a. 1/2
b. 1/3
c. 4/15
d. 2/15
e. nenhuma das anteriores.
104) Entre vinte e cinco artigos, nove so defeituosos, seis tem somente um defeito no
importante e trs tm um defeito importante. Determine a probabilidade de que
111
um artigo selecionado ao acaso tenha defeitos importantes dado que ele tenha
defeitos.
a. 1/3
b. 0,25
c. 0,24
d. 0,08
Sexo
Idade | Homem | Mulher
-----------------------------------------------
30 ou menos | 800 | 600
31 ou mais | 400 | 200
-----------------------------------------------
106) Existem duas urnas marcadas com H e T. A urna H contem 2 bolas vermelhas e 1
bola azul. A urna T contem 1 bola vermelha e 2 azuis. Uma moeda jogada ao
acaso. Se sai cara escolhida uma bola da urna H. Se sai coroa, uma bola
escolhida da urna T. Ache as seguintes probabilidades.
112
a. P(cara e vermelha) b. P(coroa) c. P(vermelha)
d. P(azul) e. P(cara|vermelha)
107) O nmero de paradas de mquinas em uma grande fbrica durante uma semana tem
a seguinte distribuio de probabilidade:
B 5 10 15 20 25
P(B = b) 0,25 0,30 0,25 0,15 0,05
109) Um vendedor de carros oferece a todos os seus clientes potenciais uma corrida de 30
milhas no tipo de carro que o cliente est interessado em comprar, mais um almoo
ou jantar gratuitos. Todos estes custos so cerca de US$ 50. Se o cliente no
compra o carro, o vendedor perde US$ 50, mas se o cliente comprar o carro, o lucro
mdio do vendedor de cerca de US$ 500 (dos quais os custos da corrida e da
refeio devem ser deduzidos). No passado, 20 % dos clientes compraram o carro
depois da corrida e da refeio gratuita. Qual o lucro esperado para o vendedor
nessa situao?
110) Um processo de produo paralisado para ajuste toda vez que uma amostra
aleatria de cinco itens, selecionada com reposio, apresenta dois ou mais
defeituosos. Ache a probabilidade de que o processo ser paralisado aps uma
inspeo se ele est produzindo:
a) 20 % de defeituosos
b) 10 % de defeituosos
c) 5 % de defeituosos
113
112) De acordo com um cientista poltico, a populao votante de certa cidade consiste de
46 % do candidato A, 40 % do candidato B, 11 % do candidato C e 3 % do
candidato D. Em uma amostra aleatria de 5 votantes, qual a probabilidade de que
a amostra contenha:
Objetivos do Captulo:
114
Assim, os possveis valores de X (nmero de caras) sero:
X = 0, 1, 2, 3.
TTT 0
TTH 1
THT 1
THH 2
HTT 1
HTH 2
HHT 2
HHH 3
115
O resultado 3 caras ocorre somente uma vez
Nmero de Probabilidade
Caras
0 1/8 = 0,125
1 3/8 = 0,375
2 3/8 = 0,375
3 1/8 = 0,125
116
Total 8/8 = 1
probabilidade
3/8
1/8
0 1 2 3
Nmero de
caras
Definio: Uma varivel aleatria discreta uma varivel que pode assumir somente
certos valores claramente separados (em descontinuidade) resultantes, por exemplo,
de uma contagem de algum item de interesse.
117
Exemplo: Seja X o nmero de caras quando uma moeda jogada 3 vezes. Aqui os
valores de X so 0,1,2 ou 3 (so claramente separados, em descontinuidade).
Nota: uma varivel aleatria discreta no precisa necessariamente assumir apenas valores
inteiros. Poderia, por exemplo, ser uma varivel que apresentasse os seguintes valores: 0,
23/7 , 72/25, etc. A condio que deve ser cumprida seus valores sejam descontnuos.
Definio: Uma varivel aleatria contnua uma varivel que pode assumir um
nmero infinitamente grande de valores (com certas limitaes prticas).
= E ( X ) = [ X .P ( X )]
onde (letra grega, mi) representa a mdia (ou valor esperado) e P(X) a probabilidade
118
4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta
2 = [(X )2 P( X )]
O desvio padro :
= 2
Exemplo 2
Uma empresa especializa-se no aluguel de carros para famlias que necessitam de um
carro adicional para um perodo curto de tempo. O presidente da empresa tem estudado
seus registros para as ltimas 20 semanas e apresentou os seguintes nmeros de carros
alugados por semana.
119
Converta o nmero de carros alugados por semana em uma distribuio de
probabilidade.
Total 1,00
A mdia
A varincia
2 = [( X ) 2 .P ( X )] =
(10 11,3) 2 0,25 + (11 11,3) 2 0,30 + ... + (13 11,3) 2 0,10 = 0,91
Clculo de E(X):
120
Nmero de Carros Probabilidade, P(X) XP(X)
alugados
10 0,25 2,5
11 0,30 3,3
12 0,35 4,2
13 0,10 1,3
Total 1,00 E(X) = 11,3
Clculo de
2
Nmero de Prob. (X ) ( X )2 ( X ) 2 P( X )
Carros P(X)
Alugados
10 0,25 10-11,3 1,69 0,4225
11 0,30 11-11,3 0,09 0,0270
12 0,35 12-11,3 0,49 0,1715
13 0,10 13-11,3 2,89 0,2890
Total 2 = 0,9135
= 0,9135 = 0,9558
121
A probabilidade de sucesso permanece constante para cada tentativa
(consequentemente, a probabilidade de falha tambm permanece constante).
As tentativas so independentes, significando que o resultado de uma tentativa no
afeta o resultado de qualquer outra tentativa.
n!
P( X = r ) = p q r nr
r!(n r )!
onde n! lido como n fatorial. Por exemplo, 4! = (4).(3).(2).(1)=24.
0! igual a 1, por definio e 1! = 1.
Exemplo 3
122
14!
P( X 1) = 1 P( X = 0) = 1 0,2 0 0,814 0 = 0,956
0!(14 0)!
No mximo dois dos trabalhadores esto desempregados.
Exemplo 4
Uma companhia fabrica rolamentos para serem usados em bicicletas. Sabe-se que 5 %
dos dimetros dos rolamentos estaro fora dos limites de aceitao (defeituosos). Se 6
rolamentos so selecionados ao acaso, qual a probabilidade de que:
Note que as condies de uma distribuio binomial esto satisfeitas neste exemplo:
123
DISTRIBUIO DE PROBABILIDADE BINOMIAL para n = 6 e p = 0,05
124
4.4 A Mdia e Varincia De Uma Distribuio Binomial
= np
2 = np (1 p )
Nota: A demonstrao terica para estes valores ser desenvolvida em sala de aula e
encontra-se na maioria dos livros de Introduo a Estatstica.
Verificar:
125
n = 10, p = 0,6 P(X = 6) = 0,251
Apndice 1 (Recordao)
Esta uma lista dos possveis valores da v.a. e as probabilidades correspondentes (que
tem que somar 1). As probabilidades podem ser escritas:
P ( X = xi ) = p i para i = 1,2,..., k e 0 p i 1
k
p =1
i =1
i
126
Apendice 2 (Recordao)
Uma varivel aleatria discreta uma varivel aleatria que toma valores discretos com
probabilidades especificadas.
Cada tentativa um 'experimento' com exatamente 2 possveis resultados, "sucesso " e "
fracasso " com probabilidades p e 1-p.
Seja X = 1 se sucesso, 0 se fracasso
A Distribuio de probabilidade
127
x 0 1
P(X = x) p 1-p
Apndice 3 (Recordao)
A distribuio Binomial
128
probabilidade do resultado SSFSF, pode ser obtida multiplicando as probabilidades
para cada resultado de tentativa.
por exemplo P(SSFSF) = p.p. (1-p) .p.(1-p) = p3(1-p)2
De fato, a probabilidade de obter trs sucessos e dois fracassos em cinco tentativas p3(1-
p)2 para cada um dos modos diferentes que isto poderia acontecer, isto , SSSFF,
SSFSF,... etc.
O nmero de arranjos "distintos" de 3 sucessos e 2 fracassos pode ser facilmente
n
calculado usando o coeficiente binomial onde n o nmero de tentativas e x o
x
nmero de sucessos requerido.
n
O coeficiente binomial (leia-se como "binomial de x em n") definido como
x
n n!
=
x x!(n x)!
5 5! 5.4.3.2.1
Neste exemplo, = = = 10, portanto
3
3!2! (3.2.1)(2.1)
h 10 maneiras distintas de se obter 3 sucessos em 5 tentativas, com cada arranjo
tendo uma probabilidade p 3 (1 - p) 2
129
n
P ( X = x) = px (1 - p) n - x
x
Assuma que cada jogo uma tentativa Bernoulli com prob(ganhar) = 0,5
Ento X tem distribuio binomial com n=3 e p=0,5, com resultado vitria (W) ou derrota
(L) em cada tentativa.
(Isto abreviado como X ~ B(3;0,5))
Qual a probabilidade de que o time ganhe 2 jogos exatamente?
P(X=2) = P(WWL) + P(WLW) + P(LWW)
= 3/8 (desenhe um diagrama de rvore)
ou usando a frmula para probabilidades binomiais, a prob(WWL) = p2(1-p) e o nmero
3 3!
de distintos arranjos de 2 vitrias em trs jogos = = 3 . Portanto a resposta
2
2!1!
3
P ( X = 2) = (0,5) 2 (1 0,5) 1 usando n = 3, x = 2, p = 0,5
3p2(1-p). Assim 2
3
=
8
130
As distribuies binomiais so usadas para modelar situaes que podem ser pensadas
como tentativas repetidas e " independentes " cada uma com somente 2 possveis
resultados. Ns os usaremos posteriormente para fazer inferncias estatsticas sobre
propores.
Um Sistema de Controle de Qualidade requer que de cada lote de itens uma amostra de
10 selecionada e testada. Se 2 ou mais itens da amostra so defeituosos o lote inteiro
rejeitado.
Se a probabilidade de um item ser defeituoso 0,05
10
(i) P ( X = 2) = (0,05) 2 (0,95) 8 = 0,0746
2
10 10
(ii) P(rejeitar o lote) = P ( X 2) = (0,05) x (0,95) 10 x o que muito
x=2 x
131
Apndice 4 (Recordao) Valor Esperado e Varincia de uma Varivel Aleatria
Anlise de deciso
132
Valor
esperado
Vende agora
125 K $ 125 K
Preos do
petrleo sobem
0,6
Vende $ 300 K
depois
300 x 0,6 +
Deciso Preos do 100 x 0,4 =
petrleo caem $ 220 K
0,4 $ 100 K
Seco
$0 200 K
0,5
Pouco petrleo
Perfura 0,4 -200 x 0,5
+ 200 x 0,4
$400 200 K + 1300 x 0,1
= $ 110 K
0,1
Jorro
$1500-200 K
A melhor deciso segurar durante um ano e ento vender. Este um exemplo de usar
um diagrama de rvore para Anlise de Deciso. Tambm ilustra o conceito do valor
esperado de uma varivel aleatria .
133
Se a distribuio de probabilidade de uma varivel aleatria X
Valores de X x1 x2 ... xk
Probabilidades p1 p2 ... pk
seu valor esperado
E ( X ) = x p + x p + ... + x p = x p
1 1 2 2 K K
i =1
i i
= Receita - $200K
134
Varincia de uma Varivel Aleatria
Recorde que a varincia uma medida de disperso. Para uma amostra de observaes de
uma populao a varincia ao redor da mdia definida como
n
(x x)
2
s =
i
2 i =1
n 1
var( x) = p1 ( x1 ) 2 + p 2 ( x 2 ) 2 + ... + p K ( x K ) 2
ou
K
var( x) = p i ( x i ) 2 = E ( x ) 2
i =1
Ela representa o limite terico da varincia amostral s2 quando o tamanho da amostra (n)
fica muito grande.
135
Ento a distribuio de probabilidade de X
x 0 1 2 3 4 5
P(X=x) 1/32 5/32 10/32 10/32 5/32 1/32
(Confira isto usando a frmula para probabilidades binomiais e desenhe um diagrama de
rvore para analisar a estrutura dos resultados.)
1 5 10 10
E ( X ) = xp( x) = 0 + 1 + 2 + 3
32 32 32 32
5 1 80
+ 4 + 5 = = 2,5 =
32 32 32
1 1
var( X ) = x 2 p ( x) 2 = 0 2 + ... + 5 2 (2,5) 2
32 32
= 7,5 - (2,5) 2
= 1,25
Portanto, = var( X ) = 1,25 = 1,12
onde q = 1 - p
[Confira os valores de E(X) e var(X) calculados acima para X ~ binomial (5;0,5) usando
estas frmulas.]
136
EMPRICO TERICO
(baseado nos dados) (MATEMTICO)
QUANTIDADE QUANTIDADE
fi
(a) Freqncia relativa n
PROB[X = xi] = pi
f quando
xi = i
n n0
fi n
(b) =1 p i
=1
i n i =1
i i n
quando
n 1 ( x i
x ) 2
pi
i =1
ii =1 n
Se Y = aX + b
onde X uma varivel aleatria e a e b so valores constantes conhecidos, ento,
E(Y) = a E(X) + b
var(Y ) = a 2 var( X )
Portanto, Y = a 2 var( X ) = a 2 x2 = a X
137
e
Semelhantemente se T = a X + b Y + c onde X e Y so variveis aleatrias e a, b e c so
constantes conhecidas, ento,
Conseqentemente E(X) = 1000 x 0.1 + 3000 x 0.3 + 5000 x 0.4 + 10000 x 0.2
A companhia lucra $2000 em cada unidade vendida no mercado local e $3500 em cada
unidade exportada.
138
Consequentemente o lucro total
T = 2000 X + 3500 Y
= $11,540,000
T = X - Y.
= E(X) - E(Y)
139
Variveis Aleatrias Independentes
Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas
4 jogadas. Portanto X e Y so independentes. Conhecer o valor de X no ajuda a predizer
o valor de Y e vice-versa.
Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas
5 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X 6) e o
evento {-1 < Y 0} so dependentes (e mutuamente exclusivos).
Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de coroas nas
primeiras 2 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X
6} e o evento {2 < Y 3} so dependentes (e mutuamente exclusivos).
140
dados so alguns exemplos. O segundo e terceiro exemplo acima mostram porque existe a
necessidade das seqncias serem no sobrepostas (ou seja, no tenham interseco).
Apndice 4 (recordao)
141
populao 300 votaro no candidato e 700 no votaro. Na primeira tentativa do
experimento (seleo da primeira pessoa) temos uma probabilidade de sucesso igual a
300 / 1000 = 0,3. Na segunda tentativa, se no for feita a reposio da primeira pessoa na
populao de origem, teremos uma probabilidade de sucesso igual a 299/999 caso tenha
ocorrido sucesso na primeira tentativa e igual a 300/299 caso tenha ocorrido fracasso na
primeira tentativa. Fica mais complicado de ver o que ocorrer na terceira tentativa, pois
o resultado ir depender do que ocorreu na primeira e na segunda tentativas. Neste caso
no teremos tentativas Bernoulli porque a probabilidade de sucesso no se mantm
constante no decorrer das tentativas seqenciais.
Iremos definir um processo Bernoulli da forma como segue. Estritamente falando, um
processo Bernoulli dever ter as seguintes propriedades:
Resultado X
NNN 0
NDN 1
142
NND 1
DNN 1
NDD 2
DND 2
DDN 2
DDD 3
3 1 3 9
P(NDN) = P(N).P(D).P(N) = . . = = 0,14
4 4 4 64
Se no houvesse independncia estatstica entre as tentativas Bernoulli e se tivssemos
um lote de produo de 1000 pecas, teramos o seguinte resultado:
P( NDN ) = P ( N1 ).P ( D2 / N1 ).P ( N 3 / N1 D2 ) =
750 250 749
= 0,14086
1000 999 998
Como pode ser visto, existe uma pequena diferena no valor da probabilidade quando
calculamos considerando como tentativas Bernoulli (tentativas independentes e com
probabilidade de sucesso constante) e quando consideramos que as tentativas no so
independentes (neste ultimo caso no so tentativas Bernoulli).
Vamos agora calcular o valor das probabilidades para cada valor da varivel aleatria X
(numero de sucessos). Para isto construmos a seguinte tabela de distribuio de
probabilidades:
x f(x) = P(X=x)
0 27/64
1 27/64
2 9/64
143
3 1/64
Distribuio binomial
Uma tentativa Bernoulli pode resultar em um sucesso com probabilidade p e com
fracasso com probabilidade q = 1- p. Ento a distribuio de probabilidade de uma
varivel aleatria binomial X, o numero de sucessos em n tentativas independentes,
n
b( x; n, p ) = p x q n x , x = 0,1,2,...,n.
x
Diferentemente de uma varivel aleatria discreta, para uma varivel aleatria contnua
no podemos definir uma funo de distribuio de probabilidade (f.d.p.). No entanto,
podemos definir o que se chama de uma funo densidade de probabilidade para as
variveis aleatrias contnuas. Por exemplo, suponhamos uma distribuio uniforme do
tipo:
144
f(X)
1/10
5 15 X
Observe que f(X) uma funo constante assumindo sempre o valor 1/10 no intervalo
fechado 5 X 10 . Essa funo goza das seguintes propriedades:
Toda funo que satisfizer essas duas propriedades chamaremos de funo densidade de
probabilidade. Essa funo apenas um instrumento matemtico para que possamos
calcular probabilidades para variveis aleatrias contnuas (assim como utilizamos a
funo distribuio de probabilidade para as variveis aleatrias discretas). Por exemplo,
para o exemplo acima, se quisermos calcular a probabilidade da varivel aleatria
contnua X estar contida no intervalo 10 X 12 ser:
12 12
12 10
P (10 X 12) = f ( X )dx = (1 / 10)dx = [ x / 10]1210 = = 2 / 10
10 10 10 10
Dessa forma, podemos calcular a probabilidade para qualquer intervalo sendo esta
probabilidade o valor da integral definida da funo densidade de probabilidade sendo
145
que os limites de integrao so as extremidades do intervalo. De uma forma geral,
podemos dizer que se f(X) a funo densidade de probabilidade de uma varivel
aleatria contnua, ento:
b
P (a X b) = f ( X )dx
a
A mdia (ou valor esperado) de uma varivel aleatria contnua dada pela expresso:
+
E[ X ] = Xf ( X )dx
+
V[X ] = ( X E[ X ])
2
f ( X )dx
5
15
15
X2 X3
5 10 2 X + 10)dx =
(
30
X 2 + 10 X = 8,333
5
146
COVARIANCIA ENTRE DUAS VARIAVEIS ALEATORIAS
Covarincia uma medida de associao (relao) linear entre duas variveis aleatrias.
Se X e Y so duas v.a., a covarincia entre elas definida por:
Cov(X,Y) = E[(X-E(X))(Y-E(Y))]
Desta forma a covarincia entre duas variveis X e Y igual a mdia de uma varivel
aleatria Z que por sua vez o produto dos desvios de cada uma das duas variveis X e Y
em relao as suas respectivas medias.
X 0 1 2 P(y)
Y
1 3/20 3/20 2/20 8/20
2 1/20 1/20 2/20 4/20
3 4/20 1/20 3/20 8/20
P(x) 8/20 5/20 7/20 1
P( X = 1, Y = 2) 1/ 20 1
P(Y = 2 / X = 1) = = =
P ( X = 1) 5 / 20 5
147
8 5 7 19
E( X ) = 0 + 1 + 2 =
20 20 20 20
8 4 8
E (Y ) = 1 + 2 + 3 =2
20 20 20
No exemplo do quadro acima a covarincia igual a:
19 3 19 3 19 2
Cov( X , Y ) = (0 ) (1 2) + (1 ) (1 2) + (2 ) (1 2)
20 20 20 20 20 20
19 1 19 1 19 2
+ (0 ) (2 2) + (1 ) (2 2) + (2 ) (2 2)
20 20 20 20 20 20
19 4 19 1 19 3
+ (0 ) (3 2) + (1 ) (3 2) + (2 ) (3 2) =0
20 20 20 20 20 20
Cov ( X , Y ) = E ( XY ) E ( X ).E (Y )
Cov(X,Y) = E[(X-E(X))(Y-E(Y))]
Cov( X , Y ) = E ( XY E ( X )Y E (Y ) X + E ( X ) E (Y )) =
E ( XY ) E ( X ).E (Y ) E (Y ).E ( X ) + E ( X ).E (Y ) = E ( XY ) E ( X ) E (Y )
Apliquemos esta expresso aos dados do quadro acima para calcular a covarincia:
Para isto precisamos calcular E(XY). Para fazer isto devemos para cada valor do quadro
(para cada dupla de valores de X e Y) calculamos o valor do produto XY e multiplicamos
pela probabilidade conjunta.
148
Mas a recproca no verdadeira. O fato de Cov(X,Y) = 0 no implica
necessariamente que X e Y sejam independentes.
Para o ultimo exemplo, verificamos que Cov(X,Y) = 0. No entanto vamos verificar que
estas duas variveis no so independentes. Para que X e Y sejam independentes
estritamente necessrio que P(X,Y) = P(X).P(Y) para todos os valores de X e Y. Ou seja,
para todas as clulas da distribuio de probabilidade conjunta, o valor da probabilidade
conjunta deve ser igual ao produto das probabilidades marginais respectivas.
Verifiquemos esta propriedade para o quadro de distribuio de probabilidade conjunta
anterior.
X 0 1 2 P(y)
Y
1 3/20 3/20 2/20 8/20
8/20.8/20 = 8/20.5/20 = 8/20.7/20 =
16/400 40/400 56/400
2 1/20 1/20 2/20 4/20
4/20.8/20 = 4/20.5/20 = 4/20.7/20 =
32/400 20/400 28/400
3 4/20 1/20 3/20 8/20
8/20.8/20 = 8/20.5/20 = 8/20.7/20 =
56/400 40/400 56/400
P(x) 8/20 5/20 7/20 1
149
Sejam X e Y duas variveis quaisquer. Ento
Cov( X , Y ) = E[( X E ( X )).(Y E (Y ))] = (x
X )( y Y )dxdy
8 xy, 0 x 1,0 y x
f ( x, y ) =
0, para outros valores
x
x2
g ( x) =
f ( x, y )dy =
8 xydy =8 x ydy =8 x.
0
2
= 4 x3
4 x3 0 x 1
g ( x) =
0 para outros valores
150
Da mesma forma podemos determinar a funo de densidade de probabilidade marginal
de Y da seguinte forma:
1
12 y 2
h( y ) =
f ( x, y )dx =
8 xydx =8 y xdx =8 y.
y
2
= 4 y (1 y 2 )
4 y (1 y 2 ) 0 y 1
g ( y) =
0 para outros valores
X = E ( X ) = x.4 x3 dx = 4 / 5
0
1
Y = E (Y ) = y.4 y (1 y 2 )dy = 8 /15
0
1 1
4
8x y dxdy = 9
3 2
E ( XY ) =
0 y
4 4 8 4
Cov ( X , Y ) = XY = E ( XY ) X Y = =
9 5 15 225
importante destacar que a varincia de uma varivel aleatria pode ser interpretada
como a covarincia desta varivel com relao a ela mesma. Ou seja,
151
tivermos um conjunto de dados observados para as variveis X e Y. Por exemplo,
utilizemos o exemplo 4.4 da pagina 81 do Morettin.
2 4 6 8 10
Anos de servio (X)
152
Na figura a seguir apresentamos a planilha Excel para o calculo da covarincia e do
coeficiente de correlao. Na quarta e quinta colunas da planilha temos os valores das
variveis subtrados das suas medias. Na sexta coluna temos o produto destas duas
ultimas colunas. A media desta ultima coluna o valor da covarincia. Finalmente nas
duas ultimas colunas calculamos os desvios ao quadrado das variveis em relao as suas
medias (para podermos calcular a varincia e o desvio padro de cada uma delas).
Finalmente, calculamos o coeficiente de correlao como sendo a diviso entre a
covarincia e o produto dos desvios padres de X e de Y.
153
154
Problemas Resolvidos
(e) Considere a varivel aleatria Z igual a soma dos rendimentos de cada homem e cada
mulher. Calcule a media e varincia de Z.
(f) Supondo que todos os casais tenham a renda de um ano disponvel, e que se oferecera
ao casal escolhido a possibilidade de comprar uma casa pelo preo de 20, qual a
probabilidade de que o casal escolhido possa efetuar a compra?
Soluo
(a) Para a varivel X temos a ocorrncia de 3 valores (5, 10 e 15) e para a varivel Y
temos a ocorrncia de 2 valores (5 e 10). Iremos construir a distribuio de
probabilidade conjunta de acordo com a freqncia relativa de ocorrncia destes
valores conjuntos. Por exemplo, em 10 observaes (casais) vemos que o par
(X=10, Y = 5) ocorre 2 vezes. Portanto a freqncia relativa 2 /10 = 0,2 e este
o valor da probabilidade conjunta de X = 10 e Y = 5. Desta forma a nossa
distribuio de probabilidade conjunta :\
(b)
155
X 5 10 15 p(Y)
Y
5 1/10 2/10 1/10 4/10
10 2/10 3/10 1/10 6/10
p(X) 3/10 5/10 2/10 1
(d) A mdia de X E[X] = 5. 3/10 + 10. 5/10 + 15 . 2/10 = 15/10 + 50/10 + 30/10 =
95/10 = 9,5. A media de Y E[Y] = 5. 4/10 + 10 . 6/10 = 20/10 + 60/10 = 8.
156
cov( X , Y ) 1
= = = 0,1166
X Y 12, 25 6
5 10 15
X
157
Planilha Excel para o calculo da covarincia pelos 3 metodos:
158
Problema 35 pagina 229 do MORETTIN
Soluo:
(a) E ( X 2 ) = Var ( X ) + ( E ( X ) )2 = 2 + 2
Soluo:
cov( Z , W ) AC cov( X , Y )
Portanto ( Z , W ) = = = ( X ,Y )
Z W A X C Y
interessante notar que a condio imposta pelo MORETTIN de que A > 0 e C > 0 no
necessria.
Soluo:
159
Var ( X 2Y ) = Var ( X ) + Var (2Y ) 2Cov( X , 2Y ) =
Var ( X ) + 4Var (Y ) 2( E[2 XY ] E[ X ].E[2Y ]) =
Var ( X ) + 4Var (Y ) 2(2 E[ XY ] 2 E[ X ].E[Y ]) =
Var ( X ) + 4Var (Y ) 4Cov ( X , Y ) =
Var ( X ) + 4Var (Y ) 4 ( X , Y ). X Y =
1
1 + 4.2 4. .1. 2 = 11,83
2
Definio
(x ) 2
2 = i =1
para o caso de uma populao
N
(x )
i =1
2
160
A quantidade x chamada desvio de uma observao em relao a media da
distribuio. Como estes desvios so elevados ao quadrado e depois calculada a media
destes valores ao quadrado. 2 ser menor se os valores de x estiverem mais prximos
da media e ser maior de os valores de x estiverem mais afastados desta media .
Exemplo:
Seja X uma varivel aleatria representada pelo numero de automveis que so usados
para propsitos de negcios oficiais em qualquer dia da semana. A distribuio de
probabilidade para a companhia A dada por
x 1 2 3
f(x) 0,3 0,4 0,3
x 0 1 2 3 4
f(x) 0,2 0,1 0,3 0,3 0,1
3
2 = ( x 2) 2 f ( x) = (1 2) 2 (0,3) + (2 2) 2 (0,4) + (3 2) 2 (0,3) = 0,6
i =1
4
2 = ( x 2) 2 f ( x) = (0 2) 2 (0,2) + (1 2) 2 (0,1) + (2 2) 2 (0,3) + (3 2) 2 (0,3) + (4 2) 2 (0,1) = 1,6
i =1
A varincia pode ser obtida tambm atravs de uma formula mais simples.
161
2 = ( x ) 2 f ( x) = ( x 2 2 x + 2 ) f ( x) = x 2 f ( x) 2 xf ( x) + 2 f ( x)
x x x x x
2 = x 2 f ( x) 2 = E ( X 2 ) 2
x
Exemplo: Seja a varivel aleatria X que representa o numero de peas defeituosas para
uma maquina quando 3 peas so selecionadas da linha de produo e testadas. Temos
ento a seguinte distribuio de probabilidade para X:
x 0 1 2 3
f(x) 0,51 0,38 0,10 0,01
Soluo:
Exemplo: A demanda semanal por uma marca de refrigerante, em milhares de litros uma
varivel aleatria continua X com densidade de probabilidade
Soluo:
2
5
= E ( X ) = 2 x( x 1)dx =
1
3
e
2
17
E ( X 2 ) = 2 x 2 ( x 1)dx =
1
6
162
Portanto:
2
17 5 7
= =
2
6 3 18
Neste ponto a varincia ou desvio padro somente tem significado quando comparamos
duas ou mais distribuies que tem as mesmas unidades de medida. Portanto, podemos
comparar as varincias das distribuies dos contedos, medidos em litros, para duas
companhias engarrafadoras de suco de laranja e o maior valor indicar a companhia cujo
produto mais varivel ou menos uniforme. No tem significado comparar a varincia da
distribuio de alturas de pessoas com a varincia da distribuio dos coeficientes de
inteligncia (Q.I.).
Agora vamos estender nosso conceito de varincia de uma varivel aleatria X para
tambm incluir variveis aleatrias relacionadas a X. Para a varivel aleatria g(X), a
varincia ser denotada por g2( X ) e calculada por meio dos seguintes teoremas.
Teorema: Seja X uma varivel aleatria com distribuio de probabilidade f(x). A mdia
ou valor esperado da varivel aleatria g(X)
g ( X ) = E [ g ( X ) ] = g ( x ) f ( x ) se X discreta, e
x
g ( X ) = E [ g ( X ) ] = g ( x ) f ( x )dx se X contnua
Exemplo: Suponha que o numero de carros, X, que passam atravs de uma lavadora de
carros entre 4 hs e 5 hs da tarde em qualquer sexta-feira ensolarada tem a seguinte
distribuio de probabilidade:
x 4 5 6 7 8 9
P(X=x) 1/12 1/12 1/4 1/4 1/6 1/6
Soluo:
163
9
1 1 1
g ( X ) = E [ g ( X ) ] = E [ 2 X 1 ] = (2 x 1) f ( x ) = (7)( ) + (9)( ) + (11)
4 12 12 4
1 1 1
(13)( ) + (15) + (17)( ) = R$12, 67
4 6 6
Teorema.
{
g2( X ) = E g ( X ) g ( X )
2
} = g ( X )
x
g( X )
2
f ( x )
Se X discreta, e
{ }
g ( X )
2 2
g2( X ) = E g ( X ) g ( X ) = g( X ) f ( x )dx
x
Se X contnua.
x 0 1 2 3
f(x) 1/4 1/8 1/2 1/8
Soluo:
3
2 X + 3 = E [ 2 X + 3 ] = (2 x + 3) f ( x ) = 6
x =0
2
2 X +3 =E { [(2 X + 3) 2 X +3 ]2 } = E { [ 2 X + 3 6 ] } = E 4 X
2 2
12 X + 9
3
= (4 x 2 12 x + 9) f ( x ) = 4
x =0
164
Ache a varincia da varivel aleatria g(X) = 4X+3
2 2
(4 x + 3) x 2 1
E (4 X + 3) = 1 3 dx = 3 1 (4 x + 3x )dx = 8
3 2
{ [ (4 X + 3) 8 ] }
2
2 x
= E (4 X 5) = (4 x 5)
2
2
4 X +3 =E 2
dx
1
2
2
1 51
=
3 1
(16 x 4 40 x 3 + 25 x 2 )dx =
5
165
Figura 2 Duas Distribuies Normais com mesma mdia mas distintos desvios padres
Podemos tambm ter distribuies normais com o mesmo desvio padro, mas com
distintas mdias ou com mdias e desvios padres distintos. Na realidade a distribuio
normal um nome genrico para definir uma famlia de infinitas distribuies normais
particulares, cada uma com os seus valores especficos de mdia e desvio padro. O que
caracteriza, portanto, e diferencia uma distribuio normal de outra so os valores destes
dois parmetros: a sua mdia e o seu desvio padro. A funo densidade de probabilidade
de uma varivel aleatria normal dada por:
( X ) 2
1
f (X ) = e 2 2
2 2
possvel demonstrar matematicamente que a mdia (ou valor esperado) dessa varivel
aleatria igual ao seu parmetro e o seu desvio padro igual ao seu segundo
parmetro (da equao acima) . O que quer dizer que se aplicarmos as definies de
valor esperado e de varincia de uma varivel aleatria contnua a expresso acima
166
chegaremos aos resultados e 2 . O problema recamos em integrais mais difceis de
serem resolvidas:
+ + ( X ) 2
1
E[ X ] = Xf ( X )dx = X
2 2
e 2 2
dx =
e
+ + ( X ) 2
1
V[X ] = ( X E[ X ]) f ( X )dx = ( X ) 2 2
dx = 2
2 2
e
2 2
(talvez um bom matemtico possa fazer essa demonstrao, mas no o nosso caso pois
pretendermos ser bons em estatstica aplicada to somente).
possvel tambm demonstrar matematicamente que as duas abscissas no eixo X de
valor + e - correspondem a pontos de inflexo da curva normal. Para isto basta
obter a segunda derivada da funo densidade e provar que o seu valor muda de sinal no
ponto de inflexo mostrando que a a curvatura muda de sentido de cncava para convexa
ou vice-versa.
Z ~ N(0,1)
Se X uma varivel aleatria normal com mdia diferente de zero e desvio padro
diferente de 1 podemos converter essa distribuio em uma distribuio normal padro
atravs da transformao linear:
167
X
Z=
Para que serve essa distribuio Z? Nada melhor que um exemplo para explicar isso.
X 2200 2000
Para X = 2200 Z = = =1
200
X 1700 2000
Para X = 1700 Z = = = 1,5
200
Cerca de 68 % da rea sob a curva normal est entre menos um e mais um desvio
padro da mdia. Isto pode ser escrito como 1 .
Cerca de 95 % da rea sob a curva normal est entre menos dois e mais dois desvios
padres da mdia, escrito como 2 .
Praticamente toda (99,74 %) a rea sob a curva normal est entre menos trs e mais
trs desvios padres da mdia, escrito como 3 .
168
Exemplo 2:
O uso dirio de gua por pessoa em uma determinada cidade normalmente distribudo
com mdia igual a 20 litros e desvio padro igual a 5 litros. O uso dirio de cerca de
68 % das pessoas nesta cidade caem entre que valores?
Qual a probabilidade de que uma pessoa selecionada ao acaso usar menos do que 20
litros por dia ?
O valor de Z Z = (20 20) / 5 = 0. Portanto P(X < 20) = P(Z < 0) = 0,5.
169
Qual a probabilidade de que uma pessoa selecionada ao acaso use mais do que 20 litros
por dia ?
O valor de Z Z = (20 20) / 5 = 0. Portanto P(X > 20) = P(Z > 0) = 0,5.
X = 20 Z=0
24 20
X = 24 Z= = 0,8
5
P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).
16 20
X = 16 Z= = 0,8
5
X = 20 Z=0
P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P(0 < Z < 0,8) = 0,2881 = 28,81
Para a obteno das probabilidades para a curva normal padro Z consulta-se uma tabela
que pode ser encontrada em anexo em praticamente todos os livros de estatstica.
Reproduziremos a seguir integralmente essa tabela (para que possa ser mostrado para os
exemplos anteriores como foram obtidas as reas (que so probabilidades) abaixo da
curva norma Z. Resolvemos colocar a tabela no corpo do texto devido a sua grande
importncia em estatstica aplicada (e achamos que ela no deve ser relegada a um anexo
que poucos alunos tem a curiosidade de consultar).
170
Tabela 1 Valor de P(0 < Z < Z0) onde Z varivel normal padro
Z0 Segunda decimal de Z0
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4625 0,4633
1,8 0,4641 0,4649 0,4658 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4986 0,4986
171
3,0 0,4987 0,4987 0,4987 0,4990 0,4990
Qual a probabilidade de que uma pessoa selecionada ao acaso use mias do que 28 litros ?
X = 28 Z = (28 20 )/ 5 = 1,6
172
Qual a porcentagem entre 18 e 26 litros ?
18 20
X = 18 Z = = 0,4
5
26 20
X = 26 Z = = 1,2
5
P(18 < X < 26) = P(-0,4 < Z < 1,2) = 0,1554 + 0,3849 = 0,5403
Seja X a quantidade mnima. Portanto, precisamos encontrar X tal que P ( X X ' ) = 0,1
. Para achar o valor de Z correspondente veja no corpo (miolo) da tabela o valor de Z0 que
deixa uma rea entre 0 e Z0 igual a (0,5 0,1) = 0,4. O valor correspondente de Z0 1,28
(aproximadamente). Portanto, temos:
X '20
= 1,28 X = 26,4. Ou seja, 10 % da populao usa no mnimo 26,4 litros por
5
dia (ver figura).
173
Exemplo 4
Um professor verificou que as mdias finais em seu curso de Estatstica tem distribuio normal
com uma mdia igual a 72 e desvio padro 5. Ele decide atribuir conceitos para o seu curso tal
que os melhores 15 % recebem grau A . Qual a mnima mdia que o estudante precisa receber
para obter um A ?
X '72
= 1,04 X' = 77,2
5
174
6. Mtodos de Amostragem e Distribuies Amostrais
OBJETIVOS DO CAPTULO:
INFERENCIA ESTATISTICA
O nome inferncia refere-se a operaes estatsticas em que com base em uma amostra
estabelecem-se afirmaes sobre uma populao. Uma populao qualquer conjunto de
objetos (pessoas, animais, coisas no querendo naturalmente coisificar os seres
humanos). Geralmente um conjunto bastante amplo de objetos, por exemplo as pessoas
de um determinado pais ou regio, os representantes de uma espcie animal no planeta e
assim por diante. Os elementos de uma populao podem ser enumerveis ou no
175
enumerveis. So enumerveis quando podemos identificar cada um dos elementos e
relacionar, por exemplo, um numero inteiro a cada um deles. Assim se por exemplo
estivermos estudando uma varivel X, a renda pessoal de cada uma das pessoas desta
populao, a renda da primeira pessoa ser X1, a renda da pessoa ser X2 e a renda da
ultima pessoa da populao ser XN se a populao tiver N elementos.
Muitas vezes, na maior parte dos casos no se examinam todos os elementos da
populao, por razoes de custo da pesquisa e de tempo. Ento seleciona-se uma amostra
de elementos da populao. No caso em que investigamos todos os elementos da
populao a pesquisa comumente chamada de censo, como o caso do Censo
Demogrfico do IBGE que realizado de 10 em 10 anos.
Os levantamentos por amostragem esto sujeitos a um erro denominado erro de
amostragem ou erro amostral. Estes erros tem natureza probabilstica, pois no podemos
prever ou antecipar qual ser o erro exato da amostra mas podemos calcular
probabilidades de que o erro seja de um determinado valor. E mesmo isto s possvel
quando nossa amostra probabilstica. Uma amostra probabilstica uma amostra cuja
seleo definida em termos de probabilidades de seleo dos elementos da populao.
Se definimos um regra de seleo da amostra a partir dos elementos da populao
atribuindo valores bem precisos de probabilidades de seleo para todos os elementos da
populao, dizemos que a amostra probabilstica. Por exemplo, podemos dizer que a
probabilidade de seleo de cada elemento da populao na amostra um numero que
deve ser diretamente proporcional a idade dos elementos. Ento se um individuo tiver 30
anos ele ter o dobro da chance de ser selecionado que um individuo de 15 anos. Alem
disto as probabilidades somadas de todos os indivduos da populao deve perfazer um
total exatamente igual a 1. Dizemos ento que P(Xi) = k . Idadei e
N
176
individuo ser 20/550 = 0,03636 e a probabilidade de seleo do ultimo individuo cuja
idade de 100 anos ser de 100/550 = 0,1818.
A amostra probabilstica mais comumente utilizada aquela chamada de amostra aleatria
simples que doravante chamaremos de AAS. Nesta todos os elementos da populao tem
a mesma probabilidade de serem selecionados. Por exemplo, suponhamos que temos uma
populao com N = 100 e desejamos selecionar uma amostra de tamanho n = 30. Se cada
elemento da populao tem a mesma chance de entrar na amostra ento a probabilidade
de seleo de cada um deles ser um numero constante e igual a 1/100. Esta ser a
probabilidade do elemento Xi ser selecionado na primeira extrao da amostra. Como a
seleo da amostra envolve 30 extraes aleatrias e independentes temos aqui um
problema mais complexo. Dizemos com maior rigor que uma amostra AAS se para cada
uma das extraes todos os elementos da populao tem idntica probabilidade.
Aprofundemos esta questo para o caso mais simples, uma AAS selecionada com
reposio. Neste exemplo de N = 100 e n = 30 a probabilidade do numero de vezes em
que cada um dos elementos da populao est contido na amostra uma varivel aleatria
binomial com parmetros p = 100 e n = 30. Por exemplo, qual a probabilidade de que o
dcimo elemento da populao (poderia ser qualquer um) ser selecionado 3 vezes na
amostra de 30 elementos? Esta probabilidade igual a
3 30 3
10 1 1
P ( X = 3) = 1 = 0,00009148
3 100 100
No vamos complicar para o caso de uma AAS selecionada sem reposio. Fica a cargo
do aluno interessado e curioso tentar calcular qual seria a probabilidade de selecionar ao
menos uma vez um dos 100 elementos da populao em uma amostra de 30 elementos.
Fica apenas a sugesto de utilizar a distribuio hipergeomtrica (deve ser justificada).
Qual a vantagem de uma amostra ser aleatria, frente a amostras no aleatrias,
escolhidas por critrios subjetivos e ao gosto do pesquisador. Em primeiro lugar, porque
como veremos adiante, uma amostra escolhida por critrios rigorosamente objetivos tende
a no introduzir vieses que ocorrem quando a seleo obtida por critrios discutveis.
177
Um pesquisador de campo pode selecionar apenas domiclios que tem menos quantidade
de pessoas para facilitar o seu trabalho e pode tambm evitar os domiclios de difcil
acesso. Mas a principal vantagem de uma amostra probabilstica (frente a uma amostra
subjetivista) que atravs de seus resultados possvel realizar clculos
probabilsticos.
Uma boa amostra deve apresentar 3 virtudes: 1) deve ser aleatria (pelos motivos que j
introduzimos e que iremos aprofundar mais adiante). 2) deve ser precisa e 3) deve ser
representativa e no geradora de vieses para as suas estimativas de parmetros da
populao. A preciso de uma amostra ira depender de seu tamanho. Geralmente quanto
maior o tamanho de uma amostra maior ser a sua preciso. A representatividade da
amostra depender no de seu tamanho, mas da maneira como os elementos so
selecionados da populao. Por exemplo, se tivermos uma populao constituda de 30
% de mulheres e 70 % de homens e estivermos interessados em estimar a quantidade
media de horas de estudo. Se selecionarmos uma amostra com 50 % de homens e 50 % de
mulheres a quantidade media de horas de estudo desta amostra no ser um bom
estimador da quantidade media de horas de estudo da populao (parmetro), se a
quantidade de horas de estudo for uma varivel que depende do sexo da pessoa. Se as
mulheres tenderem a estudar mais do que os homens esta amostra no representativa ir
conduzir a um valor superestimado da quantidade de horas de estudo media. J uma
amostra que tenha o mesmo percentual de homens e de mulheres que existe na populao
ser considerada representativa desta populao e a media de horas estudo obtida desta
amostra ser uma estimativa no viesada da media de horas de estudo da populao
(parmetro).
Podemos neste momento fazer uma importante distino entre: 1) parmetro; 2)
estimador e 3) estimativa. Parmetro uma grandeza fixa e que se refere a uma
populao. No nosso exemplo anterior, o numero de horas de estudo mdio na populao
nosso parmetro. O valor deste parmetro na maior parte dos casos um valor
desconhecido, pois raramente podemos medir toda uma populao. Geralmente
desconhecemos o valor deste parmetro e tentamos estim-lo. Para estim-lo utilizamos
um estimador que se refere a uma formula matemtica que ser aplicada aos dados de
178
uma amostra. A media de uma amostra um estimador do parmetro media da
populao. A estimativa o valor que o estimador assume para uma dada amostra
particular e somente para aquela amostra. As estimativas variam de amostra para amostra.
Para cada amostra diferente temos diferentes estimativas e estas so calculadas de acordo
com uma mesma frmula, que o estimador. No caso do numero de horas de estudo
mdio, podemos selecionar de uma populao de 1000 estudantes diversas amostras de
tamanho n = 50. Em uma primeira amostra, temos uma estimativa de media da amostra,
em uma segunda amostra temos outro valor para a estimativa. Este valor da estimativa
que oscilar de amostra para amostra poder ser considerado resultado (valores
observados) de uma mesma varivel aleatria que justamente o estimador. Ento de
forma geral podemos dizer que um estimador da media populacional ( X ) a media da
amostra ( X ) e este estimador se comporta como uma varivel aleatria sendo que cada
um de seus valores de amostra para amostra uma estimativa.
A seguir mostramos uma tabela com uma listagem de diversos estimadores e parmetros.
Xi X i
X = i =1
= i =1
n N
Varincia amostral n Varincia N
(X i X )2 (X i )2
s2 = i =1 populacional 2 = i =1
n 1 N
Proporo amostral n Proporo N
X i X i
p = i =1
onde populacional p= i =1
onde Xi
n N
Xi = 0 ou 1 = 0 ou 1
Total amostral N n Total populacional N
T = X i T = Xi
expandido n i =1 i =1
Na primeira linha desta tabela temos a media amostral que um estimador da media
populacional. Na segunda linha temos a varincia amostral que um estimador da
179
varincia populacional. Observe o detalhe que o denominador da formula da varincia
amostral n-1 e no n (ao contrario o denominador da formula da varincia populacional
N e no N-1). Isto porque necessrio que o estimador seja no viesado o que quer
dizer que E[s2] = 2 . Para entender melhor este conceito suponhamos que de uma
populao de tamanho N = 1000 selecionemos todas as amostras possveis de tamanho n
= 50. Para cada uma destas amostras calculamos o valor de s2 (utilizando a formula da
segunda linha, segunda coluna da tabela acima). Os valores de s2 iro variar de amostra
para amostra e podemos assim considerar que s2 uma varivel aleatria pois depende de
cada amostra selecionada (sendo que todas estas amostras tem o mesmo tamanho n = 50).
A media de todos estes valores de s2 dever ser igual ao valor de 2 (calculado
utilizando-se a formula da segunda linha, quarta coluna). Caso no ocorresse isto o
estimador seria viesado.
Vamos supor uma populao de 4 elementos {2,3,4,5} tendo media = 3,5 e varincia
2 = 1,25
180
pode ser utilizada uma funo randmica: No Excel, por exemplo, temos a funo
ALEATRIO ENTRE.
Ni
ni =n i = 1,2,....,k
N
181
repartio proporcional mais precisa (menor varincia do estimador) do que a
amostragem aleatria simples (AAS).
wi i Ni i
ni = n k
= n k
W
i =1
i i N
i =1
i i
para um mesmo tamanho amostral a preciso maior para amostra aleatria estratificada
com repartio de Neyman (repartio tima) do que para a amostra aleatria estratificada
com repartio proporcional que por sua vez maior do que a amostra aleatria simples
182
A principal vantagem da amostra por conglomerados a de possibilitar considervel
reduo de custos (em relao, por exemplo, a uma amostragem aleatria estratificada)
para um mesmo tamanho amostral.
5!
5C2 = = 10
( 2! )( 3! )
183
Scios Total Mdia
1,2 48 24
1,3 52 26
1,4 48 24
1,5 44 22
2,3 56 28
2,4 52 26
2,5 48 24
3,4 56 28
3,5 52 26
4,5 48 24
A mdia da populao :
22 + 26 + 30 + 26 + 22
= = 25,2
5
Para uma populao com mdia e uma varincia 2 , a distribuio amostral das
mdias de todas as possveis amostras de tamanho n, geradas a partir da populao,
184
ser aproximadamente normalmente distribuda com a mdia da distribuio
amostral igual e varincia igual 2 / n - assumindo que o tamanho amostral
suficientemente grande, ou seja, n 30 .
Note que o erro padro das mdias amostrais mostra quo prximo da mdia da
populao a mdia amostral tende a ser.
X
X =
n
X o smbolo para o erro padro das mdias amostrais
n o tamanho da amostra
185
s
sX =
n
n
(X i X )2
onde s = i =1
n 1
Exemplo: O nmero de itens defeituosos produzidos por uma mquina foi registrado em
cinco horas selecionadas aleatoriamente durante uma semana de trabalho de 40 horas. O
nmero observado de defeituosos foi 12,4,7,14 e 10. Portanto, a mdia amostral 9,4.
Assim a estimativa de ponto para a mdia semanal do nmero de defeituosos 9,4.
186
Outra interpretao do intervalo de confiana de 95 % que 95 % das mdias
amostrais para um tamanho de amostra especificado cairo a uma distncia mxima
de 1,96 desvios padres da mdia populacional.
Para o intervalo de confiana de 99 %, 99 % das mdias amostrais para um tamanho
amostral especificado cairo a uma distncia mxima de 2,58 desvios padres da
mdia populacional.
s
X 1,96
n
O IC de 99 % para a mdia populacional dado por:
s
X 2,58
n
Em geral, um intervalo de confiana para a mdia, calculado por:
s
X Z
n
onde Z obtido da tabela de distribuio normal padro.
Exemplo 2
Uma universidade quer estimar o nmero mdio de horas trabalhadas por semana por
seus estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas com um
desvio padro de 4 horas.
187
Qual o intervalo de confiana de 95 % para o nmero mdio de horas trabalhadas por
semana ?
s 4
Usando a frmula anterior ( X 1,96 ) temos 24 1,96 ou 22,88 a 25,12. O
n 49
limite de confiana inferior 22,88. O limite superior de confiana 25,12. O grau de
confiana (nvel de confiana) utilizado 0,95.
Interprete os resultados
p Z p
onde:
p a proporo amostral
p (1 p )
p =
n
O intervalo de confiana construdo por:
p (1 p )
p Z
n
onde:
188
p a proporo amostral
Z o valor da varivel normal padro para o grau de confiana adotado.
n o tamanho amostral
Exemplo 3
(0,35) (0,65)
O CI de 98 % 0,35 2,33 ou 0,35 0,0497
500
Interprete a resposta
estatstica, considera-se como populao finita quando n > 0,05 (ou seja, quando a
N
frao amostral maior do que 5 %).
Para uma populao finita, onde o nmero total de objetos N e o tamanho da
amostra n, o seguinte ajuste feito para os erros padres da mdia amostral e da
proporo amostral.
189
N n
X =
n N 1
Erro padro da proporo amostral:
p (1 p ) N n
p =
n N 1
Exemplo 4
n 49
Agora = = 0, 098 > 0, 05 . Portanto, temos que usar o FCPF
N 500
4 500 49
24 1,96 = [ 22,93 ; 25,11]
49 500 1
H 3 fatores que determinam o tamanho de uma amostra, nenhum dos quais tendo
uma relao direta com o tamanho da populao. Eles so:
1. O grau de confiana adotado
2. O mximo erro permissvel
3. A variabilidade da populao
190
Uma frmula de clculo conveniente para determinar o tamanho amostral n :
2
Zs
n=
E
onde:
E o erro permissvel
Exemplo 5
( 2,58 ) ( 20 )
2
n= = 106, 50 107
5
2
Z
n = p (1 p ) onde
E
p a proporo estimada, baseada na experincia passada ou em uma amostra piloto
191
Exemplo 6
2
1,96
n = ( 0,30 )( 0, 70 ) = 893, 4 893
0, 03
OBJETIVOS:
Definir hipteses e Testes de Hipteses
Descrever os 5 passos do procedimento de Teste de Hipteses
Distinguir entre Teste de Hipteses Unicaudal e Bicaudal
Realizar um teste para a mdia populacional
Realizar um teste para a diferena entre duas mdias ou propores populacionais
Descrever os erros estatsticos associados aos testes de hipteses
Nota:
Se nada conhecido acerca da populao, a estimao usada para fornecer uma
estimativa de ponto e de intervalo acerca da populao.
Se alguma informao acerca da populao proposta ou suspeitada, o Teste de
Hipteses usado para determinar a plausibilidade desta informao.
192
A renda mdia mensal proveniente de todas as fontes para os analistas de sistemas
de US 3625
Vinte por cento de todos os transgressores juvenis so presos e sentenciados a priso.
Erro Tipo I: Rejeitar a Hiptese Nula, H0, quando ela efetivamente verdadeira. A
probabilidade do erro tipo I igual ao nvel de significncia, (alfa).
Erro Tipo II: Aceitar a Hiptese Nula, H0, quando efetivamente falsa. A
probabilidade do erro tipo II igual a (beta)
193
Tipos de Erros
Aceita H0 Rejeita H0
H0 verdadeira Deciso Correta Erro Tipo I
H0 falsa Erro Tipo II Deciso Correta
Valor Crtico (ou z crtico ou valor de t): O ponto divisor entre a regio onde a
hiptese nula rejeitada e a regio onde ela no rejeitada. Este valor obtido a
partir da tabela de z (normal padro) ou da tabela de t (t de Student).
Um teste unicaudal quando a hiptese alternativa, H1, estabelece uma direo tal
como:
H0: A renda mdia das mulheres menor que ou igual a renda mdia dos homens.
H1: A renda mdia das mulheres maior que a renda mdia dos homens.
A regio de rejeio neste caso a cauda direita (superior) da curva.
Figura com distribuio normal mostrando a regio de rejeio para um teste unicaudal
194
H0: A renda mdia das mulheres igual a renda mdia dos homens.
H1: A renda mdia das mulheres no igual a renda mdia dos homens.
Figura com distribuio normal mostrando a regio de rejeio para um teste bicaudal
X
z =
n
Exemplo 1
Os processadores de uma indstria indicam o ponto (marca) que a garrafa contem 16
onas (medida inglesa de peso) do produto. O Departamento de Controle de
Qualidade responsvel pelo controle da quantidade includa na garrafa. Uma
amostra de 36 garrafas selecionada por hora e o seu contedo pesado. Na ltima
hora uma amostra de 36 garrafas apresentou um peso mdio de 16,12 onas com um
desvio padro de 0,5 onas.
195
Passo 1: Estabelecer a Hiptese Nula e a Hiptese Alternativa:
H:
0 =16 H:1 16
Passo 2: Estabelecer a regra de deciso:
H0 rejeitado se o z (efetivo calculado com base nos valores amostrais) < -1,96 ou z >
1,96.
Passo 3: calcule o valor da estatstica de teste ( z efetivo)
196
p-value = P{z valor da estatstica de teste calculada}
X
z=
s
n
Exemplo 2
197
H:0 400
contra
H:1 > 400
407 400
z= = 2,42
38
172
H0 rejeitada. O administrador conclui que a mdia dos saldos no pagos maior do que
US$ 400.
198
X1 X 2
z =
12 22
+
n1 n2
X1 X 2
z =
s12 s 22
+
n1 n2
Exemplo 3
H0 : 2 1 H1 : 2 > 1
199
Estabelea a regra de deciso
30 , 4 25 , 6
z = = 6 ,80
2 2
3, 6 2 .9
+
45 40
H0 : 2 1
X X
z = 1 2
s 12 s 22
+
n1 n2
z efetivo
Desde que o Z efetivo = 6,80 > Z crtico = 2,33, H0 rejeitada. Aqueles que se
aposentaram no ltimo ano tiveram mais anos de servio.
200
7.6 Testes Referentes Proporo
p p
z =
p (1 p )
n
p proporo populacional
p proporo amostral
Exemplo 4
Ao nvel de significncia de 0,05 pode-se concluir que a nova carta mais efetiva?
201
H 0 : p 0,15 H1 : p > 0,15
Estabelea a regra de deciso
45
0 ,15
z= 200 = 2 ,97
( 0,15 )( 0 ,85 )
200
p1 p 2
z=
pc (1 pc ) pc (1 pc )
+
n1 n2
n1 o tamanho da amostra da populao 1.
202
pc a mdia ponderada das duas propores amostrais, calculada por:
Exemplo 5
Uma amostra de 250 trabalhadores casados mostrou que 22 faltaram mais do que 5 dias
no ltimo ano por alguma razo. Uma amostra de 300 trabalhadores solteiros mostrou que
35 faltaram mais do que 5 dias. Use o nvel de significncia de 0,05.
H 0 : p2 p1 H1 : p2 > p1
onde o subscrito 2 refere-se a populao dos trabalhadores solteiros.
203
22 + 35
pc = = 0,1036
250 + 300
22 35
Z= 250 300 = 1,10
0,1036(1 0,1036) 0,1036(1 0,1036)
+
300 250
Qual o p-value?
EXERCCIOS :
(incluem recordao de tpicos anteriores)
204
b.Calcule a amplitude dos dados.
c.Calcule o desvio padro amostral, , s, dos dados.
d.Pelo Teorema de Chebychev, no mnimo _________ % dos dados caem dentro de
dois desvios padres de cada lado da mdia.
205
3. Em um levantamento recente, a probabilidade de que um acidente de carro causado
por um motorista embriagado cerca de 0,229. Nos prximos trs acidentes, qual a
probabilidade de que:
a.exatamente um acidente seja causado por um motorista embriagado?
b.No mnimo um acidente seja causado por um motorista embriagado?
c.Se voc6e tem os seguintes resultados de probabilidade de acidentes causados por
motoristas embriagados nos 10 prximos acidentes
206
4. Um dentista tem 5 cadeiras disponveis para pacientes em sua sala de espera. A
distribuio de probabilidade do nmero de cadeiras ocupadas, x, dada por
x p(x)
0 0,304
1 0,228
2 0,171
3 0,128
4 0,096
5 0,073
207
7. Os pesos de certos produtos em quilogramas so normalmente distribudos com
mdia = 180 e desvio padro 2 = 4. Se uma unidade deste produto escolhida
aleatoriamente, qual o peso desta unidade se a probabilidade de ocorrncia :
a. De um peso maior igual a 0,10 ?
b. De um peso menor igual a 0,05 ?
10. Suponha que os dividendos anuais de quatro aes sejam respectivamente $ 2,00, $
4,00, $ 6,00 e $ 8,00. Deduza a distribuio amostral de X considerando as seguintes
hipteses :
1. tamanho amostral n = 2.
2. mtodo de amostragem: amostragem aleatria simples com reposio
Para a distribuio amostral deduzida de X , verifique por demonstrao que
a. E( X ) =
b. V( X ) = 2 /n
c. Se a amostragem for sem reposio deduza a distribuio de X e demonstre que
E( X ) = e V( X ) =
n
[ ( N n) / ( N 1) ]
d. Se a amostragem fosse realizada com reposio, qual o valor de V( X )?
208
11. Uma populao consta de 4 nmeros: 3, 7, 11 e 15. Considerar todas as amostras
possveis que podem ser retiradas com reposio. Determinar: a) a mdia
populacional; b) o desvio padro da populao; c) a mdia da distribuio amostral
das mdias; d) o desvio padro da distribuio amostral das mdias. Verificar (c) e (d)
diretamente e por meio de (a) e (b) atravs das frmulas apropriadas.
12. Certas vlvulas fabricadas por uma companhia tm uma vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria de
16 vlvulas, retiradas do grupo, ter a vida mdia: (a) entre 790 e 810 horas; (b)
inferior a 785 horas. Para realizar esses clculos, o que necessrio supor? Explique a
razo de sua afirmativa.
13. De acordo com o exerccio 8. Se for tomada uma amostra de 64 vlvulas, como ser
resolvido? Explicar a diferena.
(X
i =1
i X )2
15. Questo terica. Demonstre que s 2 = um estimador viesado para a
n
N
(X
i =1
i ) 2
varincia populacional 2 = , onde n o tamanho da amostra e N o
N
tamanho da populao. Calcule o valor do vis. O que ocorre com esse valor quando n
de um parmetro dito no
tende ao infinito. (Lembrar que um estimador
]=
viesado se E[
209
16. Questo terica
17. Uma funo de probabilidade uma regra de correspondncia ou uma equao que:
t | 0 1 2
210
----------------------
P(T = t) | .5 .3 .2
19. Uma centena de estudantes realizou um teste no qual o escore mdio foi de 73 com
uma varincia de 64. Um grau A foi dado para quem obteve um escore de 85 ou
mais. Quantos As foram obtidos aproximadamente, assumindo que os escores So
normalmente distribudos? (escolha o mais prximo)
1. 42
2. 7
3. 58
4. 5
5. 22
20. Se uma distribuio normal tem mdia 200 e desvio padro 20, ache K tal que a
probabilidade de que um valor amostral seja menor do que K 0,975.
21. Se X a mdia de uma amostra extrada de uma distribuio normal com = 10,
211
22. A distribuio do tempo de vida de certo tipo de lmpada eltrica normalmente
distribuda com mdia de 1000 horas e um desvio padro de 100 horas. Ache o 33
Percentil da distribuio de tempo de vida.
a. 560
b. 330
c. 1044
d. 1440
e. nenhuma das anteriores
1) 0,025
2) 0,05
3) 0,0745
4) 0,0495
5) Nenhuma das anteriores
25. Em uma distribuio normal com mdia 3 e varincia 49, quais so o limite superior
e inferior para os 50 % dos dados centrais?
a. -29,83 e 35,83
212
b. -1,31 e 7,69
c. -1,69 e 7,69
d. 3,00 e 24,00
e. nenhuma das anteriores
26. Uma amostra aleatria de tamanho 25 escolhida de uma populao com mdia 7 e
varincia 4. A mdia amostral calculada como 8. Qual o valor da varivel normal
padro (z) correspondente a mdia amostral?
a. 25
b. 1,25
c. 1,25
d. +2,5
e. nenhuma das anteriores
28. Uma companhia fabrica cilindros que tem uma mdia de 2 polegadas de dimetro. O
desvio padro dos dimetros dos cilindros de 10 polegadas. Os dimetros de uma
amostra de 4 cilindros so medidos todas as horas. A mdia amostral usada para
decidir se o processo de fabricao est operando satisfatoriamente ou no. A seguinte
213
regra de deciso aplicada: se dimetro mdio da amostra de 4 cilindros maior ou
igual a 2,15 polegadas, ou menor ou igual a 1,85 polegadas, interrompe-se o processo.
29. Qual (ou quais) das seguintes sentenas descreve inferncia estatstica ?
a. uma sentena verdadeira sobre uma populao feita atravs de uma informao
amostral de uma populao
b. uma conjectura acerca de uma populao feita a partir da informao contida em uma
amostra daquela populao
c. uma sentena verdadeira acerca de uma amostra feita a partir da informao contida
em uma populao.
30. Para uma certa populao normalmente distribuda, o valor do desvio padro
conhecido, mas o valor da mdia desconhecido. Qual ser o efeito de mudanas no
tamanho amostral e do grau de confiana no comprimento do intervalo de confiana
da estimativa da mdia populacional?
a. Aumentando o tamanho amostral aumenta o comprimento dado um grau de confiana
fixo.
b. Aumentando o grau de confiana reduz o comprimento, dado um tamanho amostral
fixo.
c. Aumentando o tamanho amostral reduz o comprimento, dado um grau de confiana
fixo.
214
d. Nenhuma das anteriores.
31. A distribuio das mdias de todas as possveis amostras de tamanho (n) escolhidas
de uma populao se aproximar de uma curva normal se
a. n grande o bastante
b. a populao grande
c. a populao simtrica
d. a mdia de cada amostra igual a mdia da populao
e. nenhuma das anteriores correta
33. Em um estudo sobre que relao existente entre uma atitude de criana e a idade na
qual ela fala primeiro, os pesquisadores registraram a idade (em meses) da primeira
fala da criana e o nmero de pontos (escore) obtido pela criana em um teste sobre
a atitude. Seguem-se os dados para 21 crianas:
criana 1 2 3 4 5 6 7 8 9 10 11
Idade 15 2 10 9 15 20 18 11 8 20 7
Escore 95 71 83 91 102 87 93 100 104 94 113
215
Criana 12 13 14 15 16 17 18 19 20 21
Idade 9 10 11 11 10 12 42 17 11 10
Escore 96 83 84 102 100 105 57 121 86 100
34. Uma amostra no ano de 1989 de 130 mulheres que visitaram um ginecologista em
uma determinada universidade do Noroeste dos EUA indicou que 113 tiveram
experincia sexual.
216
c. O intervalo seria mais largo, mais estreito ou da mesma largura se resultassem
73 mulheres com experincia sexual 130 mulheres amostradas? (Voc no
precisa fazer nenhum clculo) Explique.
d. Voc acha que razovel assumir que essas mulheres formam uma amostra
aleatria? Explique.
35. No execute nenhum clculo para responder o seguinte. Explique seu raciocnio em
cada caso.
217
a. 80 % uma parmetro ou uma estatstica? Que smbolo voc deve usar para represent-
lo?
b. De acordo com o Teorema do Limite Central, como a proporo amostral de quem
come peru no Dia de Ao de Graas varia de amostra para amostra ?
c. Determine a probabilidade de que menos do que 3 quartos da amostra comam peru no
Dia de Ao de Graas.
d. Seria a resposta a (c) menor, maior ou a mesma se o tamanho amostral de 800 fosse
usado? (voc no precisa executar o clculo). Explique.
d. Podemos mostrar que nesse contexto P ( p 0,80) = 0.15. Se essa afirmativa no
estiver correta escreva uma verdadeira que a substitua. Escreva uma ou duas sentenas
explicando para um leigo o que essa afirmativa significa.
37. A seguinte tabela lista a temperatura mdia mensal e minha conta de eletricidade para
aquele ms.
ms temp conta ms temp Conta
Abr-91 51 $41.69 Jun-92 66 $40.89
Mai-91 61 $42.64 Jul-92 72 $40.89
Jun-91 74 $36.62 Ago-92 72 $41.39
Jul-91 77 $40.70 Set-92 70 $38.31
Ago-91 78 $38.49 Out-92 * *
Set-91 74 $37.88 Nov-92 45 $43.82
Out-91 59 $35.94 Dez-92 39 $44.41
Nov-91 48 $39.34 Jan-93 35 $46.24
Dez-91 44 $49.66 Fev-93 * *
Jan-92 34 $55.49 Mar-93 30 $50.80
Fev-92 32 $47.81 Abr-93 49 $47.64
Mar-92 41 $44.43 Mai-93 * *
Abr-92 43 $48.87 Jun-93 68 $38.70
218
Mai-92 57 $39.48 Jul-93 78 $47.47
Exerccios Resolvidos
EXERCICIOS
Soluo:
X X
X Z . < < X + Z .
n n
219
No caso n = 4 (o tamanho da amostra), a media amostral X = 29,2 e o desvio-padrao
amostral s = 5,76 (que utilizamos na expressao acima no lugar do X , o desvio padro
da populao, j que s um estimador no viesado para este parmetro da populao).
Para = 10 % vemos que o valor de z correspondente 1,6448. Assim o intervalo de
5,76 5,76
29,2 1,6448. < < 29,2 + 1,6448.
4 4
24,46 < < 33,94
2) De 50.000 vlvulas fabricadas por uma companhia, retira-se uma amostra aleatria de
400 vlvulas e obtem-se a vida media de 800 horas, sendo o desvio padro populacional
de 100 horas.
c) Que tamanho deve ter a amostra para que seja de 95 % a confiana na estimativa do
intervalo de 800 7,84 ?
Soluo:
a) 1- = 0,99
220
X N n N n
X Z . . < < X + Z . X .
n N 1 n N 1
100 5000 400 100 5000 400
800 2,5758 < < 800 + 2,5758
400 5000 1 400 5000 1
787,6 < < 812,3
1- = 0,9590
3) Uma amostra aleatria de 625 donas de casa revelou que 70 % delas preferem a marca
X de detergente. Construir um intervalo de confiana para p = proporo das donas de
casa que preferem X, com uma confiana de 90 %.
Resp. (67 %, 73 %)
221
5) Suponha que estamos interessados em estimar a percentagem de consumidores de certo
produto. Se uma amostra de tamanho 300 forneceu 100 indivduos que consomem o dado
produto, determine:
EXERCICIOS RESOLVIDOS
0 se x < 1,5
x se 1,5 x 2
f (x)
0,25 se 2 x 2,5
0 se x > 2,5
dessa forma:
222
2 2,5 2
2
xdx + 0,25dx = x
2,5
+ 0,25 x 2 = 4 / 2 2,25 / 2 + 0,25 2,5 0,25 2 = 2 1,125 + 0,625 0,5 = 1
2 1,5
1, 5 2
= 4 2,25 = 0,875
2
b) P (1,5 x 2) =
1, 5
f ( x)dx = xdx = x
1, 5
2 2 2
1, 5
a. O cenrio futuro para os terrenos indica que eles devero valorizar em mdia 25 % em
dois anos, mas fatores no controlveis transferem grande variabilidade para esta
previso. Acredita-se que a valorizao tenha uma varincia de 12 %.
b. O mercado financeiro mais estvel e acena com uma taxa de ganho de 20 %, com
varincia de 4 % em dois anos.
Soluo:
Seja X1 a varivel aleatria que representa a taxa de valorizao dos terrenos e X2 a taxa
de valorizao do mercado financeiro.
X 1 ~ N(25;12) e X 2 ~ N(20;4)
16 25
P ( X 1 16) = P ( z ) = P ( z 2,598) = 1 0,0047 = 0,9953
12
16 20
P ( X 2 16) = P ( z ) = P ( z 2) = 1 0,0227 = 0,9773
4
223
O investidor deve escolher pela compra dos terrenos pois P( X 1 16) > P( X 2 16)
Soluo:
Observe que a amostragem realizada considerando-se populao finita j que n/N >
0,05. Alm disso como n menor que 30 e como no enunciado nada dito sobre a
distribuio de X no podemos aplicar o Teorema do Limite Central. Dessa forma, para
solucionarmos o problema, temos que supor que o custo tem distribuio normal (caso
contrrio teramos que trabalhar com a teoria das amostras pequenas e aplicar uma outra
distribuio chamada "t" de Student). No clculo do intervalo de confiana temos que
fazer a correo de populao finita.
O intervalo de confiana para um nvel de confiana de 1 - % dado por:
N n N n
P ( X z X X + z X ) = 1
N 1 N 1
Para 1- = 93 % temos:
60 6 60 6
P (4,83 1,48 0,483 4,83 + 1,48 0,483 ) = 0,93
60 1 60 1
P (4,146 5,514) = 0,93
224
4) Uma amostra de 50 elementos foi retirada de uma populao de 500 elementos, para a
avaliao da mdia populacional, fornecendo s(x) = 4. Qual deve ser o tamanho de uma
amostra que avalie a mdia com erro mximo de 2 unidades, ao nvel de confiana de 90
%?
Soluo:
N= 500 n = 50 sx = 4
Z X = erro
Como
x sx
X =
n n
Temos:
2 2
s Z s 1,64 4
Z x = erro ou n = x = = 10,758 11
n erro 2
Como n/N > 0,05 temos que considerar a correo de populao finita, ou seja,
temos que empregar a seguinte relao:
N n
Z X = erro
N 1
225
elevando ao quadrado ambos os termos da equao acima temos:
N n
Z X
2 2
= erro 2
N 1
2 sx2
Z ( N n) = erro 2 ( N 1)
n
z2 s x2 N 1,64 2 16 500
n= 2 = =
e N e 2 + z2 s x2 4 500 4 + 1,64 2 16
10,55 11
226