Escolar Documentos
Profissional Documentos
Cultura Documentos
Curso de Estatistica Aplicada PDF
Curso de Estatistica Aplicada PDF
APLICADA
1. Introduo.......................................................................................................4
2. Estatstica Descritiva.......................................................................................8
2.1 Tipos de Variveis .......................................................................................8
2.2 Tabelas e Distribuies de Freqncia......................................................10
2.3 Histogramas...............................................................................................13
2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas...........14
2.5 Medidas de Posio e de Disperso .........................................................17
2.5.1 Uma Nota sobre Notao Estatstica ...............................................18
2.5.2 A Mdia Aritmtica No Ponderada..................................................19
2.5.3 A Mdia Aritmtica Ponderada .........................................................20
2.5.4 Propores como Mdias .................................................................21
2.5.5 A Mdia Geomtrica ..........................................................................22
2.5.6 A Mdia Harmnica............................................................................26
2.5.7 A Mediana ...........................................................................................27
2.5.8 A Mdia para Dados Agrupados .......................................................28
2.5.9 A Mediana para dados Agrupados ...................................................30
2.5.10 A Moda para dados Agrupados ......................................................32
2.5.11 O Intervalo (ou amplitude)...............................................................39
2.5.12 Percentis, Decis e Quartis...............................................................41
2.5.13 Varincia e Desvio Padro ..............................................................42
2.5.14 Varincia e Desvio Padro para Dados Agrupados......................44
2.5.15 Interpretando e Aplicando o Desvio Padro..................................46
2.5.16 Coeficiente de Variao ..................................................................47
2.6 Medidas de Assimetria...............................................................................49
2.7 Curtose: uma medida de achatamento......................................................50
3. Probabilidade..................................................................................................53
3.1 Definio Clssica de Probabilidade ........................................................54
3.2 Conceito da Freqncia Relativa ...............................................................56
3.3 Probabilidade Subjetiva ............................................................................57
3.4 Algumas Regras Bsicas de Probabilidade ...............................................57
3.5 A Regra do Complemento .........................................................................58
3.6 A Regra Geral da Adio ...........................................................................60
3.7 Regras de Multiplicao............................................................................62
3.8 Probabilidade Condicional .........................................................................64
3.9 Diagramas em rvore ................................................................................66
3.10 Teorema de Bayes ..................................................................................67
Anexo 1 Recordando Definies e Conceitos ..............................................68
Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades
......................................................................................................................72
Anexo 3 - Probabilidade Condicional............................................................77
Resumo do Clculo de Probabilidades............................................................81
Exerccios de Probabilidade ............................................................................83
2
4. Variveis Aleatrias Discretas ......................................................................101
4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta
.......................................................................................................................105
4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade
Discreta..........................................................................................................106
4.3 A Distribuio de Probabilidade Binomial ................................................109
4.4 A Mdia e Varincia De Uma Distribuio Binomial ................................112
Apndice 1 (Recordao) ..............................................................................113
Apendice 2 (Recordao) ..............................................................................114
Apndice 3 (Recordao) ..............................................................................116
Apndice 4 (recordao)................................................................................119
Valor Esperado e Varincia de uma Varivel Aleatria ..............................119
Variveis Aleatrias Independentes ..............................................................126
5. Variveis Aleatrias Contnuas e Distribuio Normal..................................129
5.1 Variveis Aleatrias Contnuas................................................................129
5.2 Mdia e Varincia de uma Varivel Aleatria Contnua...........................130
5.3 Varivel Aleatria Normal ........................................................................131
5.4 Distribuio Normal Padro .....................................................................133
5.5 reas Abaixo da Curva Normal ...............................................................135
6. Mtodos de Amostragem e Distribuies Amostrais ....................................142
6.1 Amostragem Probabilstica ......................................................................143
6.2 Teorema do Limite Central ......................................................................147
6.3 Estimativa de Ponto .................................................................................148
6.4 Estimativa de Intervalo.............................................................................149
6.5 Intervalo de Confiana para Uma Proporo Populacional .....................150
6.6 Fator de Correo de Populao Finita ...................................................151
6.7 Selecionando uma Amostra.....................................................................152
6.8 Tamanho Amostral para Estimativa de Propores ................................153
7. Teste de Hipteses Amostras Grandes .....................................................154
7.1 Testes de Significncia Unicaudais .........................................................156
7.2 Testes de Significncia Bicaudais ...........................................................157
7.3 P-value de um Teste de Hiptese............................................................158
7.4 Clculo do P-value...................................................................................159
7.5 Teste de Hipteses: Duas Mdias Populacionais....................................160
7.6 Testes Referentes a Proporo ...............................................................162
Exerccios : ....................................................................................................166
3
1. Introduo
4
De fato, a estatstica tornou-se uma ferramenta cotidiana para todos os
tipos de profissionais que entram em contato com dados quantitativos ou tiram
concluses a partir destes.
O que Estatstica ?
Estatstica Descritiva
5
que a informao fornecida pelos dados possa ser observada com grande
facilidade e preciso.
3) Apresentar dados numricos, seja organizados ou no, de forma que as
caractersticas e o comportamento dos dados so clara e facilmente
revelados. Tais apresentaes So feitas por meio de mtodos grficos.
4) Sumarizar ou descrever cada caracterstica ou propriedade dos dados por um
simples nmero, tal como uma mdia, uma porcentagem ou alguma outra
medida apropriada, a qual calculada a partir dos dados por meio de uma
frmula derivada a partir de algum princpio vlido.
Estatstica Indutiva
A Estatstica Indutiva, que tambm freqentemente chamada de
inferncia estatstica ou estatstica inferencial, em contraste com a estatstica
descritiva, essencialmente analtica em sua natureza. Consiste de um conjunto
de princpios ou teoremas que nos permitem generalizar acerca de alguma
caracterstica de uma populao a partir das caractersticas observadas de
uma amostra. Nessa definio, uma populao o conjunto de todos os itens,
objetos, coisas ou pessoas a respeito das quais a informao desejada para a
soluo de um problema. Uma amostra um grupo de itens selecionados por
um mtodo cuidadosamente concebido e projetado a partir de uma populao.
Existem diferentes tipos de amostras, dependendo dos diferentes mtodos de
seleo disponveis. Uma amostra aleatria simples, falando em termos
simplificados, aquela que selecionada de tal forma que cada e todos os itens
na populao tem a mesma chance de serem includos na amostra.
Se uma medida descritiva calculada a partir dos dados da populao
ela chamada de parmetro populacional, ou simplesmente parmetro; se
calculada a partir dos dados da amostra ela chamada de estatstica amostral,
ou simplesmente estatstica. Considerando esses conceitos podemos definir
estatstica indutiva como o processo de generalizar acerca de do valor de um
parmetro a partir do valor de uma estatstica. Existem dois procedimentos de
inferncia distintos mas relacionados: estimao e teste de hipteses.
6
Estimao processo de usar o valor de uma estatstica amostral para estimar o
valor de um parmetro que desconhecido, mas uma constante. Como um
exemplo suponhamos que temos uma populao de 100.000 bolas de gude em
um saco, todas as quais so idnticas exceto pela cor, e que no podemos v-
las embora saibamos que uma parte delas so brancas e o restante so pretas.
Suponha que desejamos ter uma idia da proporo de, digamos, bolas brancas
nessa populao. Suponha que para conseguir isso selecionamos 1.000 bolas
aleatoriamente do saco e verificamos que 350 so brancas. Isso significa que
nossa proporo amostral de bolas brancas 35 %. A partir disso conclumos
que a proporo populacional de bolas brancas tambm 35 %. Fazendo isso
ns realizamos o que chamado de estatstica pontual.
Mas afirmar que a proporo de bolas brancas em toda a populao
exatamente igual a proporo daquela amostra particular como dar um tiro no
escuro: o valor da proporo amostral um resultado aleatrio e depende de
cada amostra de 1.000 bolas escolhida da populao. Pode ser que por uma
enorme casualidade o resultado daquela amostra que escolhemos coincida
exatamente com o valor da proporo de bolas brancas em toda a populao.
Mas as chances de que isso no ocorra so muito grandes. Uma forma de
contornarmos esse problema afirmarmos que as chances so de 95 em 100
(ou de 95 %) de que o intervalo formado pela proporo amostral acrescida e
diminuda de 3 pontos percentuais contenha o verdadeiro valor da proporo
populacional desconhecido. Ou seja, construmos um intervalo com limites 35 +
0,03 x 35 = 36,05 e 35 - 0,03 x 35 = 33,95 e afirmamos (com base em algum
princpio obtido a partir da teoria estatstica) que as chances so de 95 em 100
de que o verdadeiro valor da proporo populacional esteja localizado dentro
desse intervalo. Quando uma afirmativa dessa natureza feita estamos
realizando o que se chama de estimativa por intervalo.
Quanto ao segundo procedimento da estatstica inferencial deixaremos
para coment-lo quando for abordado em sua ntegra. E o terceiro campo de
estudos da Estatstica, a Teoria da Deciso Estatstica no ser discutido nessa
apresentao.
7
2. Estatstica Descritiva
8
de pessoas por famlia, quantidade de doentes por hospital.1 As variveis
quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua
e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o
peso de pessoas, a renda familiar, o consumo mensal de energia eltrica, o
preo de um produto agrcola.2 As variveis quantitativas contnuas referem-se
ao conjunto dos nmeros reais ou a um de seus subconjuntos contnuos.
1
Uma varivel quantitativa discreta no precisa assumir necessariamente
apenas valores de contagem, ou seja nmeros inteiros ou nmeros naturais em
seqncia. Um exemplo de varivel quantitativa discreta seria, por exemplo,
uma que assumisse apenas os seguintes valores : { 1; 3,5 ; 5,75 ; 10 }. Apesar
dessa varivel abranger valores no inteiros ela apresenta saltos de
descontinuidade: nesse exemplo ela no pode assumir nenhum valor
intermedirio entre 1 e 3,5 ou entre 5,75 e 10.
2
Seria impossvel obter na prtica uma varivel perfeitamente contnua j que
os instrumentos de medida no tem preciso infinita. Por exemplo., o peso de
pessoas medido com uma balana com preciso, digamos, de dcimos de
gramas. Ento jamais conseguiremos obter um valor para essa varivel que se
localize entre 50.000,1 e 50.000,2 gramas, por exemplo, 50.000,15 gramas.
Ocorre portanto um salto de descontinuidade entre os dois valores possveis de
serem medidos e a varivel, do ponto de vista terico, no pode ser considerada
como varivel quantitativa contnua, mas varivel quantitativa discreta. Mas do
ponto de vista prtico, acabamos freqentemente por consider-la e trat-la
como sendo uma varivel quantitativa contnua, apesar dessa falta de preciso
absoluta. O mesmo podemos dizer para o caso da renda ou qualquer outra
varivel econmica medida em unidades monetria: no existe uma renda de
por exemplo R$ 200,345 j que o centavo a menor diviso do sistema
monetrio. Mas de qualquer forma, costuma-se tratar a renda como varivel
quantitativa contnua e no discreta.
3
muito comum considerar-se que a estatstica apenas abrange os estudos
que utilizam as variveis quantitativas. Nada mais equivocado. Existe um vasto
9
Exemplos so o grau de instruo, a classificao de um estudante no curso de
estatstica, as posies das 100 empresas mais lucrativas, etc. As variveis
qualitativas nominais por sua vez no definem qualquer ordenamento ou
hierarquia. So exemplos destas a cor , o sexo, o local de nascimento, etc.4
Dependendo da situao uma varivel qualitativa pode ser representada
(codificada) atravs de emprego de nmeros (por exemplo: em sexo
representamos homens como sendo 0 e mulheres como sendo 1). Mas no
tratamento estatstico dessa varivel codificada no podemos consider-la como
sendo quantitativa. Ela continua sendo uma varivel qualitativa (pois o em sua
essncia e natureza) apesar de sua codificao numrica que tem como
finalidade uma maior finalidade de tabulao de resultados.
No podemos dizer que para qualquer uma destas categorias qualquer
mtodo estatstico pode ser adequadamente aplicado. As variveis quantitativas
contnuas so aquelas que permitem a utilizao de um conjunto maior e
superior de mtodos estatsticos e so, sem dvida, as variveis mais passveis
de um rico tratamento estatstico. Em seguida vm, nessa ordem, as variveis
quantitativas discretas, as variveis qualitativas ordinais e por ltimo, as
variveis qualitativas nominais Essas ltimas so as que permitem a utilizao
de um menor e menos poderoso arsenal de instrumentos estatsticos de anlise.
10
e apresentados em uma forma sistemtica e seqencial por meio de uma tabela
ou grfico. Quando fazemos isso, as propriedades dos dados tornam-se mais
aparentes e tornamo-nos capazes de determinar os mtodos estatsticos mais
apropriados para serem aplicados no seu estudo.
Suponhamos o seguinte conjunto de dados:
14 12 13 11 12 13
16 14 14 15 17 14
11 13 14 15 13 12
14 13 14 13 15 16
12 12
Varivel freqncia
11 2
12 5
13 6
14 7
15 3
16 2
17 1
11
A freqncia de uma observao o nmero de repeties dessa
observao no conjunto de observaes. A distribuio de freqncia uma
funo formada por pares de valores sendo que o primeiro o valor da
observao (ou valor da varivel) e o segundo o nmero de repeties desse
valor.
5
Observe que os valores da ltima coluna (freqncia relativa acumulada)
podem ser calculados de duas maneiras. Na primeira, tal como feito na tabela
a seguir, dividimos o valor da freqncia absoluta acumulada pelo total de
observaes. Na segunda maneira, acumulamos o valor da freqncia relativa.
Este ltimo mtodo pode levar a acmulos de erros, de forma que o ltimo valor
de freqncia relativa acumulado se distancie consideravelmente de 1.
12
acumulada acumulada
11 2 2/26 = 0,0769 2 2/26 = 0,0769
12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1 1/26 = 0,0385 26 26/26 = 1,0000
TOTAL 26 1,0000
2.3 Histogramas
Histograma
7
6
Freqncia
5
4
Freqncia
3
2
1
0
Mais
11
12
13
14
15
16
17
Bloco
13
histograma de frequncia acumulada (ou ogiva) a representao grfica do
comportamento da frequncia acumulada. Na figura abaixo a ogiva mostrada
em sobreposio ao histograma.
Histograma
7 100,00%
6
80,00%
Freqncia
5
4 60,00% Freqncia
3 40,00% % cumulativo
2
20,00%
1
0 ,00%
Mais
11
12
13
14
15
16
17
Bloco
14
6 340 15 371
7 310 16 390
8 340 17 400
9 369 18 370
15
430 - 280
Amplitude de Classe = = 30
5
Observa-se na tabela acima que o limite superior de cada classe coincide com o
limite inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de
uma observao seja exatamente igual ao valor do limite de classe deve-se
estabelecer um critrio de incluso. Para evitar esse tipo de dificuldade
normalmente se estabelece que o limite superior de cada classe aberto (e
consequentemente, o limite inferior de cada classe fechado), ou seja, cada
intervalo de classe no inclui o valor de seu limite superior, com exceo da
ltima classe.
16
280 - 310 3 0,12 (12 %)
310 - 340 4 0,16 (16 %)
340 - 370 6 0,24 (24 %)
370 - 400 7 0,28 (28 %)
400 - 430 5 0,20 (20%)
Total 25 1,00 (100 %)
17
4. Curtose. a caracterstica que se refere ao grau de achatamento, ou a taxa
na qual a distribuio cresce ou cai da direita para a esquerda.
moda ~
xm Xm xm
18
2.5.2 A Mdia Aritmtica No Ponderada
x
n
x1 + x 2 +...+ x n i
X = =
i =1
n n
Propriedades da mdia aritmtica no ponderada:
n( X ) = x (6)
(x - X ) = 0
(x - X ) 2
= um mnimo.
6
- Utilizaremos muito freqentemente a notao x simplificadamente para
x
n
representar i .
i =1
19
teoria estatstica. Ela chega a ter um nome especial : o princpio dos mnimos
quadrados. Ela , por exemplo, a base racional do mtodo dos mnimos
quadrados que usado para ajustar a melhor curva atravs de um conjunto de
pontos em um sistema de eixos cartesianos, como veremos adiante. Esta
propriedade tambm a base para o clculo de uma importante medida de
disperso, que veremos logo a seguir.
A validade dessas tr6es propriedades pode ser facilmente demonstrada
por um exemplo numrico simples, mostrado na tabela a seguir. Nesta tabela, a
coluna (1) contem o conjunto de dados cuja soma 9 e cuja mdia 3. A
coluna (2) demonstra a primeira propriedade da mdia, ou seja, se cada uma
das observaes individuais dos dados substituda pela mdia, a soma
permanece igual a 9. A coluna (3) verifica que de fato (x - X ) = 0 .
Finalmente, as colunas (4), (5) e (6) demonstram que (x - X ) 2
= 14, que
20
decorrer do semestre. Se um determinado obter as notas 7, 5 e 8 a sua mdia
ponderada final ser:
1 (7) +1 (5) + 2 8
=7
1+ 1+ 2
Em termos gerais, a frmula para a mdia aritmtica ponderada :
X w = wi xi = wx
n
i =1
21
A mdia da varivel x m = x N . No entanto essa mdia tambm
G = n ( x1 )( x2 )...( xn )
22
A subiu 100 % e o preo de B decresceu 50 %. Qual foi a mudana mdia
relativa de preos? Em outras palavras, qual foi o percentual mdio de mudana
de preos?
23
g = 200 50 = 10.000 = 100
2. Se 1985 escolhido como a base, os preos de 1980 sero tambm 100 %
dos preos em 1985, ou seja:
g = 50 200 = 100
24
anterior 60 96 300
g = 3 (60)(96)(300) = 120
7
Se, por exemplo, ao invs de 60, 96 e 300 %, como anteriormente, tivermos
60, 96 e 78 %, a taxa de crescimento geomtrica mdia ser de
g = 3 (60)(96)(78) = 76,59 , o que indica um decrscimo mdio de 76,59 - 100 = -
23,41 %.
8
Essas ltimas porcentagens, referentes ao exemplo da tabela anterior, seriam
(6.000 - 10.000)/10.000= - 0,40, ou seja - 40 %; (5.760 - 6.000)/6.000 = -0,04 ,
ou seja, - 4 %; e (17.280 - 5.760)/5760 = 2, ou seja + 200 %.
25
freqncia uma frmula que se relaciona com a mdia geomtrica, que
:
xf
R = n -1
xi
onde:
R = taxa de crescimento geomtrica mdia,
n = nmero de perodos de tempo,
xf = valor no perodo final,
xi = valor no perodo inicial.
17.280
R = 3 - 1 = 0,20 ou 20 % , como obtido anteriormente.9 Note que
10.000
R = G -1.
1 1
1 1 1
H=
x1 + x2 +...+ xn
=
(1 / x ) = n
n n (1 / x)
Para clculos mais simples, a frmula anterior pode ser reescrita como:
9
- interessante notar que pelo clculo anterior empregam-se os valores dos
anos intermedirios, ao passo que nesse ltimo, apenas empregam-se os
valores do perodo inicial e final, no importando o que ocorreu nos perodos
intermedirios.
26
1 1 1
1 x1 + x2 +...+ xn (1 / x )
H= n
=
n
1 +1 +1
1 4 10 16 = 0,1375
H= 3
H = 7,27
Para os mesmos dados a mdia aritmtica 10 e a mdia geomtrica
8,62. Para qualquer srie de dados cujos valores no so todos os mesmos e
que no incluem o zero, a mdia harmnica sempre menor que tanto a mdia
aritmtica como a mdia geomtrica.
2.5.7 A Mediana
27
O valor da mediana no influenciado pelos valores nas caudas
de uma distribuio. Por exemplo, se temos a srie de dados 1,2,3,4,5 a
mediana 3. Se substitumos os valores das caudas dessa distribuio por
quaisquer valores uma nova distribuio formada poderia ser formada pela srie
-1000,-100,3,500,5000 e a mediana permanece sendo 3. Portanto, ela uma
medida de posio da distribuio bem adequada para distribuies
assimtricas, tais como a distribuio de renda, j que no sabemos se a famlia
mais rica ganha R$7.000.000 ou R$ 500.000.000. Veremos, mais a frente que
ela possui vantagens em relao a mdia aritmtica, como medida de posio
(ou medida de tendncia central) para dados agrupados em classes de
freqncia, quando a ltima classe tem limite superior indeterminado.
A mediana tambm tem a interessante propriedade de que a soma dos desvios
absolutos das observaes em relao a mediana menor do que a soma dos
desvios absolutos a partir de qualquer outro ponto na distribuio.
Simbolicamente:
x- X .5 = um mnimo
10
Isto , principalmente se no agrupamento dos dados originais em uma tabela
de distribuio de freqncia, empregou-se um nmero adequado de classes de
freqncia.
28
a freqncia (absoluta simples) da classe i e mi ponto mdio da classe i. Sob
essa hiptese, a mdia aproximada para uma distribuio de uma amostra com
k classes vem a ser:
X@
f 1m1 + f 2 m2 +...+ f k mk
@
fm
f 1 + f 2 +...+ f k f
fm
=
n
Classe f m fm
R$ 120,00 - R$139,99 5 130,0 650,0
140,00 - 159,99 26 150,0 3900,0
160,00 - 179,99 24 170,0 4080,0
180,00 - 199,99 15 190,0 2850,0
200,00 - 219,99 8 210,0 1680,0
220,00 - 239,99 2 230,0 460,0
Total 80 13620,0
13620,00
x= = R$170,25
80
29
0,20,40,60,80 e 100, com distncia constante entre cada par de observaes,
de forma que:
30
Total 80
55
n + 1 80 + 1
= = 40,5
2 2
31
\ X .5 = 167,92
(n + 1) / 2 - Fa
X .5 = LI .5 + c
f .5
11
- A freqncia relativa acumulada da classe anterior classe corrente a
freqncia relativa acumulada do limite inferior da classe corrente. A freqncia
relativa acumulada da classe corrente a freqncia relativa acumulada do
limite superior dessa mesma classe.
31
onde:
LI.5 = limite de classe inferior da classe da mediana,
Fa = freqncia acumulada da classe imediatamente anterior classe da
mediana,
f.5 = freqncia absoluta simples da classe da mediana,
c = amplitude (tamanho) da classe da mediana.
12
Definimos densidade de freqncia de um intervalo de classe como sendo o
quociente entre a freqncia absoluta simples desse intervalo e o seu tamanho
(amplitude). Quando os intervalos de classe possuem amplitudes desiguais,
existe uma tendncia de os intervalos maiores apresentarem maiores
freqncias. Dessa forma a classe modal no a classe de maior freqncia
mas a classe de maior densidade de freqncia. Naturalmente, quando todos os
intervalos tm a mesma amplitude, como no caso do exemplo anterior e como
geralmente so construdos para no distorcer a distribuio, a classe modal a
classe de maior densidade de freqncia assim como tambm a classe de maior
freqncia. Esse conceito de densidade de freqncia ser muito til, quando
definirmos, mais adiante, a funo densidade de probabilidade e para a sua
compreenso intuitiva.
32
onde:
Lm = o verdadeiro13 limite inferior de classe da classe modal
D1 = da diferena entre das densidades de freqncia da classe modal e
classe premodal.
D2 = da diferena entre das densidades de freqncia da classe modal e
classe posmodal.
C = a verdadeira amplitude de classe da classe modal.
xm X
13
Para determinar os limites de classe verdadeiros para uma varivel contnua,
temos que escrever os limites de classe com uma casa decimal a mais do que
os dados originais. Por exemplo, se o conjunto de dados consiste de medidas
de peso arredondadas para um dcimo de grama, os limites nominais de classe
(tambm chamados de limites aparentes podem ser 11,0 - 11,2; 11,3 - 11,5;11,6
- 11.8; ... Os limites verdadeiros de classe (tambm conhecidos como limites
reais ou efetivos) seriam 10,95 - 11,25; 11,25 - 11,55; 11,55 - 11,85;...
33
freqncias absolutas de classe no lugar das densidades de freqncia,
para o clculo do valor aproximado da mediana.
Lm = 140,00 D1 = 26 - 15 = 11
c = 20 D2 = 26 - 24 = 2
11
xm @ 140,00 + ( ) 20 = 156,92
11 + 2
Uma observaes aqui necessria. possvel calcular os valores
aproximados da mediana e da moda para dados agrupados quando o
ltimo intervalo de classe tem limite superior indeterminado. No caso da
mediana isso imediato e no caso da moda, o seu clculo somente pode
ser feito se a ltima classe no for a classe modal e preciso
primeiramente calcular as densidades de freqncia. Como exemplo,
suponhamos que a distribuio de renda de uma certa regio dada pela
seguinte distribuio de freqncia:
14
Observe-se que os dados originais esto, de acordo com o sugerido pela
tabela acima, com aproximao igual a unidades de gramas. Os limites
verdadeiros (ou reais) de classe) passam, portanto, a ter aproximao de uma
casa decimal de grama. O valor final dos clculos da mediana e da moda so
34
(542 + 1) - 210
x.5 @ 605,50 + 2 (1200,50 - 605,50) = 772
220
A Mdia Aritmtica
35
A Mediana
A Moda
36
4) Para uma distribuio negativamente assimtrica, mdia < mediana
< moda. A distncia entre a mediana e a mdia cerca de um tero
da distncia entre a moda e a mdia.
Essas ltimas caractersticas so apresentadas graficamente, a seguir
Assimetria positiva
Distribuio Simtrica
37
Assimetria negativa
Medidas de Disperso, Assimetria e Curtose
38
srie. Por exemplo, no podemos dizer qual distribuio tem maior ou menor
grau de disperso da informao dada pela tabela abaixo.
Distribuio A Distribuio B
Mdia 15 15
Mediana 15 12
Moda 15 6
39
Para algumas distribuies simtricas a mdia pode ser aproximada
tomando-se a semi-soma dos dois valores extremos,16 que freqentemente
chamada de semi-amplitude. Por exemplo, prtica entre os meteorologistas
derivar a mdia diria de temperatura tomando a mdia somente dos valores
mximo e mnimo de temperatura ao invs, de digamos, a mdia das 24 leituras
horrias do dia.
A amplitude tem alguns defeitos srios. Ela pode ser influenciada por um
valor atpico na amostra. Alm disso o seu valor independe do que ocorre no
interior da distribuio, j que somente depende dos valores extremos. Este
defeito ilustrado na figura a seguir:
f(X)
X
Na figura acima so mostradas duas distribuies com diferentes
variabilidade, mas com mesma amplitude. A amplitude tende a crescer, embora
no proporcionalmente, a medida que o tamanho da amostra cresce. Por esta
razo, no podemos interpretar a amplitude corretamente sem conhecer o
nmero de informaes dos dados.
16
Foi o que fizemos ao calcular a mdia para valores agrupados em classes de
freqncia. Nesse caso utilizamos o ponto mdio de cada intervalo de classe
como representativo da mdia de cada intervalo. Assim, ao multiplicarmos a
freqncia de cada classe pelo valor do ponto mdio, estamos calculando
aproximadamente a soma das observaes em cada intervalo, admitindo como
hiptese que a distribuio dos dados em todos os intervalos simtrica.
40
2.5.12 Percentis, Decis e Quartis
17
Para o clculo do valor exato do percentil x para dados agrupados utiliza-se o
mesmo mtodo para a determinao da mediana, ou seja, a interpolao linear.
Como no caso da mediana, podemos empregar uma frmula de interpolao
p (n + 1) / 100 - Fa
X p = LI p + c
fp
onde Xp o percentil p, Lip o limite inferior real da classe que contem o
percentil, Fa a freqncia relativa acumulada da classe anterior classe que
contem o percentil, fp a freqncia relativa (simples) da classe que contem o
percentil, c a amplitude do intervalo de classe que contem o percentil e o
nmero de observaes. O mesmo mtodo pode ser empregado tambm para
os decis e quartis.
41
observaes. Se tivermos 200 observaes, o segundo decil ser
aproximadamente a observao de posto 40.
O primeiro quartil o valor da varivel cuja freqncia relativa acumulada
0,25 (ou 25 %). O terceiro quartil o valor da varivel cuja freqncia relativa
acumulada 0,75 (ou 75 %). O primeiro quartil maior do que um quarto dos
valores observados e menor do que trs quartos destes valores. O terceiro
quartil maior do que trs quartos dos valores observados e menor do que um
quarto destes valores. O segundo quartil confunde-se com a mediana.
Uma medida de disperso o chamado desvio interquartlico que a
diferena entre o terceiro e o primeiro quartis.
S 2
=
(x - X ) 2
n -1
Para uma populao finita,
s2 =
(x - m) 2
42
n x 2 - ( x ) 2
S =
2
n( n - 1)
x x
2
2
s2 = -
N N
unidades por hora. Portanto, com base nestes dados, o tipo Y um pouco mais
rpida. Podemos retirar mais alguma informao a partir destes dados?
Podemos medir e comparar as disperses das produes horrias dos dois
tipos de mquina. Usando a penltima frmula para os dados da tabela,
obtemos:
10(16.405) - ( 403) 2
S X2 = = 18,23
10(10 - 1)
S X = 18,23 = 4,27 unidades por hora
10(17.984) - ( 408) 2
SY2 = = 135,11
10(10 - 1)
SY = 135,12 = 11,62 unidades por hora
x y x2 y2
43
35 25 1.225 625
36 26 1.296 676
49 55 2.401 3.025
44 52 1.936 2.704
43 48 1.849 2.304
37 24 1.369 576
38 34 1.444 1.156
42 47 1.764 2.209
39 50 1.521 2.500
40 47 1.600 2.209
O tipo X tem menor disperso que o tipo Y. Apesar de ter maior preo
que o tipo Y, a mquina X mais precisa.
44
so as observaes naquele intervalo de classe. As equaes para as
varincias so:
S 2
=
f (m - X ) 2
, para a amostra;
n -1
s2 =
f (m - m ) , para a populacao.
N
S2 =
fm 2
- ( fm) 2 / n
n -1
e
s 2
=
fm 2
- ( fm) 2 / N
N
45
140,00 - 159,99 150 26 3.900 585.000
160,00 - 179,99 170 24 4.080 693.000
180,00 - 199,99 190 15 2.850 541.500
200,00 - 219,99 210 8 1.680 352.800
220,00 - 239,99 230 2 460 105.800
Total 80 13.620 2.363.200
S2 =
fm 2
- ( fm) 2 / n
=
2.363.200 - (13.620) 2 / 80
= 561,96
n -1 80 - 1
S = 561,96 = 23,71
46
Considere o exemplo anterior das mquinas. Temos X = 40,3 e
S X = 4,27 . Que percentagem das mquinas tero produo entre
X 1,5S X = 40,3 1,5 4,27 , ou seja, entre 33,9 e 46,7? Resposta: no mnimo
47
quando, primeiro, todas as observaes individuais tm a mesma unidade de
medida e, segundo, as mdias dos conjuntos de dados so aproximadamente
iguais. Quando qualquer uma destas condies no satisfeita, uma medida
relativa de disperso deve ser usada. Uma medida relativa de variabilidade
freqentemente usada chamada de coeficiente de variao, denotada por CV
para uma amostra. Esta medida o valor do desvio padro em relao mdia:
S
CV =
X
48
2.6 Medidas de Assimetria
X - Xm
SK P =
S
49
A aplicao desta expresso envolve outra dificuldade, que surge devido
ao fato de que o valor modal da maioria das distribuies ser somente uma
distribuio, enquanto que a localizao da mediana mais satisfatoriamente
precisa. Contudo, em distribuies moderadamente assimtricas, a expresso
X m = X - 3( X - X .5 )
adequada (no envolve impreciso muito grande). A partir disto, vemos que:
X - X m = X - [ X - 3( X - X .5 )] = 3( X - X .5 )
Com este resultado, podemos rescrever o coeficiente de assimetria de
Pearson como:
3( X - X .5 )
SK P =
S
Esta medida igual a zero para uma distribuio simtrica, negativa para
distribuies com assimetria para a direita e positiva para distribuies com
assimetria para a esquerda. Ela varia dentro dos limites de 3. Aplicando SKP
aos dados agrupados de gastos com consumo de alimentos das famlias, temos:
3(170,25 - 167,92)
SK P = = +0,295
23,71
50
Apresentaremos agora uma medida de achatamento das distribuies, o
coeficiente de curtose, denotado por K. Esta medida algebricamente tratvel e
geometricamente interpretvel. definida como a relao entre o desvio semi-
interquartlico, ou seja, a metade do valor do desvio interquertlico, e o intervalo
entre o decil 9 e o decil 1:
1
(Q3 - Q1 )
K= 2
D9 - D1
Por meio do coeficiente de curtose, classificamos diferentes graus de
achatamento em trs categorias: leptocrtica, platicrtica e mesocrtica (ver
figura, a seguir). Uma distribuio leptocrtica (curva a) tem a maior parte de
suas observaes concentrada no centro. Consequentemente, a diferena entre
as duas distncias, (Q3 - Q1) e (D9 - D1) tende a ser muito pequena. Para um
dado grau de disperso, quanto menor for o achatamento da distribuio, menor
ser diferena entre estas duas distncias. Desde que (Q3 - Q1) < (D9 - D1)
para uma distribuio com forma muito pontiaguda, K aproxima-se de 0,5 no
limite, quando Q3 - Q1 = D9 - D1. Ao contrrio, quanto mais platicrtica a
distribuio (curva b), mais o intervalo entre os decis 9 e 1 tende a exceder o
intervalo interquartlico. Portanto, quando o intervalo de uma varivel tende ao
infinito e para uma curva completamente achatada, K tende a zero. Em vista
destas consideraes, parece razovel estabelecer valores prximos de 0,25
para representar distribuies mesocrticas (curva c). Esta escolha reforada
pelo fato de que para a varivel normal padronizada, k = 0,2630 (veremos este
ponto em captulo posterior).
51
Na figura acima compara-se a curtose de duas distribuies com a curtose de
uma distribuio mesocrtica (em linha tracejada). Na figura da esquerda temos
uma distribuio platicrtica (linha cheia) e na figura da direita temos uma
distribuio leptocrtica (linha cheia).
Aps o clculo dos quartis e decis a partir dos dados agrupados para a
distribuio de gastos com alimentao, temos que:
1
( Q3 - Q1 ) (1 / 2)(188.39 - 154,83)
K= 2 =
D9 - D1 209,78 - 146,58
= 0,2655
Este resultado indica que a distribuio de gastos com alimentos
aproximadamente mesocrtica, j que muito prximo de 0,25.
52
3. Probabilidade
Objetivos do captulo:
53
Calcular uma probabilidade usando o Teorema de Bayes
Uma probabilidade expressa como uma nmero decimal, tal como 0,70 ; 0,27
; ou 0,50. Entretanto ela pode ser representada como uma percentagem tal com
70 %, 27 % ou 50 %. O valor de uma probabilidade est localizado no intervalo
de nmero reais que vai de 0 a 1, inclusive as extremidades deste intervalo.
54
nmero de resultados favorveis
Probabilidade de um evento =
nmero total de possveis resultados
Definies
CC CK
KC KK
55
Eventos Coletivamente Exaustivos: no mnimo um dos eventos deve ocorrer
quando o experimento conduzido.
Exemplo 2
56
3.3 Probabilidade Subjetiva
Chegada Frequncia
Adiantada 100
No horrio 800
Atrasada 75
Cancelado 25
57
Total 1000
P( A) + P( A ) = 1
P( A) = 1 - P( A )
A
58
A
Exemplo 3
C D
0,8 0,025
59
(C ou D) = (A ou B) =
0,175
A regra do complemento muito importante no estudo de probabilidade.
Com freqncia, mais eficiente calcular a probabilidade de um evento
ocorrer determinando-se a probabilidade do evento no ocorrer e subtraindo
o resultado de 1.
60
Exemplo 5
TV
50
Ambos
CD 25
70
61
Seja C o evento o estudante tem um aparelho de CD e T o evento o
estudante tem uma TV
Desde que:
62
P(A e B) = P(A). P(B)
P(A e B e C) = P(A).P(B).P(C)
Exemplo 6
63
Exemplo 7
1 [(0,40).(0,40).(0,40)] = 0,936
64
A regra estabelece que para dois eventos A e B, a probabilidade conjunta de
que os dois eventos ocorram obtida pela multiplicao da probabilidade de
que o evento A ocorra pela probabilidade condicional de B dado que A
ocorreu.
Exemplo 8
65
P(A e F) = 80 / 1000
V1
7/12
B2 (7/12) (5/11)
5/11
(5/12) (7/11)
7/11
V2
5/12
B1
(5/12) (4/11)
4/11
B2
66
Probabilidades Probabilidades
Condicionais Conjuntas
Espao Amostral
A1 A2
B
A1 e B A2 e B
67
P( A ) P( B / A )
P( A / B) = 1 1
P( A ) P( B / A ) + P( A ) P( B / A )
1
1 1 2 2
Nota: Este teorema pode ser estendido para diversas parties do espao
amostral ( A1, A2, A3, etc.)
Exemplo 9 :
0,55 0,03
P( A / S ) = = 0,4783
0,55 0,03 + 0,45 0,04
Uma moeda mostra cara 50% do tempo, em mdia. Depois de muitos lances, o
nmero de caras aproximadamente igual ao nmero de coroas.
68
Um conceito de Probabilidade
nmero de caras
No limite quando o nmero de lances -> infinito 0,5
nmero de lanamenos
Dizemos que a probabilidade de aparecer uma cara em qualquer lance 1/2.
Isto ilustra o conceito de probabilidade que ser usada neste curso.
10
% de
0
caras
50 %
-5
-10
10 100 100 1000
0 0
Nmero de lanamentos
69
Teoria de probabilidade a aproximao matemtica que busca quantificar em
temos de modelos o que ocorre com estes experimentos.
Lance uma moeda duas vezes e registre para cada lance se o resultado era
uma cara (C) ou uma coroa (K). Exerccio: Liste os possveis resultados.
Seja A o evento deu uma ou mais caras. Quais resultados pertencem ao evento
A? (CK, KC, CC).
Seja B o evento no aparece nenhuma cara. (KK)
Neste exemplo, os eventos A e B so ditos disjuntos ou mutuamente exclusivos,
pois eles no tm nenhum resultado em comum. Eles tambm so exaustivos,
j que eles cobrem todos os possveis resultados do experimento.
Exerccio: Defina um evento C que no disjunto em relao a A.
DEFINIES
70
nmero de vezes em que A ocorre f
frequncia relativa de A = =
nmero de observaes n
71
Anexo 2 - Independncia e Modelos de rvore para
Calcular Probabilidades
= 0.13
P(A
somente) P(B somente)
= 0,1 0,02
P(A e B) = 0,05 0,02
= 0,02 = 0,03
= 0,08
72
A ou B consiste em 3 partes mutuamente exclusivas: A somente, B somente, A
e B.
P(A ou B) = P(A somente) + P(B somente) + P(A e B)
= P(X ou Y)
73
Diagramas de rvore so teis em clculos que envolvem vrias fases. Cada
segmento na rvore uma fase do problema e as probabilidades nos ramos a
partir de cada ponto tem que somar 1. A probabilidade de alcanar o fim de
qualquer caminho completo o produto das probabilidades escritas em seus
ramos.
Modelo de rvore para meninos (B) e meninas (G) em uma famlia de tamanho
3.
(ver figura a seguir)
Figura 1
74
Cada caminho representa um resultado ( famlia de 3 filhos). H 8 resultados.
Se voc assume que estes so igualmente provveis ento a probabilidade de
cada 1/8.
75
por exemplo P(BGB) = 0.52 x 0.48 x 0.52 = 0.13
Um evento qualquer subconjunto de resultados.
Calcule probabilidades para os eventos seguintes que usam o " modelo realista
".
C: todas as crianas tm o mesmo sexo
D: menos de 2 meninos
E: C e D ==> todas meninas
F: C ou D ==> no 2 meninos
76
BGB BGB BGB BGB
BBG BBG BBG BBG
77
Exemplo - Uma famlia de 3 crianas
P (C ou D) 0,11
P (C / D ) = = = 0,23
P ( D) 0,47
78
Em geral para eventos X e Y a probabilidade condicional de X dado que Y
aconteceu
P( X e Y)
P( X / Y ) =
P(Y)
P(X|Y) = P(X e Y)/P(Y) Isto pode ser rearranjado como:
P(X e Y) = P(X|Y)P(Y)
M F
E 0.52 0.41 0.93
U 0.05 0.02 0.07
0.57 0.43 1.00
Ache
Respostas:
79
P ( E e M) 0,52
P( E / M ) = = = 0,91
P(M) 0,57
= P(E|M)P(M) + P(E|F)P(F)
P ( M e E)
P(M / E ) =
P( E )
P( E / M ) P(M )
=
P( E / M ) P(M ) + P( E / F ) P( F )
0,52
= = 0,56
0,93
Independncia Revisitada
80
isto na equao acima d P(X e Y) = P(X) .P(Y), a regra para eventos
independentes.
81
82
Exerccios de Probabilidade
10) Uma cidade tem 30 000 habitantes e trs jornais A, B e C. Uma pesquisa de
opinio revela que:
12 000 lem A;
8 000 lem B;
7 000 lem A e B;
6 000 lem C;
83
4 500 lem A e C;
1 000 lem B e C;
500 lem A,B e C.
13) Dez pessoas so separadas em dois grupos de 5 pessoas cada um. Qual
a probabilidade de que duas pessoas determinadas A e B faam parte do
mesmo grupo?
16) Uma moeda foi cunhada de tal forma que 4 vezes mais provvel de dar
cara do que coroa. Calcular as probabilidades de cara e coroa.
84
1 1 1
P( A) = , P(B) = e P(A B) =
2 4 5
Calcular :
a) P ( A B )
b) P(A)
c) P( B)
d) P(A B)
e) P(A B)
f) P(A B)
g) P(A B)
a) uma quadra
b) uma quina
c) a Sena Principal
d) A Sena Anterior ou a Posterior.
a) um terno
b) uma quadra
c) a quina
85
b) com 11 pontos, se acerta os resultados dos 10 primeiros jogos e acerta
apenas um dos resultados dos 3 ltimos;
c) com 12 pontos, se acerta os resultados dos 10 primeiros jogos e acerta
apenas 2 dos resultados dos 3 ltimos;
d) com 13 pontos, se acerta os resultados dos 13 jogos.
a) com 10 pontos;
b) com 11 pontos;
c) com 12 pontos;
d) com 13 pontos.
27) Tem-se n urnas. Bolas so colocadas ao acaso nas urnas, uma de cada
vez, at que alguma urna receba duas bolas. Qual a probabilidade de
colocarmos exatamente p bolas nas urnas?
30) Sabe-se que 80 % dos pnaltis marcados a favor do Brasil so cobrados por
jogadores do Flamengo. A probabilidade de um pnalti ser convertido 40 %
86
se o cobrador for do Flamengo e de 70 % em caso contrrio. Um pnalti a
favor do Brasil acabou de ser marcado:
31) Marina quer enviar uma carta a Vernica. A probabilidade de que Marina
escreva a carta de 8/10. A probabilidade de que o correio no perca de
9/10. A probabilidade de que o carteiro entregue de 9/10. Dado que
Vernica no recebeu a carta, qual a probabilidade condicional de que
Marina no a tenha escrito?
33) Num exame h 3 respostas para cada pergunta e apenas uma delas certa.
Portanto, para cada pergunta, um aluno tem probabilidade de 1/3 de
escolher a resposta certa se ele est adivinhando e 1 se sabe a resposta.
Um estudante sabe 30 % das respostas do exame. Se ele deu a resposta
correta para uma das perguntas, qual a probabilidade de que a adivinhou?
2
3
1 4 5 B
A
87
Se todos os rels funcionam independentemente, qual a probabilidade de que
haja corrente circulando entre os terminais A e B?
37) Uma moeda jogada 6 vezes. Sabendo-se que no primeiro lanamento deu
coroa, calcular a probabilidade condicional de que o nmero de caras nos 6
lanamentos supere o nmero de coroas.
38) Uma moeda jogada 4 vezes. Sabendo que o primeiro resultado foi cara,
calcular a probabilidade condicional de obter pelo menos 2 caras.
P ( A) = 1 / 4 e P(A B) = 1/3
Calcule P(B)
88
Verifique que A e B so independentes
A e B so independentes? e A e C? e B e C? e A, B e C?
46) Uma pessoa com um molho de n chaves tenta abrir uma porta. Apenas uma
das chaves consegue abrir a porta. Qual a probabilidade dela s conseguir
abrir a porta na k-sima tentativa:
a) supondo que aps cada tentativa mal sucedida ela descarta a chave usada;
b) supondo que ela no faz isso.
51) A lana uma moeda n+ 1 vezes e B lana a mesma moeda n vezes. Qual
a probabilidade de A obter mais caras que B?
52) Quantas pessoas voc deve entrevistar para ter probabilidade igual ou
superior a 0,5 de encontrar pelo menos uma que aniversarie hoje?
89
54) Em uma cidade com n+ 1 habitantes, uma pessoa conta um boato para
outra pessoa, a qual por sua vez conta para uma terceira pessoa, etc.
Calcule a probabilidade do boato ser contado m vezes:
55) Sacam-se, com reposio, n (n > 1) bolas de uma urna que contem 9 bolas
numeradas de 1 a 9. Qual a probabilidade do produto dos nmeros das n
bolas extradas ser divisvel por 10?
57) Um jri de 3 pessoas tem dois jurados que decidem corretamente (cada um)
com probabilidade p e um terceiro jurado que decide por cara ou coroa. As
decises so tomadas por maioria. Outro jri tem probabilidade p de tomar
uma deciso correta. Qual dos jris tem maior probabilidade de acerto?
90
Pede-se ao entrevistado que jogue uma moeda, longe das vistas do
entrevistador, e que se o resultado for cara, responda primeira pergunta e, se
for coroa, responda segunda pergunta.
61) Uma firma fabrica chips de computador. Em um lote de 1000 chips, uma
amostra de 10 chips revelou 1 chip defeituoso. Supondo que no lote
houvesse k chips defeituosos:
91
69) Suponha que uma caracterstica (como a cor dos olhos, por exemplo)
dependa de um par de genes. Representemos por A um gen dominante e
por a um gen recessivo. Assim um indivduo com genes AA dominante
puro, um com genes aa um recessivo puro e um com genes Aa um
hbrido. Dominantes puros e hbridos so semelhantes em relao
caracterstica. Filhos recebem um gen do pai e um da me. Suponha que
pai e me sejam hbridos e tenham 4 filhos.
a) Qual a probabilidade do primeiro filho ser um recessivo puro?
b) Qual a probabilidade de exatamente um dos 4 filhos ser um recessivo puro?
72) Uma moeda tem probabilidade 0,4 de dar cara. Lanando-a 12 vezes qual o
mais provvel valor do nmero de caras obtidas?
T 0 1 2
P(T=t) 0,5 0,3 0,2
74) Suponha que voc escolha uma bola de uma urna contendo 7 bolas
vermelhas, 6 bolas brancas , 5 bolas azuis e 4 bolas brancas. Qual a
probabilidade de que voc escolha uma bola vermelha?
75) Suponha que voc escolha uma bola aleatoriamente de uma urna 7 bolas
vermelhas, 6 bolas brancas, 5 bolas azuis e 4 bolas amarelas. Qual a
probabilidade de que voc escolha uma bola branca?
92
76) Um dado no viciado jogado duas vezes. Ache a probabilidade de sair um
5 ou 6 no primeiro lance e um 1, 2 ou 3 no segundo lance.
79) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis.
Determine a probabilidade de que elas sejam escolhidas na ordem azul,
branca e vermelha dado que cada bola recolocada na urna depois de
escolhida.
80) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis.
Determine a probabilidade de que elas sejam escolhidas na ordem azul,
branca e vermelha dado que cada bola no recolocada na urna depois
que ela escolhida.
82) Voc tem 6 bolas, cada uma de cor diferente. De quantas maneiras distintas
voc pode dispo-las em uma fila?
93
89) De quantas maneiras pode um comit de 6 pode ser escolhido de 10
pessoas?
10;
200;
(a) independentes
94
96) Suponha que certa caracterstica oftalmolgica associada com a cor dos
olhos. 300 indivduos selecionados aleatoriamente so estudados e
apresentam os seguintes resultados:
Sim 70 30 20 120
No 20 110 50 180
95
Mdia 74 51 90 35 250
b. 300/500 e. 800/1000
c. 300/1000
a. 1/3
b. 0,25
c. 0,24
d. 0,08
Doena Totais
Exposio Presente Ausente
96
c. Calcule a probabilidade de doena estar presente condicionada a
presena de exposio e condicionada a ausncia de exposio.
(c) 2/5
102) Uma amostra de 2000 indivduos distribuda de acordo com a cor de olho
e a presena ou ausncia de uma certa caracterstica oftalmolgica como
segue:
97
e. a pessoa no tem olhos castanhos? _______________
f. a pessoa tem olhos azuis ou nem no tem olhos azuis nem olhos
castanhos? __________
g. a pessoa no tem a caracterstica ou no tem olhos castanhos?
________
a. 1/2
b. 1/3
c. 4/15
d. 2/15
e. nenhuma das anteriores.
104) Entre vinte e cinco artigos, nove so defeituosos, seis tem somente um
defeito no importante e trs tm um defeito importante. Determine a
probabilidade de que um artigo selecionado ao acaso tenha defeitos
importantes dado que ele tenha defeitos.
a. 1/3
b. 0,25
c. 0,24
d. 0,08
Sexo
Idade | Homem | Mulher
-----------------------------------------------
30 ou menos | 800 | 600
31 ou mais | 400 | 200
-----------------------------------------------
98
ii) Ento P[homem ou (31 ou mais)] =
a) 1/5 b) 3/10 c) 1/2 d) 7/10 e) nenhuma das anteriores
B 5 10 15 20 25
P(B = b) 0,25 0,30 0,25 0,15 0,05
99
custar a Beta US$ 250 em custos de reparo. Se o fornecedor est certo,
qual ser o nmero esperado de componentes defeituosos ? E qual o
custo esperado de reparo?
110) Um processo de produo paralisado para ajuste toda vez que uma
amostra aleatria de cinco itens, selecionada com reposio, apresenta
dois ou mais defeituosos. Ache a probabilidade de que o processo ser
paralisado aps uma inspeo se ele est produzindo:
a) 20 % de defeituosos
b) 10 % de defeituosos
c) 5 % de defeituosos
100
4. Variveis Aleatrias Discretas
Objetivos do Captulo:
101
Exemplo 1: Considere um experimento aleatrio no qual uma moeda jogada 3
vezes. Seja X o nmero de caras. Seja H o resultado cara e T o resultado coroa.
TTT 0
TTH 1
THT 1
THH 2
HTT 1
HTH 2
HHT 2
HHH 3
102
Espao Amostral X = Nmero de Caras
103
Nmero de Probabilidade
Caras
0 1/8 = 0,125
1 3/8 = 0,375
2 3/8 = 0,375
3 1/8 = 0,125
Total 8/8 = 1
probabilidade
3/8
1/8
0 1 2 3
Nmero de
caras
104
VARIVEL ALEATRIA DISCRETA
Definio: Uma varivel aleatria discreta uma varivel que pode assumir
somente certos valores claramente separados (em descontinuidade)
resultantes, por exemplo, de uma contagem de algum item de interesse.
105
A mdia de uma distribuio de probabilidade discreta determinada pela
frmula:
m = E ( X ) = [ X .P ( X )]
onde m (letra grega, mi) representa a mdia (ou valor esperado) e P(X) a
s 2 = [(X - m)2 P( X )]
O desvio padro :
s = s2
Exemplo 2
Uma empresa especializa-se no aluguel de carros para famlias que necessitam
de um carro adicional para um perodo curto de tempo. O presidente da
empresa tem estudado seus registros para as ltimas 20 semanas e apresentou
os seguintes nmeros de carros alugados por semana.
106
Nmero de Semanas
Carros alugados
10 5
11 6
12 7
13 2
Nmero de Probabilidade
carros alugados P(X)
10 0,25
11 0,30
12 0,35
13 0,10
Total 1,00
A mdia
m = E ( X ) = [ X .P( X )] = (10) (0,25) + (11) (0,30)
+ (12) (0,35) + (13) (0,10) = 11,3
107
A varincia
s 2 = [( X - m ) 2 .P ( X )] =
(10 - 11,3) 2 0,25 + (11 - 11,3) 2 0,30 + ... + (13 - 11,3) 2 0,10 = 0,91
Clculo de E(X)
Clculo de s2
s = 0,9135 = 0,9558
108
4.3 A Distribuio de Probabilidade Binomial
n!
P( X = r ) = p qr n-r
r!(n - r )!
onde n! lido como n fatorial. Por exemplo, 4! = (4).(3).(2).(1)=24.
0! igual a 1, por definio e 1! = 1.
Exemplo 3
109
O Departamento de Estatstica do Trabalho de um municpio estimou que 20 %
da fora de trabalho est desempregada. Uma amostra de 14 trabalhadores
obtida deste municpio. Calcule as seguintes probabilidades:
14!
P ( X 1) = 1 - P ( X = 0) = 1 - 0,2 0 0,814 - 0 = 0,956
0!(14 - 0)!
No mximo dois dos trabalhadores esto desempregados.
Exemplo 4
110
- H uma probalidade constante de sucesso (0,05)
- H um nmero fixo de tentativas (6)
- As tentativas so independentes (Porque?)
- H somente dois possveis resultados (um rolamento defeituoso ou no
defeituoso).
111
Nota: Como os procedimentos de clculo tornam-se repetitivos (e montonos)
faremos a seguir uma simulao no computador para diversos valores dos
parmetros n e p de uma distribuio binomial.
m = np
s 2 = np (1 - p )
112
Qual a probabilidade de que exatamente 6 destas pontes necessitem de
reparos? Esta situao (deste exemplo) satisfaz as condies para uma
distribuio binomial ? Porque?
Verificar:
Apndice 1 (Recordao)
113
Distribuio de probabilidade de um v.a. Discreta.
p =1
k
i
i =1
Apendice 2 (Recordao)
Uma varivel aleatria discreta uma varivel aleatria que toma valores
discretos com probabilidades especificadas.
114
Exemplo - tentativas de Bernoulli
x 0 1
P(X = x) p 1-p
115
Apndice 3 (Recordao)
A distribuio Binomial
n
onde n o nmero de
x
facilmente calculado usando o coeficiente binomial
n
O coeficiente binomial (leia-se como "binomial de x em n") definido como
x
n n!
=
x x!(n - x )!
5 5! 5.4.3.2.1
Neste exemplo, = = = 10, portanto
3
3!2! (3.2.1)(2.1)
h 10 maneiras distintas de se obter 3 sucessos em 5 tentativas, com cada arranjo
tendo uma probabilidade p 3 (1 - p) 2
116
Seja X a V.A. igual ao nmero total de sucessos em n tentativas .
Para calcular a probabilidade de obter x sucessos, pode ser mostrado que
n
P ( X = x) = px (1 - p) n - x
x
Assuma que cada jogo uma tentativa Bernoulli com prob(ganhar) = 0,5
Ento X tem distribuio binomial com n=3 e p=0,5, com resultado vitria (W) ou
derrota (L) em cada tentativa.
(Isto abreviado como X ~ B(3;0,5))
Qual a probabilidade de que o time ganhe 2 jogos exatamente?
P(X=2) = P(WWL) + P(WLW) + P(LWW)
= 3/8 (desenhe um diagrama de rvore)
ou usando a frmula para probabilidades binomiais, a prob(WWL) = p2(1-p) e o
3 3!
nmero de distintos arranjos de 2 vitrias em trs jogos = = 3.
2
2!1!
117
Portanto a resposta 3p2(1-p). Assim
3
P ( X = 2) = (0,5) 2 (1 - 0,5) 1 usando n = 3, x = 2, p = 0,5
2
3
=
8
As distribuies binomiais so usadas para modelar situaes que podem ser
pensadas como tentativas repetidas e " independentes " cada uma com
somente 2 possveis resultados. Ns os usaremos posteriormente para fazer
inferncias estatsticas sobre propores.
10
P ( X = 2) = (0,05) 2 (0,95) 8 = 0,0746
2
(i)
10 10
P ( X 2) = (0,05) x (0,95) 10 - x o que muito
x=2 x
(ii) P(rejeitar o lote) =
trabalhoso de calcular. Mas:
P ( X 2) = 1 - P ( X < 2) = 1 - P ( X = 0 ou X = 1)
= 1 - [P(X = 0) + P(X = 1)] mutuamente exclusivos
10 10
= 1 - [ (0,05) 0 (0,95) 10 + (0,05) 1 (0,95) 9 ]
0 1
= 0,0862
118
Apndice 4 (recordao)
119
Valor
esperado
Vende agora
125 K $ 125 K
Preos do
petrleo sobem
0,6
Vende $ 300 K
depois 300 x 0,6 +
Deciso Preos do 100 x 0,4 =
petrleo caem $ 220 K
0,4 $ 100 K
Seco
$0 200 K
0,5
Pouco petrleo
Perfura 0,4 -200 x 0,5
+ 200 x 0,4
$400 200 K + 1300 x 0,1
= $ 110 K
0,1
Jorro
$1500-200 K
120
Se a distribuio de probabilidade de uma varivel aleatria X
Valores de X x1 x2 ... xk
Probabilidades p1 p2 ... pk
seu valor esperado
E ( X ) = x p + x p + ... + x p = x p
K
1 1 2 2 K K i i
i =1
= Receita - $200K
121
Varincia de uma Varivel Aleatria
(x - x)
n
2
s =
2 i
i =1
n -1
i =1
122
x 0 1 2 3 4 5
P(X=x) 1/32 5/32 10/32 10/32 5/32 1/32
(Confira isto usando a frmula para probabilidades binomiais e desenhe um
diagrama de rvore para analisar a estrutura dos resultados.)
1 5 10 10
E ( X ) = xp( x) = 0 + 1 + 2 + 3
32 32 32 32
5 1 80
+ 4 + 5 = = 2,5 = m
32 32 32
1 1
var( X ) = x 2 p ( x) - m 2 = 0 2 + ... + 5 2 - (2,5) 2
32 32
= 7,5 - (2,5) 2
= 1,25
Portanto, s = var( X ) = 1,25 = 1,12
onde q = 1 - p
EMPRICO TERICO
123
(baseado nos dados) (MATEMTICO)
QUANTIDADE QUANTIDADE
fi
(a) Freqncia relativa n
f quando
PROB[X = xi] = pi
xi = i
n n0
fi
p
n
(b) =1
n
i
=1
i i =1
quando
n
( xi - x) 2 p i
i i
i =1 n -1 ii =1 n
Se Y = aX + b
onde X uma varivel aleatria e a e b so valores constantes conhecidos,
ento,
E(Y) = a E(X) + b
var(Y ) = a 2 var( X )
Portanto, s Y = a 2 var( X ) = a 2s x2 = as X
124
Semelhantemente se T = a X + b Y + c onde X e Y so variveis aleatrias e a,
b e c so constantes conhecidas, ento,
Consequentemente E(X) = 1000 x 0.1 + 3000 x 0.3 + 5000 x 0.4 + 10000 x 0.2
125
Consequentemente o lucro total
T = 2000 X + 3500 Y
= $11,540,000
T = X - Y.
= E(X) - E(Y)
126
Lembremos que dois eventos A e B so independentes se e somente se P(A e
B) = P(A)P(B) se a probabilidade da interseo de A e B o produto das
probabilidades de A e de B. Podemos relacionar variveis aleatrias a eventos,
ou seja, podemos definir eventos em termos de valor(es) que uma varivel
aleatria assume. Por exemplo, o evento A = {a < X b) ocorre se X maior do
que a e menor do que b. Duas variveis aleatrias, X e Y, so independentes
se e somente se todo evento da forma {a < X b} independente de todo
evento da forma {c < Y d}. Duas variveis aleatrias so independentes se
conhecendo o valor de uma no ajuda a predizer o valor da outra.
127
exemplo acima mostram porque existe a necessidade das seqncias serem
no sobrepostas (ou seja, no tenham interseco).
128
5. Variveis Aleatrias Contnuas e Distribuio
Normal
f(X)
1/10
5 15 X
Observe que f(X) uma funo constante assumindo sempre o valor 1/10 no
intervalo fechado 5 X 10 . Essa funo goza das seguintes propriedades:
5 5 10 10
129
Toda funo que satisfizer essas duas propriedades chamaremos de funo
densidade de probabilidade. Essa funo apenas um instrumento matemtico
para que possamos calcular probabilidades para variveis aleatrias contnuas
(assim como utilizamos a funo distribuio de probabilidade para as variveis
aleatrias discretas). Por exemplo, para o exemplo acima, se quisermos calcular
a probabilidade da varivel aleatria contnua X estar contida no intervalo
10 X 12 ser:
12 12
12 10
P(10 X 12) = f ( X ) dx = (1 / 10)dx = [ x / 10]1210 = - = 2 / 10
10 10 10 10
Dessa forma, podemos calcular a probabilidade para qualquer intervalo sendo
esta probabilidade o valor da integral definida da funo densidade de
probabilidade sendo que os limites de integrao so as extremidades do
intervalo. De uma forma geral, podemos dizer que se f(X) a funo densidade
de probabilidade de uma varivel aleatria contnua, ento:
b
P (a X b) = f ( X )dx
a
A mdia (ou valor esperado) de uma varivel aleatria contnua dada pela
expresso:
+
E[ X ] = Xf ( X )dx
-
130
15
+ 15
x2
E[ X ] = Xf ( X )dx = X (1 / 10)dx = =
- 5 20 5
225 25
- = 10
20 20
A varincia de uma varivel aleatria contnua dada pela expresso:
+
V[X ] = ( X - E[ X ]) f ( X ) dx
2
- 5
15
15
X2 X3
5 10 - 2 X + 10)dx =
(
30
- X 2 + 10 X = 8,333
5
131
Figura 2 Duas Distribuies Normais com mesma mdia mas distintos desvios
padres
Podemos tambm ter distribuies normais com o mesmo desvio padro mas
com distintas mdias ou com mdias e desvios padres distintos. Na realidade a
distribuio normal um nome genrico para definir uma famlia de infinitas
distribuies normais particulares, cada uma com os seus valores especficos de
mdia e desvio padro. O que caracteriza, portanto, e diferencia uma
distribuio normal de outra so os valores destes dois parmetros: a sua mdia
e o seu desvio padro. A funo densidade de probabilidade de uma varivel
aleatria normal dada por:
132
-( X - m ) 2
1
f (X ) = e 2s 2
2ps 2
seu segundo parmetro (da equao acima) s. O que quer dizer que se
aplicarmos as definies de valor esperado e de varincia de uma varivel
aleatria contnua a expresso acima chegaremos aos resultados m e s2. O
problema recamos em integrais mais difceis de serem resolvidas:
-( X - m ) 2
1
+ +
E[ X ] = Xf ( X )dx = X
- - 2ps 2
e 2s 2
dx = m
e
-( X - m ) 2
1
+ +
V[X ] = ( X - E[ X ]) f ( X )dx = ( X - m) e dx = s 2
2 2 2s 2
- - 2ps 2
133
distribuio tem as caractersticas de ser uma distribuio normal com mdia
(valor esperado) igual a zero e desvio padro igual a 1. Em notao matemtica
dizemos que:
Z ~ N(0,1)
X -m
Z=
s
Para que serve essa distribuio Z? Nada melhor que um exemplo para explicar
isso.
X - m 2200 - 2000
Para X = 2200 Z = = =1
s 200
X - m 1700 - 2000
Para X = 1700 Z = = = -1,5
s 200
134
5.5 reas Abaixo da Curva Normal
Exemplo 2:
O uso dirio de gua por pessoa em uma determinada cidade normalmente
distribudo com mdia m igual a 20 litros e desvio padro s igual a 5 litros. O
uso dirio de cerca de 68 % das pessoas nesta cidade caem entre que valores?
135
Qual a probabilidade de que uma pessoa selecionada ao acaso usar menos
do que 20 litros por dia ?
O valor de Z Z = (20 20) / 5 = 0. Portanto P(X < 20) = P(Z < 0) = 0,5.
O valor de Z Z = (20 20) / 5 = 0. Portanto P(X > 20) = P(Z > 0) = 0,5.
X = 20 Z=0
136
24 - 20
X = 24 Z= = 0,8
5
P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).
16 - 20
X = 16 Z= = -0,8
5
X = 20 Z=0
P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P(0 < Z < 0,8) = 0,2881 = 28,81
137
Tabela 1 Valor de P(0 < Z < Z0) onde Z varivel normal padro
Z0 Segunda decimal de Z0
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
138
2,4 0,4918 0,4920 0,4922 0,4934 0,4936
Qual a probabilidade de que uma pessoa selecionada ao acaso use mias do que 28
litros ?
X = 28 Z = (28 20 )/ 5 = 1,6
139
Qual a porcentagem entre 18 e 26 litros ?
18 - 20
X = 18 Z = = -0,4
5
26 - 20
X = 26 Z = = 1,2
5
P(18 < X < 26) = P(-0,4 < Z < 1,2) = 0,1554 + 0,3849 = 0,5403
140
da tabela o valor de Z0 que deixa uma rea entre 0 e Z0 igual a (0,5 0,1) = 0,4.
O valor correspondente de Z0 1,28 (aproximadamente). Portanto, temos:
X '-20
= 1,28 X = 26,4. Ou seja, 10 % da populao usa no mnimo 26,4
5
litros por dia (ver figura).
Exemplo 4
X '-72
= 1,04 X' = 77,2
5
141
6. Mtodos de Amostragem e Distribuies
Amostrais
OBJETIVOS DO CAPTULO:
142
Explicar o Teorema do Limite Central e sua importncia para a Inferncia
Estatstica
Calcular Intervalos de Confiana para Mdias e Propores
Determinar que tamanho uma amostra deve ter para estimar mdias e
propores
143
Uma amostra escolhida de tal forma que cada item ou pessoa na populao tem
a mesma probabilidade de ser includa.
Se a populao tem um tamanho N, cada pessoa desta populao tem a
mesma probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela
de nmeros aleatrios para sortear (com mesma probabilidade) os elementos da
amostra. Tambm pode ser utilizada uma funo randmica: No Excel, por
exemplo, temos a funo ALEATRIO ENTRE.
Ni
ni = n i=1,2,....,
k
N
144
amostragem aleatria estratificada com repartio proporcional mais precisa
(menor varincia do estimador) do que a amostragem aleatria simples (AAS).
wis i Nis i
ni = n = n
Ws N s
k k
i i i i
i =1 i =1
145
Uma distribuio de probabilidade consiste de uma lista de todos os
possveis valores das mdias amostrais de um dado tamanho amostral
constante selecionado da populao e a probabilidade de ocorrncia
associada a cada mdia amostral.
5!
5C2 = = 10
( 2! )( 3! )
146
24 4 4/10
26 3 3/10
28 2 2/10
A mdia da populao :
22 + 26 + 30 + 26 + 22
m= = 25,2
5
147
Note que o erro padro das mdias amostrais mostra quo prximo da
mdia da populao a mdia amostral tende a ser.
sX
sX =
n
sX o smbolo para o erro padro das mdias amostrais
s
sX =
n
n
(Xi - X )
2
s= i =1
n -1
onde
148
6.4 Estimativa de Intervalo
s
X 1,96
n
O IC de 99 % para a mdia populacional m dado por:
s
X 2,58
n
Em geral, um intervalo de confiana para a mdia, calculado por:
s
X Z
n
onde Z obtido da tabela de distribuio normal padro.
Exemplo 2
149
A estimativa de ponto do nmero mdio de horas trabalhadas por semana 24
horas (mdia amostral).
Interprete os resultados
p Zs p
onde:
p a proporo amostral
p (1 - p )
sp =
n
O intervalo de confiana construdo por:
150
p (1 - p )
p Z
n
onde:
p a proporo amostral
Z o valor da varivel normal padro para o grau de confiana adotado.
n o tamanho amostral
Exemplo 3
p = 175 = 0,35
500
Aqui n = 500,
(0,35) (0,65)
O CI de 98 % 0,35 2,33 ou 0,35 0,0497
500
Interprete a resposta
151
p (1 - p ) N - n
sp =
n N -1
Exemplo 4
n 49
Agora = = 0,098 > 0,05 . Portanto, temos que usar o
N 500
FCPF
4 500 - 49
24 1,96 = [22,93 ; 25,11]
49 500 - 1
2
Zs
n=
E
onde:
152
E o erro permissvel
Exemplo 5
(2,58) (20 )
2
n= = 106,50 @ 107
5
2
Z
n = p (1 - p )
E
onde
Exemplo 6
153
populacional, quantas crianas devem conter a amostra? Assuma um
intervalo de confiana de 95 % e que o clube estimou, com base em
experincia anterior, que aproximadamente 30 % das crianas tm um
cachorro.
2
1,96
n = (0,30 )(0,70 ) = 893,4 @ 893
0,03
OBJETIVOS:
Nota:
154
Exemplos de hipteses, ou sentenas, feitas acerca de um parmetro
populacional so:
A renda mdia mensal proveniente de todas as fontes para os analistas de
sistemas de US 3625
Vinte por cento de todos os transgressores juvenis so presos e
sentenciados a priso.
Erro Tipo II: Aceitar a Hiptese Nula, H0, quando efetivamente falsa. A
probabilidade do erro tipo II igual a b (beta)
155
Tipos de Erros
Aceita H0 Rejeita H0
H0 verdadeira Deciso Correta Erro Tipo I
H0 falsa Erro Tipo II Deciso Correta
Valor Crtico (ou z crtico ou valor de t): O ponto divisor entre a regio onde a
hiptese nula rejeitada e a regio onde ela no rejeitada. Este valor
obtido a partir da tabela de z (normal padro) ou da tabela de t (t de
Student).
H0: A renda mdia das mulheres menor que ou igual a renda mdia dos
homens.
H1: A renda mdia das mulheres maior que a renda mdia dos homens.
156
7.2 Testes de Significncia Bicaudais
H0: A renda mdia das mulheres igual a renda mdia dos homens.
H1: A renda mdia das mulheres no igual a renda mdia dos homens.
X - m
z =
s
n
Exemplo 1
157
Ao nvel de significncia de 0,05 podemos concluir que o processo est fora
de controle?
H0 : m =16 H1 : m 16
Passo 2: Estabelecer a regra de deciso:
158
7.4 Clculo do P-value
Para o exemplo anterior, z = 1,44, e desde que era um teste bicaudal, ento o
p-value = 2 P{z 1,44} = 2(0,5 - 0,4251) = 0,1498 . Desde que 0,1498 > 0,05, no
rejeitada H0.
Quanto maior for o tamanho amostral for n 30, o z efetivo pode ser
aproximado com
X -m
z=
s
n
Exemplo 2
159
mdia populacional maior que US$ 400, ou razovel assumir que a
diferena de US$ 7 (US$ 407 US$ 400 devido a chance (variao
aleatria)?
H0 :m400 H1 :m>400
Etapa 2: Estabelea a regra de deciso.
407 - 400
z= = 2,42
38
172
160
X1 - X 2
z =
s 12 s 22
+
n1 n2
X1 - X 2
z =
s12 s 22
+
n1 n2
Exemplo 3
161
Calcule o valor da estatstica de teste (valor de z efetivo):
30 , 4 - 25 , 6
z = = 6 ,80
3, 6
2
2 .9 2
+
45 40
H0 : m 2 m1
Precisamos trocar as posies das variveis na equao do z efetivo (a seguinte
equao).
X - X
z = 1 2
s 12 s 22
+
n1 n2
Z efetivo
Desde que o Z efetivo = 6,80 > Z crtico = 2,33, H0 rejeitada. Aqueles que se
aposentaram no ltimo ano tiveram mais anos de servio.
162
nmero de sucessos na amostra
p=
tamanho da amostra
p - p
z =
p (1 - p )
n
p proporo populacional
p proporo amostral
Exemplo 4
163
Calcule o valor da estatstica de teste ( valor do Z efetivo):
45
- 0 ,15
z= 200 = 2 ,97
( 0,15 )( 0 ,85 )
200
Desde que o z efetivo = 2,97 > z crtico (1,645), H0 rejeitada. A nova carta
mais efetiva.
p1 - p 2
z=
pc (1 - pc ) pc (1 - pc )
+
n1 n2
164
X2 o nmero de sucessos em n2.
Exemplo 5
H 0 : p2 p1 H1 : p2 > p1
onde o subscrito 2 refere-se a populao dos trabalhadores solteiros.
22 + 35
pc = = 0,1036
250 + 300
22 35
-
Z= 250 300 = 1,10
0,1036(1 - 0,1036) 0,1036(1 - 0,1036)
+
300 250
165
H0 rejeitada. No h diferena na proporo de ausncias para trabalhadores
casados e solteiros.
Qual o p-value?
Exerccios :
(incluem recordao de tpicos anteriores)
166
f. Calcule Pr(R3 ou P2), usando a regra geral da adio de probabilidade,
isto , Pr(A ou B) = Pr(A) + Pr(B) - Pr (A e B).
g. Ache Pr(R3 | P2).
h. Calcule Pr(P1) e Pr(P1 | R4).
i. So os eventos P1 e R4 independentes? Explique sua resposta.
So os eventos P1 e R4 mutuamente exclusivos? Explique sua
resposta.
x p(x)
0 0,304
167
1 0,228
2 0,171
3 0,128
4 0,096
5 0,073
168
1. tamanho amostral n = 2.
2. mtodo de amostragem: amostragem aleatria simples com reposio
Para a distribuio amostral deduzida de X , verifique por demonstrao que
a. E( X ) = m
b. V( X ) = s2 /n
c. Se a amostragem for sem reposio deduza a distribuio de X e demonstre
que E( X ) = m e V( X ) = s [
n
( N - n) / ( N - 1) ]
d. Se a amostragem fosse realizada com reposio, qual o valor de V( X )?
11. Uma populao consta de 4 nmeros: 3, 7, 11 e 15. Considerar todas as
amostras possveis que podem ser retiradas com reposio. Determinar: a) a
mdia populacional; b) o desvio padro da populao; c) a mdia da
distribuio amostral das mdias; d) o desvio padro da distribuio amostral
das mdias. Verificar (c) e (d) diretamente e por meio de (a) e (b) atravs
das frmulas apropriadas.
12. Certas vlvulas fabricadas por uma companhia tm uma vida mdia de 800
horas e desvio padro de 60 horas. Determinar a probabilidade de uma
amostra aleatria de 16 vlvulas, retiradas do grupo, ter a vida mdia: (a)
entre 790 e 810 horas; (b) inferior a 785 horas. Para realizar esses clculos,
o que necessrio supor? Explique a razo de sua afirmativa.
(X
n
i - X )2
15. Questo terica. Demonstre que s 2 = um estimador viesado
i =1
(X
N
i - m)2
para a varincia populacional s 2 = , onde n o tamanho da
i =1
N
amostra e N o tamanho da populao. Calcule o valor do vis. O que
ocorre com esse valor quando n tende ao infinito. (Lembrar que um
estimador Q de um parmetro Q dito no viesado se E[ Q ] = Q
169
16. Questo terica
t | 0 1 2
----------------------
P(T = t) | .5 .3 .2
19. Uma centena de estudantes realizou um teste no qual o escore mdio foi de
73 com uma varincia de 64. Um grau A foi dado para quem obteve um
escore de 85 ou mais. Quantos As foram obtidos aproximadamente,
assumindo que os escores So normalmente distribudos? (escolha o mais
prximo)
170
1. 42
2. 7
3. 58
4. 5
5. 22
20. Se uma distribuio normal tem mdia 200 e desvio padro 20, ache K tal
que a probabilidade de que um valor amostral seja menor do que K 0,975.
a. 560
b. 330
c. 1044
d. 1440
e. nenhuma das anteriores
1) 0,025
2) 0,05
3) 0,0745
4) 0,0495
5) Nenhuma das anteriores
25. Em uma distribuio normal com mdia 3 e varincia 49, quais so o limite
superior e inferior para os 50 % dos dados centrais?
171
a. -29,83 e 35,83
b. -1,31 e 7,69
c. -1,69 e 7,69
d. 3,00 e 24,00
e. nenhuma das anteriores
a. 25
b. 1,25
c. 1,25
d. +2,5
e. nenhuma das anteriores
28. Uma companhia fabrica cilindros que tem uma mdia de 2 polegadas de
dimetro. O desvio padro dos dimetros dos cilindros de 10 polegadas.
Os dimetros de uma amostra de 4 cilindros so medidos todas as horas. A
mdia amostral usada para decidir se o processo de fabricao est
operando satisfatoriamente ou no. A seguinte regra de deciso aplicada:
se dimetro mdio da amostra de 4 cilindros maior ou igual a 2,15
polegadas, ou menor ou igual a 1,85 polegadas, interrompe-se o processo.
29. Qual (ou quais) das seguintes sentenas descreve inferncia estatstica ?
172
a. uma sentena verdadeira sobre uma populao feita atravs de uma
informao amostral de uma populao
b. uma conjectura acerca de uma populao feita a partir da informao contida
em uma amostra daquela populao
c. uma sentena verdadeira acerca de uma amostra feita a partir da informao
contida em uma populao.
a. n grande o bastante
b. a populao grande
c. a populao simtrica
d. a mdia de cada amostra igual a mdia da populao
e. nenhuma das anteriores correta
33. Em um estudo sobre que relao existente entre uma atitude de criana e a
idade na qual ela fala primeiro, os pesquisadores registraram a idade (em
meses) da primeira fala da criana e o nmero de pontos (escore) obtido
173
pela criana em um teste sobre a atitude. Seguem-se os dados para 21
crianas:
criana 1 2 3 4 5 6 7 8 9 10 11
Idade 15 2 10 9 15 20 18 11 8 20 7
Escore 95 71 83 91 102 87 93 100 104 94 113
Criana 12 13 14 15 16 17 18 19 20 21
Idade 9 10 11 11 10 12 42 17 11 10
Escore 96 83 84 102 100 105 57 121 86 100
174
35. No execute nenhum clculo para responder o seguinte. Explique seu
raciocnio em cada caso.
175
37. A seguinte tabela lista a temperatura mdia mensal e minha conta de
eletricidade para aquele ms.
ms temp conta ms temp Conta
Abr-91 51 $41.69 Jun-92 66 $40.89
Mai-91 61 $42.64 Jul-92 72 $40.89
Jun-91 74 $36.62 Ago-92 72 $41.39
Jul-91 77 $40.70 Set-92 70 $38.31
Ago-91 78 $38.49 Out-92 * *
Set-91 74 $37.88 Nov-92 45 $43.82
Out-91 59 $35.94 Dez-92 39 $44.41
Nov-91 48 $39.34 Jan-93 35 $46.24
Dez-91 44 $49.66 Fev-93 * *
Jan-92 34 $55.49 Mar-93 30 $50.80
Fev-92 32 $47.81 Abr-93 49 $47.64
Mar-92 41 $44.43 Mai-93 * *
Abr-92 43 $48.87 Jun-93 68 $38.70
Mai-92 57 $39.48 Jul-93 78 $47.47
176