Escolar Documentos
Profissional Documentos
Cultura Documentos
iru;t
I )t,: l'Rr lttAtn,n)AI)E
[tlolrrrlrilirlirtlc c rt l,stlrtslit it, It'ttrlrr
s'l'rt rA si<[o llirlrot'ir<[l ;rirtir irlrrtros rlrrs r'rrcirs
e no a habilidade computacional.
trpyrlglrt O hy Mulcos Nascinrcnlo Magalhcs c Arrtonio Carlos l)ctltoso clc Lima Prefcio da 6s edio
l" r'rlio 1999 (lMli-tJSP)
J'' r'rlt1'rlo 2(XX)( lMll-l.JSl') Bste texto fruto da nossa experincia de vrios anos como professores cl
.1" crlilio 2(X) I (lMli-tJSP) Departamento de Estatstica do Instituto de Matenttica e Estatstica eln
,1" crliro 2(X)2 (lJclusp)
Unversidade de So Paulo. Nesse perodo, foram ministradas diversas disciplinns
.1" crliro 2{X}2 (Ddusp)
(rn ctlilo 2(X)4 (liclusp) lrrsicas de Estatstica para cursos nas reas de Cincias Humanas, Exatns e
Biolgicas.
Buscamos enfatizar dois aspectos neste livro. O primeiro se refere $
l )utkrs lnlct nacionais dc Catalogao na Publicao (CIP)
(('inrala Ilrasileira do Livro, SP, Brasil) rcpartir a Estatstica Descritiva ao longo do texto, suavizando, assim, a transiilo
pari Probabilidade e Variveis Aleatrias. Em geral, os alunos sentem o impacto
Mttgrt lhilt's, Mitt cos Nascinrento
<le uma maior formalizao e, muitas vezes, no conseguem estabelecer o elo clc
Nuiics rlc I'robabilidade c Estatstica / Marcos Nascimento
Mngllhitcs, nlonio Carlos Pcclroso cle Liml - ed. - So Paulo: ligao entre essas partes. Um segundo interesse transmitir a importncia dn
Jltlilurl tlu IJrtive lsichclc de So Paulo, 2004. - (Acadmica; 40) colrputao na Estatstica. No atrelamos o texto a nenhum softvvare espec:ico,
lllhliogr';r li,rt permitindo que o conhecimento computacional anterior dos estudantes pudesse ser
tstN t5-3 I 4-077-3 incorporado, minimizando o desgaste de um novo aprendizado. Ressaltamos qUe
L listltsticl - llstuclo e Ensino 2. Matemtica - Estudo e vrios software disponveis no mercado podem ser utilizados. Os arquivos
lirrsirur 3. loltabiliclaclcs - Estudo e Ensino I. Ttulo IL Srie. mencionados no decorrer do livro esto disponveis em www.ime.usp.br/-noproest
t,1 0.171 cDD-5 t 9.507 juntamente com outras informaes de interesse'
ndicos para catlogo sistemtico: O livro contm exerccios ao final de sees e captulos. Os exerccios de
l, l1\lirlslicl: Matcnriitica: Estudo e Ensino 519.507 seo so mais diretos e visam a aplicao imediata dos conceitos discutidos. Ao
2, lolrlhilitlrtilcs c Estatstica: Materntica: fim de cada captulo, um considervel nmero de exerccios ajuda os estudante$ nll
lisluclo c Errsino 519.507
fixao global das idias apresentadas. Tambm so propostos exerccios ptlrn
serem desenvolvidos com a ajuda do computador. O principal objetivo desses
I)ll'cllns lcsclvltlos
{i exerccios, enfatizar as idias estatsticas envolvidas e no a habilidncle
computacional. No Apndice'8, "apresentamos as solues comentadas dos
lklusp lulitrtrt tll [Jnivclsidade de So Paulo Coutro d Ciaerap Ldarcai{h a exerccios de so e fornecems as respostas para os exerccios mpares de fim de
Av, lrrl,l,rrciarto Gualbclto, Tlavcssa J,374 do *hrreln
('untlll lltl. rll ntiga leitoria - Cidade Universitria Iiibirotecl captulo.
0550tl U{X) .- Sio l'uulo - SP - Brasil ll.. :;,gil''rs Em relao edio anterior, a sext edio apresenta pequenfls
I)ivisalo (lrrucrcial: tcl. (Oxxl l) 3091-4008 / 3091-4150 rnodificaes. Uma das figuras do Captulo 7 foi mudadapara o Captulo 6, locnl
SA(l (0xxl l) 3091-291 I - Fax (Oxxll) 3091-4151
que nos pareceu mais apropriado. Foram acrescentados exerccios em alguns
www,rrsp,lrr'/ctlusqr - c-mail: edusp@edu.usp.br 4658108 0\/0s captulos. Os erros em respostas, identificados at ento, foram corrigidos,
cr|sEra
lrrslilulo rlc Mllcnttica c Estatstica - IME-USP Pequenas alteraes de redao tambm foram feitas. As mudanas, em relaO t
Ituil rkr Millikr, l0l0 - Cidadc Universitria
quinta edio, esto listadas no endereo Internet mencionado acima.
0-55()t1"9(X) - S;io I'aulo - SP - Brasil
l)cplrlnnlcnt( tlc listatstica - Tel. (Oxxl l) 3091-6129 / 3091-6130 Ao longo das vrias ediges, diversos colegas contribuiram com sugestes,
('uixil lrslIl (r(),2tI - 05315-970 Entre eles destacamos Adilson Simonis, Cludia Monteiro Peixoto, Cllia Tsloi,
rvww, irrx',rrsgr,lrr'/*ttoproest - c-mail: noproest@ime.usp.br Denise Botter, Elisabeti Kira, Elisete da Conceio Q. Aubin, Julio da Mottt
l irt('(l iil llril/il l(X)4 Singer, Lighia B. Horodynski-Matsushigue, Lcia P. Barroso, Marli Mikael,
Nelson Tanaka, Rinaldo Artes e Silvia Ferrari. Maria Ceclia Camargo Magalhies
lroi leito o rlt'1tr1silo lcgal
vrt
vlu Prefcio
Docentes da USP, pela diagramao das tabelas e auxlio na arte final de algumas
dns figuras apresentadas no texto.
Pedimos, desde j, desculpas pelos erros que sero eventualmente
identificados nesta nova edio. As crticas e sugestes de colegas e estudantes I
gcro muito bem-vindas e, certamente, auxiliaro na rnelhoria da prxima verso.
t"r
Contedo
Lista de Defnies
2.r Probabilidade ......,........ .................... 38
2.2 Probabilidade condicional ............. ..................,,,42
2.3 Independncia de eventos....... .........,44 .
..t-,
xu Lista de Definies
xtu
.qft
S.3Representaogrficadaregioderejeio-unilateral...,.250 I l3
4,4 Modelos discretos- valor esperado e varincia """"""""""""""""""" 187
8,4Representaogrf\cadaregioderejeio-bilatera1 e varincia """"""""""""""""""'
6, I Modelos contnuos- valor esperado
8.5 Poder """""""""' """"""'254
7,l Estimadores para mdia' proporo e varincia """''"""""211
Funo
I
Captulo 1: Introduo Anlise Exploratria de Dados l.lOqueEstatstica?
Estatstica Descritiva , em geral, utilizada na etapa inicial da anlise, cle funcionamento das lmpadas produzidas por uma indstria, no podemOS
cprlndo tomamos contato com os dados pela primeira vez. Objetivando tirar observar toda populao de interesse.
concluses de modo informal e direto, a maneira mais simples seria a observao Tendo em vista as dificuldades de vrias naturezas para se observal todos
tlos valores colhidos. Entretanto, ao depararmos com uma grande massa de dados, os elementos da populao, tomaremos alguns deles para formar um grupo i Ser
lrcrcebemos, imediatamente, que a tarefa pode no ser simples. Para tentar cstudado. Este subconjunto da populao, em geral com dimenso sensivelmentC
depreender dos dados informaes a respeito do fenmeno sob estudo, preciso rrenor, denominado amostra. A Figura 1.1 ilustra as etapas da anlige
irplicar alguma tcnica que nos permita resumir a informao daquele particular cstatstica.
conjunto de valores. Em outras palavras, a estatstica descritiva pode ser definida
coto urn conjunto de tcnicas destinadas a descrever e resumir os dados, a fim de
quc possamos tirar concluses a respeito de caractersticas de interesse.
Probabilidade pode ser pensada.como a teoria matemtica utilizada para
sc cstudarr a incerteza oriunda de fenmenos de carter aleatrio. Apesar de ser
urrrn rrea extremamente atraente e estudada do ponto de vista matemtico,
abordaremos, aqui, apenas os aspectos necessrios para as tcnicas estatsticas
irprcsentadas neste livro. Amostra
Inferncia Estatstica o estudo de tcnicas que possibilitam a w
cxtrapolao, a um grande conjunto de dados, das informaes e concluses
obtidas a partir de subconjuntos de valores, usualmente de dimenso muito
ffenor. Deve ser notado que, se tivermos acesso a todos os elementos que
clesejamos estudar, no necessrio o uso das tcnicas de inferncia estatstica.
Entretanto, elas so indispensveis quando existe a impossibilidade de acesso a
todo o conjunto de dados, por razes de natureza econmica, tica ou fsica.
Estudos complexos que envolvem o tratamento estatstico dos dados,
tusnalrnente, incluem as trs reas mencionadas acima. Na terminologia estatstica,
o grande conjunto de dados que contm a caracterstica que temos interesse Figura 1.1: Populao e amostra.
reccbc o nome de populao. Esse termo refere-se no somente a uma coleo de
inclivcluos, mas tambm ao alvo sobre o qual reside nosso interesse. Assim, nossa A seleo da amostra pode ser feita de vrias maneiras, dependendo, entre
populniro pode ser tanto todos os habitantes de Sorocaba, como todas as ()lrlr'os htores, do grau de conhecimento que temos da populao, da quantidade
lrnpaclas produzidas por uma ftbrica em um certo perodo de tempo, ou todo o rlc rccursos disponveis e assim por diante. Devemos ressaltar que, em princpio, A
sargue no corpo de uma pessoa. Algumas vezes podemos acessar toda a sr:lciro da amostra tenta fornecer um subconjunto de valores o mais pareciclo
po;lulao para estudarmos caractersticas de interesse, mas, em muitas situaes, possvcl com a populao que lhe d origem. A amostragem mais usada a
tal llroccciirnento no pode ser realizado. Em geral, razes econmicas so as mais (rtt!o,\lru r:ustral simples, em que selecionamos ao acaso, com olt sem reposi:o, os
clctclrninantes dessas situaes. Por exemplo, uma empresa, usualmente, no ilcrrs da populao que faro parte da amostra.
dispo clc vcrba suficiente para saber o que pensam todos os consumidores de Eventualmente, se tivermos informaes adicionais a respeito cltt
scus proclutos. Hir ainda razes ticas, quando, por exemplo, os experimentos de lrrrlrrrlirlio de interesse, podemos utilizar outros esquemas de amostragem muis
lttlornttilio cnvolvem o uso de seres vivos. Alm disso, existem casos em que a so'isticuclos. Por exemplo, se numa cidade, tivermos mais mulheres do clue
irnpossillilitltclc clc sc accssrr toda a populao de interesse incontomvel. Na 111y111lrs, podernos selecionar um certo nmero de indivduos entre as'mulheres e
tndlisc rlo sirngr"rc cle unra pessoi ou em um experimento para determinar o tempo outl'o nnrero entre os homens. Esse procedimento conhecido colno
(tt,toslt'o!:ct"tt. astraificada. Outras vezes, pode existir uma relao numeradl dOS
-"--qt
itens da populago (uma lista de referncia) que nos permitiria utilizar a chamada 3. Discuta, para cadaum dos casos abaixo, os cuidados que precisam ser tomadOa
1mostragem sistemtica em que selecionamos os indivduos de forma pr- para garantir uma boa concluso a partir da amostra.
determinada, por exemplo de 8 em 8 ou de 10 em 10. Outros esquemas de a. Um grupo de crianas ser escolhido para receber uma nova vacina contra
ilmostragem poderiam ser citados e todos fazem parte da chamada Teoria da meningite.
Amostragem, cujos detalhes no sero aprofundados neste livro. Assim sendo, b. Sorteamos um certo nmero de donas de casa, para testar um novo sabEO en
terminamos esta seo mencionando que quanto mais complexa for a amostragem' p.
maiores cuidados devero ser tomados nas anlises estatsticas utilizadas; em c. Uma fbrica deseja saber se sua produo de biscoitos est com o ssbof
contrapartida, o uso de esquemas de amostragem mais elaborados pode levar a previsto.
uma diminuio no tamanho de amostra necessrio para uma dada preciso. d. Aceitao popular de um certo projeto do governo.
2, Para as situaes descritas a seguir, identifique a populao e a amostfa Id: identificao do aluno
correspondente. Discuta a validade do processo.de inferncia estatstica para Turma: turma a que o aluno foi alocado (A ou B)
cada um dos casos. Scxo: F se feminino, M se masculino
a. Para avaliar a efic'cia de uma campanha de vacinao no Estado de So Iclade: idade em anos
Paulo, 200 mes de recm-nascidos, durante o primeiro semestre de um Alt: altura em metros
dado ano e em uma dada maternidade em So Paulo, foram entrevistadas a Peso: peso em quilogramas
respeito da ltima vez em que vacinaram seus.filhos.
lilhos: nmero de filhos na famli'a
b. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. lumn: hbito de fumar, sim ou no
c. Para verificar a audincia de um programa de TV, 563 indivduos foram Toler: tolerncia ao cigarro:
entrevistados por telefone com relao ao canal em que estavam (I) indif'erente, (P) incomoda pouco e (M) incomoda muito
sintonizados.
d. A fim de avaliar a inteno de voto para presidente dos brasileiros, 122
pessoas foram entrevistadas em Braslia.
. -Edl
contnufls.
Captulo I: Introduo Anlise Explorarta de Dados 1.2 Organzao de Dados I
Resumimos a classificao das variveis no esquema apresentado na Apesar de conter muita informao, a tabela de dados brutos pode nO Sef
Figura I.2 (attulo de exerccio, tente classificar todas as variveis da Tabela 1.1). prtica pu.u r"rpondermos s questes de interesse. Por exemplo, da Tabela 1'1
rriro imediato dizer se os alunos se incomodam muito ou pouco com Os
l'umantes. Porlanto, a partir da tabela de dados brutos, vamos construir UmO nOvtl
Nominal t1$ela com as informaes resumidas, para cada varivel. Essa tabela Sefd
clenominada de tabela de freqncia e, como o nome indica, conter os valOfeg dA
virrivel e suas respectivas contagens, as quais so denominadas freqnelAEq
' -.ordinal ttbsolutas ou simplesmente, freqncias. No caso de variveis qualitativas OU
-a"Qualitativa tprantitativas discretas, a tabela de freqncia consiste em listar os valorog
Varivel
possveis da varivel, numricos ou no e fazer a contagem na tabela de dadOg
\ 'Quantitativ u 1--""-Discreta lrrutos do nmero de suas ocorrncias. Representaremos por n; a freqncia dq
.-,contnua vulor i e por ?? a freqncia total. Para efeito de comparao com outros grupOS
ou conjunos de dadoi, ser conveniente acrescentarmos uma coluna na tabela de
l.oqncia contendo o clculo da freqncia relativa, definida por fi = U/t\:,
Convm notar que, quando estivermos comparando dois grupos com relaO S
freqiincias de ocorrncia dos valores de uma dada varivel, grupos cgm Um
1.2: Classificao de varidveis. nmero total de dados maior tendem a ter maiores freqncias de ocorrncia dos
liSura
vtlores da varivel. Desta forma, o uso da freqncia relativa vem resolver Bte
Vale ressaltar que, em muitas situaes prticas, a classificao depende problema.
de certas particularidades. Por exemplo, a varivel ldade, medida em nmero de A Tabela 1.2 apresenta as freqncias para a varivel Sexo, obtida a p0rtir
anOS, pode ser vista como discreta, entretanto, Se levarmos em conta os dias, no cln Tubela I .1.
absurdo falar que a idade 2,5 ou 2,85 anos, dando assim respaldo para classific-
la como contnua. Por outro lado, dependendo da preciso do instrumento
utilizado para se obter medidas em um objeto, podemos ter limitaes no nmero Tabela 1.2: Tabela de freqnca para a varivel Sexo.
cle casas decimais e uma varivel de mensurao pode se "tornar" discreta. E
Sexo n,i .t
importante salientar que a classificao apresentada acima se refere natureza da t t'7
varivel e, em geral, devemos utilizar o bom senso na hora de decidir qual F d 0,74
procedimento adotar para caracterizar uma varivel. Para salientar tal fato, M 13 0,26
menciOnamos que podemos, inclusive, discretizar uma varivel contnua para total n:50 1
0 0 0,90
90,0 F 100,0 1 0',02 1,00
t total 50 1
ZJ 2 0,04 0,94
24 1 0,02 0,96
25 2 0,04 1,00 Vamos estudar, agora, a situao em que a varivel por natureza
total n:50 1 cliscreta, mas o conjunto de possveis valores muito grande. Por exemplo, a
vflrivel TV, definida como o nmero de horas assistindo televiso, tem valores
inteiros entre 0 e 30 e uma tabela representando seus valores e respectivas
Com relao varivel Peso, lembremos que foi classificada como ieqncias seria muito extensa e pouco prtica. O caminho adequado, nesse caso,
quantitativa contnua e assim, teoricamente, seus valores podem ser qualquer trotar a varivel como se fosse contnua e criar faixas para representar seus
nmero real num certo intervalo. Aqui os valores variam entre 44,0 e 95,0 kg e vulores. Assim, passamos a tratar como contnua uma varivel que seria,
foram medidos com apenas uma casa decimal. Ainda assim, existe um grande originnlmente, classificada como discreta.
nmero de valores diferentes de modo que, se a tabela de freqncia fosse feita
nos mesmos moldes dos casos anteriores, obteramos praticamente os valores Tabela 1.5: Tabela de freqncia para a varivel TV.
originais da tabela de dados brutos. A alternativa que vamos adotar consiste em
construir classes ou faixas de valores e contar o nmero de ocorrncias em cada TV ni .ft fu"
laixa. Para a varivel Peso, usamos faixas de amplitude 10, iniciando em 40 kg. 0F-6 L4 0,28 0,28
Na Tabela 1.4, escolhemos incluir o extremo inferior e excluir o superior. Dessa 6- t7
12 0,34 0,62
I'orma, a freqncia da faixa 40,0 F 50,0 no incluiu os alunos 46 e 48 que
tinham peso igual a 50,0 kg. A opo de qual extremo incluir pode ser arbitrtria,
12- 18 11 0,22 0,84
18 t- 24 4 0,08 0,92
n"os o importante indicar claramente quais so os valores que esto sendo
conterdos em cada faixa. 24l---136 4 0,08 1,00
Apesar de no adotarmos nenhuma regra formal quanto ao total de faixas, total 50 1
cxiste hoje uma infinidade de tipos de grficos que podem ser utilizados' Como inegocirveis.
ilustra deste ponto, apresentamos na Figura 1.3 alguns grficos publicados em pizza, barras t
vamos definir trs tipos bsicos de grficos: disco ou
na grfica pode sef
rrgos de imprensa. li$t(,t4ruma. como dissemos, a criatividade apresentao
entre vrios' de
inrerrsa e os grficos que discutiremos sintetizam trs caminhos,
CIDIO RU|AT representao.
'grfico
EVOLUO DO LUCRO tiQIDO circular, se adapta muito
o de d.isco, otr pizza, ou ainda diagrama
em repartir um disco em setores
U$$ MII"HES RECURSOS PROPRIOS
hem s variveis qualitativas nominais. consiste
circularescorrespondentessporcentagensdecadlvalor,calculadas
freqncia
exemplo, O,20 de
rnnltiplicando-se por 100 a freqnca relativ f6.Por
relativa a207o o- u"' que 100 x 0'20:20' AFigura 1'4 apresenta
"o.r"rpond" da Tabela 1.1. Note que
o cliagrama de disco para avarivel Tol-er, obljd^a.a .nartir
fntiir correspondent categoria "indiferente" foi destacada.
'
t
ls I t
e= Figura 7.4: Diagrama circalar pard varilvel Toler'
' ===
,= ogrficodebarrasut\|\zaoplanocartesianocomosvaloresdavarivel
TSCR
== no eixo das abiissas e as freqnciai ou porcentagens no
eixo das ordenadas'
barra com altuf8
Note que pIia cada valor a varivel desenha-se uma
CAIMS
de grfico se adapta
,nrr"rptnd"rrdo sua freqncia ou porcentagem. Esse tipo
23,891
l. Gor
== ==Gou ==
2
==
SuPeior
20 \r
.g
oc
t;
e15
E
L
$ru'
10
18 le 20
,1"
/-'t'
O histograma consiste em retngulos contguos com base nas faixas de 40x I
60 70 80 90 100
{)
valores da varivel e com rea igual freqncia relativa da respectiva faixa. .?- Peso '
Dessa forma, a altura de cada retngulo denominada densidade de freqncia oa Figura 1.6: Histograma para a varivel Peso.
simplesmente densidade definida pelo quociente da reapela amplitude da faixa.
Para a varivel peso, as densidades de cada faixa podem ser obtidas dividindo-se a Exemplo 1.1.' Vamos calcular a mediana da varivel Peso atravs do histogram,
coluna fi da Tabela 1.4 por 10, que a amplitude de cada faixa. O histograma Inicialmente identificamos o retngulo que deve conter a mediana. Uma simplos
correspondente a essa varivel apresentado na Figura 1.6. Note que inclumos, soma das reas resulta que a mediana pertence ao intervalo [50,0; 60,0), uma vsz
no topo de cada retngulo, a porcentagem de observaes correspondente, para eluc at o valor 60,0 temos acumuladas 607o das observaes. Dentro dessa faixa,
ftci I itar a interpretao. precisamos determinar um retngulo com rea igual a 34Vo, que o que falta para
importante ressaltar que alguns autores utilizam a freqncia absoluta rringir o valor 50Vo. A situao ilustrada na figura a seguir, cujo retngulo
ou porcentagem na construo do histograma. Preferimos o uso da densidade de procurado est marcado com rea mais escura.
'eqncia, pois ela faz om que o histograma no fique distorcido, quando Com uso de propores, estabelecemos a seguinte igualdade:
amplitudes diferentes so utilizadas nas faixas. Uma outra vantagem diz respeito
relao entre histograma e grfico da funo densidade de probabilidade, que ser mdor,,- 50 _ 60 - 50 lo
visto mais adiante. 0,34 0,44
O histograma tambm pode ser utilizado no clculo da mediana (mdor,),
que o valor da varivel que divide o conjunto de dados ordenados em dois
subgrupos de mesmo tamanho, Isto , das observaes ordenadas, 507o esto f;,li4 .,t. - JJ-' i,!t
rn , 1-,
rtlt
abaixo e 507o esto acima da mediana. Assumindo que as observaes da varivel r ), ,lr,
-,-'
,I''
Y
"r'qr
q)
E
p
0,05 .,,'60-
'--'^
a 6r,'6 ''
(D
o o,o+ C,t\
:
0,03
',r"r''",'4'
o,o2
0,01
0,0
50 60
mdot, Qt Peso
o nmero mximo, 69. O box-Plot Grficos tipo box-plol tambm so teis para detectar, descritivamentc,
mnimo de laranjas em uma caixa ' 22 e
rliirl'crras nos comportamentos de grupos de variveis. Por exemplo, poclemos
correspondente apresentado na Figura 1'7'
tturrsitlornr grficos da varivel Peso para cada sexo. O resultado apresentado nn
l'jigrrlir 1,9, em que podemos notar que os homens apresentam peso mediano
atrllet'iur ito das mulheres, alm de uma maior variabilidade'
60 100
90
3so
e 80
E
o
J
40
En
!
I
60
30 50
I
40 I I
F M
20
Sexo
Figara 1.7. Box'plot para o nmero de laranjas por caixa' Irigura 1.9: Box'plot da varivel Peso para cada sexo,
40 l, {Jrrirrzt pncientcs clc unra lrrica de ortopcdia foram entrevistados qunto ito
nrnrr'r'r rk: r'ttcscs prcvistos cle I'isiotcrapin, se haver (S) ou niro (N) secltlelus
Figura 1.8: Box-plot para a varidvel Peso.
'.qt
aps o tratamento e o grau de complexidade da cirurgia realizada: alto (A), do que em uma regio industrial (Regio B). Para tanto, uma amostr foi
mdio (M) ou baixo (B). Os dados so apresentados na tabela abaixo: tomada em cada regio, fornecendo a tabela de freqncias a seguir:
Pacientes 2 3 4 5 6 7 8 9 10 ll t2 l3 I4 I Regio B
Fisioterapia 7 8 5 4 5 7 7 6 8 6 5 5 4 5
rN
Peso ni
Seqelas s S .N: ,N) N S s N N' S S S N N)
Cirurgia A M A M M B A M B M ts ts M M A <60 10 (,1,
a. Apresente os dados em uma tabela de freqncia, incluindo a freqncia rl, l{cpita o item (c) para a varivel Salrio.
relativa. r,. (lonsiderando apenas os funcionrios com mais de trs anos clc clsn,
b. Idades atpicas parecem ter ocorrido nesse ano. Aps sua retirada do tlcscreva o comportamento da varivel Salrio.
conjunto de dados, refaa o item (a). Comente as diferenas encontradas. ll. I lrrr gnrpo de pedagogos estuda a influncia da troca de escolas no descntpcttlto
Um novo medicamento para cicatrizao est sendo testado e um experimento tlt. llrrnos do ensino fundamental. Como parte do levantamento realizndo, lri
feito para estudar o tempo (em dias) de completo fechamento em cortes nrotiulo o rrmero de escolas cursadas pelos alunos participantes do estttclo.
provenientes de cirurgia. Uma amostra em trinta cobaias forneceu os valores: Escolas Cursadas freqncia
15,17,16, 15, \7, 14,17, 16, 16,17,15, 18, 14,17, 15, 14,15,16,17, 18, 18, 1 46
17, 15, 16, 14,18, 18, 16, 15 e 14.
2 57
a. Organize uma tabela de freqncia.
.) 2T
b. Que porcentagem das observaes esto abaixo de 16 dias?
4 15
c. Classifique como rpida as cicatrizaes iguais ou inferiores a 15 dias e
5 4
como lenta as demais. Faa um diagrama circular indicando as
porcentagens para cada classificao. ru. (.)rlrl a porcentagem dos alunos que cursaram mais de uma escola?
6. O Posto de Sade de um certo bairro mantm um arquivo com o nmero de Ir- ('onstrua o grrfico de barras.
crianas nas famlias que se utilizam do Posto. Os dados so os seguintes: 3, 4, c. ('lirssil'i11r.rc os alunos em dois grupos segundo a rotatividade: a/c pnt'u
3, 4, 5, r, 6, 3, 4, 5, 3, 4, 3, 3, 4, 3, 5,5, 5, 5, 6, ll, r0, 2, l, 2, 3, r, 5 e 2. itlulos cclur rnais de 2 escolas e baixa para os demais. Obtenha a titbclit tlc
a. Organize uma tabela de freqncia. lr'r;iincin dcssa varivel.
b. Faa uma representao grfica. rr. Alrrrros tlir Escola cle Educao Fsica foram submetidos a urn lcslc rkr
c. Voc identifica valores nruito discrepantes? Que fazer com eles? rr.sistrrciir rpranto ao nmero de quilmetros que conseguiram corrcr sert
(
Um questionrio foi aplicado aos dez funcionrios do setor de contabilidade de lrrrrirr'. )s clirclos cstiro apresentados a seguir.
rr. (-)rr;rl ir vtriiivcl em estudo?
uma empresa fornecendo os dados apresentados na tabela.
b. ('orrsllrrir o ltistograma.
Funcionrio Curso (completo) Idade Salrio (R$) Anos de Empresa
o
e. ( )lrlt'rrltir o lnx-pktl.
supenor 1100,00 5
2 superior 43 1450,00 8 Faixas freqncia
3 mdio 31 960,00 6 0t-4 438
4 mdio dl 960,00 8
24 600,00
4FB 206
5 mdio
6 mdio 25 600,00 2 8F12 125
1 mdio 27 600,00 5 12 F I6 22
mdio 22 450,00 I
8 2
I6 F 20
9 fundamental 2l 450,00 J
10 fundamental 26 450,00 J I0. lltrrrPo t[r rrtiliziriio rlc citixus clctrnicos clcpcrrclc dc cada usurio c rlits
a. Classifique cada uma das variveis. tl lrrrirr's r'lctrrirtlirs. liorarn colctadas 2(l rncclidas dcssc tcmpo (crn rnirtutos):
b. Faa uma representao grfica para z varirvel Curso.
l,t 1,2 1,7 0,) t.4 lr7 1,0 1,0 0,8
I ,l'r I ,: I .(i I ,l-r
c. Discuta a melhor forma de construir a tabela de I'reqiincia para a vitriiivcl I ,:t l,i l.(' | 1,2 1,2 I,0 0,) l,g 1,7 [,5
,,1 I ,ll I , l-"r
a. Organize uma tabela defreqncia sem agrupar os dados. 6,1 612 617 615 6,9 6,3 714 7,6 7r7 7,6
b. Agrupe os dados em faixas de tamanho 0,2 a pattit de 0,8 e obtenha uma /t 7r7 7,6 714 712 7,2 t 716 7r5 7,4
nova tabela de freqncia. 7r5 7,7 8,2 8,3 8,1 8,1 8,1 7,9 7,8 714
c. Compare as tabelas obtidas em (a) e (b). Comente as diferenas' 7r5 716 7,5 716 7,4 r 714 7r5 7,5 714
d. Se ao invs de 26 medidas tivssemos 1000, qual procedimento, dentre
agrupar ou no, voc utilizaria? rr- ( )rgnnize os dados em faixas de tamanho 0,4 a partir de 6.
h. ('orrstrua o histograma.
11. Vinte e uma pacientes de uma clnica mdica tiveram o seu nvel de potssio
no plasma medido. Os resultados foram os seguintes: c. ('irlculc o segundo quartil.
Nvel freqncia l.l. () lrirlcro de gols marcados no ltimo campeonato daFederao Paulistl tle
liutclxrl pelos 20 clubes participantes nos seus 38 jogos uma varivel conl os
2,25 a 2,55 1
:;r'1it r i tttcs velores:
t
2,55 - 2,75 J
3,15 F 3,35 5
Clube 11 72 13 t4 15 16 17 IB 19 20
3,35 F 3,65 6
Gols 55 70 42 4L 6B 66 74 29 47 53
a. Construa o histograma.
b. Determine os 1e, 2e e 3e quartis. ir, ('lirssi'iquc i varivel. Voc acha razovel construir uma tnbclit tle
c. Qual a porcentagem dos valores que esto acima do nvel 3? l'r'ct;iincia de atcordo com a classificao dada?
Ir. ('orrslnrt unra tirbela de freqncia agrupando as observaes em intcrvillos
12. Foram feitas medidas em operrios da construo civil a respeito da taxa de
rlt, t:ornprirnento l0 a partir de 20 (no esquea de indicar clarnclto os
hemoglobina no sangue (em gramas/cm3):
irrlt't'vit los).
11,1 L2,2 LL,7 12,5 13,9 12,3 74,4 13,6 !2,7 12,6 r'. ( )lrtt'rrhir o histogranta.
11,3 II,7 12,6 73,4 L5,2 L3,2 13,0 16,9 15,8 L4,7 rt. (.)rrr lrorccntagent dos clubes mrcaram mais de 38 gols?
13,5 L2,7 L2,3 13,5 15,4 16,3 L5,2 72,3 L3,7 L4,1
l, A t;rlrclir ir soguir apresenta as freqtincias relativzts de ocorrncias de lrixns tle
a. Organize os dados em faixas de tamanho 1 a partir do 1 1. illluut (r.n cnt) para uma imostra de 100 criins de l2 anos de icladc.
b. Construa o histograma. ar, ('orrslt'ttit o histograma.
c. Determine o terceiro quartil e a mediana. lr, ( )lrlcrrhrr <t lxtx-plo.
d. Taxas abaixo de 12 ou acima de 16 so consideradas alteradas e requerem r'. I )r'st'ilrnclo-so sopirral' os l5o/o mis eltos, qual seria o ponto de cortc'/
acompanhamento mdico. Obtenha a tabela de freqncia da varivel
Acompanhamento Mdico com duas opes sim ou no.
L3. O valor mdio de comercializao da saca de milho de 60 cluilos nir Bols:t clc
Cereais apresentado abaixo, em reais, para ltimos 40 meses.
28 Captulo l: Introduo Anlise Exploratria de Dados I 'l l',ttn'cios 29
90F95 10
I 106 1 2lo
2 222 2 342
95 F 100 2
3 338 J 109
a. Faa uma representao grfica da tabela acima. 4 292 4 9l
b. Construa o box-plot. lr 164 5 35
c. Comente a afirmao do fabricante. totitl 7I22 total 787
17. Uma nova rao foi fornecida a sunos recm desmamados e deseja-se avaliar 19, ('orrrtl ;lrltc do uurn avaliairo rndica em uma certa universidade, fbi rneclirln
sua eficincia. A rao tradicional dava um ganho de peso ao redor de 3,5 kg n lrr'r1irrciir cirrditca clos alunos do primeiro ano. Os dados so rprcscrttaclos
em um ms. A seguir, apresentamos os dados referentes ao ganho, em quilos, elrt:ir'1',ttirlit.
para essa nova rao, aplicada durante um ms em 200 animais nas condies it. ( )lrtrrrlrir o histograrna.
acima. ll, lirctl(lrrciirs cnrclacls quc cstc.ianr rbaixo de 62 ou ercima de 92 rccluercrn
a. Construa o histograma. irlrrrrrpirnlrirrrrcrrto rnclico, Quirl n porcentigem de alunos rcssits
b. Determine o 1e, 2e e3e quartis. r ltttliotrs'/
c. Voc acha que a nova rao mais eficiente que a tradicional? Justifique. r', llrrur 'cr1lrrcil iur rcclor clc 72 baticlas por nrinuto considerada paclrio,
Vor't' irt'lrir rprc dc nroclo gcral csscs alruros sc cncaixaln ncssc caso'
.to Captulo I: Introduo Anlise Exploratria de Dados I J I t,'ttt'irts 3t
90F95 1
I -L2 0,25
95 F 100 3
72-15 0,30
15F20 0,23
20. Um exame vestibular para uma faculdade tem 80 questes, sendo 40 de
portugus e 4O de matemtica. Para os 20 melhores classificados, It, lfr.st. jir-sc comparar trs tcnicas cirgicas pata a extrao de dente de siso,
apresentamos o nmero de acertos em cada disciplina, em ordem decrescente ('itrlir trrttir clas tcnicas foi aplicada em 20 pacientes e os resultados sio
do total de pontos. apt r'st'rrtirrlus a seguir.
a. Organize uma tabela de freqncia para cadavarivel.
t
10
b. Faa uma representao grfica das tabelas obtidas em (a).
c. Construa a tabela de freqncia da varivel total de pontos. .qo
!t
F
d. Comente sobre a afirmao: os aprovados so melhores em portugus do
que em matemtica.
'8. I
E
c)
o.
a,
o
aluno 1 2 J 4 5 6 7 8 9 10 d)
Portugus 35 35 34 32 31 30 26 26 24 23 s6
Matemtica 31 29 27 28 28 26 30 28 25 23 &
Es
c)
t--"
aluno 11 t2 t3 T4 15 T6 t7 18 I9 20 4
Portugus 23 L2 11 20 17 T2 L4 20 B 10
t.\
Matemtica 27 z 31 20 27 25 20 13 23 20
Tcnica cirrgica
21. Vinte baterias para automveis de uma certa marca foram testadas quanto
*r, lirrr rrrnr virlrlrcs a1-lloximados pilr er mediana de cada tcnica,
sua vida til. O teste simula autilizao da bateria, acelerando seu desgaste de
rnodo a criar uma rplica da situao real. Os resultados da durabilidade (em
b,ll tttlrtvttltt ittlerqltdrtil. , dcl'inido colno e dil'erena entre o tcrccirc c rr
1rr irtrt'iro rlttiulis, Cllculc scu valor para cerda uma das tcnicers e comentc.
mcses) so apresentados a seguir:
.:. llir('ulit rr vlrrilrllilidlrclc do tcnpo dc rccupcrao ern cada tcnica.
a. Construa o histograma.
ri. ,'jt, r'rrr't-' t'r otirrrisla, clual tcnica cscolhcria'l
b. Se a amostra acima for considerada representativa do desempenho desszr
rirce de bateria, quantas, em 1000 fabricadas, sero repostas pelo 3, tllr*. o corrrPrrlirtlor') Os cllclos a scguir representam indivduos que btlrrr
labricante, se ele o'erece 6 meses de garantia? r {r!rl'urinrr(krs llr,tlo vcrclo clc um ccrto tipo clc inseto e submcticlos ir
Irrllrlrr'nl() (tr's rliI'crcnlos Iipos). As virriiivcis so:
-t2 Captulo l: Introduo Anlise Exploratria de Dados I ,-t l','rrn'r:ios 33
No.: nmero associado aos pacientes; Atrlvs do computador, crie uma planilha com os dados apresentados.
Diag: tempo, em horas, gasto entre o contato com o inseto e l. Cltssifique cada uma das variveis.
ll. Construa uma tabela de freqncia (atravs do computador) para a
administrao do tratamento;
virivel Diag. Utilize 5 classes.
Recup: tempo, em horas, entre a administrao do tratamento e
lll. Atravs de representao grfica adequada, compare os trs tratametos
recuperao; corn relao idade dos pacientes. Voc diria que a idade se distribui
Tratam: tipo do tratamento administrado; Itotttogeneamente nos trs tratamentos?
Coag: presena de cogulos no momento de admisso. lv. l{cpita o item (iii) para a varivel Coag.
b, Strltctrrha, que ao invs de trabalhar corn a varivel ldade, cria-se uma novl
Pac.No. Idade Diag Recup Tratam Coag vurirvcl denominada Etrio, assumindo valor 0 se Idade for menor que 29
T9 28 7 3 II nao rlnos c I caso contrrio. Utilizando o computador:
4 15 52 45 I nao l. lixplique como voc poderia criar tal varivel.
27 76 30 23 II slm ll, Construa um box-plot para a varivel Recup, para cada grupo de Etrio,
7 15 53 46 I stm Corn base nos grficos, voc diria que o tempo de recuperao diferente
14 2l 3 2 II nao dependendo da faixa etria? Justifique sua resposta'
5 11 46 42 I nao , tJmn nova varivel denominada Cura criada: Cura ser rpida se Recup
11 16 55 47 I nao frrr rnenor ou igual a 10, ser normal se entre 10 e 40 (inclusive) e ser lentct
54 41 I m pnt'n lccr.rp acima de 40. Verifique, graficamente, se pacientes em cada umit
10 16 S
37
38 Captulo 2 : Probabilidades ?,1 ltitit,tlttl'tt 39
D efnio 2. 7 : Probabilidade fll:n popullo, definimos a probabilidade dele ter uma certa idade pela
fuqttrre irr rclativa associada respectiva idade. Assim,
uma funo P(.) denominada probabilidade se satisfaz as condies:
P(17) : 0,18; P(18) : 0,44; ...; P(25) : 0,04. tr
?) 0< P(A)< 1,VcQ;
i,i,) P(A) : r; No 1lrximo exemplo, obtemos a probabilidade da unio de eventos.
ii P(UAj) : t P(A, com os 7t disjuntos. 2.2; Considere a Tabela L2 do Captulo 1, contendo informaes a
j:t .i:r r tlirs 'cqiincias da varivel Sexo. Sabendo que 52Vo dos alunos esto na
tr A e 48Vo ni turma B, suponha que escolhemos um estudante ao acaso da
lnno, Quirl seria a probabilidade de escolhermos um estudante do sexo
A
pergunta que poderia surgir seria: como atribuir probabilidades aos r ott itlgurn da turma B?
elementos do espao amostral? H duas maneiras principais de responder essa l)rrs inbrrnaes a respeito da freqncia relativa acima e da Tabela 1.2,
questo.
A primeira
delas consiste na atribuio de probabilidades, baseando-se
em caractersticas tericas da realizao do fenmeno. Por exemplo, ao lanarmos /'(/") : 0,74, P(M) :0,26, P(A) :0,52, P(B): 0,48.
um dado, temos o espao amostral 0: {1,2,3,4,5,6}. Admitindo que o dado
trilidrrdc que precisamos determinar pode ser representada por P(F U B),
foi construdo de forma homognea e com medidas rigorosamente simtricas, no
guLl se sirnplesmente somarmos P(.F') com P(B), obtemos uma somn
temos nenhuma razo para privilegiar essa ou aquela face. Assim, consideramos
P(1) : P(2) :. '. : P(6) :716. Flor l I ,
E,videntemente isso no pode acontecer, pois o valor clu
llidnde poclc ser, no mximo, igual a 1. No difcil perceber que estamos
Uma outra maneira de obter probabilidades atravs das freqncias de
n trlg,rrns elcmentos duas vezes, pois ao considerarmos apenas estudantcs
ocorrncias. Observando as diversas repeties do fenmeno em que ocorre a
tXo l'errrinino, temos estudantes da turma A bem como da turma B e ao
varivel de interesse, podemos anotar o nmero de ocorrncias de cada valor
los upotes i turn'a B, temos estudantes do sexo feminino e masculino,
dessa varivel. Para um nmero grande de realizaes, a freqncia relativa
on r:sluclnntcs do sexo feminino e da turma B, isto , o evento F O B, estd
poderia ser usada como probabilidade. For exemplo, desejando estabelecer as
Ito rlvcnlo ,;' c tambm no evento B.Logo, precisamos subtrair umi vez
probabilidades de cada face de um dado sem fazer nenhuma suposio inicial
n IJ) ;turn obter a probabilidade correta. Desta forma, temos qllc il
sobre sua construo, usamos a experincia de sucessivas ocorrncias. O ponto
ilitlrrtle rlit unio FU B igual somadas probabilidades de ,F' e B menos
delicado decidir quanta experincia necessria para se fazer a atribuio de
lirlnrlc rlu interscco f' O B. tr
probabilidades, com alguma garantia de no se estar muito distante do verdadeiro
valor. Questes dessa natureza no sero discutidas aqui e fazem parte doS A plohnbilidaclc da unio de eventos calculada atravs da regru dct
captulos de inferncia estatstica. Por ora, vamos assumir que, medida que O tltt ltnilnhilitlutlcs apresentada ni Figura 2.1. No faremos unlu
nmero de repeties vai aumentando, as freqncias relativas se estabilizam em lf rio lrrrnul, pois ncreditamos que o resultado bastante sirnples c
um nmero que chamaremos de probabilidade. Em cincias biolgicas e humanas, itivo,
essa a forma mais comum de atribuir probabilidades.
De modo geral, diremos que estamos fazendo um sorteio aleatrio ou ao
acaso em uma populao, se a escolha desse ou daquele elemento s depende da
probabilidade a ele atribuda, seja atravs da freqncia relativa ou de algumit
suposio terica.
Exemplo 2.1: Para a varivel ldade, ver Tabela 1.3 clo Captulo l, o cspito ltignra 2.1: Ilegru de adio dc probahiliclaclcs.
amostral ser f) : {17,18, .. . ,25}. Supondo que um aluno escolhiclo ao icoso
Captulo 2 : Probabilidades 2.2 P robab ilidade Condic ional e Indep endnca 4T
40
Observe quo, se A e B forem disjuntos, a expresso acima se reduz linguagem da Teoria dos Conjuntos, as seguintes situaes:'
sorna das probabilicdades dos eventos A e B, pois a interseco vazia e a a. Pelo menos um dos eventos ocorre.
correspondente probabilidade nula. A regra de adio de probabilidades pode b. O evento ocorre mas B no.
ainda ser expandidan para mais de dois eventos. Jente, por exemplo' escrever a c. Nenhum deles ocorre.
expresso para P('$UBUC) considerando D: Bl)C e aplicando a regra de cl. Exatamente um dos eventos ocorre.
adiro de probabilid,lades duas vezes. 3. Uma universidade tem l0 mil alunos dos quais 4 mil so considerados
Comq conseqncia da regra da adio, obtemos que, para qualquer csportistas. Temos, ainda, que 500 alunos so do curso de biologia diurno, 700
evcnto A c {1, cla biologia noturno, 100 so esportistas e da biologia diurno e 200 so
P(A):I-P(A'), csportistas e da biologia noturno. Um aluno escolhido, ao acaso, e pergunta-
sc a probabilidade de:
que pode ser verificada aplicando a regra da adio com Ac no lugar de B. a. Ser esportista.
Tctnos, b. Ser esportista e aluno da biologia noturno.,-:l
tr(Art A') : P(A) + P(A") - P(A A") c. No ser da biologia.
: p(A) + P(A') - P(A) d. Ser esportista ou aluno da biologia.
: p(A) + P(") c. No ser esportista, nem aluno da biologia. ,---
- 0. (,,,-/
:9,2,
4. Sejam A e B dois eventos em um dado espao amostral, tais que P(A)
Como P(Au A) : P(Cl) : 1, segue imediatamente a igualdade desejada' P(B) : p, P(AU B) : 0,5 e P(A n B) : 0,1. Determine o valor de p.
5. l)ois processadores tipos A e B so colocados em teste por 50 mil horas. A
Ilxerccios da Seco 2.L: probabilidade de que um erro de clculo acontea em um processador do tipo
1. Para cada um dors casos abaixo, escreva o espao amostral correspondente e A de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que:
conte seus elementos' ri. Pelo menos um dos processadores tenha apre.sentado
b. Nenhum processador tenha apresentado erro?
"rrorc---.-u---
\
a. Uma moeda anada duas veze,s, e observam-se as faces obtidas'
b. Um dado lranado duas vezes e a ocorrncia de face par ou mpar c. Apenas o processador A tenha apresentado erro?
observada.
c. Uma urna contm 10 bolas azuis e 10 vermelhas com dimenses
rigorosamento iguais. Trs bolas so selecionadas ao acaso com reposio e 2.2 P r obabilidade Condicional e Independncia
as cores so arnotadas. Em muitas situaes prticas, o fenmeno .aleatrio com o qual
L Dois dados sio lanados simultaneamente e estamos interessados
na soma Irrrbalhamos pode ser separado em etapas. A informao do que ocorreu em uma
'- clas faces observadas. rletr-:rrninada etapa pode influenciar nas probabilidades de ocorrncias das etapas
g( Em uma cid;ade, famlias com 3 crianas so selecionadas ao acaso, srrccssivas.
' anotando-se o sexo de cada uma. Nestes casos, dizemos que ganhamos informao e podemos "recalcular"
. f.'Urna mquina produz 20
peas por hora, escolhe-se um instante qualquer e
rrs probabilidades de interesse. EsSas probabilidades "recalculadas" recebem o
observa-se o nmero de defeituosas na prxima hora. Irrrrrrc cle probabilidade condicional; cuja definio apresentamos a seguir.
g. Uma moeda lanada consecutivamnte at o aparecimento da primeira
' cafi.
42 Captulo 2 : Probabilidades ?. J l' t r il x t It i I i datle Condicional e Independncia 43
Defino 2.2 : Probabilidade c ondicional Ples srrposies iniciais, 1/ ) B : H e ento, P(H n B) : P(H): 0,02.
Dados dois eventos A e B, a probabilidade condicional de dado que Ettln,t,
ocorreu .B representada por P(A I B) e dada por
P(!,1,8). PB)
P(Htrl:r#?: ffi:0,025
'|P(Al
\ B\ '
: P(B) \ /' > 0.
ftgur rr, n scguir, apresenta o efeito da informao l no espao amostral'
Caso P(B) : g, P(Al B) pode ser definido arbitrariamente; neste texto
usaremos P(Al B): P(A). tr
Exemplo2.3.' Considere a seguinte situao hipottica. Uma grande regio de 100
km2 contm um aqfero (reservatrio de gua) subterrneo com rea igual a 2 O = Regio (100 km2)
km2, cuja localizao _ desconhecida (ver figura a seguir). A fim de determinar a
posio do aqfero, perfuraes so feitas ao acaso. Vamos representar por If o
evento de encontrar gua. Temos P(H): 0,02, obtido pelo quociente da rea do
aqfero pela rea total, onde usamos que o espao amostral f) : {regio de 100
k*t.
@ e:ptr,, rrtttostral perdeu 20 kmz , que a rea descartada para novos furos, tr
l)rr tlc'iniiro de probabilidade condicional, deduzimos a regra do produto
Suponha agora que, aps uma ano de pesquisas, uma rea de cerca de 20
fr Stnilultililrulcs, uma relao bastante til que apresentadanaFigura2'2,
km2j foi amplamente perfurada sem encontrar gua e pode ser descartada para
novos furos. Representamos essa informao por 1. Qual seria, agora, a,
correspondendo a rea total inicial menos a parte que foi descartada para novas etrrl.t,\', rllrL1 rict'ii utiliznclo rcpeticlitntcntc ao lottgo de toclo o texto'
tentirtivits. Temos que P(B) : 0,8. O evento H a B representa a ocorrncin dc,
scrn ncnhuma informao etuxiliar, ncontrarmos gua num 'uro f'eito na regiiro .R.
44 Captulo 2 : Probabilidades
P rt tl t il ti I i r k u I c Co ndic ional e Indep end nc ia 45
A Figura 2.4 apresenta um exemplo de uma partio com 6 eventos. A= (A nFr) u (A.F) u (nq)
uittcln,estar interessados em saber qual a probabilidade de que a amostra
tenlrir siclo obtida do leite fornecido pela fazenda F1, isto ,, P(4lA),
lmpllen er se inverter a probabilidade condicional conheciOa P(lF'1).
conro cssa so tpicas para o uso do resultado apresentado a seguir, tr
dc llnycs: Suponha que os eventos Ct,Cz, ... ,Cn formem uma
l e que suas probabilidades
le sejam conhecidas. Suponha, ainda, que
EFl evr:ttlo A, se conheam as probabilidades P(AlCt) para todo
11 3, ,, . , ft, linto, para qualquer j,
Figura 2.4: Partio do espao amostral (k=6).
P(A I c P(c j)
I'(C,il A) :
Exemplo 2.5.' Suponha que um fabricante de sorvetes recebe 20Vo de todo o leite
que utiliza de uma fazenda F1, 307o de ura outra fazenda F2 e 50Vo de -F's. Um D p(A I cr) p(cr)
i:l
rgo de fiscalizao inspecionou as fazendas de surpresa e observou que20Vo do
leite produzido por .F'1 estava adulterado por adio de gua, enquanto que para ro: t)r clcl'inio de probabilidade condicional temos
F2 e Fs, essa proporo era de 57o e 2Vo, respectivamente. Na indstria de P(C1n A)
sorvetes os gales de leite so armazenados em um refrigerador sem identificao P(ci I A) :
das fazendas. Para um galo escolhido ao acaso, vamos analisar o leite para
P($
decidir sobre sua adulterao ou no. Etettdor dcssl expresso pode ser reescrito 'pela regra do produto,
Se denotarmos por o evento "o leite est adulterado", temos que lgnedo r f,'i, isto ,
P(Al.p'r) : 0,20, P(Al Fz):0,05 e P(Al rs):0,02. Alm disso, .F'1, F'2 e P(A;1n A) : P(AC : P(Al C,:j)P(C.j).
,F3 formam uma partio do espao amostral pois uma dada amostra de leite vem,
necessariamente, de uma e apenas uma das trs fazendas. Desta forma, o evento EEttlFletnr u clentonstrairo note qu
pode ser escrito em termos de interseces de com os eventos F1, F2 e F3, l;
r,,(A) :Dnra.ci) :Do(1l
:
I
? ( t,' u \") -- T ((trn.r1') - lC-0" v-w d"t- J'lv'ng.r.,rzn i, ( a) b'\ - P ( ('*t'r',-,ll' )
48
'" ^\ Captulo 2: P
rr(,. s') . p[n'', -? (al@) 49
l
l/
Exemplo 2.6: Yoltando situao do fabricante de sorvetes (exemplo anterior), I
rt tt'irttrito: se dois eventos so mutuamente exclusivos ento eles'
podemos agora calcular facilmente a probabilidade desejada, isto ,
lnrlelrcttclcntes.
P(.il)
P(FrlA):--i(A)-A) Pgulo llutebol Clube ganha com probabilidade 0,7 se chove
eve, l'inr Sctcrnbro a probabilidade de chuva de 0,3.
;e com 0,8 se
O So Paulo
P(A I F'l)P(rl) ull1n l)nrticln em Setembro, qual a probabilidade de ter chovido nesse
,
P(Frlrl: :0,615.
reelos
Portanto, a probabilidade de que a amostra de leite em questo tenha si fuedn vicitclu de modo que a probabilidade de sair cara 4 vezes maior
produzida pela fazenda F1, de 0,615 em contraste com as probabilidades 0,231 I de urir coloi. Para 2 lanamentos independentes dessa moeda,
0,154 para as fazendas F2e F3, respectivamente.
p@btthiliduclc de sair somente uma cara.
Exerccios da Seo 2.22
pbchiliclnde dc sair pelo menos uma cara.
L. Considere dois eventos A e B, mrtumente exclusivos, com P() :0,3 ffebntrllidurle de dois resultados iguais.
P(B) :0,5. Calcule: urrr conjunto de 4 nmeros dos quais nenhum deles zero, dois so
a. P(An B). c dois sio negativos. Sorteamos ao acaso, com reposio, 2 nmeros
b.P(Au B). /-t / enjunto, l)eterrnine a probabilidade de:
c.P(Al B). (-" deler r,rer negntivo.
d. P(A.). qune ietrle set negativo.
e. P((A u B)").
dclr nrrrerc)s terem o mesmo sinal.
2. Se P(AU B) : 0,8;P() : 0,5 e P(B) : r, determine o valor de rno caso He sf,o vrlliclas ats afirmaes:
de: ) - lllaf'@ l) :3/5ento AeB nopodemserdisjtrntos'
a. Ae -B serem mutuamente exclusivos.,
& nt) -- 12,l'(Dl A):rI : e P(A lB) Lf2 ento An'/ao pode estar
b. e B serem independentes. U' f,tldn ettt /J.
3. Uma escola do ensino mdio do interior de So Paulo tem 40Va de estudanteg lrce dr, estustica tcve a seguinte distribuio das notas finais: 4 do sexg
do sexo masculino. Entre estes, 207a n]unca viram o mar, ao passo q\e, entre A lnu c fi clo 'crnirrino bram reprovados, 8 do sexo masculino e 14 do
meninas, essa porcentagem de 50Vo. Qual a probabilidade de que um aluno lno frtrurn ttprovndos, Para um atluno sorteado dessa classe, denote por M
selecionado ao acaso seja: lutto eseollrirlo br do scxo masculino e por se o aluno foi aprovado.
a. Do sexo masculino e nunca tenha visto o mar?
'/
b. Do sexo feminino ou nunca tenha visto o mar? F1d t=t ltl";,
a.SeP(f) :0,4;P(A) =0,7e P(A nr) = 0,3;calculc P(AI D"), F(' rr ilI"),
F(d | /1/).
50 Captulo 2 : P robabilidades ft'r't{'i,,f
5t
d.P(M'I A). F ttttr l)uirrg existem trs empresas de TV a cabo e 20 mil residncias. A
e,P(M I A). 'l'A lcrn 2100 assinantes, a TB tem 1850 e a empresa TC tem 2600
:in1ttl,,s, scttclo que algumas residncias em condomnios subscrevem aos
?eas produzidas por uma mquina so classificadas como defeituosas, lr'u tlc: urais de uma empfesa. Assim, temos 420 residncias que sito
,"c,rpe.veis ou perfeitas com probabilidade de 0, 1 ; 0,2 e 0,7 ; respectivamente. Irlr:s tlo TA e TB, 120 de TA e TC, 180 de TB e TC e 30 que sito
De um grande lote, foram sorteadas duas peas com reposio. Calcule: rrtrs tlns trs empresas. Se uma residncia desse bairro sorteada ao
a. P(duas serem defeituosas)
ruu, quttl l probabilidade de:
b. P(pelo menos uma ser Perfeita).
Fr nssirrlrrtc somente da empresa TA?
c. P(uma ser recupervel e uma perfeita).
E se o A$lttnr 1rclo tncnos uma delas?
,,@)t"Oiqu. as suposies utilizadas para resolver os itens anteriores. !Ee t.'r''l'V n cabo?
vsorteio for sem rePosio?
I gttrrrit'ios guardam as bolas de voleibol e basqete. O armrio 1 tem 3
6.Paradois evento s A e B,num mesmo espao amostral, verifique, atravs ile um de vrrleibol eI de basquete, enquanto o armrio 2 tem 3 bolas de
diagrama, que sempre possvel escrever o evento A como sendO I r' ? clc basquete. Escolhendo-se, ao acaso, um armrio e, em seguida'
e"o A1U ( n B") e que, portanto, vale P()
: P(An B) + P(A B")'
tle runs bolus, citlcule a probabilidade dela ser:
7. Numa cidade do interior de So Paulo, estima-se que cerca de 20Va doS p vok ibol, sitbcndo-se que o armrio 1 foi escolhido' -
habitantes tm algum tipo de alergia. Sabe-se qne 50Vo dos alrgicos praticam burq,,.,*, sitbcnclo-se que o armrio 2 foi escolhido.0
esporte, enquanto que essa porcentagem entre os no alrgicos de 407o'PatA fu buE,lrrcte,
um indivduo aleatoriamente nessa cidade, obtenha a probabilidade
"r"olhido Fgclctrtcs clc uma Clnica de Ginecologia com idade acima de 40 anos,
de: trr rrrr lrtrn casadas e 407o so solteiras. Sendo solteira, a probabilidnde
a. No praticar esporte. ' ',
f tlrlo urn rlistrbio hormonal no ltimo ano de I07o , enquanto que poftl
b. Ser alrgico dado que no pratica esportes.
ftnrn I r e sstt probnb i I idade aumenta para 30Va' Pergunta-se :
8. As preferncias de homens e mulheres por cada gnero de filme alugado em QU*rl tr prtoltnbiliclade de uma paciente escolhida ao acaso ter tido um
uma locadora de vdeos, esto apresentadas na prxima tabela' dlrlr'trirt ltortttottal ?
Romance Policial e A pncierrte sortcada tiver distrbio hormonal, qual a probabilidade de ser
Sexo \ Filme Comdia
:sltit'u'/
92 248
excullr!'rnus cluits pacientes ao acaso e com reposio, qual
Homens 136 a
Mulheres r02 195 62
pfolruhilirlittlc clc pclo lrenos uma ter o distrbio?
Sorteando-se, ao acaso, uma dessas locaes de vdeo, pergunta-Se A
Yt* elttr,'g.tt il s!:tl amigo uma cart, destinada sua namorada, parat sgt
probabilidade de: :4111 tro crtrrcio. Entrcttnto, ele pode se esquecer com probabilidade 0,1 .
a. Uma mulher ter alugado um filme policial? llu Er. i,sr.lltec:cl', l probltrilidacle de que o correio extravie a carta de 0'1,
b. O filme alugado ser uma comdia? lSetttr:, st: liri cnviacla pclo correio a probabilidade de que a namorada nlio
c. Um homem ter alugado ou o filme ser um romance? * tscehrr rt tL: 0, I .
d. O filme ser policial dado que foi alugado por um homem? 1 Efu trrrrturt'urlit ttio rcccbctt o carta, qual a probabilidade de seu amigo tel
prquecirto tlc crtloct-la no corrcio'l
,f,Ooit dados equilibrados so lanados' Calcule a probabilidade de:
a. Obter o par (3,4), sabendo-se que ocorreu face mpar no prirneiro dado. br Avrrltr, rrs llossillilidnclcs clcsse rlanoro cotttinuar, se a comunicaiio
,,'i'
' ll. Ocorrcr face mpar no segundo ditdo, sabenclo-se quc ocorrcu acc par tepett,l,,r rltts ctrtits ottviitdas.
nO
pritttciro dado.
52 Captulo 2 : Probabilidade 53
ttr t,',,,.r
14. Numa certa regio, a probabilidade de chuva em um dia qualquer de Flnr'rtttlt'ttt' gua em at duas tentativas.
primavera de 0,1. Um meteorologista da TV acerta suas previses em 807o Eneottlt'rtr iigtta.
dos dias em que chove e em907o dos dias em que no chove.
a. Qual a probabilidade do meteorologista acertar sua previso? UFt ttrrurlico closconfia que um paciente tem tumor no abdmen, pois isto
b. Se houve acerto na previso feita, qual a probabilidade de ter sido um dia de nn 70(k' clos casos similares que tratou. Se o paciente de fato tivcr o
chuva? , u rxnno rrltra-som o detectar com probabilidade 0,9. Entretanto, se ele
tlvr.r o lurror, o exame pode, erroneamente, indicar que tem com
15. A tabela a seguir apresenta informaes de alunos de uma universidade lirlirrle 0,1. Se o exame detectou um tumor, qual a probabilidade clo
quanto s variveis: Perodo, Sexo e Opinio sobre a Reforma Agr'ria, lcnte t lo tlu lto?
Determine a probabilidade de escolhermos:
t*helu dos 1000 ingressantes de uma universidade,
rt segttir itpresenta dados
a. Uma pessoa do sexo masculino e sem opinio sobre a reforma agrria?
lnfolrrrrrt'ics sobre rea de estudo e classe scio econmica.
b. Uma mulher contrria a reforma agr6,ria?
c. Dentre os estudantes do noturno, um que seja a favor da reforma agrria? Area \ Classe Alta Mdia Baixa
d. Uma pessoa sem opinio, sabendo-se que ela do sexo feminino? Exatas L20 156 68
Perodo Sexo Reforma Agrria Humanas 72 B5 LL2
Biolgicas 169 I45 -q
L)
Masculino 8 9 8
&r du clussc ccontrrica mais alta.
&tg,l,tt'ttu rit'cit clc exatas.
Noturno Feminino 4 8 2
&tu,lgr t,,, 1il'r:i dc humanas, sendo de classe mdia.
Masculino T2 10 I gf du r'lrsstr bitixit, clado que estuda na rea de biolgicas.
16. Trs candidatos disputam as eleies para o Governo do Estado. O candidato it probabilidade de gostar de teatro , Il3, enquinto
t'r:r'lrr poprrlitiro,
do partido de direita tem30Vo da preferncia eleitoral, o de centro tem307o e o tlc gostlr rlc cinerna 112. Determine a probabilidade de gostar de tcatro
da esquerda 40Vo. Em sendo eleito, a probabilidade de dar, efetivamente, :lc citrt'rttir, rtos scguintes casos:
prioridade para Educao e Sade de 0,4; 0,6 e 0,9 para os candidatos de grlnl'rlt, lerrtnr o gostilr cle cinema so eventos disjuntos.
direita, centro e esquerda, respectivamente. lnrttu'rh' lntltrr o gostar de cinema so eventos independentes.
a. Qual a probabilidade de no ser dada prioridade a essas reas no prximo Fgd,,r rlllr' loslnr clc teatro gostm de cinema.
governo? A Frrihirlrilirlrtrlo clc gostitr de teittro e de cinema Ll8.
b. Se a rea teve prioridade, qual a probabilidade do candidato de direita ter t flenlre os (lue nio gostam de cinema, a probabilidade de nro gostar de tcitlro
,.
,.,,.
ganho a eleio? ;l/.1,
lf:.Uma companhia que fura poos artesianos trabalha numa regio escolhendo, I Tr hilrrir'ns lrrnccctn ecluipamcntos de preciso para o laboratrio tle
"leatoriamente, o ponto de furo. No encontrando gua nessa tentativa, sorteio lpflnlr.rt rlr' untit ttttivct'siditcle, Apesar cle serem aparelhos de preciso, cxiste
outro local e, caso tambm no tenha sucesso, faz uma terceira e ltirnn EFa prlut'nl clrirrrco clo subcstirniro ou superestimao clas rnecliclns
tentativa. Admita probabilidade 0,7 de encontrar gua em qualquer ponto dcssn *lttit,lrrq A tlbcln it scgttit' aprcscnta o collportamcnto do equiparncnto
regiro. Calcule a probabilidade de: Fdttrl,l,, t'!!t t'iltlll I'iillricl:
a. Encontrar rguir na seguncla tcntativa.
54 Captulo 2: Probabi E.ttt't'it'irts 55
Fbrica I Subestima Exata Superestima Uporrhl que X represente o nmero de horas de atividade fsica por semana.
Probabilidade 0,01 0,98 0,01 cnriirlcrc a tabela a seguir:
dele ser do sexo feminino? rrlr rlrl'irritlls courcl discretas ou contnuas, porm essa atribuio no
c. Qual seria a probabilidade de escolher um morador do Jardim Raposo quo e rlt';rt.trth-r tkr irrstrumento de medida e do estudo que est sendo feito.
tenha acesso a computador? letttlrlrr, rr virliiivol tninrero dc,filltos em.famlias discreta, enquanto o
d. Determine a probabilidade de escolher um entrevistado qr"re tcnha vinclo clo clr te'tt1'titt u utn t:erlo mulicdnrcn.o contnua. A discusso sobre
nordeste, seja do sexo feminino e estr trabalhando. Se esse rnoraclor bi iflr.tt;to rh' vrrliiivcis, lbitn lro Captulo l, serr utilizada em todo o texto e a
escolhido, qual a probabilidaclc delc tor cartcira assinacla? fEl rtl:.'tttrrt'itt ir itcrcscicln itqui pttt'it inclicar qtle, cada possvel valor,
r!1 unut prohullilidnclc clc ocorrlrciu. No caso discreto, a atribuio
57
58 Captulo 3: Varidveis Aleatrias Disc 59
folr,t,lrt1,t,,
ou ainda, tr
Dessa forma, se o jogador obtm 5 e a banca 6, temos G : 0 pois j < b (5 < ,2: Ituno de distribuio de probabildade
Por outro lado, se o jogador tira 3 e a bancaJ, o valor do ganho bruto do j $ Jiutr;iltt dc tlistribuio ou funo acuru.ulada de probabilidade de uma
serG:2x(3-1):4. lerrlririrr cliscretzr X definida, para qualquer nmero real r, pela
O espao amostral, correspondente a uma jogada, apresentado a xpl'rssto:
atravs dos pares (b, j): !
F(r): P(X < r) n
(1,1) (\,2) (1,3) (r,4) (1,5) (1,6
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6
J,.f,' llrrt populao de 1.000 crianas foi analisada num estudo para
(3,1) (3, 2) (3,3) (3,4) (3, 5) (3,6
n cl'ctiviclnclc de uma vacina contra um tipo de alergia. No estudo, as
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6
fer.t:lrirrnr r.rrna dose de vacina e, aps um ms, passavam por um novo
(5, 1) (5,2) (5,3) (5,4) (5,5) (5,6
r rritrrlir livcsscm tido alguma reao alrgica, recebiam outra dose da
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6
Ao lirrr rlc.5 closcs todas as crianas foram consideradas imunizadas. Os
O valor G : 0 acontecer quando o ponto do jogador for menor ou unrrr;rletos csto na tabela a seguir.
Supondo que uma criana dessa populao sorteada ao acaso, qual ser I(.r)
probabilidade dela ter recebido 2 doses? Utilizando a idia de atribui
l,oo
probabilidade atravs da freqncia de ocorrncia, a probabilidade desejada
9,954
288/1000:0,288. A funo de probabilidade da varivel aleatria nmero
doses recebidas fica sendo: ,7fltl
0,145
,113
Note que, tendo em vista que avarinel s assume valores inteiros, esse valor 012s45
inalterado no intervalo 12,3).Isto , F(2,L);F(2,45) ou F(2,99) tm todos
mesmo valor acirn*a. Por essa razo escrevemos: I,'lgura 3.2: Funo de distribuio - doses de vacina.
F(r):P(X<r) :0,533 Pata2 (r(3' 3,6.' Nurn cstudo sobre a incidncia de cncer foi registrado, para cada
eonr essc diagnstico, o nmero de casos de cncer em parentes
Os valores completos da funo de distribuio so os seguintes: (pais, ilrniros, tios, filhos, primos e sobrinhos). Os dados de 26 pacientes
irttes:
0
.ser<1;
0,245 se 1( r 12;
0,533 se 2( r13;
: 0,789 se 3(r14;
",r, 0,934 se 4( r15;
5
(freqncia esperada) calculado cono i:26x pi. Note que os valores tlc Sco 3.1:
esperados no precisam ser nmeros inteiros, pois representam uma freqncia
terica caso o modelo fosse adequado. A tabela a seguir apresenta os resultados: fltu*rlii viciada tem probabilidade de cara igual a 0,4. Para dois
nlos itttlcpcndentes dessa moeda, estude o comportamento da varivel
rlet rttnlr c lra um grfico de sua funo de distribuio.
Incidncia n; (observados) ei (esperados)
4
bgcu ltrt itrllrrnao que voc conhece, crie os valores e as respectivas
0 216
lirlrrrlcs f)ura a varivel nmero de filhos em famlias, no caso da
1 4 216
lsn eonsiclcrada ser:
2 6 7,8
lgx*e rtrr"dil paulistana.
3 6 7,9
hehitntrtcs clo interior do Maranho.
4 2 216
5 4 216 gtttittlro lturit chcgar a uma festa pode ser dividido em trs etapas. Sem
total 26 26 o tlrr.jeto I'cito em t hora. Se enganos acontecem na primeira etapa,
r,'l',1
[e l0 rninutos ao tempo do trajeto. Para enganos na segunda etapa, o ,t v
se r<10;
se 10(r1I2;
Notamos que os dados observados seguem a mesma tendncia do P(r) : se 12(r<13;
terico, porm seus valores so dis-crepantes. uma amostra pequena, mas se 1"3 ( r 125;
no haver boa adaptao entre os dois conjuntos de nmeros. se r)25.
{
I
68 Captulo 3: Variveis Aleatrias Disc I t lt't t n la lr ts D iscretos 69
Em muitas situaes prticas a varivel de interesse assume somente {F r'nrrsllrril a /rrvore de probabilidades, consideramos que a escolha dos
valores. Por exemplo, pea classificada como boa ou defeituosa; or loi I'cilir a partir de uma populao muito grande. Dessa forma, cadit
entrevistado concorda ou no com a afirmao feita; a vacina imunizou ou ebuullritkr torn probabilidade 0,80 de estar imunizado, independente dos
criana. Estas situaes tm alternativas dicotmicas, que genericamente vrlrros rllr populao. Se classificamos como sucesso a ocorrncia dc
ser representadas por respostas do tipo sucesso-fracasso. A atribuio de qual r, lururs ir repetio independente de trs ensaios de Bernoulli.
{Lle rlt'srrjirnros estudar o comportamento da varivel X: nmero dc
respostas ser referida como sucesso feita de modo arbitrrio, mas deve
definida claramente para evitar ambigidades. Esses experimentos recebem llrrrrrrizrrrkls nesse grupo. Ela assume os valores 0, 1,2 e 3 cont
nome de Ensaios de Bernoulli e d,o origem a uma varivel aleatria com le,ri t'ir['rrlirclas com o auxlio da rvore e apresentadas na tabela:
mesmo nome.
Dffinio 3.4: Modelo Bernoull Eventos Probabilidade X
TTT 0,8' J
Dizemos que uma varivel X segue o modelo Bernoulli se atribui ou
ocorrncia de fracasso ou sucesso, respectivamente. Com p representando ITI'' 0,Bz x 0,2 2
p
[( J J(: 0,8 x 0,2" 1
Defino 3.5: Modelo Binomial Em muitas situaes prticas, a varivel Binomial aparece a partir de
outras variveis, atravs da criao de duas categorias excludentes, como no
Considere a repetio de n ensaios de Bernoulli independentes e todos
excmplo a seguir.
com a mesma probabilidade de sucesso p. A varivel aleatria que conta o
nrmero total de sucessos denominada Binomial com parmetros n e p e sua Ilxemplo 3.9: O escore em um teste internacional de proficincia na lngua
funo de probabilidade dada por itrglesa varia de 0 a 700 pontos, com mais pontos indicando um melhor
rlcscmpenho. Informaes, coletadas durante vrios anos, permitem estabelecer o
$
P(X : rl : (i,)ru (i - p)''-k, k : 0,L,2,...,n,
scgr.rinte modelo para o desempenho no teste:
X l 8 9 10 11 12
Definindo uma nova varivel X como o nmero de estudantes aptos
0,101 0,042 0,012 0,002 0+ 0+
Pt
tlrttlrc os 20, temos que X - b(20;0,10). A probabilidade de no mximo 3 serem
nptos calculada pela funo de distribuio no ponto 3, ou seja,
O valor 0+ indica uma probabilidade muito pequena que, na aproximao de F(3) :P(x<3).
rnilsimos (3 casas aps a vrgula), no teve casa decimal diferente de zero.
Diversos programas computacionais contm rotinas que calculam as I)'ssr brma, temos:
probabilidades da distribuio Binomial e alguns livros-texto incluem tabelas
dessa clistribuiiro, para vrios valores dos parmetros.
!
Filhotes 0 2 3 4 5 6 7 8 9 t0
: 0,r22 + 0,270 + 0,285 + 0,190 : 0,867. lrrccl. Observada 0 1 6 7 23 26 2t t2 ,) I 0
I'cq. Esperada 0,1 I 4,4 tr,7 20,5 24,6 20,5 I,7 4,4 1 0,1
Esse valor reflete as altas probabilidades atribudas aos escores menores de 600,
conforme o modelo de desempenho no teste. tr O modelo proposto parece se ajustar bem aos dados observados (veja a
F'igtrra 3.4) e tendemos a acreditar que o modelo Binomial uma escolhn
Exemplo 3.10: Um veterinrio est estudando o ndice de natalidade em porcos
ttdccluada. A representao grfica torna-se assim, um importante passo inicial
sujeitos inseminao artificial. Para tal, coletou informaes sobre a varivel
purt auxiliar na escolha de um modelo probabilstico. A verificao aqui foi
nmero de fllhotes nascidos vivos em cada uma das 100 inseminaes re'alizadas
flpcnas visual, mas possvel estabelecer procedimentos estatsticos que testam o
com o mesmo reprodutor. A tabela a seguir apresenta os resultados.
ajustc do modelo proposto de forma objetiva. Procedimentos mais rigorosos
devcrn ser utilizados para a deciso final e podem se basear em um teste
Nmero ) 2 J 4 5 6 7 8 9 estirtstico conhecido como Teste de Aderncia. tr
Freq. Observada 1 6 7 9a 26 2L L2 t
t) 1
a Observada
muito comum buscar estabelecer um modelo para a varivel de interesse, o que o Esperada
nesse caso possibilitaria, por exemplo, p comparao entre diferentes
reprodutores. O veterinrio informa que 11 ou mais filhotes nascidos vivos uma
ocorrncia muito rara e pode ser desprezada em termos de model. Nestes termos,
ele sugeriu considerar que a varivel N: nmero de filhotes nascidos vivos,
poderia ser ajustada pelo modelo Binomial com parmetros n : 10 e p: 0,5. O
que voc acha da sugesto do veterinrio?
Note que, mesmo no tendo havido nenhuma observao do valor 0 ou
10, o veterinrio sugeriu o modelo de uma varivel que contm esses valores, pois
apesar de no serem comuns eles podem acontecer. Com o modelo sugerido,
calculamos as probabilidades de cada um dos valores de 0 a 10 e, a partir deles, os
resultados que seriam esperados em 100 inseminaes realizadas. Por exemplo,
7 I I 10
Filhots
P(N :7) : (;o,t'0,53: o,rr.;
Fgura 3.4: Grfico de freqncias- natalidade em porcos.
76 Captulo 3: Variveis Aleatrias Discretas .,.1 Outros Modelos Discretos 77
escola.
lr.P(8<X<10).
c. P(X 12 ou X > 11).
c. O dia da semana em que ocorrem mais acidentes de trabalho numa indstria.
d. O ms do ano com maior nmero de enchentes na cidade de So Paulo. d.P(X ) tL ou X > 13).
a.P(X)3eX<6).
2. Sendo X uma varivel seguindo o modelo Uniforme Discreto, com valores no r. P(x < 13lx > 11).
conjunto {L,2,3,.. . , 10}, pergunta-se:
a. P(X > 7\. 6. Urna certa doena pode ser curada atravs de procedimento cinirgi co em 80Vo
/
dos casos. Dentre os que tm essa doena, sorteamos 15 pacientes que sero
b.P(3 <X<7).
P(X 12 ou t > submetidos cirurgia. Fazendo alguma suposio adicional que julgar
' c. 8).i
nccessria, responda qual _a probabilidade de:
d..P(X)5ouX>B)) ru. Todos serem curados? L--
',1f.e.P(X)3e X<6).
P(x < e lx 2 o;.r
\,
ll. Pelo menos dois ro serem curados?
c. Ao menos l0 ficarem livres da doena?
3. Um usurio de transporte coletivo chega pontualmente s 8 horas para pegar o
seu nibus. Devido ao trnsito catico, a demora pode ser qualquer tempo
7. Calcule a funo de distribuio da varivel X nos casos:
t. X Bernoulli com p : 0,6.
entre 1 e 20 minutos (admita que o relgio "pule" de minuto em minuto).
b. X - b(4;0,20).
Pergunta-se:
a. Qual a probabilidade de demorar mais de 10 minutos? e c. X - b(B;O,10).
b. Qual a probabilidade de demorar pelo menos 5 mas no mais de 10 minutos?
c. Qual a probabilidade da demora no chegar a 5 minutos?
q._
d. Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo nibus (que
3.3 Outros Modelos Discretos
/n ainda no passou), qual a probabilidade do amigo atrasado esperar at 3 Apresentamos, nesta seo, os modelos Geomtrico, Poisson c
minutos? L lliptrgcomtrico, que tm vrias aplicaes prticas, conforme ilustram os
e'xcrnrplos desta seo. Na seo anterior, os modelos definidos assumiram apenas
4. Discuta a validade do modelo Binomial nos seguintes casos:
rrrrr nmero finito de varlores distintos. Foi assim com o modelo Unifbrme
a. Dos alunos de uma grande universidade, sorteamos 5 e contamos quantos se
l)iscrcto com valores L,2,,..,;, Bernoulli com 0 e L e Binomial com os valores
declaram usurios de drogas.
If,t
1,...,n,
Como veremos a seguir, os modelos Geomtrico e Poisson podem ter P(Q=
0,
um nmero infinito de valores dentre os inteiros positivos. 0,010
t p) :et
llc(luena para valores grandes de k. Em tese, a produo nunca seria interrompida
- p)^ :
@mm
k): r_fr1: r
8"," - [of -
(1 se rriro houvesse o aparecimento de uma pea defeituosa. tr
Detnio 3.7: Modelo Poisson
Exemplo 3,11: lJma linha de produo est sendo analisada para efeito de Uma varivel aleatria X tem distribuigo de Poisson com parmetro
controle da qualidade das pas produzidad. Tendo em vista o alto padro > 0, se sua funo de probabilidade dada por
requerido, a produo interrompida para regulagem toda vez que uma pea
e-]'k
defeituosa observada. Se 0,01 a probabilidade da pea ser defeituosa, estude o \/kl=/c) :
P(X , k : 0,1,2, ... ,
comportamento da varivel Q, quantidade de peas boas produzidas antes da la.
defeituosa. cor o parmetro sendo usualmente referido como a taxa de ocorrncia, A
Vamos admitir que cada pea processada tem a mesma probabilidade de notuo utilizadaser X- Po(\). tr
ser defeituosa, independentemente da qualidade das demais. Sendo a ocorrncia
de pea defeituosa um sucesso, podemos aplicar o modelo Geomtrico. Observe O modelo Poisson tem sido muito utilizado em experimentos fsicos e
que o nmero de peas boas produzidas exatamente o quanto se "espera" para a lriolgicos e, nesses casos, a freqncia mdia ou esperada de ocorrncins
ocorrncia do primeiro sucesso. Temos,
trtrrn determinado intervalo de tempo, Vamos verificar que a expresso
rrprcsentada realmente representa uma funo de probabilidade. No difcil
:k) :0,01 x 0,99', k:0,L,2,"', rrlrscrvar que, para qualquer k, ela um nmero positivo. Resta mostrar que tls
P(Q
prrrllabilidades somam 1. Temos,
cuja representao grfica est na Figura 3.5.
80 Captulo 3: Variveis Aleatrias Discretas Otrtros Modelos Discretos 81
=1,.1
aqui poderia ser feita de modo mais objetivo atravs de Testes Estatsticos de Acaixa pode ter peas boas ou defeituosas e vamos sortear algumas
Aderncia. tr pcas, sem reposio. Baseado no nmero de peas defeituosas encontradas
Encerramos esta seo, definindo o modelo Hipergeomtrico. Este rlccidimos por aceitar ou rejeitar o lote. Seja D a varivel que conta o nmero de
moclelo surge da contagem de objetos de certo tipo, retirados ao acaso e sem pcras defeituosas neste sorteio. Ela segue o modelo Hipergeomtrico e vamos
reposio, de um conjunto contendo dois tipos de objetos. Por exemplo, num itlcrrtilicar os diversos parmetros. O total de peas n:25, o nmero de
grupo de jovens com 5 meninas e 5 meninos, sorteamos 3 deles ao acaso, para elel'cituosas m : 4 e o nmero de retiradas r: 5.
azer uma comisso. O sorteio ser feito sem reposio, para evitar a escolha de P(aceitar o lote) : P(no mximo 2 peas defeituosas) : P(D < 2).
utri mesma pessoa, o que inviabilizaria a formao da comisso. Na primeira
escolha cada um dos 10 jovens tem 1/10 de probabilidade de ser sorteado. Na
lintiio,
segunda, cada um dos 9 restantes, ser sorteado com probabilidade I/9 e, na
terceira, 1/8. A varivel aleatria nmero de meninas na comisso segue o modelo
: ().(';) . ()=('i ) . ()=!'il -0,e84
Hipergeomtrico, conforme definido abaixo.
Definio 3.8 : Modelo Hipergeomtrco
p(D<r)
('J) (',J) (',J)
Considere um conjunto de n objetos dos quais mso do tipo I e n - m C-onclumos que, mesmo havendo quatro defeituosas na caixa inspecionada, a
so do tipo II. Para um sorteio de r objetos (r < n), feito ao acaso e sem probabilidade de aceitar o Iote 0,984 ou, equivalentemente, para rejeitar o lote a
reposio, defina X como o nmero de objetos de tipo I selecionados. Diremos prolrabilidade 0,016. Claro que, na prtica, no saberemos quantas peas
que a varivel aleatria X segue o modelo Hipergeomtrico e sua funo de rlccituosas existem em cada caixa. Entretanto, a probabilidade calculada acima
probabilidade dada pela expresso purlcria ser um indicativo para avaliar se o critrio do controle de qualidade est
t'rrzoiivel ou no e, neste caso, parece que no! Poderamos tambm criar uma
P(X:*)-,^., _
(T) (",--T
/n,\
) ,k:A,I,...,min(r,rn).
,-_ ., , ^;^t_ tr
tobcla contendo os valores da probabilidade de rejeio do lote, em funo de
Irrrvcr certo nmero de peas defeituosas na caixa sorteada. tr
("/
l,lxcrccios da Seo 3.3:
Note que os valores possveis de X vo de 0 a min(r,rn), uma vez que
no podemos ter mais do que o nmero de objetos existentes do tipo I, nem l. Scndo X(DG(0,4), calcule:
tillnpouco mais que o total de sorteados. Utilizando resultados de anlise n. P(X:3).
combirratria, pode-se verificar que a expresso de P(X : k) um nmero no b.P(2<X<4).
negativo entre 0 e 1 e a soma, para todos os valores de k, igual a l. Assim esto c. P(X > LIX < 2).
cumpridos os requisitos necessrios para ser uma funo de probabilidade. rl. P(X > 1).
Exentplo 3.14: Uma ftbrica produz peas que so embaladas em caixas com 25 2. IJrrrir moeda equilibrada lanada sucessivamente, de modo independente, at
(f ue ocorra a primeira cara. Seja X avarivel aleatria que conta o nmero de
unidades. Para aceitar o lote enviado por essa fbrica, o controle de qualidade de
uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, lirnamentos anteriores ocorrncia de cara. Determine:
sorteia cinco peas, sem reposio, dessa mesma caixa. Se constatar no mximo u. P(X < 2).
dr"ras defeituosas, aceita o lote fornecido pela fbrica. Se a caixa sorteada tivesse 4 b. P(X > 1).
pcas defeituosas, qual seria a probabilidade de rejeitar o lote? c.P(3<x<5).
rl. Quantas vezes deve, no mnimo, ser lanada a moeda para garantir a
ocorrncia de cara com pelo menos 0,8 de probabilidade.
8{ Captulo 3: Variveis Aleatrias Discretas
3,4 [ixerccios
a. Os dois serem do primeiro ano? 9. Num certo restaurante, paga-se pelo almoo uma quantia fixa dependendo da
b. A empresa gastar no mximo 3 salrios mninos com os estgios? escolha feita de prato e bebida. A carne de peixe tem I}Vo de preferncia,
c. Sabendo que gastou pelo menos 4, gastar menos de 7 salrios mnimos? enquanto frango tem 40Vo e carne bovina 50Vo. As trs escolhas de bebida
esto condicionadas opo do prato, segundo a tabela abaixo:
6. Uma varivel aleatria X tem a seguinte funo de distribuio:
e. Mais da metade das partidas. lS.Considere uma varivel aleatria Xassumindo os valores 0,1,2,...,5 e tal
clLre P(X : j) :/c x 0,8 x 0,2i, i : 0,L,2,...,5.
12.tJm certo equipamento expedido em lotes de 500 unidades. Antes que uma
remessa seja aprovada, um inspetor escolhe 5 desses equipamentos e os ir. Para qual valor de k a expresso acima uma funo de probabilidade?
inspeciona. Se nenhum dos equipamentos inspecionados for defeituoso, o lote lr. Calcule P(X :3 I X < 5).
aprovado. Se um ou mais equipamentos forem defeituosos, todos as unidades lr. Uma vacina contra a gripe eficiente em707o dos casos. Sorteamos, ao acaso,
so inspecionadas. Suponha que existam, de fato, dez equipamentos 20 dos pacientes vacinados e pergunta-se a probabilidade de obter:
defeituosos no lote. Utilizando uma suposio conveniente, qual , a ru. Pelo menos 18 imunizados.
probabilidade de que seja necessrio testar todos os equipamentos? b. No mximo 4 imunizados.
13. Suponha que um modelo terico para a varivel notas em um teste de histria c. No mais do que 3 no imunizados,
(X), dado por: 17. 25Vo dos universitrios de So Paulo praticam esporte. Escolhendo-se, ao
ilcilso, 15 desses estudantes determine a probabilidade de:
P(X: i1 : lj - 111
, j:0,7,2,...,10. a. Pelo menos 2 deles serem esportistas.
66
b. No mnimo 12 deles no serem esportistas:
Para 2l alunos submetidos a esse teste, apresentamos um resumo de suas c. Havendo mais de 5 esportistas no grupo, obtermos menos de 7 que praticam
notas: esporte.
Notas Freqncia Itl. As pacientes diagnosticadas com cncer de mama precocemente tm 80Vo de
0-2 6 probabilidade de serem completamente curadas. Para um grupo de 12 pacientes
2-4 10 lessas condies, calcule a probabilidade de:
:r. Oito ficarem completamente curadas.
4-6 5
ll. No serem curadas de 3 a 5 pacientes.
6F8 5 c. No mais de 2 permanecerem com a doena.
8 Ft10 1
19. A resistncia (em toneladas) de vigas de concreto produzidas por uma
clrpresa, comporta-se conforme a funo de probabilidade abaixo:
Um professor desconfia que o modelo no adequado. O que voc acha?
Resistncia
14. Um laboratrio estuda a emisso de partculas de certo material radioativo.
Seja l/; nmero de partcula; emitidas em I minuto. O laboratrio admite que
l/ tem funo de probabilidade Poisson com parmetro 5, isto , Admita que essas vigas so aprovadas para uso em construes se suportarem
pclo menos 3 toneladas. De um grande lote fabricado pela empresa,
P(.^/ : k) :;, --5 ^A k:0,7,2,.... cscolhemos 15 vigas ao acaso. Qual ser a probabilidade de:
a. Todas serem aptas para construes?
a. Calcule a probabilidade de que em um minuto no haja emisses de
ll. No mnimo 13 serem aptas?
partculas.
b. Determine a probabilidade de que pelo menos uma partcula seja emitida em 2{). Ern momentos de pico, a chegada de avies a um aeroporto se d segundo o
um minuto. rnodelo Poisson com taxa de 1 por minuto.
c. Qual a probabilidade que, em um minuto, o nmero de partculas emitidas ru. Determine a probabilidade de 3 chegadas em um minuto qualquer do horrio
esteja entre 2 e 5 (inclusive)? de pico.
90 Captulo 3: Variveis Aleatrias Discretas 3,4 Ii.rerccios 91
b. se o aeroporto pode atender 2 avies por rninuto, qual a probabilidade de 24, Considere uma varivel aleatria X - G (0,8). Construa uma nova varivel
haver avies sem atendimento imediato? )/ tal que Y : X para os valores 0,1,2,...,5 e Y : 6 para X ) 6. Dessa
c. Previses para os prximos anos indicam que o trfego deve dobrar nesse rrma, Y corresponde ao truncamento de X a valores menores ou iguais a 6.
aeroporto, enquanto que a capacidade de atendimento poder ser no ( )btenha a funo de probabilidade de Y e calcule:
mximo ampliada em 50vo. como ficat a probabilidade de espera por r. P(Y :2).
atendimento?
b. O valor da funo de distribuio (acumulada) no ponto 2,5.
21. IJma indstria de tintas recebe pedidos de seus vendedores atravs de fax, c. P(Y :
3lY < 5).
telefone e Internet. o nmero de pedidos que chegam por qualquer meio (no d.P(Y>3eX<8).
horrio comercial) uma varivel aleatria discreta com distribuio Poisson
25. A durao (em centenas de horas) de'uma lmpada especial segue o modelo
com taxa de 5 pedidos por hora.
Ceomtrico com parmetro t :0,7. Determine a probabilidade da lmpada:
a. Calcule a probabilidade de mais de 2 pedidos por hora.
rr. Durar menos de 500 horas.
b. Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50
b. Durar mais de 200 e menos de 400 horas.
pedidos?
c. Sabendo-se que vai durar mais de 300 horas, durar mais de 800 horas.
c. No haver nenhum pedido, em um dia de trabalho, um evento raro?
rl. O item anterior uma aplicao de um resultado geral vlido para o modelo
22. No estudo do desempenho de uma central de computao, o acesso unidade Geomtrico. Assim, mostre que para X - G (p) e quaisquer nmeros
central de Processamento (cPU) assumido ser poisson com 4 requisies inteiros positivos rn e n,vale P(X > m * nlX > m) = P(X > n).
por segundo. Essas requisies podem ser de vrias naturezas tais como:
imprimir um arquivo, efetuar um certo clculo ou enviar uma mensagem pela 2r. l}n um estudo sobre o crescimento de jacars, uma pequena lagoa contm 4
cxemplares de espcie A e 5 da espcie B. A evoluo de peso e tamanho dos 9
Internet, entre outras.
a. Escolhendo-se ao acaso um intervalo de 1 segundo, qual a probabilidade .iacars da lagoa acompanhada pelos pesquisadores atravs de capturas
pcridicas. Determine a probabilidade de, em trs jacars capturados de uma
de haver mais de 2 acessos cPU? E do nmero de acessos no ultrapassar
vcz, obtermos:
5?
ru. Todos da espcie A.
b. considerando agora o intervalo de 10 segundos, tambm escolhido ao acaso,
b. Nem todos serem da espcie B.
qual a probabilidade de haver 50 acessos?
c. A maioria ser da espcie A.
23. Toda manh, antes de iniciar a produo, o setor de manuteno de uma
27, Un livreirodescuidado mistura 4 exemplares defeituosos junto com outros 16
indstria faz a verificao de todo o equipamento. A experincia indica que em
pcrfeitos de um certo livro didtico. Quatro amigas vo a essa livraria para
95vo dos dias tudo est bem e a produo se inicia. caso haja algum problema,
cornprar seus livros escolares.
uma reviso completa ser feita e a indstria s comear a trabalhar aps o
ir. Calcule a probabilidade de 3 levarem livros defeituosos.
almoo. Faa alguma suposio adicional que julgar necessria e respond:
ll. Qual a probabilidade de, aps a visita dessas meninas, restarem o mesmo
a. Qual a probabilidade de demorar 10 dias para aprimeira reviso completa?
nmero de defeituosos na livraria? E de no restar nenhum?
b. E de demorar pelo menos l5 dias?
c. um esquema de manuteno, com reviso preventiva, est sendo montado 2ll. (Use o computador) Para os dados apresentados na Tabela l.l no Captulo l.
de modo a evitar a reviso completa num dia aleatrio. Deterrrine um dia d, l. Construa a tabela de freqncias para a varivel Exer, horas de atividade
tal que probabilidade de quebra alm de d seja pelo menos igual a 0,6. i'sica por semana.
Revisando conr intervalos de d dias, o que estaremos garantindo? b. Suponha que 5 pessoas so selecionadas ao acaso. Qual a probabilidade de
que 3 delas pratiquem, pelo menos, 6 horas de atividade fsica por semana?
92 Captulo 3: Variveis Aleatrias Discretas
29. (Use o computador) Considere a varivel altura apresentada na Tabela 1.1, Medidas Resumo
Captulo 1.
a. Crie uma varivel lj assumindo o valor 1 se a altura do indivduo e for
maior que a mdia de altura da populao (indivdu os altos) e 0 caso
contrrio (indivduos baixos). Apresente a distribuio de freqncia para 4.1 Introduo
esta varivel e uma representao grfica adequada. Neste captulo, vamos apresentar algumas medidas que buscam sumarizar
b. Suponha que 13 alunos vo ser sorteados com reposio e a cada
um deles s informaes disponveis sobre o comlortamento de uma varivel. podemos
ser associada uma varivel V, ,i:1, ..., 13. Defina X: nmero de alunos del'inir essas medidas nos casos de ur.t cilnto de dados u de uma funo de
altos. Como voc expressaria X em termos das variveisY, i,: 1, ..., 13? prrrbabilidade de varivel aleatria. Apesar danatureza diferente de cada caso, as
c. Obtenhauma amostra de 100 valores da varivel X, isto , repita 100 vezes itcrtlidas tero a mesma interpretao, variando apenas na forma de serem
o sorteio de 13 alunos nas condies do item (b). Construa uma tabela de trlcu ladas.
freqncias. Lembremos que, no Captulo 1, tivemos a oportunidade de discutir
d. Qual seria o modelo de probabilidades adequado para as variveis Y;, Illg,ttrnas tcnicas para estudar e apresentar descritivamente quantidades na
'i : L,...,73? O modelo Binomial se aplica para X? Em caso afirmativo, peipulao, seja por tabelas de freqncias ou por grficos adequados. o conjunto
quais seriam os parmetros? Justifique suas resposta. (Uma boa idia tle dados com que trabalhamos poderia ser toda a populao ou apenas uma parte
calcular valores esperados e observados e coloc-los em um mesmo delir. J estudamos, no captulo anterior, que a representao de eventos de
grfico). lnlcrcsse pode ser feita atravs de variveis aleatrias discretas e definimos alguns
e. Assumindo que o modelo Binomial adequado para X: ntotlclos cuja ocorrncia na vida prtica mais comum.
i. Calcule P(X :7), P(X < 9) P(0 S X < 13). Nosso interesse caracterizar o conjunto de dados atravs de medidas que
"
ir'. Qual a probabilidade de pelo menos 4 alunos serem baixosT E de fsstlllim a informao, por exemplo, representando a tendncia central dos dados
mais de 7 e menos do que 12 alunos serem altos? gu ir rnaneira pela qual estes dados esto dispersos. Tais medidas tambm podem
FL'r' tlcfinidas para variveis aleatrias, permitindo caracteriz-las de forma
30. (Use o computador) Considere os dados do arquivo aeusp.txt descrito no
etrrclhante ao que feito para um conjunto de dados qualquer.
Exerccio 26, Captulo L
a. Para a varivel Temposp, construa uma tabela de freqncia com faixas de
tamanho 10, a partir dq zero. Obtenha o histograma correspondente e 4.2 Medidas de Posio
discuta a adequao de algum modelo discreto a esses dados. Se estamos numa parada de nibus urbano e nos pedem alguma
b. Faa um histograma da varivel Resid. Verifique se o modelo Binomial com llr'orrnao sobre a demora em passar um determinado nibus, que diremos?
parmetros n: l0 e p : 0,5 seria adequado para representar o Nirrgtrrn imagina que poderamos dar como resposta uma tabela de freqncias
comportamento dessa varivel na populao. rltr(' l)acientemente coletamos no ltimo ms, ou ano! Tampouco, seria adequado
ttllt1'scltar um modelo terico pelo qual teramos ajustado o comportamento da
virrirvcl aleatria de interesse. Quem perguntou deseja uma resposta breve e
t,tllrirla que sintetize a informao que dispomos e no uma completa descrio dos
tlltrlos colctados ou da modelagem que porventura fizemos.
e3
94 Captulo 4: Medidas Resumo 1,) Madidas de Posio 95
Nesta seo, definiremos medidas de posio ot medidas de tendncia Notcr que o nmero de parafusos, em cada caixa, um valor inteiro, porm, a
central para um conjunto de dados qualquer (populao ou amostra) e, ento, Ftrlirr no precisa ser necessariamente um nmero inteiro, Para este exemplo,
consideraremos as correspondentes definies para variveis aleatrias. tclrros que, em mdia, as caixas contm 98,6 parafusos.
Colocando os dados em ordem crescente, obtemos: 95,96,97,98,99,99,
Definio 4./: Medidas de posio para um conjunto de dados 100, 100, 100 e 102. Neste caso, como o nmero de elementos no conjunto de
datlos 10, um nmero par, tomamos a mediana como sendo a mdia dos dois
Considere uma varivel X com observaes representadas por
Yhrrcs que ocupam a posio central. Temos
1,t2,... ,tn,. A mdia desse conjunto a soma dos valores dividida pelo nmero
total de observaes. Isto
: 99+99
,
ftrdrh, : 99.
n
D*u
Iohs:
rL+ir2*..,*rI, i:T E imediato que o valor mais freqente 100 e assim, mo,,1,. - L00. tr
n
As medidas de posio podem ser utilizadas em conjunto para auxiliar a
A mediana, representad a pot rnd,,6r, o valor que ocupa a posio central ndliso dos dados ou, em determinadas situaes, uma pode ser mais conveniente
dos dados ordenados. 6o rpr,: a outra. Por exemplo, se um ou mais valores so muito discrepantes do que
A moda dada pelo valor mais freqente e ser denotada po moobs. gerirl das observaes, a mdia ser muito influenciad.a por este valor, tornando-
Se houver possibilidade de confuso, faremos meno varivel X 1 nssirn, inadequada para representar aquele conjunto de dados. Se uma das
representando a mediana e a moda por md,,6r(X) e mo,,6r(X) tr lxirs ao invs de 95 tivesse 45 parafusos, a mdia passaria de 98,6 para 93,6.
NcFl('' cilso, como a mediana no afetada por valores discrepantes, seu uso seri0
Note que as definies acima tambm podem ser aplicadas quando o
ffiis irclcquado para representar os dados. Por outro lado, para conjuntos de dados
conjunto de dados j est organizado numa tabela de freqncia. Por exemplo,
ttr rrruitas observaes, a mediana difcil de ser calculada, uma vez que o
para a mdia temos
pfoccsso de ordenao custoso, mesmo com o uso de computadores. nindn
A:
Egtttrrrrr o aparecimento de distribuies multimodais, isto , conjuntos de dados
ntrt * n2r2 * "' I TT'xAt
Dr,.ru f-?'i
i:l
;
QE:-r possuem mais de uma, moda. Como regra geral, .precisamos usar essfls
rohs:
nt*"'lnk, n - 4n*" ffieclitlirs com o cuidado de no distorcer informaes e caractersticas dos dados
qu rlril iunos analisando.
embalagem. Temos,
,,!0/l'
md'o1,"(X) : 75" + 76" I+2
9Bc f I02c *.'. * 100c 986 c t' .j'',
MdiadeL:lnbs: : 98,6 c. /'
10 10 : 1.
n"ff\P.To,,,(x)
Para a mediana segue que, Potlt scr de intese estudar o gasto dos alunos associado com as despesas do
stilrular. Para simplificar um pouco a situao, vamos supor que se atribui, para
mdr,6r(L) : 99c*99c :99c, du irluno, uma despesa fixa de R$ 1300, relativa preparao e mais R$ 50 para
Eeltr vcstibular prestado. De posse dessas informaes, vamos calcular as medldas
e, sern maiores dificuldades, moo65(L) : 100 c. Conclumos que a multiplicao e posio da varivel D: despesa com vestibular. Pela definio desta nova
;rcla constante c resultou em que as novas medidas de posio so as antigas QUnrrlirladc temos
nrultiplicadas por c. 50x
Vamosincluiragoraocustodaembalagem.Ascaixascustaro t! --
LCgt,, clo clculo que fizemos, vem imediatamente que
98c * e, L02c*e,..., 100 c+e.
oh.,:50 x 1,73 * 1300 :
Entro,
,,hs:
(9Bc + e) +... + (100c + e) _ 9B6c * 10e :98,6c * e.
md,o1,r(D) x 1,5 * 1300 : 1375;
10 10
Il fcil ver que para a mediana md"6,(T) : 99c * e e que para a moda, mo"1,"(D) : 50 x 1+ 1300 : 1350. fI
tno,1,"(T): 100c * e. Dessa forma, o acrscimo por uma quantidade e teve o fuenplo 4.4: l-lm estudante est procurando um estgio para o prximo ano. As
e'eito de somar essa mesma constante s medidas de po.sio. n Btttltrurlrias A e B tm programas de estgios e oferecem uma remunerao por
Iixemplo 4.3: Foram coletadas 150 observaes da varivel x, representando o lr,,r',,* semanais com as seguintes caractersticas (em salrios mnimos):
ttnlaro de vestibulares FUVEST (um por ano) que um mesmo estudante prestou,
Assim, foi observado que 75 estudantes prestaram vestibular FUVEST, uma nica Companhia A B
vcz, e assim por diante. Os dados esto na tabela abaixo: mdia )5 2,0
mediana T,7 1.9
moda 1,5 l,g
QUttl c.rrnpanhia mais adequada?
lrricialmente vamos discutir as informaes fornecidas, supondo que o
lttttlirrrtc tert seu salrio "escolhido" de acordo com uma poltica salarial
FcErrrrritlir na tabela anterior. A companhia tem 50vo dos seus estagirios
Calculando as medidas de posio de X, obtemos @r'elrrtttltl (: l,'7 salrios mnimos e o valor com maior freqncia de ocorrncia
, f ,t, ('rrro a mdia 2,5 deve haver alguns poucos estagiiios com salrio bem
Ix75t_2x47-t3x2I+4x7 : lltris irlo, isto , valor alto de salrio com freqncia pequena de ocorrncia. A
I $#t'l''' - Lr73;
150 Elrtlrttttltiit R tem as trs medidas bem prximas indicando umaazovel simetria
\' ltttr: slltrios altos e baixos. A opo do estudante depender de sua qualificao.
9, Captulo 4: Medidas Resumo 99
1,2 Al*lidas de Posio
Se ele for bem qualificado, deve preferir a companhia ,4, pois ter mais chance de
irlgurnas situaes, as desigualdades so satisfeitas por qualquer valor num
obter um dos altos salrios. Se tiver qualificao prxima ou abaixo dos outros
o intervalo e, nesse caso, tomamos a mediana como o ponto mdio do
cstudantes, deve preferir a B que parece ter uma poltica mais homognea de
salrios. tr A moda o valor (ou valores) da varivel que tem maior probabilidade de
vamos, agora, descrever algumas medidas associadas s variveis Egrt'ttcia, representando-a por Mo, temos
aleatrias eue, como j mencionamos, sero correspondentes s medidas
P(X : Mo) : max (P1, Pz,' ' ', Pn)' tr
apresentadas para um conjunto de dados.
sabemos que a descrio completa do comportamento da varivel 4.5: Considbre a varivel aleatria X com a seguinte funo discreta de
aleatria discreta , feita atravs da sua funo de probabilidade. Assim sendo,
razovel pensar que, qualquer que seja a quantidade destinada a resumir esse
comportamento, sua definio dever envolver, de alguma forma, essa funo de
probabilidade.
A medida mais popular o valor esperado, ou simplesmente mdia, el Enttts.
representa o ponto de equilbrio da distribuio de seus valores. Da mesma forma,
como mencionado no caso de um conjunto qualquer de valores, o uso do valor /,.= t i ipi: (- 5) x 0,3 * 10 x 0,2 * 15 x 0,4+20 x 0,1 :8,5.
esperado como sntese de toda a informao pode levar a distores e
interpretaes equivocadas. Em especial, possvel construir uma funo de A mrrrll o valor com maior probabilidade e, portanto, segue q1ae Mo: 15. Por
probabilidade, com valores da varivel muito diferentes uns dos outros, em que a ltnr lnclo, a mediana poder ser qualquer nmero entre 10 e 15, pois, para
rndia no caracteriza o real comportamento da varivel aleatria. A mdia junto P e I ttt, J.5], temos
com a moda e a mediana so medidas de posio ou de tendncia central e so
clefinidas a seguir.
P(X<b)>0,5 e P(X >b) >0,5.
Suponha que os possveis valores da varivel aleatria sejam Md:12,5 (ponto mdio do intervalo). tr
ftln c'orrveno adotada, tomamos
rcpresentados por tt, 12, . . . , t., com correspondentes probabilidades
'l)t,'l)2,',. ,Pk. O$serve que nem a mediana, nem a mdia precisam ser valores assumidos
peln vrrrirvel aleatria. No exemplo anterior, a mdia de X foi 8,5 e a mediana
De.finio 4.2: Medidas de posio para vardveis aleatrias discretas
13,i tpro so valores no assumidos pela varivel aleatria'
A mdia, valor esperado ol esperana de uma varivel X dada pela l)c modo similar ao ocorrido com as medidas de posio num conjunto de
cxprcsso: dcrl,rs, ir rnultiplicao ou a adio de constantes a uma varivel aleatriafaz com
gue suis medidas de posio fiquem multiplibadas ou acrescidas pelas mesmas
: Dr,
E(X) ou . Elllslitttlcs.
' i:L
Eremplo 4... Considere uma v. a. X com funo densidade discreta dada por
umer notao alternativa representar E(x) por px ou simplesmente p, se no
Itouver possibilidade de confuso.
A mediana o valor Md que satisfaz s seguintes condies
P(x > Md)>Ll2 e P(x < Md) > 1/2. Nnrr rl tlil'cil verificar que f/ : 10,3; Md : 8 e Mo : 5. Se uma nova varixelY
rrlrlitlir it partir de X atravs de Y : 5 X - 10, sua funo de probabilidade ser
100 Captulo 4: Medidas Resumo
4,2 Medidas de Posio 101
.1. Ntrrn experimento, l5 coelhos foram alimentados com uma nova rao e seu
pcso avaliado ao fim de um ms. Os dados referentes ao ganho de peso (em I
c. calcule, a partir da tabela de freqncia e com o ponto 'krdio como Ee rtumente os altos rendimentos de alguns residentes sero suficientes para fazer
representante de cada faixa, a mdia, a moda e a mediana. comente as trrclia atingir um patamar comparvel s melhores economias do
mundo, porm
diferenas encontradas com o item (a). e rliscrepnca entre os diversos valores deve ser muito grande. O que podemos
d. se ao invs de 15, fossem 500 coelhos, qual seria o procedimento mais cntrrr.esquecendo a variabilidade dos valores da varivel e isto no captado
conveniente: o de (a) ou o de (c)? Ter acesso a computador faz diferena? pelrr rnia e sim pelas medidas de disperso' Por exemplo, para o conjunto de
Vnl.,,'cs 0, 20 e 40 a mdia igual a 20. O mesmo acontece com o conjunto 20,
4. Sendo x
uma varivel aleatria com funo de probabilidade dada a seguir,
obtenha as medidas de posio 1t, Md e Mo. 30 c 20. Os dois conjuntos tm valores bem diferentes, apesar de terem a mesma
fltrliir. De fato, fctl construir exemplos onde dois conjuntos de dados distintos
Naturalmente, qualquer que seja a expresso utilizada, o desvio padro dado por
Ee trtorlo anlogo, escrevemos
dpohr: JT,04:2,AI. n
Para o caso em que o conjunto de dados est organizado numa tabela de var,,6,(Y):
#
(7b x 502 +.'. + 7 x200\ -86,52 :1917,5i
freqncia, o clculo da varincia ser modificado de forma conveniente com a
ponderao dos desvios pelas respectivas freqncias. Aproveitamos o prximo I :rgr7,5.
exemplo para ilustrar essa situao, alm de discutir o efeito, sobre a varincia, da rttr,6,(D):
#
(75 x 13502 +...+7 x 15002) - 1386,52
multiplicao ou adio de constantes aos valores da varivel de interesse.
Note que a varivel D nada mais do que Y acrscido de 1300. No
Exemplo 4.9; No Exemplo 4.3, definimos a quantidade D, despesa no vestibular,
bliy(e, suas varincias so iguais, isto , o acrscimo de constante no alterou a
obtida a partir de x pela expresso D:50 x x*1800, com x indicando o
Crilrrcia. Esse resultado de certa forma previsvel, pois a adio ou subtrao
nmero de vestibulares prestados. Para efeitos didticos, antes de obter a
$g orrstante corresponde a uma translao dos valores dessas quantidades, no
varincia de D, vamos calcular a varincia de X e da quantidade auxiliar
ltet'ntrclo sua variabilidade relativa. Por outro lado, Y igual a 50 vezes a
Y:50 x x. Iniciamos por ampliar a tabela de freqncia de x, para incluir yt'irvcl X e sua varincia 502 vezes a varincia de X. Esse resultado se explica,
tambm os valores deY e D. Temos,
pgls l multiplicao por constante altera a distncia entre os valores da varivel
flgirrll e, pela frmula da varincia, o efeito ser pelo quadrado da constante. E
X Y D Tri
1 50 1350 75 E*emplo 4.10: O salrio de professores do ensino fundamental da rede privada
2 100 1400 47 Flri scrrclo estudado. A tabela abaixo apresenta os valores, em salrios mnimos,
btitlos em um levantamento numa certa cidade. Desejamos calcular a mdia e a
J 150 r450 2L
Vt'incia desse conjunto de dados.
4 200 1500 7
14 7-9 I
var,,6.(X): - r,,0,)'
#
-- " D",(*,
i:l
,
9F11 4
total 70
ou, na forma alternativa,
f-o1lo ir varivel est apresentada em faixas de valores, no temos os valores
_c
: el.livirnrente observados e, portanto, no podemos aplicar as frmulas da mdia e
Vafr,6r(X)
hD",", nohs'
rlrr virrirrcia. Para contomar essa situao e obter resultados aproximados para as
ttrt,rlirlas clesejadas, tomamos como representante de cada faixa seu ponto mdio.
Optando por utilizar essa ltima expresso temos o seguinte clculo:
['orrr cssit alternativa, o clculo feito nos mesmos moldes das variveis
1
quantitativas discretas. Assim, , Se apenasa informao dos valores esperados, medianas e modas
ctitivesse disponvel, concluiramos por uma perfeita harmonia de desempenho
.5
:
ln
:
14x2+25 x 4+ ". *4 x 10
: elttrc os vrios mtodos. Entretanto, como podemos observar pelas distribuies
Iohs '(0 ) Tli.:xi 4,97. de probabilidade, esse no o caso. Por serem medidas de tendncia central, as
- 70
- trs rnedidas acima no captaram a variabilidade existente em cada mtodo. D
Para a varinpia: Como mencionamos para as variveis em um conjunto de dados, podemos
ter vrias maneiras de medir a disperso. Para o caso de variveis aleatrias
VQfohs :h'"*r -77,u":29,7I - 24',72: 4,99. vnrlos definir apenas a varincia, que a medida mais utilizada.
i:I'
variveis aleatrias.
Muitas vezes, denotamos a varincia por o2 e, se houver possibilidade de
Exemplo 4.11: llma pequena cirurgia dentria pode ser realizada por trs otuso, usamos o2r.Exttaindo araiz quadrada da varincia obtemos o desvio-
mtodos diferentes cujos tempos de recuperao (em dias) so modelados pelas tr
pulrto que representado por d ou ox.
variveis Xr, Xz e Xs. Admita que suas funes de probabilidade so dadas por
Exctnplo 4.12: Retomando o exemplo anterior, calculamos as varincias dos
10
tenrpos de recuperao para cada mtodo. Temos,
0,2 0,2 0,2 .
Wtr(X): (0- 5)2 x0,2+(4-5)2 x0,2 + "'+ (10-b)2 x0,2:10,40.
x, I 1 5 9
Pi I tls 113 rl3 l)e rrrodo anlogo, obtemos:
O valor 0 na varivel X1 pode ser interpretado como recuperao no mesmo dia Var(X2) : L0,67 e Var(X3): 0,60.
da cirurgia. Na tabela abaixo, apresentamos o valor esperado, a mediana e a moda
para cada uma das trs variveis. Vale ressaltar que a moda nem sempre nica e l)cssa brma, utilizando-se os mtodos 1 e 2 (variveis X1 e X2),teremos maior
para construir a tabela a seguir, escolhemos o valor 5 como representante dos vrrrinbilidade no tempo de recuperao. n
valores modais de X1e X2. A varincia definida
anteriormente pode ainda ser considerada como o
vrrlor csperado de uma nova varivel aleatria, o desvio ao quadrado. Isto ,
X1 X2 X3
valor esperado 5 5 5
Var(X):E[(X-p)2],
mediana 5 5 5
it rltrirl pode ser convenientemente reescrita na seguinte forma
moda 5 5 5
u0 Captulo 4: Medidas Resumo 1,, Medidas de Disperso IlI
u"lsf#'"!'li
seus termos. O termo E(Xt) o valor esperado da varivel leatria X2, ao passo
que p2 indica o quadrado do valor esperado de X. O prximo exemplo recalcula
'
:,'i;i;iiir,-:u^2,;t
as varincias do exemplo anterior, atravs da expresso acima. :. i tl'.:li!;!.?.
llllllltlffi
j
:
un',;6;f1[ri:=
(nltcrhti.v,a),[
$Jr r-r,ip',.t,i;
x3 I r 25 81 x?l 16 2b 36
w"@
As funes de probabilidade acima foram obtidas a partir de operaes simples,
Tabela 4.3: Propriedades da mdia e da varincia.
rlf;\
-:i.' "4,::r
t
conjni oe naos
como por exempo,
Exemplo 4.75: Para uma varivel aleatria X com distribuio Var(Y): E(Y\ - E'(Y)
parmetrosnep,temos k
E(x):IkP(x:k)
: i2P(Y : i)-
j:r
(ry)'
;:0
:ik, n'
(r- P)"-*
:iD,r- (+)'
?'"
A:I
(n-ub* .:J: L
_L k(k+r)(zk+7) _ (t + t)2
: k6
6-#@='Pk(1-P)'-k :- k2-L
(n - 1)!
n,
L)t
. nk_r (7\ - p)-' 12
''' 2 @-\r,k)t(k
s
- 1)!'
:1 Para se calcular o valor esperado e a varincia, no caso dos modelos de
Substituindo nesta ltima expresso, k-L por j e, em seguida n-I pot r Pglss<rn, Geomtrico e Hipergeomtrico, so necessrias tcnicas um pouco mais
obtemos rrdas. Optamos por no apresent-las aqui, tendo em vista o objetivo desse
EXto c, para o leitor interessado, indicamos o livro de Mood, Graybill e Boes
E(x) - "e'F_(,) r, e - p)' -i : np, lq7q. Na Tabela 4.4 apresentamos os valores esperados e as varincias para
telos os modelos discutidos no captulo anterior.
uma vez que a somatria igual a 1, pois corresponde a somar todas Tabela 4.4: Modelos discretos- valor esperado e varinca.
probabilidades de uma varivel Binomial com parmetros r e p'
A varincia ser calculada mais facilmente no prximo captulo, qua tffii1,///,//rij"l;,.?.*.-tF.
temos
k:k k+7 _:::h6 :
E(Y):Lipv : :Di k
L
>,t:
'"
,
t x|| I LLtt\\\riti
sffi\,wqry
j:1 j:1 .:i=t ls,::l:;;,:: :I
"riltii;it
k 'W"{"/"K,2/'r'*?t:;i-z7:titi
D/:
.:i:r
k (k + L)(zk + L)
ento,
il4 Captulo 4: Medidas Re
4,4 li.rtrccios t15
com os que os alunos tm em casa. Quantos computadores precisariam ser 10. Uma pea produzida por uma mquina pode receber do controle de qualidade
acrescentados sala para atender o Centro Acadmico? lrs classificaes: boa, defeituosa ou recupervel, com as seguintes
14. Duas moedas esto sobre a mesa, uma delas tem duas caras e a outra tem probabilidades, 0,5; 0,2 e O,3, respectivamente. Suponha que sejam vendidas a
probabilidade igual de cara e coroa. Sorteamos, ao acaso, uma dessas moedas e l$ 100, R$ l0 ou R$50 conforme forem boas, defeituosas ou recuperveis,
a lanamos duas vezes. Seja X a varivel aleatria que conta o nmero de rcspectivamente. Se duas peas, escolhidas ao acaso, so vendidas, qual o
caras nesses dois lanamentos. Qual a mdia de X? vtlor mdio da venda?
15. Num teste de digitao, o tempo em minutos (7) que os candidatos le 2(1. O tempo de durao em horas de uma lmpada especial foi modelado por uma
para digitar um texto modelado, de forma aproximada, pela seguinte fun vlrivel aleatria X com a seguinte funo de probabilidade:
de probabilidade:
xl5 6 7 8910
pi l0,L 0,1 0,2 0,4 0,1 0,1
O candidato recebe 4 pontos se terminar a digitao em 9 minutos, 5 (lacla lmpada custa ao fabricante R$ 10, mas se sua durao for inferior a 6
terminar em 8 minutos e assim por diante. Determine amdia e a varincia Iroras ele se compromete a indenizar o comprador com R$ 15. Qual deve ser o
nmero de pontos obtidos no teste. prco de cada lmpada para o fabricante obter um lucro mdio por lmpada de
l.$ 20?
16. A funo de probabilidade da varivel X P(X:. k) : r/5
k :7,2,"',5.Calcule E(X) e E(X') e, usando esses resultados, determi 11. tlrna concessionria tem disponvel, para um certo automvel, os modelos S,
E[(X + 3)2] evar(3x - 2). ('1, c GL com duas verses de combustvel, lcool ou gasolina. Com motor a
rilcool os preos so 30, 35 e 40 mil reais para os modelos S, CL e GL,
17. Estatsticas obtidas junto s assistncias tcnicas indicam que a bomba rrspcctivamente. Esses preos so 107o superiores se o combu3tvel for
gua de uma certa lavadora s pode apresentar defeitos aps 4 anos de g,rrsolina. A procura por carros a lcool , de 307o e a gasolina 707o. Qualquer
Admita que nos prximos 6 meses, aps esse tempo, um mal funcioname tlnc seja o combustvel escolhido h igual preferncia entre os modelos.
tem probabilidade 0,10 de ocorrer e, caso ocorra, ter 0,5 de probabilidade ('irlcule a funo de probabilidade do preo desse automvel e obtenha sua
ser recupervel. O reparo, que s pode ser feito uma vez, tem o preo de R$ I
Irrrlia e varincia.
enquanto uma bomba nova custa R$ 30. Determine a mdia e a varincia
gasto com essa pea em 4,5 anos de uso. ,2, Nurn cassino, um jogador lana dois dados, cujas probabilidades so
lrroporcionais aos valores das faces. Se sair soma 7, ganha R$50, se sair soma
It. Os alunos do curso de estatstica tm um time de futebol que no I l, ganha R$ 100 e se sair soma 2, ganha R$ 200. Qualquer outro resultado ele
melhores. O cartola que administra o time paga um prmio de vitria rriio garrha nada. Qual o ganho mdio do jogador?
partida de um sorvete porjogador, acrescentando mais um sorvete por saldo
gols maior que I (saldo de gols a diferena entre gols feitos e sofri l-1. I lrrra indstria pretende comprar 3 lotes de peas que so produzidas por dois
Admita que a funo de probabilidade dos diversos saldos a seguinte: lrlrrcccdores, A e B. Ela inicia, comprando de um dos fornecedores escolhido
n(l ilciso e, se ficar satisfeita com o material entregue, compra o prximo lote
Saldo de gols
rhr nrcsmo fornecedor. Se no ficar satisfeita, troca o fornecedor. Admita que
lrirlir cacla lote o ndice de satisfao de 80Vo e de 707o para A e B,
rrspcctivamente. Calcule a mdia e a varincia do nmero de lotes fornecidos
Qu"rl a despesa mdia do cartola com cada jogador por partida? E corn os I
"c rilques" ?
por A.
122 Captulo 4: Medidas Resumo 4,4 lixerccios t23
24. A experincia de diversas companhias de resgate de navios naufragados indica vcz. se o ganho acumulado da equipe (em milhares de reais) , 50c , sendo c o
que a probabilidade de um resgate ser bem sucedido na primeira tentativa de rrrimero de corridas completadas por esse motor antes de quebrar, calcule:
0,6; caindo para a metade a cada nova tentativa. Uma empresa de resgate tem 1. Qual a probabilidade da equipe completar 8 corridas? E de participar de B
como norma no realizar mais de trs tentativas e cobra 50 mil reais para corridas?
iniciar os trabalhos e mais 10.000 x (k - 1) reais, com k sendo o nmero de [. Quanto receber em mdia essa equipe durante sua "vida" em corridas?
tentativas.
a. Qual o custo mdio dos servios dessa empresa?
19. tlrn vendedor de cachorro quente trabalha na porta do Estdio do Morumbi
errr clias de jogo. Ele pode deixar preparado 5, 6 ou 7 dzias de sanduches que
b. Se um navio resgatado pode render ao proprietrio 65 mil
(:lstam a ete R$ 5 adzia,. Sabe-se que a procura do cachorro quente (X), no
interessante para ele contratar essa empresa? Justifique.
s!u ponto, uma varivel aleatria com a seguinte funo de probabilidade:
25. Suponha que a demanda por certa pea, numa loja de autopeas, siga o
seguinte modelo:
: P(X: k,):+, tt:r,2,J,4. Sirbo-se que cada dzia de sanduche vendida a R$ 12 e os sanduches no
Vcrrrlidos vo para um canil que paga R$ 2 pela dzia. Qual o nmero de
eltiz,ias de sanduches que devem ser preparadas de modo a maximizar o lucro
a. Encontre o valor de a.
nrrlio do vendedor?
b. Calcule a demanda esperada.
c. Qual a variabilidade da demanda? floricultura vende rosas, cravos e jasmins com lucrO de, respectivamente,
t.lrrra
R$ ltl, R$ 12 e R$ 15 por dezena. Observa-se que a procura igual para as trs
26. Numa indstria farmacutica, uma mquina produz 100 cpsulas por minuto,
flolcs. Se o estoque do dia no for vendido, a floricultura tem um prejuzo
A mquina est regulada de modo que no mximo 5Vo das cpsulas n (lrrcro negativo) de, respectivamente, R$ 5, R$7 ou R$ 10 com cada'dezena de
contenham remdio e, assim, sejam consideradas defeituosas.
fosils, cravos ou jasmins. Se a floricultura dispe de duas dezenas de cada flor
a. Se as cpsulas so acondicionadas em vidros com 20 unidades, qual tr's clientes visitam a floricultura sucessivamente e compram uma dezena
probabilidade de um vidro apresentar no mximo 2 cpsulas com defeito?
nrlir um. Fazendo alguma suposio adicional que seja conveniente, determine
b. Qual o nmero esperado de cpsulas com defeito, por vidro? s lrrcro esperado da loja.
c. Qual o nmero esperado de cpsulas com defeito por minuto de produo?
,t{t pita o problema anterior, se a procura por rosas e cravos forem iguais e
27. Um fotgrafo negocia com o jornal o seguinte trato: ele submete al orrcsponderem ao dobro da procura porjasmins
fotos semanalmente e por cada foto publicada, ganha R$ 50. Se a foto no
publicada, no ganha nada. Nesta semana 4 fotos so submetidas com jl, l,rrlir 1tn exame com 25 questes do tipo certo-errado, um estudante sabe a
uma tendo probabilidade 0,60 de ser publicada, independentemente da demais, l'r,slroslr correta de 17 questes e responde as demais "chutando".
gQVo das respostas.
a. Qual a probabilidade que o fotgrafo tenha pelo menos duas f, n. ('rrlcule a probabilidade dele acertar pelo menos
publicadas esta semana? It. l)ctcrrnine a mdia e a varincia do nmero de acertos.
b. Calcule a distribuio de probabilidade de Y: montante que o fot f. Srrpottlra que nesse mesmo exame, um outro estudante saiba a resposta
recebe esta semana; col'rolit para l5 questes e tenha probabilidade de acerto nas demais de 0,7.
(.)rrlrl clo.s estudantes voc espera que tenha melhor desempenho?
c. Calcule o ganho mdio do fotgrafo nesta semana.
tl, Nirs lncsmas condies do item (c), qual dos estudantes ter desempenho
28. Admita que, em cada corrida de Frmula l, o motor tem 0,4 de probabi rrriris Irornogneo?
de quebrar, independentemente das corridits anteriores. Suponha que a
encerrar sua participao no torneio quanclo o motor quebrar pcla pri
124 Captulo 4: Medidas Resumo
d. Baseado nas variveis Sexo e Itrab, voc diria que os homens comeam a X nao nao slm no slm nao nao nao slm nao
trabalhar mais cedo? D
Y 2 2 1 J 2 2 2 1 .) 2
t25
I2() Captulo 5 : Variveis Bidimensionais 5.1 Introduo 127
A varivel x qualitativa com dois valores: sim ou no. por outro lado, a Ilxcmplo 5.2: Um estudo envolveu 345 pacientes HfV positivos, acompanhados,
varivel Y quantitativa discreta com valores inteiros I,2 ou 3. Podemos coletar dttrante um ano, pelo setor de doenas infecciosas de um grande hospital pblico.
as freqncias de ocorrncia dos possveis pares, construindo uma tabela de Os dados apresentados contm as ocorrncias relacionadas s variveis nmero de
freqncia conjunta de X eY. itttt:rnaes (I) e nmero de crises com infeces oportunistas (C).
(X,Y) freqncia 1\c 0 1 2 D
rJ 4
(sim,1 4 0 B4 27 8 2 0
(sim,2) 2 1 20 59 35 T4 2
(sim,3) 2 2 6 11 43 28 12
(no, 1 5
(no,2) 6
l)irra obter as marginais dessas variveis, acrescentamos mais uma linha e uma
(no,3) coluna na tabela anterior, contendo os respectivos totais de ocorrncia. Assim,
1
total 20 1\c 0 1 2
q
O 4 total
0 B4 27 8 2 0 115
O par (no,1) tem freqncia de ocorrncia igual a 5, pois, na amostra coletada,
foi esse o nmero de alunos que no trabalhavam e prestaram o vestibular apenas 1 20 59 35 t4 2 130
uma vez. Os outros valores so obtidos de forma semelhante. Esta mesma tabela 2 6 11 43 2B 72 100
pode ser apresentada de modo mais conveniente atravs da tabela de dupla total 110 91 B6 44 L4 345
entrada, mosfada a seguir.
Cbnro j mencionamos, a ltima coluna da tabela acima fornece as freqncias
x\v 1 2 .) total eorrcspondentes aos valores da varivel -I, enquanto que a ltima linha fornece as
l'ct1i.incias para C. Logo,
slm 4 2 2 8
nao 5 6 1 12 I freqncia C freqncia
total I B
t
a) 20 0 115 0 110
Note que a ltima linha e a ltima coluna contm os totais de ocorrncias de cada 1 130 1 91
varivel, separadamente. Dessa forma, fica facilitad a a tarefa de obter a tabela de 2 100 2 B6
'eqtincia individual para cada "varivel que, pela posio em que seus valores total 345 3 44
aparecem na tabela de dupla entrada, chamada de tabela marginal de
freqincia
4 I4
du vuridvel x (ou Y), ou simplesmente marginal de x (ou y). Temos ento para total 345
X eY as seguintes tabelas de freqncia:
D
X freqncia Y freqncia
Ii:ccrnplo 5.3.' Numa amostra de 195 empregados de uma grande indstria,
slm 8 1 I rrlrscrvou-se o Salrio recebido (em salrios mnimos) e o Tempo de Servio na
nao L2 2 8 l')rrprcsa (em anos). Tendo em vista que a varivel Salrio quantitativa contnua,
total t t
20 t) r) lrrirrn escolhidas algumas faixas para represent-la. Por outro lado, apesar da
total 20 vrrt'irvel Tempo ser discreta, ela apresentou valores to diferentes que se achou
rrlris conveniente organiz-latambm em faixas. Assim,
l2t Captulo : Variveis Bidimensionais
5 5.1 Introduo
Salrio \Tempo <5 5F10 10 t-- 15 >15 total Note que, pela notao utilizada na Definio 5.1, o termo (X: r)
<4 36 21 4 2 63 rcpresenta o conjunto de eventos que levam a varivel X a assumir o valor r. No
4t--B 16 2B 2T 12 77 prximo exemplo, ilustramos esse ponto.
8-72 5 6 74 10 35
Ilxemplo 5.4: Uma empresa atende encomendas de supermercados dividindo os
>12 1 2 72 5 20
pcclidos em duas partes de modo a serem atendidos, de forma independente, pelas
total 5B
suas duas fbricas. Devido grande demanda, pode haver atraso no cronograma
57 51 29 195
rlc entrega, sendo que aftbrica I atrasa com probabilidade 0,1 e a II com 0,2.
Segue ento que as marginais so: Scjam A1 e All os eventos correspondentes a ocorrncia de atraso nas fbricas I e
Salrio freqncia
ll, respectivamente. Vamos admitir que as encomendas sempre sero entregues,
Tempo freqncia
<4 tcsmo que com atraso. O espao amostral, associado ao atendimento da
63 <5 58 encomenda, ficar sendo:
4F8 77 5 t-- 10 57
8F12 35 10F15 51 : AAr}.
>12
Q {A1A1r, AArr, ArAr,
20 >15 29
total 195 total 195
Pirra aliviar a notao, os eventos sero representados sem os respectivos
tr xubscritos mantendo, entretanto, a ordem das fbricas. Dessa forma, o evento
Pelos exemplos anteriores, podemos perceber que variveis de qualquer /" significa que a ftbrica I entregou sem atraso e afbrica II com atraso.
natreza podem ter seu comportamento conjunto representado atravs Suponha que para um certo pedido, a indstria recebe 200 unidades
do tablas tnonetrias (u.m.) pela encomenda total entregue, mas paga uma multa de 20 u.m.
de freqncia. Dessa forma, variveis qualitativas u quantitativas, discretas
ou pirra cada fbrica que atrasar sua parte. Considere que o supermercado, que fez a
contnuas, tm seu comportamento estudado com tabels de dupla
entrada, para cncomenda, criou um ndice relacionado pontualidade da entrega. Este ihdice,
dados oriundos de toda a populao ou de uma amostra. veremos
a seguir como trllibui 10 pontos pata cada parte da encomenda entregue dentro do cronograma
tratar essa questo no caso de variveis aleatrias discretas, definidas
a partir das prcvisto. Vamos denotar por X o valor recebido pelo pedido eY o ndice obtido.
suas funes de probabilidade. Iniciamos estendendo a definio
de funo de Para cada evento do espao amostral, podemos obter os valores das
probabilidade para o caso de duas variveis.
virrirveis. Assim, se ocorre o evento AA', avarivel X tem valor 180, pois de
Defino 5.1: Funo de probablidade conjunta ?(X) subtraimos a multa de 20, decorrente de um atraso. Por outro lado, a varivel
Sejam X e Y duas variveis aleatrias discretas originrias do mesmo )' assinala 10 pontos provenientes de uma entrega dentro do cronograma. A
fenmeno aleatrio, com valores atribudos apartir do mesmospao lirbcla a seguir, apresenta os eventos, as respectivas probabilidades e os
amostral. A crrrrcspondentes valores de X eY.
uno de probabilidade conjunta definida, para todos os possiveis pares
de
valores de (X, Y), da seguinte forma: Eventos Probabilidade X Y
p(r,a) : P[(X: u) n (Y : ]: p(X : r,y : a), AA 0,1 X 012 160 0
AA' 0,1-x 0,& 180 10
isto , p(r,A) representa a probabilidade de (X,y) ser igual a (r,A).
comum A'A 0,9 X 012 180 10
nos referirmos, sempre que no houver ambiguidades e o contexto permitir, A. A. 0,9 x 0,8 200 20
ftno de probabilidade conjunta como distribuio conjunta ou simplesmente
t:otti unta das variveis. Ap(rs coletarmos os pares idnticos, obtemos a conjunta das variveis:
tr
130 Captulo 5 : Variveis Bidimensionais 5.1 Introduo r3I
(X,Y) p(r,y) Note que pares idnticos foram agrupados e somamos as respectivas
(160, 0) 0,02 probabilidades. Uma forma equivalente de apresentar a distribuio conjunta,
(180, 10) 0,26 porm com maior apelo visual, atravs da tabela de dupla entrada.
(200,20) 0,72
x\), 0 1 2
Dessa forma, a distribuio conjunta de (X, Y) contm todas as possveis 0 r/rc 2lLj 2110
combinaes dos valores (r, g), com suas correspondentes probabilidades. tr 1 L/n r/rc 0
Considerando que escolhemos uma das sub-regies ao acaso, isto , cada sub- xl o 1 2 e Yl o 1 2
regio tm mesma probabilidade 1/10 de ser escolhida, podemos construir a n I slto 2lro sllo p I slro 4lro slro
distribuio conjunta de (X,Y): tr
(X,Y) probab.
Em muitas situaes h interesse em estudar o comportamento de uma
(0,0) L/70 'Lrno das variveis tal como soma, produto ou alguma outra relao entre elas.
(0,1) 2/70 Vamos nos restringir ao caso de variveis aleatrias, mas o tratamento similar
(0,2) 2lr0 para conjunto de dados referentes populao ou amostra. Se conhecemos a
(1,0) r/10 clistribuio conjunta de X e Y, o comportamento de outras variveis, tais como
(1,1) r/rc X +Y, X2 + 5Y ou X Y, pode ser determinado como ilustramos a seguir.
(2,0) rlL0 Ilxemplo 5.6: Emuma cidade do Estado de So Paulo, admite-se que o nmero de
(2,1 rlrc unos para completar o ensino fundamental (varivel F) e o nmero de anos para
(2,2) r/t0 cornpletar o ensino mdio (varivel M) t,m funo de probabilidade conjunta:
total 1
t32 Captulo 5 : Variveis Bidimensionais 5.1 Introduo
Suponha que exista interesse em estudar as variveis F+M e FxM. a. Determine as tabelas de freqncia marginais de C, M e A.
Acrescentando, tabela anterior, colunas correspondendo aos valores dessa novas b. Obtenha a tabela de freqncia conjunta entre (C, M), (C, A) e (M, A).
variveis temos c. Represente a tabela de freqncia conjunta de M e A, atravs de uma tabela
de dupla entrada.
(F,M) pU,m) F+M FxM d. Calcule amdiadas variveis M e A.
(8,3 3/10 11 24
(8,4) L/70 L2 32 2.Paru famlias de um certo bairro de So Paulo, apresentamos abaixo a tabela de
(8,5) 7/L0 13 40 f'reqncia conjunta das variveis: nmero de automveis (A) e de Ws (T).
(9,3) 2/L0 L2, 27 \" 2 total
0 1
9,4) L/20 13 36 0 110 235 t20 465
9,5) 7/r0 74 45 1 51 r22 178 351
(10,4) L/70 L4 40 2 15 84 L62 267
(10,5 r/20 15 50 total 176 44r 460 L077
Para obter a funo de probabilidade de tr.
valores comuns. Por exemplo,
* M, somamos as probabilidades nos a. Calcule as marginais de A e T.
b. Determine as mdias dessas variveis.
?t'
P(F + M : 13) : P(F : 8,M : 5) * P(F : 9,M .. 1
A\ _
1
3. Uma moeda equilibrada lanada 2 vezes de forma independente. Ao final dos
-
'1020 n' lanamentos, duas variveis aleatrias so anotadas: o nmero total de caras (C)
Procedendo de modo similar com os outros valores, obtemos as funes de c o nmero de coroas no 2o. lanamento (K).
probabilidade de.F * M e de F x M: a. Construa uma tabela com os possveis eventos, as respectivas probabilidades
e os valores de C e K.
r+twl tt L2 13 1.4 15 b. Apresente a tabela de dupla entrada com a funo de probabilidade conjunta
prob. | 3/10 3lL0 3120 2lI0 Il20 ' das variveis aleatrias C e K.
c. Determine o valor esperado de C.
FxMl Z+ 27 32 36 40 45 50
prob. l B/10 2lL0 ' 4. Num estudo sobre o tratamento de crises asmticas, estabeleceu-se a seguinte
uno conjunta de probabilidades entre o nmero de crises de asma () e o
tr tti,mero de interniles hospitalares (H).
134 Captulo 5 : Variv eis Bidimensionais 5,2 Associao entre Variaveis 135
\H 0 1 2 foi construda
ingls. Para esses alunos, a prxima tabela com as notas de ingls
0 r/8 I/16 0 (l), portugus (P) e matemtica (M):
1 3/16 L/8 r/16 7
I
Aluno 1 2 3 4 5 6 I 8 10 11 T2 13 L4 15
2 r/L6 3lL6 3/L6
I ( 7 7
F7
I 8 8 B 8 8 8 8 9 I I 10
a. Determine as funes de probabilidade marginal das var,{eis Ar/H. P 8 6 B 9 8 6 I I 7 6 7 B^ I 8 8
b. Calcule o valor esperado dessas variveis. M 5 6 7 5 t) 5 6 4 7 6 5 5 6 5 5
c. Obtenha a funo de probabilidade da varivel A + H. '-/
A tabela de freqncia conjunta de (.I, P) dada por:
5. A funo conjunta de probabilidade entre as variveis X eY apresentada
abaixo (com algumas entradas faltando):
1\ P 6 I 8 I
7 1 0 2 1
8
x\v -1 0 2 4 P(X : r) I
2
0
J
0
1
2
1
2 /64 0 /'r . 3t64 7t32 l'oqncias ao lado de cada ponto. Note que h uma tendncia das notas altas em
5 /n(^
P(Y : y1 ,^ 5/16 311 r/4 1
irrgls, serem acompanhadas por notas altas em portugus.
P
a. Complete a tabela.
10
b. Obtenha as marginais de X e Y.
c. Calcule afuno de probabilidade da varivel X x Y.
P(X:rlY:y): P(X
prra todos os possveis valores (r,g) das variveis (X,Y). Como definio
irlternativa e equivalente podemos usar que:
P(X : n,Y : A) : P(X : n) P(Y : A), para quaisquer (*,A). O
,
8 I 10 A verificao da equivalncia entre as duas expresses, acima, pode ser
Observe que o bom desempenho em ingls parece, lbita de modo anlogo ao realizado no Captulo 2. Deixamos ao leitor essa tarefa.
neste caso, no implicar num
bom desempenho em matemtica. Note, ainda, que a definio de independncia exige que a igualdade seja
D vcrdadeira para todas as escolhas dos pares (r,A). Assim, basta encontrarmos um
Apesar de ser um instrumento til para identificar
tendncias, os l)rr em que a igualdade no se verifique para concluirmos que as variveis
rliagramas rornam-se de difcit interprerao, irleatrias no so independentes. A Figura 5.1 resume esses comentrios.
conjunto de dados tem muitas observes "rigun.
;;;;;.;", exempro, se o
pou.os valores diferentes,
freqncias sero altas atrapahndo "o a visualizao de uma eventual
'lgumas
tcndncia' Dessa forma, importanie ampliar
o estudo da associao entre
variveis, para buscar.uma caracterizao que no
dependa s da interpretao
visual' com este objetivo, definimos piobabilidad"
e independncia
para variveis aleatrias, estendendo os conceitos "ondi"ional
apresentados no captul o 2 para
cventos aleatrios. Aqui, o condicionamento, na
ocorrncia de um valor da
varivel aleatria, equivalente ao condicionamento na ocorrncia
de um evento.
Figura 5. 1 : Indep endncin de variv eis aleatrias .
T freq. T /A:0 freq. observ. eube agora quantificar se essa tabela est ou no "muito" distante da tabela
0 15 0 5 ohscrvada. Uma medida usualmente calculada a seguinte:
1
2
3
2L
27
L7
2
J
1 2
4
4
Q':D4, i,i "11
total 80 total 15
Eonl o,;.i e eiirepfesentando, respectivamente, as freqncias observadas e
Se houvesse independncia entre T e A, o comportamento da varivel ? csl)cradas na linha 'i e coluna j. A medida Q2 usa a diferena entre oi.j e ei.j
em cada grupo deveria ser o mesmo e, portanto, esperaramos que as freqnci elcvada ao quadrado para evitar o cancelamento de termos positivos por
de cada valor de 7 mantivessem a mesma proporcionalidade encontrada na flL:gativos. A diviso pot ei.i objetiva padronizar a medida, relativizando o
ilmostra como um todo. Em outras palavras, as duas tabelas acima precisariam ser tnrrranho da diferena encontrada. Como estamos tratando de observaes de
parecidas quanto freqncia relativa. Acrescentamos, na tabela restrita ao grupo vrrrirveis, podem ocorrer flutuaes devido natureza aleata da amostragem e
A.:0, uma nova coluna com a freqncia esperada caso a independncia se rrrrcluiremos pela independncia entre essas variveis, se houver razoxel
verifique. Essa coluna foi calculada multiplicando a freqncia relativa do valor proximidade nas tabelas. No difcil perceber que isto significa valores
cle ? (em toda a amostra) pela freqncia do grupo. Por exemplo, a freqncia pe(luenos da medida Q2 e,no Captulo 8, desenvolveremos um critrio estatstico,
esperada do valor T:7, no grupo dos :0, seria 21180 x 15:3,94. Note piri tomar a deciso de aceitar a independncia de duas variveis. Para este
que esta freqncia no precisa ser um nmero inteiro. excrnplo, vamos nos contentar em apresentar o clculo da medida Q2 que, pelo
tlr:rr valor, consideraremos uma indicao de no independncia:
T\:0 freq. observ. freq. esperada
0 5 2,87
Q,:
(5-2,81)2
+...+ (4-r,70)2 :12.63.
1 2 3,94 2,81 L,70
2 4 5,06
D
3 4 3,19
total 15 15 No caso de dependncia linear e de variveis quantitativas, existe uma
prrtla medida que freqentemente utilizada e ser definida, a seguir, para um
De modo anlogo ao feito para o grupo : 0, calculamos as freqncias corr.junto de dados brutos.
esperadas para todas as colunas da tabela de dupla entrada (valores aproximados):
I)t1[ino 5.4: Correlao entre variveis num conjunto de dados brutos
7 \.4 0 1 2 4 total
Considere um conjunto de dados com n pares de valores para as variveis
0 2,Bl 4,13 3,37 3,19 1,50 15
.\ c Y, representados por (ru,g),':I,2,...,fr.O coeficiente de correlao
I 3,94 5,77 4,73 4,46 2,r0 27
rrrcrlc a dependncia linear entre as variveis e calculado da seguinte forma:
2 5,06 7,42 6,08 5,74 2,70 27
t 'n
t) 3,19 4,67 3,83 3,61 I,70 17
total 15 22 1B 77 B 80
D@o
i,:l
- r,,r,,)(ar. - a,*,)
Px,Y =
142 Captulo 5: Variveis 5.2 Associao entre Variveis 143
ou, em uma forma mais conveniente para clculo, Scgue que r o6, : l-35, 63 e y oo,
: 38, 75. Utilizando a expresso de clculo da
n,
currelao vem que:
LrtAt.-TLIohsAobs 43245-8x135,63x38,75
i:l PX,Y:
PX,Y:
E(xY): tL"yp@,a)
r '!l xl o 1 2
p | 5/10 2/70 slto
: I D,*aP@)P@) -$
r lt
'.* vl o t z
: (T 'p@)) (Duna) pi | 3lt0 4lr0 3lt0
: E(x) E(Y) .
t
\ ,nf Segue ento que E(X) : S/10 e E(Y) : L'
/t Podemos agora verificar que
Exemplo 5.12.' No Exemplo 5.5, o par de variveis f*,h represenr
: ISlto: E(X) + E(Y):
respectivamente, a quantidade de poos artesianos e de riachos em sub-regies E(X +Y) B/10 + 1, '
uma certa rea. A prxima tabela contm os valores das variveis X f Y e X isto , o valor esperado da soma igual soma dos valores esperados.
com suas probabilidades. Entretanto, para o produto temos
(X,Y) X+Y XY p(r,a) R
(0,0) 0 0 L
/10
E(xY):7lLo+E(x)E(Y): * t,
(0,1) I 0 2/r0
(0,2) 2 0 2/r0 ou seja, o valor esperado do produto de duas variveis no igual ao produto de
seus valores esperados. Note que, conforme j havamos mencionado, as variveis
(1,0 1 0 L/n no so independentes. tr
(1,1) 2 I 1170
aleatrias X eY
(2,0) 2 0 L/10 Na Figura 5.2, apresentamos a expresso do valor esperado da sorra de
( t variveis aleatrias.
(2, 1 r) 2 L/rc
(2,2) 4 4 r/70
x+rl 0 L 2 3 4
Para os valores esperados temos: importante salientar a relao unidirecional de implicao entre a
E(X+Y):18/ro e E(XY) :7lto. independncia e a fatorao da esperana do produto. O resultado vfido afirma
que a independncia de X e Y implica no valor esperado do produto XY set
As distribuies marginais de X e Y j foram calculadas no Exemplo 5.5 e so igual ao produto do valor esperado de X pelo valor esperado de Y. Todavia, se o
reapresentadas em seguida: valor esperado do produto de duas variveis o produto dos valores esperados,
t4(, Captulo 5: Variveis Bidimensionais t47
5.2 Associao entre Variveis
Por outro lado, utilizando as distribuies marginais de W e Z, podemoscalcular 5 0 0,1 0 012 0 0,3
seus valores esperados. Assim, 6 0 0 0 0 0,1 0,1
Fazemos agora uma translao de eixos para colocar a origem : o*,, : E(Xl) - E(X) E(y).
Cov(X,Y)
respectivas mdias, isto , no ponto (4,6).Dessa forma, os pontos anteri
bserve que' no caso em que xe y serem independentes, temos
transformam-se em (u - 4,a - 6), com cada coordenada representando o desvi cov(x,y) : 0,
ut1il vez que o valor esperado do produto se torna igual ao produto do, uIo.",
em relao sua mdia.
A partir da covarincia, definimos uma nova medid" d" d;;"d;;;
ffJl*'.for'
lllcilr.
Derfinio 5.6: Correlao entre vatrveis aleatras
O coeficiente de correlao entre as variveis aleatrias discretas
X ey
r:irlculado pela seguinte expresso:
Cov(X,Y)
4'.,- :
OX OY
E
Pela definio acima, o coeficiente de correla
o o quociente entre a
crviuincia e o produto dos desvios-padro de x e )2. A diviso
pelo produto dos
rlcsvios-padro tem a funo de padronizar a medida
e torn-la possvel de ser
,tilizada para comparaes com outras variveis. No difcil
u"rifi.u, gue px,v
rrrrr nmero adimensional e limitado por 1, isto , <
lpx,vl 1. A interpretao de
suir cxpresso segue os mesmos passos da covarincia,
sendo que valores de
1t,y,y prximos de 1 indicam correlao forte.
t50 Captulo 5: Variveis
5,2 Associao entre Variaveis 151
Var(X +n:
''100 2 # +2(-#) : 116
Figura 5.6: Varincia da soma de duas variveis aleatrins.
" 100
E(X):E(Xt+Xz.-"'+X,) r\c 0 1 2
: p+ p+...+ p
2
o
J
34
T2
45
16
38
31
- np.
Para obter a varincia, usaremos a independncia dos X;,r: a. Obtenha as tabelas marginais de freqncia.
b. Construa a tabela de freqncias esperadas, caso houvesse independncia
Var(X) : Var(Xr t Xz + "' 1 X,,) entre as variveis.
: Var(Xt) * var(X2) + ... + var(X") c. Determine o ndice Q2.
: p(l - p) + p(I - p) + ... + p(L - p)
4. A funo de probabilidade conjunta entre as variveis aleatrias X eY
: np(I- p). apresentada na prxima tabela.
,
(F,C) freq.
5.3 Exerccios
(0,0) L2
1. A tabela a seguir apresenta os valores observados em uma amostra de 130 (0, 1 25
empregados do ramo do comrcio. (0,2) 8
Sexo \ Fumante Sim No (1,1) t4
Masculino 24 18 (2,1 57
Feminino 25 63 (3,1 40
(3,2) 45
a. Construa as tabelas marginais de freqncia para as variveis Sexo e (4,r 27
Fumante. (4,2) 22
b. Se usssemos a amostra para tirar uma concluso sobre toda populao,
voc diria que, proporcionalmente, mais homens fumam do que mulheres? 5. Os dados a seguir referem-se a uma amostra de 5 alunos que informaram, no
c. Calcule o ndice de associao Q2 entre as variveis. incio do curso, seu peso e idade.
,,
Em uma amostra de 8 funcionrios de uma empresa, observou-se duas Aluno I 2 J 4 5
variveis: anos de empresa (A) e nmero de promoes recebidas (P). Com Peso 7L 65 70 57 66
os resultados apresentados a seguir voc diria que, para essa empresa, essas Idade L7 L7 18 17 19
variveis esto associadas?
a. Encontre a mdia e o desvio padro do peso dos alunos c"om l7 anos.
A 5 6 6 7 I B B 8 b. Construa o diagrama de Peso por ldade.
t
P 2 2 1 2 0 J 1 0 c. Obtenha o coeficiente de correlao entre peso e idade.
3. Est sendo estudado o efeito do teor de ferro na capacidade ile car p de vigas r. Para cinco volumes de uma mesma soluo foram medidos os tempos de
de concreto. Os dados abaixo apresentam os resultados de medidas btidas em aquecimento, em um mesmo bico de gs, e as respectivas temperaturas de
uma amostra. Obtenha a correlao entre as variveis. ebulio:
Ferro (7o peso) 5,4 6,8 6,9 7,3 7,7 8,1 8,2 8,5 8,6 8,9 Tempo (min.) 20 22 19 23 17
Carga (ton./m2) 2rL ,) 2r9 2r9 3,0 3,1 3,1 3,1 314 3,5 Temperatura ('C) 75 BO 75 82 78
4. A tabela de freqncia conjunta entre nmero de filhos (f') nmero de a. Obtenha o grfico do Tempo pela Temperatura e calcule a correlao.
cusamentos
"
oficiais (C) apresentada, a seguir, para os 250 funcionrios de b. Voc acha que existe associao entre as variveis?
ur certa empresa. 7. Alguns cientistas sociais acreditam que a opinio sobre o aborto independe da
a. Determine as tabelas de freqncia marginais, correspondentes a cada uma situao familiar. O que voc diria, aps estudar a amostra?
das variveis, isoladamente, e calcule as mdias de F e C.
Situao \ Opinio Favorveis Contrrios
b. Construa um grfico com a distribuio de freqncia das variveis. Voc Casados 56 2:4
chega a alguma concluso? r
Solteiros 15 25
c. Determine o coeficiente de correlao entre F e C. Note que ser
Divorciados 24 16
necessrio adaptar a expresso apresentada na Definio 5.4.
Vivos 13 27
t56 Captulo 5 : Variveis Bidimensionais 5.3 Exerccios r57
8. A tabela a seguir consiste de 16 valores de trs variveis observadas em alunos Pac. No. t 4 ll
2 J 5 6 7 8 9 10 12 I3
do curso de cincias sociaisr sexo (S), nota de estatstica (E) nota de
" C I 1 2 1 2 1 I t
a) 2 2 1 1 2
antropologio (A).
s 2 2 D
t) 1 1 2 t
L)
t
d 2 J 1 2 I
s M F M F M M F F F M M F M F F M F 0 2 4 0 1 1 1 2 0 D
L) 0 1 2
t o
E r) 6 4 iJ 6 5 5 I 4 5 5 6 5 4 t
r) 6
A t
e) 4 3 5 5 5 4 6 5 5 4 4 5 5 6 5
Pac. No. I4 15 t6 7 18 t9 20 2I 22 23 24
a. construa a tabela de dupla entrada para as notas de estatstica er C 2 I I 1
t
a) 1 2 1 1 1
t
r)
antropologia. ,9 ,f
D
() 2 1 2 2 1 1 2 t
!)
D
t)
I V 74 13 T2 13 10 I2 11 10 10 13 10
2 2 t
.) 2 2 2 2 I 2 1 I 1
t
i)
t
()
11 T2 T2 11
a. Obtenha a tabela de dupla entrada. a. A varivel ? serve para explicar a varivel I/? Justifique.
b. Calcule a porcentagem de cada ocorrncia conjunta em relao ao total de b. Calcule a correlao entre as variveis.
casos.
12. Um total de 1000 passageiros de vos domsticos foram entrevistados no
c. Repita o item (b), fazendo a porcentagem em relao ao total de colunas.
Aeroporto de Guarulhos. Duas variveis foram observadas: nmero de viagens
d. Que concluso se pode tirar da relao entre a incidncia de sarampo e
mensais (V) nmero de automveis na famlia (). O resultado est na
prxima tabela"que, por descuido, est incompleta.
difteria?
10. As informaes da tabela a seguir foram coletadas de 24 pacientes da rea de
cardiologia de um grande hospital pblico. A varivel C indica o nmero de V\A 1 2 t
r) total
intervenes cirrgicas sofridas pelo paciente, ,9 representa o nmero de 1 /0 BO 60 -zt)O
pontes safena colocadas pelo paciente em uma ou mais cirurgias e a varivel F 2 150 :.{.,t C 450
indica o nmero de.familiares prximos com problemas cardacos. /t0
J L20 ,l4a 300
total 300 200 'i i .. ),
/51J Captulo 5 : Variveis Bidimensionais 5.3 Exerccios
t59
a. Complete a tabela. !
16. A funo de probabilidade conjunta das variveis x ey dadapela seguinte
tabela de dupla entrada.
b. Calcule as porcentagens em relao ao total de coluna.
c. As variveis so independentes? Justifique. x\y -1 0 1
21. sorteia-se ao acaso um dentre os nmeros g, 12, e zz e feita a P(Y : u) 012 0,3
decomposio do nmero sorteado em fatores primos.
$ejam D e T, as a. Complete a tabela.
variveis que representam, respectivamente, o nmero de b. Calcule o valor esperado e a varincia de 2X Y.
3 aparecem na decomposio.
/ezes em que o 2 e o -
a. Obtenha a conjunta entre D e T.
{
\ 26. Sendo Xr,Xz e X3 variveis aleatrias independentes, seguindo o modelo
b. calcule a covarincia e o coeficiente de correlao entre as variveis. Bernoulli de parmetro p, pergunta-se:
a. Qual a funo de probabilidade de Xt t Xz * Xs? Voc reconhece essa
22. As variveis F e M representam, respectivamente, o nmero de anos para varivel?
compltar o ensino fundamental e o ensino mdio. Numa certa cidade , a tabela b. Qual o valor aeVar($h)t
a seguir adotada pafa a funo de probabilidade conjunta dessas variveis.
Determine o valor esperado e a varincia da varivel F + M que representa o 27. Sabe-se que X e Y so independentes e assumem, respectivamente, os valores
total de anos at completar o ensino mdio. 7,2 e 3 e-0, I e2. Admita conhecidas as probabilidades P(Y:0):1/3,
P(X :3) : Ll3, P(X : L,Y :0) : 1/9 e P(X :3,Y :2) : Llq,
F\M 3 4 5 6 a. Construa atabela de dupla entrada para X eY.
8 e 160 I /60 7/60 r/60 b. Calcule E(X x Y) e Var(X + Y).
9 7/60 7 /60 5/60 3/60
28. Um paleontlogo acredita que o nmero de minerais presentes em certo tipo
10 3/60 4160 3/60 2/60
de rocha pode influir na chance de se encontrar fsseis perto de uma indstria
23. Sejam X -b(5;0,5) e Y -b(3;0,2) independentes. Determine o valor calcria. Atravs de amostras de rocha obtidas em levantamentos de campo, elc
esperado e a varincia da varivel2X - BY. obteve a distribuio conjunta para as variveis Z:nmero de minerctis
presentes eW: varivel que assume 1, se for observada a presena de fssil e 0
24. A rabela a seguir representa a funo de probabilidade conjunta entre o
caso contrrio.
nmero de empregos desde que comeou a trabalhar (E) e a idade do primeiro
enlprego (1), de jovens em uma pequena cidade do Estado de so paulo. w\z 1 2 t
r)
n. crie uma tabela de dupla entracla, contendo Etrio nas linhas e Coag nas
colunas. Com base em tal tabela, reavalie se a presena de cogulos
Captulo 6
diferente dependendo da faixa etria.
b. Suponha que um paciente escolhido ao acaso.
Qual a probabilidade de que Variveis Aleatrias Contnuas
a pessoa apresentasse cogulos no momento de admissol E uma pessoa
de
faixa etria mais alta?
c. Voc diria que Coag e Etrio so independentes? por qu?
38. (Use o computador) Novamente com os dados do Exerccio 23 do Captulo (r.1 Introduo
1.
considere agotaavarivelCuracriadanoitem(c).
\ Neste captulo, discutiremos a Vracteriz4o de variveis cujos possveis
a. Crie uma tabela de dupla entrada com Cura nas linhas e Tratjm nas colunas.
b. com base na tabela do item (a), voc diria que neste caso,/rapidezda cura valores ocorrem aleatoriamente e pertencem a um intervalo dos nmerd's reais:
depende do tipo de tratamento considerado? Justifique. virriveis aleatrias contnuas. Renda, salrio, tempo de uso de um equipamento,
/ comprimento de uma pea e rea atingida por certa praga agreola so exemplos
c. Qual a probabilidade de que uma pessoa selecionada o u"uro tenha cura
rpida, dado que recebeu tratamento do tipo I ? dc quantidades que podem ser modeladas por variveis aleatrias contnuas. De
d. Qual a probabilidade de uma pessoa ter recebido tratamento do tipo I, dado lrrma semelhante quela desenvolvida. para variveis aleatrias discretas,
que teve cura normal? prccisamos estabelecer, para as contnuas, a atribuio de probabilidades s suas
cliversas realizaes que, neste caso, podem assumir um nmero infinito de
39. (use o computador) Responda os itens a seguir, baseado nos dados de vtlores diferentes. Abordamos esta questo no prgximo exemplo.
incidncia de cncer apresentados no Exercc io 24, captulo l.
a. utilizando a mediana da varivel GL, classifique os pacientes em dois Iixemplo .1.' Estudos anteriores revelam a existncia de um grande lenol de
grupos, de alta e de baixa taxa de glicose. Denote essa nova varivel por gua no subsolo de uma regio. No entanto, sua profundidade ainda no foi
Clagl e construa uma tabela de dupla entrada entre Clagl e ALB. Voc diria tlcterminada, sabendo-se apenas que o lenol pode estar situado em qualquer
que as duas variveis esto relacionadas de alguma forma? ponto entre 20 e 100 metros.
b. considere os valores da varivel Idade em trs grupos: jovem com at,25 Vamos supor que escolhemos, ao acaso, um ponto nessa regio e
anos (inclusive), meia idade para indivduos com idades entre 25 e 55 anos tlispomos de uma sonda que, ao fazer a perfurao, detecta com preciso a
(inclusive) e senior para maiores de 55 anos. construa uma tabela de dupla lrlofundidade do reservatrio de gua. Denotamos por X a varivel alearia
entrada para estudar o comportamento desses grupos em relao rcpresentand o a p rofundidade.
concentrao de fosfato, tirando as concluses pertinentes. Notemos que, apesar de X poder ser qualquer nmero entre 20 e 100
c. Escolhendo-se um paciente ao acaso, qual a probabilidade de que ele seja do nctros, o instrumento, com que trabalhamos, pode no ser to preciso como
grupo .falso-negativo, dado que tem mais de 50 anos? E ter acima liostaramos. Por exemplo, uma profundidade de 32,571 metros poderia ser
de 50 rrrcdida por 32,6 metros. Vamos assumir, entretanto, que temos um instrumento
irnos, dado que no do grupo falso-negativo?
itlcal que no faz aproximaes. Nessas condies, podemos supor a sonda
40. (use o computador) utilize as informaes do arquivo aeusp.txt, introduzido ;rcoplada a um instrumento indicador da profundidade e um dispositivo que,
no Exerccio 26 do Captulo 1. tlrrnndo a sonda encontrar gua, provoque a imediata interrupo da perfurao.
a. crie uma tabela de dupla entrada com as variveis comun e Renda. Voc Uma vez que no temos informaes adicionais a respeito da
diria que existe associao entre elas? lrronndidade do lenol, razovel assumirmos que a sonda pode parar em
b. Repita o item (a) para as variveis Reproce e Trab. rprnlquer ponto entre 20 e 100 metros, sem que tenhamos motivos para privilegiar
c. O que pode ser dito da associao entre nmero de residentes (varivel cssn oll aquela profundidade. Assim, consideraremos todos os pontos como
Resid) e idade que comeou a traballrar (varirvel Itrab),? igrralmcnte provveis. Se utilizarmos a mesma idia de atribuir a cada possvel
l6(t Captulo 6: Variveis Aleatrias 167
6,1 Introduo
ponto uma probabilidade, teremos uma dificuldade extra, pois eles pertencem
intervalo [20, 100], em que existem infinitos nmeros reais. Assim, se cada Densidade
Densidade de
Probabilidade
100
Note que, dada as caractersticas do problema, a diviso em g intervalos
produziu o mesmo valor de densidade de l/80 para todos eles. Se dividirmos o
intcrvalo [20, 100] em l6 faixas iguais, utilizando o mesmo argumento anterior, Estamos agora em condies de caracterizar, completamente, a atribuio
tcrnos que os intervalos [20, 25), [25, 30), [30, 35), .. . , [95, 100] tero todos a rlc probabilidades para o caso contnuo. Ela ser definida pela fuea abaixo de uma
rosma probabilidade l/16. O histograma correspondente ser: I'uno positiva, denominada densidade de probabilidade. Observe que a
clcnsidade em si no uma probabilidade, mas uma funo matemtica que nos