Você está na página 1de 91

l,lsllr olrr ir ('llnlir irrlrorlrtr.

iru;t
I )t,: l'Rr lttAtn,n)AI)E
[tlolrrrlrilirlirtlc c rt l,stlrtslit it, It'ttrlrr
s'l'rt rA si<[o llirlrot'ir<[l ;rirtir irlrrtros rlrrs r'rrcirs

<k' < in< iirs lriolrigi< lrs, ('xlrlirs ('

hrrmanas. Ao corrtliilio rlt' orr(rrrs

rrItr'trlo Mlrgalhes textos e lcrlc'1ir'('s, os ttilli<'os <lc

Estatstica l)escritivir rriro lrarrr


lur l't'rlt'rlsrl <lc [,ima
apresentados en ur rnit o captrlo:

procurou-se i n trodrrzir csses conceil os

em paralelo corn outros tpicos mais


tericos no decorrer do livro. Desse
modo,.buscou-se desenvolver texto
de forma similar ao uso prtico da

Estatstica, quando normalmente um

conjunto de dados explorado


descritivamente antes da modelagem
e aplicao de tcnicas estatsticas.

No foi explicitado o uso de nenhum


software em particular, uma vez que se

procuro enfatrzar as idias envolvidas

e no a habilidade computacional.

No obstante, vrios exerccios -


apresentados ao {im de cada seo
e em uma seo especfica ao final

de cada captulo - assumem o uso de

computadores para sua resoluo e

alguns conjuntos de dados mais


extensos so disponibilizados na

internet, o que estimula o leitor 4

utilizar um programa computacional


com o qual tenha famiiariclade pan
ar rxl io ttits t'csoltr'<-rcs.
"
)''

trpyrlglrt O hy Mulcos Nascinrcnlo Magalhcs c Arrtonio Carlos l)ctltoso clc Lima Prefcio da 6s edio
l" r'rlio 1999 (lMli-tJSP)
J'' r'rlt1'rlo 2(XX)( lMll-l.JSl') Bste texto fruto da nossa experincia de vrios anos como professores cl
.1" crlilio 2(X) I (lMli-tJSP) Departamento de Estatstica do Instituto de Matenttica e Estatstica eln
,1" crliro 2(X)2 (lJclusp)
Unversidade de So Paulo. Nesse perodo, foram ministradas diversas disciplinns
.1" crliro 2{X}2 (Ddusp)
(rn ctlilo 2(X)4 (liclusp) lrrsicas de Estatstica para cursos nas reas de Cincias Humanas, Exatns e
Biolgicas.
Buscamos enfatizar dois aspectos neste livro. O primeiro se refere $
l )utkrs lnlct nacionais dc Catalogao na Publicao (CIP)
(('inrala Ilrasileira do Livro, SP, Brasil) rcpartir a Estatstica Descritiva ao longo do texto, suavizando, assim, a transiilo
pari Probabilidade e Variveis Aleatrias. Em geral, os alunos sentem o impacto
Mttgrt lhilt's, Mitt cos Nascinrento
<le uma maior formalizao e, muitas vezes, no conseguem estabelecer o elo clc
Nuiics rlc I'robabilidade c Estatstica / Marcos Nascimento
Mngllhitcs, nlonio Carlos Pcclroso cle Liml - ed. - So Paulo: ligao entre essas partes. Um segundo interesse transmitir a importncia dn
Jltlilurl tlu IJrtive lsichclc de So Paulo, 2004. - (Acadmica; 40) colrputao na Estatstica. No atrelamos o texto a nenhum softvvare espec:ico,
lllhliogr';r li,rt permitindo que o conhecimento computacional anterior dos estudantes pudesse ser
tstN t5-3 I 4-077-3 incorporado, minimizando o desgaste de um novo aprendizado. Ressaltamos qUe
L listltsticl - llstuclo e Ensino 2. Matemtica - Estudo e vrios software disponveis no mercado podem ser utilizados. Os arquivos
lirrsirur 3. loltabiliclaclcs - Estudo e Ensino I. Ttulo IL Srie. mencionados no decorrer do livro esto disponveis em www.ime.usp.br/-noproest
t,1 0.171 cDD-5 t 9.507 juntamente com outras informaes de interesse'
ndicos para catlogo sistemtico: O livro contm exerccios ao final de sees e captulos. Os exerccios de
l, l1\lirlslicl: Matcnriitica: Estudo e Ensino 519.507 seo so mais diretos e visam a aplicao imediata dos conceitos discutidos. Ao
2, lolrlhilitlrtilcs c Estatstica: Materntica: fim de cada captulo, um considervel nmero de exerccios ajuda os estudante$ nll
lisluclo c Errsino 519.507
fixao global das idias apresentadas. Tambm so propostos exerccios ptlrn
serem desenvolvidos com a ajuda do computador. O principal objetivo desses
I)ll'cllns lcsclvltlos
{i exerccios, enfatizar as idias estatsticas envolvidas e no a habilidncle
computacional. No Apndice'8, "apresentamos as solues comentadas dos
lklusp lulitrtrt tll [Jnivclsidade de So Paulo Coutro d Ciaerap Ldarcai{h a exerccios de so e fornecems as respostas para os exerccios mpares de fim de
Av, lrrl,l,rrciarto Gualbclto, Tlavcssa J,374 do *hrreln
('untlll lltl. rll ntiga leitoria - Cidade Universitria Iiibirotecl captulo.
0550tl U{X) .- Sio l'uulo - SP - Brasil ll.. :;,gil''rs Em relao edio anterior, a sext edio apresenta pequenfls
I)ivisalo (lrrucrcial: tcl. (Oxxl l) 3091-4008 / 3091-4150 rnodificaes. Uma das figuras do Captulo 7 foi mudadapara o Captulo 6, locnl
SA(l (0xxl l) 3091-291 I - Fax (Oxxll) 3091-4151
que nos pareceu mais apropriado. Foram acrescentados exerccios em alguns
www,rrsp,lrr'/ctlusqr - c-mail: edusp@edu.usp.br 4658108 0\/0s captulos. Os erros em respostas, identificados at ento, foram corrigidos,
cr|sEra
lrrslilulo rlc Mllcnttica c Estatstica - IME-USP Pequenas alteraes de redao tambm foram feitas. As mudanas, em relaO t
Ituil rkr Millikr, l0l0 - Cidadc Universitria
quinta edio, esto listadas no endereo Internet mencionado acima.
0-55()t1"9(X) - S;io I'aulo - SP - Brasil
l)cplrlnnlcnt( tlc listatstica - Tel. (Oxxl l) 3091-6129 / 3091-6130 Ao longo das vrias ediges, diversos colegas contribuiram com sugestes,
('uixil lrslIl (r(),2tI - 05315-970 Entre eles destacamos Adilson Simonis, Cludia Monteiro Peixoto, Cllia Tsloi,
rvww, irrx',rrsgr,lrr'/*ttoproest - c-mail: noproest@ime.usp.br Denise Botter, Elisabeti Kira, Elisete da Conceio Q. Aubin, Julio da Mottt
l irt('(l iil llril/il l(X)4 Singer, Lighia B. Horodynski-Matsushigue, Lcia P. Barroso, Marli Mikael,
Nelson Tanaka, Rinaldo Artes e Silvia Ferrari. Maria Ceclia Camargo Magalhies
lroi leito o rlt'1tr1silo lcgal
vrt
vlu Prefcio

colnborou na reviso final da redao. A estudante Tatyana Maya Okano auxiliou


nn COrreo das respostas de vrios exerccios. Apontamos, ainda, o recebimento Contedo
CJc vrrias mensagens eletrnicas com comentrios e/ou sugestes. A todos que
Colnboraram, o nosso sincero muito obrigado. Agradecemos, ainda, aos alunos de
vlrias unidades da USP, que apontaram erros e deram sugestes. Finalmente,
gostaramos de agradecer a Lus Ricardo Cmara, da ADUSP- Associao dos

Docentes da USP, pela diagramao das tabelas e auxlio na arte final de algumas
dns figuras apresentadas no texto.
Pedimos, desde j, desculpas pelos erros que sero eventualmente
identificados nesta nova edio. As crticas e sugestes de colegas e estudantes I
gcro muito bem-vindas e, certamente, auxiliaro na rnelhoria da prxima verso.

So Paulo, janeiro de2004

Marcos N. Magalhes e Antonio Carlos P. Lima '


(marcos @ime.usp.br) (acarlos@ime.usp.br) '

t"r
Contedo

Lista de Defnies
2.r Probabilidade ......,........ .................... 38
2.2 Probabilidade condicional ............. ..................,,,42
2.3 Independncia de eventos....... .........,44 .

2.4 Partio do espao amostral ............46


3.r Funo discreta de probabilidade ...........

3.2 Funo de distribuio deprobabilidade ............63


3.3 Modelo Uniforme Discreto ........;.......... ..............68
3.4 Modelo Bernoulli ................... ......... 70
3.5 Modelo Binomial ................... ..........72

3.6 Modelo Geomtrico ......78


3.7 Modelo Poisson ......,,,,,,79
3.8 Modelo Hipergeomtrico ........... .....,82
4.1 Medidas de posio para um conjunto de dados .......,..,......,,94
4.2 Medidas de posio para variveis aleatrias discretas ........................... 98
4.3 Amplitude de uma varivel em um conjunto de dados ....,.. 103
4.4 Varincia e desvio-padro em um conjunto de dados ......... 104
4.5 Varincia de uma varivel aleatria discreta ....109
5.1 Funo de probabilidade conjunta ............... ..,..128
5,2 Probabi lidade condicional para variveis aleatrias discretas ............... 137

.5.3 Independncia de variveis aleatrias ..........,... 137


5.4 Correlao entre variveis num conjunto de dados brutos ...........,.......,. l4l
5.5 Covarincia de duas variveis aleatrias .........,147
.5.(r Correlairo entre variveis aleatrias ................. ................,.149

..t-,
xu Lista de Definies

6.1 Funo densidade de probabilidade ........... ...... 168 Lista de Figuras


6,2 Medidas de posio paravariveis aleatrias contnuas .....I73
6.3 Varincia paravariveis aleatrias contnuas .....................1,73
1.1 Populao e amostra
6.4 Modelo Uniforme Contnuo ..........177
Classificao de variveis....'..'....... ........"'."",.,', d
r.2
6.5 Modelo Exponencial ................. .....180
Exemplos de grficos publicados na imprensa ..:'....."""""" l2 '
1.3
6,6 Modelo Normal DiagramacircularparaavarivelToler.....'.'. .'.....'..""""""13
t.4
7,1 Parmetro
1.5 Grfico de barras paa avarivel Idade ......'.. ......."""':"""" 14
7,2 Estimador e estimativa .................. 208
Histograma paraavarivel Peso .'.'....'. .'..'.......'.15
t.6
7.3 Vcio ......... ..................213
1.7 Box-plot para o nmero de laranjas por caixa ...'........""""" 18
7.4 Consistncia ................ ...................213
1.8 Box-plot para a varivel Peso '.....'... ....'.....".'.....18
7,5 Eficincia ....................216 r.9 Box-plotda varivel Peso para cada sexo .'.'......'."...'..'........ 19

2,1 Regra de adio de probabilidades .'....... ....'.,'..' 39

2.2 Regra do produto de probabilidades .'....... ....',,,,43

2.3 rvore de probabilidades ......'.. ,...,.,45

2.4 Partio do espao amostral (k : 6) .'....,""""" 46


3.1. rvore de probabilidades - alteraes no subsolo ...........'.,..60

3.2 Funo de distribuio - doses de vacina ...........65

3.3 Modelo Uniforme Discreto [0, 10] .'...'...'.......,..,69

3.4 Grfico de freqncias - natalidade em porcos .'."...'..'.........75

3.5 Modelo Geomtrico (P: 0,0t) ..'.'7g


3.6 Modelo Poisson ( : 5) "..........."'.80
5.1 Independncia de variveis aleatrias '.....'.".."137
5.2 Valor esperado da soma de variveis aleatrias ..'.'.'.':"'......"'.......'....'. 145
5,3 Valor esperado do produto e independncia de variveis aleatrias ..,..146
.5.4 Correlao para conjuntos de dados (brutos) .'.'.'....'.". '.'....151

5,.5 Covarincia e correlao de variveis aleatrias ..'............. l5l

xtu
.qft

I'islu ilct liigrtnts


rlv

5,6 Varincia da soma de duas variveis aleatrias """"""""" 151


6,1 Densidade Uniforme Contnua ""' 178 Lista de Tabelas
Densidade Exponencial """"""""' """""""""'180
.l lnformaes de questionrio estudantil - dados brutos
6,2 """""'1
6,3 Densidade Normal
""' 183 l

1.2 Tubela de freqncia para a varivel Sexo """"" """""""""' 9


6.4 Aproximao Normal para o Modelo Binomial """"""""' 189 """"""""' 10
190 1,3 Tlbela de freqncia para a varivel Idade ""'""
6.5 Histogramas para valores simulados da Binomial """"""""""""""""' """"""""" I
1,4 Tabela de freqncia para a varivel Peso """""
1

7.l Efeito de n na distribuio amostral de X - N(10,I6/n) """"""""""22I


de X """"" """"""224 L5 TabeladefreqnciaparaavarivelTV""""""' """"""""'1l
7.2 Efeito do tamanho da amostra sobre a distribuio """" 100
4,1 Meclidas de tendncia central
8.1 Erros associados a testes de hipteses """"""'248
"""""""""" 11 1
4,2 Medidas de disperso
8'2Representaogrficadoserrosd'ep.,.'..... """"""""" 11
4,3 Propriedades da mdia e da varincia """""""'
1

S.3Representaogrficadaregioderejeio-unilateral...,.250 I l3
4,4 Modelos discretos- valor esperado e varincia """"""""""""""""""" 187
8,4Representaogrf\cadaregioderejeio-bilatera1 e varincia """"""""""""""""""'
6, I Modelos contnuos- valor esperado
8.5 Poder """""""""' """"""'254
7,l Estimadores para mdia' proporo e varincia """''"""""211
Funo

8,6 EtaPas de um teste de hiPteses """"'234


Intervalos de confian apaa p e """""
p
1 ,2
8.7 Student """"""""""'259
9,I Comparao de mdias para duas populaes """"""""""309
Densidade -

8.8 Nvel descritivo unilateral """"""" """""""""264


com Hoi F : Fo """"""""'265
g,2 Tnbela de Anlise de Varincia (ANOVA) ""' 326
8.9 Regies desfavorveis num teste bilateral

8. l0 Nvel descritivo bilateral"""""""' """""""""'266


8.1 I Densidade .f e Regio Crtica ""'27O

9.1 Cirsos na comparao de duas amostras """""""' """""""'295


9.2 Distribuio de Fisher- Snedecor """"""""""'317
9.3 Resduos no modelo de regresso linear simples """"""""':""""""""'335
Captulo L

Introduo Anlise Exploratria de Dados

t.1 O que Estatstica?


Neste captulo, pretendemos formalizar alguns conceitos que constitucrn tt
base de tcnicas desenvolvidas com a finalidade de auxiliar a responder, de I'ortrtit
objetiva e segura, situaes que envolvem uma grande quantidadc dc
irrformaes. A utilizao dessas tcnicas, destinadas anlise de situitcs
complexas ou no, tem aumentado efaz parte de nosso cotidiano. Tome-sc' pof
cxemplo, as transmisses esportivas. Em jogos de futebol, o nmero cle
cscanteios, o nmero de faltas cometidas e o tempo de posse de bola so daclos
geralmente fornecidos ao telespectador e fazem com que as concluses sobre qunl
time foi o melhor em campo, se tornem objetivas (no que isso impliqlle que
tcnlra sido o vencedor...). O que tem levado a essa quantificao de nossas viclus
no dia a dia? Um fator importante a populatizao dos computadores. No
passado, tratar uma grande massa de nmeros era uma tarefa custosa e cansativtt,
que exigia horas de trabalho tedioso. Recentemente, no entanto, grnnCle
quantidade de informaes pode ser analisada rapidamente com um computudor
pessoal e pfogramas adequados. Desta forma, o computador contribui,
positivamente, na difuso e uso de mtodos estatsticos. Por outro lado, o
computador possibilita uma automao que pode levar um indivduo ser prepilro
especfico a:utilizar tcnicas inadequadas para resolver um dado problema. Assitrt,
necessrio a compreenso dos conceitos bsicos da Estatstica, bem como 0s
suposies necessrias para o seu uso de forma criteriosa. Entendemos it
Estatstica como um conjunto de tcnicas que permite, de forma sistemtictt,
organizar, descrever, analisar e interpretat dados oriundos de estudos tltt
experimentos, realizados em qualquer rea do conhecimento- Estatrtos
denominando por dados um (ou mais) conjunto de valores, numricos ou nito. A
aplicabilidade das tcnicas a serem discutidas se d nas mais variadas rels tln
atividade humana.
A grosso modo podemos dividir a Estatstica em trs reas:
o Estatstica Descritiva
o Probabilidade
i o Inferncia Estatstica

I
Captulo 1: Introduo Anlise Exploratria de Dados l.lOqueEstatstica?

Estatstica Descritiva , em geral, utilizada na etapa inicial da anlise, cle funcionamento das lmpadas produzidas por uma indstria, no podemOS
cprlndo tomamos contato com os dados pela primeira vez. Objetivando tirar observar toda populao de interesse.
concluses de modo informal e direto, a maneira mais simples seria a observao Tendo em vista as dificuldades de vrias naturezas para se observal todos
tlos valores colhidos. Entretanto, ao depararmos com uma grande massa de dados, os elementos da populao, tomaremos alguns deles para formar um grupo i Ser
lrcrcebemos, imediatamente, que a tarefa pode no ser simples. Para tentar cstudado. Este subconjunto da populao, em geral com dimenso sensivelmentC
depreender dos dados informaes a respeito do fenmeno sob estudo, preciso rrenor, denominado amostra. A Figura 1.1 ilustra as etapas da anlige
irplicar alguma tcnica que nos permita resumir a informao daquele particular cstatstica.
conjunto de valores. Em outras palavras, a estatstica descritiva pode ser definida
coto urn conjunto de tcnicas destinadas a descrever e resumir os dados, a fim de
quc possamos tirar concluses a respeito de caractersticas de interesse.
Probabilidade pode ser pensada.como a teoria matemtica utilizada para
sc cstudarr a incerteza oriunda de fenmenos de carter aleatrio. Apesar de ser
urrrn rrea extremamente atraente e estudada do ponto de vista matemtico,
abordaremos, aqui, apenas os aspectos necessrios para as tcnicas estatsticas
irprcsentadas neste livro. Amostra
Inferncia Estatstica o estudo de tcnicas que possibilitam a w
cxtrapolao, a um grande conjunto de dados, das informaes e concluses
obtidas a partir de subconjuntos de valores, usualmente de dimenso muito
ffenor. Deve ser notado que, se tivermos acesso a todos os elementos que
clesejamos estudar, no necessrio o uso das tcnicas de inferncia estatstica.
Entretanto, elas so indispensveis quando existe a impossibilidade de acesso a
todo o conjunto de dados, por razes de natureza econmica, tica ou fsica.
Estudos complexos que envolvem o tratamento estatstico dos dados,
tusnalrnente, incluem as trs reas mencionadas acima. Na terminologia estatstica,
o grande conjunto de dados que contm a caracterstica que temos interesse Figura 1.1: Populao e amostra.
reccbc o nome de populao. Esse termo refere-se no somente a uma coleo de
inclivcluos, mas tambm ao alvo sobre o qual reside nosso interesse. Assim, nossa A seleo da amostra pode ser feita de vrias maneiras, dependendo, entre
populniro pode ser tanto todos os habitantes de Sorocaba, como todas as ()lrlr'os htores, do grau de conhecimento que temos da populao, da quantidade
lrnpaclas produzidas por uma ftbrica em um certo perodo de tempo, ou todo o rlc rccursos disponveis e assim por diante. Devemos ressaltar que, em princpio, A
sargue no corpo de uma pessoa. Algumas vezes podemos acessar toda a sr:lciro da amostra tenta fornecer um subconjunto de valores o mais pareciclo
po;lulao para estudarmos caractersticas de interesse, mas, em muitas situaes, possvcl com a populao que lhe d origem. A amostragem mais usada a
tal llroccciirnento no pode ser realizado. Em geral, razes econmicas so as mais (rtt!o,\lru r:ustral simples, em que selecionamos ao acaso, com olt sem reposi:o, os
clctclrninantes dessas situaes. Por exemplo, uma empresa, usualmente, no ilcrrs da populao que faro parte da amostra.
dispo clc vcrba suficiente para saber o que pensam todos os consumidores de Eventualmente, se tivermos informaes adicionais a respeito cltt
scus proclutos. Hir ainda razes ticas, quando, por exemplo, os experimentos de lrrrlrrrlirlio de interesse, podemos utilizar outros esquemas de amostragem muis
lttlornttilio cnvolvem o uso de seres vivos. Alm disso, existem casos em que a so'isticuclos. Por exemplo, se numa cidade, tivermos mais mulheres do clue
irnpossillilitltclc clc sc accssrr toda a populao de interesse incontomvel. Na 111y111lrs, podernos selecionar um certo nmero de indivduos entre as'mulheres e

tndlisc rlo sirngr"rc cle unra pessoi ou em um experimento para determinar o tempo outl'o nnrero entre os homens. Esse procedimento conhecido colno
(tt,toslt'o!:ct"tt. astraificada. Outras vezes, pode existir uma relao numeradl dOS
-"--qt

Captulo I: Introduo Anlise Exploratria de Dados 1.2 Organizao de Dados

itens da populago (uma lista de referncia) que nos permitiria utilizar a chamada 3. Discuta, para cadaum dos casos abaixo, os cuidados que precisam ser tomadOa
1mostragem sistemtica em que selecionamos os indivduos de forma pr- para garantir uma boa concluso a partir da amostra.
determinada, por exemplo de 8 em 8 ou de 10 em 10. Outros esquemas de a. Um grupo de crianas ser escolhido para receber uma nova vacina contra
ilmostragem poderiam ser citados e todos fazem parte da chamada Teoria da meningite.
Amostragem, cujos detalhes no sero aprofundados neste livro. Assim sendo, b. Sorteamos um certo nmero de donas de casa, para testar um novo sabEO en
terminamos esta seo mencionando que quanto mais complexa for a amostragem' p.
maiores cuidados devero ser tomados nas anlises estatsticas utilizadas; em c. Uma fbrica deseja saber se sua produo de biscoitos est com o ssbof
contrapartida, o uso de esquemas de amostragem mais elaborados pode levar a previsto.
uma diminuio no tamanho de amostra necessrio para uma dada preciso. d. Aceitao popular de um certo projeto do governo.

Exerccios da Seo 1.L: 1.2 Organizao de Dados


1. Classifique em verdadeiro ou falso as seguintes afirmaes: Nesta seo, discutiremos alguns procedimentos que podem ser utilizados
a. Estatstica um conjunto de tcnicas destinadas aorganizar um conjunto de pnrt organizar e descrever um conjunto de dados, seja em uma populaO OU em
valores numricos. ulB omostra. Veremos como conceitos relacionados Teoria das Probabilidades
b. Sempre que estivermos trabalhando com nmeros, deveremos utilizar a 11pnrecem naturalmente, levando-nos, assim, a uma exposio maiS criteriosa dO
Inferncia Estatstica. Rssullto.
c. A Estatstica Descritiva fornece uma maneira adequada de tratar um A questo inicial : dado um conjunto de dados, como "tratar" os vttlofeE,
conjunto de valores, numricos ou no, com a finalidade de conhecermos o nurnricos ou no, a fim de se extrair informaes a respeito de uma ou mAlC
fenmeno de interesse. elllctcrsticas de interesse? Basicamente, faremos uso de tabelas de freqnclas e
d. Qualquer amostra representa, de forma adequada, uma populao. grc'('icos, notando que tais procedimentos devem levar em conta a natUreZ& dO
e. As tcnicas estatsticas no so adequadas para casos que envolvam dnelos,
experimentos destrutivos como, por exemplo, queima de equipamentos, Suponha, por exemplo, que um questionrio foi aplicado aos alunog do
destruio de corpos de provas, etc. prirneiro ano de uma escola fornecendo as seguintes informaes:

2, Para as situaes descritas a seguir, identifique a populao e a amostfa Id: identificao do aluno
correspondente. Discuta a validade do processo.de inferncia estatstica para Turma: turma a que o aluno foi alocado (A ou B)
cada um dos casos. Scxo: F se feminino, M se masculino
a. Para avaliar a efic'cia de uma campanha de vacinao no Estado de So Iclade: idade em anos
Paulo, 200 mes de recm-nascidos, durante o primeiro semestre de um Alt: altura em metros
dado ano e em uma dada maternidade em So Paulo, foram entrevistadas a Peso: peso em quilogramas
respeito da ltima vez em que vacinaram seus.filhos.
lilhos: nmero de filhos na famli'a
b. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. lumn: hbito de fumar, sim ou no
c. Para verificar a audincia de um programa de TV, 563 indivduos foram Toler: tolerncia ao cigarro:
entrevistados por telefone com relao ao canal em que estavam (I) indif'erente, (P) incomoda pouco e (M) incomoda muito
sintonizados.
d. A fim de avaliar a inteno de voto para presidente dos brasileiros, 122
pessoas foram entrevistadas em Braslia.
. -Edl

Captulo I: Introduo Anlise Exploratria de Dados 1.2 Organizao de Dados 7

Exerc: horas de atividade fsica, por semana


Cine: nmero de vezes em que vai ao cinema por semana Tabela 1,1: Informaes de questiondrio estudantil - dados brutos,
OpCine: opinio a respeito das salas de cinema na cidade:
.[d Turma Sexo Idade AIt Peso Filh Fuma Toler Exer Cine Opcine TV OpTV
(B) regular a boa e (M) muito boa
TV: horas gastas assistindo TV, por semana 1.AF 1,7 L,60 60 ,5 2 NAO P 01- 81.6R
2AF 18 1,69 55,0 1 NAO M 01 B7R
OpTV: opinio a respeito da qualidade da programao na TV: 3AM 1,8 L,85 12,8 2 NAO P 52 M1.5R
(R) ruim, (M) mdia, (B) boa e (N) no sabe 4AM l-, 85 80, 9 2 NAO P 52 B20R
5AF 19 1", s8 55, 0 l- NAO M B5R
6AM 19 1_,76 60,0 3 NAO M a1 13 Z .b{

7\F 20 1,60 58.0 1 NAO P 3l- B7R


O conjunto de informaes disponveis, aps a tabulao do questionrio BAF l-8 L,64 41,0 3- SIM I MlOR
ou pesquisa de campo, denominado de tabela de dados brutos e contm os 9F t_8 L,62 57,8 3 NAO M M1-2R
IOAF T7 t,64 58,0 2 NAO M 22 MlOR
daclos da maneira que foram coletados inicialmente. Os valores obtidos para cada 11 F l-8 r,72 70,0 L SIM I 102 B8N
uma dessas informaes esto apresentados na Tabela 1.1. Cada uma das 12 A F 18 L,66 54,0 3 NAO M 02 BOR
13 A F a1 L,70 58,0 2 NAO M 6t M 30 R
Caractersticas perguntadas aos alunos, tais como o peso, a idade e a altura, entre T4AM I9 1, 78 68, 5 l- SIM I 5l_ M2N
outras, denominada de varivel. Assim, a varivel Altura assume os valores 15AF 18 1,65 63,5 l- NAO I 41- BlOR
16AF t-9 7,63 47 ,4 3 NAO P 01 B18R
(em metros) 1,60; 1,58;... e a varivel Turma assume os valores ou B. LTAF L7 1.,82 66 ,0 r NAO P 31 BlON
Claramente tais variveis tm naturezas diferentes no que tange aos possveis 1g M 1"8 1-,80 85,2 2 NAO P 34 BlOR
19 A F 20 1,,60 54,5 t NAO P 11 B5R
valores que podem assumir. Tal fato deve ser levado em conta nas anlises e, para 30 A F l_8 L,68 52,5 3 NAO M 1) B14M
fixar idias, vamos considerar dois grandes tipos de'variveis: numricas e no 11 A F 2L 1.,70 60,0 2 NAO P 82 B5R
22F 18 1,65 58,5 1 NAO M 03 B5R
numricas. As numricas sero denominadas quantitativas, ao passo que as no 33 F L8 1,57 49 ,2 1 SfM I 54 BlOR
numricas, qualitativ as. 24AF 20 L,55 48,0 1 SIM T 01 M 28 R
25 A F )^ 1.,69 57,6 2 NAO P M4N
A varivel qualitativa quando os possveis valores que assume B6 A F. L9 L,54 51,0 2 NAO I 62 B5R
3'/ B F z3 L,62 63 ,0 2 NAO M 82 M5R
representam atributos e/ou qualidades. Se tais variveis tm uma ordenao 3E B F 18 L,62 52,0 1 NAO P 1"1 MlOR
natural, indicando intensidades crescentes de realizao, ento elas sero 39 B F 18 L,57 49,0 2 NAO P 3L BL2R
30 E F 25 t,65 59,0 4 NAO M 12 M2R
ctassificadas como qualitativas ordinais. Caso contrrio, quando no possvel 31 B F 18 t,6L 52,0 1- NAO P 22 M6N
estabelecer uma ordem natural entre seus valores, elas so classificadas como 3 E M 17 L,71. 73 ,0 L NAO P 1L B 20 R
3 B F T7 t,65 56,0 3 NAO M 21 BL4R
qualitativas nominais. Variveis tais como Turma (A ou B), Sexo (feminino ou 34 ll F L7 r,67 58,0 L NAO M 42 BlOR
masculino) e Fuma (sim ou no) so variveis qualitativas nominais. Por outro 1E li M J. 1",73 87,0 r NAO M 7L B25B
16 t! Ir 18 r,60 47,0 t NAO P 51 M14R
lndo, variveis como Tamanho (pequeno, mdio ou grande), Classe Social (baixa, 1't 11 M 77 1,70 95,0 1 NAO P 1-0 2 M12N
rndia ou alta) so variveis qualitativas ordinais. t1 M 2L L,85 84,0 1 SIM T 64 B],OR
19 11 1,'
10 1,70 60,0 1 NAO P 52 BT2R
Variveis quantitativas, isto , variveis de natureza numrica, podem ser 4r.) B M 1A 1,73 '73 ,0 1 NAO M 4L B2R
subdivididas em discretas e contnuas. A grosso modo, variveis quantitativas 41 t] F L7 1,70 55,0 NAO f 54 BlOB
4 Fr F' 23 1,45 44,0
1
2 NAO M )) B 25 R
discretas podem ser vistas como resultantes de contagens, assumindo assim, em 41 HM 24 I,76 75,0 2 NAO I 70 M1.4N
geral, valores inteiros. De uma maneira mais formal, o conjunto dos valores 44DF L8 1,68 55,0 1 NAO P 51 B8R
4F F F 18 1,55 49,0 1 NAO M 01 MlOR
assumidos finito ou enumervel. J as variveis quantitativas contnuas 4 E TI L9 1,70 50,0 7 NAO M 01 B8R
assumem valores em intervalos dos nmeros reais e, geralmente, so provenientes 478Iil 19 1,5s 54,5 2 NAO M 43 B3R
4E H F 18 r., 60 50, 0 I NAO P 2L B5R
de uma mensurao. Por exemplo, Nmero de Irmos (0, I,2, ...) e Nmero de S H M t7 L,8o 71,o 1 NAO P "t0 M1.4R
Def'eitos (0, 1,2,.,.) so discretas, enquanto que Peso e Altura so quantitativas h0 11 M 1B 1,83 86,0 L NAO P 70 M 20 B

contnufls.
Captulo I: Introduo Anlise Explorarta de Dados 1.2 Organzao de Dados I

Resumimos a classificao das variveis no esquema apresentado na Apesar de conter muita informao, a tabela de dados brutos pode nO Sef
Figura I.2 (attulo de exerccio, tente classificar todas as variveis da Tabela 1.1). prtica pu.u r"rpondermos s questes de interesse. Por exemplo, da Tabela 1'1
rriro imediato dizer se os alunos se incomodam muito ou pouco com Os
l'umantes. Porlanto, a partir da tabela de dados brutos, vamos construir UmO nOvtl
Nominal t1$ela com as informaes resumidas, para cada varivel. Essa tabela Sefd
clenominada de tabela de freqncia e, como o nome indica, conter os valOfeg dA
virrivel e suas respectivas contagens, as quais so denominadas freqnelAEq
' -.ordinal ttbsolutas ou simplesmente, freqncias. No caso de variveis qualitativas OU
-a"Qualitativa tprantitativas discretas, a tabela de freqncia consiste em listar os valorog
Varivel
possveis da varivel, numricos ou no e fazer a contagem na tabela de dadOg
\ 'Quantitativ u 1--""-Discreta lrrutos do nmero de suas ocorrncias. Representaremos por n; a freqncia dq
.-,contnua vulor i e por ?? a freqncia total. Para efeito de comparao com outros grupOS
ou conjunos de dadoi, ser conveniente acrescentarmos uma coluna na tabela de
l.oqncia contendo o clculo da freqncia relativa, definida por fi = U/t\:,
Convm notar que, quando estivermos comparando dois grupos com relaO S
freqiincias de ocorrncia dos valores de uma dada varivel, grupos cgm Um
1.2: Classificao de varidveis. nmero total de dados maior tendem a ter maiores freqncias de ocorrncia dos
liSura
vtlores da varivel. Desta forma, o uso da freqncia relativa vem resolver Bte
Vale ressaltar que, em muitas situaes prticas, a classificao depende problema.
de certas particularidades. Por exemplo, a varivel ldade, medida em nmero de A Tabela 1.2 apresenta as freqncias para a varivel Sexo, obtida a p0rtir
anOS, pode ser vista como discreta, entretanto, Se levarmos em conta os dias, no cln Tubela I .1.
absurdo falar que a idade 2,5 ou 2,85 anos, dando assim respaldo para classific-
la como contnua. Por outro lado, dependendo da preciso do instrumento
utilizado para se obter medidas em um objeto, podemos ter limitaes no nmero Tabela 1.2: Tabela de freqnca para a varivel Sexo.
cle casas decimais e uma varivel de mensurao pode se "tornar" discreta. E
Sexo n,i .t
importante salientar que a classificao apresentada acima se refere natureza da t t'7
varivel e, em geral, devemos utilizar o bom senso na hora de decidir qual F d 0,74
procedimento adotar para caracterizar uma varivel. Para salientar tal fato, M 13 0,26
menciOnamos que podemos, inclusive, discretizar uma varivel contnua para total n:50 1

obter uma melhor representao da ocorrncia de seus valores no conjunto de


dirclos.
Outro ponto que pode trazer confuso que, muitas vezes, na utilizao Note que, para variveis cujos valores possuem ordenao n0tufel
Cle programas computacionais, associamos cdigos numricos a uma varivel (eluglitltivas ordinais e quantitativas em geral), faz sentido incluirmos tambm
qqalitativa. Por exemplo na Tabela 1.1, pode-se associar ao sexo feminino o valor urttrt coluna contendo asJreqncias acumuladas r,,'' Afreqncia acumulada at&
I e ao masculino 2. Apesar da varivel ser representada por valores numricos, un1 cefto valor obtida pela soma das freqncias de todos os valores da varivel,
issO no a torna uma varivel quantitativa. Novamente, vemos que a natureza da tncnorcs ou iguais ao vator considerado. Sua utilidade principal ajudor o
vnrivel deve sempre ser levada em conta na hora de se interpretar resultados estu$eleccr pontos de corte com uma determinada freqncia nos valores da
obtidos na anlise descritiva. vurivel. Poi exemplo, na Tabela t .3, observamos que 907o dos alunos tm idadcs
rrt 2l unos, cle fato 22, um vez que este valor tem 'reqiincia zero.
l0 Captulo 1: Introduo Anlise Exploratria de Dados L2 Organizao de Dados il

Tabela 1.4: Tabela de freqnca para a vardvel Peso.


Tabela 1.3: Tabela de freqncia para a varvel ldade,
Peso fl,4 lt. fo"
Idade TLi .ft .f o" 40,01-- 50,0 B 0,16 0,16
L7 9 0,18 0,18 50,0 F 60,0 22 0,44 0,60
18 22 0,44 0,62 60,0 l-- 70,0 8 0,16 0,76
19 I 0,L4 0,76 70,0 F 80,0 6 0,L2 0,BB
20 4 0,08 0,84 80,0 t-- 90,0 5 0,10 0,98
2L 0,06 0,90
22
.1

0 0 0,90
90,0 F 100,0 1 0',02 1,00
t total 50 1
ZJ 2 0,04 0,94
24 1 0,02 0,96
25 2 0,04 1,00 Vamos estudar, agora, a situao em que a varivel por natureza
total n:50 1 cliscreta, mas o conjunto de possveis valores muito grande. Por exemplo, a
vflrivel TV, definida como o nmero de horas assistindo televiso, tem valores
inteiros entre 0 e 30 e uma tabela representando seus valores e respectivas
Com relao varivel Peso, lembremos que foi classificada como ieqncias seria muito extensa e pouco prtica. O caminho adequado, nesse caso,
quantitativa contnua e assim, teoricamente, seus valores podem ser qualquer trotar a varivel como se fosse contnua e criar faixas para representar seus
nmero real num certo intervalo. Aqui os valores variam entre 44,0 e 95,0 kg e vulores. Assim, passamos a tratar como contnua uma varivel que seria,
foram medidos com apenas uma casa decimal. Ainda assim, existe um grande originnlmente, classificada como discreta.
nmero de valores diferentes de modo que, se a tabela de freqncia fosse feita
nos mesmos moldes dos casos anteriores, obteramos praticamente os valores Tabela 1.5: Tabela de freqncia para a varivel TV.
originais da tabela de dados brutos. A alternativa que vamos adotar consiste em
construir classes ou faixas de valores e contar o nmero de ocorrncias em cada TV ni .ft fu"
laixa. Para a varivel Peso, usamos faixas de amplitude 10, iniciando em 40 kg. 0F-6 L4 0,28 0,28
Na Tabela 1.4, escolhemos incluir o extremo inferior e excluir o superior. Dessa 6- t7
12 0,34 0,62
I'orma, a freqncia da faixa 40,0 F 50,0 no incluiu os alunos 46 e 48 que
tinham peso igual a 50,0 kg. A opo de qual extremo incluir pode ser arbitrtria,
12- 18 11 0,22 0,84
18 t- 24 4 0,08 0,92
n"os o importante indicar claramente quais so os valores que esto sendo
conterdos em cada faixa. 24l---136 4 0,08 1,00
Apesar de no adotarmos nenhuma regra formal quanto ao total de faixas, total 50 1

utilizarnos, em geral, de 5 a 8 faixas com mesma amplitude. Entretanto,


ressaltamos que faixas de tamanho desigual podem ser convenientes para
A organizao dos dados em tabelas de freqncia proporciona um meio
representar valores nas extremidades da tabela.
cl'icitz cle estudo do comportamento de caractersticas de interesse. Muitas vezes, tt
irrbrnrao contida nas tabelas pode ser mais faci'lmente visualizada atravs dc
grrl'icos. Meios de comunicao apresentam, diariamente, grficos das mais
vlriidils formas para auxiliar na apresentao das informaes. rgos pblicos e
('nprcsos sc municiom de grrficos e tabelas em documentos internos e relatrios
--- qFFF TF
1,2 Organtzao de Dados
t) Cttpftulrt l; hilnxluiltt Antilise ll.rplorutrfu dt l)urlt*

equivocodr, Obviamente, questes de manipulao incorreta da informao


de atividades e desempenho. Graas proliferao de recufsos grficos, cuja p,id.* ocorrer em qualque e,"7: n: cabe culpar a Estatstica' O uso e a
Cnstruo tem sido cada vez mais simplificada em programas computacionais, divulgao tica e criterira de dados devem ser
pr-requisitos indispensveis e

cxiste hoje uma infinidade de tipos de grficos que podem ser utilizados' Como inegocirveis.
ilustra deste ponto, apresentamos na Figura 1.3 alguns grficos publicados em pizza, barras t
vamos definir trs tipos bsicos de grficos: disco ou
na grfica pode sef
rrgos de imprensa. li$t(,t4ruma. como dissemos, a criatividade apresentao
entre vrios' de
inrerrsa e os grficos que discutiremos sintetizam trs caminhos,
CIDIO RU|AT representao.
'grfico
EVOLUO DO LUCRO tiQIDO circular, se adapta muito
o de d.isco, otr pizza, ou ainda diagrama
em repartir um disco em setores
U$$ MII"HES RECURSOS PROPRIOS
hem s variveis qualitativas nominais. consiste
circularescorrespondentessporcentagensdecadlvalor,calculadas
freqncia
exemplo, O,20 de
rnnltiplicando-se por 100 a freqnca relativ f6.Por
relativa a207o o- u"' que 100 x 0'20:20' AFigura 1'4 apresenta
"o.r"rpond" da Tabela 1.1. Note que
o cliagrama de disco para avarivel Tol-er, obljd^a.a .nartir
fntiir correspondent categoria "indiferente" foi destacada.
'

12, t5,9 E[/ SIR = 22'l 0


LLiPLTO 8,9 No D[ C0NTRATCS

VALO|ES A-IUATIZADOS NOS IOIDES DA COR|EAO INEGRAI

RECURSOS HUMANOS RECURSOS HUN/ANOS

DrsTRrBUrO POR ruvrL HtrnRRSUtCO


DISIRISUO POR ESCOLARiDADE

t
ls I t
e= Figura 7.4: Diagrama circalar pard varilvel Toler'
' ===
,= ogrficodebarrasut\|\zaoplanocartesianocomosvaloresdavarivel
TSCR
== no eixo das abiissas e as freqnciai ou porcentagens no
eixo das ordenadas'
barra com altuf8
Note que pIia cada valor a varivel desenha-se uma
CAIMS

de grfico se adapta
,nrr"rptnd"rrdo sua freqncia ou porcentagem. Esse tipo
23,891
l. Gor
== ==Gou ==
2

==
SuPeior

rnelhoi s variveis discretas ou qualitativas ordinais'

Figura 1.3: Exemplos de grdficos publicados na im'prensa'

Deve ser notado, entretanto, que a utilizao de recursos visuais na


criao de grficos deve ser f'eita cuidadosamente; um grfico desproporcional em
suas medids pode dar falst impresso de desempenho e conduzir a concluses
t4 Captulo l: Introduo Aruilise Exploratria de Dados 1.2 Organizao de Dados t5

em cada faixa so homogeneamente distribudas, para um mesmo retngulo, fatias


de mesmo tamanho contm uma mesma porcentagem de observaes. Apesar do
suposio de homogeneidade no ser sempre verificada, ela bastante razovol
em muitas situaes e pode ser uma boa aproximao da realidade.
25

20 \r
.g
oc
t;
e15
E
L
$ru'
10

18 le 20
,1"

Fgura 1.5: Grftco de barras para a varvel ldade.

/-'t'
O histograma consiste em retngulos contguos com base nas faixas de 40x I
60 70 80 90 100
{)
valores da varivel e com rea igual freqncia relativa da respectiva faixa. .?- Peso '

Dessa forma, a altura de cada retngulo denominada densidade de freqncia oa Figura 1.6: Histograma para a varivel Peso.
simplesmente densidade definida pelo quociente da reapela amplitude da faixa.
Para a varivel peso, as densidades de cada faixa podem ser obtidas dividindo-se a Exemplo 1.1.' Vamos calcular a mediana da varivel Peso atravs do histogram,
coluna fi da Tabela 1.4 por 10, que a amplitude de cada faixa. O histograma Inicialmente identificamos o retngulo que deve conter a mediana. Uma simplos
correspondente a essa varivel apresentado na Figura 1.6. Note que inclumos, soma das reas resulta que a mediana pertence ao intervalo [50,0; 60,0), uma vsz
no topo de cada retngulo, a porcentagem de observaes correspondente, para eluc at o valor 60,0 temos acumuladas 607o das observaes. Dentro dessa faixa,
ftci I itar a interpretao. precisamos determinar um retngulo com rea igual a 34Vo, que o que falta para
importante ressaltar que alguns autores utilizam a freqncia absoluta rringir o valor 50Vo. A situao ilustrada na figura a seguir, cujo retngulo
ou porcentagem na construo do histograma. Preferimos o uso da densidade de procurado est marcado com rea mais escura.
'eqncia, pois ela faz om que o histograma no fique distorcido, quando Com uso de propores, estabelecemos a seguinte igualdade:
amplitudes diferentes so utilizadas nas faixas. Uma outra vantagem diz respeito
relao entre histograma e grfico da funo densidade de probabilidade, que ser mdor,,- 50 _ 60 - 50 lo
visto mais adiante. 0,34 0,44
O histograma tambm pode ser utilizado no clculo da mediana (mdor,),
que o valor da varivel que divide o conjunto de dados ordenados em dois
subgrupos de mesmo tamanho, Isto , das observaes ordenadas, 507o esto f;,li4 .,t. - JJ-' i,!t
rn , 1-,
rtlt
abaixo e 507o esto acima da mediana. Assumindo que as observaes da varivel r ), ,lr,
-,-'
,I''
Y
"r'qr

t6 Captulo 1: Introduo AnIise Exploratria de Dados 1.2 Organizao de Dados I7

q)
E
p
0,05 .,,'60-
'--'^
a 6r,'6 ''
(D
o o,o+ C,t\
:

0,03
',r"r''",'4'
o,o2

0,01

0,0

50 60
mdot, Qt Peso

l)c I'orma semelhante, obtemos para o terceiro quartil Qs : 69,38 kg. tr


Da segue qtte mdo6, : 57,73kg. tr
Para o clculo de quartis e medianas usando a tabela de dados brutos,
O conceito de mediana, que ser considerado ern detalhes no Captulo
4' prccisamos ordenar as observaes e escolher os valores que dividem os dados
pode ser generalizado para situaes em que o conjunto de dados dividido em
nits propores desejadas. Eventualmente, ser necessrio tomar mdias de
mais do q:ue dois subgrupos' Um caso importante aquele -em que dividimos
o
vulores vizinhos. No caso de tabelas de freqncias, os dadosj esto ordenado
conjunto em quatro iubg*pot. Para tanto, deveremos determinar' alm da ru procedimento similar.
rn"iunu, dois valores tais qu 25Vo das observaes ordenadas estaro abaixo
de
Uma representao grfica envolvendo os quartis o box-plot Definimoa,
um deles e 75Vo estaro abaixo do outro' Tais valores so denominados' ul'nn "caixa" com o nvel superior dado pelo terceiro quartil e o nvel inferior pelo
respectivamente, primeiro quartil e terceiro quartil, Usualmente representados plirneiro quartil. A mediana representada por um trao no interior da caixa o
poi 8r e Q3. Note que a mediana, discutida anteriormerrte, representa o segundo segllcntos de reta so colocados da caixa at os valores mximo e mnimo, que
q""rii. O clculo os valores dos quartis tambm pode ser feito atravs do rrlo scjam observaes discrepantes (o critrio para decidir se uma observao
histograma, conforme mostrado no exemplo a seguir. tliscrcpante no ser discutido aqui, mas, em geral, envolve a diferena entre o
tercciro e o primeiro quartis)- O prximo exemplo ilustra a construo do box-plot
Exemplo 1.2; No Exemplo 1.1, o valor da mediana (segUndo quartil) calculado
pnrt uma varivel quantitativa discreta utilizando-se os dados brutos.
atrav do histogram u, 57,73 kg. De forma semelhante, vemos que o valor do
primeiro quartii tambm se encontra no intervalo [50,0; 60,0)' isto ' Ilwtttplo 1.3.' Suponha que um produtor de laranjas costuma guardar as frutns cm
correrpondr ao valor 8r que determinar uma tea de 9Vo no retngulo cuixus c estr interessado em estudar o nmero de laranjas por caixa. Aps um dia
correspondente. Assim, temos (ver figura a seguir) rle colhcita, 20 caixas foram contadas. Os resultados brutos, aps a ordenno,
silo: 22, 29, 33, 35, 35, 37, 38, 43, 43, 44y 48, 48, 52, 53, 55, 57, 61, 62, 67 e 69,
: *=
Q^=
0,09
=-!o 0,44
lo + Qt:52,,05kg' lrrrr osses dados, temos qe md,,6, ilfOo+ 11s) l2 : (44+48) 12 = 46,
' Annlogarnente, obtemos Qr : 36 e Qs :56. Tambm observamos que o nmero
r(-

\,i',, 511,,\ ''i I r(. ,


l,.l ()rganizao de Dados t9
18 Captulo 1: Introduo Anlise Exploratria de Dados

o nmero mximo, 69. O box-Plot Grficos tipo box-plol tambm so teis para detectar, descritivamentc,
mnimo de laranjas em uma caixa ' 22 e
rliirl'crras nos comportamentos de grupos de variveis. Por exemplo, poclemos
correspondente apresentado na Figura 1'7'
tturrsitlornr grficos da varivel Peso para cada sexo. O resultado apresentado nn
l'jigrrlir 1,9, em que podemos notar que os homens apresentam peso mediano
atrllet'iur ito das mulheres, alm de uma maior variabilidade'

60 100

90

3so
e 80
E
o
J

40
En
!
I

60

30 50
I

40 I I

F M
20
Sexo

Figara 1.7. Box'plot para o nmero de laranjas por caixa' Irigura 1.9: Box'plot da varivel Peso para cada sexo,

A representao gr,ficaatravs do box-plot bastante rica no sentido de


llxerr'clos tll Sco 1.2:
informar, entre outras coisas, a variabilidade e simetria dos dados' Note'que na
Figura 1.7 os dados apresentam simetria acentuada (a distncia da mediana para l, tlllssil'ique cacla uma das variveis abaixo em qualitativa (nominal / ordinal) ott
os"quartis a mesma), o mesmo podendo ser observdo a respeito da distncia
dos
rltmnl il rt i vil (cliscreta / contnua):
pono, de mnimo e mximo em relao mediana. Em contraste, temos na Figura
$. Ocorrlrcia de hipertenso pr-natal em grvidas com mais de 35 anos (stl
i.A o box-ptot paraa varivel Peso, que apresenta uma pecluena assimetria. tttrttlrtsf,opossveisrespostasparaestavarivel). l' ", t;t/titt( i ,,r r

h, Inlelriio clo voto para presidente (possveis respdstas so os nomes dos


ctttttlitlitrtts,almde no sei).''',,,t11 )1' t t'r, "
(
'100
C. l,r't'rh rlc pcso de maratonistas n Corrida de So Silvestre, em quilos. 'tl,\tt, 1'l
90
rl, lrrlr.rrsirlnrlc clt perda de peso
-" de maratonistas na Corrida de So Silvcstre
80 (lt'Ve, tttoclCrilCla, fOrte).
(
' 1t r/ /
l1 't.\ l;rtJ' '
o
3to
L , (lrrrrr rle satis'airo cla populao brasileira com relaro ao trabalho cle seu
60 presirlerrte (vnlores de 0 a 5, com 0 indicando totalmente insatis'eito e 5
50
lrtlttltnettlc satisl'eito). i,,t tt! t (l' r/lr'l I , ,,1,','
,

40 l, {Jrrirrzt pncientcs clc unra lrrica de ortopcdia foram entrevistados qunto ito
nrnrr'r'r rk: r'ttcscs prcvistos cle I'isiotcrapin, se haver (S) ou niro (N) secltlelus
Figura 1.8: Box-plot para a varidvel Peso.
'.qt

20 Captulo I: Introduo Anlise Exploratria de Dados 1.3 O Uso de Computadares em Estatstica 2t

aps o tratamento e o grau de complexidade da cirurgia realizada: alto (A), do que em uma regio industrial (Regio B). Para tanto, uma amostr foi
mdio (M) ou baixo (B). Os dados so apresentados na tabela abaixo: tomada em cada regio, fornecendo a tabela de freqncias a seguir:
Pacientes 2 3 4 5 6 7 8 9 10 ll t2 l3 I4 I Regio B
Fisioterapia 7 8 5 4 5 7 7 6 8 6 5 5 4 5
rN
Peso ni
Seqelas s S .N: ,N) N S s N N' S S S N N)
Cirurgia A M A M M B A M B M ts ts M M A <60 10 (,1,

a. Classifique cada uma das variveis. 60F70 34


b. Para cadavarivel, construa a tabela de freqncia e faa uma representao TOFBO 109
grlica. BOF90 111
c. Para o grupo de pacientes que no ficaram com seqelas, faa um grfico de >90 55
barras para a varivel Fisioterapia. Voc acha que essa varivel se comporta total 319
de modo diferente nesse grupo?
a. Os dados apresentados sugerem que o grau de desnutrio diferente nas
3. Os dados abaixo referem-se ao salrio (em salrios mnimos) de 20
duas regies? (Note que o total de observaes difere em cada regio).
funcionrios administrativos em uma indstria. b. Construa, apartir dos dados das tabelas, um histograma para cada regi0,
10,1 nt
lt 8,5 5,0 412 3,1 ))
- )- 9,0 914 6,1 Faa uma suposio conveniente para as faixas no delimitadas.
tt
Jr9 10,7 1,5 8;2 10,0 4,7 315 6,5 8,9 6,1 c. Com base nos histogramas apresentados em (b), obtenha as medidas
necessrias e construa o box-plot, um para cada regio. Com base nessa
a. Construa uma tabela de freqncia agrupando os dados em intervalos de representao grfica, rediscuta o item (a).
amplitude 2 apartir de l.
r. Construa o histograma e calculo o 1e e o 3e quartil.
1.3 O Uso de Computadores em Estatstica
4. Um grupo de estudantes do ensino mdio foi submetido a um teste de
Foi mencionado anteriormente que o desenvolvimento da indstrirr de
matemtica resultando em:
computadores deu grande impulso ao uso da Estatstica. Vrios progrumes
Nota freqncia computacionais de uso comum contm rotinas estatsticas incorporadas s suas
0F-2 L4 [a ,.r' funes bsicas. o caso das planilhas eletrnicas, usualmente pi-instaladas em
computadores novos. Programas especificamente desenvolvidos para efetuar
2+4 28
anlises estatsticas so conhecidos como pacotes estatsticos. Existe um nmero
4-6 27 considervel desses pacotes, alguns voltados para anlises mais comuns na dretl
6FB 11 de humanidades, outros para a rea de biomdicas; alguns so extremamente
8F10 4 simples de se utilizar atravs de menus, outros pressupem conhecimento de uma
linguagem de programao especfica. Qualquer que seja o programa a ser
a. Construa o histograma. utilizado, trs so as etapas que envolvem seu uso:
b. Se a nota mnima para aprova,o 5, qual ser a porcentagem de 1 Entrada de Dados
aprovao? 2. Execuo da Anlise Estatstica
c. Obtenha o box-plot. 3. Interpretao de Resultados
5. Um estudo pretende verificar se o problema da,desnutrio em adultos medida A Entrada de Dados deve assumir certas convenes. Apesar de certos
pelo peso, em quilos, em uma regio agrcola (denotada por Regio A), maior programas terem rotinas desenvolvidas de forma a simplificar a criao do banco
Captulo 1: Introduo Anlise Explqratria de Dados 1.4 Exerccios 23
22

de dados, intrinsecamente o que se tem a criao de uma matriz, em que cada


linha corresponde a uma unidade experimental e cada coluna a uma varivel. 1".4 Exerccios
Por unidade experimental, entende-se o elemento da populao ou
amostra no qual observaremos as variveis. Por exemplo, na Tabela 1.1, 1. Responda certo ou errado, justificando:
observamos 50 unidades experimentais, os estudantes, nos quais foram a. Suponha duas amostras colhidas de uma mesma populao, sendo uma de
observadas 14 variveis. Assim, os dados podem ser representados por uma tamanho 100 e outra de tamanho 200. Ento, a amostra de tamanho maior
matriz com dimenso 50 por 14. Leitores familiares com planilhas eletrnicas mais representativa da populao. F
no tero problema em visualizar esta situao. Assim, quando estudamos uma b. Duas variveis diferentes podem apresentar histogramas idnticos' I
nica varivel, consideramos a coluna correspondente. Se estamos interessados c. Duas variveis combox-plol iguais no podem ter valores diferentes' Fj
em saber o comportamento desta varivel em dois grupos diferentes (como na 2. Suponha que duas empresas desejam empreg-lo e aps considerar s
Figura 1.9), precisamos estudar os valores da coluna em que ela se encontra, uuntug"n. de cada uma, voc vai escher aqoel que lhe pgar melhor' Aps
conjuntamente com a coluna que contm a informao dos grupos' certa pesquisa, voc consegue a distribuio de salrio das errpresas, dadas
A fase da execuo da anlise estatstica pressupe o conhecimento de segundo os grficos abaixo.
como o programa que est sendo utilizado trabalha as informaes. Torna-se, Empresa B
Empesa A
assim, importante se ter acesso ao manual do programa'
Aps as informaes terem sido trabalhadas, vem a fase da interpretao
dos resultados obtidos. Nesta hora, aconselhvel consultar o manual sempre que
houver dvida, se o que foi calculado relaciona-se, de fato, anlise estatstica
desejada. Ao interpretar as caractersticas observadas, importante verificar se
resultados absurdos no esto ocorrendo. Em caso positivo, releia o manual e
certifique-se de ter executado a anlise correta para os dados em questo. Em
muitos casos, a fase de interpretao a mais difcil e interessante, pois envolve o 5101520253035404550
Slrios Mnimos

equacionamento das caractersticas apresentadas na anlise com vistas a


responder as questes inicialmente colocadas' Com base nas informaes de cada grfico, qual seria sua deciso?
3. Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo
Exerccios da Seo 1.3: indagou sobre os diferentes tipos usados nas suas locomoes dirias. Dentre
nibus, metro e trem, o nmero de diferentes meios de transporte utilizados foi
l. Utilizando alguma planilha eletrnica ou pacote estatstico disponvel e com as oseguinte:2,3,2, 1,2, 1,2, 1,2,3,I,1,1,2,2,3,1,1, 1,I,2, I, 1,2,2, 1,2,
informaes da Tabela 1.1, construa um banco de dados para os 20 indivduos 1,2 e 3.
iniciais e as 4 primeiras colunas. Imprima e confira os valores digitados. a. Organize uma tabela de freqncia.
2. Considerando o banco de dados criado no Exerccio 1 desta seo, construa b. Faa uma representao grfica.
histogramas para as quatro variveis e, baseado no grfico, descreva os seus c. Admitindo que essa amostra represente bem o comportamento do usurio
comportamentos. paulistano, voc acha que a porcentagem dos usurios que utilizam mais de
um tipo de transporte grande?
3. Considerando o banco de dados criado no Exerccio I desta seo, divida a
idade em trs categorias (menores de 18 anos, idade entre 18 e 21 inclusive, e 4. A idade dos 20 ingressantes num certo ano no curso de ps-graduao em
maiores de 2l anos). Construa grficos de barra para essa varivel, incluindo jornalismo de uma universidade foi o seguinte: 22,22,22,22,23,23,24,24,
toclos os indivduos e um para cada sexo. Interprete os resultados obtidos. 24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.
24 Captulo l: Introduo Anlise Exploratria de Dados I -l li rrt t:cios 2.\

a. Apresente os dados em uma tabela de freqncia, incluindo a freqncia rl, l{cpita o item (c) para a varivel Salrio.
relativa. r,. (lonsiderando apenas os funcionrios com mais de trs anos clc clsn,
b. Idades atpicas parecem ter ocorrido nesse ano. Aps sua retirada do tlcscreva o comportamento da varivel Salrio.
conjunto de dados, refaa o item (a). Comente as diferenas encontradas. ll. I lrrr gnrpo de pedagogos estuda a influncia da troca de escolas no descntpcttlto
Um novo medicamento para cicatrizao est sendo testado e um experimento tlt. llrrnos do ensino fundamental. Como parte do levantamento realizndo, lri
feito para estudar o tempo (em dias) de completo fechamento em cortes nrotiulo o rrmero de escolas cursadas pelos alunos participantes do estttclo.
provenientes de cirurgia. Uma amostra em trinta cobaias forneceu os valores: Escolas Cursadas freqncia
15,17,16, 15, \7, 14,17, 16, 16,17,15, 18, 14,17, 15, 14,15,16,17, 18, 18, 1 46
17, 15, 16, 14,18, 18, 16, 15 e 14.
2 57
a. Organize uma tabela de freqncia.
.) 2T
b. Que porcentagem das observaes esto abaixo de 16 dias?
4 15
c. Classifique como rpida as cicatrizaes iguais ou inferiores a 15 dias e
5 4
como lenta as demais. Faa um diagrama circular indicando as
porcentagens para cada classificao. ru. (.)rlrl a porcentagem dos alunos que cursaram mais de uma escola?
6. O Posto de Sade de um certo bairro mantm um arquivo com o nmero de Ir- ('onstrua o grrfico de barras.
crianas nas famlias que se utilizam do Posto. Os dados so os seguintes: 3, 4, c. ('lirssil'i11r.rc os alunos em dois grupos segundo a rotatividade: a/c pnt'u
3, 4, 5, r, 6, 3, 4, 5, 3, 4, 3, 3, 4, 3, 5,5, 5, 5, 6, ll, r0, 2, l, 2, 3, r, 5 e 2. itlulos cclur rnais de 2 escolas e baixa para os demais. Obtenha a titbclit tlc
a. Organize uma tabela de freqncia. lr'r;iincin dcssa varivel.
b. Faa uma representao grfica. rr. Alrrrros tlir Escola cle Educao Fsica foram submetidos a urn lcslc rkr
c. Voc identifica valores nruito discrepantes? Que fazer com eles? rr.sistrrciir rpranto ao nmero de quilmetros que conseguiram corrcr sert
(
Um questionrio foi aplicado aos dez funcionrios do setor de contabilidade de lrrrrirr'. )s clirclos cstiro apresentados a seguir.
rr. (-)rr;rl ir vtriiivcl em estudo?
uma empresa fornecendo os dados apresentados na tabela.
b. ('orrsllrrir o ltistograma.
Funcionrio Curso (completo) Idade Salrio (R$) Anos de Empresa
o
e. ( )lrlt'rrltir o lnx-pktl.
supenor 1100,00 5
2 superior 43 1450,00 8 Faixas freqncia
3 mdio 31 960,00 6 0t-4 438
4 mdio dl 960,00 8
24 600,00
4FB 206
5 mdio
6 mdio 25 600,00 2 8F12 125
1 mdio 27 600,00 5 12 F I6 22
mdio 22 450,00 I
8 2
I6 F 20
9 fundamental 2l 450,00 J

10 fundamental 26 450,00 J I0. lltrrrPo t[r rrtiliziriio rlc citixus clctrnicos clcpcrrclc dc cada usurio c rlits
a. Classifique cada uma das variveis. tl lrrrirr's r'lctrrirtlirs. liorarn colctadas 2(l rncclidas dcssc tcmpo (crn rnirtutos):
b. Faa uma representao grfica para z varirvel Curso.
l,t 1,2 1,7 0,) t.4 lr7 1,0 1,0 0,8
I ,l'r I ,: I .(i I ,l-r
c. Discuta a melhor forma de construir a tabela de I'reqiincia para a vitriiivcl I ,:t l,i l.(' | 1,2 1,2 I,0 0,) l,g 1,7 [,5
,,1 I ,ll I , l-"r

Idade. Construa uma representao grii'ica,


,.J
26 Captulo I: Introduo Andlise Exploratria de Dados I .l l';rtx:cios

a. Organize uma tabela defreqncia sem agrupar os dados. 6,1 612 617 615 6,9 6,3 714 7,6 7r7 7,6
b. Agrupe os dados em faixas de tamanho 0,2 a pattit de 0,8 e obtenha uma /t 7r7 7,6 714 712 7,2 t 716 7r5 7,4
nova tabela de freqncia. 7r5 7,7 8,2 8,3 8,1 8,1 8,1 7,9 7,8 714

c. Compare as tabelas obtidas em (a) e (b). Comente as diferenas' 7r5 716 7,5 716 7,4 r 714 7r5 7,5 714
d. Se ao invs de 26 medidas tivssemos 1000, qual procedimento, dentre
agrupar ou no, voc utilizaria? rr- ( )rgnnize os dados em faixas de tamanho 0,4 a partir de 6.
h. ('orrstrua o histograma.
11. Vinte e uma pacientes de uma clnica mdica tiveram o seu nvel de potssio
no plasma medido. Os resultados foram os seguintes: c. ('irlculc o segundo quartil.

Nvel freqncia l.l. () lrirlcro de gols marcados no ltimo campeonato daFederao Paulistl tle
liutclxrl pelos 20 clubes participantes nos seus 38 jogos uma varivel conl os
2,25 a 2,55 1
:;r'1it r i tttcs velores:
t
2,55 - 2,75 J

2,75 - 2,95 2 Clube 1 2 , 4 5 6 7 8 I 10


at
Gols 42 35 79 57 dt 52 35 25
2,95 F 3,15 4 32 td

3,15 F 3,35 5
Clube 11 72 13 t4 15 16 17 IB 19 20
3,35 F 3,65 6
Gols 55 70 42 4L 6B 66 74 29 47 53
a. Construa o histograma.
b. Determine os 1e, 2e e 3e quartis. ir, ('lirssi'iquc i varivel. Voc acha razovel construir uma tnbclit tle
c. Qual a porcentagem dos valores que esto acima do nvel 3? l'r'ct;iincia de atcordo com a classificao dada?
Ir. ('orrslnrt unra tirbela de freqncia agrupando as observaes em intcrvillos
12. Foram feitas medidas em operrios da construo civil a respeito da taxa de
rlt, t:ornprirnento l0 a partir de 20 (no esquea de indicar clarnclto os
hemoglobina no sangue (em gramas/cm3):
irrlt't'vit los).
11,1 L2,2 LL,7 12,5 13,9 12,3 74,4 13,6 !2,7 12,6 r'. ( )lrtt'rrhir o histogranta.
11,3 II,7 12,6 73,4 L5,2 L3,2 13,0 16,9 15,8 L4,7 rt. (.)rrr lrorccntagent dos clubes mrcaram mais de 38 gols?
13,5 L2,7 L2,3 13,5 15,4 16,3 L5,2 72,3 L3,7 L4,1
l, A t;rlrclir ir soguir apresenta as freqtincias relativzts de ocorrncias de lrixns tle
a. Organize os dados em faixas de tamanho 1 a partir do 1 1. illluut (r.n cnt) para uma imostra de 100 criins de l2 anos de icladc.
b. Construa o histograma. ar, ('orrslt'ttit o histograma.
c. Determine o terceiro quartil e a mediana. lr, ( )lrlcrrhrr <t lxtx-plo.
d. Taxas abaixo de 12 ou acima de 16 so consideradas alteradas e requerem r'. I )r'st'ilrnclo-so sopirral' os l5o/o mis eltos, qual seria o ponto de cortc'/
acompanhamento mdico. Obtenha a tabela de freqncia da varivel
Acompanhamento Mdico com duas opes sim ou no.

L3. O valor mdio de comercializao da saca de milho de 60 cluilos nir Bols:t clc
Cereais apresentado abaixo, em reais, para ltimos 40 meses.
28 Captulo l: Introduo Anlise Exploratria de Dados I 'l l',ttn'cios 29

Faixas freqncia relativa Ganho freqncia


100 F 110 0,10 1,0 F 2,0 45

110 F 120 0,25 2,0 F 3,0 83

120 F 130 0,30 3,0 F 4,0 52

130 F 140 0,25 4,0 F 5,0 15

140 F 160 0,10 5,0 F 6,0 4


6,0 F 7,0 I
1.6. O ndice de germinao um dos principais fatores para definir a qualidade
das sementes, Ele determinado em experimento cientfico conduzido pelo tH. Nrrrrr cstudo sobre rotatividade de mo-de-obra na indstria, anotou-sc o
fabricante e regulamentado pelo rgos fiscalizadores. Um fabricante afirma nunr(rro de empregos nos ltimos 3 anos para operrios especializados e nfro
que o ndice de germinao de suas sementes de milho de 85Vo. Para verificar tspt'r'iir Iizados.
tal afirmao, uma cooperativa de agricultores sorteou 100 amostras com 100 tr, (lonstrua o diagrama de barra correspondente a cada tabela usanclo it
sementes em cada uma e anotou a porcentagem de germinao em cada porc:cntagem no eixo das ordenadas.
amostra. b. ,lrrrrto as inormaes das duas tabelas em uma s e obtenha um diagratnn tle
Ir:rn'irs cla rotatividade de mo de obra na indstria (sem dif'erenciar it
Germinao (Vo) freqncia
r's1 rr'c ilrl iz.itiro).
60F75 B
r'. Voc ircha que os trabalhadores especializados trocam menos cle errtllrcgo'/
75F80 20 ,f rrslil'it1uc.
BOFBS 42 No Especializados izados

85F90 18 Iirnprcgos ,; Empregos TLi

90F95 10
I 106 1 2lo
2 222 2 342
95 F 100 2
3 338 J 109
a. Faa uma representao grfica da tabela acima. 4 292 4 9l
b. Construa o box-plot. lr 164 5 35
c. Comente a afirmao do fabricante. totitl 7I22 total 787

17. Uma nova rao foi fornecida a sunos recm desmamados e deseja-se avaliar 19, ('orrrtl ;lrltc do uurn avaliairo rndica em uma certa universidade, fbi rneclirln
sua eficincia. A rao tradicional dava um ganho de peso ao redor de 3,5 kg n lrr'r1irrciir cirrditca clos alunos do primeiro ano. Os dados so rprcscrttaclos
em um ms. A seguir, apresentamos os dados referentes ao ganho, em quilos, elrt:ir'1',ttirlit.
para essa nova rao, aplicada durante um ms em 200 animais nas condies it. ( )lrtrrrlrir o histograrna.
acima. ll, lirctl(lrrciirs cnrclacls quc cstc.ianr rbaixo de 62 ou ercima de 92 rccluercrn
a. Construa o histograma. irlrrrrrpirnlrirrrrcrrto rnclico, Quirl n porcentigem de alunos rcssits
b. Determine o 1e, 2e e3e quartis. r ltttliotrs'/
c. Voc acha que a nova rao mais eficiente que a tradicional? Justifique. r', llrrur 'cr1lrrcil iur rcclor clc 72 baticlas por nrinuto considerada paclrio,
Vor't' irt'lrir rprc dc nroclo gcral csscs alruros sc cncaixaln ncssc caso'
.to Captulo I: Introduo Anlise Exploratria de Dados I J I t,'ttt'irts 3t

Freqncia Cardaca freqncia Slt' o rbricante vende


cada bateria por 207o acima do preo de custo, em
l(XX) baterias fabricadas, descontadas as que repe, quanto ser seu lucro
60F65 11
pol birtcria em funo do preo de custo?
65F70 35
Durabilidade freqncia relativa
70 t- 75 68
75F80 20 0F3 0,02

80F85 L2 3F6 0,05

85F90 10 6F9 0,15

90F95 1
I -L2 0,25

95 F 100 3
72-15 0,30
15F20 0,23
20. Um exame vestibular para uma faculdade tem 80 questes, sendo 40 de
portugus e 4O de matemtica. Para os 20 melhores classificados, It, lfr.st. jir-sc comparar trs tcnicas cirgicas pata a extrao de dente de siso,
apresentamos o nmero de acertos em cada disciplina, em ordem decrescente ('itrlir trrttir clas tcnicas foi aplicada em 20 pacientes e os resultados sio
do total de pontos. apt r'st'rrtirrlus a seguir.
a. Organize uma tabela de freqncia para cadavarivel.

t
10
b. Faa uma representao grfica das tabelas obtidas em (a).
c. Construa a tabela de freqncia da varivel total de pontos. .qo
!t

F
d. Comente sobre a afirmao: os aprovados so melhores em portugus do
que em matemtica.
'8. I
E
c)
o.
a,
o
aluno 1 2 J 4 5 6 7 8 9 10 d)

Portugus 35 35 34 32 31 30 26 26 24 23 s6
Matemtica 31 29 27 28 28 26 30 28 25 23 &
Es
c)
t--"
aluno 11 t2 t3 T4 15 T6 t7 18 I9 20 4
Portugus 23 L2 11 20 17 T2 L4 20 B 10
t.\
Matemtica 27 z 31 20 27 25 20 13 23 20
Tcnica cirrgica
21. Vinte baterias para automveis de uma certa marca foram testadas quanto
*r, lirrr rrrnr virlrlrcs a1-lloximados pilr er mediana de cada tcnica,
sua vida til. O teste simula autilizao da bateria, acelerando seu desgaste de
rnodo a criar uma rplica da situao real. Os resultados da durabilidade (em
b,ll tttlrtvttltt ittlerqltdrtil. , dcl'inido colno e dil'erena entre o tcrccirc c rr
1rr irtrt'iro rlttiulis, Cllculc scu valor para cerda uma das tcnicers e comentc.
mcses) so apresentados a seguir:
.:. llir('ulit rr vlrrilrllilidlrclc do tcnpo dc rccupcrao ern cada tcnica.
a. Construa o histograma.
ri. ,'jt, r'rrr't-' t'r otirrrisla, clual tcnica cscolhcria'l
b. Se a amostra acima for considerada representativa do desempenho desszr
rirce de bateria, quantas, em 1000 fabricadas, sero repostas pelo 3, tllr*. o corrrPrrlirtlor') Os cllclos a scguir representam indivduos que btlrrr
labricante, se ele o'erece 6 meses de garantia? r {r!rl'urinrr(krs llr,tlo vcrclo clc um ccrto tipo clc inseto e submcticlos ir
Irrllrlrr'nl() (tr's rliI'crcnlos Iipos). As virriiivcis so:
-t2 Captulo l: Introduo Anlise Exploratria de Dados I ,-t l','rrn'r:ios 33

No.: nmero associado aos pacientes; Atrlvs do computador, crie uma planilha com os dados apresentados.

Idade: idade do paciente no momento de admisso' em anos; lirsoando-se nesta planilha: :

Diag: tempo, em horas, gasto entre o contato com o inseto e l. Cltssifique cada uma das variveis.
ll. Construa uma tabela de freqncia (atravs do computador) para a
administrao do tratamento;
virivel Diag. Utilize 5 classes.
Recup: tempo, em horas, entre a administrao do tratamento e
lll. Atravs de representao grfica adequada, compare os trs tratametos
recuperao; corn relao idade dos pacientes. Voc diria que a idade se distribui
Tratam: tipo do tratamento administrado; Itotttogeneamente nos trs tratamentos?
Coag: presena de cogulos no momento de admisso. lv. l{cpita o item (iii) para a varivel Coag.
b, Strltctrrha, que ao invs de trabalhar corn a varivel ldade, cria-se uma novl
Pac.No. Idade Diag Recup Tratam Coag vurirvcl denominada Etrio, assumindo valor 0 se Idade for menor que 29
T9 28 7 3 II nao rlnos c I caso contrrio. Utilizando o computador:
4 15 52 45 I nao l. lixplique como voc poderia criar tal varivel.
27 76 30 23 II slm ll, Construa um box-plot para a varivel Recup, para cada grupo de Etrio,
7 15 53 46 I stm Corn base nos grficos, voc diria que o tempo de recuperao diferente
14 2l 3 2 II nao dependendo da faixa etria? Justifique sua resposta'
5 11 46 42 I nao , tJmn nova varivel denominada Cura criada: Cura ser rpida se Recup
11 16 55 47 I nao frrr rnenor ou igual a 10, ser normal se entre 10 e 40 (inclusive) e ser lentct
54 41 I m pnt'n lccr.rp acima de 40. Verifique, graficamente, se pacientes em cada umit
10 16 S

ilI m clns cntcgorias de Cura apresentam diferenas no que se refere ao tempo


25 47 13 12 S

II nao eltttr! o ccltttitto com o inseto e a administrao do tratamento.


6 18 59 51
l6 40 20 l1 ru slm Elt nttlttit',t:; ilc dutlos mencionados nos exerccios a seguir podem ser obtidas ent
20 24 J 1 II nao lflPlt" llr, rt,y t, b r/- n rt p ro e s t
l3 32 9 J il nao
#, (LIse o corrrputador) Os itens seguintes referem-se aos dados contidos no
15 31 9 -) il nao
f'rluivo clr.: nome cancer.txt. Esse arquivo contm os dados de uma pesquisa
8 10 44 40 I slm fOtrrr: irrcidOncia de cncer e apresentado em 9 colunas representando ns
18 3t 9 J il slm rEu i nlFs vitritvcis de interesse:
T2 3l 10 4 il slm
l: iderrt i l'icao do paciente.
e'eilttntt
24 46 t3 11 m sim
e'ulumr 2i tliitgttstico:
21 21 1 2 il slm
I = nlso-negativo: diagnosticados como no tendo a doena qunnclo
22 39 l7 B il slm nl verclade a tinham,
-) l5 53 46 I slm 2 = ncgativo: diagrrosticados como no tendo a doena quarrdo ele
2 9 42 39 I nao 'ato niro a tinham.
23 75 30 22 III slm - = llositivo: diagnosticados corretamente como tendo er doena.
26 54 l8 l6 III nao 4 = lulso-positivo: diagnosticados como tendo a doena quando na
l7 35 t2 5 I] S m verclircle niro tinham.
9 In -58 50 II s ln ilutu.li irlnrle.
34 Captulo l: Introduo Anlise Exploratria de Dados
1,4 l',ltex'cios 35

coluna 4: espectro qumico da anlise do sangue-alkaliine phosphatose (AKp).


d. Crrlcnle a rea til total para cada apartamento. Armazene esta informao
, coluna 5: concentrao de fosfato no sangue (P).
er uma varivel denominada Total. Repita os itens (b) e (c) para a varivel
c o luna 6 : enzima, lactate dehydro genase (LDH). 'lrtal,
coluna 7: albumina (ALB).
c. Buserndo-se nos itens anteriores, voc diria que existem diferenas nas reas
coluna B: nitrognio na uria (N). rkrs apartamentos dos blocos A e B? Em caso positivo, qual(is) cmodo(s)
coluna 9: glicose (GL). rrplcsenta(m) o problema?
a. Escolha 3 variveis dentre as colunas 2 a 9. classifique-as e faa o f. lrxplore descritivamente os dados referentes a problemas estruturais
histograma e a tabela de freqncia para cada uma delas (se necessrio, crie (rlchaduras e infiltraes). Com a informao contida na varivel Andar
at cinco faixas). clivicla os apartamentos em trs categorias dependendo do andar onde se
b. unia afirmao feita por alguns mdicos a de que o grupo dos falso- cncontra: baixo, mdio e alto. Estude a ocorrncia de rachaduras e
positivos mais jovem do que o dos falso-negativos. para os dados dessa in'i ltraes para cada categoria.
pesquisa, o que voc diria a respeito? Justifique sua resposta baseando-se (tJse o computador) Os itens seguintes referem-se aos dados contidos no
em grficos e tabelas de freqncia.
l,
rquivo de nome aeusp.txt, que contm parte dos dados de uma pesquisa,
25. (Use o computador) Um empreendimento imobilirio consistiu da construo reslizuda pela Associao dos Educadores da USP (AEUSP), sobre aspectos
de dois edifcios residenciais, com apartamentos de I dormitrio e rea til de eio-econmicos e culturais de comunidades de baixa renda da regio do
fi #. Em uma primeira fase, foi construdo apenas um edifcio, denominado utunti, So Paulo. O questionrio foi respondido por um dos moradores dn
"'Bloco 4". Para a concluso do Bloco B houve uma troca de empreiteiras. g sortcada para participar da pesquisa. Os dados esto organizados da
Suspeita-se que seus apartamentos foram construdos com metragem diferente gtlinlc lbrma:
daquela especificada na escritura. O arquivo areas.txt contm as seguintes golund /: Nmero do questionrio (Num).
variveis, obtidas por peritos de uma firma independente: alunu 2: Comunidade (Comun).
Id: identificaoda observao no arquivo alnnu.?: Sexo (Sexo):
Bloco: bloco a que prtence o apartamento L : masculino;
Andar: andar onde o apartamento est situado 2 : feminino.
Final: nmero identificando a posio do apto. no andar Faixas de idade, em anos (Idade):
Sala: reada sala, em m2 1 = 114,25);
Cozinha: rea da cozinha, em m2
2:125,35);
Banheiro:
3:
[35,45);
4:
rea do banheiro, em m2
[45, oo).
Dorm: rea do dormitrio, em m2
Hltl,d 5l Bstado civil (Ecivil),
Rachad: ocorrncia de rachaduras no apto: 0 - no, 1- sim 1 : solteiro;
' Infiltr: ocorncia de infiltraes no apto: 0 - no, I - sim 2 = casado;
a. Explore o arquivo de dados. Qual o nmero total de apartamentos no ll : clivorciado;
empreendimento? Quantos apartamentos existem por prdio? E por andar? 4 vivo;
=
b. Construa tabelas de freqncia para cada uma das variveis quantitativas l'r =
outro.
contnuas e faa grficos adequados, eetlttnu (t: llegiio de procedncia (Reproce).
c. Repita o item (b), para cada bloco, separadamente. construa grficos clo tipo ttunt 7i Tentpo de residncia em So Paulo, em anos (Ternposp),
box-plot e compare as reas para cada cmodo considerado. :olwtil li Nmero de residentes na casa (Resid).
6 Captulo 1: Introduo Anlise Exploratria de Dados

coluna 9: Trabalho (Trab):


:
1 sim;
2: no;
3: aposentado. habilidades
coluna l0: Tipo de trabalho, s para os que trabalham (Ttrab) :

1 : emPregado com carteira;


2 : emPregado sem carteira;
3 : profissional liberal; Introduo
4 : autnomo;
: No captulo anterior, vimos como caracterizar uma massa de dados, com o
5 rural.
coluna I l: Idadeque comeou a trabalhar, em anos (Itrab).
do organizar e resumir informaes. Neste captulo, apresentamos o
coluna 12: Rendafamiliar em faixas de reais (Renda):
nntemiltica que d a base terica para o desenvolvimento de tcnicas
atlens tt $erem apresentadas no restante do livro.
1
-- [0,150); Denominamos fenmeno aleatrio situao ou acontecimento cujos
2:1t50,300);
g : [300,450); no podem ser previstos com certeza. Por exemplo, as condies
clo prximo domingo no podem ser estabelecidas com total acerto, O
4 : [450, 900);
pocle ser dito da taxa de inflao do prximo ms. Veremos que, cm
5 - [900,1500);
como essas, modelos podem ser estabelecidos para quantificar os
6 : [1500, oo).
dus diversas ocorrncias.
coluna 13.' Acesso a computador (Acompu):
: Aprcsentamos, a seguir, alguns conceitos de teoria dos conjuntos, que
1 sim;
ados neste captulo. Chamamos de espao amostral ao conjunto de todos
z: nao.
possveis de um certo fenmeno aleatrio. Ele ser represontedo
coluna t4: Srieem que parou de estudar (Serief).
letfa gregn O (mega). Os subconjuntos de 0 so denominados eventoge
Branco : no parou de estudar;
aclos pelas letras latinas maisculas A,8,. . . . O conjunto vazio, como jl
1a B : sries do ensino fundamental;
lelpnnl, ser denotado por 0.
9 aL2: sries do ensino mdio.
A unio de dois eventos A e B, denotada por AUB, represento tt
a. Explore o conjunto de dados e classifique as variveis. Verifique se existem ia ele, pclo menos, um dos eventos Aou B. Ainterseco do evento
variveis com valores incompatveis ou invlidos e proponha alternativas , denotrrcln por.rl a B, a ocorrncia simultnea de A e B.
para a soluo do problema. Observe que existem variveis com respostas Dois eventos A e B siro disjuntos ou mutuamefie exclusivos quando no
em branco e discuta porque isso acontece. lcmcntos ern coffrur.Isto , Ao B : A.
b. Estude a varivel Renda em funo de Comun. Voc diria que os moradores Dlzemos qr,re e B so complementares se sua unio o espao amostral
da Cohab e do Jardim d'Abril tm a mesma renda? Justifique sua resposta lnteraeclo vuzia. O complementarr de ser representado por " e temos
baseando-se em grficos e tabelas de freqncia. :4.
U ', _: fl e .zt A,,
c, Verifique se o comportamento'da varivel Temposp influenciado pelo tipo Vamos considerar probabilidade como sendo uma funo P(') que
de trabalho (varivel Ttrab). valores nurnricos aos eventos do espao amostral, conforme a defiriio n
d. Faa um box-plot para a varivel ltrab.

37
38 Captulo 2 : Probabilidades ?,1 ltitit,tlttl'tt 39

D efnio 2. 7 : Probabilidade fll:n popullo, definimos a probabilidade dele ter uma certa idade pela
fuqttrre irr rclativa associada respectiva idade. Assim,
uma funo P(.) denominada probabilidade se satisfaz as condies:
P(17) : 0,18; P(18) : 0,44; ...; P(25) : 0,04. tr
?) 0< P(A)< 1,VcQ;
i,i,) P(A) : r; No 1lrximo exemplo, obtemos a probabilidade da unio de eventos.

ii P(UAj) : t P(A, com os 7t disjuntos. 2.2; Considere a Tabela L2 do Captulo 1, contendo informaes a
j:t .i:r r tlirs 'cqiincias da varivel Sexo. Sabendo que 52Vo dos alunos esto na
tr A e 48Vo ni turma B, suponha que escolhemos um estudante ao acaso da
lnno, Quirl seria a probabilidade de escolhermos um estudante do sexo
A
pergunta que poderia surgir seria: como atribuir probabilidades aos r ott itlgurn da turma B?
elementos do espao amostral? H duas maneiras principais de responder essa l)rrs inbrrnaes a respeito da freqncia relativa acima e da Tabela 1.2,
questo.
A primeira
delas consiste na atribuio de probabilidades, baseando-se
em caractersticas tericas da realizao do fenmeno. Por exemplo, ao lanarmos /'(/") : 0,74, P(M) :0,26, P(A) :0,52, P(B): 0,48.
um dado, temos o espao amostral 0: {1,2,3,4,5,6}. Admitindo que o dado
trilidrrdc que precisamos determinar pode ser representada por P(F U B),
foi construdo de forma homognea e com medidas rigorosamente simtricas, no
guLl se sirnplesmente somarmos P(.F') com P(B), obtemos uma somn
temos nenhuma razo para privilegiar essa ou aquela face. Assim, consideramos
P(1) : P(2) :. '. : P(6) :716. Flor l I ,
E,videntemente isso no pode acontecer, pois o valor clu
llidnde poclc ser, no mximo, igual a 1. No difcil perceber que estamos
Uma outra maneira de obter probabilidades atravs das freqncias de
n trlg,rrns elcmentos duas vezes, pois ao considerarmos apenas estudantcs
ocorrncias. Observando as diversas repeties do fenmeno em que ocorre a
tXo l'errrinino, temos estudantes da turma A bem como da turma B e ao
varivel de interesse, podemos anotar o nmero de ocorrncias de cada valor
los upotes i turn'a B, temos estudantes do sexo feminino e masculino,
dessa varivel. Para um nmero grande de realizaes, a freqncia relativa
on r:sluclnntcs do sexo feminino e da turma B, isto , o evento F O B, estd
poderia ser usada como probabilidade. For exemplo, desejando estabelecer as
Ito rlvcnlo ,;' c tambm no evento B.Logo, precisamos subtrair umi vez
probabilidades de cada face de um dado sem fazer nenhuma suposio inicial
n IJ) ;turn obter a probabilidade correta. Desta forma, temos qllc il
sobre sua construo, usamos a experincia de sucessivas ocorrncias. O ponto
ilitlrrtle rlit unio FU B igual somadas probabilidades de ,F' e B menos
delicado decidir quanta experincia necessria para se fazer a atribuio de
lirlnrlc rlu interscco f' O B. tr
probabilidades, com alguma garantia de no se estar muito distante do verdadeiro
valor. Questes dessa natureza no sero discutidas aqui e fazem parte doS A plohnbilidaclc da unio de eventos calculada atravs da regru dct
captulos de inferncia estatstica. Por ora, vamos assumir que, medida que O tltt ltnilnhilitlutlcs apresentada ni Figura 2.1. No faremos unlu
nmero de repeties vai aumentando, as freqncias relativas se estabilizam em lf rio lrrrnul, pois ncreditamos que o resultado bastante sirnples c
um nmero que chamaremos de probabilidade. Em cincias biolgicas e humanas, itivo,
essa a forma mais comum de atribuir probabilidades.
De modo geral, diremos que estamos fazendo um sorteio aleatrio ou ao
acaso em uma populao, se a escolha desse ou daquele elemento s depende da
probabilidade a ele atribuda, seja atravs da freqncia relativa ou de algumit
suposio terica.
Exemplo 2.1: Para a varivel ldade, ver Tabela 1.3 clo Captulo l, o cspito ltignra 2.1: Ilegru de adio dc probahiliclaclcs.
amostral ser f) : {17,18, .. . ,25}. Supondo que um aluno escolhiclo ao icoso
Captulo 2 : Probabilidades 2.2 P robab ilidade Condic ional e Indep endnca 4T
40

2. Sendo A e B dois eventos em um mesmo espao amostral, "tadrtza" pafa A

Observe quo, se A e B forem disjuntos, a expresso acima se reduz linguagem da Teoria dos Conjuntos, as seguintes situaes:'
sorna das probabilicdades dos eventos A e B, pois a interseco vazia e a a. Pelo menos um dos eventos ocorre.
correspondente probabilidade nula. A regra de adio de probabilidades pode b. O evento ocorre mas B no.
ainda ser expandidan para mais de dois eventos. Jente, por exemplo' escrever a c. Nenhum deles ocorre.
expresso para P('$UBUC) considerando D: Bl)C e aplicando a regra de cl. Exatamente um dos eventos ocorre.
adiro de probabilid,lades duas vezes. 3. Uma universidade tem l0 mil alunos dos quais 4 mil so considerados
Comq conseqncia da regra da adio, obtemos que, para qualquer csportistas. Temos, ainda, que 500 alunos so do curso de biologia diurno, 700
evcnto A c {1, cla biologia noturno, 100 so esportistas e da biologia diurno e 200 so
P(A):I-P(A'), csportistas e da biologia noturno. Um aluno escolhido, ao acaso, e pergunta-
sc a probabilidade de:
que pode ser verificada aplicando a regra da adio com Ac no lugar de B. a. Ser esportista.
Tctnos, b. Ser esportista e aluno da biologia noturno.,-:l
tr(Art A') : P(A) + P(A") - P(A A") c. No ser da biologia.
: p(A) + P(A') - P(A) d. Ser esportista ou aluno da biologia.
: p(A) + P(") c. No ser esportista, nem aluno da biologia. ,---
- 0. (,,,-/
:9,2,
4. Sejam A e B dois eventos em um dado espao amostral, tais que P(A)
Como P(Au A) : P(Cl) : 1, segue imediatamente a igualdade desejada' P(B) : p, P(AU B) : 0,5 e P(A n B) : 0,1. Determine o valor de p.
5. l)ois processadores tipos A e B so colocados em teste por 50 mil horas. A
Ilxerccios da Seco 2.L: probabilidade de que um erro de clculo acontea em um processador do tipo
1. Para cada um dors casos abaixo, escreva o espao amostral correspondente e A de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que:
conte seus elementos' ri. Pelo menos um dos processadores tenha apre.sentado
b. Nenhum processador tenha apresentado erro?
"rrorc---.-u---
\
a. Uma moeda anada duas veze,s, e observam-se as faces obtidas'
b. Um dado lranado duas vezes e a ocorrncia de face par ou mpar c. Apenas o processador A tenha apresentado erro?
observada.
c. Uma urna contm 10 bolas azuis e 10 vermelhas com dimenses
rigorosamento iguais. Trs bolas so selecionadas ao acaso com reposio e 2.2 P r obabilidade Condicional e Independncia
as cores so arnotadas. Em muitas situaes prticas, o fenmeno .aleatrio com o qual
L Dois dados sio lanados simultaneamente e estamos interessados
na soma Irrrbalhamos pode ser separado em etapas. A informao do que ocorreu em uma
'- clas faces observadas. rletr-:rrninada etapa pode influenciar nas probabilidades de ocorrncias das etapas
g( Em uma cid;ade, famlias com 3 crianas so selecionadas ao acaso, srrccssivas.
' anotando-se o sexo de cada uma. Nestes casos, dizemos que ganhamos informao e podemos "recalcular"
. f.'Urna mquina produz 20
peas por hora, escolhe-se um instante qualquer e
rrs probabilidades de interesse. EsSas probabilidades "recalculadas" recebem o
observa-se o nmero de defeituosas na prxima hora. Irrrrrrc cle probabilidade condicional; cuja definio apresentamos a seguir.
g. Uma moeda lanada consecutivamnte at o aparecimento da primeira
' cafi.
42 Captulo 2 : Probabilidades ?. J l' t r il x t It i I i datle Condicional e Independncia 43

Defino 2.2 : Probabilidade c ondicional Ples srrposies iniciais, 1/ ) B : H e ento, P(H n B) : P(H): 0,02.
Dados dois eventos A e B, a probabilidade condicional de dado que Ettln,t,
ocorreu .B representada por P(A I B) e dada por
P(!,1,8). PB)
P(Htrl:r#?: ffi:0,025
'|P(Al
\ B\ '
: P(B) \ /' > 0.
ftgur rr, n scguir, apresenta o efeito da informao l no espao amostral'
Caso P(B) : g, P(Al B) pode ser definido arbitrariamente; neste texto
usaremos P(Al B): P(A). tr
Exemplo2.3.' Considere a seguinte situao hipottica. Uma grande regio de 100
km2 contm um aqfero (reservatrio de gua) subterrneo com rea igual a 2 O = Regio (100 km2)
km2, cuja localizao _ desconhecida (ver figura a seguir). A fim de determinar a
posio do aqfero, perfuraes so feitas ao acaso. Vamos representar por If o
evento de encontrar gua. Temos P(H): 0,02, obtido pelo quociente da rea do
aqfero pela rea total, onde usamos que o espao amostral f) : {regio de 100
k*t.

C)'= Nova Regio (80 km2)

2 = Regio (100 km2)

@ e:ptr,, rrtttostral perdeu 20 kmz , que a rea descartada para novos furos, tr
l)rr tlc'iniiro de probabilidade condicional, deduzimos a regra do produto

Suponha agora que, aps uma ano de pesquisas, uma rea de cerca de 20
fr Stnilultililrulcs, uma relao bastante til que apresentadanaFigura2'2,
km2j foi amplamente perfurada sem encontrar gua e pode ser descartada para
novos furos. Representamos essa informao por 1. Qual seria, agora, a,

probabilidade de um furo, feito ao acaso, atingir o aqfero? Vamos representar


por P(H I 1) u probabilidade desejada. Com a mesma argumentao utilizada
acima, a nova regio de procura terrea B0 km2 e portanto P(H I I):0,025,
Isto , como espervamos, a probabilidade de obter gua aumentou devido i Itigura 2.2: Regra do produto de probabilidades.
informao recebida. Vamos refazer esse clculo utilizando agora a frmula de
probabilidade condicional. Para tal, seja B a nova regio de procurir I lrrr corrceito nruito inrportante em probabilidade o da irulependnciu cle

correspondendo a rea total inicial menos a parte que foi descartada para novas etrrl.t,\', rllrL1 rict'ii utiliznclo rcpeticlitntcntc ao lottgo de toclo o texto'
tentirtivits. Temos que P(B) : 0,8. O evento H a B representa a ocorrncin dc,
scrn ncnhuma informao etuxiliar, ncontrarmos gua num 'uro f'eito na regiiro .R.
44 Captulo 2 : Probabilidades
P rt tl t il ti I i r k u I c Co ndic ional e Indep end nc ia 45

Deftnio 2.3: Independncia de eventos


Dois eventos A e B so independentes, se a informao da ocorrncia ou
no de Bno altera a probabilidade da ocorrncia de ,4. Isto ,

P(Al B): P(A), P(B) > o, ol


0.9 5

ou ainda a seguinte forma equivalente:


o.;
P(A . B) : P(A) P(B). tr
o2
No difcil verificar que se A , independente de B, ento B
0,0 5
independente de A. O uso da expresso acima permite, ainda, verificar que o
evento vazio independente de qualquer evento. As demonstraes so deixadas
oi
a cargo do leitor.
E muito comum, primeira vista, confundir eventos independentes e o;
eyentos disjuntos. O prximo exemplo ajuda a esclarecer essa questo.
Figura 23: rvore de probabilidades.
Exemplo 2.4: lJnaempresa produz peas em duas mquinas 1e f f , quepodem
apresentar desajustes com probabilidade 0,05 e 0,10; respectivamente. No incio A tabeln u seguir resume as ocorrncias e suas respectivas probabilidades,
do dia de operao um teste realizado e, caso a mquina esteja fora de ajuste, ela
ficar sem operar nesse dia passando por reviso tcnica. Para cumprir o nvel Eventos Probabilidade
mnimo de produo pelo menos uma.das mquinas deve operar. Voc diria que a oro, 0,95x0,90:0,855
empresa corre o risco de no cumprir com suas metas de produo? OrO' 0,95x0,1,0:0,095
Seja O; o evento da mquina i estar operando, ,i : 7,2. Pelas informaes ol'o, 0,05x0,90:0,045
disponveis temos P(Ot): 0,95 e P(O2): 0,90.
o'o;' 0,05x0,10:0,005
Na Figura 2.3, apresentamos um diagrama conhecido como rvore de
probabilidades, qu'e consiste em representar os eventos e as probabilidades
Parn otrter o nvel mnimo de produo di'ria, precisamos ter pelo menos
condicionais associadas s realizaes. Cada um dos caminhos da rvore indica
uma possvel ocorrncia.
nilleluinn opcrando. Isto corresponde ocorrncia do evento
U (, t( )i' t J Oj'0r.Ternos,
No preenchimento dos valores de probabilidades na rvore, observe que
assumimos a independncia entre 01 e 02, pois acreditamos que a eventual falta t1(()(),,Q OLOI u O'O2) : P(OQz) + P(OLO;') + P(O'O),
de ajuste em uma mquina no interfere no comportamento da outra. Note que, no
caso de independncia, o segundo ramo da rvore no afetado pela ocorrncia r ll'e renlizflcs so disjuntas. Por exemplo, no possvel as duns
dos eventos que aparecem no primeiro ramo. Portanto, pela definio de lncs estnrenr operunclo (evento Op)
e ao mesmo tempo s a mquinn .I
independncia, segue que P(O2l Ot) : P(Or): 0,90. (evento O()').Dessn brma, conclumos que a probabilidade d manter o
Para facilitar a notao, vamos escrever O1O2 para o evento OtOz. trfninro dc procluiio 0,995, Portanto, a empresa tem alta probabilidade de
sua probabilidade da ocorrncia dada pelo produto dos ramos que levam nesse r1n Huns rnetus cle produo. tr
evento. Isto correspondendo aplicao da regra do produto de probabilidades: No exernplo anterior, os eventos representados pelas interseces
P(Ap2) P(Oz I 01) P(Ol).
g,f,l1(J,j', ()i02 c Oi'Oi'lonnnrn novos cventos que tm a propriedacle de
=
ltlulrlnnrente exclusivos e cuja uniflo contenrplt toclas as possveis
46 Captulo 2 : Probabilidades F tt il t t I t iI il h ul c Co ndicional e Independncia 47

combinaes. Eventos que satisfaam essas duas caractersticas tm importante


papel no clculo de probabilidades e, assim, merecem destaque.

Definio 2.4: Part.o do espao amostrsl


Os eventos Cr,Cz,... ,Ct, formam uma partio do espao amostral, se
eles no tm interseco entre si e se sua unio igual ao espao amostral. Isto ,
1,

Ca)Ci:Q Para i'+i e U Ci:9.


.i:t tr

A Figura 2.4 apresenta um exemplo de uma partio com 6 eventos. A= (A nFr) u (A.F) u (nq)
uittcln,estar interessados em saber qual a probabilidade de que a amostra
tenlrir siclo obtida do leite fornecido pela fazenda F1, isto ,, P(4lA),
lmpllen er se inverter a probabilidade condicional conheciOa P(lF'1).
conro cssa so tpicas para o uso do resultado apresentado a seguir, tr
dc llnycs: Suponha que os eventos Ct,Cz, ... ,Cn formem uma
l e que suas probabilidades
le sejam conhecidas. Suponha, ainda, que
EFl evr:ttlo A, se conheam as probabilidades P(AlCt) para todo
11 3, ,, . , ft, linto, para qualquer j,
Figura 2.4: Partio do espao amostral (k=6).
P(A I c P(c j)
I'(C,il A) :
Exemplo 2.5.' Suponha que um fabricante de sorvetes recebe 20Vo de todo o leite
que utiliza de uma fazenda F1, 307o de ura outra fazenda F2 e 50Vo de -F's. Um D p(A I cr) p(cr)
i:l
rgo de fiscalizao inspecionou as fazendas de surpresa e observou que20Vo do
leite produzido por .F'1 estava adulterado por adio de gua, enquanto que para ro: t)r clcl'inio de probabilidade condicional temos
F2 e Fs, essa proporo era de 57o e 2Vo, respectivamente. Na indstria de P(C1n A)
sorvetes os gales de leite so armazenados em um refrigerador sem identificao P(ci I A) :
das fazendas. Para um galo escolhido ao acaso, vamos analisar o leite para
P($
decidir sobre sua adulterao ou no. Etettdor dcssl expresso pode ser reescrito 'pela regra do produto,
Se denotarmos por o evento "o leite est adulterado", temos que lgnedo r f,'i, isto ,

P(Al.p'r) : 0,20, P(Al Fz):0,05 e P(Al rs):0,02. Alm disso, .F'1, F'2 e P(A;1n A) : P(AC : P(Al C,:j)P(C.j).
,F3 formam uma partio do espao amostral pois uma dada amostra de leite vem,
necessariamente, de uma e apenas uma das trs fazendas. Desta forma, o evento EEttlFletnr u clentonstrairo note qu
pode ser escrito em termos de interseces de com os eventos F1, F2 e F3, l;
r,,(A) :Dnra.ci) :Do(1l
:

conforme ilustra a figura a seguir. c,) P(c). tr


i=l i=L

I
? ( t,' u \") -- T ((trn.r1') - lC-0" v-w d"t- J'lv'ng.r.,rzn i, ( a) b'\ - P ( ('*t'r',-,ll' )

48
'" ^\ Captulo 2: P
rr(,. s') . p[n'', -? (al@) 49

l
l/
Exemplo 2.6: Yoltando situao do fabricante de sorvetes (exemplo anterior), I
rt tt'irttrito: se dois eventos so mutuamente exclusivos ento eles'
podemos agora calcular facilmente a probabilidade desejada, isto ,
lnrlelrcttclcntes.
P(.il)
P(FrlA):--i(A)-A) Pgulo llutebol Clube ganha com probabilidade 0,7 se chove
eve, l'inr Sctcrnbro a probabilidade de chuva de 0,3.
;e com 0,8 se
O So Paulo
P(A I F'l)P(rl) ull1n l)nrticln em Setembro, qual a probabilidade de ter chovido nesse
,

que sc AeB so independentes ento A e B" tambm io


les.
e, ento

P(Frlrl: :0,615.
reelos
Portanto, a probabilidade de que a amostra de leite em questo tenha si fuedn vicitclu de modo que a probabilidade de sair cara 4 vezes maior
produzida pela fazenda F1, de 0,615 em contraste com as probabilidades 0,231 I de urir coloi. Para 2 lanamentos independentes dessa moeda,
0,154 para as fazendas F2e F3, respectivamente.
p@btthiliduclc de sair somente uma cara.
Exerccios da Seo 2.22
pbchiliclnde dc sair pelo menos uma cara.
L. Considere dois eventos A e B, mrtumente exclusivos, com P() :0,3 ffebntrllidurle de dois resultados iguais.
P(B) :0,5. Calcule: urrr conjunto de 4 nmeros dos quais nenhum deles zero, dois so
a. P(An B). c dois sio negativos. Sorteamos ao acaso, com reposio, 2 nmeros
b.P(Au B). /-t / enjunto, l)eterrnine a probabilidade de:
c.P(Al B). (-" deler r,rer negntivo.
d. P(A.). qune ietrle set negativo.
e. P((A u B)").
dclr nrrrerc)s terem o mesmo sinal.
2. Se P(AU B) : 0,8;P() : 0,5 e P(B) : r, determine o valor de rno caso He sf,o vrlliclas ats afirmaes:
de: ) - lllaf'@ l) :3/5ento AeB nopodemserdisjtrntos'
a. Ae -B serem mutuamente exclusivos.,
& nt) -- 12,l'(Dl A):rI : e P(A lB) Lf2 ento An'/ao pode estar
b. e B serem independentes. U' f,tldn ettt /J.
3. Uma escola do ensino mdio do interior de So Paulo tem 40Va de estudanteg lrce dr, estustica tcve a seguinte distribuio das notas finais: 4 do sexg
do sexo masculino. Entre estes, 207a n]unca viram o mar, ao passo q\e, entre A lnu c fi clo 'crnirrino bram reprovados, 8 do sexo masculino e 14 do
meninas, essa porcentagem de 50Vo. Qual a probabilidade de que um aluno lno frtrurn ttprovndos, Para um atluno sorteado dessa classe, denote por M
selecionado ao acaso seja: lutto eseollrirlo br do scxo masculino e por se o aluno foi aprovado.
a. Do sexo masculino e nunca tenha visto o mar?
'/
b. Do sexo feminino ou nunca tenha visto o mar? F1d t=t ltl";,
a.SeP(f) :0,4;P(A) =0,7e P(A nr) = 0,3;calculc P(AI D"), F(' rr ilI"),
F(d | /1/).
50 Captulo 2 : P robabilidades ft'r't{'i,,f
5t

d.P(M'I A). F ttttr l)uirrg existem trs empresas de TV a cabo e 20 mil residncias. A
e,P(M I A). 'l'A lcrn 2100 assinantes, a TB tem 1850 e a empresa TC tem 2600
:in1ttl,,s, scttclo que algumas residncias em condomnios subscrevem aos
?eas produzidas por uma mquina so classificadas como defeituosas, lr'u tlc: urais de uma empfesa. Assim, temos 420 residncias que sito
,"c,rpe.veis ou perfeitas com probabilidade de 0, 1 ; 0,2 e 0,7 ; respectivamente. Irlr:s tlo TA e TB, 120 de TA e TC, 180 de TB e TC e 30 que sito
De um grande lote, foram sorteadas duas peas com reposio. Calcule: rrtrs tlns trs empresas. Se uma residncia desse bairro sorteada ao
a. P(duas serem defeituosas)
ruu, quttl l probabilidade de:
b. P(pelo menos uma ser Perfeita).
Fr nssirrlrrtc somente da empresa TA?
c. P(uma ser recupervel e uma perfeita).
E se o A$lttnr 1rclo tncnos uma delas?
,,@)t"Oiqu. as suposies utilizadas para resolver os itens anteriores. !Ee t.'r''l'V n cabo?
vsorteio for sem rePosio?
I gttrrrit'ios guardam as bolas de voleibol e basqete. O armrio 1 tem 3
6.Paradois evento s A e B,num mesmo espao amostral, verifique, atravs ile um de vrrleibol eI de basquete, enquanto o armrio 2 tem 3 bolas de
diagrama, que sempre possvel escrever o evento A como sendO I r' ? clc basquete. Escolhendo-se, ao acaso, um armrio e, em seguida'
e"o A1U ( n B") e que, portanto, vale P()
: P(An B) + P(A B")'
tle runs bolus, citlcule a probabilidade dela ser:
7. Numa cidade do interior de So Paulo, estima-se que cerca de 20Va doS p vok ibol, sitbcndo-se que o armrio 1 foi escolhido' -
habitantes tm algum tipo de alergia. Sabe-se qne 50Vo dos alrgicos praticam burq,,.,*, sitbcnclo-se que o armrio 2 foi escolhido.0
esporte, enquanto que essa porcentagem entre os no alrgicos de 407o'PatA fu buE,lrrcte,
um indivduo aleatoriamente nessa cidade, obtenha a probabilidade
"r"olhido Fgclctrtcs clc uma Clnica de Ginecologia com idade acima de 40 anos,
de: trr rrrr lrtrn casadas e 407o so solteiras. Sendo solteira, a probabilidnde
a. No praticar esporte. ' ',
f tlrlo urn rlistrbio hormonal no ltimo ano de I07o , enquanto que poftl
b. Ser alrgico dado que no pratica esportes.
ftnrn I r e sstt probnb i I idade aumenta para 30Va' Pergunta-se :
8. As preferncias de homens e mulheres por cada gnero de filme alugado em QU*rl tr prtoltnbiliclade de uma paciente escolhida ao acaso ter tido um
uma locadora de vdeos, esto apresentadas na prxima tabela' dlrlr'trirt ltortttottal ?
Romance Policial e A pncierrte sortcada tiver distrbio hormonal, qual a probabilidade de ser
Sexo \ Filme Comdia
:sltit'u'/
92 248
excullr!'rnus cluits pacientes ao acaso e com reposio, qual
Homens 136 a
Mulheres r02 195 62
pfolruhilirlittlc clc pclo lrenos uma ter o distrbio?
Sorteando-se, ao acaso, uma dessas locaes de vdeo, pergunta-Se A
Yt* elttr,'g.tt il s!:tl amigo uma cart, destinada sua namorada, parat sgt
probabilidade de: :4111 tro crtrrcio. Entrcttnto, ele pode se esquecer com probabilidade 0,1 .
a. Uma mulher ter alugado um filme policial? llu Er. i,sr.lltec:cl', l probltrilidacle de que o correio extravie a carta de 0'1,
b. O filme alugado ser uma comdia? lSetttr:, st: liri cnviacla pclo correio a probabilidade de que a namorada nlio
c. Um homem ter alugado ou o filme ser um romance? * tscehrr rt tL: 0, I .
d. O filme ser policial dado que foi alugado por um homem? 1 Efu trrrrturt'urlit ttio rcccbctt o carta, qual a probabilidade de seu amigo tel
prquecirto tlc crtloct-la no corrcio'l
,f,Ooit dados equilibrados so lanados' Calcule a probabilidade de:
a. Obter o par (3,4), sabendo-se que ocorreu face mpar no prirneiro dado. br Avrrltr, rrs llossillilidnclcs clcsse rlanoro cotttinuar, se a comunicaiio
,,'i'
' ll. Ocorrcr face mpar no segundo ditdo, sabenclo-se quc ocorrcu acc par tepett,l,,r rltts ctrtits ottviitdas.
nO

pritttciro dado.
52 Captulo 2 : Probabilidade 53
ttr t,',,,.r

14. Numa certa regio, a probabilidade de chuva em um dia qualquer de Flnr'rtttlt'ttt' gua em at duas tentativas.
primavera de 0,1. Um meteorologista da TV acerta suas previses em 807o Eneottlt'rtr iigtta.
dos dias em que chove e em907o dos dias em que no chove.
a. Qual a probabilidade do meteorologista acertar sua previso? UFt ttrrurlico closconfia que um paciente tem tumor no abdmen, pois isto
b. Se houve acerto na previso feita, qual a probabilidade de ter sido um dia de nn 70(k' clos casos similares que tratou. Se o paciente de fato tivcr o
chuva? , u rxnno rrltra-som o detectar com probabilidade 0,9. Entretanto, se ele
tlvr.r o lurror, o exame pode, erroneamente, indicar que tem com
15. A tabela a seguir apresenta informaes de alunos de uma universidade lirlirrle 0,1. Se o exame detectou um tumor, qual a probabilidade clo
quanto s variveis: Perodo, Sexo e Opinio sobre a Reforma Agr'ria, lcnte t lo tlu lto?
Determine a probabilidade de escolhermos:
t*helu dos 1000 ingressantes de uma universidade,
rt segttir itpresenta dados
a. Uma pessoa do sexo masculino e sem opinio sobre a reforma agrria?
lnfolrrrrrt'ics sobre rea de estudo e classe scio econmica.
b. Uma mulher contrria a reforma agr6,ria?
c. Dentre os estudantes do noturno, um que seja a favor da reforma agrria? Area \ Classe Alta Mdia Baixa
d. Uma pessoa sem opinio, sabendo-se que ela do sexo feminino? Exatas L20 156 68
Perodo Sexo Reforma Agrria Humanas 72 B5 LL2
Biolgicas 169 I45 -q
L)

Contra A Favor Sem opinio


Diurno Feminino 2 8 2 BFI ttltttur ittplt'cssiutte escolhido ao acaso, determine a probabilidade dc:

Masculino 8 9 8
&r du clussc ccontrrica mais alta.
&tg,l,tt'ttu rit'cit clc exatas.
Noturno Feminino 4 8 2
&tu,lgr t,,, 1il'r:i dc humanas, sendo de classe mdia.
Masculino T2 10 I gf du r'lrsstr bitixit, clado que estuda na rea de biolgicas.

16. Trs candidatos disputam as eleies para o Governo do Estado. O candidato it probabilidade de gostar de teatro , Il3, enquinto
t'r:r'lrr poprrlitiro,
do partido de direita tem30Vo da preferncia eleitoral, o de centro tem307o e o tlc gostlr rlc cinerna 112. Determine a probabilidade de gostar de tcatro
da esquerda 40Vo. Em sendo eleito, a probabilidade de dar, efetivamente, :lc citrt'rttir, rtos scguintes casos:
prioridade para Educao e Sade de 0,4; 0,6 e 0,9 para os candidatos de grlnl'rlt, lerrtnr o gostilr cle cinema so eventos disjuntos.
direita, centro e esquerda, respectivamente. lnrttu'rh' lntltrr o gostar de cinema so eventos independentes.
a. Qual a probabilidade de no ser dada prioridade a essas reas no prximo Fgd,,r rlllr' loslnr clc teatro gostm de cinema.
governo? A Frrihirlrilirlrtrlo clc gostitr de teittro e de cinema Ll8.
b. Se a rea teve prioridade, qual a probabilidade do candidato de direita ter t flenlre os (lue nio gostam de cinema, a probabilidade de nro gostar de tcitlro
,.
,.,,.
ganho a eleio? ;l/.1,

lf:.Uma companhia que fura poos artesianos trabalha numa regio escolhendo, I Tr hilrrir'ns lrrnccctn ecluipamcntos de preciso para o laboratrio tle
"leatoriamente, o ponto de furo. No encontrando gua nessa tentativa, sorteio lpflnlr.rt rlr' untit ttttivct'siditcle, Apesar cle serem aparelhos de preciso, cxiste
outro local e, caso tambm no tenha sucesso, faz uma terceira e ltirnn EFa prlut'nl clrirrrco clo subcstirniro ou superestimao clas rnecliclns
tentativa. Admita probabilidade 0,7 de encontrar gua em qualquer ponto dcssn *lttit,lrrq A tlbcln it scgttit' aprcscnta o collportamcnto do equiparncnto
regiro. Calcule a probabilidade de: Fdttrl,l,, t'!!t t'iltlll I'iillricl:
a. Encontrar rguir na seguncla tcntativa.
54 Captulo 2: Probabi E.ttt't'it'irts 55

Fbrica I Subestima Exata Superestima Uporrhl que X represente o nmero de horas de atividade fsica por semana.
Probabilidade 0,01 0,98 0,01 cnriirlcrc a tabela a seguir:

Fbrica II Subestima Exata Superestima Sexo \ Atividade 0<x<3 3<X<5 x>5


Probabilidade 0,005 0,98 0,015 Feminino 22 B 7
t 4 6
Masculino d
Fbrica III Subestima Exata Superestima
Probabilidade 0,00 0,99 0,01 r Qull a probabilidade de sortear aleatoriamente uma menina com atividade
fsicit scrnanal na faixa de [3, 5) horas?
As fbricas I, II e III fornecem, respectivamente, 20Vo, 30Vo e 50Vo dos r enlculc P(X > 5).
aparelhos utilizados. Escolhemos, ao acaso, um desses aparelhos e Cr *rlcrrlc a probabilidade de que um rapaz escolhido aleatoriamente dedique
perguntamos a probabilidade de: pelo rncnos 5 horas atividade fsica. Idem para uma moa.
a. Haver superestimao de medidas? , utttltitt'c is respostas dadas nos itens (b) e (c)'
b. No haver subestimao das medidas efetuadas?
c. Dando medidas exatas, ter sido fabricado em III? A ptrrtlrtrilidade de encontrar gs numa certa regio , llrc. Trs sondas
i!'ns estito perfurando de modo independente.
d. Ter sido produzido por I, dado que no subestima as medidas?
gbertrlo-se que uma delas (qualquer) no achou gs, qual a probabilidade
22. Acredita-se que numa certa populao, 207o de seus habitantes sofrem dHg ottlt'its duets encontrarem?
algum tipo de alergia e so classificados como alrgicos para fins de sade $bcttrltt-so que uma delas (qualquer) no achou gs, qual a probabilidade
pblica. Sendo alrgico, a probabilidade de ter reao a um certo antibitico d etteorttrar gs na regio atravs dessas perfuraes?
de 0,5. Para os no alrgicos essa probabilidade de apenas 0,05. Uma pessoa tllrc:nrkr-sc que no mais de uma delas (qualquer) achou gs, qual a
dessa populao teve reao ao ingerir o antibitico, qual a probabilidade de: prohrrbiliducle de nenhuma encontrar gs?
a. Ser do grupo no alrgico?
b. Ser do grupo alrgico? ! I A, ll c C pertencentes a um mesmo espao amostral. Mostre que:
AltJ) :1-P(AlB).
23. Estatsticas dos ltimos anos do departamento estadual de estradas so F(a U B I c) : P(Al c) + P(B lc)-P(A)Blc).
apresentadas na tabela a seguir, contendo o nmero de acidentes incluindo te Jt /'' cntito P(Au B I C) : 1.
vtimas fatais e as condies do principal motorista envolvido, sbrio ou F(,4 t t 11U C) : P(A) + P(B) + P(c) - P(A. B) - P(A. c)
= t'(/t l) + P(An B nC).
alcoolizado.
Motorista \ Vtimas fatais No Sim vilja ao litoral para passar um fim de semana. A probabilidade
jlntr fnrrrlil
Sbrio L22B 275
ft euttgr.slirtttittnento net estrada de 0,6. Havendo congestionamento, a
Sbttlrilirlrrrkr clos seus dois filhos brigarem no carro de 0,8 e,
Alcoolizado 2393 762 sem
$ngesti.rrrnnrenlo, a brga pode aparecer com probabilidade 0,4. Quando h
Voc diria que o fato do motorista estar ou no alcoolizado interfere na
or.l scln congestionamento, probabilidade do pai perder a
ocorrncia de vtimas fatais? bitl, ,,.,",
piIe in r'(n os 'ilhos de 0,7. E claro que havendo congestionamento o pai
24. Sejam A e B dois eventos de f), tal que P(B) ) 0. Mostre que: pde per,l,.r'tt pitcinciil com os filhos mesmo sem brigas, o que aconteceria
a. Se P( I B) : P() ento P(A18) : P(A)P(B)' Ft ptohlhilirlndo 0,5. Quando niro hr nem congestionamento, nem briga, o
b. Se P( n B) : P(A)P(B) entito e D siro independcntes' pi eltrtgr. trnrtqiiilo c nto 1:crdc a pucincia, Determine a probabilidade de:
* Nnrr kt'ltitvirkl congestiottittrtcnto se o pai no percleu a pacincia com seus
flllrrtF
56 Captulo 2: Probabi

b. Ter havido briga, dado que perdeu a pacincia. ultt.


29.Um candidato a motorista treina na auto-escola e acredita que passa no exame
com probabilidade 0,7. se no passar, far mais treinamento, o que ele estima
que lhe aumentar em lj%o a probabilidade de passar, isto , no segundo
rklvcis Aleatrias Discretas
exame passar com0,77 de probabilidade.
a. Supondo que ele continue acreditando nesse aumento de possibilidade, em
que exame ser aprovado com certeza?
b. Qual a probabilidade de serem necessrios mais de 2 exames? IRtrorluiro
Os arquivos de dqdos mencionados nos exerccios a seguir podem ser obtidos em
Nr.rlc c'irptulo, incorporamos o conceito de probabilidade no estudo de
www. i me. us p. b r/- no p ro e s t
l: tsrociirclls a caractersticas em uma populao. No Captulo 1, vimos
30. (Use o computador) Considere os dados do arquivo areas.txt descrito no Hllllrrrrrrlo rrrtlr tabela de freqncia, podemos apresentar os valores oossveis
Exerccio 25, captulo 1. Suponha que voc ganhe um apartamento em uma glua rlrtrlir vnrirvel e suas respectivas freqncias. Evitamos, dessa forma,
promoo feita por uma cadeia de lojas. utilizando o computador, construa $endr, ltet'tlir clc informao, a repetio, s vezes muito grande, dos valores
tabelas de freqncia necessrias para responder s seguintes questes. dvc.l, l)tr ornra irnloga, vamos formalizar, com a ajuda da Teoria das
a. Qual a probabilidade do apartamento estar situado entre os andares 4 e7? llrlnrk's, o conrportamento de variveis na populao, associando a cada
b. Qual a probabilidade do apartamento estar situado no bloco B? vllor sua probabilidade de ocorrncia. Como j mencionamos no
c. Qual seria a probabilidade de voc ganhar um apartamento com algum iilrtrli()r', irlnr da probabilidade poder ser obtida a partir do estudo das
problema de construo? (Isto , com rachaduras ou infiltraes). Irts, clrr tirrnbm pode ser deduzida a partir de suposies feitas a respeito
d. Repita os itens anteriores, dado que o apartamento esta situado no bloco B. llrt;t,r rlo 'r:nmeno. Na formalizao que faremos com a introduo de
llklnrlr's, nos ocrparemos apenas das variveis quantitativas. Vamos
3L. (Use o computador) Considerando o arquivo cancer.txt calcule:
It'etrlrr os casos discreto e contnuo, pois a atribuio de probabilidades
a. As probabilidades de que um paciente selecionado, ao acaso, seja
h' r'trt ciulrt situao. As variveis qualitativas podem ser, em algumas
classificado em cada uma das quatro categorias da varivel Diagnstico.
! E corrl o ctovido cuidado, tratadas como discretas na atribuio de
b. utilizando apenas o item (a), qual a probabilidade de um paciente, hliirlt's,
selecionado ao acaso, ser diagnosticado como no tendo a doena? Utnir rilrirrrticlaclc X, associada a cada possvel resultado do espao
32. (use o computador) considere os dados do arquivo aeusp.txt descrito no , tlt'rrrrrrrirtirdn dc vevivel aleatria discreta, se assume valores num
Exerccio 26, Capnlo 1. Suponha que escolhemos, ao acaso, um dos r etttttrrel'iivol, corn certa probabilidade. Por outro lado, ser denominada
moradores entrevistados. ctle'ttltit'itt t:rtttltuta, se seu conjunto de valores qualquer intervalo dos
a. Qual a probabilidade da idade do entrevistado ser inferior a 35 anos? iFntH. o tltrc scria um conjunto no enumervel.
b. Dado que o morador tem menos do que 35 anos, qual a probabiridade ( rnlr i'i rrtcrrcionamos arnteriormente, existem variveis que so
!r

dele ser do sexo feminino? rrlr rlrl'irritlls courcl discretas ou contnuas, porm essa atribuio no
c. Qual seria a probabilidade de escolher um morador do Jardim Raposo quo e rlt';rt.trth-r tkr irrstrumento de medida e do estudo que est sendo feito.
tenha acesso a computador? letttlrlrr, rr virliiivol tninrero dc,filltos em.famlias discreta, enquanto o
d. Determine a probabilidade de escolher um entrevistado qr"re tcnha vinclo clo clr te'tt1'titt u utn t:erlo mulicdnrcn.o contnua. A discusso sobre
nordeste, seja do sexo feminino e estr trabalhando. Se esse rnoraclor bi iflr.tt;to rh' vrrliiivcis, lbitn lro Captulo l, serr utilizada em todo o texto e a
escolhido, qual a probabilidaclc delc tor cartcira assinacla? fEl rtl:.'tttrrt'itt ir itcrcscicln itqui pttt'it inclicar qtle, cada possvel valor,
r!1 unut prohullilidnclc clc ocorrlrciu. No caso discreto, a atribuio

57
58 Captulo 3: Varidveis Aleatrias Disc 59
folr,t,lrt1,t,,

similar tabela de freqncia; jL no caso contnuo, utilizaremos


= (l) 0,20. De forma semelhante, temos que P(l'r 1) : 0,30 e
:
generalizao da idia de histograma. a catacterizao probabilstica a varivel
=: '=l ) 0,15. Para completar
lrt N. jrltn obter as probabilidades P(l : 3), P(l/ :4) e P(N : 5).
Neste captllo apresentamos os resultados e modelos mais comuns
variveis aleatrias discretas, deixando para o Captulo 6 a discusso do
r rrs irrlrmaes fomecidas, elas so iguais e, digamos, tm valor p.
contnuo.
r rr rlcl'irtio de funo discreta de probabilidade, temos que:
Seja X uml varivel aleatria discreta e 11,12,ryt..., seus dife
valores. /)(N : :
0) + P(.^'r *
1) ... + P(,^f - 5) :
Definio 3.1: Funo dscreta de probabilidade 0,20 + 0,30 +0,35 + p+ p + P r :
A funo que atribui a cada valor da varivel aleatria sua probabr 0,85 + 3p: I
0,15
denominada de funo discreta de probabilidade ou, simplesmente, funo p::0,05.
probabilidade. Anotao a ser utilizada :
P(X = r;) : p(r1) : pi,'i : I,2,... Ftttrio rlc probabilidade para l/ dada pela tabela a seguir:

ou ainda, tr

.1,): Nir construo de um certo prdio, as fundaes devem atingir 15


\1

1 p, < pt : de prolrnrliclade e, para cada 5 metros de estacas colocadas, o operador


"I
Uma funo de probabilidade satisfaz 0 1 L.
l lrorrvt. ;rltcrao no ritmo de perfurao previamente estabelecido. Essa
icsrrltlulo de mudanas para mais ou para menos, na resistncia do
Note que, na maioria dos casos, X ter apenas um nmero finito
Nps rlis c1sos, medidas corretivas sero necessrias, encarecendo o
valores possveis e, assim, a verificao de qge a soma de probabilidades igunl
I ser feita atravs deuma soma finita. As variveis aleatrias so complet d pltru, ('otr lrase em avaliaes geolgicas, admite-se que a probabilidade
caracterizadas pela sua funo de probabilidade e uma parte importantg
tliit rltr irltcraes de 0,1 para cada 5 metros. O custo bsico inicial
Estatstica , justamente, obter, para uma dada varivel de interesse, a funlo
tlf'('s (rrrrirllrlc padro de construo) e ser acrescido de 50k, com k
rtirhr o rrtirncto de alteraes observadas. Como Se comporta a varivel
probabilidade que melhor represente seu comportamento na populao.
r rilrtrrs tkr ltndaito?
Exemplo 3.1.' Com do ltimo censo, a assistente social de um Centro
dados Assrrrrrirrros cluc as alteraes ocorrem independentemente entre cada um
Sade constatou que para as famlias da regio, 20Vo no tm filhos, 30o/o t,m $r ltrt,,rvitlos tlc -5 metros e representamos por A a ocorrncia de alterao
filho, 35Vo tm dois e as restantes se dividem iryglgrglf" entre trs, quatro *l, lrrlr,rrzlo, scltclo '' seu complementar. A Figura 3.1 apresenta as trs
cinco filhos. Suponha que uma famlia ser es'colhida, aleatoriamente, ne !,r!u (s possvcis resultados da perfurao. Cada etapa tem duas
regio e o nmero de filhos averiguado. Definimos N como sendo a vari llrlri,l,'s (lu(:, (lr.riurclo combinadas com as outras duas etapas, originam 8
aleatria ntimero deftlhos e consideramos que a escolha feita entre as cli l -vlrrlos. llr cxcmplo, o evento AA"A representa que, na primeira e na
opes de valores parn N. Isto , no importa qual a famlia escolhida, mas Clllill,, it(.()tloccril-n alteraes, enquanto que na segunda nada se alterou.
qual a resposta dada quanto ao nmero de filhos. Desse mocJo, est letfrr ri ll ('lirl)irs, coltt 2 possibilidades emcadauma, temos no total 23 :B
sorteando um valor deNdentre 0,7,2,3, 4 ou 5. A funo de probabilidaclo
varivel segue das informaes disponveis, isto , como 20ok das l'amlius I I r-r,|no itrttoslt'itl cclnsistc na unio de todos os caminhos que levam de
tm filhos, ento a ptobabilidade de uma ftrrrrliir sortcacla ao icaso niro ter I'ilho pHltlrlr {riil!o (llr iirvorc clc probabiliclacles,
60 Captulo 3: Variveis Aleatrias Discretas lllln,ilrr'ro 61

P(C :150) : P(AA"A') + P(A'AA") + P(A'A'A)


-----_-----
^0,t4 :3 x 0,1 x 0,92 :0,243.
0,9 A"
ptrrlrlbilidades para os outros valores de C podem ser obtidas de modo
o' on,
r, r'csultando na seguinte funo de probabilidade:
o"
0,9

lrrrna, o comportamento da varivel de interesse pode ser estudado atravs


tsoc:iao de cada custo com sua probabilidade de ocorrncia. Essa
tiio pode auxiliar na previso de gastos e na elaborao de oramentos. I
Figura 3.1: rvore de probabilidades- alteraes no subsolo. Vlmos considerar agora exemplos em que as probabilidades associadas
[:rucrrtos do espao amostral so obtidas a partir de uma suposio terica.
Sendo C a varilrvel aleatria custo da obra, obtemos a seguinte tabela: 3.3r Considere o experimento de lanar uma certa moeda observar se
eilnr ou coroa. Descreva o comportamento da varivel nmero de caras em
Eventos Probabilidade ' (em UPCs) lilnt mentos dessa moeda.
AAA 0,1" 250 Sc denotamos por ly' a varivel de interesse, segue imediatamente que l/
AAA" 0,12 x 0,9 200 nssrrrrrir os valores 0, 1 ou 2.Para atribuir probabilidades a cada um desses
AA.A 0,12 x 0,9 200
rrecessrio fazu alguma suposio a respeito da probabilidade de
rciir de cara ou coroa. Admitindo que a moeda equilibrada, as
AA"A" 0,1 x 0,92 150
lrilitlrrcles de cada face sero iguais, isto , P(cara): P(coroa) : Ll2.
A.AA 0,12 x 0,9 200 ttos ainda a independncia entre lanamentos, de modo que a ocorrncia de
A.AA. 0,1 x 0,92 150 rlclclnrinada face no primeiro lanamento no altere a probabilidade de cara
A" AcA 0,1 x 0,9' 150 pror n0 segundo lanamento.
AcAcAc 0,9 t 100 l)oclemos considerar como espao amostral o seguinte conjunto:
g : {cc ,c R, RC , RR},
Note que associamos a cada evento do espao amostral um valor para a
varivel aleatria C. Os distintos possveis valores so c1 - 100, cz: L50, (I c / rcpresentando a ocorrncia de cara e coroa, respectivamente.
cs : 200 a c4 :250. Alm disso, podemos ter um mesmo valor da varivel l'lra deduzir a funo de probabilidade de -y', observe que o valor 1
associado a mais de um elemento do espao amostral, por exemplo, rrttr. rros cventos CR e C, enquanto que os valores 0 e 2 tm apenas um
etttrr ir cles associado, respectivamente, -R e CC. Segue ento que as
P(C : cz) : P(C: 150) : P(AAA'l) AAA'U A"A"A). pfehnlrilitlucles associadas aos valores de Iy' so as seguintes:
Tendo em vista que os eventos so disjuntos, a probabilidade da unio fica sendo
tr
simplesmente a soma das probabilidades de cada evento. Ento,
62 Captulo 3: Variveis Aleatrias Disc 63

Exemplo 3.4: tJmjogador paga 5 fichas para participar de um jogo de (1, 1)


disputando com a banca quem tem o ponto maior. O jogador e a banca (2,L) (2,2)
cada um o seu dado e a seguinte regra de premiao estabelecida: (3,1) (3,2) (3,3)
- se o Ponto do jogador
Joga maior, ele ganha 2 vezes a diferena entre o (4,1) (4,2) (4,3) (4,4)
ponto e o obtido pela banca; (5,1) (5,2) (5,3) (5,4) (5,5)
se o ponto do jogador menor ou igual ao da banca, ele no ganha (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
O que voc acha desse jogo? 3l 1r,t'.r trn todos a mesma probabilidade de ocorrncia e, portanto,
Vamos admitir que os dados utilizados so perfeitamente homogneos, Jtlf'l 0) :21136. De modo anlogo, calculamos os demais valores e
tal forma que no h preferncia na ocorrncia de qualquer uma das seis f futtiio clc probabilidade:
Assim, podemos considerar que os pares de valores (b, i) representt (;l 0 2 4 6 B 10
respectivamente,o resultado obtido pela banca e pelo jogador, tm a met 7t, I ztlze 5lJ6 4lJ6 Jls6 2186 Llz6
probabilidade de ocorrncia. Isto , qualquer par tem probabilidade 1136
ocorrer. fiubrc o jogo fica, ento, evidente. Tendo em vista as 5 fichas pagas
Para cada par (b,7) sorteado, a premiao baseada nos seus va o .jogirclor s no ter prejuzo nos casos em que obtiver 6, 8 ou 10
Definimos a varivel aleatria discreta G como sendo o ganho bruto do io de, rctorno, o que acontece com probabilidade
em uma jogada, isto , o valor arrecadado sem descontar as fichas iniciais !/aC t lf 36:6/36. Portanto, o jogo altamente favorvel banca e,
para participar do jogo. Pela regra de premiao' segue que: rint nruitl sorte (1/36), o jogador ganhar o dobro do que apostou. tr
Ent vriliirs situaes til calcular a probabilidade acumulada at um
t:l o, se i<b. , A tlel'inio a seguir apresenta esse conceito.

Dessa forma, se o jogador obtm 5 e a banca 6, temos G : 0 pois j < b (5 < ,2: Ituno de distribuio de probabildade
Por outro lado, se o jogador tira 3 e a bancaJ, o valor do ganho bruto do j $ Jiutr;iltt dc tlistribuio ou funo acuru.ulada de probabilidade de uma
serG:2x(3-1):4. lerrlririrr cliscretzr X definida, para qualquer nmero real r, pela
O espao amostral, correspondente a uma jogada, apresentado a xpl'rssto:
atravs dos pares (b, j): !
F(r): P(X < r) n
(1,1) (\,2) (1,3) (r,4) (1,5) (1,6
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6
J,.f,' llrrt populao de 1.000 crianas foi analisada num estudo para
(3,1) (3, 2) (3,3) (3,4) (3, 5) (3,6
n cl'ctiviclnclc de uma vacina contra um tipo de alergia. No estudo, as
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6
fer.t:lrirrnr r.rrna dose de vacina e, aps um ms, passavam por um novo
(5, 1) (5,2) (5,3) (5,4) (5,5) (5,6
r rritrrlir livcsscm tido alguma reao alrgica, recebiam outra dose da
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6
Ao lirrr rlc.5 closcs todas as crianas foram consideradas imunizadas. Os
O valor G : 0 acontecer quando o ponto do jogador for menor ou unrrr;rletos csto na tabela a seguir.

ao da banca. Esse caso corresponde ao seguinte subconjunto do espao


l)oses 2 3 4 5
'r'ccy. 245 28t 256 t45 66
64 Captulo 3: Variveis Aleatrias Discre 65

Supondo que uma criana dessa populao sorteada ao acaso, qual ser I(.r)
probabilidade dela ter recebido 2 doses? Utilizando a idia de atribui
l,oo
probabilidade atravs da freqncia de ocorrncia, a probabilidade desejada
9,954
288/1000:0,288. A funo de probabilidade da varivel aleatria nmero
doses recebidas fica sendo: ,7fltl

0,145
,113

Suponha, agoa, que desejamos calcular a probabilidade da criana ter recebi


at duas vacinas. O que precisamos obter a funo de distribuio no ponto
ou seja, calculamos a probabilidade acumulada de ocorrncia de valores men
ou iguais a 2. Assim,

F(2) : P(X < 2) : P(X : 1) * P(X :2) : 0,533.

Note que, tendo em vista que avarinel s assume valores inteiros, esse valor 012s45
inalterado no intervalo 12,3).Isto , F(2,L);F(2,45) ou F(2,99) tm todos
mesmo valor acirn*a. Por essa razo escrevemos: I,'lgura 3.2: Funo de distribuio - doses de vacina.

F(r):P(X<r) :0,533 Pata2 (r(3' 3,6.' Nurn cstudo sobre a incidncia de cncer foi registrado, para cada
eonr essc diagnstico, o nmero de casos de cncer em parentes
Os valores completos da funo de distribuio so os seguintes: (pais, ilrniros, tios, filhos, primos e sobrinhos). Os dados de 26 pacientes
irttes:

0
.ser<1;
0,245 se 1( r 12;
0,533 se 2( r13;
: 0,789 se 3(r14;
",r, 0,934 se 4( r15;
5

{ 1 se r)5. llltcliorcs irssurnem que a incidncia de cncer em parentes prximos


teut'icrrrrrcrrto nrodelada pela seguinte funo discreta de probabilidade:

A notao utilizada para escrever a funo de distribuio pode,


primeira vista, parecer confusa, mas como as contas efetuadas so simp
acreditamos que com um pouco de treino o leitor ficar familiarizado com
funo. A Figura 3.2 apresenta um diagrama dessa funo. frh*ir,t'vitrlos concordam com o modelo terico?

Fg tnlrcln rlc dados brutos com as 26 observaes, coletamos para cada


d vtrt'liivel, o nmcro de suas ocorrncias. Por outro lado, seguindo o
tct'ico, o rrrirrrcro cle observaes que seria esperado em cada incidncia
66 Captulo 3: Variveis Aleatrias Discre 67

(freqncia esperada) calculado cono i:26x pi. Note que os valores tlc Sco 3.1:
esperados no precisam ser nmeros inteiros, pois representam uma freqncia
terica caso o modelo fosse adequado. A tabela a seguir apresenta os resultados: fltu*rlii viciada tem probabilidade de cara igual a 0,4. Para dois
nlos itttlcpcndentes dessa moeda, estude o comportamento da varivel
rlet rttnlr c lra um grfico de sua funo de distribuio.
Incidncia n; (observados) ei (esperados)
4
bgcu ltrt itrllrrnao que voc conhece, crie os valores e as respectivas
0 216
lirlrrrlcs f)ura a varivel nmero de filhos em famlias, no caso da
1 4 216
lsn eonsiclcrada ser:
2 6 7,8
lgx*e rtrr"dil paulistana.
3 6 7,9
hehitntrtcs clo interior do Maranho.
4 2 216
5 4 216 gtttittlro lturit chcgar a uma festa pode ser dividido em trs etapas. Sem
total 26 26 o tlrr.jeto I'cito em t hora. Se enganos acontecem na primeira etapa,
r,'l',1
[e l0 rninutos ao tempo do trajeto. Para enganos na segunda etapa, o ,t v

ttn 20 o, pilra er terceira, 30 minutos. Admita que a probabilidade de


Representando em um mesmo diagrama as duas freqncias obtemos: 0, I ; 0,2 e 0,3 para a primeira, segunda e terceira etapas,
vnlenc. I'i provvel haver atraso na chegada festa? Determine a
Irlurk tlc ltavcr atraso, e o atraso no passar de 40 minutos.
itttetn de iuros prestando vestibular para conseguir uma vaga na
lttlc. esr scttdo estudado. As carreiras tm procura diferentes e, em
delux, o col-r'ullr pode ser prestar vestibular mais de um ano. Suponha
ttiolltr'tttos, ito acaso, um dos ingressantes da sua carreira. Que
Itlirtle voc atribuiria (invente!) necessidade de 1, 2,3, ...anos de
I

levrt tt 'illro to cinema filho vai


e vai gastar nas duas entradas R$ 15. O
plltll e onre r pipocu com probabilidade 0,'l e, alm disso, pode pedir bala
pnrbnbilidnrlc 0,9. Esses pedidos so atendidos pelo pai com
illtllrlc 0,.5; inclcpendentemente um do outro. Se a pipoca custa R$ 2. e a
fl$.1, r,strrrlc o gusto eletuado com a ida ao cinema.
Vntl:lvrl rrh:lttirin X tcrn a seguinte funo de distribuio:

se r<10;
se 10(r1I2;
Notamos que os dados observados seguem a mesma tendncia do P(r) : se 12(r<13;
terico, porm seus valores so dis-crepantes. uma amostra pequena, mas se 1"3 ( r 125;
no haver boa adaptao entre os dois conjuntos de nmeros. se r)25.
{
I
68 Captulo 3: Variveis Aleatrias Disc I t lt't t n la lr ts D iscretos 69

i rdl'icrr tln densidade apresentado na Figura 3.3 para o caso k : L0.


Determine:
a. A funo de probabilidade de X.
b. P(x < L2). - Fl,r =.r )

c. P(X < L2).


d.P12<X<20). E,l0
e.P(x t rs). (t
B,tlH

3.2 Principais Modelos Discretos E,Ofi

Os exemplos da seo anterior ajudam a esclarecer a relao entre


g,4
varivel e a realizao do experimento aleatrio que a origina. Cada poss
elemento do espao amostral uma realizao do experimento e corresponde
um valor da varivel, nem sempre distinto. ,sa
Algumas variveis aleatrias aparecem com bastante freqncra
situaes prticas e justificam um estudo mais aprofundado. Em geral
casos, a distribuio de probabilidade pode ser escrita de uma maneira 2 3 4 5 6 7 I 9 l0 x
compacta, isto , existe uma lei para atribuir as probabilidades.
Por exemplo, se uma varivel aleatria W tem funo de probabili 'ittura 3,3: Modelo Uniforme Discreto [0, 10].
dada por
Clhrelve (ple it cxpresso na definio anterior, de fato, representa umn
wl r 2 3 4 5 6 dhet'etn rlc llrubabilidade, uma vez que seus valores esto no intervitlcl
Fntilr tle loclits as probabilidades igual a 1. O modelo Uniforrne tem
i pofrlue loclos os seus valores ocorrem com a mesma probabilidade e,
pedetnus tlizer quc a probabilidade se distribui uniformemente entre os
ento, escrevemos essas probabilidades como P(W : k) : k
1[hrres,
k:L,2,...,6. Dessa maneira, temos uma forma abreviada de apresentar
varivel e sua funo de probabilidade. Vamos apresentar os principais mode J,7,' llrrrn rilr tcrl 100 billretes numerados de 1 a 100. Tenho 5 bilhetes
de variveis aleatrias discretas, comeando pelo mais simples a seguir, quo lvrrr nrtnre'rrulrts dc2l 'd 25 e meu colega tem outros 5 bilhetes, col'1 os
aquele que atribui igual probabilidade a todos os possveis valores da varivel, Il, I l, .l(), (rtJ c 93. Quem tem maior possibilidade de ser sorteado?
prlrreill vistn tcnr-se a impresso de que "espalhar" os nmeros tt
Definio 3.3: Modelo Uniforme Discreto
lltllleill ([. giltlitr o $orteio. Entretanto,
assumindo a honestidade da ritt,
Seja X uma varivel aleatria cujos possveis valores so represe l tttintr:rus lettt it ttrcsma probabilidade de corrncia, com l/100 para cnclit
por J1 , t2,r."1,...,tt. Dizemos que X segue o modelo Uniforme Discreto $ Yntlrivel ttletttr'ia cm questo, o n,mero sorteado, segue o rnodelo
atribui a mesma probabilidade llk a cada um desses k valores, isto , sua fu Fr prrllrrrrlu, !:u c mcu colcgit com 5 bilhetes temos et fiesll1lt
de probabilidade dada por llrhirlo t['
gnttltitr l rir. Ncstc sorteio, como no modelo Unilorme cttt
lltllnr ou tncllot'probabiliclade clc garrhar clcpcndc dc quantos bilhetes'sc
P(X : x. : Ilk: ,V.:i : L,2,... ,k. tr
n rlrt pirrlit'rtlrtr escolltu tlo nntcro,
\ ..l s
ir""\ - {-'r
70 Captulo 3: Varidveis Aleatrias Disc tl.t A l, n I t' I o^t I)iscretos '^ J - ' ., '-'' 7t

Em muitas situaes prticas a varivel de interesse assume somente {F r'nrrsllrril a /rrvore de probabilidades, consideramos que a escolha dos
valores. Por exemplo, pea classificada como boa ou defeituosa; or loi I'cilir a partir de uma populao muito grande. Dessa forma, cadit
entrevistado concorda ou no com a afirmao feita; a vacina imunizou ou ebuullritkr torn probabilidade 0,80 de estar imunizado, independente dos
criana. Estas situaes tm alternativas dicotmicas, que genericamente vrlrros rllr populao. Se classificamos como sucesso a ocorrncia dc
ser representadas por respostas do tipo sucesso-fracasso. A atribuio de qual r, lururs ir repetio independente de trs ensaios de Bernoulli.
{Lle rlt'srrjirnros estudar o comportamento da varivel X: nmero dc
respostas ser referida como sucesso feita de modo arbitrrio, mas deve
definida claramente para evitar ambigidades. Esses experimentos recebem llrrrrrrizrrrkls nesse grupo. Ela assume os valores 0, 1,2 e 3 cont
nome de Ensaios de Bernoulli e d,o origem a uma varivel aleatria com le,ri t'ir['rrlirclas com o auxlio da rvore e apresentadas na tabela:
mesmo nome.
Dffinio 3.4: Modelo Bernoull Eventos Probabilidade X
TTT 0,8' J
Dizemos que uma varivel X segue o modelo Bernoulli se atribui ou
ocorrncia de fracasso ou sucesso, respectivamente. Com p representando ITI'' 0,Bz x 0,2 2

probabilidade de sucesso, 0 ( p 1 7, sua funo discreta de probabilidade I T,'I 0,82 x 0,2 2


por T I,'1,' 0,8 x 0,22 I
rII 0,8" x 0,2 2

p
[( J J(: 0,8 x 0,2" 1

T,'1,, I 0,8 x 0,22 1


ou, de modo resumido, P(X - r) : p'' (7 - O1L-:r: , r :0,L [( I( J(l 0,2" 0
A repetio de ensaios de Bernoulli independentes d origem
importante varivel aleatria discreta denominada modelo Binomial. nrcnle, ir rniro de probabilidade de X fica sendo
Exemplo 3.8.' Sabe-se que a eficincia de ume vacina de 80Vo. Um grupo de
0 2
indivduos sorteado, dentre a populao vacinada, e submetido a testes
averiguar se a imunizao foi efetiva, evento representado por .I. A rvore o,2ir ll x o,B x 0,22 3 x 0,82 x 0,2 0,8'
probabilidades apresen tada a seguir.
f,l rrnrpurturrre:nlo tlc X completamente determinado pela funo acima,
0,8 / lirlrrrlrs lirrrrbtl podem ser escritas atravs da expresso
. --_-_--_-_-.----..
0,2
o''
I
I'(, ') : (i) x o,g' x or23-k" k :0,7,2,3.
," ',,
0,2 t :lue lrrohllliliclirclcs correspondem aos temos do desenvolvimcnto
?rlirti
Irr rlr. Newl91 rlo (0,8 + 0,2):, o qr-re justifica o nome escolhiclo pala
0,8

72 Captulo 3: Variveis Aleatrias Discretas .,2 Principais Modelos Discretos 73

Defino 3.5: Modelo Binomial Em muitas situaes prticas, a varivel Binomial aparece a partir de
outras variveis, atravs da criao de duas categorias excludentes, como no
Considere a repetio de n ensaios de Bernoulli independentes e todos
excmplo a seguir.
com a mesma probabilidade de sucesso p. A varivel aleatria que conta o
nrmero total de sucessos denominada Binomial com parmetros n e p e sua Ilxemplo 3.9: O escore em um teste internacional de proficincia na lngua
funo de probabilidade dada por itrglesa varia de 0 a 700 pontos, com mais pontos indicando um melhor
rlcscmpenho. Informaes, coletadas durante vrios anos, permitem estabelecer o
$
P(X : rl : (i,)ru (i - p)''-k, k : 0,L,2,...,n,
scgr.rinte modelo para o desempenho no teste:

Pontos lo,200) 200,300) 1300,400) 1400,500) 1500,600) 1600,7001


com (ii) representando o coeficiente binomial calculado por n; 0,06. 0,15 0,16 0r25 0,28 0,10

Vrits universidades americanas, exigem um escore mnimo de 600 pontos para


(n\ nt.
ruccitar candidatos de pases de lngua no inglesa. De um grande grupo de
\n) -- kG-4. estudantes brasileiros que prestaram o ltimo exame, escolhemos ao acaso 20
tlclcs. Qual seria a probabilidade de no mximo 3 atenderem ao requisito mnimo
Usaremos a notao X -U1,",p) paraindicar que a varivel aleatria X segue o ttrcncionado?
modelo Binomial com parmetros n e p. tr Vamos admitir que a tabela acima representa o escore dos estudantes que
importante notar que as probabilidades so completamente estio prestando esse ltimo exame. Essa uma suposio razoixel tendo em vista
caracterizadas pela informao dos parmetros. Por exemplo, desejando calcular a clrc a tabela foi feita a partir de um conjunto muito grande de dados. Isto quer
probtrbilidade de 3 sucessos numa b(12;0,4) temos rliz,cr que um aluno selecionado ao acaso apresentar um dos vrios escores de
ttcordo com as probabilidades apresentadas na tabela. Por exemplo, a chance de
nprcsentar menos de 200 pontos 0,06. Admitimos ainda que os estudantes
P(x - :3) (lj;o,n'0,6n - -1{e,4s o,6e : 0,142 . lunsileiros tm comportamento similar aos demais e portanto a tabela tambm
porlc ser usada para representar esse desempenho.
Pelo critrio das universidades, o estudante classificado como apto, se
De modo similar, obtemos os outros valores da funo discreta de probabilidade: neu cscore de 600 pontos ou mais, caso contrrio, ser considerado no apto.
l)cssa fbrma, para cada indivduo, teremos a classificao de apto ou no, feita de
X 0 I 2 4 5
ttrotlo independente e com as seguintes probabilidades
-t 6
0,002 0,017 0,064 0,142 0,2r3 0,227 0,777
Pt'
P(aPto) : 0,10 e P(no apto) : 6,99 .

X l 8 9 10 11 12
Definindo uma nova varivel X como o nmero de estudantes aptos
0,101 0,042 0,012 0,002 0+ 0+
Pt
tlrttlrc os 20, temos que X - b(20;0,10). A probabilidade de no mximo 3 serem
nptos calculada pela funo de distribuio no ponto 3, ou seja,
O valor 0+ indica uma probabilidade muito pequena que, na aproximao de F(3) :P(x<3).
rnilsimos (3 casas aps a vrgula), no teve casa decimal diferente de zero.
Diversos programas computacionais contm rotinas que calculam as I)'ssr brma, temos:
probabilidades da distribuio Binomial e alguns livros-texto incluem tabelas
dessa clistribuiiro, para vrios valores dos parmetros.
!

74 Captulo 3: Varidveis Aleatrias Discretas ..2 Principais Modelos Discretos 75

e, cnto, podemos concluir por uma expectativa de ll,7 nascimentos com 7


:
()
r1x 3ly 0,1 o,e2o- I'ilhotes dentre as 100 inseminaes. Observe que os valores esperados no
prccisam ser nmeros inteiros, pois representam uma freqncia terica de
ocorrncia. A tabela a seguir contm os valores observados e os esperados, se o
: ()0,100,e20. ()0,11 0,e1e. ()0,120,e18. ()0,130,e17 nxrclelo Binomial fosse utilizado.

Filhotes 0 2 3 4 5 6 7 8 9 t0
: 0,r22 + 0,270 + 0,285 + 0,190 : 0,867. lrrccl. Observada 0 1 6 7 23 26 2t t2 ,) I 0
I'cq. Esperada 0,1 I 4,4 tr,7 20,5 24,6 20,5 I,7 4,4 1 0,1
Esse valor reflete as altas probabilidades atribudas aos escores menores de 600,
conforme o modelo de desempenho no teste. tr O modelo proposto parece se ajustar bem aos dados observados (veja a
F'igtrra 3.4) e tendemos a acreditar que o modelo Binomial uma escolhn
Exemplo 3.10: Um veterinrio est estudando o ndice de natalidade em porcos
ttdccluada. A representao grfica torna-se assim, um importante passo inicial
sujeitos inseminao artificial. Para tal, coletou informaes sobre a varivel
purt auxiliar na escolha de um modelo probabilstico. A verificao aqui foi
nmero de fllhotes nascidos vivos em cada uma das 100 inseminaes re'alizadas
flpcnas visual, mas possvel estabelecer procedimentos estatsticos que testam o
com o mesmo reprodutor. A tabela a seguir apresenta os resultados.
ajustc do modelo proposto de forma objetiva. Procedimentos mais rigorosos
devcrn ser utilizados para a deciso final e podem se basear em um teste
Nmero ) 2 J 4 5 6 7 8 9 estirtstico conhecido como Teste de Aderncia. tr
Freq. Observada 1 6 7 9a 26 2L L2 t
t) 1

a Observada
muito comum buscar estabelecer um modelo para a varivel de interesse, o que o Esperada
nesse caso possibilitaria, por exemplo, p comparao entre diferentes
reprodutores. O veterinrio informa que 11 ou mais filhotes nascidos vivos uma
ocorrncia muito rara e pode ser desprezada em termos de model. Nestes termos,
ele sugeriu considerar que a varivel N: nmero de filhotes nascidos vivos,
poderia ser ajustada pelo modelo Binomial com parmetros n : 10 e p: 0,5. O
que voc acha da sugesto do veterinrio?
Note que, mesmo no tendo havido nenhuma observao do valor 0 ou
10, o veterinrio sugeriu o modelo de uma varivel que contm esses valores, pois
apesar de no serem comuns eles podem acontecer. Com o modelo sugerido,
calculamos as probabilidades de cada um dos valores de 0 a 10 e, a partir deles, os
resultados que seriam esperados em 100 inseminaes realizadas. Por exemplo,
7 I I 10
Filhots
P(N :7) : (;o,t'0,53: o,rr.;
Fgura 3.4: Grfico de freqncias- natalidade em porcos.
76 Captulo 3: Variveis Aleatrias Discretas .,.1 Outros Modelos Discretos 77

Ao finalizar essa seo, oportuno


mencionar as diferentes formas b. Escolhemos 20 lmpadas ao acaso na prateleira de um supermercado, sendo
utilizadas para referenciar os modelos tericos das variveis aleatrias. Por 10 de uma fbrica e 10 de outra. Contamos o nmero total de defeituosas.
exemplo, alguns autores referem-se a uma varivel aleatria com distribuio c. Quinze automveis 0 km de uma mesma marca e tipo so submetidos a um
Binomial enquanto outros enfatizam uma varivel aleatria seguindo o modelo teste anti-poluio e contamos o nmero deles que passaram no teste.
Binomial. Neste livro, vamos utilizar indistintamente essas duas formas que d. Um motorista submetido a um teste em que deve estacionar seu veculo
consideramos equivalentes. num pequeno espao (isto popularmente chamado defazer baliza). Em l0
tentativas, contamos o nmero de vezes em que o motorista estacionou
corretamente.
Bxerccios da Seo 3.2:
5. Sendo X uma varivel seguindo o modelo Binomial com parmetros n : 15 e
1. Discuta a validade do modelo Uniforme Discreto nos seguintes casos:
a. O nmero sorteado numa rifa com 100 nmeros. P:0,4; Pergunta-se:
b. A escolha de um aluno que vai representar a classe junto direo da a. P(X > 14).

escola.
lr.P(8<X<10).
c. P(X 12 ou X > 11).
c. O dia da semana em que ocorrem mais acidentes de trabalho numa indstria.
d. O ms do ano com maior nmero de enchentes na cidade de So Paulo. d.P(X ) tL ou X > 13).
a.P(X)3eX<6).
2. Sendo X uma varivel seguindo o modelo Uniforme Discreto, com valores no r. P(x < 13lx > 11).
conjunto {L,2,3,.. . , 10}, pergunta-se:
a. P(X > 7\. 6. Urna certa doena pode ser curada atravs de procedimento cinirgi co em 80Vo
/
dos casos. Dentre os que tm essa doena, sorteamos 15 pacientes que sero
b.P(3 <X<7).
P(X 12 ou t > submetidos cirurgia. Fazendo alguma suposio adicional que julgar
' c. 8).i
nccessria, responda qual _a probabilidade de:
d..P(X)5ouX>B)) ru. Todos serem curados? L--

',1f.e.P(X)3e X<6).
P(x < e lx 2 o;.r
\,
ll. Pelo menos dois ro serem curados?
c. Ao menos l0 ficarem livres da doena?
3. Um usurio de transporte coletivo chega pontualmente s 8 horas para pegar o
seu nibus. Devido ao trnsito catico, a demora pode ser qualquer tempo
7. Calcule a funo de distribuio da varivel X nos casos:
t. X Bernoulli com p : 0,6.
entre 1 e 20 minutos (admita que o relgio "pule" de minuto em minuto).
b. X - b(4;0,20).
Pergunta-se:
a. Qual a probabilidade de demorar mais de 10 minutos? e c. X - b(B;O,10).
b. Qual a probabilidade de demorar pelo menos 5 mas no mais de 10 minutos?
c. Qual a probabilidade da demora no chegar a 5 minutos?
q._
d. Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo nibus (que
3.3 Outros Modelos Discretos
/n ainda no passou), qual a probabilidade do amigo atrasado esperar at 3 Apresentamos, nesta seo, os modelos Geomtrico, Poisson c
minutos? L lliptrgcomtrico, que tm vrias aplicaes prticas, conforme ilustram os
e'xcrnrplos desta seo. Na seo anterior, os modelos definidos assumiram apenas
4. Discuta a validade do modelo Binomial nos seguintes casos:
rrrrr nmero finito de varlores distintos. Foi assim com o modelo Unifbrme
a. Dos alunos de uma grande universidade, sorteamos 5 e contamos quantos se
l)iscrcto com valores L,2,,..,;, Bernoulli com 0 e L e Binomial com os valores
declaram usurios de drogas.
If,t

78 Captulo 3: Variveis Aleatrias Discretas .1.-l Outros Modelos Discretos 79

1,...,n,
Como veremos a seguir, os modelos Geomtrico e Poisson podem ter P(Q=
0,
um nmero infinito de valores dentre os inteiros positivos. 0,010

Definio 3.6: Modelo Geomtrico


0,008
Dizemos que uma varivel aleatria X tem distribuio Geomtrica de
parmetro p, se sua funo de probabilidade tem a forma 0,006

P(X: k): p(L- p)o', 0<p 1le k:0,1,2,.... 0,004

Nesse caso, usaremos a notao X- G(p). tr 0,002


Interpretando p como a probabilidade de sucesso, a distribuio
Geomtrica pode ser pensada como o nmero de ensaios de Bernoulli que
precedem o primeiro sucesso. Note que a expresso apresentada na Definio 3.6 0 4 I 12 16 20 24 28 32 36 40 44 48 tc

de fato uma funo de probabilidade, pois positiva e sua soma igual a 1,


conforme pode ser verificado atravs da frmula da soma de progresso Figura 3.5: Modelo Geomtrico (n:0,01).
geomtrica (PG) infinita:
Clorno podemos verificar atravs da figura, a probabilidade vai ficando muito

t p) :et
llc(luena para valores grandes de k. Em tese, a produo nunca seria interrompida
- p)^ :
@mm
k): r_fr1: r
8"," - [of -
(1 se rriro houvesse o aparecimento de uma pea defeituosa. tr
Detnio 3.7: Modelo Poisson
Exemplo 3,11: lJma linha de produo est sendo analisada para efeito de Uma varivel aleatria X tem distribuigo de Poisson com parmetro
controle da qualidade das pas produzidad. Tendo em vista o alto padro > 0, se sua funo de probabilidade dada por
requerido, a produo interrompida para regulagem toda vez que uma pea
e-]'k
defeituosa observada. Se 0,01 a probabilidade da pea ser defeituosa, estude o \/kl=/c) :
P(X , k : 0,1,2, ... ,
comportamento da varivel Q, quantidade de peas boas produzidas antes da la.
defeituosa. cor o parmetro sendo usualmente referido como a taxa de ocorrncia, A
Vamos admitir que cada pea processada tem a mesma probabilidade de notuo utilizadaser X- Po(\). tr
ser defeituosa, independentemente da qualidade das demais. Sendo a ocorrncia
de pea defeituosa um sucesso, podemos aplicar o modelo Geomtrico. Observe O modelo Poisson tem sido muito utilizado em experimentos fsicos e
que o nmero de peas boas produzidas exatamente o quanto se "espera" para a lriolgicos e, nesses casos, a freqncia mdia ou esperada de ocorrncins
ocorrncia do primeiro sucesso. Temos,
trtrrn determinado intervalo de tempo, Vamos verificar que a expresso
rrprcsentada realmente representa uma funo de probabilidade. No difcil
:k) :0,01 x 0,99', k:0,L,2,"', rrlrscrvar que, para qualquer k, ela um nmero positivo. Resta mostrar que tls
P(Q
prrrllabilidades somam 1. Temos,
cuja representao grfica est na Figura 3.5.
80 Captulo 3: Variveis Aleatrias Discretas Otrtros Modelos Discretos 81
=1,.1

Se o intervalo de tempo alterado, a varivel aleatria mantm a mesma

tt" : 4=# : "-^# :


l':0 k:U :ll
e-\e : r' dlrtritruio de Poisson, mas com o valor do parmetro ajustado de forma
Ggrrvcniente. Assim, se o perodo de tempo considerado for de dois minutos,
tglepros que o nmero de partculas emitidas em dois minutos ter distribuio
No clculo acima, usamos que a srie \R' 1kt , somada para valores de k entre 0 e tr
Po( l 0),
oo, produz e. Esse resultado bastante conhecido e segue do desenvolvimento
em srie de Taylor do termo el. O leitor interessado poder consultar, para outros Eyemplo 3./3; Engenheiros da companhia telefnica estudam se o modelo de
detalhes, textos bsicos de Clculo Diferencial e Integral. Poisson pode ser ajustado ao nmero N de chamadas interestaduais que chegam,
Fr [ora, a uma central telefnica,
durante o perodo notumo. Os dados coletadOS,
Exemplo 3.12: A emisso de partculas radioativas tem sido modelada atravs de
Efl:r'cntes a 650 perodos de uma hora, esto apresentados a seguir:
uma distribuio de Poisson, com o valor do parmetro dependendo da fonte
utilizada. Suponha que o nmero de partculas alfa, emitidas por minuto, seja uma 2 t 4 5 6 7 >8
Chamadas 0 1
varivel aleatria seguindo o modelo Poisson com parmetro 5, isto , a taxa
mdia de ocorrncia de 5 emisses a cada minuto. Calculemos a probabilidade
Freq. Observada I 38 7t 115 r25 106 79 50 57

de haver mais de 2 emisses em um minuto.


Seja o ntimero de partculas alfa emitidas por minuto. Pelas suposies Da tabela temos que, por exemplo, em 125 perodos de uma hora
feitas, temos A - Po(5) e a probabilidade desejada ser orrcram 4 chamadas.
Os engenheiros sugerem rttilizar uma taxa de ocorrncia de 4-5-chamadas
6 , pet lrora no perodo estudado. Seguindo o modelo indicado, a freqncia esperada
P(A> 2) :t P(A:a) :1-t P(A:0) :1- $e-s,n
4 o,l {g ocorrncias com k chamadas obtida multiplicando 650 (o total das
bnr-t'vaes) pela probabilidade de k chamadas. Assim, para k : 2, temos
Aps os clculos n":"lrrur,or, obtemos ir'o 12) : 0,875. **r"r"t,"*os na
Figura 3.6, alguns valores da funo discreta de probabilidade da Po(5). Freq. esperadapara 2 chamadas : 650 x P(N :2)
4152
:650x "-4's
2l
P(N=n) :73,13.
0,1 8
0,16 Ee rrurclo anlogo obtemos os demais valores.
0,14
I >8
o,12 Flr'! utrlas
rvadn
0
a 38
2
71 115
3 4
125
5
106
6
79
7
50 57
0,1 0 LOhsc
i 7,22 32,50 73,13 109,66 123,37 111,02 83,27 53,56 56,36
0;08 fllsl'1
0,0 6

tabela acima parece indicar que o modelo Poisson, com : 4,5


0,04
0,02
A
ftl'rrr..c,c unr bom ajuste para a varivel aleatiia de interesse. O leitor pode
14 e'otrslnrir um grfico de freqncia'para visualizar melhor essa aderncia. A
4 6 I 10 12 16 18 20
cxh.nsiro clessas concluses aos diferentes perodos de tempo e/ou outros tipos de
Figura 3.6: Modelo Poisson (),: 5). G:hirrrrncla deve ser feita com cuidado, porm o ajuste j obtido uma "boa pista"
Flt'n il cscolha do modelo. Como mencionamos anteriormente, a concluso obtida
82 Captulo 3: Variveis ,Aleatrias Discretas ,.. Outros Modelos Discretos 83

aqui poderia ser feita de modo mais objetivo atravs de Testes Estatsticos de Acaixa pode ter peas boas ou defeituosas e vamos sortear algumas
Aderncia. tr pcas, sem reposio. Baseado no nmero de peas defeituosas encontradas
Encerramos esta seo, definindo o modelo Hipergeomtrico. Este rlccidimos por aceitar ou rejeitar o lote. Seja D a varivel que conta o nmero de
moclelo surge da contagem de objetos de certo tipo, retirados ao acaso e sem pcras defeituosas neste sorteio. Ela segue o modelo Hipergeomtrico e vamos

reposio, de um conjunto contendo dois tipos de objetos. Por exemplo, num itlcrrtilicar os diversos parmetros. O total de peas n:25, o nmero de
grupo de jovens com 5 meninas e 5 meninos, sorteamos 3 deles ao acaso, para elel'cituosas m : 4 e o nmero de retiradas r: 5.

azer uma comisso. O sorteio ser feito sem reposio, para evitar a escolha de P(aceitar o lote) : P(no mximo 2 peas defeituosas) : P(D < 2).
utri mesma pessoa, o que inviabilizaria a formao da comisso. Na primeira
escolha cada um dos 10 jovens tem 1/10 de probabilidade de ser sorteado. Na
lintiio,
segunda, cada um dos 9 restantes, ser sorteado com probabilidade I/9 e, na
terceira, 1/8. A varivel aleatria nmero de meninas na comisso segue o modelo
: ().(';) . ()=('i ) . ()=!'il -0,e84
Hipergeomtrico, conforme definido abaixo.
Definio 3.8 : Modelo Hipergeomtrco
p(D<r)
('J) (',J) (',J)
Considere um conjunto de n objetos dos quais mso do tipo I e n - m C-onclumos que, mesmo havendo quatro defeituosas na caixa inspecionada, a
so do tipo II. Para um sorteio de r objetos (r < n), feito ao acaso e sem probabilidade de aceitar o Iote 0,984 ou, equivalentemente, para rejeitar o lote a
reposio, defina X como o nmero de objetos de tipo I selecionados. Diremos prolrabilidade 0,016. Claro que, na prtica, no saberemos quantas peas
que a varivel aleatria X segue o modelo Hipergeomtrico e sua funo de rlccituosas existem em cada caixa. Entretanto, a probabilidade calculada acima
probabilidade dada pela expresso purlcria ser um indicativo para avaliar se o critrio do controle de qualidade est
t'rrzoiivel ou no e, neste caso, parece que no! Poderamos tambm criar uma

P(X:*)-,^., _
(T) (",--T
/n,\
) ,k:A,I,...,min(r,rn).
,-_ ., , ^;^t_ tr
tobcla contendo os valores da probabilidade de rejeio do lote, em funo de
Irrrvcr certo nmero de peas defeituosas na caixa sorteada. tr
("/
l,lxcrccios da Seo 3.3:
Note que os valores possveis de X vo de 0 a min(r,rn), uma vez que
no podemos ter mais do que o nmero de objetos existentes do tipo I, nem l. Scndo X(DG(0,4), calcule:
tillnpouco mais que o total de sorteados. Utilizando resultados de anlise n. P(X:3).
combirratria, pode-se verificar que a expresso de P(X : k) um nmero no b.P(2<X<4).
negativo entre 0 e 1 e a soma, para todos os valores de k, igual a l. Assim esto c. P(X > LIX < 2).
cumpridos os requisitos necessrios para ser uma funo de probabilidade. rl. P(X > 1).
Exentplo 3.14: Uma ftbrica produz peas que so embaladas em caixas com 25 2. IJrrrir moeda equilibrada lanada sucessivamente, de modo independente, at
(f ue ocorra a primeira cara. Seja X avarivel aleatria que conta o nmero de
unidades. Para aceitar o lote enviado por essa fbrica, o controle de qualidade de
uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, lirnamentos anteriores ocorrncia de cara. Determine:
sorteia cinco peas, sem reposio, dessa mesma caixa. Se constatar no mximo u. P(X < 2).
dr"ras defeituosas, aceita o lote fornecido pela fbrica. Se a caixa sorteada tivesse 4 b. P(X > 1).
pcas defeituosas, qual seria a probabilidade de rejeitar o lote? c.P(3<x<5).
rl. Quantas vezes deve, no mnimo, ser lanada a moeda para garantir a
ocorrncia de cara com pelo menos 0,8 de probabilidade.
8{ Captulo 3: Variveis Aleatrias Discretas
3,4 [ixerccios

3. A varirvel aleatria Y temdensidade poisson com parmetro : 2. obtenha:


a. P(Y < 2), LJrna agncia de turismo apresenta aos clientes o oramento de uma certa
b.P(2<Y <4). viagem em duas partes. A primeira o transporte areo que tm trs opes
c. P(Y > 0). com preos 3;3,5 e 4 mil reais e preferncias de escolha de 0,5; O,3 e 0,2 para
d. P(Y: 1l]'< 3). ;rs companhias TWA, TWB e TWC, respectivamente. A segunda parte do
or'amento a escolha de estadia. Existem quatro opes de hotis que custam
4. A aplicao de fundo anti-corosivo em chapas de ao de 1 m2 feita 2; 2,5; 3 e 3,5 mil reais e so escolhidos pelos clientes com a mesma
mecanicamente e pode produzir defeitos (pequenas boihas na pintura), prcferncia, independentemente da companhia area. Seja x a varivel
de
ncordo com uma varivel aleatria poisson de parmetro : t p, *2.
-a irlcatria oramento da viagem. Calcule a funo de probabilidade e a funo
chapa sorteada ao acaso para ser inspecionad, pergunta-se a probabilidade rlc distribuio da varivel X .
de:
n. Encontrarmos pelo menos I defeito. Urn equipamento consiste de duas peas A e B que tm 0,10 e 0,15 de
b. No mximo 2 defeitos serem encontrados. ;lrobabilidade de serem de qualidade inferior. um operrio escolhe ao acaso
c. Encontrarmos de 2 a 4 defeitos. utni pea tipo A e uma tipo B para construir o equipamento. Na passagem pelo
d. No mais de 1 defeito ser encontrado. controle de qualidade o equipamento vai ser classificado. Ser considerado
como nvel I, se as peas A e B forem de qualidade inferior. ser nvel II, se
5. A varivel 11 segue o modelo Hipergeomtrico com parmetros n: r0,m : trrna delas for de qualidade inferior e, nvel III, no outro caso. o lucro na venda
5
a r' : 4. Determine: dc R$ 10, R$ 20 ou R$ 30 para os nveis I, II ou III, respectivamente. Como se
a, P(H :2). cornporta a varivel lucro? Para dois equipamentos vendidos, obtenha a funo
b. P(H < L). tlo probabilidade do lucro. Nesse caso, qual seria a probabilidade de pelo
c. P(f/ > 0). rronos R$ 30 de lucro?
6. Por engano 3 peas defeituosas foram misturadas com boas formando um lote Na verificao de mquinas, observam-se as partes eltrica, mecnica e
corn l2 peas no total. Escolhendo ao acaso.,4 dessas peas, determine a estrutural. A probabilidade de aparecer uma falha em cada uma das partes
probabi lidade de encontrar: 0,01; independente das demais. ocorrendo falha, o tempo de conserto ro,z0
n. Pelo menos 2 defeituosas. t orr 50 minutos para falha eltrica, mecnica ou estrutural, respectivamente. Se
b. No rnrximo I defeituosa. rr alha eltrica aparece junto com a falha mecnica, teremos ainda um
c. No mrrimo I boa. ircrscimo de 20 minutos. Para uma mquina escolhida ao acaso, qual a
lrrobabilidade do tempo de interrupo (se no h falha, esse tempo , zero):
tt. Durar menos de 25 minutos?
3.4 Exerccios b. Ultrapassar 40 minutos?
l. urn agricultor cultiva laranjas e tambm produz mudas para vender. Aps llrna empresa paga a seus estagirios de engenharia de acordo com o ano de
irlguns meses a muda pode ser atacada por fungos p.bubilidade 0,0j e, ctrrso do estudante. Para se obter o salrio mensal pago por 30 horas semanais,
nesse cASo, ela escolhida para ser recuperada com "o-
probabilidade 0,5. Admita rnrrltiplica-se o salrio mnimo pelo ano de curso do estagirio. Dessa forma, o
que o processo de recuperao infalvel. o custo e cada muda produzida trstudante {o primeiro ano ganha um salrio mnimo, o do segundo recebe dois

l$ 1,00; acrescido de mais R$ 0,50 se precisar ser recuperada. Cada muda r' itssim por diante at o quinto ano. A empresa vai empregar 2 novos
vorrdida a R$ 3,00 e so descartadas as mudas no recuperadas de ataque cstngirrios e admitimos que todos os anos tm igual nmero de estudantes
de
lngos. Estude como se comporta o ganho por muda produzida. intcressados no estgio (considere a populao de candidatos muito grande de
trulclo a no haver diferena entre escolher com ou sem reposio). pergunta-se
;r protrabilidade de:
86 Captulo 3: Variweis Aleatrias Discretas .1.4 Exerccios 87

a. Os dois serem do primeiro ano? 9. Num certo restaurante, paga-se pelo almoo uma quantia fixa dependendo da
b. A empresa gastar no mximo 3 salrios mninos com os estgios? escolha feita de prato e bebida. A carne de peixe tem I}Vo de preferncia,
c. Sabendo que gastou pelo menos 4, gastar menos de 7 salrios mnimos? enquanto frango tem 40Vo e carne bovina 50Vo. As trs escolhas de bebida
esto condicionadas opo do prato, segundo a tabela abaixo:
6. Uma varivel aleatria X tem a seguinte funo de distribuio:

Opo:Peixe Cerveia Agua Vinho


0 se r<-1;
P(Bebida Peixe) 0,4 0,3 0,3
0,2 se -1 1 r 12;
0,5 se 2(r15;
",rr: 0,7 se 5(r16; Opco: Frango Cerveia Azua Vinho
0,9 se6(r115; P(Bebida I Frango) 0,3 0,5 012

{ 1 se r)15. Opo:Bovina Cerveja Agua Vinho


Determine: P(Bebida I Bovina) 0,6 0'3 0,1
a. A funo de probabilidade de X.
b. P(x < -2). Admita os seguintes preos:
c. P(X < 2).
d.P(3<X<12). Bovina
Pedido Peixe Frango Cerveja Agua Vinho
e. P(X > 14).
Preo T2 l5 t8 6 J 9
7. Estatsticas de acidentes, num trecho da rodovia SP330, indicam probabilidade
de 0,05 de haver um acidente durante a madrugada (24 s 6 horas). Em ru. Dado que algum escolhe peixe, qual a probabilidade de que escolha
ocorrendo um acidente nesse perodo, a chance de gerar vtimas de 0,5. cerveja?
Ainda considerando o perodo acima, se acontece um acidente com vtima, ela ll. Se escolhe carne bovina, qual a probabilidade de tomar vinho?
ser fatal com probabilidade 0,1. o servio de ajuda aos usuriqs :utiliza 2 c. Sabendo que tomou gua, qual a chance de ter escolhido frango?
veculos na inspeo do trfego naquela rea. A esse nmero, acrescentamos tl. Determine a funo de probabilidade para cada uma das variveis X: preo
mais 2 se houver acidente. Se o acidente tem vtimas, acrescente aos anteriores do almoo e Y: preo do almoo para aqueles que preferem cerveja.
mais 2 veculos e, finalmente, acrescente mais 1 se a vtima for fatal. Encontre
a luno de probabilidade da varivel aleatria ntimero de veculos em servio l(1. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para
de auxlio nessa estrada durante a madrugada. rrrrra famlia com trs filhos, calcule a probabilidade de que:
a. Exatamente dois sejam do sexo masculino.
8. Em treinamento de animais, usa-se a repetio como estratgia de ll. Pelo menos um deles ser do sexo masculino.
aprendizagem. Num experimento, um macaco realiza certa tarefa corretamente, c. Todos serem do sexo feminino.
pela primeita vez, com probabilidade 0,5. Caso falhe, a probabilidade de
realizar corretamente na segunda tentativa cresce I\Vo, ou seja, a probabilidade lf . tJrn time paulista de futebol tem probabilidade 0,92 de vitria sempre que
, agora 0,55 e assim sucessivamente. Admita que o experimento termina em ioga. Se o time a\uar 4 vezes, determine a probabilidade de que vena
quatro tentativas ou antes, na primeira vez que o macaco acertar. Descreva o n. Toctas as 4 partidas.
comportamento probabilstico do nmero de tentativas. b. Exatamente 2 partidas
c. Pelo menos uma partida.
tl. No rnximo 3 partidas.
88 Captulo 3: Variveis Aleatrias Discretas .1,,1 lixerccios 89

e. Mais da metade das partidas. lS.Considere uma varivel aleatria Xassumindo os valores 0,1,2,...,5 e tal
clLre P(X : j) :/c x 0,8 x 0,2i, i : 0,L,2,...,5.
12.tJm certo equipamento expedido em lotes de 500 unidades. Antes que uma
remessa seja aprovada, um inspetor escolhe 5 desses equipamentos e os ir. Para qual valor de k a expresso acima uma funo de probabilidade?
inspeciona. Se nenhum dos equipamentos inspecionados for defeituoso, o lote lr. Calcule P(X :3 I X < 5).
aprovado. Se um ou mais equipamentos forem defeituosos, todos as unidades lr. Uma vacina contra a gripe eficiente em707o dos casos. Sorteamos, ao acaso,
so inspecionadas. Suponha que existam, de fato, dez equipamentos 20 dos pacientes vacinados e pergunta-se a probabilidade de obter:
defeituosos no lote. Utilizando uma suposio conveniente, qual , a ru. Pelo menos 18 imunizados.
probabilidade de que seja necessrio testar todos os equipamentos? b. No mximo 4 imunizados.
13. Suponha que um modelo terico para a varivel notas em um teste de histria c. No mais do que 3 no imunizados,
(X), dado por: 17. 25Vo dos universitrios de So Paulo praticam esporte. Escolhendo-se, ao
ilcilso, 15 desses estudantes determine a probabilidade de:
P(X: i1 : lj - 111
, j:0,7,2,...,10. a. Pelo menos 2 deles serem esportistas.
66
b. No mnimo 12 deles no serem esportistas:
Para 2l alunos submetidos a esse teste, apresentamos um resumo de suas c. Havendo mais de 5 esportistas no grupo, obtermos menos de 7 que praticam
notas: esporte.
Notas Freqncia Itl. As pacientes diagnosticadas com cncer de mama precocemente tm 80Vo de
0-2 6 probabilidade de serem completamente curadas. Para um grupo de 12 pacientes
2-4 10 lessas condies, calcule a probabilidade de:
:r. Oito ficarem completamente curadas.
4-6 5
ll. No serem curadas de 3 a 5 pacientes.
6F8 5 c. No mais de 2 permanecerem com a doena.
8 Ft10 1
19. A resistncia (em toneladas) de vigas de concreto produzidas por uma
clrpresa, comporta-se conforme a funo de probabilidade abaixo:
Um professor desconfia que o modelo no adequado. O que voc acha?
Resistncia
14. Um laboratrio estuda a emisso de partculas de certo material radioativo.
Seja l/; nmero de partcula; emitidas em I minuto. O laboratrio admite que
l/ tem funo de probabilidade Poisson com parmetro 5, isto , Admita que essas vigas so aprovadas para uso em construes se suportarem
pclo menos 3 toneladas. De um grande lote fabricado pela empresa,
P(.^/ : k) :;, --5 ^A k:0,7,2,.... cscolhemos 15 vigas ao acaso. Qual ser a probabilidade de:
a. Todas serem aptas para construes?
a. Calcule a probabilidade de que em um minuto no haja emisses de
ll. No mnimo 13 serem aptas?
partculas.
b. Determine a probabilidade de que pelo menos uma partcula seja emitida em 2{). Ern momentos de pico, a chegada de avies a um aeroporto se d segundo o
um minuto. rnodelo Poisson com taxa de 1 por minuto.
c. Qual a probabilidade que, em um minuto, o nmero de partculas emitidas ru. Determine a probabilidade de 3 chegadas em um minuto qualquer do horrio
esteja entre 2 e 5 (inclusive)? de pico.
90 Captulo 3: Variveis Aleatrias Discretas 3,4 Ii.rerccios 91

b. se o aeroporto pode atender 2 avies por rninuto, qual a probabilidade de 24, Considere uma varivel aleatria X - G (0,8). Construa uma nova varivel
haver avies sem atendimento imediato? )/ tal que Y : X para os valores 0,1,2,...,5 e Y : 6 para X ) 6. Dessa
c. Previses para os prximos anos indicam que o trfego deve dobrar nesse rrma, Y corresponde ao truncamento de X a valores menores ou iguais a 6.
aeroporto, enquanto que a capacidade de atendimento poder ser no ( )btenha a funo de probabilidade de Y e calcule:
mximo ampliada em 50vo. como ficat a probabilidade de espera por r. P(Y :2).
atendimento?
b. O valor da funo de distribuio (acumulada) no ponto 2,5.
21. IJma indstria de tintas recebe pedidos de seus vendedores atravs de fax, c. P(Y :
3lY < 5).
telefone e Internet. o nmero de pedidos que chegam por qualquer meio (no d.P(Y>3eX<8).
horrio comercial) uma varivel aleatria discreta com distribuio Poisson
25. A durao (em centenas de horas) de'uma lmpada especial segue o modelo
com taxa de 5 pedidos por hora.
Ceomtrico com parmetro t :0,7. Determine a probabilidade da lmpada:
a. Calcule a probabilidade de mais de 2 pedidos por hora.
rr. Durar menos de 500 horas.
b. Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50
b. Durar mais de 200 e menos de 400 horas.
pedidos?
c. Sabendo-se que vai durar mais de 300 horas, durar mais de 800 horas.
c. No haver nenhum pedido, em um dia de trabalho, um evento raro?
rl. O item anterior uma aplicao de um resultado geral vlido para o modelo
22. No estudo do desempenho de uma central de computao, o acesso unidade Geomtrico. Assim, mostre que para X - G (p) e quaisquer nmeros
central de Processamento (cPU) assumido ser poisson com 4 requisies inteiros positivos rn e n,vale P(X > m * nlX > m) = P(X > n).
por segundo. Essas requisies podem ser de vrias naturezas tais como:
imprimir um arquivo, efetuar um certo clculo ou enviar uma mensagem pela 2r. l}n um estudo sobre o crescimento de jacars, uma pequena lagoa contm 4
cxemplares de espcie A e 5 da espcie B. A evoluo de peso e tamanho dos 9
Internet, entre outras.
a. Escolhendo-se ao acaso um intervalo de 1 segundo, qual a probabilidade .iacars da lagoa acompanhada pelos pesquisadores atravs de capturas
pcridicas. Determine a probabilidade de, em trs jacars capturados de uma
de haver mais de 2 acessos cPU? E do nmero de acessos no ultrapassar
vcz, obtermos:
5?
ru. Todos da espcie A.
b. considerando agora o intervalo de 10 segundos, tambm escolhido ao acaso,
b. Nem todos serem da espcie B.
qual a probabilidade de haver 50 acessos?
c. A maioria ser da espcie A.
23. Toda manh, antes de iniciar a produo, o setor de manuteno de uma
27, Un livreirodescuidado mistura 4 exemplares defeituosos junto com outros 16
indstria faz a verificao de todo o equipamento. A experincia indica que em
pcrfeitos de um certo livro didtico. Quatro amigas vo a essa livraria para
95vo dos dias tudo est bem e a produo se inicia. caso haja algum problema,
cornprar seus livros escolares.
uma reviso completa ser feita e a indstria s comear a trabalhar aps o
ir. Calcule a probabilidade de 3 levarem livros defeituosos.
almoo. Faa alguma suposio adicional que julgar necessria e respond:
ll. Qual a probabilidade de, aps a visita dessas meninas, restarem o mesmo
a. Qual a probabilidade de demorar 10 dias para aprimeira reviso completa?
nmero de defeituosos na livraria? E de no restar nenhum?
b. E de demorar pelo menos l5 dias?
c. um esquema de manuteno, com reviso preventiva, est sendo montado 2ll. (Use o computador) Para os dados apresentados na Tabela l.l no Captulo l.
de modo a evitar a reviso completa num dia aleatrio. Deterrrine um dia d, l. Construa a tabela de freqncias para a varivel Exer, horas de atividade
tal que probabilidade de quebra alm de d seja pelo menos igual a 0,6. i'sica por semana.
Revisando conr intervalos de d dias, o que estaremos garantindo? b. Suponha que 5 pessoas so selecionadas ao acaso. Qual a probabilidade de
que 3 delas pratiquem, pelo menos, 6 horas de atividade fsica por semana?
92 Captulo 3: Variveis Aleatrias Discretas

c. Repita o item (b) calculando a probabilidade de todas as pessoas escolhidas Captulo 4


praticarem pelo menos 6 horas de atividade fsica.

29. (Use o computador) Considere a varivel altura apresentada na Tabela 1.1, Medidas Resumo
Captulo 1.
a. Crie uma varivel lj assumindo o valor 1 se a altura do indivduo e for
maior que a mdia de altura da populao (indivdu os altos) e 0 caso
contrrio (indivduos baixos). Apresente a distribuio de freqncia para 4.1 Introduo
esta varivel e uma representao grfica adequada. Neste captulo, vamos apresentar algumas medidas que buscam sumarizar
b. Suponha que 13 alunos vo ser sorteados com reposio e a cada
um deles s informaes disponveis sobre o comlortamento de uma varivel. podemos
ser associada uma varivel V, ,i:1, ..., 13. Defina X: nmero de alunos del'inir essas medidas nos casos de ur.t cilnto de dados u de uma funo de
altos. Como voc expressaria X em termos das variveisY, i,: 1, ..., 13? prrrbabilidade de varivel aleatria. Apesar danatureza diferente de cada caso, as
c. Obtenhauma amostra de 100 valores da varivel X, isto , repita 100 vezes itcrtlidas tero a mesma interpretao, variando apenas na forma de serem
o sorteio de 13 alunos nas condies do item (b). Construa uma tabela de trlcu ladas.
freqncias. Lembremos que, no Captulo 1, tivemos a oportunidade de discutir
d. Qual seria o modelo de probabilidades adequado para as variveis Y;, Illg,ttrnas tcnicas para estudar e apresentar descritivamente quantidades na
'i : L,...,73? O modelo Binomial se aplica para X? Em caso afirmativo, peipulao, seja por tabelas de freqncias ou por grficos adequados. o conjunto
quais seriam os parmetros? Justifique suas resposta. (Uma boa idia tle dados com que trabalhamos poderia ser toda a populao ou apenas uma parte
calcular valores esperados e observados e coloc-los em um mesmo delir. J estudamos, no captulo anterior, que a representao de eventos de
grfico). lnlcrcsse pode ser feita atravs de variveis aleatrias discretas e definimos alguns
e. Assumindo que o modelo Binomial adequado para X: ntotlclos cuja ocorrncia na vida prtica mais comum.
i. Calcule P(X :7), P(X < 9) P(0 S X < 13). Nosso interesse caracterizar o conjunto de dados atravs de medidas que
"
ir'. Qual a probabilidade de pelo menos 4 alunos serem baixosT E de fsstlllim a informao, por exemplo, representando a tendncia central dos dados
mais de 7 e menos do que 12 alunos serem altos? gu ir rnaneira pela qual estes dados esto dispersos. Tais medidas tambm podem
FL'r' tlcfinidas para variveis aleatrias, permitindo caracteriz-las de forma
30. (Use o computador) Considere os dados do arquivo aeusp.txt descrito no
etrrclhante ao que feito para um conjunto de dados qualquer.
Exerccio 26, Captulo L
a. Para a varivel Temposp, construa uma tabela de freqncia com faixas de
tamanho 10, a partir dq zero. Obtenha o histograma correspondente e 4.2 Medidas de Posio
discuta a adequao de algum modelo discreto a esses dados. Se estamos numa parada de nibus urbano e nos pedem alguma
b. Faa um histograma da varivel Resid. Verifique se o modelo Binomial com llr'orrnao sobre a demora em passar um determinado nibus, que diremos?
parmetros n: l0 e p : 0,5 seria adequado para representar o Nirrgtrrn imagina que poderamos dar como resposta uma tabela de freqncias
comportamento dessa varivel na populao. rltr(' l)acientemente coletamos no ltimo ms, ou ano! Tampouco, seria adequado
ttllt1'scltar um modelo terico pelo qual teramos ajustado o comportamento da
virrirvcl aleatria de interesse. Quem perguntou deseja uma resposta breve e
t,tllrirla que sintetize a informao que dispomos e no uma completa descrio dos
tlltrlos colctados ou da modelagem que porventura fizemos.

e3
94 Captulo 4: Medidas Resumo 1,) Madidas de Posio 95

Nesta seo, definiremos medidas de posio ot medidas de tendncia Notcr que o nmero de parafusos, em cada caixa, um valor inteiro, porm, a
central para um conjunto de dados qualquer (populao ou amostra) e, ento, Ftrlirr no precisa ser necessariamente um nmero inteiro, Para este exemplo,
consideraremos as correspondentes definies para variveis aleatrias. tclrros que, em mdia, as caixas contm 98,6 parafusos.
Colocando os dados em ordem crescente, obtemos: 95,96,97,98,99,99,
Definio 4./: Medidas de posio para um conjunto de dados 100, 100, 100 e 102. Neste caso, como o nmero de elementos no conjunto de
datlos 10, um nmero par, tomamos a mediana como sendo a mdia dos dois
Considere uma varivel X com observaes representadas por
Yhrrcs que ocupam a posio central. Temos
1,t2,... ,tn,. A mdia desse conjunto a soma dos valores dividida pelo nmero
total de observaes. Isto
: 99+99
,
ftrdrh, : 99.
n
D*u
Iohs:
rL+ir2*..,*rI, i:T E imediato que o valor mais freqente 100 e assim, mo,,1,. - L00. tr
n
As medidas de posio podem ser utilizadas em conjunto para auxiliar a
A mediana, representad a pot rnd,,6r, o valor que ocupa a posio central ndliso dos dados ou, em determinadas situaes, uma pode ser mais conveniente
dos dados ordenados. 6o rpr,: a outra. Por exemplo, se um ou mais valores so muito discrepantes do que
A moda dada pelo valor mais freqente e ser denotada po moobs. gerirl das observaes, a mdia ser muito influenciad.a por este valor, tornando-
Se houver possibilidade de confuso, faremos meno varivel X 1 nssirn, inadequada para representar aquele conjunto de dados. Se uma das
representando a mediana e a moda por md,,6r(X) e mo,,6r(X) tr lxirs ao invs de 95 tivesse 45 parafusos, a mdia passaria de 98,6 para 93,6.
NcFl('' cilso, como a mediana no afetada por valores discrepantes, seu uso seri0
Note que as definies acima tambm podem ser aplicadas quando o
ffiis irclcquado para representar os dados. Por outro lado, para conjuntos de dados
conjunto de dados j est organizado numa tabela de freqncia. Por exemplo,
ttr rrruitas observaes, a mediana difcil de ser calculada, uma vez que o
para a mdia temos
pfoccsso de ordenao custoso, mesmo com o uso de computadores. nindn
A:
Egtttrrrrr o aparecimento de distribuies multimodais, isto , conjuntos de dados
ntrt * n2r2 * "' I TT'xAt
Dr,.ru f-?'i
i:l
;
QE:-r possuem mais de uma, moda. Como regra geral, .precisamos usar essfls
rohs:
nt*"'lnk, n - 4n*" ffieclitlirs com o cuidado de no distorcer informaes e caractersticas dos dados
qu rlril iunos analisando.

k diferentes valores, ponderada


llm muitos casos, a varivel de iqteresse no observada diretamente e
e, assim, 7n6, pode ser pensada como a mdia dos
Unln lro do conjunto original de dados. Assim, pode ser necessrio considerar
pelas respectivas freqncias relativas de ocorrncia. De modo anlogo tambm
s vrrlorcs originais multiplicados ou acrescidos de constantes para produzir.um
podemos obter, atravs da tabelabe freqncia, a mediana e a moda.
lltivo corrjunto de valores. Nos prximos exemplos, estudamos como as medidas
Exemplo 4.1.. Suponha que parafusos a serem utilizados em tomadas eltricas so de grosiiro se alteram e veremos como podem ser obtidas a partir das respectivas
embalados em caixas rotuladas como contendo 100 unidades. Em uma construo, flterlirlirs do conjunto original.
10 caixas de um lote tiveram o nmero de parafusos contados, fornecendo os
valores 98, 102, 100, 100, 99,97,96,95,99, 100. Para essas caixas, o nmero
El'entplo y'.2.. Nas caixas de parafusos do Exemplo 4.1, vamos admitir um custo
de ,' p,rr paraso e de e pela embalagem da caixa. Desejamos calcular as medidas
mdio de parafusos ser dado por
ele lrtrsio clo custo total (T), definido como a soma dos custos dos parafusos c
dtt t'rrrlrirhgcm. Iniciamos, calculando as novas medidas de posio apenas pira o
ulttt lqttido por caixa (.L), isto , o custo dos parafusos contidos na caixa sem it
9() Captulo 4: Medidas Resumo 4,2 Merlidas de Posio

embalagem. Temos,
,,!0/l'
md'o1,"(X) : 75" + 76" I+2
9Bc f I02c *.'. * 100c 986 c t' .j'',
MdiadeL:lnbs: : 98,6 c. /'
10 10 : 1.
n"ff\P.To,,,(x)
Para a mediana segue que, Potlt scr de intese estudar o gasto dos alunos associado com as despesas do
stilrular. Para simplificar um pouco a situao, vamos supor que se atribui, para
mdr,6r(L) : 99c*99c :99c, du irluno, uma despesa fixa de R$ 1300, relativa preparao e mais R$ 50 para
Eeltr vcstibular prestado. De posse dessas informaes, vamos calcular as medldas

e, sern maiores dificuldades, moo65(L) : 100 c. Conclumos que a multiplicao e posio da varivel D: despesa com vestibular. Pela definio desta nova
;rcla constante c resultou em que as novas medidas de posio so as antigas QUnrrlirladc temos
nrultiplicadas por c. 50x
Vamosincluiragoraocustodaembalagem.Ascaixascustaro t! --
LCgt,, clo clculo que fizemos, vem imediatamente que
98c * e, L02c*e,..., 100 c+e.
oh.,:50 x 1,73 * 1300 :
Entro,

,,hs:
(9Bc + e) +... + (100c + e) _ 9B6c * 10e :98,6c * e.
md,o1,r(D) x 1,5 * 1300 : 1375;
10 10

Il fcil ver que para a mediana md"6,(T) : 99c * e e que para a moda, mo"1,"(D) : 50 x 1+ 1300 : 1350. fI
tno,1,"(T): 100c * e. Dessa forma, o acrscimo por uma quantidade e teve o fuenplo 4.4: l-lm estudante est procurando um estgio para o prximo ano. As
e'eito de somar essa mesma constante s medidas de po.sio. n Btttltrurlrias A e B tm programas de estgios e oferecem uma remunerao por
Iixemplo 4.3: Foram coletadas 150 observaes da varivel x, representando o lr,,r',,* semanais com as seguintes caractersticas (em salrios mnimos):
ttnlaro de vestibulares FUVEST (um por ano) que um mesmo estudante prestou,
Assim, foi observado que 75 estudantes prestaram vestibular FUVEST, uma nica Companhia A B
vcz, e assim por diante. Os dados esto na tabela abaixo: mdia )5 2,0
mediana T,7 1.9
moda 1,5 l,g
QUttl c.rrnpanhia mais adequada?
lrricialmente vamos discutir as informaes fornecidas, supondo que o
lttttlirrrtc tert seu salrio "escolhido" de acordo com uma poltica salarial
FcErrrrritlir na tabela anterior. A companhia tem 50vo dos seus estagirios
Calculando as medidas de posio de X, obtemos @r'elrrtttltl (: l,'7 salrios mnimos e o valor com maior freqncia de ocorrncia
, f ,t, ('rrro a mdia 2,5 deve haver alguns poucos estagiiios com salrio bem
Ix75t_2x47-t3x2I+4x7 : lltris irlo, isto , valor alto de salrio com freqncia pequena de ocorrncia. A
I $#t'l''' - Lr73;
150 Elrtlrttttltiit R tem as trs medidas bem prximas indicando umaazovel simetria
\' ltttr: slltrios altos e baixos. A opo do estudante depender de sua qualificao.
9, Captulo 4: Medidas Resumo 99
1,2 Al*lidas de Posio

Se ele for bem qualificado, deve preferir a companhia ,4, pois ter mais chance de
irlgurnas situaes, as desigualdades so satisfeitas por qualquer valor num
obter um dos altos salrios. Se tiver qualificao prxima ou abaixo dos outros
o intervalo e, nesse caso, tomamos a mediana como o ponto mdio do
cstudantes, deve preferir a B que parece ter uma poltica mais homognea de
salrios. tr A moda o valor (ou valores) da varivel que tem maior probabilidade de
vamos, agora, descrever algumas medidas associadas s variveis Egrt'ttcia, representando-a por Mo, temos
aleatrias eue, como j mencionamos, sero correspondentes s medidas
P(X : Mo) : max (P1, Pz,' ' ', Pn)' tr
apresentadas para um conjunto de dados.
sabemos que a descrio completa do comportamento da varivel 4.5: Considbre a varivel aleatria X com a seguinte funo discreta de
aleatria discreta , feita atravs da sua funo de probabilidade. Assim sendo,
razovel pensar que, qualquer que seja a quantidade destinada a resumir esse
comportamento, sua definio dever envolver, de alguma forma, essa funo de
probabilidade.
A medida mais popular o valor esperado, ou simplesmente mdia, el Enttts.
representa o ponto de equilbrio da distribuio de seus valores. Da mesma forma,
como mencionado no caso de um conjunto qualquer de valores, o uso do valor /,.= t i ipi: (- 5) x 0,3 * 10 x 0,2 * 15 x 0,4+20 x 0,1 :8,5.
esperado como sntese de toda a informao pode levar a distores e
interpretaes equivocadas. Em especial, possvel construir uma funo de A mrrrll o valor com maior probabilidade e, portanto, segue q1ae Mo: 15. Por
probabilidade, com valores da varivel muito diferentes uns dos outros, em que a ltnr lnclo, a mediana poder ser qualquer nmero entre 10 e 15, pois, para
rndia no caracteriza o real comportamento da varivel aleatria. A mdia junto P e I ttt, J.5], temos
com a moda e a mediana so medidas de posio ou de tendncia central e so
clefinidas a seguir.
P(X<b)>0,5 e P(X >b) >0,5.
Suponha que os possveis valores da varivel aleatria sejam Md:12,5 (ponto mdio do intervalo). tr
ftln c'orrveno adotada, tomamos
rcpresentados por tt, 12, . . . , t., com correspondentes probabilidades
'l)t,'l)2,',. ,Pk. O$serve que nem a mediana, nem a mdia precisam ser valores assumidos
peln vrrrirvel aleatria. No exemplo anterior, a mdia de X foi 8,5 e a mediana
De.finio 4.2: Medidas de posio para vardveis aleatrias discretas
13,i tpro so valores no assumidos pela varivel aleatria'
A mdia, valor esperado ol esperana de uma varivel X dada pela l)c modo similar ao ocorrido com as medidas de posio num conjunto de
cxprcsso: dcrl,rs, ir rnultiplicao ou a adio de constantes a uma varivel aleatriafaz com
gue suis medidas de posio fiquem multiplibadas ou acrescidas pelas mesmas
: Dr,

E(X) ou . Elllslitttlcs.
' i:L
Eremplo 4... Considere uma v. a. X com funo densidade discreta dada por
umer notao alternativa representar E(x) por px ou simplesmente p, se no
Itouver possibilidade de confuso.
A mediana o valor Md que satisfaz s seguintes condies
P(x > Md)>Ll2 e P(x < Md) > 1/2. Nnrr rl tlil'cil verificar que f/ : 10,3; Md : 8 e Mo : 5. Se uma nova varixelY
rrlrlitlir it partir de X atravs de Y : 5 X - 10, sua funo de probabilidade ser
100 Captulo 4: Medidas Resumo
4,2 Medidas de Posio 101

Ressaltamos que, no caso de conjunto de dados, usamos letras minsculas


pnrit denotar as referidas medidas, eniluanto, no caso de variveis aleatrias,
Ulilizamos letras maisculas. Como mencionamos, a interpretao feita de modo
o clculo das suas medidas de posio pode ser feito pela definio. Temos girnilar nos dois casos.

Fv : g x 0,1 * 15 x 0,3+... +90 x 0,2 : 4L,5)


Fxcrccios da Seo 4.2:
Md(Y) : 30, pois onico valorcom p(y > 30) > 0,5 e p(y < B0) ) 0,5; l. l)iscuta quais medidas de posio seriam mais adequadas para os conjuntos de
Mo(Y) : 15, pois o valor com maior probabilidade. dados abaixo. Comente suas escolhas.
tu. Esto disponveis dados mensais sobre a incidncia de envenenamento por
Estes mesmos resultados poderiam ser obtidos a partir das medidas de posio de picada de cobra. Deseja-se planejar a compra mensal de antdoto.
X multiplicadas por 5 e subtradas de 10. Isto , lr. O nmero dirio de usurios, entre 17 e 19 horas, de determinada linha de
nibus foi anotado. Pretende-se utilizar essa informao para dimensionar a
Fv:5x10,3-10:41,5; frota em circulao
Md(Y):5xB-10:30; c. Um fabricante de baterias deseja divulgar a durabilidade do seu produto e
coleta a informao sobre a durao de 100 de suas baterias.
Mo(Y):5x5-10:15. tl. Num vo internacional uma companhia serve dois tipos de pratos no jantar:
peixe ou frango. Um banco de dados contm os pedidos feitos nos ltimos 0

Esta propriedade facilita clculos e pode ser bastante til. tr i


200 vos. Pretende-se planejar o nmero de cada tipo a ser colocado
Na Tabela 4.1, apresentamos as expresses para as medidas de posio disposio dos passageiros.
para as duas situaes estudadas: conjunto de dados e varivel aleatria.
2, Vinte e cinco residncias de um certo bairro foram sorteadas e visitadas por um
l
cntrevistador que, entre outras questes, perguntou sobre o nmero de
Tabela 4.1: Medidas de tendncia cntral. tclcvisores. Os dados foram os seguintes:
l
2,2,2,3,7,2,1, 1, 1, 1, 0, 1, 2,2,2,2,3,r,1, 3, 1, 2,7,0 e 2. //
Orgirnize os dados numa tabela de freqncia e determine as divers as
rlc posio. ^eai#
I

.1. Ntrrn experimento, l5 coelhos foram alimentados com uma nova rao e seu
pcso avaliado ao fim de um ms. Os dados referentes ao ganho de peso (em I

r;uilogramas) foram os seguintes:


I

1,5; 1,6; 2,3;\7,7; !;5;2,0; L,g; I,8;2,7;2,L; L;9i \,8;i.!,7;2,5 e 2,2. f


n. Utilizando os dados brutos, determine mdia, moda e mediana desse
conjunto.
lr. Organize uma tabela de freqncia com faixas de amplitude 0,2 a partir de
1,5'
t02 103
Captulo 4: Medidas Resumo 4,. Medidas de DisPerstt

c. calcule, a partir da tabela de freqncia e com o ponto 'krdio como Ee rtumente os altos rendimentos de alguns residentes sero suficientes para fazer
representante de cada faixa, a mdia, a moda e a mediana. comente as trrclia atingir um patamar comparvel s melhores economias do
mundo, porm
diferenas encontradas com o item (a). e rliscrepnca entre os diversos valores deve ser muito grande. O que podemos
d. se ao invs de 15, fossem 500 coelhos, qual seria o procedimento mais cntrrr.esquecendo a variabilidade dos valores da varivel e isto no captado
conveniente: o de (a) ou o de (c)? Ter acesso a computador faz diferena? pelrr rnia e sim pelas medidas de disperso' Por exemplo, para o conjunto de
Vnl.,,'cs 0, 20 e 40 a mdia igual a 20. O mesmo acontece com o conjunto 20,
4. Sendo x
uma varivel aleatria com funo de probabilidade dada a seguir,
obtenha as medidas de posio 1t, Md e Mo. 30 c 20. Os dois conjuntos tm valores bem diferentes, apesar de terem a mesma
fltrliir. De fato, fctl construir exemplos onde dois conjuntos de dados distintos

a-.'' possuem medidas de posio idnticas. Em muitas dessas situaes existe


li'.r"no em relao disperso dos dados, isto , quanto maneira como os
Valer.cs de cada conjunto se espalham. A fim de quantificar tal aracterstica,
vtliuos definir algumas medidas de disperso'
5. Para cada item abaixo, construa uma_varivel aleatria que atenda as condies
indicadas. Dc,f'ittio 4.3: Amplitude de uma varidvel em utn coniunto de dados
. p: Md : Mo. A amplitude, referente a uma certa varivel, definida como a diferena
b. > Md.: Mo.
pr,
( -" lltr.c o maror e o menor valor do conjunto de dados. Ser denotada
por A. n
c.t-L < Md < Mo.
A amplitude s leva em conta dois valores de todo o conjunto e, assim,
er.iir mais cnveniente considerarmos uma medida que utilizasse todas
6. um atacadista recebede vrios fornecedores uma certa pea para revenda. A as
pea produzida com material de qualidade diferente e, portanto, tem custo ltscrvaes. Uma idia inicial considerar o desvio de cada observao em
diferenciado. Levando em conta a proporo fornecida e o preo apresentado felrriro a um ponto de referncia e ento tomar sua mdia. caso a observao
seja
por cada fabricante, pode-se admitir que o custo de uma pea em reais, nttrilr do que a referncia, o desvio seria negativo, caso seja maior, positivo' A
escolhida ao acaso, uma varivel aleatria (C). Admita a seguinte funo de Fqrrur cle tais desvios far com que termos de sinais diferentes se compensem,
probabilidade para C: p6tlcrrclo ocultar o efeito da variabilidade. Esta dificuldade discutida no exemplo
egtlir.

E,rttttplo 4.7: Numa classe com 12 alunos de um curso de ingls, os alunos


llrlir:itt'am o nmero de outras lnguas (alm do portugus e ingls) que tinham
Hlg,rrrla familiaridade. Os resultados ordenados foramos seguintes: 0;0,0,0,
a. Determine as medidas de posio davarivgl C. 1, 1,
b. Suponha que o atacadista revenda cada uma dessas peas acrescentando f , l, I ,2,2 e 4. Calculamos sem dificuldade a mdia e a mediana e obtemos
50% sobre o custo da pea, alm de um adicional de R$0,10 pelo frete. iT,,/,r . 13f 12 e md,,6* : L.
Calcule as medidas de posio davarivel preo de revenda. O desvio de cada observao em relao mediana obtido pela
ex;rlcssito ri - m(1o65. Para o conjunto de dados acima temos: -1, -1' -1, -1, 0,
4.3 Medidas de Disperso [], 0, 0, 0, ]-, 1 e 3. Se calculamos a mdia desses desvios obtemos 1/12'
Nultrrrr<ts que valores negativos e positivos se compensam, diminuindo a mdia
Apesar das medidas de tendncia central fornecerem uma idia do rlrs rlcsvis e dando a falsa impresso de pequena variao. Um caminho
trlcr.nirtivo seria tomar a mdia dos valores absolutos dos desvios acima, o
comportamento das variveis, elas podem esconder valiosas informaes. Essas que
medidas podem no ser suficientes para descrever e discriminar diferentes rllrrrrtttitttdo tlesvio mediano e definido por
conjuntos de dados. Por exemplo, um bairro nobre da capital paulista inclui umir
das maiores favelas de So Paulo. o que podemos dizer da renda mdia do bairro?
104 Captulo 4: Medidas Resumo 4,.1 Medidas de Disperso 105

A vantagem de usar essa expresso alternativa evitar a operao de subtrao,


desvio mediano :
iElni - md.o6,l : *
qrrc em muitos casos envolve decimais e torna-se muito trabalhosa.

Exemplo 4.8: No Exemplo 4.1, foram fomecidas as quantidades de parafusos em


uma outra maneira de calcular os desvios em relao mdia e, neste caso, a l0 caixas de um lote. Pelos valores observados, o maior nmero de parafusos foi
expresso a ser usada r,; - rotr. A soma desses desvios sempre d zero se o 102, ao passo que o menor foi 95. Logo, a amplitude ser dada por
clculo for feito sem arredondamento e, portanto, a mdia deles tambm sempre
zero. Dessa maneira, essa medida no seria nada informativa sobre a disperso
A--102-95:7.
das observaes. Entretanto, podemos tomar os valores absolutos obtendo o Para calcular a varincia, utilizamos o valor da mdia, 98,6; j,obtido no
desvio m,dio, que definido como a mdia dos valores absolutos dos desvios em te'crido exemplo. Para auxiliar nos clculos, podemos construir as tabelas abaixo.
relao mdia. Isto , tJlilizando a expresso da Definio 4.4, necessrio criar colunas com os
vrrlrrres ri - Tohs (*o - Tnt r)2, enquanto que a expresso alternativa requer
"12 b(
"
llpcnas uma coluna com os valores rf
- a \-
.
mdio:
desvio
L24lri-T"n''l: 6 ' D
I)efinio 4.4: i,,)lsi$ Alternativa:
ri'- /
\ri -I,'hs)'\., ri'
os desvios mediano e mdio utilizam a funo mdulo que, por suas
,L
1:; Tob, - L lLi
caractersticas matemticas, torna mais difcil o estudo de suas propriedades. I 98 - 0,6 0,36 1 98 9604
Definimos a seguir ua nova medida de disperso que iliza o quarado dos 2 r02 3,4 11,56 2 102 70404
desvios em relao mdia. L) 100 r14 1,96 .) 100. 10000
Definio 4.4: Vari,ncia e desvio-padro etn um conjunto de dados 4 100 L,4 1,96 4 100 10000
5 99 0,4 0,16 5 99 9801
A varincia, referente varivel x de um conjunto de dados, definida 6 97 - 1,6 2,56 6 97 9409
por
I 96 - 2,6 6,76 7 96 9276
aTl
l-.-
ver(,hs:: /-'
8 95 - 3,6 L2,96 8 95 9025
n,
) .(", -T,,t r)2 . ) 99 0,4 0,16 I 99 9801
l0 100 L,4 1,96 10 100 10000
Para manter a mesma unidade dos dados originqis, conveniente definirmos o total 40,40 total 97264
desvio-padro como sendo dpob,: var,n . se houver possibilidade de
f
confuso, faremos meno varivel X, utilizando a notao var,,6_(X). tr Scp,rrc da Definio 4.4 e da tabela correspondente que:
A expresso apresentada na Definio 4.4 auxilia o leitor na interpretao
1.\. \, :
da varincia como uma medida de variabilidade. Entretanto, possvel obter uma
expresso alternativa que facilita os clculos. Fica como exerccio ao leitor
vlr(,hs:
; L\",-
X:I
t1,6*)'
ff : n,on'
mostrar que:
lrt:lir cxpresso alternativa, temos
4'ILl
t _u
Vgfobs - v \--,
Q-t
*obs' 1.\
vctt'(il).\:- > .r" -ri,t^
-1 :- 97260 -:1nu,u;): n,on.
n,-' z=l 10
t0(t Captulo 4: Medidas Resumo 1,.1 4uliclas de Disperso 107

Naturalmente, qualquer que seja a expresso utilizada, o desvio padro dado por
Ee trtorlo anlogo, escrevemos
dpohr: JT,04:2,AI. n
Para o caso em que o conjunto de dados est organizado numa tabela de var,,6,(Y):
#
(7b x 502 +.'. + 7 x200\ -86,52 :1917,5i
freqncia, o clculo da varincia ser modificado de forma conveniente com a
ponderao dos desvios pelas respectivas freqncias. Aproveitamos o prximo I :rgr7,5.
exemplo para ilustrar essa situao, alm de discutir o efeito, sobre a varincia, da rttr,6,(D):
#
(75 x 13502 +...+7 x 15002) - 1386,52
multiplicao ou adio de constantes aos valores da varivel de interesse.
Note que a varivel D nada mais do que Y acrscido de 1300. No
Exemplo 4.9; No Exemplo 4.3, definimos a quantidade D, despesa no vestibular,
bliy(e, suas varincias so iguais, isto , o acrscimo de constante no alterou a
obtida a partir de x pela expresso D:50 x x*1800, com x indicando o
Crilrrcia. Esse resultado de certa forma previsvel, pois a adio ou subtrao
nmero de vestibulares prestados. Para efeitos didticos, antes de obter a
$g orrstante corresponde a uma translao dos valores dessas quantidades, no
varincia de D, vamos calcular a varincia de X e da quantidade auxiliar
ltet'ntrclo sua variabilidade relativa. Por outro lado, Y igual a 50 vezes a
Y:50 x x. Iniciamos por ampliar a tabela de freqncia de x, para incluir yt'irvcl X e sua varincia 502 vezes a varincia de X. Esse resultado se explica,
tambm os valores deY e D. Temos,
pgls l multiplicao por constante altera a distncia entre os valores da varivel
flgirrll e, pela frmula da varincia, o efeito ser pelo quadrado da constante. E
X Y D Tri
1 50 1350 75 E*emplo 4.10: O salrio de professores do ensino fundamental da rede privada
2 100 1400 47 Flri scrrclo estudado. A tabela abaixo apresenta os valores, em salrios mnimos,
btitlos em um levantamento numa certa cidade. Desejamos calcular a mdia e a
J 150 r450 2L
Vt'incia desse conjunto de dados.
4 200 1500 7

As mdias de X e D jforam calculadas no Exemplo 4.3 e a de Y segue Salrio freqncia


sem dificuldade. Assim, r,hs : I,73; y,,6-: 86,5 e ,,h, L 1386,5. Para calcular a 1F3 L4
varincia de X, via tabela de freqncia, adaptamos as expresses apresentadas 3F5 25
anteriormente obtendo:
5-7 1B

14 7-9 I
var,,6.(X): - r,,0,)'
#
-- " D",(*,
i:l
,
9F11 4
total 70
ou, na forma alternativa,
f-o1lo ir varivel est apresentada em faixas de valores, no temos os valores
_c
: el.livirnrente observados e, portanto, no podemos aplicar as frmulas da mdia e
Vafr,6r(X)
hD",", nohs'
rlrr virrirrcia. Para contomar essa situao e obter resultados aproximados para as
ttrt,rlirlas clesejadas, tomamos como representante de cada faixa seu ponto mdio.
Optando por utilizar essa ltima expresso temos o seguinte clculo:
['orrr cssit alternativa, o clculo feito nos mesmos moldes das variveis
1

var,,1,,,(X): (Tsxt2 *4T x22 +2r x 32 + r x +2)-r,TJ2 :0,767.


r,o
4,.1 Medidas de Disperso 109
t08 Captulo 4: Medidas Resumo

quantitativas discretas. Assim, , Se apenasa informao dos valores esperados, medianas e modas
ctitivesse disponvel, concluiramos por uma perfeita harmonia de desempenho
.5
:
ln
:
14x2+25 x 4+ ". *4 x 10
: elttrc os vrios mtodos. Entretanto, como podemos observar pelas distribuies
Iohs '(0 ) Tli.:xi 4,97. de probabilidade, esse no o caso. Por serem medidas de tendncia central, as
- 70
- trs rnedidas acima no captaram a variabilidade existente em cada mtodo. D
Para a varinpia: Como mencionamos para as variveis em um conjunto de dados, podemos
ter vrias maneiras de medir a disperso. Para o caso de variveis aleatrias
VQfohs :h'"*r -77,u":29,7I - 24',72: 4,99. vnrlos definir apenas a varincia, que a medida mais utilizada.

De.linio 4.5: Vartncia de uma varidvel aleatria discreta


Para um salrio mnimo de R$ 180, a mdia e a varincia dos salrios em reais
Seja X uma varivel aleatria com P(Xi - *n) : P,i,'i : L,2,... ,k e
seriam, respectivamente, 180 x 4,g7: 894,60 e 1802 x 4,gg: 161.676,00. tr
Itrdia p. A varincia de X a ponderao pelas respectivas probabilidades, dos
Vamos, agora, apresentar as medidas de disperso para variveis tlesvios relativos mdia, elevados ao quadrado, isto ,
aleatrias. Como j mencionamos no incio da so, as medidas de posio no k
"explicam tudo" que est acontecendo, seja num conjunto de dados ou com
variveis aleatrias. O prximo expmplo refora essa idia para o caso de
Var(X):
'
t (*, - p)' pu .

i:I'
variveis aleatrias.
Muitas vezes, denotamos a varincia por o2 e, se houver possibilidade de
Exemplo 4.11: llma pequena cirurgia dentria pode ser realizada por trs otuso, usamos o2r.Exttaindo araiz quadrada da varincia obtemos o desvio-
mtodos diferentes cujos tempos de recuperao (em dias) so modelados pelas tr
pulrto que representado por d ou ox.
variveis Xr, Xz e Xs. Admita que suas funes de probabilidade so dadas por
Exctnplo 4.12: Retomando o exemplo anterior, calculamos as varincias dos
10
tenrpos de recuperao para cada mtodo. Temos,
0,2 0,2 0,2 .
Wtr(X): (0- 5)2 x0,2+(4-5)2 x0,2 + "'+ (10-b)2 x0,2:10,40.
x, I 1 5 9
Pi I tls 113 rl3 l)e rrrodo anlogo, obtemos:
O valor 0 na varivel X1 pode ser interpretado como recuperao no mesmo dia Var(X2) : L0,67 e Var(X3): 0,60.
da cirurgia. Na tabela abaixo, apresentamos o valor esperado, a mediana e a moda
para cada uma das trs variveis. Vale ressaltar que a moda nem sempre nica e l)cssa brma, utilizando-se os mtodos 1 e 2 (variveis X1 e X2),teremos maior
para construir a tabela a seguir, escolhemos o valor 5 como representante dos vrrrinbilidade no tempo de recuperao. n
valores modais de X1e X2. A varincia definida
anteriormente pode ainda ser considerada como o
vrrlor csperado de uma nova varivel aleatria, o desvio ao quadrado. Isto ,
X1 X2 X3
valor esperado 5 5 5
Var(X):E[(X-p)2],
mediana 5 5 5
it rltrirl pode ser convenientemente reescrita na seguinte forma
moda 5 5 5
u0 Captulo 4: Medidas Resumo 1,, Medidas de Disperso IlI

Tabela 4.2: Medidas de disperso.


k
Var(X) : E(X\ - P2 : la,"? - ut'
i:L
Esta ltima expresso bastante til e, para no criar confuso, explicitamos os ',:ri;,ii I lll

u"lsf#'"!'li
seus termos. O termo E(Xt) o valor esperado da varivel leatria X2, ao passo
que p2 indica o quadrado do valor esperado de X. O prximo exemplo recalcula
'
:,'i;i;iiir,-:u^2,;t
as varincias do exemplo anterior, atravs da expresso acima. :. i tl'.:li!;!.?.

Exemplo 4.13: A partir das funes de probabilidade de X1,X2 e Xs ::. Varinci-,.;=


*: ::::::::::-r:.,, : r:l

apresentadas no Exemplo 4.11, obtemos ::: ::.:!;:::..:!..:l/a;U

llllllltlffi
j
:
un',;6;f1[ri:=
(nltcrhti.v,a),[
$Jr r-r,ip',.t,i;

x3 I r 25 81 x?l 16 2b 36
w"@
As funes de probabilidade acima foram obtidas a partir de operaes simples,
Tabela 4.3: Propriedades da mdia e da varincia.

rlf;\
-:i.' "4,::r
t

conjni oe naos
como por exempo,

P(X?: 16) : P(Xt -- 4 ou Xt : 4) : P(Xt : 4),

uma vez que X1 no assume valores negativos.


Temos ento que
i::i; , ,

E(x?) : 0 x *Y, ,i.fiffi


#,,
0,2 + 16 x 0,2 t"' + 100 x 0,2 :35,40.
Ento,
Vamos concluir esta seo apresentando, atravs de exemplos, os clculos
Var(X):35,4-* - 10,40. do vlrlor esperado e da varincia de alguns dos modelos tericos que foram
del'irr itlos no captulo anterior.
De modo anlogo, obtemos E(X :35,67 e n(X'zr) :25,60; resultando
emVar(X2) = 70,67 e Var(X3): 0,60. tr Et'ttttpltt 4.14: SejaX com distribuio Bernoulli de parmetro p. Temos

A Tabela 4.2 auxilia o estabelecimento da correspondncia entre as E(X):0x(1 -p)+Lxp:p e

medidas de disperso obtidas a partir de um conjunto de dados e aquelas 6\: 02 x Q - p) * L2 x p: p '


calculadas para variveis aleatrias. Em seguida, na Tabela 4.3, apresentamos um Lrrg,,, ir varincia
resumo das propriedades da mdia e da varincia discutidas at agora.
""rf
Var(X)-p-p2:p(t-p). tr
1t2 Captulo 4: Medidas Resumo 1,.1 l+4cdidas de Disperso 113

Exemplo 4.75: Para uma varivel aleatria X com distribuio Var(Y): E(Y\ - E'(Y)
parmetrosnep,temos k

E(x):IkP(x:k)
: i2P(Y : i)-
j:r
(ry)'
;:0

:ik, n'
(r- P)"-*
:iD,r- (+)'
?'"
A:I
(n-ub* .:J: L

_L k(k+r)(zk+7) _ (t + t)2
: k6
6-#@='Pk(1-P)'-k :- k2-L
(n - 1)!
n,
L)t
. nk_r (7\ - p)-' 12
''' 2 @-\r,k)t(k
s
- 1)!'
:1 Para se calcular o valor esperado e a varincia, no caso dos modelos de
Substituindo nesta ltima expresso, k-L por j e, em seguida n-I pot r Pglss<rn, Geomtrico e Hipergeomtrico, so necessrias tcnicas um pouco mais
obtemos rrdas. Optamos por no apresent-las aqui, tendo em vista o objetivo desse
EXto c, para o leitor interessado, indicamos o livro de Mood, Graybill e Boes
E(x) - "e'F_(,) r, e - p)' -i : np, lq7q. Na Tabela 4.4 apresentamos os valores esperados e as varincias para
telos os modelos discutidos no captulo anterior.

uma vez que a somatria igual a 1, pois corresponde a somar todas Tabela 4.4: Modelos discretos- valor esperado e varinca.
probabilidades de uma varivel Binomial com parmetros r e p'
A varincia ser calculada mais facilmente no prximo captulo, qua tffii1,///,//rij"l;,.?.*.-tF.

apresentaremos propriedades da varincia da soma de variveis a Varivel Diiciet';


independentes. Por ora, s informamos que seu valor nplL - p)'
/ji;..!. ... .........:.:;....-. - : ;;
wffi"',
Exemplo 4.16: Considere a varivel aleatria Y com modelo Uniforme
entre os valores I e k. Aplicando a definio de esperana matemtica ;-.
utilizando a conhecida expresso para a soma de uma progresso aritmti )( r:
r! !.!l$nN! !i:!1
b)ii
iii:l:::

temos
k:k k+7 _:::h6 :

E(Y):Lipv : :Di k
L
>,t:
'"
,
t x|| I LLtt\\\riti

sffi\,wqry
j:1 j:1 .:i=t ls,::l:;;,:: :I

Para calcular a varincia usaremos o seguinte resultado de soma de sries:


Ws'..14)! r.

"riltii;it
k 'W"{"/"K,2/'r'*?t:;i-z7:titi

D/:
.:i:r
k (k + L)(zk + L)

ento,
il4 Captulo 4: Medidas Re
4,4 li.rtrccios t15

Exerccios da Seo 4.3:


.jogador ganhou menos o pagamento inicial (prejuzo ' lucro negativ.o).
l. Voc est indeciso em comprar uma televiso e decide avaliar a l)ctermine mdia, moda, mediana e varincia dessa varivel.
informaes estatsticas, fornecidas pelo fabricante, sobre a durao (e
lroras) do tubo de imagem. 6. Nrrma certa cidade, o nmero de crianas em idade escolar, em famlias com 4
f ilhos, uma varivel aleatria modelada pela Binomial com parmetros n : 4
Marca da TV GA EB HW c 1r: 0,6. Para cada filho em idade escolai, um projeto de apoio educao
Mdia 8000 8200 8000 prrga 1 salrio mnimo para a famlia. Calcule a mdia e a varincia do custo
Mediana 8000 9000 7000 rlcsse projeto por famlia. ,-
Desvio Padro 600 1500 2500 e ---'t'
Com que marca voc ficaria? Justifique. 4.4 Exerccios
2. A pulsao de 10 estudantes no incio de uma prova de estatstica?am l, tlrrr certo cruzamento tem alto ndice de acidentes de trnsito, conforme pode
scr constatado em uma amostra dos ltimos 12 meses: 5,4,7, B, 5, 6, 4,7, g,
)86. Calcule a mdia a uurin"iu O"rr" 7, 6 e B. Determine a mdia e a varincia do nmero de acidentes mensais
" "". rrcsse local.
3. Num estudo sobre consumo de combustvel, 200 automveis do mesmo ano
modelo tiveram seu consumo observado durante 1000 quilmetros. l. listudando uma nova tcnica de sutura, loram contados os dias necessrios para
infbrmao obtida apresentada na tabela abaixo em km/litro. ir completa cicatrizao de determinada cirurgia. Os resultados de 25 pacientes
lrlam os seguintes: 6, 8,9, 7,8,6,6,7,8,9,10,7,8, 10,9, 9,9,7,6,5,7,7,8,
Faixas Freqncia
l0 e I 1. Organize os dados numa tabela de freqncia e calcule a mdia e a
7F8 27 (-_:,. virrincia.
8F9 29
, IJrna amostra de vinte empresas, de porte mdio, foi escolhidapata um estudo
9F10 46 sobre o nvel educacional dos funcionrios do setor de vendas. Os dados
10 F 11 43 coletados, quanto ao nmero de empregados com curso superior completo, so
11 F 12 55 rrpresentados abaixo.

Detennine o desvio padro do consumo. Empresa 1 2 t


d 4 5 6 7 8 I 10 11
t
No. Funcionrios 1 0 0 r) 0 L I 2 2 2 0
4. Nurn certo bairro da cidade de So pauro, as companhias de seguro
cstabeleceram o seguinte modelo para o nmero de veculos furtados por
Empresa 72 13 14 15 16 t7 1B 19 20
sclnani: t
No. Funcionrios 2 0 2 0 2 2
purtosl_o.
_1_ 2 J n t"
\.
1 1 L)

ru.Organize uma tabela de freqncia e calcule mdia, moda e mediana.'


b. Determine o desvio padro.
calcule a mdia e a varincia do nmero de furtos semanais desse bairro.
c. As empresas pretendem incentivar o estudo dos seus funcionrios
5. Nunr jogo de dados, umjogador paga R$ S puralanar um dado equilibrado e o'erecendo um adicional de 2 salrios mnimos para cada funcionrio com
ganha R$ 10 se der face g, ganha R$5 se der face 5 e no ganha nda as curso superior. Qual ser a despesa mdia adicional nessas empresas?
outras faces. Defina a varivel luro por jogadacomo sendo o saldo do"o* que o .1. As notas finais de estatstica para alunos de um curso de Administrao foram
e irs scguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5,6, 4,6,6,3, 8, 4, 5, 4, 5, 5 e 6.
il Captulo 4: Medidas R 4.4 li.rarccios t17

a. Determine a mediana e a mdia.


l)aciente 27 22 23 24 25 26 27 28 29 30
b. Separe o conjunto de dados em dois grupos denominado s aprovados, 206 206 217 214 2IB
Colesterol 203 205 208 209 225
nota pelo menos igual a 5, e reprovados para os demais. Compare
varincia desses dois grupos. n. (lllcule a mdia, a moda, a mediana e a varincia a partir da tabela de dados
llrutos.
5. um lrospital maternidade est planejando a ampliao dos leitos para rec
nascidos. Para tal, fez um levantamento dos ltimos 50 nascimentos, obtendo
b. ( )r'ganize os dados em uma tabela de freqncia com faixas de tamanho de
informao sobre o nmero de dias que os bebes permaneceram no h l0 a partir de 160.
e, l{cra o item (a) usando a tabela de freqncia obtida em (b).
antes de terem alta. os dados, j ordenados, so apresentados a seguir: 1, 1,
al. (lomente as diferenas encontradas entre os valores das medidas calculadas
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4,
4,4,4,4,5,5,5, 5, 5, 5,6,7,7, g e 15. crn (a) e (c).
n. Organize uma tabela de freqncia. , o tcrnpo, em horas, necessrio para um certo medicarnento fazer efeio
b. Calcule mdia, moda e mediana. Itplcscntado abaixo:
c. Determine o desvio padro.
0,2r 2,71 2,12 2,81 3,30 0,15 0,54 3,r2 0,80 1,76
d. Dentre as medidas de posio calculadas em (b), discuta quais delas seri
1,I4 0;16 0,31 0,91 0,18 0,04 l,16 2,16 I,48 0,63
mais adequadas para resumir esse conjunto de dados.
c. voc identifica algum valor excepcional dentre os que foram observados, H. ( lllcLrle a mdia e a varincia para o
conjunto de dados.
Se sim, remova-o e recalcule os itens (a) e (b). Comente as difr b. (bnstrua uma tabela de freqncia para classes com amplitude de 0,5 hora,
encontradas. corneando do zero.
6. o departamento de atendimento ao consumidor de um concessionria f. Suponha que o conjunto original de dados foi perdido e s dispomos da
tirbcla construda em (b). Utilizando alguma suposio conveniente,
veculos recebe, via telefone, as reclamaes dos clientes. o nmero
rcrculcule a mdia e a varincia e comente as possveis diferenas
clramadas dos ltimos 30 dias foram anotados e os resultados foram: 3,4,5,
cncontradas.
4, 5, 6, g, 4, 4, 5, 6, 4, 3, 6, 7, 4, 5, 4, 5, 7, g, g, 5, 7, 5, 4, 5, 7 e 6.
a. Construa uma tabela de freqncia.
1 Ertrrrlirnclo-se o nmero de acertos em 100 lances-livre de bola ao cesto, uma
b. Calcule a mdia e o desvio padro. $uros(r'a com 20 jogadores forneceu os seguintes resultados: 68,73, 61, 66,96,
c. Admitindo que cada telefonema acarreta servios sob a garantia avali ft), (t5,86, 84, 79,65,78,78,62,80,67,75,88, 75 e 82. Agrupe as
em R$ 50 por chamada, calcule a mdia e o des.rio padro das obsr:r'vaes em intervalos de comprimento 5 a partir de 60 e, usando alguma
oriundas do atendimento ao consumidor. Irrgrosiiro adicional, determine a mdia e a varincia do nmero de acertos em
l(10 irllcmessos.
7. lioram anotados os nveis de colesterol (em mg/l00m1) para trinta pacientes
urna clnica cardaca. As medidas se referem a homens entre 40 e 60 anos 10. t I Sindicato dos Engenheiros do Estado de So Paulo est estudando o
idade que foram clnica fazer um check-up. irrrgrircto do estgio na obteno de bons empregos. Dentre os engenheiros
.) a'r'r'd'ru 'ormaclos e com empregos considerados bons, foi sorteada uma aostra
Paciente 1 2 d 4 5 6 I 8 I 10 c' olrscrrvado o nmero de anos de estgio anteriores formatura.
Colesterol 160 160 161 170
163 167 172 172 173 177 $, ('irlculc a mdia e a varincia.
Paciente 11 T2 13 74 15 16
It- l'irnr cl'eito de anlise, decidiu-se desprezar os valores que se distanciassem
T7 1B 19 20
Colesterol 178 181 181 782 185
tlir rndia amostral por mais de dois desvios-padro, isto , s sero
186 194 797 199 203
crrrrsiclcrados os valores no intervalo fronr* 2 dponr. Recalcule o item (a) e
corncntc os resultitdos.
il8 Captulo 4: Medidas Resumo
1,.1 Exerccios 119

Anos de estgio freqncia Interrupes freqncia


0 25 t2
0
1 5B 1 t4
2 t47 2 I
,
r) i05 .) I
4 72 t
4 d
5 45 5 3
6 10 2
6
total 462 total 50

ru. Determine a mdia e a varincia do nmero de interrupes semanais.


11. Na linha de produo de uma grande montadora de veculos, existem 7
b. O Governo Federal aplica uma multa de 10 mil reais por semana, se h pelo
verificaes do controle de qualidade. Sorteamos alguns dias do ms e
menos uma interrupo no fornecimento. Calcule a mdia e a varincia do
anotamos o nmero de "OKs" recebidos pelos veculos produzidos nesses dias,
valor das multas aplicadas por semana.
isto , em quantos dos controles mencionados o automvel foi aprovado.
c. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios
Aprovaes freqncia setores, decorrentes da falta de energia e atribuiu um valor total de 900 mil
4 L26, reais para ser ressarcido pela companhia responsvel pelo fornecimento de
5 359 eletricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo
6 1685
mdio por semana?
7 4764
rl. Nesse perodo, qual ser a mdia e a varincia do desembolso semanal da
companhia, incluindo multa e ressarcimento de prejuzo?
total 6934
l.l. O Centro Acadmico de uma faculdade pretende iniciar uma campanha junto
a. Determine mdia, moda e mediana do nmero de aprovaes por automvel
direo da escola com vistas melhoria das salas de informtica. Para tal, fez
produzido. o
e
uma enquete com todos os alunos perguntou sobre nmero de
tr. Calcule a varincia.
computadores que cada um tinha na sua residncia.
c. crie uma nova varivel Reprovaes, indicando o nmero de verificaes
no "OKs" no veculo. Determine mdia, moda, mediana e varincia dessa Computadores freqncia
varivel. 0 156
d. Cada reprovao implica em custos adicionais para amontadora, tendo em 1 135
vista a necessidade de corrigir o defeito apontado. Admitindo um valor 2 47
bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia e a t 25
t)

varincia da despesa adicional por automvel produzido. 4 B

12. O rgo do Governo Federal encanegado de fiscalizar a distribuio de total 37L


energia eltrica tem acompanhado o nmro semanal de intemrpes de
a. Obtenha a mdia e a varincia.
fornecimento numa certa cidade. Os dados, referentes s ltimas 50 semanas,
b. O Centro Acadmico argumenta qe o ideal ter uma mdia de 1
consideraram apenas as interrupes que ultrapassaram 3 horas e so
cornputador por tluno, .iuntando os 20 da sala de informtica da faculdade
apresentados na tabela abaixo.
H8 Captulo 4: Medidas Re lixerccios 119

Anos de estgio freqncia Interrupes freqncia


0 25
0 12
1 5B
I T4
2 747
t
2 I
e) 105 t
t) I
4 72 t
4 J
5 45 t
5 r)
6 10
6 2
total 462 total 50

tt. l)etermine amdia e a varincia do nmero de interrupes semanais.


1L.Na linha de produo de uma grande montadora de veculos, existem, It. O Govemo Federal aplica uma multa de 10 mil reais por semana, se h pelo
verificaes do controle de qualidade. Sorteamos alguns dias do ms
rlenos uma interrupo no fornecimento. Calcule a mdia e a varincia do
anotamos o nmero de "oKs" recebidos pelos veculos produzidos nesses d
valor das multas aplicadas por semana.
isto , em quantos dos controles mencionados o automvel foi aprovado.
e. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios
Aprovaes freqncia sctores, decorrentes da falta de energia e atribuiu um valor total de 900 mil
4 726 rcais para ser ressarcido pela companhia responsvel pelo fornecimento de
5 359 clctricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo
rrrdio por semana?
6 1685
I 4764 d. Ncsse perodo, qual ser a mdia e a varincia do desembolso semanal da
companhia, incluindo multa e ressarcimento de prejuzo?
total 6934
() (-lentro Acadmico de uma faculdade pretende iniciar uma campanha junto
a. Determine mdia, moda e mediana do nmero de aprovaes por au
rlirco da escola com vistas melhoria das salas de informtica.Parata\ fez
produzido.
ullir enquete com todos os alunos e perguntou sobre o nmero de
b. Calcule a varincia.
ornllutadores que cada um tinha na sua residncia.
c. Crie uma nova varivel 'Reprovaes, indicando o nmero de veri
no "OKs" no veculo. Determine mdia, moda, mediana e varrancla Computadores freqncia
varivel. 0 156
d. Cada reprovao implica em custos adicionais para a montadora, tendo 1 135
vista a necessidade de corrigir o defeito apontado. Admitindo um 2 47
bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia 3 25
varincia da despesa adicional por automvel produzido. 4 B

12. O rgo do Governo Federal encarregado de fiscalizar a distribuio total 37r


energia eltrica tem acompanhado o nmero semanal de interrupec
n, ( )lrtcnha a mdia e a varincia,
fomecimento numa certa cidade. Os dados, referentes s ltimas 50
consideraram apenas as interrupes que ultrapasszrram 3 horas I
b. ( ) Centro Acadmico argumenta qe o ideal ter uma mdia de 1
c'onrputador por aluno, juntando os 20 da sala de informtica da faculdade
apresentados na tabela abaixo.
t20 Captulo 4: Medidas Resumo 4.,1 lixerccios 121

com os que os alunos tm em casa. Quantos computadores precisariam ser 10. Uma pea produzida por uma mquina pode receber do controle de qualidade
acrescentados sala para atender o Centro Acadmico? lrs classificaes: boa, defeituosa ou recupervel, com as seguintes
14. Duas moedas esto sobre a mesa, uma delas tem duas caras e a outra tem probabilidades, 0,5; 0,2 e O,3, respectivamente. Suponha que sejam vendidas a
probabilidade igual de cara e coroa. Sorteamos, ao acaso, uma dessas moedas e l$ 100, R$ l0 ou R$50 conforme forem boas, defeituosas ou recuperveis,
a lanamos duas vezes. Seja X a varivel aleatria que conta o nmero de rcspectivamente. Se duas peas, escolhidas ao acaso, so vendidas, qual o
caras nesses dois lanamentos. Qual a mdia de X? vtlor mdio da venda?

15. Num teste de digitao, o tempo em minutos (7) que os candidatos le 2(1. O tempo de durao em horas de uma lmpada especial foi modelado por uma
para digitar um texto modelado, de forma aproximada, pela seguinte fun vlrivel aleatria X com a seguinte funo de probabilidade:
de probabilidade:
xl5 6 7 8910
pi l0,L 0,1 0,2 0,4 0,1 0,1

O candidato recebe 4 pontos se terminar a digitao em 9 minutos, 5 (lacla lmpada custa ao fabricante R$ 10, mas se sua durao for inferior a 6
terminar em 8 minutos e assim por diante. Determine amdia e a varincia Iroras ele se compromete a indenizar o comprador com R$ 15. Qual deve ser o
nmero de pontos obtidos no teste. prco de cada lmpada para o fabricante obter um lucro mdio por lmpada de
l.$ 20?
16. A funo de probabilidade da varivel X P(X:. k) : r/5
k :7,2,"',5.Calcule E(X) e E(X') e, usando esses resultados, determi 11. tlrna concessionria tem disponvel, para um certo automvel, os modelos S,
E[(X + 3)2] evar(3x - 2). ('1, c GL com duas verses de combustvel, lcool ou gasolina. Com motor a
rilcool os preos so 30, 35 e 40 mil reais para os modelos S, CL e GL,
17. Estatsticas obtidas junto s assistncias tcnicas indicam que a bomba rrspcctivamente. Esses preos so 107o superiores se o combu3tvel for
gua de uma certa lavadora s pode apresentar defeitos aps 4 anos de g,rrsolina. A procura por carros a lcool , de 307o e a gasolina 707o. Qualquer
Admita que nos prximos 6 meses, aps esse tempo, um mal funcioname tlnc seja o combustvel escolhido h igual preferncia entre os modelos.
tem probabilidade 0,10 de ocorrer e, caso ocorra, ter 0,5 de probabilidade ('irlcule a funo de probabilidade do preo desse automvel e obtenha sua
ser recupervel. O reparo, que s pode ser feito uma vez, tem o preo de R$ I
Irrrlia e varincia.
enquanto uma bomba nova custa R$ 30. Determine a mdia e a varincia
gasto com essa pea em 4,5 anos de uso. ,2, Nurn cassino, um jogador lana dois dados, cujas probabilidades so
lrroporcionais aos valores das faces. Se sair soma 7, ganha R$50, se sair soma
It. Os alunos do curso de estatstica tm um time de futebol que no I l, ganha R$ 100 e se sair soma 2, ganha R$ 200. Qualquer outro resultado ele
melhores. O cartola que administra o time paga um prmio de vitria rriio garrha nada. Qual o ganho mdio do jogador?
partida de um sorvete porjogador, acrescentando mais um sorvete por saldo
gols maior que I (saldo de gols a diferena entre gols feitos e sofri l-1. I lrrra indstria pretende comprar 3 lotes de peas que so produzidas por dois
Admita que a funo de probabilidade dos diversos saldos a seguinte: lrlrrcccdores, A e B. Ela inicia, comprando de um dos fornecedores escolhido
n(l ilciso e, se ficar satisfeita com o material entregue, compra o prximo lote
Saldo de gols
rhr nrcsmo fornecedor. Se no ficar satisfeita, troca o fornecedor. Admita que
lrirlir cacla lote o ndice de satisfao de 80Vo e de 707o para A e B,
rrspcctivamente. Calcule a mdia e a varincia do nmero de lotes fornecidos
Qu"rl a despesa mdia do cartola com cada jogador por partida? E corn os I
"c rilques" ?
por A.
122 Captulo 4: Medidas Resumo 4,4 lixerccios t23

24. A experincia de diversas companhias de resgate de navios naufragados indica vcz. se o ganho acumulado da equipe (em milhares de reais) , 50c , sendo c o
que a probabilidade de um resgate ser bem sucedido na primeira tentativa de rrrimero de corridas completadas por esse motor antes de quebrar, calcule:
0,6; caindo para a metade a cada nova tentativa. Uma empresa de resgate tem 1. Qual a probabilidade da equipe completar 8 corridas? E de participar de B

como norma no realizar mais de trs tentativas e cobra 50 mil reais para corridas?
iniciar os trabalhos e mais 10.000 x (k - 1) reais, com k sendo o nmero de [. Quanto receber em mdia essa equipe durante sua "vida" em corridas?
tentativas.
a. Qual o custo mdio dos servios dessa empresa?
19. tlrn vendedor de cachorro quente trabalha na porta do Estdio do Morumbi
errr clias de jogo. Ele pode deixar preparado 5, 6 ou 7 dzias de sanduches que
b. Se um navio resgatado pode render ao proprietrio 65 mil
(:lstam a ete R$ 5 adzia,. Sabe-se que a procura do cachorro quente (X), no
interessante para ele contratar essa empresa? Justifique.
s!u ponto, uma varivel aleatria com a seguinte funo de probabilidade:
25. Suponha que a demanda por certa pea, numa loja de autopeas, siga o
seguinte modelo:

: P(X: k,):+, tt:r,2,J,4. Sirbo-se que cada dzia de sanduche vendida a R$ 12 e os sanduches no
Vcrrrlidos vo para um canil que paga R$ 2 pela dzia. Qual o nmero de
eltiz,ias de sanduches que devem ser preparadas de modo a maximizar o lucro
a. Encontre o valor de a.
nrrlio do vendedor?
b. Calcule a demanda esperada.
c. Qual a variabilidade da demanda? floricultura vende rosas, cravos e jasmins com lucrO de, respectivamente,
t.lrrra
R$ ltl, R$ 12 e R$ 15 por dezena. Observa-se que a procura igual para as trs
26. Numa indstria farmacutica, uma mquina produz 100 cpsulas por minuto,
flolcs. Se o estoque do dia no for vendido, a floricultura tem um prejuzo
A mquina est regulada de modo que no mximo 5Vo das cpsulas n (lrrcro negativo) de, respectivamente, R$ 5, R$7 ou R$ 10 com cada'dezena de
contenham remdio e, assim, sejam consideradas defeituosas.
fosils, cravos ou jasmins. Se a floricultura dispe de duas dezenas de cada flor
a. Se as cpsulas so acondicionadas em vidros com 20 unidades, qual tr's clientes visitam a floricultura sucessivamente e compram uma dezena
probabilidade de um vidro apresentar no mximo 2 cpsulas com defeito?
nrlir um. Fazendo alguma suposio adicional que seja conveniente, determine
b. Qual o nmero esperado de cpsulas com defeito, por vidro? s lrrcro esperado da loja.
c. Qual o nmero esperado de cpsulas com defeito por minuto de produo?
,t{t pita o problema anterior, se a procura por rosas e cravos forem iguais e
27. Um fotgrafo negocia com o jornal o seguinte trato: ele submete al orrcsponderem ao dobro da procura porjasmins
fotos semanalmente e por cada foto publicada, ganha R$ 50. Se a foto no
publicada, no ganha nada. Nesta semana 4 fotos so submetidas com jl, l,rrlir 1tn exame com 25 questes do tipo certo-errado, um estudante sabe a

uma tendo probabilidade 0,60 de ser publicada, independentemente da demais, l'r,slroslr correta de 17 questes e responde as demais "chutando".
gQVo das respostas.
a. Qual a probabilidade que o fotgrafo tenha pelo menos duas f, n. ('rrlcule a probabilidade dele acertar pelo menos
publicadas esta semana? It. l)ctcrrnine a mdia e a varincia do nmero de acertos.
b. Calcule a distribuio de probabilidade de Y: montante que o fot f. Srrpottlra que nesse mesmo exame, um outro estudante saiba a resposta
recebe esta semana; col'rolit para l5 questes e tenha probabilidade de acerto nas demais de 0,7.
(.)rrlrl clo.s estudantes voc espera que tenha melhor desempenho?
c. Calcule o ganho mdio do fotgrafo nesta semana.
tl, Nirs lncsmas condies do item (c), qual dos estudantes ter desempenho
28. Admita que, em cada corrida de Frmula l, o motor tem 0,4 de probabi rrriris Irornogneo?
de quebrar, independentemente das corridits anteriores. Suponha que a
encerrar sua participao no torneio quanclo o motor quebrar pcla pri
124 Captulo 4: Medidas Resumo

33. (Use o computador) Usando a Tabela 1.1 do Captulo 1: Captulo 5


a. Obtenha as medidas de posio e de variabilidade para o Peso e a Altura.
b. Compare, atravs de medidas de posio e de variabilidade, o peso e a altura
dos alunos das turmas A e B. Comente as diferenas em relao ao item (a).
Variveis Bidimensionais
c. Com respeito varivel TV, alunos e alunas tm o mesmo comportamento?
Justifique sua resposta com o uso de medidas resumo.
34. (Use o computador) Considere as observaes contidas no arquivo cancerlxt 5.L Introduo
(ver Exerccio 24, Captulo 1).
muito comum estarmos interessados no comportamento conjunto de
a. Obtenha as medidas de posio e de variabilidade para as variveis Idade e
Glicose (GL). viirias variveis. Neste captulo, vamos tratar de duas vriveis. Todavia, os
b. Repita o item (a) para cada tipo de diagnstico. Compare as respostas conceitos discutidos aqui podem ser, em geral, expandidos para situaes em que
obtidas. lrs ou mais variveis so estudadas. Nesta primeira seo apresentamos, para
variveis em um conjunto de dados, a tabela de freqncia conjunta e, para o caso
35. (Use o computador) Com os dados do Exerccio 25, Captulo 1: tlc variveis aleatrias, a funo de probabilidade conjunta. A tabela de
a. Para cada bloco, determine medidas de posio e de variabilidade pra a l'cqncia conjunta tambm pode ser utilizada com variveis qualitativas,
rea total do apartamento e para a rea de cada cmodo. Voc diria que conforme veremos nos exemplos. Nas sees subseqentes, estudamos a
existem diferenas nos apartamentos, dependendo do bloco? russociao entre variveis e a obteno de funes de variveis aleatrias.
b. Construa uma tabela de freqncia para a rea total dos apartamentos do As informaes em um conjunto de dados, sejam elas referentes ao todo
bloco I, utilizando faixas de valores convenientemente definidas. Suponha ou parte de uma populao, quase sempre contm observaes multidimensionais,
que um apartamento escolhido ao acaso. Defina por X a varivel aleatria isto , observaes relacionadas a vrias v4riveis. Por exemplo, num
rea total do apartamento selecionado. Baseando-se na tabela de rprestionrio aplicado a alunos de uma universidade, podemos obter a idade, o
freqncia construda, qual o valor esperado de X? Como este valor se llmanho da famlia e o nmero de disciplinas j cursadas, entre outras
compara com aquele observado no item (a) para a rea total? Porqu tluantidades que podem ser de interesse para cada aluno. Considerando duas
deveriam ser iguais e se no so, qual arazo? variveis, digamos idade e tamanho da famlia, podemos listar todos os pares que
36. (Use o computador) As variveis desse exerccio fazem parte do arquivo ocorrem. Como pode haver repetio de valores, os resultados podem ser
aeusp.txt (ver Exerccio 26, Captulo 1). organizados em uma tabela, com os possveis pares associados s suas respectivas
a. Obtenha as medidas de posio e de variabilidade para as variveis Itrab e
'cqncias.
Renda. Ilxemplo 5.1.. Uma amostra de 20 alunos do primeiro ano de uma faculdade foi
b. Repita o item (a) para cada uma das comunidades estudadas. Existem cscolhida. Perguntou-se aos alunos se trabalhevam, varivel que foi representada
diferenas entre elas? ;ror X, e o nmero de vestibulares prestados, varivel representada por Y' Os
c. Utilizando os valores da varivel Serief, divida os moradores em trs tlados obtidos esto na tabela abaixo.
categorias: os que no pararam de estudar, aqueles que pararam at a 8
srie e os demais. Para cada uma das categorias, obtenha as medidas de
X nao slm nao nao nao slm slm nao slm stm
D
posio e a varincia da varivel Itrab. Y 1 1 2 1 I 2 t) 1 1 1

d. Baseado nas variveis Sexo e Itrab, voc diria que os homens comeam a X nao nao slm no slm nao nao nao slm nao
trabalhar mais cedo? D
Y 2 2 1 J 2 2 2 1 .) 2

t25
I2() Captulo 5 : Variveis Bidimensionais 5.1 Introduo 127

A varivel x qualitativa com dois valores: sim ou no. por outro lado, a Ilxcmplo 5.2: Um estudo envolveu 345 pacientes HfV positivos, acompanhados,
varivel Y quantitativa discreta com valores inteiros I,2 ou 3. Podemos coletar dttrante um ano, pelo setor de doenas infecciosas de um grande hospital pblico.
as freqncias de ocorrncia dos possveis pares, construindo uma tabela de Os dados apresentados contm as ocorrncias relacionadas s variveis nmero de
freqncia conjunta de X eY. itttt:rnaes (I) e nmero de crises com infeces oportunistas (C).
(X,Y) freqncia 1\c 0 1 2 D
rJ 4
(sim,1 4 0 B4 27 8 2 0
(sim,2) 2 1 20 59 35 T4 2
(sim,3) 2 2 6 11 43 28 12
(no, 1 5
(no,2) 6
l)irra obter as marginais dessas variveis, acrescentamos mais uma linha e uma
(no,3) coluna na tabela anterior, contendo os respectivos totais de ocorrncia. Assim,
1

total 20 1\c 0 1 2
q
O 4 total
0 B4 27 8 2 0 115
O par (no,1) tem freqncia de ocorrncia igual a 5, pois, na amostra coletada,
foi esse o nmero de alunos que no trabalhavam e prestaram o vestibular apenas 1 20 59 35 t4 2 130
uma vez. Os outros valores so obtidos de forma semelhante. Esta mesma tabela 2 6 11 43 2B 72 100
pode ser apresentada de modo mais conveniente atravs da tabela de dupla total 110 91 B6 44 L4 345
entrada, mosfada a seguir.
Cbnro j mencionamos, a ltima coluna da tabela acima fornece as freqncias
x\v 1 2 .) total eorrcspondentes aos valores da varivel -I, enquanto que a ltima linha fornece as
l'ct1i.incias para C. Logo,
slm 4 2 2 8
nao 5 6 1 12 I freqncia C freqncia
total I B
t
a) 20 0 115 0 110
Note que a ltima linha e a ltima coluna contm os totais de ocorrncias de cada 1 130 1 91
varivel, separadamente. Dessa forma, fica facilitad a a tarefa de obter a tabela de 2 100 2 B6
'eqtincia individual para cada "varivel que, pela posio em que seus valores total 345 3 44
aparecem na tabela de dupla entrada, chamada de tabela marginal de
freqincia
4 I4
du vuridvel x (ou Y), ou simplesmente marginal de x (ou y). Temos ento para total 345
X eY as seguintes tabelas de freqncia:
D
X freqncia Y freqncia
Ii:ccrnplo 5.3.' Numa amostra de 195 empregados de uma grande indstria,
slm 8 1 I rrlrscrvou-se o Salrio recebido (em salrios mnimos) e o Tempo de Servio na
nao L2 2 8 l')rrprcsa (em anos). Tendo em vista que a varivel Salrio quantitativa contnua,
total t t
20 t) r) lrrirrn escolhidas algumas faixas para represent-la. Por outro lado, apesar da
total 20 vrrt'irvel Tempo ser discreta, ela apresentou valores to diferentes que se achou
rrlris conveniente organiz-latambm em faixas. Assim,
l2t Captulo : Variveis Bidimensionais
5 5.1 Introduo

Salrio \Tempo <5 5F10 10 t-- 15 >15 total Note que, pela notao utilizada na Definio 5.1, o termo (X: r)
<4 36 21 4 2 63 rcpresenta o conjunto de eventos que levam a varivel X a assumir o valor r. No
4t--B 16 2B 2T 12 77 prximo exemplo, ilustramos esse ponto.
8-72 5 6 74 10 35
Ilxemplo 5.4: Uma empresa atende encomendas de supermercados dividindo os
>12 1 2 72 5 20
pcclidos em duas partes de modo a serem atendidos, de forma independente, pelas
total 5B
suas duas fbricas. Devido grande demanda, pode haver atraso no cronograma
57 51 29 195
rlc entrega, sendo que aftbrica I atrasa com probabilidade 0,1 e a II com 0,2.
Segue ento que as marginais so: Scjam A1 e All os eventos correspondentes a ocorrncia de atraso nas fbricas I e
Salrio freqncia
ll, respectivamente. Vamos admitir que as encomendas sempre sero entregues,
Tempo freqncia
<4 tcsmo que com atraso. O espao amostral, associado ao atendimento da
63 <5 58 encomenda, ficar sendo:
4F8 77 5 t-- 10 57
8F12 35 10F15 51 : AAr}.
>12
Q {A1A1r, AArr, ArAr,
20 >15 29
total 195 total 195
Pirra aliviar a notao, os eventos sero representados sem os respectivos
tr xubscritos mantendo, entretanto, a ordem das fbricas. Dessa forma, o evento
Pelos exemplos anteriores, podemos perceber que variveis de qualquer /" significa que a ftbrica I entregou sem atraso e afbrica II com atraso.
natreza podem ter seu comportamento conjunto representado atravs Suponha que para um certo pedido, a indstria recebe 200 unidades
do tablas tnonetrias (u.m.) pela encomenda total entregue, mas paga uma multa de 20 u.m.
de freqncia. Dessa forma, variveis qualitativas u quantitativas, discretas
ou pirra cada fbrica que atrasar sua parte. Considere que o supermercado, que fez a
contnuas, tm seu comportamento estudado com tabels de dupla
entrada, para cncomenda, criou um ndice relacionado pontualidade da entrega. Este ihdice,
dados oriundos de toda a populao ou de uma amostra. veremos
a seguir como trllibui 10 pontos pata cada parte da encomenda entregue dentro do cronograma
tratar essa questo no caso de variveis aleatrias discretas, definidas
a partir das prcvisto. Vamos denotar por X o valor recebido pelo pedido eY o ndice obtido.
suas funes de probabilidade. Iniciamos estendendo a definio
de funo de Para cada evento do espao amostral, podemos obter os valores das
probabilidade para o caso de duas variveis.
virrirveis. Assim, se ocorre o evento AA', avarivel X tem valor 180, pois de
Defino 5.1: Funo de probablidade conjunta ?(X) subtraimos a multa de 20, decorrente de um atraso. Por outro lado, a varivel
Sejam X e Y duas variveis aleatrias discretas originrias do mesmo )' assinala 10 pontos provenientes de uma entrega dentro do cronograma. A
fenmeno aleatrio, com valores atribudos apartir do mesmospao lirbcla a seguir, apresenta os eventos, as respectivas probabilidades e os
amostral. A crrrrcspondentes valores de X eY.
uno de probabilidade conjunta definida, para todos os possiveis pares
de
valores de (X, Y), da seguinte forma: Eventos Probabilidade X Y
p(r,a) : P[(X: u) n (Y : ]: p(X : r,y : a), AA 0,1 X 012 160 0
AA' 0,1-x 0,& 180 10
isto , p(r,A) representa a probabilidade de (X,y) ser igual a (r,A).
comum A'A 0,9 X 012 180 10
nos referirmos, sempre que no houver ambiguidades e o contexto permitir, A. A. 0,9 x 0,8 200 20

ftno de probabilidade conjunta como distribuio conjunta ou simplesmente
t:otti unta das variveis. Ap(rs coletarmos os pares idnticos, obtemos a conjunta das variveis:
tr
130 Captulo 5 : Variveis Bidimensionais 5.1 Introduo r3I

(X,Y) p(r,y) Note que pares idnticos foram agrupados e somamos as respectivas
(160, 0) 0,02 probabilidades. Uma forma equivalente de apresentar a distribuio conjunta,
(180, 10) 0,26 porm com maior apelo visual, atravs da tabela de dupla entrada.
(200,20) 0,72
x\), 0 1 2
Dessa forma, a distribuio conjunta de (X, Y) contm todas as possveis 0 r/rc 2lLj 2110
combinaes dos valores (r, g), com suas correspondentes probabilidades. tr 1 L/n r/rc 0

Da funo de probabilidade conjunta p(r,E) possvel obter as funes


2 L/n rlL0 rl10
de probabilidade marginal de X ou de Y, atravs da soma de uma db As distribuies marginais tambm podem aparecer na tabela, bastando efetuar a
coordenadas. Assim, soma nas linhas para obter a marginal de X e, nas colunas, paa a marginal de Y.
Por exemplo, para calcular a probabilidade de X ser igual a zero, temos
P(X : : t p(r,a) e P(Y : a) :\n@,
") u:D
,
P(X :0) : P(X :0,Y: 0) * P(X :0,Y :1) + P(X :0,Y :2)
r225
:10-10-10:10
com a somatria percorrendo todos os valores possveis de X ou Y, conforme o
caso.
Iepetindo os clculos para outros valores de X e Y, obtemos a tabela a seguir:
Exemplo 5.5.' Uma regio foi subdividida em 10 sub-regies. Em cada uma delas,
foram observadas duas variveis: ntmero de poos artesianos (X) e nmero de x\v 0 1 2 P(X : r)
riachos ou rios presentes na sub-regio (y). Os resultados so apresentados na 0 rlt0 2170 2lr0 5lr0
tabela a seguir: 1 7/70 rl70 0 2/r0
2 r/L0 r/n r/t0 3l70
Sub-regio 1 2 J 4 5 6 7 8 9 10
P(Y : u) 3/L0 4lro 3lr0 1
X 0 0 0 0 I 2 I 2 2 0
Y I 2 1 0 I 0 0 1 2 2 Portanto, as funes de probabilidade marginais so as seguintes:

Considerando que escolhemos uma das sub-regies ao acaso, isto , cada sub- xl o 1 2 e Yl o 1 2

regio tm mesma probabilidade 1/10 de ser escolhida, podemos construir a n I slto 2lro sllo p I slro 4lro slro
distribuio conjunta de (X,Y): tr
(X,Y) probab.
Em muitas situaes h interesse em estudar o comportamento de uma
(0,0) L/70 'Lrno das variveis tal como soma, produto ou alguma outra relao entre elas.
(0,1) 2/70 Vamos nos restringir ao caso de variveis aleatrias, mas o tratamento similar
(0,2) 2lr0 para conjunto de dados referentes populao ou amostra. Se conhecemos a
(1,0) r/10 clistribuio conjunta de X e Y, o comportamento de outras variveis, tais como
(1,1) r/rc X +Y, X2 + 5Y ou X Y, pode ser determinado como ilustramos a seguir.
(2,0) rlL0 Ilxemplo 5.6: Emuma cidade do Estado de So Paulo, admite-se que o nmero de
(2,1 rlrc unos para completar o ensino fundamental (varivel F) e o nmero de anos para
(2,2) r/t0 cornpletar o ensino mdio (varivel M) t,m funo de probabilidade conjunta:
total 1
t32 Captulo 5 : Variveis Bidimensionais 5.1 Introduo

(F, M) p(.f ,m)


lxerccios da Seo 5.1:
(8,3 3/L0
(8,4 r/rc l. O setor de emergncia de um Pronto Socorro Infantil anotou o numero de
(8,5 r/70 crianas atendidas (C), de mdicos (M) de auxiliares () de planto em 15
"
clias de atividades. Os dados so apresentados na tabela abaixo.
(9,3) 2/r0
(9,4 r/20 Dia 1 2 t
J 4 5 6 I 8 I 10 11 12 13 L4 15
(9,5 r/10 C 5 7 5 6 5 5 7 5- 6 6 I 5 5 6 6
(10,4 r/70 M 1 1 2 2 2 1 2 1 1 2 2 2 2 2 2
(10, 5) r/20 A 4 4 5 6
7
I I 6 5 5 6
7
I I 6 6 7

Suponha que exista interesse em estudar as variveis F+M e FxM. a. Determine as tabelas de freqncia marginais de C, M e A.
Acrescentando, tabela anterior, colunas correspondendo aos valores dessa novas b. Obtenha a tabela de freqncia conjunta entre (C, M), (C, A) e (M, A).
variveis temos c. Represente a tabela de freqncia conjunta de M e A, atravs de uma tabela
de dupla entrada.
(F,M) pU,m) F+M FxM d. Calcule amdiadas variveis M e A.
(8,3 3/10 11 24
(8,4) L/70 L2 32 2.Paru famlias de um certo bairro de So Paulo, apresentamos abaixo a tabela de
(8,5) 7/L0 13 40 f'reqncia conjunta das variveis: nmero de automveis (A) e de Ws (T).
(9,3) 2/L0 L2, 27 \" 2 total
0 1
9,4) L/20 13 36 0 110 235 t20 465
9,5) 7/r0 74 45 1 51 r22 178 351
(10,4) L/70 L4 40 2 15 84 L62 267
(10,5 r/20 15 50 total 176 44r 460 L077
Para obter a funo de probabilidade de tr.
valores comuns. Por exemplo,
* M, somamos as probabilidades nos a. Calcule as marginais de A e T.
b. Determine as mdias dessas variveis.
?t'
P(F + M : 13) : P(F : 8,M : 5) * P(F : 9,M .. 1
A\ _
1
3. Uma moeda equilibrada lanada 2 vezes de forma independente. Ao final dos
-
'1020 n' lanamentos, duas variveis aleatrias so anotadas: o nmero total de caras (C)
Procedendo de modo similar com os outros valores, obtemos as funes de c o nmero de coroas no 2o. lanamento (K).
probabilidade de.F * M e de F x M: a. Construa uma tabela com os possveis eventos, as respectivas probabilidades
e os valores de C e K.
r+twl tt L2 13 1.4 15 b. Apresente a tabela de dupla entrada com a funo de probabilidade conjunta
prob. | 3/10 3lL0 3120 2lI0 Il20 ' das variveis aleatrias C e K.
c. Determine o valor esperado de C.
FxMl Z+ 27 32 36 40 45 50
prob. l B/10 2lL0 ' 4. Num estudo sobre o tratamento de crises asmticas, estabeleceu-se a seguinte
uno conjunta de probabilidades entre o nmero de crises de asma () e o
tr tti,mero de interniles hospitalares (H).
134 Captulo 5 : Variv eis Bidimensionais 5,2 Associao entre Variaveis 135

\H 0 1 2 foi construda
ingls. Para esses alunos, a prxima tabela com as notas de ingls
0 r/8 I/16 0 (l), portugus (P) e matemtica (M):
1 3/16 L/8 r/16 7
I
Aluno 1 2 3 4 5 6 I 8 10 11 T2 13 L4 15
2 r/L6 3lL6 3/L6
I ( 7 7
F7
I 8 8 B 8 8 8 8 9 I I 10
a. Determine as funes de probabilidade marginal das var,{eis Ar/H. P 8 6 B 9 8 6 I I 7 6 7 B^ I 8 8
b. Calcule o valor esperado dessas variveis. M 5 6 7 5 t) 5 6 4 7 6 5 5 6 5 5
c. Obtenha a funo de probabilidade da varivel A + H. '-/
A tabela de freqncia conjunta de (.I, P) dada por:
5. A funo conjunta de probabilidade entre as variveis X eY apresentada
abaixo (com algumas entradas faltando):
1\ P 6 I 8 I
7 1 0 2 1

8
x\v -1 0 2 4 P(X : r) I
2
0
J
0
1
2
1

-2 ,14't 3/64 Ll32 %6 5lL6 10 0 0 1 0


-1 L/16 7/16 0 \lt (" Ji tto
1 7/at 77/64 1/6tt L/64 5/76 tlrn grfico contendo as informaes dessa tabela apresentado, a seguir, com as

2 /64 0 /'r . 3t64 7t32 l'oqncias ao lado de cada ponto. Note que h uma tendncia das notas altas em
5 /n(^
P(Y : y1 ,^ 5/16 311 r/4 1
irrgls, serem acompanhadas por notas altas em portugus.
P
a. Complete a tabela.
10
b. Obtenha as marginais de X e Y.
c. Calcule afuno de probabilidade da varivel X x Y.

5.2 Associao entre Variveis


Uma pergunta freqente de pesquisadores e usurios de Estatstica ,l

sobre a associao entre uma ou mais variveis. Bucar explicar como se


comporta uma varivel em funo do desempenho de outras tm sido o objetivo
de vrios estudos que utilizam a Estatstica como ferramenta auxiliar. Nesta
seo, comeamos a responder a essa questo. Uma resposta mais completa ser
dada na parte referente Inferncia Estatstica.
Com dados de duas variveis, em uma populao ou amostra, podemos
construir um grfico no plano cartesiano com a freqncia de ocorrncia dos
diversos pares de valores. Esse diagrama pode auxiliar a identificao de Considere agora as variveis I e M. A tabela de freqncia conjunta
tendncias de associao entre as variveis, conforme veremos no prximo scguinte:
exemplo.
Exemplo 5.7: Dentre os alunos do 1o. ano do ensino mdio de uma certa escola,
selecionou-se os quinze alunos com melhor desempenho (nota acima de 7) em
IJ
Captulo 5 : Variveis Bidimensionais 5,2 Associado entre Variaveis

I\M 4 5 6 7 Deftnio 5.2: Probabilidade condicional para variveis aleatrias discretas


I 0 2 1 1
8 1
t
J 2 I Dadas duas variveis aleatrias discretas definidas no mesmo espao
I 0 2
urnostral, a probabilidade condicional de X : :L,dado que Y : a ocorreu, dada
1 0
pcla expresso:
10 0 1 0 0

P(X:rlY:g): P(X:r,Y:y) P(Y: g) >


: , se 0.
P(Y a)

Caso P(Y : A) :0, a probabilidade condicional pode ser definida


rtrbitrariamente e adotaremos P(X : r lY : A) : P(X : r). D
Definio 5.3: Independncia de varidveis aleatras
Duas variveis aleatrias discretas so independentes, se a ocorrncia de
rlualquer valor de uma delas no altera a probabilidade de ocorrncia de valores
tla outra. Em termos matemticos,

P(X:rlY:y): P(X
prra todos os possveis valores (r,g) das variveis (X,Y). Como definio
irlternativa e equivalente podemos usar que:
P(X : n,Y : A) : P(X : n) P(Y : A), para quaisquer (*,A). O
,
8 I 10 A verificao da equivalncia entre as duas expresses, acima, pode ser
Observe que o bom desempenho em ingls parece, lbita de modo anlogo ao realizado no Captulo 2. Deixamos ao leitor essa tarefa.
neste caso, no implicar num
bom desempenho em matemtica. Note, ainda, que a definio de independncia exige que a igualdade seja
D vcrdadeira para todas as escolhas dos pares (r,A). Assim, basta encontrarmos um
Apesar de ser um instrumento til para identificar
tendncias, os l)rr em que a igualdade no se verifique para concluirmos que as variveis
rliagramas rornam-se de difcit interprerao, irleatrias no so independentes. A Figura 5.1 resume esses comentrios.
conjunto de dados tem muitas observes "rigun.
;;;;;.;", exempro, se o
pou.os valores diferentes,
freqncias sero altas atrapahndo "o a visualizao de uma eventual
'lgumas
tcndncia' Dessa forma, importanie ampliar
o estudo da associao entre
variveis, para buscar.uma caracterizao que no
dependa s da interpretao
visual' com este objetivo, definimos piobabilidad"
e independncia
para variveis aleatrias, estendendo os conceitos "ondi"ional
apresentados no captul o 2 para
cventos aleatrios. Aqui, o condicionamento, na
ocorrncia de um valor da
varivel aleatria, equivalente ao condicionamento na ocorrncia
de um evento.
Figura 5. 1 : Indep endncin de variv eis aleatrias .

Ilxemplo 5.8r O Centro Acadmico de uma faculdade de administrao fez um


lovantamento da remunerairo dos estrgios dos alunos, em salrios mnimos, com
/.ft Captulo 5 : Variveis Bidimensionais
5.2 Associao entre Varives 139

relao ao ano que esto cursando. As probabilidades de cada caso


apresentadas na prxima tabela, incluindo as distribuies marginais.
so u\r'r 0 1 2 ou mals total
Sim 2r,lvo 53,8%io 87,l%o 53,SVo
Salrio \ Ano 2 ,) 4 5 P(Sal. : z) No 7B,9Vo 46,2Vq L3,}Vo 46,7Vo
2 2/25 2/25 r/25 0 5/25 total I00Vo l0OVo L00Vo L00Vo
.) 2/25 5/25 2/25 2/25 Lr/25
(lgnsiderando os valores de [/ no conjunto total de dados, temos 53,3Vo de
4 7/25 2/25 2/25 4/25 I /25
P(Ano: y) rcspostas positivas e 46,7V0 de negativas. Caso no haja associao dessa varivel
5 /25 s/25 5/25 6125 1
eoln o nmero de parceiros, devemos esperar porcentagens similares em cada
Pclas informaes apresentadas, as variveis salrio e Ano de curso virlor da varivel ,f, indicando que esses valores no interferem com as respostas
no sil
inclcpendentes pois, por exemplo, tlo [/. Assim, por exemplo, para ly' : 0 seria esperado ter, aproximadamente,
: : 4]:2lzs I p(Sat.: lil,3%o de respostas positivas, que a mesma ocorrncia verificada no total da
P[(Sal. 3) n (Ano B)p(Ano : rr/r2s.
- 4) linha. Como se pode observar da tabela acima, as porcentagens so prximas
Unra maneira bem pr'tica de verificar independncia consiste em usar a lpenas no caso l/: 1, sendo bem diferentes nos outros casos. Dessa forma, os
tabela de
clupla entrada, checando se o produto da ltima linha e ltima coluna (as rludos sugerem que as variveis no so independentes' n
rnargirrais) reproduz o corpo da tabela. se a tabela contiver um zero no
seu corpo, Continuando o estudo da associao entre variveis num conjunto de
brsta verificar se uma das marginais correspondentes zero. caso nenhuma
tllctos, construmos, no prximo exemplo, uma tabela de dupla entrada contendo
marginal seja zero, conclumos imediatamente a no independncia, uma
vez que rrs freqncias que seriam esperadas, caso houvesse independncia entre as
o produto de dois nmeros no nulos nunca zero.
tr vlriveis. Precisamos decidir se as duas tabelas, a de freqncias observadas e a
A verificao da independncia, no caso de duas variveis em um tlc esperadas, esto suficientemente prximas uma da outra.
conjunto de dados, ser discutida com maior profundidade no captulo g que Ilxemplo 5.-f 0.. Apresentamos os dados relativos a uma amostra de 80 famlias, de
trata
cle Testes de Hipteses. Entretanto, podemos utilizar as idias de
indepedncia lun certo bairro, com as informaes sobre o nmero de pessoas que trabalham
cle variveis aleatrias para estudar a relao de duas variveis observadas
numa nufamlia (") e o nmero de adolescentes entre 12 e 1B anos (A).
populao ou amostra. Uma das formas utilizadas construir a tabela
cntrada com porcentagens em relao ao total de colunas ou linhas.
de dupla
r\ 0 1 2 t
rJ 4 total
0 5 4 2 3 1 15
Ilxcntplo 5.9.' Em uma clnica mdica foram coletados dados em 150 pacientes,
relbrcntes ao ltimo ano. observou-se a ocorrncia de infeces urindris (J)
I 2 B 6 4 I 2t
eo 2 4 8 B 5 2 27
ttttncru tle parceiros sexuais (,n/). Deseja-se verificar se essas variveis esto
.1 ,
4 2 2 5 4 I7
russociadas. os dados so apresentados a seguir, com as respectivas
marginais. B, 80
total 15 22 1B T7
u\r/ 0 7 2 ou mais total
A rnarginal deT e as freqncias de seus valores, restritas ao grupo - 0, sero
Sim t2 2L 47 BO
irpresentadas em seguida. Note que as freqncias de ocorrncia, restritas a cada
No 45 1B 7 70 grr.rpo de valor de A, nada mais so do que as colunas da tabela de dupla entrada
total 57 39 54 150 rlo incio do exemplo.
Cottstruindo uma nova tabela com as porcentagens em relao ao total de coluna,
otrtcmos a proporo relativa da varivel (J em relao i cada subconjunto
de
valores de N.
t40 Captulo 5 : Variv eis Bidimensionais 5,2 Associao entre Variveis 141

T freq. T /A:0 freq. observ. eube agora quantificar se essa tabela est ou no "muito" distante da tabela
0 15 0 5 ohscrvada. Uma medida usualmente calculada a seguinte:
1

2
3
2L
27
L7
2
J
1 2
4
4
Q':D4, i,i "11

total 80 total 15
Eonl o,;.i e eiirepfesentando, respectivamente, as freqncias observadas e
Se houvesse independncia entre T e A, o comportamento da varivel ? csl)cradas na linha 'i e coluna j. A medida Q2 usa a diferena entre oi.j e ei.j
em cada grupo deveria ser o mesmo e, portanto, esperaramos que as freqnci elcvada ao quadrado para evitar o cancelamento de termos positivos por
de cada valor de 7 mantivessem a mesma proporcionalidade encontrada na flL:gativos. A diviso pot ei.i objetiva padronizar a medida, relativizando o
ilmostra como um todo. Em outras palavras, as duas tabelas acima precisariam ser tnrrranho da diferena encontrada. Como estamos tratando de observaes de
parecidas quanto freqncia relativa. Acrescentamos, na tabela restrita ao grupo vrrrirveis, podem ocorrer flutuaes devido natureza aleata da amostragem e
A.:0, uma nova coluna com a freqncia esperada caso a independncia se rrrrcluiremos pela independncia entre essas variveis, se houver razoxel
verifique. Essa coluna foi calculada multiplicando a freqncia relativa do valor proximidade nas tabelas. No difcil perceber que isto significa valores
cle ? (em toda a amostra) pela freqncia do grupo. Por exemplo, a freqncia pe(luenos da medida Q2 e,no Captulo 8, desenvolveremos um critrio estatstico,
esperada do valor T:7, no grupo dos :0, seria 21180 x 15:3,94. Note piri tomar a deciso de aceitar a independncia de duas variveis. Para este
que esta freqncia no precisa ser um nmero inteiro. excrnplo, vamos nos contentar em apresentar o clculo da medida Q2 que, pelo
tlr:rr valor, consideraremos uma indicao de no independncia:
T\:0 freq. observ. freq. esperada
0 5 2,87
Q,:
(5-2,81)2
+...+ (4-r,70)2 :12.63.
1 2 3,94 2,81 L,70
2 4 5,06
D
3 4 3,19
total 15 15 No caso de dependncia linear e de variveis quantitativas, existe uma
prrtla medida que freqentemente utilizada e ser definida, a seguir, para um
De modo anlogo ao feito para o grupo : 0, calculamos as freqncias corr.junto de dados brutos.
esperadas para todas as colunas da tabela de dupla entrada (valores aproximados):
I)t1[ino 5.4: Correlao entre variveis num conjunto de dados brutos
7 \.4 0 1 2 4 total
Considere um conjunto de dados com n pares de valores para as variveis
0 2,Bl 4,13 3,37 3,19 1,50 15
.\ c Y, representados por (ru,g),':I,2,...,fr.O coeficiente de correlao
I 3,94 5,77 4,73 4,46 2,r0 27
rrrcrlc a dependncia linear entre as variveis e calculado da seguinte forma:
2 5,06 7,42 6,08 5,74 2,70 27
t 'n
t) 3,19 4,67 3,83 3,61 I,70 17
total 15 22 1B 77 B 80
D@o
i,:l
- r,,r,,)(ar. - a,*,)
Px,Y =
142 Captulo 5: Variveis 5.2 Associao entre Variveis 143

ou, em uma forma mais conveniente para clculo, Scgue que r o6, : l-35, 63 e y oo,
: 38, 75. Utilizando a expresso de clculo da
n,
currelao vem que:
LrtAt.-TLIohsAobs 43245-8x135,63x38,75
i:l PX,Y:
PX,Y:

lrrtanto, a correlao entre ndice pluviomtrico e produo positiva e bastante


titzovel. Desta forma, locais com maior intensidade de chuva tenderiam a ter
As expresses anteriores podem ser adaptadas para o caso em que tttlior produtividade. tr
dados esto agrupados em uma tabela de freqncia. As expresses no Vamos voltar nossa ateno agora paravariveis aleatrias discretas. Para
apresentadas aqui, mas acreditamos que podem ser obtidas sem dificuldade. elc'inir medidas de dependncia entre elas, precisamos estudar, inicialmente, as
possvel verificar que o coeficiente de correlao sempre um n propriedades do valor esperado.
entre -1 e 1. Um ponto a ser ressaltado, que muitas vezes causa confuso, Sejam X e Y duas variveis aleatrias discretas com distribuio
correlao igual a zero no indica independncia. Se a correlao zero, o conjunta p(r,y). As marginais de X e )z sero representadas, repectivamente, por
podemos dizer que no existe dependncia linear entre as variveis. p(t:) e p(y).
interpretao para os termos presentes no seu clculo ser dada mais adian Vamos determinar o valor esperado da varivel X +Y:
quando definiremos coeficiente de correlao para variveis aleatrias.

Exemplo 5.11: A quantidade de chuva um fator importante na produtivi


agrcola. Para medir esse efeito foram anotados, para 8 diferentes regi
E(x-+Y): tIt"
r.u
+p@,a)
produtoras de soja, o ndice pluviomtrico em milmetros (X) e a produo
:I D,p@, +L,\un@,u)
TU:E'!J
,t'tt(. Tfutull>
r"ned'u,tt7-D
: > -,1, rt'''UtA : I" (t p@,a))+t, (f p(*,)
t
' auxlio o" rr-uofrn[ilf"
, . | ,,\J-
lca o uma
o, rUUT
"o-'o 88 :trp@)+tap@)
D"o: 10Bb ,D"?: 151533; X;U
i--L
88
i:l : E(x) + E(Y).
Dru:310,
i:t
t:12640;
i:L Notc que obtemos essa importante propriedade do valor esperado, sem necessitar
8
tlc rtcnhuma hiptese adicional sobre as variveis. Dessa forma, esse resultado
43245. lcrn ampla aplicao e tambm vlido para mais de duas variveis.
D*oro:
i:l Considere agora o produto XY. O valor esperado do produto ser o
pt'oduto dos valores esperados, sempre que as variveis forem independentes.
Para X eY variveis aleatrias discretas independentes, temos:
t44 Captulo 5 : Variveis B idimensionais 5.2 Associao entre Variveis 145

E(xY): tL"yp@,a)
r '!l xl o 1 2
p | 5/10 2/70 slto
: I D,*aP@)P@) -$
r lt
'.* vl o t z
: (T 'p@)) (Duna) pi | 3lt0 4lr0 3lt0

: E(x) E(Y) .
t
\ ,nf Segue ento que E(X) : S/10 e E(Y) : L'
/t Podemos agora verificar que
Exemplo 5.12.' No Exemplo 5.5, o par de variveis f*,h represenr
: ISlto: E(X) + E(Y):
respectivamente, a quantidade de poos artesianos e de riachos em sub-regies E(X +Y) B/10 + 1, '

uma certa rea. A prxima tabela contm os valores das variveis X f Y e X isto , o valor esperado da soma igual soma dos valores esperados.
com suas probabilidades. Entretanto, para o produto temos
(X,Y) X+Y XY p(r,a) R
(0,0) 0 0 L
/10
E(xY):7lLo+E(x)E(Y): * t,
(0,1) I 0 2/r0
(0,2) 2 0 2/r0 ou seja, o valor esperado do produto de duas variveis no igual ao produto de
seus valores esperados. Note que, conforme j havamos mencionado, as variveis
(1,0 1 0 L/n no so independentes. tr
(1,1) 2 I 1170
aleatrias X eY
(2,0) 2 0 L/10 Na Figura 5.2, apresentamos a expresso do valor esperado da sorra de
( t variveis aleatrias.
(2, 1 r) 2 L/rc
(2,2) 4 4 r/70

Utilizando a tabela acima, a funo de probabilidade de X +Y e a de XY


obtidas sem dificuldade:

x+rl 0 L 2 3 4

Fgura 5.2: Valor esperado da soma de vuriveis aleatrias.

Para os valores esperados temos: importante salientar a relao unidirecional de implicao entre a
E(X+Y):18/ro e E(XY) :7lto. independncia e a fatorao da esperana do produto. O resultado vfido afirma
que a independncia de X e Y implica no valor esperado do produto XY set
As distribuies marginais de X e Y j foram calculadas no Exemplo 5.5 e so igual ao produto do valor esperado de X pelo valor esperado de Y. Todavia, se o
reapresentadas em seguida: valor esperado do produto de duas variveis o produto dos valores esperados,
t4(, Captulo 5: Variveis Bidimensionais t47
5.2 Associao entre Variveis

niio necessariamente verdade que X e Y so independentes. A Figura


c, desde que temos um par em que a probabilidade da conjunta no igual ao
resume esse comentrio, que ilustrado no prximo exemplo.
;rroduto das probabilidades marginais, concluimos que as variveis aleatrias W e
Z no so independentes. tr
Se as variveis so dependentes, a relao entre elas pode ser de vrios
tiflcs e, no caso de ser linear, vamos definir uma medida dessa dependncia.
Definio 5,5: Covarncia de duas varidveis aleatrias
Uma medida de dependncia linear entre X eY , dada pela covarincia:

Cov(X,Y) : ox,Y : E[(X - LLx) (Y - P")]'


Itigura 5.3: Valor esperado do produto e independnca de variveis aleatrias.
Iirn palavras, a covarincia o valor esperado do produto dos desvios de cada
varivel em relao sua mdia. tr
Ixemplo 5.13.' Considere as variveis WeZ com a seguinte distribuio No prximo exemplo ilustramos o clculo da covarincia e, para auxiliar
conjunta: ir interpretao de sua expresso, faremos uma representao grfica dos valores
W\Z 2 t
L) 4 P(W : w) clas variveis.

-1 2/72 0 3/12 5l12 Ilxemplo 5.14: As variveis U eV tm a seguinte distribuio conjunta:


0 0 r/L2 L/T2 2/12
1 I/L2 2/12 2/12 5/r2 (u,v) (2,2) (3,4) (3, B) (4,6) (5,4) (5,8) (6, 10)
P(Z : z) 3/L2 3/12 6/12 1 P(u,u) 0,1 012 0,1 012 0,1 012 0,1

A varivel W Z tem funo de probabilidade dada por:


l{epresentamos a seguir essa distribuio atravs de uma tabela de dupla entrada,
wzl-4 -2 0 i ncluindo as marginais.

prob. | 3lL2 2/L2 2/L2 7/72 2


Temos ento,
u\v 2 4 6 B 10 P(U : u)
2 0,1 0 0 0 0 0,1
E(W Z) : (-4) x 3lL2+ .'. + 4 x 2lLz D
t) 0 012 0 0,1 0 0,3
-0. 4 0 0 012 0 0 012

Por outro lado, utilizando as distribuies marginais de W e Z, podemoscalcular 5 0 0,1 0 012 0 0,3
seus valores esperados. Assim, 6 0 0 0 0 0,1 0,1

E(W) : (-1) x 5lI2 + 0 x 2lI2 * L x 5fL2 : 0 ;


P(V : u) 0,1 0,3 012 0,3 0,1 I
E(Z) : 2 x 3lI2 + 3 x 3112 + 4 x 6lL2 : 391L2
Utilizando as probabilidades marginais, obtemos imediatamente que E(t/) : 4 e
Vale portanto a relao E(WZ):E(W)E(Z).Nesse caso, seriam WeZ Ii(V) :6. Nosso interesse verificar a existncia de uma relao linear entre U e
independentes? A resposta no, uma vez que, por exemplo, |/. No diagrama a seguir, apresentamos a funo de probabilidade conjunta das
cluas variveis.
P(W : -I,Z - 2) : 2lI2 + P(W : -L)P(Z - 2) : L5/L44,
148 Captulo 5: Variveis 5,2 A,r,vtciao entre Variveis
r49

os pontos localizados no 1" e 3" quadrantes tm suas coordenadas


com o
ffinnro sinal, Iogo o produto delas positivo. No 2" e 4o, o produto
e n"guii;o.
Sonr'ndo esses produtos, ponderados ielas respectivas probabilidades, temos:

tf @ - n(u))x (u - E(v)) x p(u,u),


essc nmero inai"u' t"naon"iu de alinhamento no sentido dos quadrantes
mp'res ou pares, de acordo com o sinal positivo ou negativo, respectivamente.
A
r;trcsso acima nada mais do que a frmula da covarincia entre
x e y,
prcsentada aqui em uma forma mais detarhada do que na Definio
5.5.
ru.rirnoo os clculos,
Etbtuando calculos, obtemos Cov(U rV) :2,
Cov(U,V) : 2, inOi"nao
indicando u a tendncia das
varirveis moverem-se na mesma direo, isto , quando uma varivel
cresce na
Uru tambm cresce.
tr
A covarincia pode ser calculada mais facilmente pela seguinte
expresso
lternativa:

Fazemos agora uma translao de eixos para colocar a origem : o*,, : E(Xl) - E(X) E(y).
Cov(X,Y)
respectivas mdias, isto , no ponto (4,6).Dessa forma, os pontos anteri
bserve que' no caso em que xe y serem independentes, temos
transformam-se em (u - 4,a - 6), com cada coordenada representando o desvi cov(x,y) : 0,
ut1il vez que o valor esperado do produto se torna igual ao produto do, uIo.",
em relao sua mdia.
A partir da covarincia, definimos uma nova medid" d" d;;"d;;;
ffJl*'.for'
lllcilr.
Derfinio 5.6: Correlao entre vatrveis aleatras
O coeficiente de correlao entre as variveis aleatrias discretas
X ey
r:irlculado pela seguinte expresso:

Cov(X,Y)
4'.,- :
OX OY

E
Pela definio acima, o coeficiente de correla
o o quociente entre a
crviuincia e o produto dos desvios-padro de x e )2. A diviso
pelo produto dos
rlcsvios-padro tem a funo de padronizar a medida
e torn-la possvel de ser
,tilizada para comparaes com outras variveis. No difcil
u"rifi.u, gue px,v
rrrrr nmero adimensional e limitado por 1, isto , <
lpx,vl 1. A interpretao de
suir cxpresso segue os mesmos passos da covarincia,
sendo que valores de
1t,y,y prximos de 1 indicam correlao forte.
t50 Captulo 5: Variveis
5,2 Associao entre Variaveis 151

Vamos, agora, deduzir a expresso da varincia da soma de duas vari


aleatrias. Desenvolvendo a partir da definio de varincia temos:

Var(X +Y): E16 +Y) - (trt + t"y)l'


: El(x - px) + (Y - pt)l'
E16 - px)z + (v - pv)2 + 2(x - px)(Y - p")l Figura 5.4: Correlao para conjuntos de dados (brutos).
E(x - px)2 + E(Y - ttv)2 +2El(X - px)(Y - p")].
Ento,

Var(X + y) : Var(X) + Var(Y) i 2 Cov(X,Y)


que, se rcdtzir soma das varincias, no caso de independncia entre X eY.
Exemplo 5.15.' Nos Exemplos 5 .5 e 5 .I2, o par de variveis (X ,Y) representa
respectivamente, o nmero de poos e de riachos em sub-regies de uma
6trea. Figura 5.5: Covarincia e correlao de varidveis aleatrias.

J calculamos .E(X Y) : 7 ltO, E(X) :8/10 e E(Y) : 1, portanto,

cov(x,Y) : E(xY) - E(x) E(Y) :+t0- *10t t : -*.


10

Usando as distribuies marginais, podemos obter 2x :76/100


ozr: e o2u :
:60/1
Para avarincia de X i Y temos

Var(X +n:
''100 2 # +2(-#) : 116
Figura 5.6: Varincia da soma de duas variveis aleatrins.
" 100

O coeficiente de correlao ser


Vamos encerrar essa seo, aplicando as propriedades do valor esperado e
Cov(X,Y) -Llt0 :
ox oY ffi@ -0,15. rlu varincia na obteno dessas quantidades para o modelo Binomial.

Il"rctnplo 5.1.' Considere uma sequncia de variveis aleatrias independentes


eorrr distribuio Bernoulli de parmetro p. Como se comporta a soma de n dessas
virliiiveis?
Nas figuras a seguir, resumimos algumas frmulas dessa seo.
Representemos por Xr, Xz, .. ., X,,, a sequncia de variveis de Bernoulli.
lisirrnos interessados em X : Xr t Xz * '.' * Xn, e, pela definio do modelo
Ilirrornial, j sabemos que X - b(n,p).
Lembrando que E(Xa) : p e Var(X6) : p(l - p) para 'i:1,2,..., D,
virrros calcular a mdia ea varincia de X, utilizando as propriedades
t52 Captulo 5 : Varidv eis Bidimensionais 5.2 Associao entre Variveis t53

apresentadas anteriormente. Temos,

E(X):E(Xt+Xz.-"'+X,) r\c 0 1 2

: E(xt) + E(x2) + ... + E(x")


1 1B 16 10

: p+ p+...+ p
2
o
J
34
T2
45
16
38
31
- np.
Para obter a varincia, usaremos a independncia dos X;,r: a. Obtenha as tabelas marginais de freqncia.
b. Construa a tabela de freqncias esperadas, caso houvesse independncia
Var(X) : Var(Xr t Xz + "' 1 X,,) entre as variveis.
: Var(Xt) * var(X2) + ... + var(X") c. Determine o ndice Q2.
: p(l - p) + p(I - p) + ... + p(L - p)
4. A funo de probabilidade conjunta entre as variveis aleatrias X eY
: np(I- p). apresentada na prxima tabela.
,

Esses resultados coincidem com aqueles apresentados no Captulo 3. tl x\y -2 0 2 4


Exerccios da Seo 5.2: -1 0,1 0,2 0,1 012
1. Na tabela a seguir encontram-se os conceitos de histria (H), matemtica (M) 1 012 0 0,1 0,1
efsica (F ) de alguns alunos do 3o. ano do ensino mdio de uma escola. a. Obtenha as funes de probabilidade marginais das variveis.
b. X e Y so independentes?
Aluno I 2 J 4 5 6 7 8 9 10 11 l2 c. Calcule a covarincia e a correlao entre X eY.
,
H C C' 'c C b. h b b b b b a,
M c C d c b c a c c c c c 5. Na caixa I existem duas bolas numeradas 0 e 1, enquanto que a caixa II contm
duas bolas numeradas 1 e 0. Uma bola retirada aleatoriamente de cada
F d c b C b c c b b c c b
caixa, de forma independente uma da outra. A esse experimento, associamos as
variveis aleatrias: nmero da bola retirada na caixa I (X), soma dos valores
a. Construa as tabelas de freqncia conjunta para H e M e para H e F.
das duas bolas retiradas (Y) e a difurena, em mdulo, desses valores (Z).
b. Calcule a proporo de alunos com em fsica, dentre os com pelo menos c a. Determine a funo de probabilidade conjunta entre X eY e entre Y e Z.
em matemtica.
b. Verifique se X e Y so independentes. Idem paraY e Z.
2. rJm levantamento obtido, junto aos funcionrios de um pequeno escritrio; c. Calcule a covarincia entre X eY.
busca relacionar as variveis: anos de estudo (X) nmero de diftrentes d. Obtenha Var(X +Y).
"
empregos nos ltimos 5 anos (y). O que voc pode dizer com os dados
6. A varivel X ,Bernoulli com p : 0,4 eY Binomial com p : 0,5 e n : 3.
fornecidos?
Admita que X e Y so independentes.
X 8 I 10 11 l2 a. Determine P(X :\lY :2).
Y 4 2 I 2 I b. Obtenha a funo de probabilidade conjunta de X e Y e do produto XY.
c. Calcule E(X),8(Y) e E(XY) e verifique que: E(X) x E(Y) : E(XY).
3. Uma amostra de 220 clientes de uma clnica dentria foi selecionada' As d. Determine o valor de Cov(X,Y) e de py,y.
variveis tempo, em anos, decorridos desde a ltima visita ao dentista (V) eo
nmero de cries encontradas (C) apresentado na prxima tabela'
Captulo 5 : Variv eis Bidimensionais 5.3 Exerccios 155
t54

(F,C) freq.
5.3 Exerccios
(0,0) L2
1. A tabela a seguir apresenta os valores observados em uma amostra de 130 (0, 1 25
empregados do ramo do comrcio. (0,2) 8
Sexo \ Fumante Sim No (1,1) t4
Masculino 24 18 (2,1 57
Feminino 25 63 (3,1 40
(3,2) 45
a. Construa as tabelas marginais de freqncia para as variveis Sexo e (4,r 27
Fumante. (4,2) 22
b. Se usssemos a amostra para tirar uma concluso sobre toda populao,
voc diria que, proporcionalmente, mais homens fumam do que mulheres? 5. Os dados a seguir referem-se a uma amostra de 5 alunos que informaram, no
c. Calcule o ndice de associao Q2 entre as variveis. incio do curso, seu peso e idade.
,,
Em uma amostra de 8 funcionrios de uma empresa, observou-se duas Aluno I 2 J 4 5
variveis: anos de empresa (A) e nmero de promoes recebidas (P). Com Peso 7L 65 70 57 66
os resultados apresentados a seguir voc diria que, para essa empresa, essas Idade L7 L7 18 17 19
variveis esto associadas?
a. Encontre a mdia e o desvio padro do peso dos alunos c"om l7 anos.
A 5 6 6 7 I B B 8 b. Construa o diagrama de Peso por ldade.
t
P 2 2 1 2 0 J 1 0 c. Obtenha o coeficiente de correlao entre peso e idade.

3. Est sendo estudado o efeito do teor de ferro na capacidade ile car p de vigas r. Para cinco volumes de uma mesma soluo foram medidos os tempos de
de concreto. Os dados abaixo apresentam os resultados de medidas btidas em aquecimento, em um mesmo bico de gs, e as respectivas temperaturas de
uma amostra. Obtenha a correlao entre as variveis. ebulio:

Ferro (7o peso) 5,4 6,8 6,9 7,3 7,7 8,1 8,2 8,5 8,6 8,9 Tempo (min.) 20 22 19 23 17
Carga (ton./m2) 2rL ,) 2r9 2r9 3,0 3,1 3,1 3,1 314 3,5 Temperatura ('C) 75 BO 75 82 78

4. A tabela de freqncia conjunta entre nmero de filhos (f') nmero de a. Obtenha o grfico do Tempo pela Temperatura e calcule a correlao.
cusamentos
"
oficiais (C) apresentada, a seguir, para os 250 funcionrios de b. Voc acha que existe associao entre as variveis?
ur certa empresa. 7. Alguns cientistas sociais acreditam que a opinio sobre o aborto independe da
a. Determine as tabelas de freqncia marginais, correspondentes a cada uma situao familiar. O que voc diria, aps estudar a amostra?
das variveis, isoladamente, e calcule as mdias de F e C.
Situao \ Opinio Favorveis Contrrios
b. Construa um grfico com a distribuio de freqncia das variveis. Voc Casados 56 2:4
chega a alguma concluso? r
Solteiros 15 25
c. Determine o coeficiente de correlao entre F e C. Note que ser
Divorciados 24 16
necessrio adaptar a expresso apresentada na Definio 5.4.
Vivos 13 27
t56 Captulo 5 : Variveis Bidimensionais 5.3 Exerccios r57

8. A tabela a seguir consiste de 16 valores de trs variveis observadas em alunos Pac. No. t 4 ll
2 J 5 6 7 8 9 10 12 I3
do curso de cincias sociaisr sexo (S), nota de estatstica (E) nota de
" C I 1 2 1 2 1 I t
a) 2 2 1 1 2
antropologio (A).
s 2 2 D
t) 1 1 2 t
L)
t
d 2 J 1 2 I
s M F M F M M F F F M M F M F F M F 0 2 4 0 1 1 1 2 0 D
L) 0 1 2
t o
E r) 6 4 iJ 6 5 5 I 4 5 5 6 5 4 t
r) 6
A t
e) 4 3 5 5 5 4 6 5 5 4 4 5 5 6 5
Pac. No. I4 15 t6 7 18 t9 20 2I 22 23 24
a. construa a tabela de dupla entrada para as notas de estatstica er C 2 I I 1
t
a) 1 2 1 1 1
t
r)
antropologia. ,9 ,f
D
() 2 1 2 2 1 1 2 t
!)
D
t)

b. Repita o item (a), considerando apenas os homens. F t


d ,) 0 0 1 0 0 1 1 2 4
c. calcule, para os alunos do sexo masculino, o coeficiente de correlao entre
as notas de estatstica e de antropologia. a. Construa a tabela de dupla entrada com as variveis C e S.
d. Com o uso da tabela obtida em (a), calcule a porcentagem de cada b. Estude a associao entre as variveis C e S, atravs das porcentagens em
freqncia conjunta em relao ao total de alunos. relao ao total de coluna.
9. Num certo distrito de sade, o comportamento conjunto dos de c. Repita os itens (a) e (b) para C e F.
sarampo (S) e difteria (D) foi o seguinte: d. Repita os itens (a) e (b) para S e F.
11. Odepartamento de vendas de certa companhia ofereceu um curso de
atualizao a seus funcionrios e, para estudar a eficcia do curso, resolveu
comparar a noto de teste no curso (7) com o volume de vendas, em rhilhares
de unidades, nos seis meses seguintes ao curso (V). Os resultados esto na
tabela abaixo.
t6 I7 18 t9 20 2t 22 23 24 25 26 27 28 29 30 ,1, q
1 I 2 1 0 1 2 1 0 0 0 1 L 2
R 9 7 8 6 8 .J 5 6 7 4 7 d 5 3

I V 74 13 T2 13 10 I2 11 10 10 13 10
2 2 t
.) 2 2 2 2 I 2 1 I 1
t
i)
t
()
11 T2 T2 11

a. Obtenha a tabela de dupla entrada. a. A varivel ? serve para explicar a varivel I/? Justifique.
b. Calcule a porcentagem de cada ocorrncia conjunta em relao ao total de b. Calcule a correlao entre as variveis.
casos.
12. Um total de 1000 passageiros de vos domsticos foram entrevistados no
c. Repita o item (b), fazendo a porcentagem em relao ao total de colunas.
Aeroporto de Guarulhos. Duas variveis foram observadas: nmero de viagens
d. Que concluso se pode tirar da relao entre a incidncia de sarampo e
mensais (V) nmero de automveis na famlia (). O resultado est na
prxima tabela"que, por descuido, est incompleta.
difteria?
10. As informaes da tabela a seguir foram coletadas de 24 pacientes da rea de
cardiologia de um grande hospital pblico. A varivel C indica o nmero de V\A 1 2 t
r) total
intervenes cirrgicas sofridas pelo paciente, ,9 representa o nmero de 1 /0 BO 60 -zt)O
pontes safena colocadas pelo paciente em uma ou mais cirurgias e a varivel F 2 150 :.{.,t C 450
indica o nmero de.familiares prximos com problemas cardacos. /t0
J L20 ,l4a 300
total 300 200 'i i .. ),
/51J Captulo 5 : Variveis Bidimensionais 5.3 Exerccios
t59

a. Complete a tabela. !
16. A funo de probabilidade conjunta das variveis x ey dadapela seguinte
tabela de dupla entrada.
b. Calcule as porcentagens em relao ao total de coluna.
c. As variveis so independentes? Justifique. x\y -1 0 1

-1 I/B 1/8 r/8


13. A tabela de freqncia apresentada em seguida est incompleta e contm
0 1/8 0 1/B
observaes das variveis: vida til do equipamento (t/) garantia do
fabricante (G), ambas medidas em anos.
" 1 L/8 I/B L/8
a. Verifique se E(XY) : E(X)E(Y).
U\G 2 4 6 B total b. X e Y so independentes? Comente.
t
8 t) 3 o 0 6
17. Numa caixa existem 4 bolas numeradas 3, 5, 5 eT.rJmabola sorteada ao
10 I 6 +4.
4
acaso, seu nmero anotado (xr) devolvida caixa. uma segunda bola
t2 1 ) 5 4 10\ "
escolhida, tambm ao acaso, e seu nmero denotado por X2.
total 5 '., 1t <,O / a. Determine a conjunta de X1e X2.
b. Calcule as marginais de X1 e X2. Elas so independentes?
a. Complete tabe c. Encontre o valor esperado e a varincia de X1, X2 eX : e+t.
b. Construa o grfico de [/ por G e verifique se h associao entre as
variveis. 18. Uma moeda equilibrada lanada trs vezes e so definidas as variveis
c. Calcule a vida til mdia para cada subgrupo de valor da garantia. Comente aleatrias: nmero de caras nos dois primeiros resultados (x), nmero de
os resultados. caras no ltimo lanamento (Y) e nmero total de caras (S).
a. Construa a tabela conjunta de (X,Y).
L4. Para o lanamento de dois dados equilibrados, defina duas variveis b. Verifique se X e Y so independentes. ' ,
aleatrias. Seja X o nmero de vezes que aparece aface 2 eY igual a 0 se a c. Calcule E(X), E(Y) e Cov(X,Y).
soma for par e 1, caso contrrio. d. Expresse ,5 em funo de X e Y e determine E(.9) e Var(S).
a. Determine a funo de probabilidade conjunta de X eY.
b. Calcule E(X), E(Y) e E(X +Y). 19. considere a frase: "Para mais sade pratique mais esporte,,. Escolha ao acaso
c. Verifique se X eY so independentes. uma palavra dessa frase e considere as variveis aleatrias nmero de vogais
d. Calcule o coeficiente de correlao entre X eY. (V) e nmero de consoantes (C).
a. Determine a conjunta deV e C.
15. Considere a funo conjunta: b. Obtenha as funes de probabilidade marginais.
x\v 0 1 2 c. Calcule os valores esperados dessas variveis.
d. As variveis so independentes? Justifique.
0 t/78 rls rl6
7/9 I/I8 e. se a escolha acima resultou em v : 2,, qual a probabilidade da palavra
1 U9
"mais" ter sido a escolhida.
2 L/6 r/6 r/18
P(l < X 12,y > 1) e P(X:
20.A tabela a seguir representa a funo de probabilidade conjunta de duas
a. Calcule 1, Y ) 1).
variveis aleatrias independentes.
b. Determine E(X), E(Y) e Cov(X,Y).
c. X e Y so independentes? Justifique.
160 \.. lxerccios r61
Captulo 5 : Variveis Bidimensionais

x\ ), 1 2 3 P(X : r) a. Determine o valor esperado e a varinciadavarivel X :1- 18.


b.IdemparaY:E-l.tp.
-1 L/6
c. Obtenha a conjunta entre X eY.
0 2/6
1 3/6 25. A conjunta das variveis aleatrias independentes X e Y ' parcialmente
P(Y : y1 r/5 3/5 L/5 1 apresentada a seguir:

a. Complete a tabela. x\v -2 0 2 P(X : r)


i:3i,iil'l :,Y';E(Y) "
cov(x'Y) I
1
2
0,3
0r7

21. sorteia-se ao acaso um dentre os nmeros g, 12, e zz e feita a P(Y : u) 012 0,3
decomposio do nmero sorteado em fatores primos.
$ejam D e T, as a. Complete a tabela.
variveis que representam, respectivamente, o nmero de b. Calcule o valor esperado e a varincia de 2X Y.
3 aparecem na decomposio.
/ezes em que o 2 e o -
a. Obtenha a conjunta entre D e T.
{
\ 26. Sendo Xr,Xz e X3 variveis aleatrias independentes, seguindo o modelo
b. calcule a covarincia e o coeficiente de correlao entre as variveis. Bernoulli de parmetro p, pergunta-se:
a. Qual a funo de probabilidade de Xt t Xz * Xs? Voc reconhece essa
22. As variveis F e M representam, respectivamente, o nmero de anos para varivel?
compltar o ensino fundamental e o ensino mdio. Numa certa cidade , a tabela b. Qual o valor aeVar($h)t
a seguir adotada pafa a funo de probabilidade conjunta dessas variveis.
Determine o valor esperado e a varincia da varivel F + M que representa o 27. Sabe-se que X e Y so independentes e assumem, respectivamente, os valores
total de anos at completar o ensino mdio. 7,2 e 3 e-0, I e2. Admita conhecidas as probabilidades P(Y:0):1/3,
P(X :3) : Ll3, P(X : L,Y :0) : 1/9 e P(X :3,Y :2) : Llq,
F\M 3 4 5 6 a. Construa atabela de dupla entrada para X eY.
8 e 160 I /60 7/60 r/60 b. Calcule E(X x Y) e Var(X + Y).
9 7/60 7 /60 5/60 3/60
28. Um paleontlogo acredita que o nmero de minerais presentes em certo tipo
10 3/60 4160 3/60 2/60
de rocha pode influir na chance de se encontrar fsseis perto de uma indstria
23. Sejam X -b(5;0,5) e Y -b(3;0,2) independentes. Determine o valor calcria. Atravs de amostras de rocha obtidas em levantamentos de campo, elc
esperado e a varincia da varivel2X - BY. obteve a distribuio conjunta para as variveis Z:nmero de minerctis
presentes eW: varivel que assume 1, se for observada a presena de fssil e 0
24. A rabela a seguir representa a funo de probabilidade conjunta entre o
caso contrrio.
nmero de empregos desde que comeou a trabalhar (E) e a idade do primeiro
enlprego (1), de jovens em uma pequena cidade do Estado de so paulo. w\z 1 2 t
r)

0 r/8 r/8 r/4


E\r 13 14 15 16
I L/8 L/4 1/B
b 0,02 0,02 0,02 0,03
6 0,07 0,09 0,L2 0,13 a. Calcule P(W :0, Z > L).
I 0,10 0,08 0,03 0,05 b. Encontre as distribuies marginais para Z e W .

8 0,10 0,06 0,04 0,04 c. Qual a esperana de Z?


I ()2 Captulo 5 : Variveis Bidimensionais
.\.-l Exerccios 163

d. A suspeita do paleontlogo confirmada pelos valores apresentados na


tabela? Justifique sua resposta quantitativamente. c. Se o produto dever ser vendido poi 50 reais, qual ser o lucro mdio por
unidade?
29. Sejam (J :Y2 eV : X +Y, com a funo de probabilidade conjuntaentre
X eY dada na tabeia a seguir: 33. A caixa Icontm uma bola vermelha e uma azul, enquanto que a caixa II
contm duas vermelhas e uma azul. Um experimento consiste em escolher uma
x\v 0 7 2 bola ao acaso da caixa I e passar para a caixa II e, em seguida, escolher uma
-1 L/12 Ll6 r/3 bola da II e passar paraa I. Sejam X eY os nmeros de bolas vermelhas nas
1 7/6 7/4 0 caixas Ie II, respectivamente.
a. Calcule a conjunta de X e Y. Elas so independentes?
a. Obtenha a conjunta de U e V.
b. Comente o que ocorre com a varivel X +Y.
b. Calcule P(U : 4lV : L).
c. Determine a mdia e a varincia para cada uma das varivel X eY .
c. Determine Cov(U,V).
34. Considere duas variveis aleatrias independentes U-Po(2) e V-G(0,3). A
30. considere duas ua.iveis aleatrias discretas ,1, a/l,aoota que assume
" partir dessas variveis definimos outras duas da seguinte forma:
somente os valores ay, a2 e oJ, enquanto B os valore sl6 e b2. Sabemos que:
P(A: ot):0,2; P(A - or) : 0,,5 ; P(B: br) : 0,6; seU:0; seI/:0;
-_0l1 sel/)1: e Y: seI/:1;
P(A : a1,B :bt) : 0,,L2 e P(B : bz I A : as): 0,b,
\- {' seV ) 2.
a. Construa a tabela de dupla entrada entre A e B. a. Construa a conjunta de X e Y e determine Cov(X,Y).
b. As variveis so independentes? Justifique. b. Determine o valor esperado e a varincia de 2X - 3Y .
c. Calcule P(A: or l B: br).
35. Duas moedas so lanadas simultaneamente. Uma delas equilibrada e a
31. sejam x e Y independentes com funo de probabilidade G(0,5). Determine outra tem probabilidade 213 de sair face cara. Considere as variveis U: total
o valor esperado e a varincia de: de caras observadas eV uma Bernoulli que assume valor I se as duas faces
a.S: X+Y. so iguais.
b.D:X-Y. a. Determine a conjunta de U e V e verifique se so independentes.
b. Calcule a mdia e a varincia de 2U - V .
32. Baseando-se nas projees de preo de duas matrias primas, M1 e M2,
pretende-se estudar a viabilidade econmica do lanamento de um certo 36. (Use o computador) Com os dados das variveis altura e peso da Tabela 1.1
produto. A funo conjunta de probabilidade com os preos (em reais) do Captulo l:
apresentada a seguir. a. Verifique o grau de associao atravs do clculo do coeficiente de
correlao.
Mt\ Mz 5 I 13
b. Obtenha a mdia e o desvio padro para cada uma das variveis.
I 0,1 0 0
I
c. Calcule o coeficiente de correlao entre as variveis peso e altura
r) 0,1 0,2 012 padronizadas. Os valores da varivel padronizada so obtidos subtraindo-se
5 0 012 012 a mdia e dividindo-se pelo correspondente desvio padro. Compare com o
a. Determine o preo mdio e a varincia das matrias primas. resultado encontrado no item (a).
b. O produto usa 2 unidades de M1e 3 de M2. Qual seu custo mdio? .17. (Useo computador) Considere os dados apresentados no Exerccio 23 do
Captulo 1, onde, no item (b) foi definida a varivel Etrio.
I.1 Captulo 5 : Variveis Bidimensionais

n. crie uma tabela de dupla entracla, contendo Etrio nas linhas e Coag nas
colunas. Com base em tal tabela, reavalie se a presena de cogulos
Captulo 6

diferente dependendo da faixa etria.
b. Suponha que um paciente escolhido ao acaso.
Qual a probabilidade de que Variveis Aleatrias Contnuas
a pessoa apresentasse cogulos no momento de admissol E uma pessoa
de
faixa etria mais alta?
c. Voc diria que Coag e Etrio so independentes? por qu?
38. (Use o computador) Novamente com os dados do Exerccio 23 do Captulo (r.1 Introduo
1.
considere agotaavarivelCuracriadanoitem(c).
\ Neste captulo, discutiremos a Vracteriz4o de variveis cujos possveis
a. Crie uma tabela de dupla entrada com Cura nas linhas e Tratjm nas colunas.
b. com base na tabela do item (a), voc diria que neste caso,/rapidezda cura valores ocorrem aleatoriamente e pertencem a um intervalo dos nmerd's reais:
depende do tipo de tratamento considerado? Justifique. virriveis aleatrias contnuas. Renda, salrio, tempo de uso de um equipamento,
/ comprimento de uma pea e rea atingida por certa praga agreola so exemplos
c. Qual a probabilidade de que uma pessoa selecionada o u"uro tenha cura
rpida, dado que recebeu tratamento do tipo I ? dc quantidades que podem ser modeladas por variveis aleatrias contnuas. De
d. Qual a probabilidade de uma pessoa ter recebido tratamento do tipo I, dado lrrma semelhante quela desenvolvida. para variveis aleatrias discretas,
que teve cura normal? prccisamos estabelecer, para as contnuas, a atribuio de probabilidades s suas
cliversas realizaes que, neste caso, podem assumir um nmero infinito de
39. (use o computador) Responda os itens a seguir, baseado nos dados de vtlores diferentes. Abordamos esta questo no prgximo exemplo.
incidncia de cncer apresentados no Exercc io 24, captulo l.
a. utilizando a mediana da varivel GL, classifique os pacientes em dois Iixemplo .1.' Estudos anteriores revelam a existncia de um grande lenol de
grupos, de alta e de baixa taxa de glicose. Denote essa nova varivel por gua no subsolo de uma regio. No entanto, sua profundidade ainda no foi
Clagl e construa uma tabela de dupla entrada entre Clagl e ALB. Voc diria tlcterminada, sabendo-se apenas que o lenol pode estar situado em qualquer
que as duas variveis esto relacionadas de alguma forma? ponto entre 20 e 100 metros.
b. considere os valores da varivel Idade em trs grupos: jovem com at,25 Vamos supor que escolhemos, ao acaso, um ponto nessa regio e
anos (inclusive), meia idade para indivduos com idades entre 25 e 55 anos tlispomos de uma sonda que, ao fazer a perfurao, detecta com preciso a
(inclusive) e senior para maiores de 55 anos. construa uma tabela de dupla lrlofundidade do reservatrio de gua. Denotamos por X a varivel alearia
entrada para estudar o comportamento desses grupos em relao rcpresentand o a p rofundidade.
concentrao de fosfato, tirando as concluses pertinentes. Notemos que, apesar de X poder ser qualquer nmero entre 20 e 100
c. Escolhendo-se um paciente ao acaso, qual a probabilidade de que ele seja do nctros, o instrumento, com que trabalhamos, pode no ser to preciso como
grupo .falso-negativo, dado que tem mais de 50 anos? E ter acima liostaramos. Por exemplo, uma profundidade de 32,571 metros poderia ser
de 50 rrrcdida por 32,6 metros. Vamos assumir, entretanto, que temos um instrumento
irnos, dado que no do grupo falso-negativo?
itlcal que no faz aproximaes. Nessas condies, podemos supor a sonda
40. (use o computador) utilize as informaes do arquivo aeusp.txt, introduzido ;rcoplada a um instrumento indicador da profundidade e um dispositivo que,
no Exerccio 26 do Captulo 1. tlrrnndo a sonda encontrar gua, provoque a imediata interrupo da perfurao.
a. crie uma tabela de dupla entrada com as variveis comun e Renda. Voc Uma vez que no temos informaes adicionais a respeito da
diria que existe associao entre elas? lrronndidade do lenol, razovel assumirmos que a sonda pode parar em
b. Repita o item (a) para as variveis Reproce e Trab. rprnlquer ponto entre 20 e 100 metros, sem que tenhamos motivos para privilegiar
c. O que pode ser dito da associao entre nmero de residentes (varivel cssn oll aquela profundidade. Assim, consideraremos todos os pontos como
Resid) e idade que comeou a traballrar (varirvel Itrab),? igrralmcnte provveis. Se utilizarmos a mesma idia de atribuir a cada possvel
l6(t Captulo 6: Variveis Aleatrias 167
6,1 Introduo

ponto uma probabilidade, teremos uma dificuldade extra, pois eles pertencem
intervalo [20, 100], em que existem infinitos nmeros reais. Assim, se cada Densidade

cleles tiver, individualmente, probabilidade maior que zero, a soma


probabilidades ser igual a infinito e no 1, como requer a definio da funo
probabilidade. Em geral, em situaes como esta, no de intEresse conside
um nico valor para a vari..vel aleatria, mas intervalos de valores na atribui
dc probabilidades. Neste caso, sabemos que o espao amostral corresponde
intervalo [20, 100] e as profundidades so igualmente provveis. suponh, por
nomento, que dividimos o espao amostral em 8 intervalos de comorimento 1
Logo, razovel atribuir aos intervalos a probabilidade l/g,
us, corre$ondend,
corres\ondendo
relao entre o comprimento de cada um deles e o compri-"ntoldo
nmostral. Isto , 10 para 80 ou 1/8. Assim, com a diviso m s fzas de".p, is
comprimento e sem interseco entre elas, teremos os intervalo d po, 30),
20 30 40 50 0 70 80 90 100
40),..., [90, 100] todos com a mesma probabilidade l/g, pois tods tem o mes
termanho. O histograma mostra que, apesar de termos diferentes intervalos, a
Para construir um histograma, nos mesmos moldes do captulo clcnsidade permanece com o mesmo valor, igual a 1/80.
podemos supor que l/8 , a freqncia relativa da ocorrncia de cada um taumentando cada vez mais o
Podemos continuar esse procedimento,
irrtervalos. As ordenadas do grfico so as densidades, calculadas de modo que rrrnero de faixas, com a conseqente diminuio das suas amplitudes de tal forma
rea de cada retngulo seja a freqncia relativa (probabilidade) do intervalo. (ple, em uma situao terica com infinitos intervalos, temos o seguinte
Iristograma:
Densidade

Densidade de
Probabilidade

1/8 1/8 lta 1t8 1/8 'v8 1lA 118

100
Note que, dada as caractersticas do problema, a diviso em g intervalos
produziu o mesmo valor de densidade de l/80 para todos eles. Se dividirmos o
intcrvalo [20, 100] em l6 faixas iguais, utilizando o mesmo argumento anterior, Estamos agora em condies de caracterizar, completamente, a atribuio
tcrnos que os intervalos [20, 25), [25, 30), [30, 35), .. . , [95, 100] tero todos a rlc probabilidades para o caso contnuo. Ela ser definida pela fuea abaixo de uma
rosma probabilidade l/16. O histograma correspondente ser: I'uno positiva, denominada densidade de probabilidade. Observe que a
clcnsidade em si no uma probabilidade, mas uma funo matemtica que nos

Você também pode gostar