Você está na página 1de 91

I

)t,:

s'l'rt

l'Rr lttAtn,n)AI)E

l,lsllr olrr ir

rA

si<[o

('llnlir irrlrorlrtr.iru;t

[tlolrrrlrilirlirtlc c rt l,stlrtslit it, It'ttrlrr


llirlrot'ir<[l ;rirtir irlrrtros

rlrrs r'rrcirs

<k' < in< iirs lriolrigi< lrs, ('xlrlirs ('

hrrmanas. Ao

rrItr'trlo Mlrgalhes
lur l't'rlt'rlsrl <lc [,ima

corrtliilio rlt'

orr(rrrs

textos e lcrlc'1ir'('s, os ttilli<'os

<lc

Estatstica l)escritivir rriro lrarrr


apresentados en ur rnit o captrlo:

procurou-se

trodrrzir

csses conceil os

em paralelo corn outros tpicos mais


tericos no decorrer do livro. Desse
modo,.buscou-se desenvolver texto
de forma similar ao uso prtico da
Estatstica, quando normalmente um

conjunto de dados explorado


descritivamente antes da modelagem
e aplicao de tcnicas estatsticas.

No foi explicitado o uso de nenhum


software em

particular, uma vez que

procuro enfatrzar

se

as idias envolvidas

e no a habilidade computacional.

No obstante, vrios exerccios

apresentados ao {im de cada seo


e em uma seo especfica ao final

de cada captulo

assumem o uso de

computadores para sua resoluo

alguns conjuntos de dados mais


extensos so disponibilizados na
internet, o que estimula o

leitor

utilizar um programa computacional


com o qual tenha famiiariclade pan
ar

rxl

io ttits

t'csoltr'<-rcs.

)''

Prefcio da 6s edio

trpyrlglrt O hy Mulcos Nascinrcnlo Magalhcs c Arrtonio Carlos l)ctltoso clc Lima


l" r'rlio 1999 (lMli-tJSP)
( lMll-l.JSl')
.1" crlilio 2(X) I (lMli-tJSP)

Bste texto fruto da nossa experincia de vrios anos como professores

J'' r'rlt1'rlo 2(XX)

crliro 2(X)2 (lJclusp)


.1" crliro 2{X}2 (Ddusp)
(rn ctlilo 2(X)4 (liclusp)

lnlct nacionais dc Catalogao na Publicao (CIP)


(('inrala Ilrasileira do Livro, SP, Brasil)

Mttgrt lhilt's, Mitt cos Nascinrento

Nuiics rlc I'robabilidade c Estatstica / Marcos Nascimento


Mngllhitcs, nlonio Carlos Pcclroso cle Liml - ed. - So Paulo:
Jltlilurl tlu IJrtive lsichclc de So Paulo, 2004. - (Acadmica; 40)
lllhliogr';r

tstN

li,rt

t5-3 I 4-077-3

llstuclo e Ensino 2. Matemtica - Estudo e


- Estudo e Ensino I. Ttulo IL Srie.

L listltsticl -

lirrsirur 3. loltabiliclaclcs

cDD-5 t 9.507

t,1 0.171

ndicos para catlogo sistemtico:

l,
2,

l1\lirlslicl: Matcnriitica: Estudo e Ensino 519.507


lolrlhilitlrtilcs c Estatstica: Materntica:
lisluclo c

I)ll'cllns lcsclvltlos

Errsino

519.507

lklusp lulitrtrt tll

[Jnivclsidade de So Paulo
l,rrciarto Gualbclto, Tlavcssa J,374
('untlll lltl. rll ntiga leitoria - Cidade Universitria
0550tl U{X) .- Sio l'uulo - SP - Brasil
I)ivisalo (lrrucrcial: tcl. (Oxxl l) 3091-4008 / 3091-4150
SA(l (0xxl l) 3091-291 I - Fax (Oxxll) 3091-4151
www,rrsp,lrr'/ctlusqr - c-mail: edusp@edu.usp.br

Av,

{i

lrrl,

Coutro d Ciaerap Ldarcai{h a


do *hrreln

Iiibirotecl

ll.. :;,gil''rs

4658108

cr|sEra
lrrslilulo rlc Mllcnttica c Estatstica - IME-USP
l0l0 - Cidadc Universitria
0-55()t1"9(X) - S;io I'aulo - SP - Brasil
l)cplrlnnlcnt( tlc listatstica - Tel. (Oxxl l) 3091-6129 / 3091-6130
('uixil lrslIl (r(),2tI - 05315-970
rvww, irrx',rrsgr,lrr'/*ttoproest - c-mail: noproest@ime.usp.br
Ituil rkr Millikr,

l irt('(l iil

llril/il

lroi leito o

rlt'1tr1silo lcgal

l(X)4

0\/0s

cl

eln
Departamento de Estatstica do Instituto de
Unversidade de So Paulo. Nesse perodo, foram ministradas diversas disciplinns
lrrsicas de Estatstica para cursos nas reas de Cincias Humanas, Exatns e
Biolgicas.
Buscamos enfatizar dois aspectos neste livro. O primeiro se refere $
rcpartir a Estatstica Descritiva ao longo do texto, suavizando, assim, a transiilo
pari Probabilidade e Variveis Aleatrias. Em geral, os alunos sentem o impacto
<le uma maior formalizao e, muitas vezes, no conseguem estabelecer o elo clc
ligao entre essas partes. Um segundo interesse transmitir a importncia dn
colrputao na Estatstica. No atrelamos o texto a nenhum softvvare espec:ico,
permitindo que o conhecimento computacional anterior dos estudantes pudesse ser
incorporado, minimizando o desgaste de um novo aprendizado. Ressaltamos qUe
vrios software disponveis no mercado podem ser utilizados. Os arquivos
mencionados no decorrer do livro esto disponveis em www.ime.usp.br/-noproest
juntamente com outras informaes de interesse'
O livro contm exerccios ao final de sees e captulos. Os exerccios de
seo so mais diretos e visam a aplicao imediata dos conceitos discutidos. Ao
fim de cada captulo, um considervel nmero de exerccios ajuda os estudante$ nll
fixao global das idias apresentadas. Tambm so propostos exerccios ptlrn
serem desenvolvidos com a ajuda do computador. O principal objetivo desses
exerccios, enfatizar as idias estatsticas envolvidas e no a habilidncle
computacional. No Apndice'8, "apresentamos as solues comentadas dos
exerccios de so e fornecems as respostas para os exerccios mpares de fim de
captulo.
Em relao edio anterior, a sext edio apresenta pequenfls
rnodificaes. Uma das figuras do Captulo 7 foi mudadapara o Captulo 6, locnl
que nos pareceu mais apropriado. Foram acrescentados exerccios em alguns
captulos. Os erros em respostas, identificados at ento, foram corrigidos,
Pequenas alteraes de redao tambm foram feitas. As mudanas, em relaO t
quinta edio, esto listadas no endereo Internet mencionado acima.
Ao longo das vrias ediges, diversos colegas contribuiram com sugestes,
Entre eles destacamos Adilson Simonis, Cludia Monteiro Peixoto, Cllia Tsloi,
Denise Botter, Elisabeti Kira, Elisete da Conceio Q. Aubin, Julio da Mottt
Singer, Lighia B. Horodynski-Matsushigue, Lcia P. Barroso, Marli Mikael,
Nelson Tanaka, Rinaldo Artes e Silvia Ferrari. Maria Ceclia Camargo Magalhies

Matenttica

,1"

l )utkrs

"

vrt

Estatstica

Prefcio

vlu

colnborou na reviso final da redao. A estudante Tatyana Maya Okano auxiliou


nn COrreo das respostas de vrios exerccios. Apontamos, ainda, o recebimento
CJc vrrias mensagens eletrnicas com comentrios e/ou sugestes. A todos que
Colnboraram, o nosso sincero muito obrigado. Agradecemos, ainda, aos alunos de
vlrias unidades da USP, que apontaram erros e deram sugestes. Finalmente,
gostaramos de agradecer a Lus Ricardo Cmara, da ADUSP- Associao dos
Docentes da USP, pela diagramao das tabelas e auxlio na arte final de algumas
dns figuras apresentadas no texto.

Pedimos, desde j, desculpas pelos erros que sero eventualmente


identificados nesta nova edio. As crticas e sugestes de colegas e estudantes
gcro muito bem-vindas e, certamente, auxiliaro na rnelhoria da prxima verso.

Contedo

So Paulo, janeiro de2004

e Antonio Carlos P. Lima


(marcos @ime.usp.br) (acarlos@ime.usp.br)

Marcos N. Magalhes

'
'

t"r

Contedo

Lista de Defnies

2.4

......,........
Probabilidade condicional .............
Independncia de eventos.......
Partio do espao amostral

3.r

Funo discreta de probabilidade ...........

3.2

4.1

probabilidade
Modelo Uniforme Discreto ........;..........
Modelo Bernoulli ...................
Modelo Binomial
Modelo Geomtrico
Modelo Poisson
Modelo Hipergeomtrico ...........
Medidas de posio para um conjunto de dados

4.2

Medidas de posio para variveis aleatrias discretas ........................... 98

4.3

5.1

dados
Varincia e desvio-padro em um conjunto de dados
Varincia de uma varivel aleatria discreta
Funo de probabilidade conjunta ...............

5,2

Probabi lidade condicional para variveis aleatrias discretas ............... 137

.5.3

Independncia de variveis

5.4

Correlao entre variveis num conjunto de dados brutos ...........,.......,.

5.5

Covarincia de duas variveis

.5.(r

Correlairo entre variveis

2.r
2.2
2.3

3.3

3.4
3.5

3.6
3.7
3.8

4.4
4.5

Probabilidade

.................... 38
..................,,,42

.........,44
............46

Funo de distribuio de

Amplitude de uma varivel em um conjunto de

aleatrias

aleatrias
aleatrias .................
..t-,

............63
..............68
......... 70
................... ..........72

......78

......,,,,,,79
.....,82

.......,..,......,,94

....,.. 103
......... 104
....109

..,..128

..........,... 137

l4l

.........,147
................,.149

Lista de Definies

xu

Lista de Figuras

6.5

...........
...... 168
Medidas de posio paravariveis aleatrias contnuas
.....I73
.....................1,73
Varincia paravariveis aleatrias contnuas
..........177
Modelo Uniforme Contnuo
.....180
Modelo Exponencial .................

1.3

....'..'.......
Exemplos de grficos publicados na imprensa

6,6

Modelo Normal

t.4

DiagramacircularparaavarivelToler.....'.'. .'.....'..""""""13

7,1

Parmetro

1.5

Grfico de barras paa avarivel Idade

7,2

Estimador e estimativa

.................. 208

7.3

Vcio

.........
Consistncia ................
Eficincia

..................213

6.1

6,2
6.3

6.4

7.4
7,5

Funo densidade de probabilidade

...................213
....................216

1.1

r.2

Populao e amostra

Classificao de variveis

........"'."",.,',

..:'....."""""" l2

5.1

......."""':"""" 14
......'..
.'..'.......'.15
Histograma paraavarivel Peso .'.'....'.
...'........""""" 18
Box-plot para o nmero de laranjas por caixa
....'.....".'.....18
Box-plot para a varivel Peso '.....'...
.'.'......'."...'..'........ 19
Box-plotda varivel Peso para cada sexo
....'.,'..' 39
Regra de adio de probabilidades .'.......
....',,,,43
Regra do produto de probabilidades .'.......
,...,.,45
rvore de probabilidades ......'..
.'....,""""" 46
Partio do espao amostral (k : 6)
...........'.,..60
rvore de probabilidades - alteraes no subsolo
...........65
Funo de distribuio - doses de vacina
.'...'...'.......,..,69
Modelo Uniforme Discreto [0, 10]
.'."...'..'.........75
Grfico de freqncias - natalidade em porcos
..'.'7g
Modelo Geomtrico (P: 0,0t)
Modelo Poisson ( : 5)
"..........."'.80
Independncia de variveis aleatrias
'.....'.".."137

5.2

Valor esperado da soma de variveis aleatrias ..'.'.'.':"'......"'.......'....'. 145

5,3

Valor esperado do produto e independncia de variveis aleatrias ..,..146

.5.4

Correlao para conjuntos de dados (brutos)

5,.5

Covarincia e correlao de variveis

t.6
1.7
1.8

r.9
2,1

2.2
2.3

2.4
3.1.

3.2
3.3

3.4
3.5
3.6

xtu

.'.'.'....'.".
aleatrias

'.'....151

..'.............

l5l

'

.qft
I'islu ilct liigrtnts

rlv

5,6
6,1
6,2
6,3
6.4
6.5
7.l
7.2
8.1

Varincia da soma de duas variveis

aleatrias

Contnua
Densidade Exponencial """"""""'
Densidade Normal

Densidade Uniforme

""""""""" 151
""' 178
"""""""""'180
""' 183

Binomial
""""""""' 189
190
Histogramas para valores simulados da Binomial """"""""""""""""'
Efeito de n na distribuio amostral de X - N(10,I6/n) """"""""""22I

Aproximao Normal para o Modelo

de
Efeito do tamanho da amostra sobre a distribuio

Erros associados a testes de hipteses

X """"" """"""224
""""""'248

8'2Representaogrficadoserrosd'ep.,.'.....
8,4Representaogrf\cadaregioderejeio-bilatera1
Funo

Poder

""""""'254

"""""""""'

EtaPas de um teste de hiPteses

Densidade -

Student

Nvel descritivo unilateral

"""""""

Regies desfavorveis num teste bilateral

"""""""'
.f e Regio Crtica

Nvel descritivo bilateral


Densidade

""""""""""'259
"""""""""264
com Hoi F : Fo """"""""'265
"""""""""'266
""'27O

"""""""'

9.1

Cirsos na comparao de duas amostras

9.2

Distribuio de Fisher-

9.3

Resduos no modelo de regresso linear simples

Snedecor

"""""'1
.l lnformaes de questionrio estudantil - dados brutos
"""""""""' 9
1.2 Tubela de freqncia para a varivel Sexo """""
""""""""' 10
1,3 Tlbela de freqncia para a varivel Idade ""'""
""""""""" I
1,4 Tabela de freqncia para a varivel Peso """""
L5 TabeladefreqnciaparaavarivelTV""""""' """"""""'1l
"""" 100
4,1 Meclidas de tendncia central
"""""""""" 11
4,2 Medidas de disperso
""""""""" 11
4,3 Propriedades da mdia e da varincia """""""'
I l3
4,4 Modelos discretos- valor esperado e varincia """"""""""""""""""" 187
e varincia """"""""""""""""""'
Modelos contnuos- valor esperado
6, I
"""''"""""211
7,l Estimadores para mdia' proporo e varincia
""""'234
p
Intervalos de confian apaa p e """""
1 ,2
9,I Comparao de mdias para duas populaes """"""""""309
""' 326
g,2 Tnbela de Anlise de Varincia (ANOVA)

S.3Representaogrficadaregioderejeio-unilateral...,.250

8.5
8,6
8.7
8.8
8.9
8. l0
8.1 I

Lista de Tabelas

"""""""'295
""""""""""'317

""""""""':""""""""'335

Captulo

Introduo Anlise Exploratria de Dados


t.1 O que Estatstica?
Neste captulo, pretendemos formalizar alguns conceitos que constitucrn tt
base de tcnicas desenvolvidas com a finalidade de auxiliar a responder, de I'ortrtit
objetiva e segura, situaes que envolvem uma grande quantidadc dc
irrformaes. A utilizao dessas tcnicas, destinadas anlise de situitcs
complexas ou no, tem aumentado efaz parte de nosso cotidiano. Tome-sc' pof

cxemplo, as transmisses esportivas. Em jogos de futebol, o nmero cle


cscanteios, o nmero de faltas cometidas e o tempo de posse de bola so daclos
geralmente fornecidos ao telespectador e fazem com que as concluses sobre qunl

time foi o melhor em campo, se tornem objetivas (no que isso impliqlle que
tcnlra sido o vencedor...). O que tem levado a essa quantificao de nossas viclus
no dia a dia? Um fator importante a populatizao dos computadores. No
passado, tratar uma grande massa de nmeros era uma tarefa custosa e cansativtt,
que exigia horas de trabalho tedioso. Recentemente, no entanto, grnnCle
quantidade de informaes pode ser analisada rapidamente com um computudor

pessoal e pfogramas adequados. Desta forma, o computador contribui,


positivamente, na difuso e uso de mtodos estatsticos. Por outro lado, o
computador possibilita uma automao que pode levar um indivduo ser prepilro

especfico a:utilizar tcnicas inadequadas para resolver um dado problema. Assitrt,


necessrio a compreenso dos conceitos bsicos da Estatstica, bem como 0s
suposies necessrias para o seu uso de forma criteriosa. Entendemos it
Estatstica como um conjunto de tcnicas que permite, de forma sistemtictt,

organizar, descrever, analisar e interpretat dados oriundos de estudos tltt


experimentos, realizados em qualquer rea do conhecimento- Estatrtos
denominando por dados um (ou mais) conjunto de valores, numricos ou nito. A
aplicabilidade das tcnicas a serem discutidas se d nas mais variadas rels tln
atividade humana.
A grosso modo podemos dividir a Estatstica em trs reas:
o Estatstica Descritiva
o Probabilidade
o Inferncia Estatstica

Captulo 1: Introduo Anlise Exploratria de Dados

Estatstica Descritiva , em geral, utilizada na etapa inicial da anlise,


cprlndo tomamos contato com os dados pela primeira vez. Objetivando tirar
concluses de modo informal e direto, a maneira mais simples seria a observao
tlos valores colhidos. Entretanto, ao depararmos com uma grande massa de dados,
lrcrcebemos, imediatamente, que a tarefa pode no ser simples. Para tentar
depreender dos dados informaes a respeito do fenmeno sob estudo, preciso
irplicar alguma tcnica que nos permita resumir a informao daquele particular
conjunto de valores. Em outras palavras, a estatstica descritiva pode ser definida
coto urn conjunto de tcnicas destinadas a descrever e resumir os dados, a fim de
quc possamos tirar concluses a respeito de caractersticas de interesse.
Probabilidade pode ser pensada.como a teoria matemtica utilizada para
sc cstudarr a incerteza oriunda de fenmenos de carter aleatrio. Apesar de ser
urrrn rrea extremamente atraente e estudada do ponto de vista matemtico,
abordaremos, aqui, apenas os aspectos necessrios para as tcnicas estatsticas
irprcsentadas neste livro.
Inferncia Estatstica o estudo de tcnicas que possibilitam a
cxtrapolao, a um grande conjunto de dados, das informaes e concluses
obtidas a partir de subconjuntos de valores, usualmente de dimenso muito
ffenor. Deve ser notado que, se tivermos acesso a todos os elementos que
clesejamos estudar, no necessrio o uso das tcnicas de inferncia estatstica.
Entretanto, elas so indispensveis quando existe a impossibilidade de acesso a
todo o conjunto de dados, por razes de natureza econmica, tica ou fsica.
Estudos complexos que envolvem o tratamento estatstico dos dados,
tusnalrnente, incluem as trs reas mencionadas acima. Na terminologia estatstica,
o grande conjunto de dados que contm a caracterstica que temos interesse
reccbc o nome de populao. Esse termo refere-se no somente a uma coleo de
inclivcluos, mas tambm ao alvo sobre o qual reside nosso interesse. Assim, nossa
populniro pode ser tanto todos os habitantes de Sorocaba, como todas as
lrnpaclas produzidas por uma ftbrica em um certo perodo de tempo, ou todo o
sargue no corpo de uma pessoa. Algumas vezes podemos acessar toda a
po;lulao para estudarmos caractersticas de interesse, mas, em muitas situaes,
tal llroccciirnento no pode ser realizado. Em geral, razes econmicas so as mais
clctclrninantes dessas situaes. Por exemplo, uma empresa, usualmente, no
dispo clc vcrba suficiente para saber o que pensam todos os consumidores de
scus proclutos. Hir ainda razes ticas, quando, por exemplo, os experimentos de
lttlornttilio cnvolvem o uso de seres vivos. Alm disso, existem casos em que a
irnpossillilitltclc clc sc accssrr toda a populao de interesse incontomvel. Na
tndlisc rlo sirngr"rc cle unra pessoi ou em um experimento para determinar o tempo

l.lOqueEstatstica?

cle funcionamento das lmpadas produzidas por uma indstria, no podemOS


observar toda populao de interesse.
Tendo em vista as dificuldades de vrias naturezas para se observal todos
os elementos da populao, tomaremos alguns deles para formar um grupo i Ser
cstudado. Este subconjunto da populao, em geral com dimenso sensivelmentC
rrenor, denominado amostra. A Figura 1.1 ilustra as etapas da anlige
cstatstica.

Amostra

Figura 1.1: Populao

e amostra.

A seleo da amostra pode ser feita de vrias maneiras, dependendo, entre


()lrlr'os htores, do grau de conhecimento que temos da populao, da quantidade
rlc rccursos disponveis e assim por diante. Devemos ressaltar que, em princpio, A
sr:lciro da amostra tenta fornecer um subconjunto de valores o mais pareciclo
possvcl com a populao que lhe d origem. A amostragem mais usada a
(rtt!o,\lru r:ustral simples, em que selecionamos ao acaso, com olt sem reposi:o, os
ilcrrs da populao que faro parte da amostra.

Eventualmente, se tivermos informaes adicionais a respeito cltt


lrrrlrrrlirlio de interesse, podemos utilizar outros esquemas de amostragem muis
so'isticuclos. Por exemplo, se numa cidade, tivermos mais mulheres do clue
111y111lrs, podernos selecionar um certo nmero de indivduos entre as'mulheres e
outl'o nnrero entre os homens. Esse procedimento conhecido colno
(tt,toslt'o!:ct"tt. astraificada. Outras vezes, pode existir uma relao numeradl dOS

-"--qt
Captulo

I:

Introduo Anlise Exploratria de Dados

itens da populago (uma lista de referncia) que nos permitiria utilizar a chamada
1mostragem sistemtica em que selecionamos os indivduos de forma prdeterminada, por exemplo de 8 em 8 ou de 10 em 10. Outros esquemas de
ilmostragem poderiam ser citados e todos fazem parte da chamada Teoria da

Amostragem, cujos detalhes no sero aprofundados neste livro. Assim sendo,


terminamos esta seo mencionando que quanto mais complexa for a amostragem'
maiores cuidados devero ser tomados nas anlises estatsticas utilizadas; em
contrapartida, o uso de esquemas de amostragem mais elaborados pode levar a
uma diminuio no tamanho de amostra necessrio para uma dada preciso.

Exerccios da Seo 1.L:

valores numricos.

c.

Sempre que estivermos trabalhando com nmeros, deveremos utilizar a


Inferncia Estatstica.
A Estatstica Descritiva fornece uma maneira adequada de tratar um
conjunto de valores, numricos ou no, com a finalidade de conhecermos o

fenmeno de interesse.
d. Qualquer amostra representa, de forma adequada, uma populao.

e. As tcnicas

estatsticas no so adequadas para casos que envolvam

experimentos destrutivos como, por exemplo, queima de equipamentos,


destruio de corpos de provas, etc.

descritas a seguir, identifique a populao e a amostfa


a validade do processo.de inferncia estatstica para
Discuta
correspondente.
cada um dos casos.
a. Para avaliar a efic'cia de uma campanha de vacinao no Estado de So
Paulo, 200 mes de recm-nascidos, durante o primeiro semestre de um
dado ano e em uma dada maternidade em So Paulo, foram entrevistadas a
respeito da ltima vez em que vacinaram seus.filhos.
b. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
c. Para verificar a audincia de um programa de TV, 563 indivduos foram
entrevistados por telefone com relao ao canal em que estavam

2, Para as situaes

sintonizados.

d. A fim de avaliar a inteno de voto para presidente dos brasileiros,


pessoas foram entrevistadas em Braslia.

3. Discuta, para cadaum dos casos abaixo, os cuidados que precisam ser tomadOa
para garantir uma boa concluso a partir da amostra.
a. Um grupo de crianas ser escolhido para receber uma nova vacina contra

meningite.
b. Sorteamos um certo nmero de donas de casa, para testar um novo

sabEO

en

p.

c. Uma fbrica deseja saber se sua produo de biscoitos est com o ssbof
previsto.
d. Aceitao popular de um certo projeto do governo.

1.2 Organizao de Dados

1. Classifique em verdadeiro ou falso as seguintes afirmaes:


a. Estatstica um conjunto de tcnicas destinadas aorganizar um conjunto de

b.

1.2 Organizao de Dados

122

Nesta seo, discutiremos alguns procedimentos que podem ser utilizados

pnrt organizar e descrever um conjunto de dados, seja em uma populaO OU em


ulB omostra. Veremos como conceitos relacionados Teoria das Probabilidades
11pnrecem naturalmente, levando-nos, assim, a uma exposio maiS criteriosa dO
Rssullto.

A questo inicial : dado um conjunto de dados, como "tratar" os vttlofeE,


nurnricos ou no, a fim de se extrair informaes a respeito de uma ou mAlC
elllctcrsticas de interesse? Basicamente, faremos uso de tabelas de freqnclas e
grc'('icos, notando que tais procedimentos devem levar em conta a natUreZ& dO
dnelos,

Suponha, por exemplo, que um questionrio foi aplicado aos alunog do


prirneiro ano de uma escola fornecendo as seguintes informaes:

Id:
Turma:

Scxo:
Iclade:

Alt:

Peso:

lilhos:
lumn:

Toler:

identificao do aluno
turma a que o aluno foi alocado (A ou B)
F se feminino, M se masculino
idade em anos
altura em metros
peso em quilogramas
nmero de filhos na famli'a
hbito de fumar, sim ou no

tolerncia ao cigarro:

(I) indif'erente, (P) incomoda pouco e (M) incomoda muito

. -Edl

Captulo

Exerc:
Cine:
OpCine:

TV:
OpTV:

I:

Introduo Anlise Exploratria de Dados

horas de atividade fsica, por semana


nmero de vezes em que vai ao cinema por semana
opinio a respeito das salas de cinema na cidade:
(B) regular a boa e (M) muito boa
horas gastas assistindo TV, por semana
opinio a respeito da qualidade da programao na TV:
(R) ruim, (M) mdia, (B) boa e (N) no sabe

O conjunto de informaes disponveis, aps a tabulao do questionrio


ou pesquisa de campo, denominado de tabela de dados brutos e contm os
daclos da maneira que foram coletados inicialmente. Os valores obtidos para cada
uma dessas informaes esto apresentados na Tabela 1.1. Cada uma das
Caractersticas perguntadas aos alunos, tais como o peso, a idade e a altura, entre
outras, denominada de varivel. Assim, a varivel Altura assume os valores
(em metros) 1,60; 1,58;... e a varivel Turma assume os valores ou B.
Claramente tais variveis tm naturezas diferentes no que tange aos possveis
valores que podem assumir. Tal fato deve ser levado em conta nas anlises e, para
fixar idias, vamos considerar dois grandes tipos de'variveis: numricas e no
numricas. As numricas sero denominadas quantitativas, ao passo que as no
numricas, qualitativ as.

varivel qualitativa quando os possveis valores que assume


representam atributos e/ou qualidades. Se tais variveis tm uma ordenao
natural, indicando intensidades crescentes de realizao, ento elas sero

ctassificadas como qualitativas ordinais. Caso contrrio, quando no possvel


estabelecer uma ordem natural entre seus valores, elas so classificadas como
qualitativas nominais. Variveis tais como Turma (A ou B), Sexo (feminino ou
masculino) e Fuma (sim ou no) so variveis qualitativas nominais. Por outro
lndo, variveis como Tamanho (pequeno, mdio ou grande), Classe Social (baixa,
rndia ou alta) so variveis qualitativas ordinais.
Variveis quantitativas, isto , variveis de natureza numrica, podem ser
subdivididas em discretas e contnuas. A grosso modo, variveis quantitativas
discretas podem ser vistas como resultantes de contagens, assumindo assim, em
geral, valores inteiros. De uma maneira mais formal, o conjunto dos valores
assumidos finito ou enumervel. J as variveis quantitativas contnuas
assumem valores em intervalos dos nmeros reais e, geralmente, so provenientes
de uma mensurao. Por exemplo, Nmero de Irmos (0, I,2, ...) e Nmero de
Def'eitos (0, 1,2,.,.) so discretas, enquanto que Peso e Altura so quantitativas
contnufls.

1.2 Organizao de Dados

Tabela 1,1: Informaes de questiondrio estudantil - dados brutos,


.[d Turma Sexo Idade AIt Peso Filh Fuma Toler Exer Cine Opcine TV

1.AF
2AF
3AM
4AM
5AF
6AM
7\F
BAF
9F
IOAF
11 F
12 A F
13 A F
T4AM
15AF
16AF
LTAF
1g M
19 A F
30 A F
11 A F
22F
33 F
24AF
25 A F
B6 A
3'/ B F
3E B F
39 B F
30 E F
31 B F
3 E M
3 B F
34 ll F
1E li M
16 t! Ir
1't 11 M
t1 M
19 11
4r.) B M
41 t] F
4 Fr F'
41 HM
44DF
4F F F
4 E TI
478Iil
4E H F
S H M
h0 11 M
F.

1,'

19

L,60 60 ,5
1,69 55,0
L,85 12,8
l-, 85 80, 9
1", s8 55, 0

19

1_,76

1,7

18
1,8

20
l-8
t_8

T7

l-8
18
a1

I9
18
t-9
L7
1"8

20
l_8

2L
18
L8

20

)^
L9

z3
18

18
25
18
17
T7

L7
J.

18
77
2L
10

1A

L7
23
24
L8
18
L9
19

18

t7
1B

60,0
1,60 58.0
L,64 41,0
L,62 57,8
t,64 58,0
r,72 70,0
L,66 54,0
L,70 58,0
1, 78 68, 5
1,65 63,5
7,63 47 ,4
1.,82 66 ,0
1-,80 85,2
1,,60 54,5
L,68 52,5
1.,70 60,0
1,65 58,5
1,57 49 ,2
L,55 48,0
1.,69 57,6
L,54 51,0
L,62 63 ,0
L,62 52,0
L,57 49,0
t,65 59,0
t,6L 52,0
L,71. 73 ,0
t,65 56,0
r,67 58,0
1",73 87,0
r,60 47,0
1,70 95,0
L,85 84,0
1,70 60,0
1,73 '73 ,0
1,70 55,0
1,45 44,0
I,76 75,0
1,68 55,0
1,55 49,0
1,70 50,0
1,5s 54,5
r., 60 50, 0
L,8o 71,o
1,83 86,0

2
1
2
2
l3
1
3-

3
2

L
3
2

ll3

3
2
1
1
1
2
2
2

1
2

4
1-

L
3
L

t
1
1
1
1
1
2
2
1
1

7
2

I
1
L

NAO
NAO
NAO
NAO

P
M
P
P
M
M
P

NAO
NAO

M
M

NAO
NAO

M
M

NAO
NAO

M
P
M

NAO

NAO

NAO
NAO

SIM I
SIM I

SIM I
NAO I
NAO P
NAO P
NAO P
NAO P
NAO

SfM I
SIM T

NAO I
NAO
NAO
NAO
NAO

NAO
NAO
NAO
NAO
NAO
NAO
NAO

SIM

P
P
M

P
P
M
M
M
P
P
T

NAO P
NAO M
NAO f
NAO M

NAO I

NAO
NAO
NAO
NAO
NAO
NAO

NAO

P
M

M
M
P
P
P

0101
52
52

81.6R
B7R
M1.5R
B20R
B5R

a1

13

3l22
102
02
6t
5l_
4101
31
34
11
1)

82
03
54
01
62
82
1"1
3L
12
22
1L
21
42
7L
51
1-0
64
52
4L
54
))
70
51
01
01
43
2L
"t0
70

OpTV

B7R
MlOR
M1-2R
MlOR
B8N
BOR
M
30
M2N
BlOR
B18R
BlON
BlOR
B5R
B14M
B5R
B5R
BlOR
M
28
M4N
B5R
M5R
MlOR
BL2R
M2R
M6N
B
20
BL4R
BlOR
B25B
M14R
M12N
B],OR
BT2R
B2R
BlOB
B
25
M1.4N
B8R
MlOR
B8R
B3R
B5R
M1.4R
M 20

.b{

Captulo

I:

Introduo Anlise Explorarta de Dados

Resumimos a classificao das variveis no esquema apresentado na


Figura I.2 (attulo de exerccio, tente classificar todas as variveis da Tabela 1.1).

1.2 Organzao de Dados

Apesar de conter muita informao, a tabela de dados brutos pode nO Sef


prtica pu.u r"rpondermos s questes de interesse. Por exemplo, da Tabela 1'1

rriro

imediato dizer se os alunos se incomodam muito ou pouco com Os

l'umantes. Porlanto, a partir da tabela de dados brutos, vamos construir UmO nOvtl

Nominal

'
Varivel

-.ordinal

-a"Qualitativa

liSura

'Quantitativ u

1--""-Discreta

.-,contnua

1.2: Classificao de varidveis.

Vale ressaltar que, em muitas situaes prticas, a classificao depende


de certas particularidades. Por exemplo, a varivel ldade, medida em nmero de
anOS, pode ser vista como discreta, entretanto, Se levarmos em conta os dias, no
absurdo falar que a idade 2,5 ou 2,85 anos, dando assim respaldo para classificla como contnua. Por outro lado, dependendo da preciso do instrumento
utilizado para se obter medidas em um objeto, podemos ter limitaes no nmero
cle casas decimais e uma varivel de mensurao pode se "tornar" discreta. E
importante salientar que a classificao apresentada acima se refere natureza da
varivel e, em geral, devemos utilizar o bom senso na hora de decidir qual
procedimento adotar para caracterizar uma varivel. Para salientar tal fato,
menciOnamos que podemos, inclusive, discretizar uma varivel contnua para
obter uma melhor representao da ocorrncia de seus valores no conjunto de

t1$ela com as informaes resumidas, para cada varivel. Essa tabela Sefd
clenominada de tabela de freqncia e, como o nome indica, conter os valOfeg dA
virrivel e suas respectivas contagens, as quais so denominadas freqnelAEq
ttbsolutas ou simplesmente, freqncias. No caso de variveis qualitativas OU
tprantitativas discretas, a tabela de freqncia consiste em listar os valorog
possveis da varivel, numricos ou no e fazer a contagem na tabela de dadOg
lrrutos do nmero de suas ocorrncias. Representaremos por n; a freqncia dq
vulor i e por ?? a freqncia total. Para efeito de comparao com outros grupOS
ou conjunos de dadoi, ser conveniente acrescentarmos uma coluna na tabela de
l.oqncia contendo o clculo da freqncia relativa, definida por fi = U/t\:,
Convm notar que, quando estivermos comparando dois grupos com relaO S
freqiincias de ocorrncia dos valores de uma dada varivel, grupos cgm Um
nmero total de dados maior tendem a ter maiores freqncias de ocorrncia dos
vtlores da varivel. Desta forma, o uso da freqncia relativa vem resolver Bte
problema.

A Tabela 1.2 apresenta


cln

as freqncias para a varivel Sexo, obtida a

p0rtir

Tubela I .1.
Tabela 1.2: Tabela

de

freqnca para a varivel Sexo.

Sexo

n,i

.t

F
M
total

t t'7
d

13

0,74
0,26

n:50

dirclos.

Outro ponto que pode trazer confuso que, muitas vezes, na utilizao
Cle programas computacionais, associamos cdigos numricos a uma varivel
qqalitativa. Por exemplo na Tabela 1.1, pode-se associar ao sexo feminino o valor
I e ao masculino 2. Apesar da varivel ser representada por valores numricos,
issO no a torna uma varivel quantitativa. Novamente, vemos que a natureza da
vnrivel deve sempre ser levada em conta na hora de se interpretar resultados
obtidos na anlise descritiva.

Note que, para variveis cujos valores possuem ordenao n0tufel


(eluglitltivas ordinais e quantitativas em geral), faz sentido incluirmos tambm
urttrt coluna contendo asJreqncias acumuladas r,,'' Afreqncia acumulada at&
un1 cefto valor obtida pela soma das freqncias de todos os valores da varivel,
tncnorcs ou iguais ao vator considerado. Sua utilidade principal ajudor o

estu$eleccr pontos de corte com uma determinada freqncia nos valores da


vurivel. Poi exemplo, na Tabela t .3, observamos que 907o dos alunos tm idadcs
rrt 2l unos, cle fato 22, um vez que este valor tem 'reqiincia zero.

l0

Captulo 1: Introduo Anlise Exploratria de Dados

L2 Organizao

il

de Dados

Tabela 1.4: Tabela


Tabela 1.3: Tabela

de

de

freqnca para a vardvel Peso.

freqncia para a varvel ldade,

Idade

TLi

.ft

.f o"

L7

9
22

0,18
0,44

0,18

18
19

0,L4

20

2L

.1

0,08
0,06

22
t
ZJ

0,04
0,02
0,04

24

25

total

n:50

0,84
0,90
0,90
0,94
0,96

Com relao varivel Peso, lembremos que foi classificada como


quantitativa contnua e assim, teoricamente, seus valores podem ser qualquer
nmero real num certo intervalo. Aqui os valores variam entre 44,0 e 95,0 kg e
foram medidos com apenas uma casa decimal. Ainda assim, existe um grande
nmero de valores diferentes de modo que, se a tabela de freqncia fosse feita
nos mesmos moldes dos casos anteriores, obteramos praticamente os valores
originais da tabela de dados brutos. A alternativa que vamos adotar consiste em
construir classes ou faixas de valores e contar o nmero de ocorrncias em cada
laixa. Para a varivel Peso, usamos faixas de amplitude 10, iniciando em 40 kg.
Na Tabela 1.4, escolhemos incluir o extremo inferior e excluir o superior. Dessa
I'orma, a freqncia da faixa 40,0 F 50,0 no incluiu os alunos 46 e 48 que
tinham peso igual a 50,0 kg. A opo de qual extremo incluir pode ser arbitrtria,
n"os o importante indicar claramente quais so os valores que esto sendo
conterdos em cada faixa.
Apesar de no adotarmos nenhuma regra formal quanto ao total de faixas,
utilizarnos, em geral, de 5 a 8 faixas com mesma amplitude. Entretanto,
ressaltamos que faixas de tamanho desigual podem ser convenientes para
representar valores nas extremidades da tabela.

fl,4

lt.
0,16

0,16

60,0

22

0,44

0,60

l--

50,0
60,0
70,0
80,0
90,0

0,62
0,76

1,00

Peso

40,01-- 50,0

fo"

70,0

0,16

0,76

80,0

0,L2

0,BB

t--

90,0

0,10

0,98

100,0

0',02

1,00

50

total

Vamos estudar, agora, a situao em que a varivel por natureza


o conjunto de possveis valores muito grande. Por exemplo, a
vflrivel TV, definida como o nmero de horas assistindo televiso, tem valores
inteiros entre 0 e 30 e uma tabela representando seus valores e respectivas

cliscreta, mas

ieqncias seria muito extensa e pouco prtica. O caminho adequado, nesse caso,
trotar a varivel como se fosse contnua e criar faixas para representar seus
vulores. Assim, passamos a tratar como contnua uma varivel que seria,
originnlmente, classificada como discreta.
Tabela 1.5: Tabela

de

freqncia para a varivel TV.

TV

ni

.ft

0F-6

fu"

L4

0,28

0,28

12

t7

0,34

0,62

18

11

0,22

0,84

24

0,08

0,92

24l---136
total

0,08

1,00

50

61218 t-

A organizao dos dados em tabelas de freqncia proporciona um meio


cl'icitz cle estudo do comportamento de caractersticas de interesse. Muitas vezes, tt
irrbrnrao contida nas tabelas pode ser mais faci'lmente visualizada atravs dc
grrl'icos. Meios de comunicao apresentam, diariamente, grficos das mais
vlriidils formas para auxiliar na apresentao das informaes. rgos pblicos e
('nprcsos sc municiom de grrficos e tabelas em documentos internos e relatrios

TF

--- qFFF

t)

Cttpftulrt

l;

hilnxluiltt Antilise ll.rplorutrfu dt l)urlt*

de atividades e desempenho. Graas proliferao de recufsos grficos, cuja


Cnstruo tem sido cada vez mais simplificada em programas computacionais,

cxiste hoje uma infinidade de tipos de grficos que podem ser utilizados' Como
ilustra deste ponto, apresentamos na Figura 1.3 alguns grficos publicados em
rrgos de imprensa.

CIDIO

EVOLUO DO LUCRO tiQIDO


U$$ MII"HES

1,2 Organtzao de Dados

equivocodr, Obviamente, questes

ocorrer em qualque e,"7:


pr-requisitos indispensveis
divulgao tica e criterira de dados devem ser

p,id.*

inegocirveis.

pizza, barras t
vamos definir trs tipos bsicos de grficos: disco ou
pode sef
grfica
na
apresentao
li$t(,t4ruma. como dissemos, a criatividade
de
vrios'
entre
os grficos que discutiremos sintetizam trs caminhos,

inrerrsa e
representao.
'grfico

RU|AT

de manipulao incorreta da informao


n: cabe culpar a Estatstica' O uso e a

de d.isco, otr pizza, ou ainda diagrama

circular,

se adapta muito

em repartir um disco em setores


hem s variveis qualitativas nominais. consiste

RECURSOS PROPRIOS

circularescorrespondentessporcentagensdecadlvalor,calculadas
freqncia
exemplo, O,20 de
rnnltiplicando-se por 100 a freqnca relativ f6.Por
a207o o- u"' que 100 x 0'20:20' AFigura 1'4 apresenta
relativa
"o.r"rpond"
da Tabela 1.1. Note que
o cliagrama de disco para avarivel Tol-er, obljd^a.a .nartir
fntiir correspondent categoria "indiferente" foi destacada.

'

LLiPLTO

8,9

t5,9

12,

VALO|ES A-IUATIZADOS NOS IOIDES DA

No

D[

C0NTRATCS

E[/ SIR = 22'l 0

COR|EAO INEGRAI

RECURSOS HUN/ANOS

RECURSOS HUMANOS
DrsTRrBUrO POR ruvrL HtrnRRSUtCO

DISIRISUO POR ESCOLARiDADE

ls I t
e=
'

===

,=
TSCR

==

CAIMS
23,891

l. Gor
==

Figura 1.3: Exemplos

Figura 7.4: Diagrama circalar pard varilvel Toler'

==Gou ==
==
2

SuPeior

de grdficos publicados na im'prensa'

Deve ser notado, entretanto, que a utilizao de recursos visuais na


criao de grficos deve ser f'eita cuidadosamente; um grfico desproporcional em
suas medids pode dar falst impresso de desempenho e conduzir a concluses

ogrficodebarrasut\|\zaoplanocartesianocomosvaloresdavarivel
eixo das ordenadas'
no eixo das abiissas e as freqnciai ou porcentagens no
barra com altuf8
Note que pIia cada valor a varivel desenha-se uma
de grfico se adapta
,nrr"rptnd"rrdo sua freqncia ou porcentagem. Esse tipo
rnelhoi s variveis discretas ou qualitativas ordinais'

t4

Captulo

l:

Introduo Aruilise Exploratria de Dados

t5

1.2 Organizao de Dados

em cada faixa so homogeneamente distribudas, para um mesmo retngulo, fatias


de mesmo tamanho contm uma mesma porcentagem de observaes. Apesar do
suposio de homogeneidade no ser sempre verificada, ela bastante razovol
em muitas situaes e pode ser uma boa aproximao da realidade.
25

\r

20
.g

oc

$ru'

e15
E

t;

10

18 le 20
,1"
Fgura 1.5: Grftco de barras para a varvel ldade.

O histograma consiste em retngulos contguos com base nas faixas de


valores da varivel e com rea igual freqncia relativa da respectiva faixa.
Dessa forma, a altura de cada retngulo denominada densidade de freqncia oa
simplesmente densidade definida pelo quociente da reapela amplitude da faixa.
Para a varivel peso, as densidades de cada faixa podem ser obtidas dividindo-se a

da Tabela 1.4 por 10, que a amplitude de cada faixa. O histograma


correspondente a essa varivel apresentado na Figura 1.6. Note que inclumos,
no topo de cada retngulo, a porcentagem de observaes correspondente, para
ftci I itar a interpretao.
importante ressaltar que alguns autores utilizam a freqncia absoluta
porcentagem
na construo do histograma. Preferimos o uso da densidade de
ou
'eqncia, pois ela faz om que o histograma no fique distorcido, quando
amplitudes diferentes so utilizadas nas faixas. Uma outra vantagem diz respeito
relao entre histograma e grfico da funo densidade de probabilidade, que ser
visto mais adiante.
O histograma tambm pode ser utilizado no clculo da mediana (mdor,),
que o valor da varivel que divide o conjunto de dados ordenados em dois
subgrupos de mesmo tamanho, Isto , das observaes ordenadas, 507o esto
abaixo e 507o esto acima da mediana. Assumindo que as observaes da varivel

coluna

fi

/-'t'

40x

I
60
70
80
90
{)
.?- Peso
Figura 1.6: Histograma para a varivel Peso.

100

'

Exemplo 1.1.' Vamos calcular a mediana da varivel Peso atravs do histogram,


Inicialmente identificamos o retngulo que deve conter a mediana. Uma simplos
soma das reas resulta que a mediana pertence ao intervalo [50,0; 60,0), uma vsz
eluc at o valor 60,0 temos acumuladas 607o das observaes. Dentro dessa faixa,
precisamos determinar um retngulo com rea igual a 34Vo, que o que falta para
rringir o valor 50Vo. A situao ilustrada na figura a seguir, cujo retngulo
procurado est marcado com rea mais escura.
Com uso de propores, estabelecemos a seguinte igualdade:

- 50 _
0,34

mdor,,

f;,li4 .,t. r

),

60

- 50 lo

0,44

JJ-' i,!t
rn , 1-,

rtlt

,lr,

-,-'
,I''

"r'qr
Captulo 1: Introduo AnIise Exploratria de Dados

t6

I7

1.2 Organizao de Dados

.,,'60'--'^

q)

E
p

0,05

6r,'6
:
C,t\

(D

o,o+

''

',r"r''",'4'

0,03

o,o2

0,01

0,0
60

50
mdot,

Da segue qtte mdo6,

tr

: 57,73kg.

4'
O conceito de mediana, que ser considerado ern detalhes no Captulo
em
dividido

dados
pode ser generalizado para situaes em que o conjunto de
o
mais do q:ue dois subgrupos' Um caso importante aquele -em que dividimos
conjunto em quatro iubg*pot. Para tanto, deveremos determinar' alm da
de
rn"iunu, dois valores tais qu 25Vo das observaes ordenadas estaro abaixo
denominados'
so
um deles e 75Vo estaro abaixo do outro' Tais valores

respectivamente, primeiro quartil e terceiro quartil, Usualmente representados


poi 8r e Q3. Note que a mediana, discutida anteriormerrte, representa o segundo
clculo os valores dos quartis tambm pode ser feito atravs do

q""rii. O

histograma, conforme mostrado no exemplo a seguir.

Exemplo 1.2; No Exemplo 1.1, o valor da mediana (segUndo quartil) calculado


atrav do histogram u, 57,73 kg. De forma semelhante, vemos que o valor do
primeiro quartii tambm se encontra no intervalo [50,0; 60,0)' isto '
correrpondr ao valor 8r que determinar uma tea de 9Vo no retngulo
correspondente. Assim, temos (ver figura a seguir)

:
=-!o
0,09

Q^=

*=

lo + Qt:52,,05kg'

0,44
'

Peso

Qt

l)c

I'orma semelhante, obtemos para o terceiro quartil Qs

69,38

kg.

tr

Para o clculo de quartis e medianas usando a tabela de dados brutos,


prccisamos ordenar as observaes e escolher os valores que dividem os dados
nits propores desejadas. Eventualmente, ser necessrio tomar mdias de
vulores vizinhos. No caso de tabelas de freqncias, os dadosj esto ordenado
ru procedimento similar.
Uma representao grfica envolvendo os quartis o box-plot Definimoa,
ul'nn "caixa" com o nvel superior dado pelo terceiro quartil e o nvel inferior pelo
plirneiro quartil. A mediana representada por um trao no interior da caixa o
segllcntos de reta so colocados da caixa at os valores mximo e mnimo, que
rrlo scjam observaes discrepantes (o critrio para decidir se uma observao
tliscrcpante no ser discutido aqui, mas, em geral, envolve a diferena entre o
tercciro e o primeiro quartis)- O prximo exemplo ilustra a construo do box-plot
pnrt uma varivel quantitativa discreta utilizando-se os dados brutos.

Ilwtttplo

1.3.' Suponha que um produtor de laranjas costuma guardar as frutns cm


cuixus c estr interessado em estudar o nmero de laranjas por caixa. Aps um dia
rle colhcita, 20 caixas foram contadas. Os resultados brutos, aps a ordenno,
silo: 22, 29, 33, 35, 35, 37, 38, 43, 43, 44y 48, 48, 52, 53, 55, 57, 61, 62, 67 e 69,
lrrrr osses dados, temos qe md,,6, ilfOo+ 11s) l2 : (44+48) 12 = 46,
Annlogarnente, obtemos Qr : 36 e Qs :56. Tambm observamos que o nmero
r(-

\,i',,

511,,\

''i

r(.

Captulo 1: Introduo Anlise Exploratria de Dados

18

mnimo de laranjas em uma caixa ' 22

o nmero mximo, 69. O box-Plot

correspondente apresentado na Figura 1'7'

l,.l ()rganizao

t9

de Dados

Grficos tipo box-plol tambm so teis para detectar, descritivamentc,


rliirl'crras nos comportamentos de grupos de variveis. Por exemplo, poclemos
tturrsitlornr grficos da varivel Peso para cada sexo. O resultado apresentado nn
l'jigrrlir 1,9, em que podemos notar que os homens apresentam peso mediano
atrllet'iur ito das mulheres, alm de uma maior variabilidade'

100

60

90

3so
e

80

En

40

60

50

30

40
20

Sexo

Irigura 1.9: Box'plot da varivel

Figara 1.7. Box'plot para o nmero de laranjas por caixa'


atravs do box-plot bastante rica no sentido de
informar, entre outras coisas, a variabilidade e simetria dos dados' Note'que na
1.7 os dados apresentam simetria acentuada (a distncia da mediana para

A representao gr,fica

Figura

dos
os"quartis a mesma), o mesmo podendo ser observdo a respeito da distncia
Figura
pono, de mnimo e mximo em relao mediana. Em contraste, temos na
i.A o box-ptot paraa varivel Peso, que apresenta uma pecluena assimetria.

llxerr'clos

tll

l, tlllssil'ique

Peso

para cada sexo,

Sco 1.2:
cacla uma das variveis abaixo em qualitativa (nominal

/ ordinal) ott

rltmnl il rt i vil (cliscreta / contnua):

$. Ocorrlrcia de hipertenso pr-natal em grvidas com mais de 35 anos (stl


i ,,r
tttrttlrtsf,opossveisrespostasparaestavarivel). l' ", t;t/titt(
h, Inlelriio clo voto para presidente (possveis respdstas so os nomes dos
(
ctttttlitlitrtts,almde no sei).''',,,t11 )1' t t'r, "
C. l,r't'rh rlc pcso de maratonistas n Corrida de So Silvestre, em quilos. 'tl,\tt, 1'l
maratonistas na Corrida de So Silvcstre
rl, lrrlr.rrsirlnrlc clt perda de peso
-" de
(
l1 't.\ l;rtJ'
(lt'Ve, tttoclCrilCla, fOrte).
' 1t r/ /
, (lrrrrr rle satis'airo cla populao brasileira com relaro ao trabalho cle seu
presirlerrte (vnlores de 0 a 5, com 0 indicando totalmente insatis'eito e 5
lrtlttltnettlc satisl'eito). i,,t tt! t (l' r/lr'l I , ,,1,','

'100

90
80

'

3to
L
60

50

40

Figura 1.8: Box-plot para a varidvel Peso.

l,

{Jrrirrzt pncientcs clc unra lrrica de ortopcdia foram entrevistados qunto ito
nrnrr'r'r rk: r'ttcscs prcvistos cle I'isiotcrapin, se haver (S) ou niro (N) secltlelus

'.qt
Captulo

20

I:

Introduo Anlise Exploratria de Dados

aps o tratamento e o grau de complexidade da cirurgia realizada: alto (A),


mdio (M) ou baixo (B). Os dados so apresentados na tabela abaixo:
2

Pacientes

Fisioterapia

Seqelas

s
A

Cirurgia

.N: ,N)
A
M

10

ll

t2

l3

I4

N'

rN

N)

N
M

4
N

ts

ts

1.3 O Uso de Computadares em Estatstica

do que em uma regio industrial (Regio B). Para tanto, uma

20

funcionrios administrativos em uma indstria.


10,1

8,5

5,0

412

tt
Jr9

10,7

1,5

8;2

10,0

4. Um grupo de

estudantes
matemtica resultando em:

1e

3,1

9,0

914

6,1

4,7

315

6,5

8,9

6,1

freqncia

0F-2

L4

2+4

28

4-6

27

6FB
8F10
mnima para aprova,o

de

34

TOFBO

109

BOF90

111

>90

55

(,1,

319

um teste

de

[a ,.r'

ser

nas

duas regies? (Note que o total de observaes difere em cada regio).


regi0,

histogramas apresentados em

(b), obtenha as

medidas

necessrias e construa o box-plot, um para cada regio. Com base nessa


representao grfica, rediscuta o item (a).

1.3 O Uso de Computadores em Estatstica

11

5, qual

10

a. Os dados apresentados sugerem que o grau de desnutrio diferente

c. Com base nos

a. Construa o histograma.

b. Se a nota

<60
60F70

Faa uma suposio conveniente para as faixas no delimitadas.

e o 3e quartil.

do ensino mdio foi submetido


Nota

ni

b. Construa, apartir dos dados das tabelas, um histograma para cada

))
- )-

a. Construa uma tabela de freqncia agrupando os dados em intervalos


amplitude 2 apartir de l.
r. Construa o histograma e calculo o

Peso

total

de modo diferente nesse grupo?

nt
lt

foi

Regio B

grlica.
Para
o grupo de pacientes que no ficaram com seqelas, faa um grfico de
c.
barras para a varivel Fisioterapia. Voc acha que essa varivel se comporta

Os dados abaixo referem-se ao salrio (em salrios mnimos) de

amostr

tomada em cada regio, fornecendo a tabela de freqncias a seguir:

a. Classifique cada uma das variveis.


b. Para cadavarivel, construa a tabela de freqncia e faa uma representao

3.

2t

porcentagem de

aprovao?
c. Obtenha o box-plot.
5. Um estudo pretende verificar se o problema da,desnutrio em adultos medida
pelo peso, em quilos, em uma regio agrcola (denotada por Regio A), maior

Foi mencionado anteriormente que o desenvolvimento da indstrirr de


computadores deu grande impulso ao uso da Estatstica. Vrios progrumes
computacionais de uso comum contm rotinas estatsticas incorporadas s suas
das planilhas eletrnicas, usualmente pi-instaladas em
computadores novos. Programas especificamente desenvolvidos para efetuar
anlises estatsticas so conhecidos como pacotes estatsticos. Existe um nmero
considervel desses pacotes, alguns voltados para anlises mais comuns na dretl
de humanidades, outros para a rea de biomdicas; alguns so extremamente
simples de se utilizar atravs de menus, outros pressupem conhecimento de uma
linguagem de programao especfica. Qualquer que seja o programa a ser
utilizado, trs so as etapas que envolvem seu uso:
funes bsicas. o caso

1 Entrada de Dados
2. Execuo da Anlise Estatstica
3. Interpretao de Resultados

A Entrada de Dados deve assumir certas convenes. Apesar de certos


programas terem rotinas desenvolvidas de forma a simplificar a criao do banco

Captulo 1: Introduo Anlise Explqratria de Dados

22

de dados, intrinsecamente o que se tem a criao de uma matriz, em que cada


linha corresponde a uma unidade experimental e cada coluna a uma varivel.
Por unidade experimental, entende-se o elemento da populao ou
amostra no qual observaremos as variveis. Por exemplo, na Tabela 1.1,

observamos 50 unidades experimentais, os estudantes, nos quais foram


observadas 14 variveis. Assim, os dados podem ser representados por uma
matriz com dimenso 50 por 14. Leitores familiares com planilhas eletrnicas
no tero problema em visualizar esta situao. Assim, quando estudamos uma
nica varivel, consideramos a coluna correspondente. Se estamos interessados
em saber o comportamento desta varivel em dois grupos diferentes (como na
Figura 1.9), precisamos estudar os valores da coluna em que ela se encontra,
conjuntamente com a coluna que contm a informao dos grupos'
A fase da execuo da anlise estatstica pressupe o conhecimento de
como o programa que est sendo utilizado trabalha as informaes. Torna-se,
assim, importante se ter acesso ao manual do programa'
Aps as informaes terem sido trabalhadas, vem a fase da interpretao
dos resultados obtidos. Nesta hora, aconselhvel consultar o manual sempre que
houver dvida, se o que foi calculado relaciona-se, de fato, anlise estatstica
desejada. Ao interpretar as caractersticas observadas, importante verificar se
resultados absurdos no esto ocorrendo. Em caso positivo, releia o manual e
certifique-se de ter executado a anlise correta para os dados em questo. Em
muitos casos, a fase de interpretao a mais difcil e interessante, pois envolve o
equacionamento das caractersticas apresentadas na anlise com vistas a
responder as questes inicialmente colocadas'

23

1.4 Exerccios

1".4

Exerccios

1. Responda certo ou errado, justificando:

a. Suponha duas amostras colhidas de uma mesma populao, sendo uma de


tamanho 100 e outra de tamanho 200. Ento, a amostra de tamanho maior
mais representativa da populao. F

b. Duas variveis diferentes podem apresentar histogramas idnticos' I


c. Duas variveis combox-plol iguais no podem ter valores diferentes' Fj

2.

Suponha que duas empresas desejam empreg-lo e aps considerar s


uuntug"n. de cada uma, voc vai escher aqoel que lhe pgar melhor' Aps
certa pesquisa, voc consegue a distribuio de salrio das errpresas, dadas
segundo os grficos abaixo.
Empresa B

Empesa A

5101520253035404550

Slrios Mnimos

Com base nas informaes de cada grfico, qual seria sua deciso?

3. Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo


Exerccios da Seo 1.3:

l.

Utilizando alguma planilha eletrnica ou pacote estatstico disponvel e com as


informaes da Tabela 1.1, construa um banco de dados para os 20 indivduos
iniciais e as 4 primeiras colunas. Imprima e confira os valores digitados.

2. Considerando o banco de dados criado no Exerccio 1 desta seo, construa


histogramas para as quatro variveis e, baseado no grfico, descreva os seus
comportamentos.

desta seo, divida a


idade em trs categorias (menores de 18 anos, idade entre 18 e 21 inclusive, e
maiores de 2l anos). Construa grficos de barra para essa varivel, incluindo
toclos os indivduos e um para cada sexo. Interprete os resultados obtidos.

3. Considerando o banco de dados criado no Exerccio

indagou sobre os diferentes tipos usados nas suas locomoes dirias. Dentre
nibus, metro e trem, o nmero de diferentes meios de transporte utilizados foi

oseguinte:2,3,2, 1,2, 1,2, 1,2,3,I,1,1,2,2,3,1,1, 1,I,2, I, 1,2,2, 1,2,


1,2 e 3.
a. Organize uma tabela de freqncia.
b. Faa uma representao grfica.
c. Admitindo que essa amostra represente bem o comportamento do usurio
paulistano, voc acha que a porcentagem dos usurios que utilizam mais de
um tipo de transporte grande?

4. A idade dos 20 ingressantes num certo ano no curso de ps-graduao em


jornalismo de uma universidade foi o seguinte: 22,22,22,22,23,23,24,24,
24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.

Captulo

24

l:

Introduo Anlise Exploratria de Dados

I -l li rrt t:cios

rl, l{cpita o item (c) para a varivel Salrio.


r,. (lonsiderando apenas os funcionrios com mais de trs anos clc clsn,

a. Apresente os dados em uma tabela de freqncia, incluindo a freqncia


relativa.

b.

Idades atpicas parecem ter ocorrido nesse ano. Aps sua retirada do
conjunto de dados, refaa o item (a). Comente as diferenas encontradas.

Um novo medicamento para cicatrizao est sendo testado e um experimento


feito para estudar o tempo (em dias) de completo fechamento em cortes
provenientes de cirurgia. Uma amostra em trinta cobaias forneceu os valores:
15,17,16, 15, \7, 14,17, 16, 16,17,15, 18, 14,17, 15, 14,15,16,17, 18, 18,
17, 15, 16, 14,18, 18, 16, 15 e 14.
a. Organize uma tabela de freqncia.
b. Que porcentagem das observaes esto abaixo de 16 dias?
c. Classifique como rpida as cicatrizaes iguais ou inferiores a 15 dias e

como lenta as demais. Faa um diagrama circular indicando

tlcscreva o comportamento da varivel Salrio.

ll. I lrrr gnrpo de pedagogos estuda a influncia da troca de escolas no descntpcttlto


tlt. llrrnos do ensino fundamental. Como parte do levantamento realizndo, lri
nrotiulo o rrmero de escolas cursadas pelos alunos participantes do estttclo.
Escolas Cursadas

freqncia

46

as

porcentagens para cada classificao.


6.

2.\

57

.)

2T

15

(.)rlrl a porcentagem dos alunos que cursaram mais de uma escola?


Ir- ('onstrua o grrfico de barras.
c. ('lirssil'i11r.rc os alunos em dois grupos segundo a rotatividade: a/c pnt'u
itlulos cclur rnais de 2 escolas e baixa para os demais. Obtenha a titbclit tlc
lr'r;iincin dcssa varivel.
ru.

O Posto de Sade de um certo bairro mantm um arquivo com o nmero de


crianas nas famlias que se utilizam do Posto. Os dados so os seguintes: 3, 4,
3, 4, 5, r, 6, 3, 4, 5, 3, 4, 3, 3, 4, 3, 5,5, 5, 5, 6, ll, r0, 2, l, 2, 3, r, 5 e 2.
a. Organize uma tabela de freqncia.
b. Faa uma representao grfica.
c. Voc identifica valores nruito discrepantes? Que fazer com eles?

rr.

Alrrrros tlir Escola cle Educao Fsica foram submetidos a urn lcslc rkr
rr.sistrrciir rpranto ao nmero de quilmetros que conseguiram corrcr sert
(
lrrrrirr'. )s clirclos cstiro apresentados a seguir.
(-)rr;rl
rr.
ir vtriiivcl em estudo?

Um questionrio foi aplicado aos dez funcionrios do setor de contabilidade de


uma empresa fornecendo os dados apresentados na tabela.

b. ('orrsllrrir o ltistograma.
e. ( )lrlt'rrltir o lnx-pktl.

Funcionrio

Curso (completo)

Idade

Salrio (R$)

Anos de Empresa

1100,00
1450,00
960,00
960,00
600,00
600,00
600,00

supenor
superior

12

F I6

22

450,00
450,00
450,00

I6

F 20

4
5

6
1
8

9
10

mdio
mdio
mdio
mdio

mdio
mdio
fundamental
fundamental

43
31
dl

24
25
27
22

2l
26

a. Classifique cada uma das variveis.


b. Faa uma representao grfica para

Faixas

freqncia

0t-4

438

4FB
8F12

206

varirvel Curso.

c. Discuta a melhor forma de construir a tabela de I'reqiincia para a vitriiivcl


Idade. Construa uma representao grii'ica,

I0.

125

lltrrrPo t[r rrtiliziriio rlc citixus clctrnicos clcpcrrclc dc cada usurio c rlits
tl lrrrirr's r'lctrrirtlirs. liorarn colctadas 2(l rncclidas dcssc tcmpo (crn rnirtutos):

l,t
I ,:t

1,2

1,7

0,)

,:

t.4

l,i

I ,l'r

l.('

1,2

1,2

I,0

0,)

,,1

.(i

lr7
l,g

1,0

1,0

0,8

1,7

[,5

,ll

I ,l-r

l-"r

Captulo

26

I:

Introduo Andlise Exploratria de Dados

,.J

I .l l';rtx:cios

a. Organize uma tabela defreqncia sem agrupar os dados.


b. Agrupe os dados em faixas de tamanho 0,2 a pattit de 0,8 e obtenha uma
nova tabela de freqncia.
c. Compare as tabelas obtidas em (a) e (b). Comente as diferenas'
d. Se ao invs de 26 medidas tivssemos 1000, qual procedimento, dentre
agrupar ou no, voc utilizaria?
11. Vinte e uma pacientes de uma clnica mdica tiveram o seu nvel de potssio
no plasma medido. Os resultados foram os seguintes:

Nvel
2,25 a 2,55
2,55 - 2,75

freqncia

2,75

F 3,15
3,15 F 3,35
3,35 F 3,65

617

615

6,9

/t

7r7

7,6
8,2
7,5

714

712

8,3

8,1
7,4

7r5

7,7

7r5

716

rr- ( )rgnnize os dados em

716

6,3
7,2
8,1

714

7,6

7r7

716

7r5

7,6
7,4

8,1

7,9

7,8

714

714

7r5

7,5

714

faixas de tamanho 0,4 a partir de 6.

h. ('orrstrua o histograma.
c. ('irlculc o segundo quartil.
marcados no ltimo campeonato daFederao Paulistl tle
participantes nos seus 38 jogos uma varivel conl os
pelos
20
clubes
liutclxrl
:;r'1it r i tttcs velores:

t
J

2,95

612

l.l. () lrirlcro de gols

2,95

6,1

Clube

10

35

79

57

dt

52

35

25

Gols

32

42

at
td

Clube

11

72

13

t4

15

16

17

IB

19

20

Gols

55

70

42

4L

6B

66

74

29

47

53

5
6

a. Construa o histograma.

ir, ('lirssi'iquc i varivel. Voc

b. Determine os 1e, 2e e 3e quartis.


c. Qual a porcentagem dos valores que esto acima do nvel 3?
12. Foram feitas medidas em operrios da construo civil a respeito da taxa de
hemoglobina no sangue (em gramas/cm3):
11,1

L2,2

11,3

II,7

12,6

73,4

L5,2

12,3
L3,2

13,5

L2,7

L2,3

13,5

15,4

16,3

LL,7

12,5

13,9

74,4

13,0
L5,2

13,6
16,9
72,3

!2,7
15,8
L3,7

12,6
L4,7
L4,1

a. Organize os dados em faixas de tamanho 1 a partir do 1 1.


b. Construa o histograma.
c. Determine o terceiro quartil e a mediana.
d. Taxas abaixo de 12 ou acima de 16 so consideradas alteradas e requerem

acompanhamento mdico. Obtenha a tabela de freqncia


Acompanhamento Mdico com duas opes sim ou no.

da varivel

L3. O valor mdio de comercializao da saca de milho de 60 cluilos nir Bols:t clc
Cereais apresentado abaixo, em reais, para ltimos 40 meses.

acha razovel construir uma tnbclit tle


l'r'ct;iincia de atcordo com a classificao dada?
Ir. ('orrslnrt unra tirbela de freqncia agrupando as observaes em intcrvillos
rlt, t:ornprirnento l0 a partir de 20 (no esquea de indicar clarnclto os
irrlt't'vit los).
r'. ( )lrtt'rrhir o histogranta.
rt. (.)rrr lrorccntagent dos clubes mrcaram mais de 38 gols?
apresenta as freqtincias relativzts de ocorrncias de lrixns tle
illluut (r.n cnt) para uma imostra de 100 criins de l2 anos de icladc.

l, A t;rlrclir ir soguir
ar,

('orrslt'ttit o histograma.

lr, ( )lrlcrrhrr

<t

lxtx-plo.

r'. I )r'st'ilrnclo-so sopirral' os l5o/o mis eltos, qual seria o ponto de cortc'/

Captulo

28

l:

Introduo Anlise Exploratria de Dados

Faixas

freqncia relativa

F 110
110 F 120
120 F 130
130 F 140
140 F 160

0,10

100

I 'l l',ttn'cios

29

Ganho

freqncia

F 2,0
2,0 F 3,0
3,0 F 4,0
4,0 F 5,0
5,0 F 6,0
6,0 F 7,0

45

1,0

0,25
0,30
0,25
0,10

O ndice de germinao um dos principais fatores para definir a qualidade


das sementes, Ele determinado em experimento cientfico conduzido pelo
fabricante e regulamentado pelo rgos fiscalizadores. Um fabricante afirma
que o ndice de germinao de suas sementes de milho de 85Vo. Para verificar
tal afirmao, uma cooperativa de agricultores sorteou 100 amostras com 100
sementes em cada uma e anotou a porcentagem de germinao em cada

83
52
15

1.6.

amostra.
Germinao (Vo)

freqncia

60F75
75F80

20

BOFBS

42

85F90
90F95

18

95

F 100

tH. Nrrrrr cstudo sobre rotatividade de mo-de-obra na indstria, anotou-sc o


nunr(rro de empregos nos ltimos 3 anos para operrios especializados e nfro
tspt'r'iir Iizados.

tr, (lonstrua o diagrama de barra correspondente a cada tabela usanclo


Ir:rn'irs cla rotatividade
r's1 rr'c

de mo de obra na indstria (sem dif'erenciar

r'. Voc ircha que os trabalhadores especializados trocam menos


,f

it

ilrl iz.itiro).
cle errtllrcgo'/

rrslil'it1uc.

No Especializados
,;
Iirnprcgos

10
2

a. Faa uma representao grfica da tabela acima.


b. Construa o box-plot.
c. Comente a afirmao do fabricante.
17. Uma nova rao foi fornecida a sunos recm desmamados e deseja-se avaliar
sua eficincia. A rao tradicional dava um ganho de peso ao redor de 3,5 kg
em um ms. A seguir, apresentamos os dados referentes ao ganho, em quilos,
para essa nova rao, aplicada durante um ms em 200 animais nas condies
acima.
a. Construa o histograma.
b. Determine o 1e, 2e e3e quartis.
c. Voc acha que a nova rao mais eficiente que a tradicional? Justifique.

it

porc:cntagem no eixo das ordenadas.


b. ,lrrrrto as inormaes das duas tabelas em uma s e obtenha um diagratnn tle

106

izados

Empregos

TLi

2lo

222

342

338

109

292
164

9l

lr

35

totitl

7I22

total

787

19, ('orrrtl ;lrltc do uurn avaliairo rndica em uma certa universidade, fbi rneclirln
n lrr'r1irrciir cirrditca clos alunos do primeiro ano. Os dados so rprcscrttaclos
elrt:ir'1',ttirlit.

it. ( )lrtrrrlrir o histograrna.


ll, lirctl(lrrciirs cnrclacls quc cstc.ianr rbaixo de 62 ou ercima de 92 rccluercrn
irlrrrrrpirnlrirrrrcrrto rnclico, Quirl n porcentigem de alunos rcssits
r ltttliotrs'/
llrrur
r',
'cr1lrrcil iur rcclor clc 72 baticlas por nrinuto considerada paclrio,

Vor't' irt'lrir rprc dc nroclo gcral csscs alruros sc cncaixaln ncssc caso'

I:

Captulo

.to

Introduo Anlise Exploratria de Dados

Freqncia Cardaca

freqncia

60F65
65F70

11

35

t-

75

68

75F80
80F85
85F90
90F95

20

70

95

I J I t,'ttt'irts

3t

o rbricante vende

cada bateria por 207o acima do preo de custo, em


l(XX) baterias fabricadas, descontadas as que repe, quanto ser seu lucro
pol birtcria em funo do preo de custo?

Slt'

L2
10
1

100

20. Um exame vestibular para uma faculdade tem 80 questes, sendo 40 de


portugus e 4O de matemtica. Para os 20 melhores classificados,
apresentamos o nmero de acertos em cada disciplina, em ordem decrescente
do total de pontos.
a. Organize uma tabela de freqncia para cadavarivel.
b. Faa uma representao grfica das tabelas obtidas em (a).
c. Construa a tabela de freqncia da varivel total de pontos.
d. Comente sobre a afirmao: os aprovados so melhores em portugus do
que em matemtica.

It,

Durabilidade

freqncia relativa

0F3
3F6
6F9
I -L2
72-15

0,02

0,30

15F20

0,23

0,05
0,15
0,25

lfr.st. jir-sc comparar trs tcnicas cirgicas pata a extrao de dente de siso,
('itrlir trrttir clas tcnicas foi aplicada em 20 pacientes e os resultados sio
apt r'st'rrtirrlus a seguir.

10

.qo
!t

I
'8.
E
c)

o.

a,

o
d)

aluno
Portugus

10

35

35

32

31

30

26

26

24

23

s6

Matemtica

31

29

34
27

28

28

26

30

28

25

23

&

Es
c)

aluno

11

t2

t3

T4

15

T6

t7

18

I9

20

Portugus

23

L2

11

20

17

T2

L4

20

10

Matemtica

27

t.\
z

31

20

27

25

20

13

23

20

21. Vinte baterias para automveis de uma certa marca foram testadas quanto
sua vida til. O teste simula autilizao da bateria, acelerando seu desgaste de
rnodo a criar uma rplica da situao real. Os resultados da durabilidade (em
mcses) so apresentados a seguir:
a. Construa o histograma.

a amostra acima for considerada representativa do desempenho desszr


rirce de bateria, quantas, em 1000 fabricadas, sero repostas pelo

b. Se

labricante, se ele o'erece 6 meses de garantia?

t--"

Tcnica cirrgica

*r, lirrr

rrrnr virlrlrcs a1-lloximados pilr

er

mediana de cada tcnica,

b,ll

tttlrtvttltt ittlerqltdrtil. , dcl'inido colno e dil'erena entre o tcrccirc c


irtrt'iro
rlttiulis, Cllculc scu valor para cerda uma das tcnicers e comentc.
1rr
.:. llir('ulit rr vlrrilrllilidlrclc do tcnpo dc rccupcrao ern cada tcnica.
ri. ,'jt,

r'rrr't-' t'r otirrrisla, clual tcnica

3, tllr*. o

rr

cscolhcria'l

corrrPrrlirtlor') Os cllclos a scguir representam indivduos que btlrrr


{r!rl'urinrr(krs llr,tlo vcrclo clc um ccrto tipo clc inseto e submcticlos ir
Irrllrlrr'nl() (tr's rliI'crcnlos Iipos). As virriiivcis so:
r

Captulo

-t2

l:

Introduo Anlise Exploratria de Dados

No.: nmero associado aos pacientes;


Idade: idade do paciente no momento de admisso' em anos;

Diag: tempo, em horas, gasto entre

contato com

Atrlvs do computador, crie uma planilha com os dados

administrao

inseto

do tratamento

recuperao;
Tratam: tipo do tratamento administrado;
Coag: presena de cogulos no momento de admisso.
Pac.No.

Idade

Diag

Recup

Tratam

Coag

T9

28

nao

15

52

45

27

76

30

23

II
I
II

15

53

46

stm

2l

II

nao

11

46

42

11

16

55

47

nao
nao

10

16

54

41

I
I
I

25

47

13

12

ilI

18

59

51

II

nao

l6

20

l1

ru
II

slm

20

40
24

l3

32

31

-)

il
il

nao

15
8

10

44

40

18

3t

il
il

slm
slm
slm
sim
slm
slm
slm

S
S

nao

T2

3l

10

24

46

t3

11

21

21

il

22

39

l7

il

-)

l5

53

46

42

39

23
26

75

30

22

54

l8

l6

III
III

l7

35

t2

I]

-58

50

II

In

b, Strltctrrha, que ao invs de trabalhar corn a varivel ldade, cria-se uma novl
vurirvcl denominada Etrio, assumindo valor 0 se Idade for menor que 29
rlnos c I caso contrrio. Utilizando o computador:
l. lixplique como voc poderia criar tal varivel.
ll, Construa um box-plot para a varivel Recup, para cada grupo de Etrio,
Corn base nos grficos, voc diria que o tempo de recuperao diferente
dependendo da faixa etria? Justifique sua resposta'
, tJmn nova varivel denominada Cura criada: Cura ser rpida se Recup
frrr rnenor ou igual a 10, ser normal se entre 10 e 40 (inclusive) e ser lentct
pnt'n lccr.rp acima de 40. Verifique, graficamente, se pacientes em cada umit
clns cntcgorias de Cura apresentam diferenas no que se refere ao tempo

m
m

nao

Itotttogeneamente nos trs tratamentos?

lv. l{cpita o item (iii) para a varivel Coag.

slm

I
I

corn relao idade dos pacientes. Voc diria que a idade se distribui

nao

14

eltttr! o ccltttitto com o inseto e a administrao do tratamento.

Elt nttlttit',t:; ilc dutlos mencionados nos exerccios a seguir podem ser obtidas ent
lflPlt" llr, rt,y t, b r/- n rt p ro e s t

#,

(LIse o corrrputador) Os itens seguintes referem-se aos dados contidos no


f'rluivo clr.: nome cancer.txt. Esse arquivo contm os dados de uma pesquisa
fOtrrr: irrcidOncia de cncer e apresentado em 9 colunas representando ns
rEu i nlFs vitritvcis de interesse:
e'eilttntt

l:

iderrt i l'icao do paciente.

e'ulumr 2i tliitgttstico:

I = nlso-negativo: diagnosticados como no tendo a doena qunnclo


nl verclade a tinham,
2 = ncgativo: diagrrosticados como no tendo a doena quarrdo ele

nao

'ato niro a tinham.

slm

- = llositivo: diagnosticados corretamente como tendo er doena.


4 = lulso-positivo: diagnosticados como tendo a doena quando na

nao

m
ln

apresentados.

lirsoando-se nesta planilha:


l. Cltssifique cada uma das variveis.
ll. Construa uma tabela de freqncia (atravs do computador) para a
virivel Diag. Utilize 5 classes.
lll. Atravs de representao grfica adequada, compare os trs tratametos

administrao do tratamento;

Recup: tempo, em horas, entre

33

,-t l','rrn'r:ios

verclircle niro tinham.

ilutu.li

irlnrle.

34

Captulo

l:

Introduo Anlise Exploratria de Dados

35

1,4 l',ltex'cios

coluna 4: espectro qumico da anlise do sangue-alkaliine phosphatose (AKp).


coluna 5: concentrao de fosfato no sangue (P).
c o luna 6 : enzima, lactate dehydro genase (LDH).
coluna 7: albumina (ALB).
coluna B: nitrognio na uria (N).
coluna 9: glicose (GL).

d. Crrlcnle a rea til total para cada apartamento. Armazene esta informao
er uma varivel denominada Total. Repita os itens (b) e (c) para a varivel
'lrtal,
c. Buserndo-se nos itens anteriores, voc diria que existem diferenas nas reas
rkrs apartamentos dos blocos A e B? Em caso positivo, qual(is) cmodo(s)

a. Escolha 3 variveis dentre as colunas 2 a 9. classifique-as e faa o

f.

rrplcsenta(m) o problema?

histograma e a tabela de freqncia para cada uma delas (se necessrio, crie
at cinco faixas).

b. unia

afirmao feita por alguns mdicos a de que o grupo dos falsopositivos mais jovem do que o dos falso-negativos. para os dados dessa
pesquisa, o que voc diria a respeito? Justifique sua resposta baseando-se
em grficos e tabelas de freqncia.

25. (Use o computador) Um empreendimento imobilirio consistiu da construo


de dois edifcios residenciais, com apartamentos de I dormitrio e rea til de
fi #. Em uma primeira fase, foi construdo apenas um edifcio, denominado

"'Bloco 4". Para a concluso do Bloco B houve uma troca de empreiteiras.

Suspeita-se que seus apartamentos foram construdos com metragem diferente


daquela especificada na escritura. O arquivo areas.txt contm as seguintes
variveis, obtidas por peritos de uma firma independente:

Id:
Bloco:
Andar:
Final:
Sala:

Cozinha:
Banheiro:

Dorm:
'

Rachad:

Infiltr:

identificaoda observao no arquivo


bloco a que prtence o apartamento
andar onde o apartamento est situado

lrxplore descritivamente os dados referentes a problemas estruturais


(rlchaduras e infiltraes). Com a informao contida na varivel Andar
clivicla os apartamentos em trs categorias dependendo do andar onde se
cncontra: baixo, mdio e alto. Estude a ocorrncia de rachaduras e
in'i ltraes para cada categoria.

(tJse o computador) Os itens seguintes referem-se aos dados contidos no


rquivo de nome aeusp.txt, que contm parte dos dados de uma pesquisa,
reslizuda pela Associao dos Educadores da USP (AEUSP), sobre aspectos
eio-econmicos e culturais de comunidades de baixa renda da regio do
utunti, So Paulo. O questionrio foi respondido por um dos moradores dn
g sortcada para participar da pesquisa. Os dados esto organizados da
gtlinlc lbrma:

l,

golund /: Nmero do questionrio (Num).


alunu 2: Comunidade (Comun).
alnnu.?: Sexo (Sexo):
L : masculino;

feminino.

nmero identificando a posio do apto. no andar


reada sala, em m2

Faixas de idade, em anos (Idade):


1 = 114,25);

rea da cozinha, em m2
rea do banheiro, em m2

3:
4:

rea do dormitrio, em m2
ocorrncia de rachaduras no apto: 0 - no, 1- sim
ocorncia de infiltraes no apto: 0 - no, I - sim

a. Explore o arquivo de dados. Qual o nmero total de apartamentos

no
empreendimento? Quantos apartamentos existem por prdio? E por andar?
b. Construa tabelas de freqncia para cada uma das variveis quantitativas
contnuas e faa grficos adequados,
c. Repita o item (b), para cada bloco, separadamente. construa grficos clo tipo
box-plot e compare as reas para cada cmodo considerado.

2:125,35);

[35,45);
[45, oo).
Hltl,d 5l Bstado civil (Ecivil),
1 : solteiro;
2 = casado;

ll

=
l'r =

clivorciado;

vivo;

outro.
eetlttnu (t: llegiio de procedncia (Reproce).
ttunt 7i Tentpo de residncia em So Paulo, em anos (Ternposp),
:olwtil li Nmero de residentes na casa (Resid).

Captulo 1: Introduo Anlise Exploratria de Dados

coluna 9: Trabalho (Trab):

:
2:
3:
1

sim;

no;

coluna l0: Tipo de trabalho, s para os que trabalham (Ttrab)


1 : emPregado com carteira;
2 : emPregado sem carteira;
3
4
5

:
:
:

habilidades

aposentado.
:

profissional liberal;
autnomo;

rural.
coluna I l: Idadeque comeou a trabalhar, em anos (Itrab).
coluna 12: Rendafamiliar em faixas de reais (Renda):
1

-- [0,150);
2:1t50,300);

: [300,450);
4 : [450, 900);
5 - [900,1500);
6 : [1500, oo).
g

coluna 13.' Acesso a computador (Acompu):


1 sim;

z:

nao.
coluna t4: Srieem que parou de estudar (Serief).
Branco : no parou de estudar;
1a B : sries do ensino fundamental;
9 aL2: sries do ensino mdio.
a. Explore o conjunto de dados e classifique as variveis. Verifique se existem
variveis com valores incompatveis ou invlidos e proponha alternativas
para a soluo do problema. Observe que existem variveis com respostas
em branco e discuta porque isso acontece.
b. Estude a varivel Renda em funo de Comun. Voc diria que os moradores
da Cohab e do Jardim d'Abril tm a mesma renda? Justifique sua resposta
baseando-se em grficos e tabelas de freqncia.
c, Verifique se o comportamento'da varivel Temposp influenciado pelo tipo
de trabalho (varivel Ttrab).
d. Faa um box-plot para a varivel ltrab.

Introduo
No captulo anterior, vimos como caracterizar uma massa de dados, com o

do organizar e resumir informaes. Neste captulo, apresentamos o


nntemiltica que d a base terica para o desenvolvimento de tcnicas
atlens tt $erem apresentadas no restante do livro.

Denominamos fenmeno aleatrio

situao

ou acontecimento cujos

no podem ser previstos com certeza. Por exemplo, as condies


clo prximo domingo no podem ser estabelecidas com total acerto, O
pocle ser dito da taxa de inflao do prximo ms. Veremos que, cm
como essas, modelos podem ser estabelecidos para quantificar os
dus diversas ocorrncias.

Aprcsentamos, a seguir, alguns conceitos de teoria dos conjuntos, que


ados neste captulo. Chamamos de espao amostral ao conjunto de todos
possveis de um certo fenmeno aleatrio. Ele ser represontedo
letfa gregn O (mega). Os subconjuntos de 0 so denominados eventoge
aclos pelas letras latinas maisculas A,8,. . . . O conjunto vazio, como jl
lelpnnl, ser denotado por 0.
denotada por AUB, represento tt
A unio de dois eventos A e
ia ele, pclo menos, um dos eventos Aou B. Ainterseco do evento

B,

, denotrrcln por.rl a B,

a ocorrncia simultnea de

A e B.

Dois eventos A e B siro disjuntos ou mutuamefie exclusivos quando no


lcmcntos ern coffrur.Isto , Ao B
A.
Dlzemos qr,re e B so complementares se sua unio o espao amostral
lnteraeclo vuzia. O complementarr de ser representado por " e temos
U ', _: fl e .zt A,,

:4.

Vamos considerar probabilidade como sendo uma funo

P(')

que

valores nurnricos aos eventos do espao amostral, conforme a defiriio

37

Captulo 2 : Probabilidades

38

efnio

2.

P(17)

0< P(A)< 1,VcQ;

i,i,)

P(A)

r;

ii P(UAj)
j:t

: t P(A, com os 7t disjuntos.


.i:r

0,44;

...; P(25) :

tr

0,04.

tr

l)rrs inbrrnaes a respeito da freqncia relativa acima e da Tabela 1.2,

A primeira

delas consiste na atribuio de probabilidades, baseando-se


em caractersticas tericas da realizao do fenmeno. Por exemplo, ao lanarmos
um dado, temos o espao amostral 0: {1,2,3,4,5,6}. Admitindo que o dado
foi construdo de forma homognea e com medidas rigorosamente simtricas, no
temos nenhuma razo para privilegiar essa ou aquela face. Assim, consideramos

P(6) :716.

Uma outra maneira de obter probabilidades atravs das freqncias de


ocorrncias. Observando as diversas repeties do fenmeno em que ocorre a
varivel de interesse, podemos anotar o nmero de ocorrncias de cada valor
dessa varivel. Para um nmero grande de realizaes, a freqncia relativa
poderia ser usada como probabilidade. For exemplo, desejando estabelecer as
probabilidades de cada face de um dado sem fazer nenhuma suposio inicial
sobre sua construo, usamos a experincia de sucessivas ocorrncias. O ponto
delicado decidir quanta experincia necessria para se fazer a atribuio de
probabilidades, com alguma garantia de no se estar muito distante do verdadeiro
valor. Questes dessa natureza no sero discutidas aqui e fazem parte doS
captulos de inferncia estatstica. Por ora, vamos assumir que, medida que O
nmero de repeties vai aumentando, as freqncias relativas se estabilizam em
um nmero que chamaremos de probabilidade. Em cincias biolgicas e humanas,
essa a forma mais comum de atribuir probabilidades.
De modo geral, diremos que estamos fazendo um sorteio aleatrio ou ao
acaso em uma populao, se a escolha desse ou daquele elemento s depende da
probabilidade a ele atribuda, seja atravs da freqncia relativa ou de algumit

/'(/") : 0,74, P(M) :0,26, P(A) :0,52, P(B):

0,48.

trilidrrdc que precisamos determinar pode ser representada por P(F U B),
guLl se sirnplesmente somarmos P(.F') com P(B), obtemos uma somn

Flor l

E,videntemente isso no pode acontecer, pois o valor clu


llidnde poclc ser, no mximo, igual a 1. No difcil perceber que estamos
n trlg,rrns elcmentos duas vezes, pois ao considerarmos apenas estudantcs
tXo l'errrinino, temos estudantes da turma A bem como da turma B e ao
los upotes i turn'a B, temos estudantes do sexo feminino e masculino,
on r:sluclnntcs do sexo feminino e da turma B, isto , o evento F O B, estd
Ito rlvcnlo ,;' c tambm no evento B.Logo, precisamos subtrair umi vez
n IJ) ;turn obter a probabilidade correta. Desta forma, temos qllc il
ilitlrrtle rlit unio FU B igual somadas probabilidades de ,F' e B menos
lirlnrlc rlu interscco f' O B.
tr
I

A plohnbilidaclc da unio de eventos calculada atravs da regru dct


tltt ltnilnhilitlutlcs apresentada ni Figura 2.1. No faremos unlu
lf rio lrrrnul, pois ncreditamos que o resultado bastante sirnples c
itivo,

suposio terica.

Exemplo 2.1: Para a varivel ldade, ver Tabela 1.3 clo Captulo l, o cspito
amostral ser f) : {17,18, .. . ,25}. Supondo que um aluno escolhiclo ao icoso

r tlirs 'cqiincias da varivel Sexo. Sabendo que 52Vo dos alunos esto na
A e 48Vo ni turma B, suponha que escolhemos um estudante ao acaso da
lnno, Quirl seria a probabilidade de escolhermos um estudante do sexo
r ott itlgurn da turma B?

questo.

:. '. :

0,18; P(18)

2.2; Considere a Tabela L2 do Captulo 1, contendo informaes

pergunta que poderia surgir seria: como atribuir probabilidades aos


elementos do espao amostral? H duas maneiras principais de responder essa

P(2)

No 1lrximo exemplo, obtemos a probabilidade da unio de eventos.

pela

fuqttrre irr rclativa associada respectiva idade. Assim,

uma funo P(.) denominada probabilidade se satisfaz as condies:

P(1)

39

fll:n popullo, definimos a probabilidade dele ter uma certa idade

: Probabilidade

?)

?,1 ltitit,tlttl'tt

ltignra 2.1: Ilegru de adio dc probahiliclaclcs.

Captulo 2 : Probabilidades

40

2.2

4T

robab ilidade Condic ional e Indep endnca

2. Sendo A e B dois eventos em um mesmo espao amostral, "tadrtza" pafa


Observe quo, se A e B forem disjuntos, a expresso acima se reduz
sorna das probabilicdades dos eventos A e B, pois a interseco vazia e a
correspondente probabilidade nula. A regra de adio de probabilidades pode
ainda ser expandidan para mais de dois eventos. Jente, por exemplo' escrever a
expresso para P('$UBUC) considerando D: Bl)C e aplicando a regra de
adiro de probabilid,lades duas vezes.

Comq conseqncia da regra da adio, obtemos que, para qualquer


evcnto A c {1,

P(A):I-P(A'),
que pode ser verificada aplicando a regra da adio com Ac no lugar de B.
Tctnos,

tr(Art

Como P(Au A) :

A')

P(Cl) :

:
:
:

P(A) + P(A")
p(A) + P(A')
p(A) + P(")

P(A A")
P(A)
0.

linguagem da Teoria dos Conjuntos, as seguintes situaes:'


a. Pelo menos um dos eventos ocorre.
b. O evento ocorre mas B no.
c. Nenhum deles ocorre.
cl. Exatamente um dos eventos ocorre.

3. Uma universidade tem l0 mil alunos dos quais 4 mil so

considerados
csportistas. Temos, ainda, que 500 alunos so do curso de biologia diurno, 700

cla biologia noturno, 100 so esportistas e da biologia diurno e 200 so


csportistas e da biologia noturno. Um aluno escolhido, ao acaso, e perguntasc a probabilidade de:
a. Ser esportista.
b. Ser esportista e aluno da biologia noturno.,-:l
c. No ser da biologia.
d. Ser esportista ou aluno da biologia.
c. No ser esportista, nem aluno da biologia.

,--(,,,-/
:9,2,
tais que P(A)

A e B dois eventos em um dado espao amostral,


P(B) : p, P(AU B) : 0,5 e P(A n B) : 0,1. Determine o valor de p.
5. l)ois processadores tipos A e B so colocados em teste por 50 mil horas. A

4. Sejam
1, segue imediatamente a igualdade desejada'

Ilxerccios da Seco 2.L:


1. Para cada um dors casos abaixo, escreva o espao amostral correspondente e
conte seus elementos'
a. Uma moeda anada duas veze,s, e observam-se as faces obtidas'
b. Um dado lranado duas vezes e a ocorrncia de face par ou mpar

probabilidade de que um erro de clculo acontea em um processador do tipo


A de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que:
ri. Pelo menos um dos processadores tenha apre.sentado

b. Nenhum processador tenha apresentado erro?


c. Apenas o processador A tenha apresentado erro?

"rrorc---.-u--\

observada.

c. Uma urna contm 10 bolas azuis e 10 vermelhas com dimenses


rigorosamento iguais. Trs bolas so selecionadas ao acaso com reposio e
as cores so arnotadas.

na soma
L Dois dados sio lanados simultaneamente e estamos interessados

'-

clas faces observadas.

g( Em uma cid;ade, famlias com 3 crianas so selecionadas ao


' anotando-se
o sexo de cada uma.

acaso,

peas por hora, escolhe-se um instante qualquer


. f.'Urna mquina produz 20

g. Uma moeda lanada consecutivamnte at o aparecimento da primeira


cafi.

Em muitas situaes prticas, o fenmeno .aleatrio com o

qual

Irrrbalhamos pode ser separado em etapas. A informao do que ocorreu em uma


rletr-:rrninada etapa pode influenciar nas probabilidades de ocorrncias das etapas
srrccssivas.

Nestes casos, dizemos que ganhamos informao e podemos "recalcular"


e

observa-se o nmero de defeituosas na prxima hora.

'

2.2 P r obabilidade Condicional e Independncia

rrs probabilidades de interesse. EsSas probabilidades "recalculadas" recebem o


Irrrrrrc cle probabilidade condicional; cuja definio apresentamos a seguir.

Captulo 2 : Probabilidades

42

Dados dois eventos A e B, a probabilidade condicional de


ocorreu .B representada por P(A I B) e dada por

:
'

J l' t r il x

It i I i

dado que

: H e ento, P(H n B) : P(H):

0,02.

Ettln,t,

P(Htrl:r#?:

P(!,1,8). PB)
\ /' > 0.
P(B)

'|
Caso P(B) : g, P(Al B) pode ser definido
usaremos P(Al B): P(A).

43

datle Condicional e Independncia

Ples srrposies iniciais, 1/ ) B

Defino 2.2 : Probabilidade c ondicional

P(Al
\ B\

?.

ffi:0,025

ftgur rr, n scguir, apresenta o efeito da informao

no espao amostral'

arbitrariamente; neste texto

tr

Exemplo2.3.' Considere a seguinte situao hipottica. Uma grande regio de 100


km2 contm um aqfero (reservatrio de gua) subterrneo com rea igual a 2
km2, cuja localizao _ desconhecida (ver figura a seguir). A fim de determinar a
posio do aqfero, perfuraes so feitas ao acaso. Vamos representar por If o
evento de encontrar gua. Temos P(H): 0,02, obtido pelo quociente da rea do
aqfero pela rea total, onde usamos que o espao amostral f) : {regio de 100

O = Regio (100 km2)

k*t.

C)'= Nova Regio (80 km2)

= Regio (100 km2)

@ e:ptr,, rrtttostral perdeu

Suponha agora que, aps uma ano de pesquisas, uma rea de cerca de 20
foi amplamente perfurada sem encontrar gua e pode ser descartada para

j
novos furos. Representamos essa informao por
km2

1. Qual seria, agora,

fr

20 kmz , que a rea descartada para novos

furos, tr

l)rr tlc'iniiro de probabilidade condicional, deduzimos a regra do produto


Stnilultililrulcs, uma relao bastante til que apresentadanaFigura2'2,

a,

probabilidade de um furo, feito ao acaso, atingir o aqfero? Vamos representar


por P(H I 1) u probabilidade desejada. Com a mesma argumentao utilizada
acima, a nova regio de procura terrea B0 km2 e portanto P(H I I):0,025,
Isto , como espervamos, a probabilidade de obter gua aumentou devido i
informao recebida. Vamos refazer esse clculo utilizando agora a frmula de
probabilidade condicional. Para tal, seja B a nova regio de procurir
correspondendo a rea total inicial menos a parte que foi descartada para novas
tentirtivits. Temos que P(B) : 0,8. O evento H a B representa a ocorrncin dc,
scrn ncnhuma informao etuxiliar, ncontrarmos gua num 'uro f'eito na regiiro .R.

Itigura 2.2: Regra do produto


I lrrr

de probabilidades.

corrceito nruito inrportante em probabilidade o da irulependnciu

etrrl.t,\', rllrL1 rict'ii utiliznclo rcpeticlitntcntc ao lottgo de toclo o texto'

cle

Captulo 2 : Probabilidades

44

P rt tl t

il ti I i r k u I c

Co

ndic ional e Indep end nc ia

45

Deftnio 2.3: Independncia de eventos


no de

Dois eventos A e B so independentes, se a informao da ocorrncia ou


no altera a probabilidade da ocorrncia de ,4. Isto ,

P(Al

ol

B): P(A), P(B) > o,

0.9

ou ainda a seguinte forma equivalente:

P(A

B)

P(A) P(B).

o.;

tr

o2

No difcil verificar que se A , independente de B, ento B


independente de A. O uso da expresso acima permite, ainda, verificar que o
evento vazio independente de qualquer evento. As demonstraes so deixadas
a cargo do leitor.
E muito comum, primeira vista, confundir eventos independentes e
eyentos disjuntos. O prximo exemplo ajuda a esclarecer essa questo.
Exemplo 2.4: lJnaempresa produz peas em duas mquinas 1e f f , quepodem
apresentar desajustes com probabilidade 0,05 e 0,10; respectivamente. No incio
do dia de operao um teste realizado e, caso a mquina esteja fora de ajuste, ela
ficar sem operar nesse dia passando por reviso tcnica. Para cumprir o nvel
mnimo de produo pelo menos uma.das mquinas deve operar. Voc diria que a
empresa corre o risco de no cumprir com suas metas de produo?
Seja O; o evento da mquina i estar operando, ,i : 7,2. Pelas informaes
disponveis temos P(Ot): 0,95 e P(O2): 0,90.
Na Figura 2.3, apresentamos um diagrama conhecido como rvore de
probabilidades, qu'e consiste em representar os eventos e as probabilidades
condicionais associadas s realizaes. Cada um dos caminhos da rvore indica
uma possvel ocorrncia.

0,0

oi
o;
Figura 23: rvore

de

probabilidades.

A tabeln u seguir resume as ocorrncias e suas respectivas probabilidades,


Eventos

Probabilidade

oro,

0,95x0,90:0,855
0,95x0,1,0:0,095
0,05x0,90:0,045
0,05x0,10:0,005

OrO'

ol'o,
o'o;'

Parn otrter o nvel mnimo de produo di'ria, precisamos ter pelo menos

nilleluinn opcrando.
U (, t( )i'

Isto

corresponde

ocorrncia

do

evento

Oj'0r.Ternos,

No preenchimento dos valores de probabilidades na rvore, observe que


assumimos a independncia entre 01 e 02, pois acreditamos que a eventual falta
de ajuste em uma mquina no interfere no comportamento da outra. Note que, no
caso de independncia, o segundo ramo da rvore no afetado pela ocorrncia

r ll'e renlizflcs so disjuntas. Por exemplo, no possvel as duns

dos eventos que aparecem no primeiro ramo. Portanto, pela definio de


independncia, segue que P(O2l Ot) : P(Or): 0,90.
Para facilitar a notao, vamos escrever O1O2 para o evento OtOz.

trfninro dc procluiio 0,995, Portanto, a empresa tem alta probabilidade de

sua probabilidade da ocorrncia dada pelo produto dos ramos que levam nesse
evento. Isto correspondendo aplicao da regra do produto de probabilidades:

P(Ap2)

P(Oz I 01) P(Ol).

t1(()(),,Q OLOI u O'O2)

P(OQz) + P(OLO;') + P(O'O),

Op)

e ao mesmo tempo s a mquinn .I


lncs estnrenr operunclo (evento
(evento O()').Dessn brma, conclumos que a probabilidade d manter o
r1n Huns rnetus cle produo.

tr

No exernplo anterior, os eventos representados pelas interseces


g,f,l1(J,j', ()i02 c Oi'Oi'lonnnrn novos cventos que tm a propriedacle de
ltlulrlnnrente exclusivos

e cuja

uniflo contenrplt toclas as possveis

Captulo 2 : Probabilidades

46

F tt

il t

t I t

iI

il h ul c Co

ndicional

47

e Independncia

combinaes. Eventos que satisfaam essas duas caractersticas tm importante


papel no clculo de probabilidades e, assim, merecem destaque.

Definio 2.4: Part.o do espao amostrsl


Os eventos Cr,Cz,... ,Ct, formam uma partio do espao amostral, se
eles no tm interseco entre si e se sua unio igual ao espao amostral. Isto ,

Ca)Ci:Q

Para

i'+i

1,

U Ci:9.
.i:t

tr

A=

A Figura 2.4 apresenta um exemplo de uma partio com 6 eventos.

(A

nFr) u

(A.F) u (nq)

uittcln,estar interessados em saber qual a probabilidade de que a amostra


tenlrir siclo obtida do leite fornecido pela fazenda F1, isto ,, P(4lA),
lmpllen er se inverter a probabilidade condicional conheciOa P(lF'1).
conro cssa so tpicas para o uso do resultado apresentado a seguir, tr

dc llnycs: Suponha que os eventos Ct,Cz, ... ,Cn formem

l e que suas probabilidades


EFl evr:ttlo A, se conheam as
le

Figura 2.4: Partio do espao amostral (k=6).


Exemplo 2.5.' Suponha que um fabricante de sorvetes recebe 20Vo de todo o leite
que utiliza de uma fazenda F1, 307o de ura outra fazenda F2 e 50Vo de -F's. Um
rgo de fiscalizao inspecionou as fazendas de surpresa e observou que20Vo do
leite produzido por .F'1 estava adulterado por adio de gua, enquanto que para
F2 e Fs, essa proporo era de 57o e 2Vo, respectivamente. Na indstria de
sorvetes os gales de leite so armazenados em um refrigerador sem identificao
das fazendas. Para um galo escolhido ao acaso, vamos analisar o leite para
decidir sobre sua adulterao ou no.

Se denotarmos por o evento "o leite est adulterado", temos que


P(Al.p'r) : 0,20, P(Al Fz):0,05 e P(Al rs):0,02. Alm disso, .F'1, F'2 e
,F3 formam uma partio do espao amostral pois uma dada amostra de leite vem,
necessariamente, de uma e apenas uma das trs fazendas. Desta forma, o evento
pode ser escrito em termos de interseces de com os eventos F1, F2 e F3,
conforme ilustra a figura a seguir.

11

3,

,,

. , ft,

linto, para qualquer

j,

uma
sejam conhecidas. Suponha, ainda, que
probabilidades P(AlCt) para todo

P(A I c P(c j)

I'(C,il A) :

D p(A I cr) p(cr)

i:l

ro: t)r clcl'inio de probabilidade condicional temos

P(ci I A) :
Etettdor
lgnedo

dcssl expresso pode


f,'i, isto

P(C1n A)

P($
ser reescrito

'pela regra do produto,

P(A;1n A)

: P(AC : P(Al C,:j)P(C.j).

EEttlFletnr u clentonstrairo note qu

l;

r,,(A) :Dnra.ci) :Do(1l


i=l

i=L

c,) P(c).

tr

48
'"

-- T ((trn.r1')

( t,' u \")

rr(,.

^\
.
s')

- lC-0" v-w d"t- J'lv'ng.r.,rzn

i,

( a) b'\ - P (

('*t'r',-,ll'

Captulo 2: P

p[n'', -? (al@)

49

Exemplo 2.6: Yoltando situao do fabricante de sorvetes (exemplo anterior),


podemos agora calcular facilmente a probabilidade desejada, isto ,

P(.il)

P(FrlA):--i(A)-A)

l/

rt tt'irttrito: se dois eventos so mutuamente exclusivos ento eles'

lnrlelrcttclcntes.

Pgulo llutebol Clube ganha com probabilidade 0,7 se chove

;e com 0,8 se
chuva

de
0,3.
O
So Paulo
probabilidade
de
a
Sctcrnbro
eve, l'inr
probabilidade
ter
chovido
nesse
qual
de
a
ull1n l)nrticln em Setembro,

P(A I F'l)P(rl)

que sc

AeB

so independentes ento

A e B"

tambm io

les.

e, ento

P(Frlrl:

:0,615.

reelos

Portanto, a probabilidade de que a amostra de leite em questo tenha si


produzida pela fazenda F1, de 0,615 em contraste com as probabilidades 0,231
0,154 para as fazendas F2e F3, respectivamente.
Exerccios da Seo 2.22

L. Considere dois eventos A e B, mrtumente exclusivos, com P()

:0,3

P(B) :0,5. Calcule:


a. P(An B).
b.P(Au B). /-t
c.P(Al B). (-"
d. P(A.).
e. P((A u B)").

2. Se P(AU B)

p@btthiliduclc de sair somente uma cara.


pbchiliclnde dc sair pelo menos uma cara.
ffebntrllidurle de dois resultados iguais.
urrr conjunto de 4 nmeros dos quais nenhum deles zero, dois so
c dois sio negativos. Sorteamos ao acaso, com reposio, 2 nmeros
enjunto, l)eterrnine a probabilidade de:
deler r,rer negntivo.

0,8;P()

fuedn vicitclu de modo que a probabilidade de sair cara 4 vezes maior


I de urir coloi. Para 2 lanamentos independentes dessa moeda,

0,5 e

P(B)

qune ietrle set negativo.


dclr nrrrerc)s terem o mesmo sinal.

r, determine o valor de rno

caso

He

afirmaes:

P(A lB)

Lf2 ento

An'/ao pode estar

f,tldn ettt /J.

3. Uma escola do ensino mdio do interior de So Paulo tem 40Va de estudanteg


do sexo masculino. Entre estes, 207a n]unca viram o mar, ao passo q\e, entre A
meninas, essa porcentagem de 50Vo. Qual a probabilidade de que um aluno
selecionado ao acaso seja:
a. Do sexo masculino e nunca tenha visto o mar?
b. Do sexo feminino ou nunca tenha visto o mar?

nr)

ats

& nt) -- 12,l'(Dl A):r

a. Ae -B serem mutuamente exclusivos.,


b. e B serem independentes. U'

a.SeP(f) :0,4;P(A) =0,7e P(A

sf,o vrlliclas

) - lllaf'@ l) :3/5ento AeB nopodemserdisjtrntos'


:

de:

'/

= 0,3;calculc P(AI D"),

lrce dr, estustica tcve a seguinte distribuio das notas finais: 4 do sexg

lnu c fi clo 'crnirrino bram reprovados, 8 do sexo masculino e 14 do


lno frtrurn ttprovndos, Para um atluno sorteado dessa classe, denote por M
lutto eseollrirlo br do scxo masculino e por se o aluno foi aprovado.

F1d

t=t

ltl";,

rr ilI"),

F('
F(d | /1/).

Captulo

50

robabilidades

d.P(M'I

ttttr l)uirrg existem trs empresas de TV a cabo e 20 mil residncias. A


'l'A lcrn 2100 assinantes, a TB tem 1850 e a empresa TC tem 2600
:in1ttl,,s, scttclo que algumas residncias em condomnios subscrevem aos
lr'u tlc: urais de uma empfesa. Assim, temos 420 residncias que sito
Irlr:s tlo TA e TB, 120 de TA e TC, 180 de TB e TC e 30 que sito
rrtrs tlns trs empresas. Se uma residncia desse bairro sorteada ao
ruu, quttl l probabilidade de:

A).
e,P(M I A).
?eas produzidas por uma mquina so classificadas como defeituosas,
,"c,rpe.veis ou perfeitas com probabilidade de 0, 1 ; 0,2 e 0,7 ; respectivamente.
De um grande lote, foram sorteadas duas peas com reposio. Calcule:

a. P(duas serem defeituosas)


b. P(pelo menos uma ser Perfeita).
c. P(uma ser recupervel e uma perfeita).
E se o
,,@)t"Oiqu. as suposies utilizadas para resolver os itens anteriores.
vsorteio for sem rePosio?
6.Paradois evento s A e B,num mesmo espao amostral, verifique, atravs ile um
diagrama, que sempre possvel escrever o evento A como sendO
: P(An B) + P(A B")'
e"o A1U ( n B") e que, portanto, vale P()

7.

Fr nssirrlrrtc somente da empresa TA?


A$lttnr 1rclo tncnos uma delas?

!Ee t.'r''l'V n cabo?

tle runs bolus, citlcule a probabilidade dela ser:

fu buE,lrrcte,
Fgclctrtcs clc uma Clnica de Ginecologia com idade acima de 40 anos,
trr rrrr lrtrn casadas e 407o so solteiras. Sendo solteira, a probabilidnde
f tlrlo urn rlistrbio hormonal no ltimo ano de I07o , enquanto que poftl
ftnrn I r e sstt probnb i I idade aumenta para 30Va' Pergunta-se :
QU*rl tr prtoltnbiliclade de uma paciente escolhida ao acaso ter tido um
dlrlr'trirt ltortttottal ?
e A pncierrte sortcada tiver distrbio hormonal, qual a probabilidade de ser

a. No praticar esporte. ' ',


b. Ser alrgico dado que no pratica esportes.

8. As preferncias de homens e mulheres por cada gnero de filme alugado em


uma locadora de vdeos, esto apresentadas na prxima tabela'

Mulheres

Comdia

Romance

136

92
195

r02

Policial
248

,f,Ooit dados equilibrados so lanados' Calcule a probabilidade de:


a. Obter o par (3,4), sabendo-se que ocorreu face mpar no prirneiro dado.
,,'i'
' ll. Ocorrcr face mpar no segundo ditdo, sabenclo-se quc ocorrcu acc par
pritttciro dado.

:sltit'u'/

excullr!'rnus cluits pacientes ao acaso e com reposio, qual

62

Sorteando-se, ao acaso, uma dessas locaes de vdeo, pergunta-Se


probabilidade de:
a. Uma mulher ter alugado um filme policial?
b. O filme alugado ser uma comdia?
c. Um homem ter alugado ou o filme ser um romance?
d. O filme ser policial dado que foi alugado por um homem?

de basquete, enquanto o armrio 2 tem 3 bolas de


I r' ? clc basquete. Escolhendo-se, ao acaso, um armrio e, em seguida'

eI

p vok ibol, sitbcndo-se que o armrio 1 foi escolhido' burq,,.,*, sitbcnclo-se que o armrio 2 foi escolhido.0

"r"olhido

Sexo \ Filme
Homens

gttrrrit'ios guardam as bolas de voleibol e basqete. O armrio 1 tem 3

de vrrleibol

Numa cidade do interior de So Paulo, estima-se que cerca de 20Va doS


habitantes tm algum tipo de alergia. Sabe-se qne 50Vo dos alrgicos praticam
esporte, enquanto que essa porcentagem entre os no alrgicos de 407o'PatA
aleatoriamente nessa cidade, obtenha a probabilidade
um indivduo
de:

5t

ft'r't{'i,,f

pfolruhilirlittlc clc pclo lrenos uma ter o distrbio?


elttr,'g.tt il s!:tl amigo uma cart, destinada sua namorada, parat sgt
:4111 tro crtrrcio. Entrcttnto, ele pode se esquecer com probabilidade 0,1 .
llu Er. i,sr.lltec:cl', l probltrilidacle de que o correio extravie a carta de 0'1,
lSetttr:, st: liri cnviacla pclo correio a probabilidade de que a namorada nlio

Yt*

tscehrr rt tL: 0, I .
Efu trrrrturt'urlit ttio rcccbctt o carta, qual a probabilidade de seu amigo tel
prquecirto tlc crtloct-la no corrcio'l

br
nO

Avrrltr, rrs llossillilidnclcs clcsse rlanoro cotttinuar, se a comunicaiio


tepett,l,,r rltts ctrtits ottviitdas.

Captulo 2 : Probabilidade

52

14. Numa certa regio, a probabilidade de chuva em um dia qualquer de


primavera de 0,1. Um meteorologista da TV acerta suas previses em 807o

Flnr'rtttlt'ttt' gua em at duas tentativas.

Eneottlt'rtr iigtta.

dos dias em que chove e em907o dos dias em que no chove.


a. Qual a probabilidade do meteorologista acertar sua previso?
b. Se houve acerto na previso feita, qual a probabilidade de ter sido um dia de
chuva?

UFt ttrrurlico closconfia que um paciente tem tumor no abdmen, pois isto
nn 70(k' clos casos similares que tratou. Se o paciente de fato tivcr o
, u rxnno rrltra-som o detectar com probabilidade 0,9. Entretanto, se ele

o lurror, o exame pode, erroneamente, indicar que tem com


lirlirrle 0,1. Se o exame detectou um tumor, qual a probabilidade clo
lcnte t lo tlu lto?
tlvr.r

15. A tabela a seguir apresenta informaes de alunos de uma universidade


quanto s variveis: Perodo, Sexo e Opinio sobre a Reforma Agr'ria,
Determine a probabilidade de escolhermos:
a. Uma pessoa do sexo masculino e sem opinio sobre a reforma agrria?
b. Uma mulher contrria a reforma agr6,ria?
c. Dentre os estudantes do noturno, um que seja a favor da reforma agrria?
d. Uma pessoa sem opinio, sabendo-se que ela do sexo feminino?
Perodo

Diurno
Noturno

dos 1000 ingressantes de uma universidade,


e classe scio econmica.
de
estudo
sobre
rea
lnfolrrrrrt'ics

t*helu

Reforma Agrria

Sexo

53

ttr t,',,,.r

rt segttir itpresenta dados

Area \ Classe

Alta

Mdia

Baixa

Exatas

L20

156

68

Humanas

72
169

B5

LL2

I45

Biolgicas

-q
L)

Contra

A Favor

Sem opinio

Feminino

Masculino

Feminino

&tg,l,tt'ttu rit'cit clc exatas.


&tu,lgr t,,, 1il'r:i dc humanas, sendo de classe mdia.

Masculino

T2

10

gf du r'lrsstr bitixit, clado que estuda na rea de biolgicas.

16. Trs candidatos disputam as eleies para o Governo do Estado. O candidato


do partido de direita tem30Vo da preferncia eleitoral, o de centro tem307o e o
da esquerda 40Vo. Em sendo eleito, a probabilidade de dar, efetivamente,
prioridade para Educao e Sade de 0,4; 0,6 e 0,9 para os candidatos de
direita, centro e esquerda, respectivamente.
a. Qual a probabilidade de no ser dada prioridade a essas reas no prximo
governo?
b. Se a rea teve prioridade, qual a probabilidade do candidato de direita ter
ganho a eleio?
,.

,.,,.

lf:.Uma companhia

que fura poos artesianos trabalha numa regio escolhendo,


"leatoriamente, o ponto de furo. No encontrando gua nessa tentativa, sorteio
outro local e, caso tambm no tenha sucesso, faz uma terceira e ltirnn
tentativa. Admita probabilidade 0,7 de encontrar gua em qualquer ponto dcssn
regiro. Calcule a probabilidade de:
a. Encontrar rguir na seguncla tcntativa.

BFI ttltttur ittplt'cssiutte escolhido ao acaso, determine a probabilidade dc:

&r

du clussc ccontrrica mais alta.

it probabilidade de gostar de teatro , Il3, enquinto


gostlr
rlc cinerna 112. Determine a probabilidade de gostar de tcatro
tlc
t'r:r'lrr poprrlitiro,

:lc citrt'rttir, rtos scguintes casos:

grlnl'rlt, lerrtnr o gostilr cle cinema so eventos disjuntos.


lnrttu'rh' lntltrr o gostar de cinema so eventos independentes.

Fgd,,r rlllr' loslnr clc teatro gostm de cinema.


A Frrihirlrilirlrtrlo clc gostitr de teittro e de cinema Ll8.
flenlre os (lue nio gostam de cinema, a probabilidade de

nro gostar de

tcitlro

;l/.1,

ecluipamcntos de preciso para o laboratrio tle


Apesar cle serem aparelhos de preciso, cxiste
ttttivct'siditcle,
lpflnlr.rt rlr' untit

I Tr hilrrir'ns lrrnccctn

EFa prlut'nl clrirrrco clo subcstirniro ou superestimao clas rnecliclns


*lttit,lrrq A tlbcln it scgttit' aprcscnta o collportamcnto do equiparncnto
Fdttrl,l,, t'!!t t'iltlll I'iillricl:

Captulo 2: Probabi

54

Fbrica I
Probabilidade

Subestima
0,01

Exata
0,98

Superestima
0,01

Fbrica II
Probabilidade

Subestima
0,005

Exata
0,98

Superestima
0,015

Fbrica III
Probabilidade

Subestima
0,00

Exata
0,99

Superestima
0,01

Uporrhl que X represente o nmero de horas de atividade fsica por semana.


cnriirlcrc a tabela a seguir:
Sexo \ Atividade

II e III fornecem, respectivamente, 20Vo, 30Vo e 50Vo dos


aparelhos utilizados. Escolhemos, ao acaso, um desses aparelhos e

perguntamos a probabilidade de:


a. Haver superestimao de medidas?
b. No haver subestimao das medidas efetuadas?
c. Dando medidas exatas, ter sido fabricado em III?
d. Ter sido produzido por I, dado que no subestima as medidas?

a probabilidade de sortear aleatoriamente uma menina com atividade


fsicit scrnanal na faixa de [3, 5) horas?

ptrrtlrtrilidade de encontrar gs numa certa regio ,

2393

762

Voc diria que o fato do motorista estar ou no alcoolizado interfere


ocorrncia de vtimas fatais?
24. Sejam A e B dois eventos de f), tal que P(B) ) 0. Mostre que:
a. Se P( I B) : P() ento P(A18) : P(A)P(B)'
b. Se P( n B) : P(A)P(B) entito e D siro independcntes'

ll

c C pertencentes a um mesmo espao amostral. Mostre que:

F(a U B I c) : P(Al c) + P(B lc)-P(A)Blc).


te Jt /'' cntito P(Au B I C) : 1.
F(,4 t t 11U C) : P(A) + P(B) + P(c) - P(A. B) - P(A. c)
= t'(/t l) + P(An B nC).

alcoolizado.

Alcoolizado

A,

AltJ) :1-P(AlB).

23. Estatsticas dos ltimos anos do departamento estadual de estradas so


apresentadas na tabela a seguir, contendo o nmero de acidentes incluindo
vtimas fatais e as condies do principal motorista envolvido, sbrio ou

275

llrc. Trs sondas

i!'ns estito perfurando de modo independente.


gbertrlo-se que uma delas (qualquer) no achou gs, qual a probabilidade
dHg ottlt'its duets encontrarem?
$bcttrltt-so que uma delas (qualquer) no achou gs, qual a probabilidade
d etteorttrar gs na regio atravs dessas perfuraes?
tllrc:nrkr-sc que no mais de uma delas (qualquer) achou gs, qual a
prohrrbiliducle de nenhuma encontrar gs?
I

L22B

7
6

Qull

Sim

t
d

P(X > 5).


a probabilidade de que um rapaz escolhido aleatoriamente dedique
*rlcrrlc
Cr
pelo rncnos 5 horas atividade fsica. Idem para uma moa.
, utttltitt'c is respostas dadas nos itens (b) e (c)'

pblica. Sendo alrgico, a probabilidade de ter reao a um certo antibitico


de 0,5. Para os no alrgicos essa probabilidade de apenas 0,05. Uma pessoa
dessa populao teve reao ao ingerir o antibitico, qual a probabilidade de:

No

22

r enlculc

22. Acredita-se que numa certa populao, 207o de seus habitantes sofrem
algum tipo de alergia e so classificados como alrgicos para fins de sade

Motorista \ Vtimas fatais


Sbrio

0<x<3 3<X<5 x>5

Feminino
Masculino

As fbricas I,

a. Ser do grupo no alrgico?


b. Ser do grupo alrgico?

55

E.ttt't'it'irts

jlntr fnrrrlil

ft

vilja ao litoral para

euttgr.slirtttittnento net estrada

passar um

fim de semana. A probabilidade

de 0,6. Havendo

congestionamento, a

Sbttlrilirlrrrkr clos seus dois filhos brigarem no carro de 0,8 e,

na

$ngesti.rrrnnrenlo, a

sem
brga pode aparecer com probabilidade 0,4. Quando h

or.l scln congestionamento, probabilidade do pai perder a


piIe in r'(n os 'ilhos de 0,7. E claro que havendo congestionamento o pai
pde per,l,.r'tt pitcinciil com os filhos mesmo sem brigas, o que aconteceria
Ft ptohlhilirlndo 0,5. Quando niro hr nem congestionamento, nem briga, o
pi eltrtgr. trnrtqiiilo c nto 1:crdc a pucincia, Determine a probabilidade de:
* Nnrr kt'ltitvirkl congestiottittrtcnto se o pai no percleu a pacincia com seus

bitl, ,,.,",

flllrrtF

56

Captulo 2: Probabi

b. Ter havido briga, dado que perdeu a pacincia.

ultt.

29.Um candidato

a motorista treina na auto-escola e acredita que passa no exame


com probabilidade 0,7. se no passar, far mais treinamento, o que ele estima
que lhe aumentar em lj%o a probabilidade de passar, isto , no segundo
exame passar com0,77 de probabilidade.
a. Supondo que ele continue acreditando nesse aumento de possibilidade, em

que exame ser aprovado com certeza?

b. Qual a probabilidade de serem necessrios mais de 2 exames?


Os arquivos de dqdos mencionados nos exerccios a seguir podem ser obtidos em
www. i me. us p. b r/- no p ro e s t

30. (Use o computador) Considere os dados do arquivo areas.txt descrito no


Exerccio 25, captulo 1. Suponha que voc ganhe um apartamento em uma
promoo feita por uma cadeia de lojas. utilizando o computador, construa
tabelas de freqncia necessrias para responder s seguintes questes.
a. Qual a probabilidade do apartamento estar situado entre os andares 4 e7?
b. Qual a probabilidade do apartamento estar situado no bloco B?

c. Qual seria a probabilidade de voc ganhar um apartamento com algum


problema de construo? (Isto , com rachaduras ou infiltraes).
d. Repita os itens anteriores, dado que o apartamento esta situado no bloco B.
3L. (Use o computador) Considerando o arquivo cancer.txt calcule:

a. As

probabilidades de que um paciente selecionado, ao acaso, seja

classificado em cada uma das quatro categorias da varivel Diagnstico.


b. utilizando apenas o item (a), qual a probabilidade de um paciente,
selecionado ao acaso, ser diagnosticado como no tendo a doena?

32. (use o computador) considere os dados do arquivo aeusp.txt descrito no


Exerccio 26, Capnlo 1. Suponha que escolhemos, ao acaso, um dos
moradores entrevistados.
a. Qual a probabilidade da idade do entrevistado ser inferior a 35 anos?
b. Dado que o morador tem menos do que 35 anos, qual a probabiridade
dele ser do sexo feminino?
c. Qual seria a probabilidade de escolher um morador do Jardim Raposo quo
tenha acesso a computador?
d. Determine a probabilidade de escolher um entrevistado qr"re tcnha vinclo clo
nordeste, seja do sexo feminino e estr trabalhando. Se esse rnoraclor bi
escolhido, qual a probabilidaclc delc tor cartcira assinacla?

rklvcis Aleatrias Discretas


IRtrorluiro
Nr.rlc c'irptulo, incorporamos o conceito de probabilidade no estudo de
l: tsrociirclls a caractersticas em uma populao. No Captulo 1, vimos
Hllllrrrrrrlo rrrtlr tabela de freqncia, podemos apresentar os valores oossveis
glua rlrtrlir vnrirvel e suas respectivas freqncias. Evitamos, dessa forma,
$endr, ltet'tlir clc informao, a repetio, s vezes muito grande, dos valores
dvc.l, l)tr ornra irnloga, vamos formalizar, com a ajuda da Teoria das
llrlnrk's, o conrportamento de variveis na populao, associando a cada
vllor sua probabilidade de ocorrncia. Como j mencionamos no
iilrtrli()r', irlnr da probabilidade poder ser obtida a partir do estudo das
Irts, clrr tirrnbm pode ser deduzida a partir de suposies feitas a respeito
llrt;t,r rlo 'r:nmeno. Na formalizao que faremos com a introduo de
llklnrlr's, nos ocrparemos apenas das variveis quantitativas. Vamos
It'etrlrr os casos discreto e contnuo, pois a atribuio de probabilidades
h' r'trt ciulrt situao. As variveis qualitativas podem ser, em algumas
! E corrl o ctovido cuidado, tratadas como discretas na atribuio de
hliirlt's,

Utnir rilrirrrticlaclc X, associada a cada possvel resultado do espao


, tlt'rrrrrrrirtirdn dc vevivel aleatria discreta, se assume valores num
r etttttrrel'iivol, corn certa probabilidade. Por outro lado, ser denominada
ctle'ttltit'itt t:rtttltuta, se seu conjunto de valores qualquer intervalo dos
iFntH. o tltrc scria um conjunto no enumervel.

rnlr i'i rrtcrrcionamos arnteriormente, existem variveis que so


rrlr rlrl'irritlls courcl discretas ou contnuas, porm essa atribuio no

!r

e rlt';rt.trth-r tkr irrstrumento de medida e do estudo que est sendo feito.


letttlrlrr, rr virliiivol tninrero dc,filltos em.famlias discreta, enquanto o

clr

te'tt1'titt

u utn t:erlo

mulicdnrcn.o

contnua. A

discusso sobre

iflr.tt;to rh' vrrliiivcis, lbitn lro Captulo l, serr utilizada em todo o texto e a
fEl rtl:.'tttrrt'itt ir itcrcscicln itqui pttt'it inclicar qtle, cada possvel valor,
r!1 unut prohullilidnclc clc ocorrlrciu. No caso discreto, a atribuio

57

Captulo 3: Varidveis Aleatrias Disc

58

similar

tabela

de freqncia;

no caso contnuo,

jL

utilizaremos

generalizao da idia de histograma.


Neste captllo apresentamos os resultados e modelos mais comuns
variveis aleatrias discretas, deixando para o Captulo 6 a discusso do

contnuo.

Seja

uml varivel aleatria discreta e

11,12,ryt...,

seus dife

59

folr,t,lrt1,t,,

1) : 0,30 e
a catacterizao probabilstica a varivel
=: '=l ) 0,15. Para completar
lrt N. jrltn obter as probabilidades P(l : 3), P(l/ :4) e P(N : 5).
r rrs irrlrmaes fomecidas, elas so iguais e, digamos, tm valor p.
r rr rlcl'irtio de funo discreta de probabilidade, temos que:

= (l) 0,20. De forma semelhante, temos que P(l'r

valores.

/)(N

Definio 3.1: Funo dscreta de probabilidade

0,20

A funo que atribui a cada valor da varivel aleatria sua probabr


denominada de funo discreta de probabilidade ou, simplesmente, funo
probabilidade. Anotao a ser utilizada :
P(X =

r;) :

p(r1)

: pi,'i : I,2,...

1) ... + P(,^f
0) + P(.^'r
r
0,30 +0,35 + p+ p + P
0,85 + 3p: I

5)

0,15
p::0,05.
Ftttrio rlc probabilidade para

l/

dada pela tabela a seguir:

tr

ou ainda,

.1,): Nir construo de um certo prdio, as fundaes devem atingir 15


de prolrnrliclade e, para cada 5 metros de estacas colocadas, o operador
l lrorrvt. ;rltcrao no ritmo de perfurao previamente estabelecido. Essa
icsrrltlulo de mudanas para mais ou para menos, na resistncia do
Nps rlis c1sos, medidas corretivas sero necessrias, encarecendo o
d pltru, ('otr lrase em avaliaes geolgicas, admite-se que a probabilidade
tliit rltr irltcraes de 0,1 para cada 5 metros. O custo bsico inicial
tlf'('s (rrrrirllrlc padro de construo) e ser acrescido de 50k, com k
rtirhr o rrtirncto de alteraes observadas. Como Se comporta a varivel
\1

Uma funo de probabilidade satisfaz 0

1 p, <

pt :
"I

L.

Note que, na maioria dos casos, X ter apenas um nmero finito


valores possveis e, assim, a verificao de qge a soma de probabilidades igunl
I ser feita atravs deuma soma finita. As variveis aleatrias so complet
caracterizadas pela sua funo de probabilidade e uma parte importantg
Estatstica , justamente, obter, para uma dada varivel de interesse, a funlo
probabilidade que melhor represente seu comportamento na populao.
Exemplo 3.1.' Com

do ltimo censo, a assistente social de um Centro


Sade constatou que para as famlias da regio, 20Vo no tm filhos, 30o/o t,m
filho, 35Vo tm dois e as restantes se dividem iryglgrglf" entre trs, quatro
cinco filhos. Suponha que uma famlia ser es'colhida, aleatoriamente, ne
regio e o nmero de filhos averiguado. Definimos N como sendo a vari
aleatria ntimero deftlhos e consideramos que a escolha feita entre as cli
opes de valores parn N. Isto , no importa qual a famlia escolhida, mas
qual a resposta dada quanto ao nmero de filhos. Desse mocJo, est
sorteando um valor deNdentre 0,7,2,3, 4 ou 5. A funo de probabilidaclo
varivel segue das informaes disponveis, isto , como 20ok das l'amlius
tm filhos, ento a ptobabilidade de uma ftrrrrliir sortcacla ao icaso niro ter I'ilho
dados

r rilrtrrs tkr ltndaito?

Assrrrrrirrros cluc as alteraes ocorrem independentemente entre cada um


ltrt,,rvitlos tlc -5 metros e representamos por A a ocorrncia de alterao
*l, lrrlr,rrzlo, scltclo '' seu complementar. A Figura 3.1 apresenta as trs
!,r!u (s possvcis resultados da perfurao. Cada etapa tem duas

$r

llrlri,l,'s (lu(:, (lr.riurclo combinadas com as outras duas etapas, originam 8


l -vlrrlos. llr cxcmplo, o evento AA"A representa que, na primeira e na
Clllill,, it(.()tloccril-n alteraes, enquanto que na segunda nada se alterou.
letfrr ri ll ('lirl)irs, coltt 2 possibilidades emcadauma, temos no total 23 :B
I I r-r,|no itrttoslt'itl cclnsistc na unio de todos os caminhos que levam de
pHltlrlr {riil!o (llr iirvorc clc probabiliclacles,

Captulo 3: Variveis Aleatrias Discretas

60

61

lllln,ilrr'ro

P(C :150)

-----_----^0,t4
0,9

o'

o"

A"
on,

: P(AA"A') + P(A'AA")
:3 x 0,1 x 0,92 :0,243.

+ P(A'A'A)

ptrrlrlbilidades para os outros valores de C podem ser obtidas de modo


r, r'csultando na seguinte funo de probabilidade:

0,9

lrrrna, o comportamento da varivel de interesse pode ser estudado atravs

tsoc:iao

de cada custo com sua probabilidade de ocorrncia. Essa

tiio pode auxiliar na previso de gastos e na elaborao de oramentos.

Figura 3.1: rvore


Sendo

de

probabilidades- alteraes no subsolo.

C a varilrvel aleatria custo da obra,

obtemos a seguinte tabela:

Eventos

Probabilidade

' (em UPCs)

AAA
AAA"

0,1"
0,12 x 0,9
0,12 x 0,9

250
200
200

AA.A
AA"A"
A.AA

A.AA.
A" AcA

AcAcAc

0,1

0,92

150

x 0,9
0,1 x 0,92
0,1 x 0,9'
0,9 t

200

0,12

150
150
100

Vlmos considerar agora exemplos em que as probabilidades associadas


[:rucrrtos do espao amostral so obtidas a partir de uma suposio terica.
3.3r Considere o experimento de lanar uma certa moeda observar se
eilnr ou coroa. Descreva o comportamento da varivel nmero de caras em
lilnt mentos dessa moeda.
Sc denotamos por ly' a varivel de interesse, segue imediatamente que l/
nssrrrrrir os valores 0, 1 ou 2.Para atribuir probabilidades a cada um desses
rrecessrio fazu alguma suposio a respeito da probabilidade de
rciir de cara ou coroa. Admitindo que a moeda equilibrada, as
lrilitlrrcles de cada face sero iguais, isto , P(cara): P(coroa) : Ll2.
ttos ainda a independncia entre lanamentos, de modo que a ocorrncia de
rlclclnrinada face no primeiro lanamento no altere a probabilidade de cara
pror n0 segundo lanamento.
l)oclemos considerar como espao amostral o seguinte conjunto:

g
Note que associamos a cada evento do espao amostral um valor para a
varivel aleatria C. Os distintos possveis valores so c1 - 100, cz: L50,
cs : 200 a c4 :250. Alm disso, podemos ter um mesmo valor da varivel
associado a mais de um elemento do espao amostral, por exemplo,

P(C :

cz)

: P(C:

150)

: P(AAA'l) AAA'U A"A"A).

Tendo em vista que os eventos so disjuntos, a probabilidade da unio fica sendo


simplesmente a soma das probabilidades de cada evento. Ento,

: {cc ,c R, RC , RR},

c / rcpresentando a ocorrncia de cara e coroa, respectivamente.


l'lra deduzir a funo de probabilidade de -y', observe que o valor 1
rrttr. rros cventos CR e C, enquanto que os valores 0 e 2 tm apenas um
etttrr ir cles associado, respectivamente, -R e CC. Segue ento que as
(I

pfehnlrilitlucles associadas aos valores de Iy' so as seguintes:

tr

Captulo 3: Variveis Aleatrias Disc

62

Exemplo 3.4: tJmjogador paga 5 fichas para participar de um jogo de


disputando com a banca quem tem o ponto maior. O jogador e a banca
cada um o seu dado e a seguinte regra de premiao estabelecida:
maior, ele ganha 2 vezes a diferena entre o
- se o Ponto do jogador
Joga
ponto e o obtido pela banca;
se o ponto do jogador menor ou igual ao da banca, ele no ganha
O que voc acha desse jogo?
Vamos admitir que os dados utilizados so perfeitamente homogneos,
tal forma que no h preferncia na ocorrncia de qualquer uma das seis f
Assim, podemos considerar que os pares de valores (b, i) representt

o resultado obtido pela banca e pelo jogador, tm a met


probabilidade de ocorrncia. Isto , qualquer par tem probabilidade 1136

63

(1, 1)

(2,L)
(3,1)
(4,1)
(5,1)
(6,1)

Para cada par (b,7) sorteado, a premiao baseada nos seus va


Definimos a varivel aleatria discreta G como sendo o ganho bruto do io
em uma jogada, isto , o valor arrecadado sem descontar as fichas iniciais
para participar do jogo. Pela regra de premiao' segue que:

t:l

o,

se

O espao amostral, correspondente a uma jogada, apresentado a

j):

futtiio clc probabilidade:

(;l

2 4 6 B 10
0
7t, I ztlze 5lJ6 4lJ6 Jls6 2186 Llz6

(5, 1)

(6,1)
O valor G

fiubrc o jogo fica, ento, evidente. Tendo em vista as 5 fichas pagas


o .jogirclor s no ter prejuzo nos casos em que obtiver 6, 8 ou 10

rint nruitl sorte (1/36), o jogador ganhar o dobro do que

<

(2,2)
(3,

2)

(4,2)
(5,2)
(6,2)

(1,3)
(2,3)
(3,3)
(4,3)
(5,3)
(6,3)

(r,4)

(2,4)
(3,4)
(4,4)
(5,4)
(6,4)

(1,5)
(2,5)
(3, 5)

(4,5)
(5,5)
(6,5)

apostou. tr

,2: Ituno de distribuio de probabildade

$ Jiutr;iltt dc tlistribuio
lerrlririrr cliscretzr

ou

(1,6
(2,6
(3,6
(4,6
(5,6
(6,6

0 acontecer quando o ponto do jogador for menor ou

ao da banca. Esse caso corresponde ao seguinte subconjunto do espao

funo acuru.ulada de probabilidade de uma


real r, pela

X definida, para qualquer nmero

xpl'rssto:
!

(\,2)

(6,6)

de, rctorno, o que acontece com probabilidade


!/aC t lf 36:6/36. Portanto, o jogo altamente favorvel banca e,

i<b.

serG:2x(3-1):4.
(1,1)
(2,1)
(3,1)
(4,1)

(4,3) (4,4)
(5,3) (5,4) (5,5)
(6,3) (6,4) (6,5)

Ent vriliirs situaes til calcular a probabilidade acumulada at um


, A tlel'inio a seguir apresenta esse conceito.

Dessa forma, se o jogador obtm 5 e a banca 6, temos G : 0 pois j < b (5


Por outro lado, se o jogador tira 3 e a bancaJ, o valor do ganho bruto do j

atravs dos pares (b,

(3,3)

3l 1r,t'.r trn todos a mesma probabilidade de ocorrncia e, portanto,


Jtlf'l 0) :21136. De modo anlogo, calculamos os demais valores e

respectivamente,
ocorrer.

(2,2)
(3,2)
(4,2)
(5,2)
(6,2)

F(r):

P(X < r)

llrrt populao de 1.000 crianas foi analisada num estudo para


cl'ctiviclnclc
de uma vacina contra um tipo de alergia. No estudo, as
n
fer.t:lrirrnr r.rrna dose de vacina e, aps um ms, passavam por um novo
r rritrrlir livcsscm tido alguma reao alrgica, recebiam outra dose da
Ao lirrr rlc.5 closcs todas as crianas foram consideradas imunizadas. Os
unrrr;rletos csto na tabela a seguir.
J,.f,'

l)oses
'r'ccy.

245

2
28t

256

t45

66

Captulo 3: Variveis Aleatrias Discre

64

Supondo que uma criana dessa populao sorteada ao acaso, qual ser
probabilidade dela ter recebido 2 doses? Utilizando a idia de atribui
probabilidade atravs da freqncia de ocorrncia, a probabilidade desejada
288/1000:0,288. A funo de probabilidade da varivel aleatria nmero
doses recebidas fica sendo:

65

I(.r)
l,oo
9,954
,7fltl

0,145
,113

Suponha, agoa, que desejamos calcular a probabilidade da criana ter recebi


at duas vacinas. O que precisamos obter a funo de distribuio no ponto
ou seja, calculamos a probabilidade acumulada de ocorrncia de valores men
ou iguais a 2. Assim,

F(2)

P(X < 2) : P(X

1)

* P(X :2) :

0,533.

Note que, tendo em vista que avarinel s assume valores inteiros, esse valor
inalterado no intervalo 12,3).Isto , F(2,L);F(2,45) ou F(2,99) tm todos
mesmo valor acirn*a. Por essa razo escrevemos:

F(r):P(X<r) :0,533 Pata2 (r(3'


Os valores completos da funo de distribuio so os seguintes:

012s45
I,'lgura 3.2: Funo de distribuio - doses de vacina.
3,6.' Nurn cstudo sobre a incidncia de cncer foi registrado, para cada

eonr essc diagnstico, o nmero de casos de cncer em parentes


(pais, ilrniros, tios, filhos, primos e sobrinhos). Os dados de 26 pacientes
irttes:

",r,

0,245
0,533

0,789

0,934

.ser<1;
se 1( r 12;
se 2( r13;
se 3(r14;
se 4( r15;
se r)5.

notao utilizada para escrever a funo de distribuio pode,


primeira vista, parecer confusa, mas como as contas efetuadas so simp
acreditamos que com um pouco de treino o leitor ficar familiarizado com
funo. A Figura 3.2 apresenta um diagrama dessa funo.

llltcliorcs irssurnem que a incidncia de cncer em parentes prximos


teut'icrrrrrcrrto nrodelada pela seguinte funo discreta de probabilidade:

frh*ir,t'vitrlos concordam com o modelo terico?

Fg tnlrcln rlc dados brutos com as 26 observaes, coletamos para cada


d vtrt'liivel, o nmcro de suas ocorrncias. Por outro lado, seguindo o
tct'ico, o rrrirrrcro cle observaes que seria esperado em cada incidncia

Captulo 3: Variveis Aleatrias Discre

66

(freqncia esperada) calculado cono i:26x pi. Note que os valores


esperados no precisam ser nmeros inteiros, pois representam uma freqncia
terica caso o modelo fosse adequado. A tabela a seguir apresenta os resultados:
Incidncia

n; (observados)

ei (esperados)

4
4

216

6
6

7,8
7,9

216

216

total

26

26

216

Representando em um mesmo diagrama as duas freqncias obtemos:

67

tlc Sco 3.1:

fltu*rlii viciada tem probabilidade de cara igual a 0,4. Para

dois

nlos itttlcpcndentes dessa moeda, estude o comportamento da varivel


rlet rttnlr c lra um grfico de sua funo de distribuio.
bgcu ltrt itrllrrnao que voc conhece, crie os valores e as respectivas
lirlrrrlcs f)ura a varivel nmero de filhos em famlias, no caso da
lsn eonsiclcrada ser:
lgx*e rtrr"dil paulistana.
hehitntrtcs clo interior do Maranho.

gtttittlro lturit chcgar a uma festa pode ser dividido em trs etapas. Sem
o tlrr.jeto I'cito em t hora. Se enganos acontecem na primeira etapa,
[e l0 rninutos ao tempo do trajeto. Para enganos na segunda etapa, o
ttn 20 o, pilra er terceira, 30 minutos. Admita que a probabilidade de

0, I ;

0,2 e 0,3 para a primeira, segunda e terceira etapas,

vnlenc. I'i provvel haver atraso na chegada festa? Determine a


Irlurk tlc ltavcr atraso, e o atraso no passar de 40 minutos.

itttetn de iuros prestando vestibular para conseguir uma vaga na


lttlc. esr scttdo estudado. As carreiras tm procura diferentes e, em
delux, o col-r'ullr pode ser prestar vestibular mais de um ano. Suponha
ttiolltr'tttos, ito acaso, um dos ingressantes da sua carreira. Que
Itlirtle voc atribuiria (invente!) necessidade de 1, 2,3, ...anos de
I

filho vai
plltll e onre r pipocu com probabilidade 0,'l e, alm disso, pode pedir bala
pnrbnbilidnrlc 0,9. Esses pedidos so atendidos pelo pai com
illtllrlc 0,.5; inclcpendentemente um do outro. Se a pipoca custa R$ 2. e a
levrt tt 'illro

to cinema

e vai gastar nas duas entradas R$ 15. O

fl$.1, r,strrrlc o gusto eletuado com a ida ao cinema.

Vntl:lvrl rrh:lttirin X tcrn a seguinte funo de distribuio:

Notamos que os dados observados seguem a mesma tendncia do


terico, porm seus valores so dis-crepantes. uma amostra pequena, mas
no haver boa adaptao entre os dois conjuntos de nmeros.

P(r)

:
{

se r<10;
se 10(r1I2;
se 12(r<13;
se 1"3 ( r 125;
se r)25.

r,'l',1
,t v

I
Captulo 3: Variveis Aleatrias Disc

68

Determine:
a. A funo de probabilidade de

b. P(x
c. P(X

< L2).
< L2).

e.P(x

t rs). (t

lt't t n la lr ts D

69

iscretos

i rdl'icrr tln densidade apresentado na Figura 3.3 para o caso k

L0.

X.

Fl,r

d.P12<X<20).

=.r )

E,l0
B,tlH

3.2 Principais Modelos Discretos

E,Ofi

Os exemplos da seo anterior ajudam a esclarecer a relao entre


varivel e a realizao do experimento aleatrio que a origina. Cada poss
elemento do espao amostral uma realizao do experimento e corresponde

g,4

,sa

um valor da varivel, nem sempre distinto.


Algumas variveis aleatrias aparecem com bastante freqncra
situaes prticas e justificam um estudo mais aprofundado. Em geral
casos, a distribuio de probabilidade pode ser escrita de uma maneira
compacta, isto , existe uma lei para atribuir as probabilidades.
Por exemplo, se uma varivel aleatria W tem funo de probabili
dada por

wl r

ento, escrevemos essas probabilidades como P(W : k) :

2 3 4 5 6 7 I

Definio 3.3: Modelo Uniforme Discreto

por

J1 ,

Seja X uma varivel aleatria cujos possveis valores so represe


t2,r."1,...,tt. Dizemos que X segue o modelo Uniforme Discreto

atribui a mesma probabilidade


de probabilidade dada por

P(X

llk

a cada um desses

k valores, isto , sua fu

Clhrelve (ple it cxpresso na definio anterior, de fato, representa umn


dhet'etn rlc llrubabilidade, uma vez que seus valores esto no intervitlcl
Fntilr tle loclits as probabilidades igual a 1. O modelo Uniforrne tem
i pofrlue loclos os seus valores ocorrem com a mesma probabilidade e,
pedetnus tlizer quc a probabilidade se distribui uniformemente entre os
1[hrres,

J,7,' llrrrn rilr

Ilk: ,V.:i

L,2,... ,k.

tcrl

100 billretes numerados de 1 a 100. Tenho 5 bilhetes

2l 'd 25 e meu colega tem outros 5 bilhetes, col'1 os


l, I l, .l(), (rtJ c 93. Quem tem maior possibilidade de ser sorteado?
prlrreill vistn tcnr-se a impresso de que "espalhar" os nmeros tt
lvrrr nrtnre'rrulrts dc

lltllleill ([. giltlitr o $orteio. Entretanto,

assumindo a honestidade da ritt,


l tttintr:rus lettt it ttrcsma probabilidade de corrncia, com l/100 para cnclit
$ Yntlrivel ttletttr'ia cm questo, o n,mero sorteado, segue o rnodelo

Fr prrllrrrrlu, !:u c mcu colcgit com 5 bilhetes temos et fiesll1lt

t['

gnttltitr l rir. Ncstc sorteio, como no modelo Unilorme cttt


lltllnr ou tncllot'probabiliclade clc garrhar clcpcndc dc quantos bilhetes'sc
tr
n rlrt pirrlit'rtlrtr escolltu tlo nntcro,
llrhirlo

x.

'ittura 3,3: Modelo Uniforme Discreto [0, 10].

k:L,2,...,6.

Dessa maneira, temos uma forma abreviada de apresentar


varivel e sua funo de probabilidade. Vamos apresentar os principais mode
de variveis aleatrias discretas, comeando pelo mais simples a seguir, quo
aquele que atribui igual probabilidade a todos os possveis valores da varivel,

9 l0

70

Captulo 3: Varidveis Aleatrias Disc

Em muitas situaes prticas a varivel de interesse assume somente

valores. Por exemplo,

pea

classificada como boa ou defeituosa;


entrevistado concorda ou no com a afirmao feita; a vacina imunizou ou
criana. Estas situaes tm alternativas dicotmicas, que genericamente
ser representadas por respostas do tipo sucesso-fracasso. A atribuio de qual
respostas ser referida como sucesso feita de modo arbitrrio, mas deve
definida claramente para evitar ambigidades. Esses experimentos recebem
nome de Ensaios de Bernoulli e d,o origem a uma varivel aleatria com

tl.t

l,

n I t'

o^t

I)iscretos

..l

ir""\ - {-'r
'^ J - '

.,

'-''

7t

{F

r'nrrsllrril a /rrvore de probabilidades, consideramos que a escolha dos


or loi I'cilir a partir de uma populao muito grande. Dessa forma, cadit
ebuullritkr torn probabilidade 0,80 de estar imunizado, independente dos
vrlrros rllr populao. Se classificamos como sucesso a ocorrncia dc
r, lururs ir repetio independente de trs ensaios de Bernoulli.
{Lle rlt'srrjirnros estudar o comportamento da varivel X: nmero dc
llrrrrrrizrrrkls nesse grupo. Ela assume os valores 0, 1,2 e 3 cont
le,ri t'ir['rrlirclas com o auxlio da rvore e apresentadas na tabela:

mesmo nome.

Dffinio 3.4: Modelo Bernoull


Dizemos que uma varivel X segue o modelo Bernoulli se atribui ou
ocorrncia de fracasso ou sucesso, respectivamente. Com p representando
probabilidade de sucesso, 0 ( p 1 7, sua funo discreta de probabilidade
por

P(X - r) : p'' (7 -

Probabilidade

TTT

0,8'

ITI''
I T,'I
T

I,'1,'

rII

[(

p
ou, de modo resumido,

Eventos

O1L-:r: , r :0,L

J J(:

T,'1,,

[( I(

J(l

x 0,2
x 0,2

0,8 x 0,22
0,8" x 0,2
0,8 x 0,2"

I
2

0,8 x

0,Bz
0,82

0,22

0,2"

repetio de ensaios de Bernoulli independentes d origem


importante varivel aleatria discreta denominada modelo Binomial.
Exemplo 3.8.' Sabe-se que a eficincia de ume vacina de 80Vo. Um grupo de
indivduos sorteado, dentre a populao vacinada, e submetido a testes
averiguar se a imunizao foi efetiva, evento representado por .I. A rvore
probabilidades apresen tada a seguir.

0,8

0,2

. --_-_--_-_-.----..

,"

o''
0,2
0,8

',,
t

nrcnle, ir rniro de probabilidade de X fica sendo


0

o,2ir ll x o,B x 0,22 3 x 0,82 x 0,2 0,8'


f,l rrnrpurturrre:nlo tlc X completamente determinado pela funo acima,
lirlrrrlrs lirrrrbtl podem ser escritas atravs da expresso

I'(,

')

: (i) x

o,g'

x or23-k" k :0,7,2,3.

lrrohllliliclirclcs correspondem aos temos do desenvolvimcnto


Irr rlr. Newl91 rlo (0,8 + 0,2):, o qr-re justifica o nome escolhiclo pala

:lue

?rlirti

Captulo 3: Variveis Aleatrias Discretas

72

Defino 3.5: Modelo Binomial


Considere a repetio de n ensaios de Bernoulli independentes e todos
com a mesma probabilidade de sucesso p. A varivel aleatria que conta o
nrmero total de sucessos denominada Binomial com parmetros n e p e sua
funo de probabilidade dada por

: rl :

P(X

(i,)ru (i - p)''-k,

.,2 Principais Modelos Discretos

Em muitas situaes prticas, a varivel Binomial aparece a partir de


outras variveis, atravs da criao de duas categorias excludentes, como no
excmplo a seguir.

Ilxemplo 3.9: O escore em um teste internacional de proficincia na lngua


itrglesa varia de 0 a 700 pontos, com mais pontos indicando um melhor
rlcscmpenho. Informaes, coletadas durante vrios anos, permitem estabelecer o
scgr.rinte modelo para o desempenho no teste:

0,L,2,...,n,

Pontos

lo,200)

n;

0,06.

com (ii) representando o coeficiente binomial calculado por

(n\

Usaremos a notao X -U1,",p) paraindicar que a varivel aleatria


modelo Binomial com parmetros n e p.

importante notar que

as

segue o

tr

probabilidades so completamente

caracterizadas pela informao dos parmetros. Por exemplo, desejando calcular a


probtrbilidade de 3 sucessos numa b(12;0,4) temos

P(x

- :
3)

(lj;o,n'0,6n

200,300)
0,15

1300,400)

1400,500)

1500,600)

1600,7001

0,16

0r25

0,28

0,10

Vrits

nt.

\n) -- kG-4.

73

-1{e,4s

o,6e

0,142

nprcsentar menos de 200 pontos 0,06. Admitimos ainda que os estudantes


lunsileiros tm comportamento similar aos demais e portanto a tabela tambm

De modo similar, obtemos os outros valores da funo discreta de probabilidade:

Pt'

0,002

I
0,017

10

11

12

Pt

0,101

0,042

0,012

0,002

0+

0+

-t

0,064

0,142

0,2r3

0,227

0,777

universidades americanas, exigem um escore mnimo de 600 pontos para


ruccitar candidatos de pases de lngua no inglesa. De um grande grupo de
estudantes brasileiros que prestaram o ltimo exame, escolhemos ao acaso 20
tlclcs. Qual seria a probabilidade de no mximo 3 atenderem ao requisito mnimo
ttrcncionado?
Vamos admitir que a tabela acima representa o escore dos estudantes que
estio prestando esse ltimo exame. Essa uma suposio razoixel tendo em vista
clrc a tabela foi feita a partir de um conjunto muito grande de dados. Isto quer
rliz,cr que um aluno selecionado ao acaso apresentar um dos vrios escores de
ttcordo com as probabilidades apresentadas na tabela. Por exemplo, a chance de

porlc ser usada para representar esse desempenho.


Pelo critrio das universidades, o estudante classificado como apto, se
neu cscore de 600 pontos ou mais, caso contrrio, ser considerado no apto.
l)cssa fbrma, para cada indivduo, teremos a classificao de apto ou no, feita de
ttrotlo independente e com as seguintes probabilidades

P(aPto)

0,10 e P(no apto)

6,99

Definindo uma nova varivel X como o nmero de estudantes aptos


tlrttlrc os 20, temos que X - b(20;0,10). A probabilidade de no mximo 3 serem
nptos calculada pela funo de distribuio no ponto 3, ou seja,

O valor 0+ indica uma probabilidade muito pequena que, na aproximao

de

F(3)

rnilsimos (3 casas aps a vrgula), no teve casa decimal diferente de zero.

Diversos programas computacionais contm rotinas que calculam as


probabilidades da distribuio Binomial e alguns livros-texto incluem tabelas
dessa clistribuiiro, para vrios valores dos parmetros.

I)'ssr brma, temos:

:P(x<3).

!
Captulo 3: Varidveis Aleatrias Discretas

74

r1x 3ly

()

..2 Principais Modelos Discretos

75

e, cnto, podemos concluir por uma expectativa de ll,7 nascimentos com 7


I'ilhotes dentre as 100 inseminaes. Observe que os valores esperados no
prccisam ser nmeros inteiros, pois representam uma freqncia terica de

0,1 o,e2o-

A tabela a seguir contm os valores observados


Binomial
fosse utilizado.
nxrclelo

ocorrncia.

: ()0,100,e20. ()0,11 0,e1e. ()0,120,e18. ()0,130,e17

0,r22 + 0,270 + 0,285 + 0,190

Filhotes
lrrccl. Observada
I'cq. Esperada

0,867.

Esse valor reflete as altas probabilidades atribudas aos escores menores de 600,
conforme o modelo de desempenho no
tr

teste.

Exemplo 3.10: Um veterinrio est estudando o ndice de natalidade em porcos


sujeitos inseminao artificial. Para tal, coletou informaes sobre a varivel
nmero de fllhotes nascidos vivos em cada uma das 100 inseminaes re'alizadas
com o mesmo reprodutor. A tabela a seguir apresenta os resultados.
Nmero
Freq. Observada

9a

26

2L

L2

t)

t0

23

26

2t

,)

0,1

4,4

tr,7

20,5

24,6

20,5

t2
I,7

4,4

0,1

O modelo proposto parece se ajustar bem aos dados observados (veja a


F'igtrra 3.4) e tendemos a acreditar que o modelo Binomial uma escolhn
ttdccluada. A representao grfica torna-se assim, um importante passo inicial
purt auxiliar na escolha de um modelo probabilstico. A verificao aqui foi
flpcnas visual, mas possvel estabelecer procedimentos estatsticos que testam o
ajustc do modelo proposto de forma objetiva. Procedimentos mais rigorosos

devcrn ser utilizados para a deciso final e podem se basear em um teste


estirtstico conhecido como Teste de Aderncia.
tr

a
o

:7) : (;o,t'0,53: o,rr.;

os esperados, se o

muito comum buscar estabelecer um modelo para a varivel de interesse, o que


nesse caso possibilitaria, por exemplo, p comparao entre diferentes
reprodutores. O veterinrio informa que 11 ou mais filhotes nascidos vivos uma
ocorrncia muito rara e pode ser desprezada em termos de model. Nestes termos,
ele sugeriu considerar que a varivel N: nmero de filhotes nascidos vivos,
poderia ser ajustada pelo modelo Binomial com parmetros n : 10 e p: 0,5. O
que voc acha da sugesto do veterinrio?
Note que, mesmo no tendo havido nenhuma observao do valor 0 ou
10, o veterinrio sugeriu o modelo de uma varivel que contm esses valores, pois
apesar de no serem comuns eles podem acontecer. Com o modelo sugerido,
calculamos as probabilidades de cada um dos valores de 0 a 10 e, a partir deles, os
resultados que seriam esperados em 100 inseminaes realizadas. Por exemplo,

P(N

Observada
Esperada

10

Filhots

Fgura 3.4: Grfico

de

freqncias- natalidade em porcos.

Captulo 3: Variveis Aleatrias Discretas

76

Ao finalizar

oportuno

mencionar as diferentes formas


utilizadas para referenciar os modelos tericos das variveis aleatrias. Por
exemplo, alguns autores referem-se a uma varivel aleatria com distribuio
Binomial enquanto outros enfatizam uma varivel aleatria seguindo o modelo
Binomial. Neste livro, vamos utilizar indistintamente essas duas formas que
essa seo,

consideramos equivalentes.

.,.1 Outros

corretamente.

1. Discuta a validade do modelo Uniforme Discreto nos seguintes casos:


a. O nmero sorteado numa rifa com 100 nmeros.
b. A escolha de um aluno que vai representar a classe junto direo da
escola.
c. O dia da semana em que ocorrem mais acidentes de trabalho numa indstria.
d. O ms do ano com maior nmero de enchentes na cidade de So Paulo.

2. Sendo X uma varivel seguindo o modelo Uniforme Discreto, com valores no


conjunto {L,2,3,.. . , 10}, pergunta-se:
a. P(X > 7\.
/

b.P(3 <X<7).
P(X 12 ou t >

c.

8).i

d..P(X)5ouX>B))
X<6).
',1f.e.P(X)3e
P(x < e lx 2 o;.r

77

b. Escolhemos 20 lmpadas ao acaso na prateleira de um supermercado, sendo


10 de uma fbrica e 10 de outra. Contamos o nmero total de defeituosas.
c. Quinze automveis 0 km de uma mesma marca e tipo so submetidos a um
teste anti-poluio e contamos o nmero deles que passaram no teste.
d. Um motorista submetido a um teste em que deve estacionar seu veculo
num pequeno espao (isto popularmente chamado defazer baliza). Em l0
tentativas, contamos o nmero de vezes em que o motorista estacionou

Bxerccios da Seo 3.2:

'

Modelos Discretos

\,

3. Um usurio de transporte coletivo chega pontualmente s 8 horas para pegar o


seu nibus. Devido ao trnsito catico, a demora pode ser qualquer tempo
entre 1 e 20 minutos (admita que o relgio "pule" de minuto em minuto).
Pergunta-se:
a. Qual a probabilidade de demorar mais de 10 minutos?
b. Qual a probabilidade de demorar pelo menos 5 mas no mais de 10 minutos?
c. Qual a probabilidade da demora no chegar a 5 minutos?
q._
d. Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo nibus (que
/n ainda no passou), qual a probabilidade do amigo atrasado esperar at 3

minutos? L
4. Discuta a validade do modelo Binomial nos seguintes casos:
a. Dos alunos de uma grande universidade, sorteamos 5 e contamos quantos se
declaram usurios de drogas.

5. Sendo

P:0,4;
a.

uma varivel seguindo o modelo Binomial com parmetros n

15 e

Pergunta-se:
14).

P(X >

lr.P(8<X<10).
c. P(X 12 ou X > 11).

P(X ) tL ou X > 13).


a.P(X)3eX<6).
d.
r.

P(x < 13lx > 11).

6. Urna certa doena pode ser curada atravs de procedimento cinirgi co em 80Vo
dos casos. Dentre os que tm essa doena, sorteamos 15 pacientes que sero
submetidos cirurgia. Fazendo alguma suposio adicional que julgar
nccessria, responda qual _a probabilidade de:
ru. Todos serem curados? L-ll. Pelo menos dois ro serem curados?
c. Ao menos l0 ficarem livres da doena?
7. Calcule a funo de distribuio da varivel

t. X Bernoulli
b. X - b(4;0,20).
c. X - b(B;O,10).

com p :

nos casos:

0,6.

3.3 Outros Modelos Discretos


Apresentamos, nesta seo, os modelos Geomtrico, Poisson
lliptrgcomtrico, que tm vrias aplicaes prticas, conforme ilustram

os

e'xcrnrplos desta seo. Na seo anterior, os modelos definidos assumiram apenas

rrrrr nmero finito de varlores distintos. Foi assim com o modelo Unifbrme
l)iscrcto com valores L,2,,..,;, Bernoulli com 0 e L e Binomial com os valores

If,t
Captulo 3: Variveis Aleatrias Discretas

78

.1.-l Outros

79

P(Q=

1,...,n,

Como veremos a seguir, os modelos Geomtrico e Poisson podem ter


um nmero infinito de valores dentre os inteiros positivos.
0,

Modelos Discretos

0,010

Definio 3.6: Modelo Geomtrico


0,008

Dizemos que uma varivel aleatria X tem distribuio Geomtrica de


parmetro p, se sua funo de probabilidade tem a forma

P(X: k): p(L- p)o',


Nesse caso, usaremos a notao

0<p

1le k:0,1,2,....

0,004

X- G(p).

tr

Interpretando p como a probabilidade de sucesso, a distribuio


Geomtrica pode ser pensada como o nmero de ensaios de Bernoulli que
precedem o primeiro sucesso. Note que a expresso apresentada na Definio 3.6
de fato uma funo de probabilidade, pois positiva e sua soma igual a 1,
conforme pode ser verificado atravs da frmula da soma de progresso
geomtrica (PG) infinita:

t p) :et
k):
8"," - [of @mm

(1

- p)^ :

r_fr1:

Exemplo 3,11: lJma linha de produo est sendo analisada para efeito de
controle da qualidade das pas produzidad. Tendo em vista o alto padro
requerido, a produo interrompida para regulagem toda vez que uma pea
defeituosa observada. Se 0,01 a probabilidade da pea ser defeituosa, estude o
comportamento da varivel Q, quantidade de peas boas produzidas antes da la.
defeituosa.
Vamos admitir que cada pea processada tem a mesma probabilidade de
ser defeituosa, independentemente da qualidade das demais. Sendo a ocorrncia
de pea defeituosa um sucesso, podemos aplicar o modelo Geomtrico. Observe
que o nmero de peas boas produzidas exatamente o quanto se "espera" para a
ocorrncia do primeiro sucesso. Temos,

P(Q

:k) :0,01 x 0,99', k:0,L,2,"',

cuja representao grfica est na Figura 3.5.

0,006

0,002

0 4 I 12 16 20 24 28 32 36 40 44 48

tc

Figura 3.5: Modelo Geomtrico (n:0,01).


Clorno podemos verificar atravs da figura, a probabilidade vai ficando muito
llc(luena para valores grandes de k. Em tese, a produo nunca seria interrompida
se rriro houvesse o aparecimento de uma pea defeituosa.
tr

Detnio 3.7: Modelo Poisson

Uma varivel aleatria X tem distribuigo de Poisson com parmetro

> 0, se sua funo de probabilidade

dada por

e-]'k
P(X
,
\/kl=/c) :

0,1,2, ...

cor o parmetro sendo usualmente referido como


notuo utilizadaser X- Po(\).

a taxa de ocorrncia, A
tr

O modelo Poisson tem sido muito utilizado em experimentos fsicos e


lriolgicos e, nesses casos, a freqncia mdia ou esperada de ocorrncins
trtrrn determinado intervalo de tempo, Vamos verificar que a expresso
rrprcsentada realmente representa uma funo de probabilidade. No difcil
rrlrscrvar que, para qualquer k, ela um nmero positivo. Resta mostrar que tls
prrrllabilidades somam 1. Temos,

Captulo 3: Variveis Aleatrias Discretas

80

=1,.1

tt" : 4=# : "-^# :

Se o intervalo de tempo alterado, a varivel aleatria mantm a mesma

e-\e : r'

:ll

k:U

l':0

No clculo acima, usamos que a srie \R' 1kt , somada para valores de k entre 0 e
oo, produz e. Esse resultado bastante conhecido e segue do desenvolvimento
em srie de Taylor do termo el. O leitor interessado poder consultar, para outros
detalhes, textos bsicos de Clculo Diferencial e Integral.
Exemplo 3.12: A emisso de partculas radioativas tem sido modelada atravs de
uma distribuio de Poisson, com o valor do parmetro dependendo da fonte
utilizada. Suponha que o nmero de partculas alfa, emitidas por minuto, seja uma
varivel aleatria seguindo o modelo Poisson com parmetro 5, isto , a taxa
mdia de ocorrncia de 5 emisses a cada minuto. Calculemos a probabilidade
de haver mais de 2 emisses em um minuto.
Seja o ntimero de partculas alfa emitidas por minuto. Pelas suposies
feitas, temos A - Po(5) e a probabilidade desejada ser

P(A> 2) :t

P(A:a) :1-t

Aps os clculos n":"lrrur,or, obtemos

P(A:0) :1- $e-s,n


4 o,l

ir'o 12) :

0,875.

**r"r"t,"*os

81

Otrtros Modelos Discretos

dlrtritruio de Poisson, mas com o valor do parmetro ajustado de forma


Ggrrvcniente. Assim, se o perodo de tempo considerado for de dois minutos,
tglepros que o nmero de partculas emitidas em dois minutos ter distribuio

tr

Po( l 0),

Eyemplo 3./3; Engenheiros da companhia telefnica estudam se o modelo de


Poisson pode ser ajustado ao nmero N de chamadas interestaduais que chegam,
durante o perodo notumo. Os dados coletadOS,
Fr [ora, a uma central telefnica,
Efl:r'cntes a 650 perodos de uma hora, esto apresentados a seguir:
Chamadas

Freq. Observada

38

7t

115

r25

106

6
79

>8

50

57

Da tabela temos que, por exemplo, em 125 perodos de uma

hora

orrcram 4 chamadas.
Os engenheiros sugerem rttilizar uma taxa de ocorrncia de 4-5-chamadas
pet lrora no perodo estudado. Seguindo o modelo indicado, a freqncia esperada

ocorrncias com k chamadas obtida multiplicando 650 (o total das


bnr-t'vaes) pela probabilidade de k chamadas. Assim, para k : 2, temos

{g
na

Freq. esperadapara 2 chamadas

Figura 3.6, alguns valores da funo discreta de probabilidade da Po(5).

650 x

P(N

:650x

"-4's

:73,13.

P(N=n)

:2)
4152

2l

0,1 8

Ee rrurclo anlogo obtemos os demais valores.

0,16

0,14

Flr'! utrlas
rvadn

o,12

LOhsc

0,1 0

fllsl'1

0;08

38
32,50

71

115

125

73,13

109,66

123,37

7,22

>8

106

79

111,02

83,27

50
53,56

57
56,36

0,0 6

0,04

tabela acima parece indicar que o modelo Poisson, com : 4,5


ftl'rrr..c,c unr bom ajuste para a varivel aleatiia de interesse. O leitor pode
e'otrslnrir um grfico de freqncia'para visualizar melhor essa aderncia. A
cxh.nsiro clessas concluses aos diferentes perodos de tempo e/ou outros tipos de
G:hirrrrncla deve ser feita com cuidado, porm o ajuste j obtido uma "boa pista"
Flt'n il cscolha do modelo. Como mencionamos anteriormente, a concluso obtida

0,02

10

12

14

16

18

Figura 3.6: Modelo Poisson (),: 5).

20

Captulo 3: Variveis ,Aleatrias Discretas

82

aqui poderia ser feita de modo mais objetivo atravs de Testes Estatsticos de

Aderncia.

tr

Encerramos esta seo, definindo

modelo Hipergeomtrico. Este

moclelo surge da contagem de objetos de certo tipo, retirados ao acaso e sem


reposio, de um conjunto contendo dois tipos de objetos. Por exemplo, num
grupo de jovens com 5 meninas e 5 meninos, sorteamos 3 deles ao acaso, para
azer uma comisso. O sorteio ser feito sem reposio, para evitar a escolha de
utri mesma pessoa, o que inviabilizaria a formao da comisso. Na primeira
escolha cada um dos 10 jovens tem 1/10 de probabilidade de ser sorteado. Na
segunda, cada um dos 9 restantes, ser sorteado com probabilidade I/9 e, na
terceira, 1/8. A varivel aleatria nmero de meninas na comisso segue o modelo
Hipergeomtrico, conforme definido abaixo.

Definio

3.8

caixa pode ter peas boas ou defeituosas e vamos sortear algumas


pcas, sem reposio. Baseado no nmero de peas defeituosas encontradas
rlccidimos por aceitar ou rejeitar o lote. Seja D a varivel que conta o nmero de
pcras defeituosas neste sorteio. Ela segue o modelo Hipergeomtrico e vamos
itlcrrtilicar os diversos parmetros. O total de peas n:25, o nmero de
elel'cituosas

P(X:*)-,^., _

(T)

(",--T

/n,\
("/

) ,k:A,I,...,min(r,rn).
_ ., ,
^;^t_
,-

tr

Note que os valores possveis de X vo de 0 a min(r,rn), uma vez que


podemos
ter mais do que o nmero de objetos existentes do tipo I, nem
no
tillnpouco mais que o total de sorteados. Utilizando resultados de anlise
combirratria, pode-se verificar que a expresso de P(X : k) um nmero no
negativo entre 0 e 1 e a soma, para todos os valores de k, igual a l. Assim esto
cumpridos os requisitos necessrios para ser uma funo de probabilidade.
Exentplo 3.14: Uma ftbrica produz peas que so embaladas em caixas com 25
unidades. Para aceitar o lote enviado por essa fbrica, o controle de qualidade de
uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida,
sorteia cinco peas, sem reposio, dessa mesma caixa. Se constatar no mximo
dr"ras defeituosas, aceita o lote fornecido pela fbrica. Se a caixa sorteada tivesse 4
pcas defeituosas, qual seria a probabilidade de rejeitar o lote?

4 e o nmero de retiradas

P(aceitar o lote)

r:

5.

P(no mximo 2 peas defeituosas)

: P(D < 2).

lintiio,

p(D<r)

: Modelo Hipergeomtrco

Considere um conjunto de n objetos dos quais mso do tipo I e n - m


so do tipo II. Para um sorteio de r objetos (r < n), feito ao acaso e sem
reposio, defina X como o nmero de objetos de tipo I selecionados. Diremos
que a varivel aleatria X segue o modelo Hipergeomtrico e sua funo de
probabilidade dada pela expresso

83

,.. Outros Modelos Discretos

) . ()=!'il -0,e84
: ().(';) . ()=('i
(',J) (',J)

('J)

C-onclumos que, mesmo havendo quatro defeituosas na caixa inspecionada, a


probabilidade de aceitar o Iote 0,984 ou, equivalentemente, para rejeitar o lote a

prolrabilidade 0,016. Claro que, na prtica, no saberemos quantas peas


rlccituosas existem em cada caixa. Entretanto, a probabilidade calculada acima
purlcria ser um indicativo para avaliar se o critrio do controle de qualidade est
t'rrzoiivel ou no e, neste caso, parece que no! Poderamos tambm criar uma
tobcla contendo os valores da probabilidade de rejeio do lote, em funo de
tr
Irrrvcr certo nmero de peas defeituosas na caixa sorteada.
l,lxcrccios da Seo 3.3:

l.

Scndo X(DG(0,4), calcule:


n. P(X:3).

b.P(2<X<4).

P(X > LIX <


rl. P(X > 1).
c.

2).

2. IJrrrir moeda equilibrada lanada sucessivamente, de modo independente, at


(f ue ocorra a primeira cara. Seja X avarivel aleatria que conta o nmero de
lirnamentos anteriores ocorrncia de cara. Determine:
u. P(X < 2).
b. P(X > 1).

c.P(3<x<5).
rl.

Quantas vezes deve, no mnimo, ser lanada a moeda para garantir a


ocorrncia de cara com pelo menos 0,8 de probabilidade.

8{

3.

Captulo 3: Variveis Aleatrias Discretas

A varirvel aleatria Y temdensidade poisson com parmetro : 2. obtenha:

P(Y <

2),

P(Y >

0).

a.

b.P(2<Y <4).
c.

d.

P(Y: 1l]'<

3).

4. A aplicao de fundo anti-corosivo em chapas de ao de 1 m2 feita


mecanicamente e pode produzir defeitos (pequenas boihas na pintura),
de
ncordo com uma varivel aleatria poisson de parmetro : t p, *2.
-a
chapa sorteada ao acaso para ser inspecionad, pergunta-se a probabilidade

de:

n. Encontrarmos pelo menos I defeito.


b. No mximo 2 defeitos serem encontrados.
c. Encontrarmos de 2 a 4 defeitos.
d. No mais de 1 defeito ser encontrado.

5. A varivel 11 segue o modelo Hipergeomtrico com parmetros


a r' : 4. Determine:
a, P(H :2).
b. P(H < L).
c. P(f/ > 0).

n:

r0,m

or'amento a escolha de estadia. Existem quatro opes de hotis que custam


2; 2,5; 3 e 3,5 mil reais e so escolhidos pelos clientes com a mesma

prcferncia, independentemente da companhia area. Seja x a varivel


irlcatria oramento da viagem. Calcule a funo de probabilidade e a funo
rlc distribuio da varivel X .

Urn equipamento consiste de duas peas A e B que tm 0,10 e 0,15 de


;lrobabilidade de serem de qualidade inferior. um operrio escolhe ao acaso
utni pea tipo A e uma tipo B para construir o equipamento. Na passagem pelo
controle de qualidade o equipamento vai ser classificado. Ser considerado
como nvel I, se as peas A e B forem de qualidade inferior. ser nvel II, se
trrna delas for de qualidade inferior e, nvel III, no outro caso. o lucro na venda
dc R$ 10, R$ 20 ou R$ 30 para os nveis I, II ou III, respectivamente. Como se
cornporta a varivel lucro? Para dois equipamentos vendidos, obtenha a funo
rronos R$ 30 de lucro?

3.4 Exerccios

l.

LJrna agncia de turismo apresenta aos clientes o oramento de uma certa


viagem em duas partes. A primeira o transporte areo que tm trs opes
com preos 3;3,5 e 4 mil reais e preferncias de escolha de 0,5; O,3 e 0,2 para
;rs companhias TWA, TWB e TWC, respectivamente. A segunda parte do

tlo probabilidade do lucro. Nesse caso, qual seria a probabilidade de pelo

6. Por engano 3 peas defeituosas foram misturadas com boas formando um lote
corn l2 peas no total. Escolhendo ao acaso.,4 dessas peas, determine a
probabi lidade de encontrar:
n. Pelo menos 2 defeituosas.
b. No rnrximo I defeituosa.
c. No mrrimo I boa.

3,4 [ixerccios

urn agricultor cultiva laranjas e tambm produz mudas para vender. Aps
irlguns meses a muda pode ser atacada por fungos
p.bubilidade 0,0j e,
nesse cASo, ela escolhida para ser recuperada com "oprobabilidade 0,5. Admita
que o processo de recuperao infalvel. o custo e cada muda produzida

l$ 1,00; acrescido de mais R$ 0,50 se precisar ser recuperada. Cada muda


vorrdida a R$ 3,00 e so descartadas as mudas no recuperadas de ataque
de
lngos. Estude como se comporta o ganho por muda produzida.

Na verificao de mquinas, observam-se as partes eltrica, mecnica e


estrutural. A probabilidade de aparecer uma falha em cada uma das partes
0,01; independente das demais. ocorrendo falha, o tempo de conserto ro,z0
orr 50 minutos para falha eltrica, mecnica ou estrutural, respectivamente. Se
rr alha eltrica aparece junto com a falha mecnica, teremos ainda um
ircrscimo de 20 minutos. Para uma mquina escolhida ao acaso, qual a
lrrobabilidade do tempo de interrupo (se no h falha, esse tempo , zero):
tt. Durar menos de 25 minutos?
b. Ultrapassar 40 minutos?

llrna empresa paga a seus estagirios de engenharia de acordo com o ano de


ctrrso do estudante. Para se obter o salrio mensal pago por 30 horas semanais,
rnrrltiplica-se o salrio mnimo pelo ano de curso do estagirio. Dessa forma, o
trstudante {o primeiro ano ganha um salrio mnimo, o do segundo recebe dois
r' itssim por diante at o quinto ano. A empresa vai empregar 2 novos

cstngirrios e admitimos que todos os anos tm igual nmero de estudantes


intcressados no estgio (considere a populao de candidatos muito grande de
trulclo a no haver diferena entre escolher com ou sem reposio). pergunta-se
;r protrabilidade de:

86

Captulo 3: Variweis Aleatrias Discretas

a. Os dois serem do primeiro ano?


b. A empresa gastar no mximo 3 salrios mninos com os estgios?
c. Sabendo que gastou pelo menos 4, gastar menos de 7 salrios mnimos?
6. Uma varivel aleatria

tem a seguinte funo de distribuio:

.1.4

Exerccios

9. Num certo restaurante, paga-se pelo almoo uma quantia fixa dependendo da
escolha feita de prato e bebida. A carne de peixe tem I}Vo de preferncia,
enquanto frango tem 40Vo e carne bovina 50Vo. As trs escolhas de bebida
esto condicionadas opo do prato, segundo a tabela abaixo:

se r<-1;
0,2 se -1 1 r 12;
0,5 se 2(r15;
0,7 se 5(r16;

0,9 se6(r115;
{ 1 se r)15.

Determine:
a.

A funo

b. P(x
c. P(X

de probabilidade de

< -2).

<

X.

P(X >

Pedido
Preo

14).

7. Estatsticas de acidentes, num trecho da rodovia SP330, indicam probabilidade


de 0,05 de haver um acidente durante a madrugada (24 s 6 horas). Em
ocorrendo um acidente nesse perodo, a chance de gerar vtimas de 0,5.
Ainda considerando o perodo acima, se acontece um acidente com vtima, ela
ser fatal com probabilidade 0,1. o servio de ajuda aos usuriqs :utiliza 2
veculos na inspeo do trfego naquela rea. A esse nmero, acrescentamos
mais 2 se houver acidente. Se o acidente tem vtimas, acrescente aos anteriores
mais 2 veculos e, finalmente, acrescente mais 1 se a vtima for fatal. Encontre
a luno de probabilidade da varivel aleatria ntimero de veculos em servio
de auxlio nessa estrada durante a madrugada.

8. Em treinamento de

Agua

0,4

0,3

Opco: Frango
P(Bebida I Frango)

Cerveia

Azua

Vinho

0,3

0,5

012

Opo:Bovina
P(Bebida I Bovina)

Cerveja
0,6

Agua

Vinho

0'3

0,1

Admita os seguintes preos:

2).

d.P(3<X<12).
e.

Vinho
0,3

Cerveia

Opo:Peixe
P(Bebida Peixe)

",rr:

87

animais, usa-se

repetio como estratgia de

aprendizagem. Num experimento, um macaco realiza certa tarefa corretamente,

pela primeita vez, com probabilidade 0,5. Caso falhe, a probabilidade de


realizar corretamente na segunda tentativa cresce I\Vo, ou seja, a probabilidade
, agora 0,55 e assim sucessivamente. Admita que o experimento termina em
quatro tentativas ou antes, na primeira vez que o macaco acertar. Descreva o
comportamento probabilstico do nmero de tentativas.

Peixe

Frango

Bovina

Cerveja

Agua

Vinho

T2

l5

t8

ru. Dado que algum escolhe peixe, qual a probabilidade de que escolha
cerveja?
ll. Se escolhe carne bovina, qual a probabilidade de tomar vinho?
c. Sabendo que tomou gua, qual a chance de ter escolhido frango?
tl. Determine a funo de probabilidade para cada uma das variveis X: preo
do almoo e Y: preo do almoo para aqueles que preferem cerveja.

l(1. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para


rrrrra famlia com trs filhos, calcule a probabilidade de que:
a. Exatamente dois sejam do sexo masculino.
ll. Pelo menos um deles ser do sexo masculino.
c. Todos serem do sexo feminino.

lf . tJrn time paulista de futebol tem probabilidade 0,92 de vitria sempre que
ioga. Se o time a\uar 4 vezes, determine a probabilidade de que vena
n. Toctas as 4 partidas.

b. Exatamente 2 partidas
c. Pelo menos uma partida.
tl. No rnximo 3 partidas.

Captulo 3: Variveis Aleatrias Discretas

88

e. Mais da metade das partidas.

12.tJm certo equipamento expedido em lotes de 500 unidades. Antes que uma
remessa seja aprovada, um inspetor escolhe 5 desses equipamentos e os
inspeciona. Se nenhum dos equipamentos inspecionados for defeituoso, o lote
aprovado. Se um ou mais equipamentos forem defeituosos, todos as unidades
so inspecionadas. Suponha que existam, de fato, dez equipamentos
defeituosos no lote. Utilizando uma suposio conveniente, qual , a
probabilidade de que seja necessrio testar todos os equipamentos?
13. Suponha que um modelo terico para a varivel notas em um teste de histria

(X),

dado por:

P(X:
Para

2l

i1

lj -

111

66

, j:0,7,2,...,10.

alunos submetidos a esse teste, apresentamos um resumo de suas

notas:

.1,,1

89

lixerccios

lS.Considere uma varivel aleatria Xassumindo os valores 0,1,2,...,5 e tal


clLre P(X : j) :/c x 0,8 x 0,2i, i : 0,L,2,...,5.
ir. Para qual valor de k a expresso acima uma funo de probabilidade?
lr. Calcule P(X :3 I X < 5).

lr. Uma vacina contra a gripe eficiente em707o dos casos. Sorteamos, ao acaso,
20 dos pacientes vacinados e pergunta-se a probabilidade de obter:
ru. Pelo menos 18 imunizados.
b. No mximo 4 imunizados.
c. No mais do que 3 no imunizados,
17. 25Vo dos universitrios de So Paulo praticam esporte. Escolhendo-se, ao
ilcilso, 15 desses estudantes determine a probabilidade de:
a. Pelo menos 2 deles serem esportistas.
b. No mnimo 12 deles no serem esportistas:
c. Havendo mais de 5 esportistas no grupo, obtermos menos de 7 que praticam
esporte.

Notas

Freqncia

0-2
2-4
4-6

10

6F8

8 Ft10

Itl. As pacientes diagnosticadas com cncer de mama precocemente tm

c. No mais de 2 permanecerem com a doena.

19. A resistncia (em toneladas) de vigas de concreto produzidas por uma


clrpresa, comporta-se conforme a funo de probabilidade abaixo:

Um professor desconfia que o modelo no adequado. O que voc acha?

14. Um laboratrio estuda a emisso de partculas de certo material radioativo.


Seja l/; nmero de partcula; emitidas em I minuto. O laboratrio admite que
l/ tem funo de probabilidade Poisson com parmetro 5, isto ,

P(.^/

k)

:;, --5 ^A

k:0,7,2,....

a. Calcule a probabilidade de que em um minuto no haja emisses

80Vo de

probabilidade de serem completamente curadas. Para um grupo de 12 pacientes


lessas condies, calcule a probabilidade de:
:r. Oito ficarem completamente curadas.
ll. No serem curadas de 3 a 5 pacientes.

de

partculas.

b. Determine a probabilidade de que pelo menos uma partcula seja emitida em


um minuto.
c. Qual a probabilidade que, em um minuto, o nmero de partculas emitidas
esteja entre 2 e 5 (inclusive)?

Resistncia

Admita que essas vigas so aprovadas para uso em construes se suportarem


pclo menos 3 toneladas. De um grande lote fabricado pela empresa,
cscolhemos 15 vigas ao acaso. Qual ser a probabilidade de:
a. Todas serem aptas para construes?

ll. No mnimo 13 serem aptas?


2{). Ern momentos de pico, a chegada de avies a um aeroporto se d segundo o
rnodelo Poisson com taxa de 1 por minuto.
ru. Determine a probabilidade de 3 chegadas em um minuto qualquer do horrio
de pico.

90

Captulo 3: Variveis Aleatrias Discretas

b. se o aeroporto pode atender 2 avies por rninuto, qual a probabilidade de


haver avies sem atendimento imediato?
c. Previses para os prximos anos indicam que o trfego deve dobrar nesse
aeroporto, enquanto que a capacidade de atendimento poder ser no

mximo ampliada em 50vo. como ficat a probabilidade de espera por


atendimento?

21. IJma indstria de tintas recebe pedidos de seus vendedores atravs de fax,
telefone e Internet. o nmero de pedidos que chegam por qualquer meio (no
horrio comercial) uma varivel aleatria discreta com distribuio Poisson
com taxa de 5 pedidos por hora.
a. Calcule a probabilidade de mais de 2 pedidos por hora.
b. Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50
pedidos?
c. No haver nenhum pedido, em um dia de trabalho, um evento raro?

22. No estudo do desempenho de uma central de computao, o acesso unidade


central de Processamento (cPU) assumido ser poisson com 4 requisies
por segundo. Essas requisies podem ser de vrias naturezas tais como:
imprimir um arquivo, efetuar um certo clculo ou enviar uma mensagem pela
Internet, entre outras.
a. Escolhendo-se ao acaso um intervalo de 1 segundo, qual a probabilidade
de haver mais de 2 acessos cPU? E do nmero de acessos no ultrapassar
5?

b. considerando agora o intervalo de 10 segundos, tambm escolhido ao acaso,


qual a probabilidade de haver 50 acessos?

23. Toda manh, antes de iniciar a produo, o setor de manuteno de uma


indstria faz a verificao de todo o equipamento. A experincia indica que em
95vo dos dias tudo est bem e a produo se inicia. caso haja algum problema,
uma reviso completa ser feita e a indstria s comear a trabalhar aps o
almoo. Faa alguma suposio adicional que julgar necessria e respond:
a. Qual a probabilidade de demorar 10 dias para aprimeira reviso completa?
b. E de demorar pelo menos l5 dias?
c. um esquema de manuteno, com reviso preventiva, est sendo montado
de modo a evitar a reviso completa num dia aleatrio. Deterrrine um dia d,

tal que probabilidade de quebra alm de d seja pelo menos igual a 0,6.

Revisando conr intervalos de d dias, o que estaremos garantindo?

3,4 Ii.rerccios

91

24, Considere uma varivel aleatria X - G (0,8). Construa uma nova varivel
)/ tal que Y : X para os valores 0,1,2,...,5 e Y : 6 para X ) 6. Dessa
rrma, Y corresponde ao truncamento de X a valores menores ou iguais a 6.
( )btenha a funo de probabilidade de Y e calcule:

r. P(Y

:2).

b. O valor da funo de distribuio (acumulada) no ponto 2,5.


3lY < 5).
c. P(Y

d.P(Y>3eX<8).

25. A durao (em centenas de horas) de'uma lmpada especial segue o modelo
Ceomtrico com parmetro t :0,7. Determine a probabilidade da lmpada:
rr. Durar menos de 500 horas.
b. Durar mais de 200 e menos de 400 horas.
c. Sabendo-se que vai durar mais de 300 horas, durar mais de 800 horas.
rl. O item anterior uma aplicao de um resultado geral vlido para o modelo

Geomtrico. Assim, mostre que para X


inteiros positivos rn e n,vale P(X > m *

- G (p) e quaisquer nmeros


nlX > m) = P(X > n).

l}n um estudo sobre o crescimento de jacars, uma pequena lagoa contm 4


cxemplares de espcie A e 5 da espcie B. A evoluo de peso e tamanho dos 9
.iacars da lagoa acompanhada pelos pesquisadores atravs de capturas
pcridicas. Determine a probabilidade de, em trs jacars capturados de uma
vcz, obtermos:

2r.

ru.

Todos da espcie A.

b. Nem todos serem da espcie B.


c. A maioria ser da espcie A.
descuidado mistura 4 exemplares defeituosos junto com outros 16
pcrfeitos de um certo livro didtico. Quatro amigas vo a essa livraria para
cornprar seus livros escolares.
ir. Calcule a probabilidade de 3 levarem livros defeituosos.
ll. Qual a probabilidade de, aps a visita dessas meninas, restarem o mesmo
nmero de defeituosos na livraria? E de no restar nenhum?

27,

Un livreiro

2ll. (Use o computador) Para os dados apresentados na Tabela l.l no Captulo l.


l. Construa a tabela de freqncias para a varivel Exer, horas de atividade
i'sica por semana.
b. Suponha que 5 pessoas so selecionadas ao acaso. Qual a probabilidade de
que 3 delas pratiquem, pelo menos, 6 horas de atividade fsica por semana?

Captulo 3: Variveis Aleatrias Discretas

92

c. Repita o item (b) calculando a probabilidade de todas as pessoas escolhidas


praticarem pelo menos 6 horas de atividade fsica.

29. (Use o computador) Considere a varivel altura apresentada na Tabela 1.1,


Captulo 1.
a. Crie uma varivel lj assumindo o valor 1 se a altura do indivduo e for
maior que a mdia de altura da populao (indivdu os altos) e 0 caso
contrrio (indivduos baixos). Apresente a distribuio de freqncia para
esta varivel e uma representao grfica adequada.

b. Suponha que

13 alunos vo ser sorteados com reposio e a cada

um deles
ser associada uma varivel V, ,i:1, ..., 13. Defina X: nmero de alunos
altos. Como voc expressaria X em termos das variveisY, i,: 1, ..., 13?
c. Obtenhauma amostra de 100 valores da varivel X, isto , repita 100 vezes
o sorteio de 13 alunos nas condies do item (b). Construa uma tabela de
freqncias.
adequado para as variveis Y;,
'i : L,...,73? O modelo Binomial se aplica para X? Em caso afirmativo,
quais seriam os parmetros? Justifique suas resposta. (Uma boa idia
calcular valores esperados e observados e coloc-los em um mesmo

grfico).

i. Calcule P(X

:7), P(X < 9)

"

Medidas Resumo
4.1 Introduo
Neste captulo, vamos apresentar algumas medidas que buscam sumarizar
s informaes disponveis sobre o comlortamento de uma varivel. podemos
del'inir essas medidas nos casos de ur.t cilnto de dados u de uma funo de
prrrbabilidade de varivel aleatria. Apesar danatureza diferente de cada caso, as
itcrtlidas tero a mesma interpretao, variando apenas na forma de serem
trlcu ladas.

Lembremos que, no Captulo 1, tivemos

d. Qual seria o modelo de probabilidades

e. Assumindo que o modelo Binomial adequado para

Captulo 4

X:

P(0 S X < 13).

ir'. Qual a probabilidade de pelo menos 4 alunos serem baixosT E de


mais de 7 e menos do que 12 alunos serem altos?

30. (Use o computador) Considere os dados do arquivo aeusp.txt descrito no

a oportunidade de discutir

Illg,ttrnas tcnicas para estudar e apresentar descritivamente quantidades na


peipulao, seja por tabelas de freqncias ou por grficos adequados. o conjunto
tle dados com que trabalhamos poderia ser toda a populao ou apenas uma parte

delir. J estudamos, no captulo anterior, que a representao de eventos de


lnlcrcsse pode ser feita atravs de variveis aleatrias discretas e definimos alguns
ntotlclos cuja ocorrncia na vida prtica mais comum.
Nosso interesse caracterizar o conjunto de dados atravs de medidas que
fsstlllim a informao, por exemplo, representando a tendncia central dos dados
gu ir rnaneira pela qual estes dados esto dispersos. Tais medidas tambm podem
FL'r' tlcfinidas para variveis aleatrias, permitindo caracteriz-las de forma
etrrclhante ao que feito para um conjunto de dados qualquer.

Exerccio 26, Captulo L


a. Para a varivel Temposp, construa uma tabela de freqncia com faixas de
tamanho 10, a partir dq zero. Obtenha o histograma correspondente e

4.2 Medidas de Posio

discuta a adequao de algum modelo discreto a esses dados.


b. Faa um histograma da varivel Resid. Verifique se o modelo Binomial com

Se estamos numa parada de nibus urbano e nos pedem alguma


llr'orrnao sobre a demora em passar um determinado nibus, que diremos?

parmetros

n: l0 e

: 0,5

seria adequado para representar

comportamento dessa varivel na populao.

Nirrgtrrn imagina que poderamos dar como resposta uma tabela de freqncias
rltr(' l)acientemente coletamos no ltimo ms, ou ano! Tampouco, seria adequado
ttllt1'scltar um modelo terico pelo qual teramos ajustado o comportamento da

virrirvcl aleatria de interesse. Quem perguntou deseja uma resposta breve e


t,tllrirla que sintetize a informao que dispomos e no uma completa descrio dos
tlltrlos colctados ou da modelagem que porventura fizemos.

e3

Captulo 4: Medidas Resumo

94

Nesta seo, definiremos medidas de posio ot medidas de tendncia


central para um conjunto de dados qualquer (populao ou amostra) e, ento,
consideraremos as correspondentes definies para variveis aleatrias.

Definio 4./: Medidas de posio para um conjunto de dados

Considere uma varivel X com observaes representadas por


1,t2,... ,tn,. A mdia desse conjunto a soma dos valores dividida pelo nmero
total de observaes. Isto

1,) Madidas de Posio

95

o nmero de parafusos, em cada caixa, um valor inteiro, porm, a


Ftrlirr no precisa ser necessariamente um nmero inteiro, Para este exemplo,
Notcr que

tclrros que, em mdia, as caixas contm 98,6 parafusos.

Colocando os dados em ordem crescente, obtemos: 95,96,97,98,99,99,


100 e 102. Neste caso, como o nmero de elementos no conjunto de
100,
100,
datlos 10, um nmero par, tomamos a mediana como sendo a mdia dos dois
Yhrrcs que ocupam a posio central. Temos

ftrdrh,

Iohs:

D*u

rL+ir2*..,*rI,

i:T
n

dos dados ordenados.


A moda dada pelo valor mais freqente e ser denotada po moobs.

Se houver possibilidade de confuso, faremos meno varivel

mo,,6r(X)

X
tr

Note que as definies acima tambm podem ser aplicadas quando o


conjunto de dados j est organizado numa tabela de freqncia. Por exemplo,
para a mdia temos
A:

rohs:

ntrt * n2r2 * "' I


nt*"'lnk,

Dr,.ru f-?'i
i:l
n - 4n*"
;

TT'xAt

99.

E imediato que o valor mais freqente 100 e assim, mo,,1,.

A mediana, representad a pot rnd,,6r, o valor que ocupa a posio central

representando a mediana e a moda por md,,6r(X) e

: 99+99

k diferentes valores, ponderada


pelas respectivas freqncias relativas de ocorrncia. De modo anlogo tambm
e, assim, 7n6, pode ser pensada como a mdia dos

podemos obter, atravs da tabelabe freqncia, a mediana e a moda.

Exemplo 4.1.. Suponha que parafusos a serem utilizados em tomadas eltricas so


embalados em caixas rotuladas como contendo 100 unidades. Em uma construo,

10 caixas de um lote tiveram o nmero de parafusos contados, fornecendo os


valores 98, 102, 100, 100, 99,97,96,95,99, 100. Para essas caixas, o nmero
mdio de parafusos ser dado por

- L00. tr

As medidas de posio podem ser utilizadas em conjunto para auxiliar a


dos
dados ou, em determinadas situaes, uma pode ser mais conveniente
ndliso
a
outra.
Por exemplo, se um ou mais valores so muito discrepantes do que
rpr,:
6o
gerirl das observaes, a mdia ser muito influenciad.a por este valor, tornando1 nssirn, inadequada

para representar aquele conjunto de dados. Se uma das

lxirs ao invs de 95 tivesse 45 parafusos, a mdia passaria de 98,6 para 93,6.


NcFl('' cilso, como a mediana no afetada por valores discrepantes, seu uso seri0
ffiis irclcquado para representar os dados. Por outro lado, para conjuntos de dados
ttr rrruitas observaes, a mediana difcil de ser calculada, uma vez que o
pfoccsso de ordenao custoso, mesmo com o uso de computadores. nindn

o aparecimento de distribuies multimodais, isto , conjuntos de dados


possuem
mais de uma, moda. Como regra geral, .precisamos usar essfls
QE:-r
ffieclitlirs com o cuidado de no distorcer informaes e caractersticas dos dados
Egtttrrrrr

qu rlril iunos analisando.

llm muitos casos, a varivel de iqteresse no observada diretamente e


lro
do conjunto original de dados. Assim, pode ser necessrio considerar
Unln
originais
multiplicados ou acrescidos de constantes para produzir.um
s vrrlorcs
lltivo corrjunto de valores. Nos prximos exemplos, estudamos como as medidas
de grosiiro se alteram e veremos como podem ser obtidas a partir das respectivas
flterlirlirs do conjunto original.
El'entplo y'.2.. Nas caixas de parafusos do Exemplo 4.1, vamos admitir um custo
de ,' p,rr paraso e de e pela embalagem da caixa. Desejamos calcular as medidas
ele lrtrsio clo custo total (T), definido como a soma dos custos dos parafusos c
dtt t'rrrlrirhgcm. Iniciamos, calculando as novas medidas de posio apenas pira o
ulttt lqttido por caixa (.L), isto , o custo dos parafusos contidos na caixa sem it

9()

Captulo 4: Medidas Resumo

4,2 Merlidas de Posio

embalagem. Temos,

,,!0/l'
9Bc

MdiadeL:lnbs:

I02c

*.'. * 100c

986 c

10

10

: 99c*99c

:99c,

e, sern maiores dificuldades, moo65(L) : 100 c. Conclumos que a multiplicao


;rcla constante c resultou em que as novas medidas de posio so as antigas
nrultiplicadas por c.

Vamosincluiragoraocustodaembalagem.Ascaixascustaro

1.

e,

L02c*e,...,

100

+ e) +... + (100c + e) _
10

* 10e
10

QUnrrlirladc temos

50x
--

LCgt,, clo clculo que fizemos, vem imediatamente que

c+e.

9B6c

associado com as despesas do

stilrular. Para simplificar um pouco a situao, vamos supor que se atribui, para
du irluno, uma despesa fixa de R$ 1300, relativa preparao e mais R$ 50 para
Eeltr vcstibular prestado. De posse dessas informaes, vamos calcular as medldas
e posio da varivel D: despesa com vestibular. Pela definio desta nova

t!

oh.,:50 x

Entro,

(9Bc

n"ff\P.To,,,(x)
Potlt scr de intese estudar o gasto dos alunos

mdr,6r(L)

,,hs:

I+2

75" + 76"

md'o1,"(X)

/'

98,6 c.

Para a mediana segue que,

98c

t' .j'',

:98,6c *

1,73

md,o1,r(D)
e.

Il fcil ver que para a mediana md"6,(T) : 99c * e e que para a moda,
tno,1,"(T): 100c * e. Dessa forma, o acrscimo por uma quantidade e teve o
e'eito de somar essa mesma constante s medidas de po.sio.
n
Iixemplo 4.3: Foram coletadas 150 observaes da varivel x, representando o
ttnlaro de vestibulares FUVEST (um por ano) que um mesmo estudante prestou,
Assim, foi observado que 75 estudantes prestaram vestibular FUVEST, uma nica
vcz, e assim por diante. Os dados esto na tabela abaixo:

mo"1,"(D)

50

1300

1,5

* 1300 :

x 1+

1300

1375;

fI

1350.

fuenplo 4.4: l-lm estudante est procurando um estgio para o prximo ano. As
Btttltrurlrias A e B tm programas de estgios e oferecem uma remunerao por
lr,,r',,* semanais com as seguintes caractersticas (em salrios

Companhia
mdia
mediana
moda

)5

2,0

T,7

1.9

1,5

l,g

mnimos):

QUttl c.rrnpanhia mais adequada?

Calculando as medidas de posio de

I $#t'l''' \'

X,

obtemos

Ix75t_2x47-t3x2I+4x7 :
150

Lr73;

lrricialmente vamos discutir as informaes fornecidas, supondo que o


lttttlirrrtc tert seu salrio "escolhido" de acordo com uma poltica salarial
FcErrrrritlir na tabela anterior. A companhia tem 50vo dos seus estagirios
@r'elrrtttltl (: l,'7 salrios mnimos e o valor com maior freqncia de ocorrncia
, f ,t, ('rrro a mdia 2,5 deve haver alguns poucos estagiiios com salrio bem
lltris irlo, isto , valor alto de salrio com freqncia pequena de ocorrncia. A
Elrtlrttttltiit R tem as trs medidas bem prximas indicando umaazovel simetria
ltttr: slltrios altos e baixos. A opo do estudante depender de sua qualificao.

9,

Captulo 4: Medidas Resumo

Se ele for bem qualificado, deve preferir a companhia ,4, pois ter mais chance de

obter um dos altos salrios. Se tiver qualificao prxima ou abaixo dos outros
cstudantes, deve preferir a B que parece ter uma poltica mais homognea de

tr

salrios.

vamos, agora, descrever algumas medidas associadas s variveis


aleatrias eue, como j mencionamos, sero correspondentes s medidas

irlgurnas situaes, as desigualdades so satisfeitas por qualquer valor num


o intervalo e, nesse caso, tomamos a mediana como o ponto mdio do

A moda o valor (ou valores) da varivel que tem maior probabilidade de


Egrt'ttcia, representando-a por Mo, temos

P(X : Mo) :

apresentadas para um conjunto de dados.

sabemos que a descrio completa do comportamento da varivel


aleatria discreta , feita atravs da sua funo de probabilidade. Assim sendo,
razovel pensar que, qualquer que seja a quantidade destinada a resumir esse
comportamento, sua definio dever envolver, de alguma forma, essa funo de
probabilidade.
A medida mais popular o valor esperado, ou simplesmente mdia, el
representa o ponto de equilbrio da distribuio de seus valores. Da mesma forma,
como mencionado no caso de um conjunto qualquer de valores, o uso do valor

esperado como sntese de toda a informao pode levar a distores e


interpretaes equivocadas. Em especial, possvel construir uma funo de
probabilidade, com valores da varivel muito diferentes uns dos outros, em que a
rndia no caracteriza o real comportamento da varivel aleatria. A mdia junto
com a moda e a mediana so medidas de posio ou de tendncia central e so

De.finio 4.2: Medidas

de posio

mdia, valor esperado

para vardveis aleatrias discretas

ol

esperana de uma varivel

dada pela

cxprcsso:

: Dr,

E(X)
'

ou

P(x > Md)>Ll2 e P(x < Md) > 1/2.

tr

com a seguinte funo discreta de

Enttts.

/,.=

t i ipi: (-

5) x 0,3 * 10 x 0,2 * 15 x 0,4+20 x 0,1 :8,5.

A mrrrll o valor com maior probabilidade e, portanto, segue q1ae Mo: 15. Por
ltnr lnclo, a mediana poder ser qualquer nmero entre 10 e 15, pois, para
P e I ttt, J.5], temos

P(X<b)>0,5 e P(X >b) >0,5.


ftln

c'orrveno adotada, tomamos

Md:12,5

(ponto mdio do intervalo).

tr

O$serve que nem a mediana, nem a mdia precisam ser valores assumidos
peln vrrrirvel aleatria. No exemplo anterior, a mdia de X foi 8,5 e a mediana
13,i tpro so valores no assumidos pela varivel aleatria'
l)c modo similar ao ocorrido com as medidas de posio num conjunto de
dcrl,rs, ir rnultiplicao ou a adio de constantes a uma varivel aleatriafaz com
gue suis medidas de posio fiquem multiplibadas ou acrescidas pelas mesmas
Elllslitttlcs.

i:L

umer notao alternativa representar E(x) por px ou simplesmente


Itouver possibilidade de confuso.
A mediana o valor Md que satisfaz s seguintes condies

max (P1, Pz,' ' ', Pn)'

4.5: Considbre a varivel aleatria

clefinidas a seguir.

Suponha que os possveis valores da varivel aleatria sejam


rcpresentados por tt, 12, . . . , t., com correspondentes probabilidades
'l)t,'l)2,',. ,Pk.

99

1,2 Al*lidas de Posio

Eremplo 4... Considere uma v. a. X com funo densidade discreta dada por

p,

se no

Nnrr rl tlil'cil verificar que f/ : 10,3; Md : 8 e Mo : 5. Se uma nova varixelY


rrlrlitlir it partir de X atravs de Y : 5 X - 10, sua funo de probabilidade ser

100

Captulo 4: Medidas Resumo


4,2 Medidas de Posio

o clculo
Fv

Ressaltamos que, no caso de conjunto de dados, usamos letras minsculas


pnrit denotar as referidas medidas, eniluanto, no caso de variveis aleatrias,
Ulilizamos letras maisculas. Como mencionamos, a interpretao feita de modo
das suas medidas de posio pode ser feito pela definio. Temos

g x 0,1 * 15 x

Md(Y) :
Mo(Y)

101

0,3+... +90 x 0,2 :

30, pois onico valorcom

girnilar nos dois casos.

4L,5)

p(y > 30) > 0,5 e p(y < B0) )

Fxcrccios da Seo 4.2:


0,5;

Estes mesmos resultados poderiam ser obtidos a partir das medidas de posio de
X multiplicadas por 5 e subtradas de 10. Isto ,

Esta propriedade

tr

Na Tabela 4.1, apresentamos as expresses para as medidas de posio


para as duas situaes estudadas: conjunto de dados e varivel aleatria.
Tabela 4.1: Medidas de tendncia cntral.

l)iscuta quais medidas de posio seriam mais adequadas para os conjuntos de


dados abaixo. Comente suas escolhas.

15, pois o valor com maior probabilidade.

Fv:5x10,3-10:41,5;
Md(Y):5xB-10:30;
Mo(Y):5x5-10:15.
facilita clculos e pode ser bastante til.

l.

disponveis dados mensais sobre a incidncia de envenenamento por


picada de cobra. Deseja-se planejar a compra mensal de antdoto.
lr. O nmero dirio de usurios, entre 17 e 19 horas, de determinada linha de
nibus foi anotado. Pretende-se utilizar essa informao para dimensionar a
frota em circulao
c. Um fabricante de baterias deseja divulgar a durabilidade do seu produto e
coleta a informao sobre a durao de 100 de suas baterias.
tl. Num vo internacional uma companhia serve dois tipos de pratos no jantar:
peixe ou frango. Um banco de dados contm os pedidos feitos nos ltimos
200 vos. Pretende-se planejar o nmero de cada tipo a ser colocado
disposio dos passageiros.
tu. Esto

2, Vinte e cinco residncias de um certo bairro foram sorteadas e visitadas por um


cntrevistador que, entre outras questes, perguntou sobre o nmero de
tclcvisores. Os dados foram os seguintes:

2,2,2,3,7,2,1,

1, 1, 1, 0, 1,

2,2,2,2,3,r,1,

3, 1, 2,7,0 e

2.

Orgirnize os dados numa tabela de freqncia e determine as divers as


rlc posio.

//

^eai#
I

.1. Ntrrn experimento, l5 coelhos foram alimentados com uma nova rao e seu
pcso avaliado ao fim de um ms. Os dados referentes ao ganho de peso (em
r;uilogramas) foram os seguintes:
I

1,5; 1,6; 2,3;\7,7;

!;5;2,0; L,g; I,8;2,7;2,L; L;9i \,8;i.!,7;2,5

n. Utilizando os dados brutos, determine mdia, moda e

e 2,2.

mediana desse

conjunto.
lr. Organize uma tabela de freqncia com faixas de amplitude 0,2 a partir de
1,5'

t02

Captulo 4: Medidas Resumo

c. calcule, a partir da tabela de freqncia e com o ponto 'krdio como


d.

representante de cada faixa, a mdia, a moda e a mediana. comente as


diferenas encontradas com o item (a).
se ao invs de 15, fossem 500 coelhos, qual seria o procedimento mais
conveniente: o de (a) ou o de (c)? Ter acesso a computador faz diferena?

4. Sendo

uma varivel aleatria com funo de probabilidade dada a seguir,


obtenha as medidas de posio 1t, Md e Mo.

a-.''
5. Para cada item abaixo, construa uma_varivel aleatria que atenda as condies
indicadas.
. p: Md : Mo.

> Md.: Mo.


Md < Mo.
<
t-L
6. um atacadista recebe
b.

pr,

( -"

c.

de vrios fornecedores uma certa pea para revenda. A


pea produzida com material de qualidade diferente e, portanto, tem custo

diferenciado. Levando em conta a proporo fornecida e o preo apresentado


por cada fabricante, pode-se admitir que o custo de uma pea em reais,
escolhida ao acaso, uma varivel aleatria (C). Admita a seguinte funo de
probabilidade para C:

103

4,. Medidas de DisPerstt

rtumente os altos rendimentos de alguns residentes sero suficientes para fazer


mundo, porm
trrclia atingir um patamar comparvel s melhores economias do
grande.
O que podemos
e rliscrepnca entre os diversos valores deve ser muito
cntrrr.esquecendo a variabilidade dos valores da varivel e isto no captado

Ee

pelrr rnia e sim pelas medidas de disperso' Por exemplo, para o conjunto de
Vnl.,,'cs 0, 20 e 40 a mdia igual a 20. O mesmo acontece com o conjunto 20,
30 c 20. Os dois conjuntos tm valores bem diferentes, apesar de terem a mesma

fltrliir. De fato, fctl construir exemplos onde dois conjuntos de dados distintos
possuem medidas de posio idnticas. Em muitas dessas situaes existe

li'.r"no em relao disperso dos dados, isto , quanto maneira como os


Valer.cs de cada conjunto se espalham. A fim de quantificar tal aracterstica,
vtliuos definir algumas medidas de disperso'
Dc,f'ittio 4.3: Amplitude de uma varidvel em utn coniunto de dados

A amplitude, referente a uma certa varivel, definida como a diferena


n
por A.
lltr.c o maror e o menor valor do conjunto de dados. Ser denotada

A amplitude s leva em conta dois valores de todo o conjunto e, assim,


as
er.iir mais cnveniente considerarmos uma medida que utilizasse todas
em
observao
ltscrvaes. Uma idia inicial considerar o desvio de cada

seja
felrriro a um ponto de referncia e ento tomar sua mdia. caso a observao
seria negativo, caso seja maior, positivo' A
de sinais diferentes se compensem,
que
termos
Fqrrur cle tais desvios far com
p6tlcrrclo ocultar o efeito da variabilidade. Esta dificuldade discutida no exemplo

nttrilr do que a referncia, o desvio


egtlir.

a. Determine as medidas de posio davarivgl C.


b. Suponha que o atacadista revenda cada uma dessas peas acrescentando
50% sobre o custo da pea, alm de um adicional de R$0,10 pelo frete.
Calcule as medidas de posio davarivel preo de revenda.

E,rttttplo 4.7: Numa classe com 12 alunos de um curso de ingls, os alunos


llrlir:itt'am o nmero de outras lnguas (alm do portugus e ingls) que tinham
1, 1,
Hlg,rrrla familiaridade. Os resultados ordenados foramos seguintes: 0;0,0,0,
obtemos
e
mediana
a
e
a
mdia
dificuldade
sem
f , l, I ,2,2 e 4. Calculamos
iT,,/,r

13f 12 e md,,6*

Apesar das medidas de tendncia central fornecerem uma idia do


comportamento das variveis, elas podem esconder valiosas informaes. Essas
medidas podem no ser suficientes para descrever e discriminar diferentes
conjuntos de dados. Por exemplo, um bairro nobre da capital paulista inclui umir
das maiores favelas de So Paulo. o que podemos dizer da renda mdia do bairro?

L.

O desvio de cada observao em relao

ex;rlcssito

4.3 Medidas de Disperso

ri -

m(1o65.

[], 0, 0, 0, ]-, 1

Para o conjunto de dados acima temos:

e 3.

obtido pela
-1, -1' -1, -1, 0,

mediana

Se calculamos a mdia desses desvios obtemos 1/12'

Nultrrrr<ts que valores negativos e positivos se compensam, diminuindo a mdia

impresso de pequena variao. Um caminho


que
trlcr.nirtivo seria tomar a mdia dos valores absolutos dos desvios acima, o
rllrrrrtttitttdo tlesvio mediano e definido por

rlrs rlcsvis e dando a falsa

104

Captulo 4: Medidas Resumo

relao mdia. Isto ,

"12

Exemplo 4.8: No Exemplo 4.1, foram fomecidas as quantidades de parafusos em


l0 caixas de um lote. Pelos valores observados, o maior nmero de parafusos foi
102, ao passo que o menor foi 95. Logo, a amplitude ser dada por

A--102-95:7.
Para calcular a varincia, utilizamos o valor da mdia, 98,6; j,obtido no
te'crido exemplo. Para auxiliar nos clculos, podemos construir as tabelas abaixo.

tJlilizando a expresso da Definio 4.4, necessrio criar colunas com os


(*o - Tnt r)2, enquanto que a expresso alternativa requer
vrrlrrres ri - Tohs

"

b(

L24lri-T"n''l: 6 '

llpcnas uma coluna com os valores

os

desvios mediano e mdio utilizam a funo mdulo que, por suas


caractersticas matemticas, torna mais difcil o estudo de suas propriedades.
Definimos a seguir ua nova medida de disperso que iliza o quarado dos
desvios em relao mdia.

Definio 4.4: Vari,ncia e desvio-padro etn um conjunto de dados

de um conjunto de dados, definida

por
aTl

l-.-

ver(,hs:: /-'
) .(", -T,,t r)2
n,

Para manter a mesma unidade dos dados originqis, conveniente definirmos o

desvio-padro como sendo dpob,: var,n .


f
confuso, faremos meno varivel X, utilizando

se houver
a notao

1:;

ri'-

98

r02

,L

Tob,

/
\ri

Alternativa:

-I,'hs)'\.,

0,36

98

11,56

102

da varincia como uma medida de variabilidade. Entretanto, possvel obter uma

100

r14

1,96

.)

100.

100

L,4

1,96

100

10000
10000

99

0,4

97

96

8
)

95
99

- 2,6
- 3,6
0,4

0,16
2,56
6,76
L2,96
0,16

l0

100

L,4

1,96

10

40,40

total

1,6

total

99

9801

97

9409

96

95

9276
9025

99
100

10000

Scp,rrc da

Definio 4.4 e da tabela correspondente que:

vlr(,hs:

1.\.
; L\",X:I

\, :

t1,6*)'

ff : n,on'

lrt:lir cxpresso alternativa, temos


Vgfobs

- v \--,
Q-t

_u

*obs'

9604
70404

L)

expresso alternativa que facilita os clculos. Fica como exerccio ao leitor


4'ILl

ri'

possibilidade de

var,,6_(X). tr

lLi

0,6
3,4

A expresso apresentada na Definio 4.4 auxilia o leitor na interpretao


mostrar que:

rf

i,,)lsi$

I)efinio 4.4:

A varincia, referente varivel

105

qrrc em muitos casos envolve decimais e torna-se muito trabalhosa.

uma outra maneira de calcular os desvios em relao mdia e, neste caso, a


expresso a ser usada r,; - rotr. A soma desses desvios sempre d zero se o
clculo for feito sem arredondamento e, portanto, a mdia deles tambm sempre
zero. Dessa maneira, essa medida no seria nada informativa sobre a disperso
das observaes. Entretanto, podemos tomar os valores absolutos obtendo o
desvio m,dio, que definido como a mdia dos valores absolutos dos desvios em

mdio:
- a \-

Medidas de Disperso

A vantagem de usar essa expresso alternativa evitar a operao de subtrao,

desvio mediano :
iElni - md.o6,l : *

desvio

4,.1

1.\
-1
vctt'(il).\:- > .r" -ri,t^
n,-'
z=l

:- 97260 -:1nu,u;): n,on.


10

9801

97264

t0(t

Captulo 4: Medidas Resumo

Naturalmente, qualquer que seja a expresso utilizada, o desvio padro dado por

dpohr:

JT,04:2,AI.

Para o caso em que o conjunto de dados est organizado numa tabela de


freqncia, o clculo da varincia ser modificado de forma conveniente com a

ponderao dos desvios pelas respectivas freqncias. Aproveitamos o prximo


exemplo para ilustrar essa situao, alm de discutir o efeito, sobre a varincia, da
multiplicao ou adio de constantes aos valores da varivel de interesse.

Exemplo 4.9; No Exemplo 4.3, definimos a quantidade D, despesa no vestibular,


obtida a partir de x pela expresso D:50 x x*1800, com x indicando o
nmero de vestibulares prestados. Para efeitos didticos, antes de obter a
varincia de D, vamos calcular a varincia de X e da quantidade auxiliar
Y:50 x x. Iniciamos por ampliar a tabela de freqncia de x, para incluir
tambm os valores deY e D. Temos,

Tri

50

1350

75

100

1400

47

150

r450

2L

200

1500

14

#
-- " D",(*,
i:l

107

Disperso

Ee trtorlo anlogo, escrevemos

var,,6,(Y):

rttr,6,(D):

I
#

(7b

502

(75 x 13502

+.'. + 7 x200\ -86,52 :1917,5i


+...+7 x 15002) -

1386,52

:rgr7,5.

Note que a varivel D nada mais do que Y acrscido de 1300. No


bliy(e, suas varincias so iguais, isto , o acrscimo de constante no alterou a
Crilrrcia. Esse resultado de certa forma previsvel, pois a adio ou subtrao
$g orrstante corresponde a uma translao dos valores dessas quantidades, no
ltet'ntrclo sua variabilidade relativa. Por outro lado, Y igual a 50 vezes a
yt'irvcl X e sua varincia 502 vezes a varincia de X. Esse resultado se explica,
pgls l multiplicao por constante altera a distncia entre os valores da varivel
flgirrll e, pela frmula da varincia, o efeito ser pelo quadrado da constante. E
E*emplo 4.10: O salrio de professores do ensino fundamental da rede privada
Flri scrrclo estudado. A tabela abaixo apresenta os valores, em salrios mnimos,
btitlos em um levantamento numa certa cidade. Desejamos calcular a mdia e a
Vt'incia desse conjunto de dados.

As mdias de X e D jforam calculadas no Exemplo 4.3 e a de Y segue


sem dificuldade. Assim, r,hs : I,73; y,,6-: 86,5 e ,,h, L 1386,5. Para calcular a
varincia de X, via tabela de freqncia, adaptamos as expresses apresentadas
anteriormente obtendo:

var,,6.(X):

1,.1 4uliclas de

r,,0,)'

Salrio

freqncia

1F3
3F5

L4

5-7
7-9

25
1B

9F11

total

70

ou, na forma alternativa,

Vafr,6r(X)

hD",",

_c
nohs'

Optando por utilizar essa ltima expresso temos o seguinte clculo:

var,,1,,,(X):

r,o

(Tsxt2 *4T x22 +2r x 32 + r x +2)-r,TJ2 :0,767.

f-o1lo ir varivel est apresentada em faixas de valores, no temos os valores


el.livirnrente observados e, portanto, no podemos aplicar as frmulas da mdia e
rlrr virrirrcia. Para contomar essa situao e obter resultados aproximados para as
ttrt,rlirlas clesejadas, tomamos como representante de cada faixa seu ponto mdio.
['orrr cssit alternativa, o clculo feito nos mesmos moldes das variveis

t08

Captulo 4: Medidas Resumo

14x2+25 x 4+ ". *4 x

10

70

4,97.

Para a varinpia:
VQfohs

:h'"*r -77,u":29,7I - 24',72:

4,99.

109

Medidas de Disperso

a informao dos valores esperados, medianas e modas


concluiramos por uma perfeita harmonia de desempenho
disponvel,
ctitivesse
elttrc os vrios mtodos. Entretanto, como podemos observar pelas distribuies
de probabilidade, esse no o caso. Por serem medidas de tendncia central, as
trs rnedidas acima no captaram a variabilidade existente em cada mtodo. D

quantitativas discretas. Assim,

.5
ln
:
:
Iohs
'(0 ) Tli.:xi
-

4,.1

Se apenas

Como mencionamos para as variveis em um conjunto de dados, podemos


ter vrias maneiras de medir a disperso. Para o caso de variveis aleatrias
vnrlos definir apenas a varincia, que a medida mais utilizada.
De.linio 4.5: Vartncia de uma varidvel aleatria discreta

Para um salrio mnimo de R$ 180, a mdia e a varincia dos salrios em reais


seriam, respectivamente, 180 x 4,g7: 894,60 e 1802 x 4,gg: 161.676,00. tr

Vamos, agora, apresentar as medidas de disperso para variveis


j mencionamos no incio da so, as medidas de posio no
"explicam tudo" que est acontecendo, seja num conjunto de dados ou com
variveis aleatrias. O prximo expmplo refora essa idia para o caso de

Seja X uma varivel aleatria com P(Xi - *n) : P,i,'i : L,2,... ,k e


Itrdia p. A varincia de X a ponderao pelas respectivas probabilidades, dos
tlesvios relativos mdia, elevados ao quadrado, isto ,

aleatrias. Como

variveis aleatrias.

Exemplo 4.11: llma pequena cirurgia dentria pode ser realizada por trs
mtodos diferentes cujos tempos de recuperao (em dias) so modelados pelas
variveis Xr, Xz e Xs. Admita que suas funes de probabilidade so dadas por

0,2

10

0,2

0,2 .

x, I 1 5 9
Pi I tls 113 rl3

Var(X):
'

(*,

i:I'

p)'

pu

Muitas vezes, denotamos a varincia por o2 e, se houver possibilidade de


otuso, usamos o2r.Exttaindo araiz quadrada da varincia obtemos o desviotr
pulrto que representado por d ou ox.

Exctnplo 4.12: Retomando o exemplo anterior, calculamos as varincias dos


tenrpos de recuperao para cada mtodo. Temos,

Wtr(X): (0-

5)2

x0,2+(4-5)2 x0,2 + "'+ (10-b)2 x0,2:10,40.

l)e rrrodo anlogo, obtemos:

O valor 0 na varivel X1 pode ser interpretado como recuperao no mesmo dia


da cirurgia. Na tabela abaixo, apresentamos o valor esperado, a mediana e a moda
para cada uma das trs variveis. Vale ressaltar que a moda nem sempre nica e
para construir a tabela a seguir, escolhemos o valor 5 como representante dos
valores modais de X1e X2.
X1

X2

X3

valor esperado

mediana
moda

Var(X2)

L0,67

e Var(X3): 0,60.

l)cssa brma, utilizando-se os mtodos 1 e 2 (variveis X1


vrrrinbilidade

no tempo de recuperao.

e X2),teremos

A varincia definida

maior

anteriormente pode ainda ser considerada como o


vrrlor csperado de uma nova varivel aleatria, o desvio ao quadrado. Isto ,

Var(X):E[(X-p)2],
it rltrirl pode ser convenientemente reescrita na seguinte forma

u0

Captulo 4: Medidas Resumo

Tabela 4.2: Medidas de disperso.

Var(X)

: E(X\ - P2 : la,"? - ut'


i:L

Esta ltima expresso bastante til e, para no criar confuso, explicitamos os


seus termos. O termo E(Xt) o valor esperado da varivel leatria X2, ao passo
que p2 indica o quadrado do valor esperado de X. O prximo exemplo recalcula
as varincias do exemplo anterior, atravs da expresso acima.

Exemplo 4.13:

A partir das funes de probabilidade de X1,X2 e

Xs

apresentadas no Exemplo 4.11, obtemos

',:ri;,ii

lll

'

u"lsf#'"!'li

:.

:,'i;i;iiir,-:u^2,;t
tl'.:li!;!.?.

::. Varinci-,.;=
*:

:::

::::::::::-r:.,,

: r:l

::.:!;:::..:!..:l/a;U

llllllltlffi
j
:

x3

25 81

I r

w"@

x?l 16 2b 36

: P(Xt -- 4 ou Xt :

4)

: P(Xt :

0,2

$Jr

r-r,ip',.t,i;

16

x 0,2 t"' +

rlf;\
-:i.'

"4,::r

conjni oe naos

4),

uma vez que X1 no assume valores negativos.


Temos ento que

E(x?) : 0 x

(nltcrhti.v,a),[

como por exempo,

16)

un',;6;f1[ri:=

Tabela 4.3: Propriedades da mdia e da varincia.

As funes de probabilidade acima foram obtidas a partir de operaes simples,

P(X?:

IlI

1,, Medidas de Disperso

i::i;

100

x 0,2 :35,40.

#,,

*Y, ,i.fiffi

Ento,

Var(X):35,4-* - 10,40.
De modo anlogo, obtemos E(X :35,67 e n(X'zr) :25,60; resultando
emVar(X2) = 70,67 e Var(X3): 0,60.
tr
A Tabela 4.2 auxilia o estabelecimento da correspondncia entre as
medidas de disperso obtidas a partir de um conjunto de dados e aquelas
calculadas para variveis aleatrias. Em seguida, na Tabela 4.3, apresentamos um
resumo das propriedades da mdia e da varincia discutidas at agora.

Vamos concluir esta seo apresentando, atravs de exemplos, os clculos

do vlrlor esperado e da varincia de alguns dos modelos tericos que foram


del'irr itlos no captulo anterior.

Et'ttttpltt 4.14: SejaX com distribuio Bernoulli de parmetro p. Temos

E(X):0x(1 -p)+Lxp:p
6\: 02 x Q - p) * L2 x p:
Lrrg,,, ir varincia
""rf
Var(X)-p-p2:p(t-p).

'

tr

Captulo 4: Medidas Resumo

1t2

Exemplo 4.75: Para uma varivel aleatria


parmetrosnep,temos

j:r

:iD,r- (+)'
.:J: L

_L k(k+r)(zk+7)
k6
:- k2-L

6-#@='Pk(1-P)'-k

(n - 1)!
L)t
. nk_r (7\ - p)-'
''' 2 @-\r,k)t(k
1)!'
:1
n,

k-L

por

e, em seguida

n-I

pot r

obtemos

- "e'F_(,) r, e - p)' -i :

np,

a somatria igual a 1, pois corresponde a somar todas

probabilidades de uma varivel Binomial com parmetros r e p'


A varincia ser calculada mais facilmente no prximo captulo, qua
apresentaremos propriedades da varincia da soma de variveis
independentes. Por ora, s informamos que seu valor nplL - p)'

k:k

E(Y):Lipv : :Di
j:1
j:1

>,t:
'"

k+7

.:i=t

Para calcular a varincia usaremos o seguinte resultado de soma de sries:


k

D/:
.:i:r

ento,

k (k

+ L)(zk +

L)

+ t)2

(t

Para se calcular o valor esperado e a varincia, no caso dos modelos de


Pglss<rn, Geomtrico e Hipergeomtrico, so necessrias tcnicas um pouco mais
rrdas. Optamos por no apresent-las aqui, tendo em vista o objetivo desse
EXto c, para o leitor interessado, indicamos o livro de Mood, Graybill e Boes
lq7q. Na Tabela 4.4 apresentamos os valores esperados e as varincias para
telos os modelos discutidos no captulo anterior.

Tabela 4.4: Modelos discretos- valor esperado e varinca.


tffii1,///,//rij"l;,.?.*.-tF.

Varivel
Diiciet';
: ;;
/ji;..!. ... .........:.:;....-.
-

wffi"',

Exemplo 4.16: Considere a varivel aleatria Y com modelo Uniforme


entre os valores I e k. Aplicando a definio de esperana matemtica
utilizando a conhecida expresso para a soma de uma progresso aritmti
temos

12

uma vez que

(ry)'

: i2P(Y : i)-

n'
:ik,
(r- P)"-*
(n-ub*
?'"
A:I

E(x)

E'(Y)

;:0

Substituindo nesta ltima expresso,

113

Disperso

Var(Y): E(Y\

com distribuio

E(x):IkP(x:k)

1,.1 l+4cdidas de

;-.
r:

)(

r! !.!l$nN!

_:::h6
t

x||

!i:!1

b)ii
iii:l:::

LLtt\\\riti

sffi\,wqry
ls,::l:;;,:: :I

Ws'..14)!
'W"{"/"K,2/'r'*?t:;i-z7:titi

r.

"riltii;it

il4

Captulo 4: Medidas Re

Exerccios da Seo 4.3:

l.

Voc est indeciso em comprar uma televiso e decide avaliar a


informaes estatsticas, fornecidas pelo fabricante, sobre a durao (e
lroras) do tubo de imagem.
Marca da TV
Mdia
Mediana
Desvio Padro

2.

GA
8000
8000
600

EB
8200
9000

8000

1500

2500

HW

.jogador ganhou menos o pagamento inicial (prejuzo ' lucro negativ.o).


l)ctermine mdia, moda, mediana e varincia dessa varivel.
6. Nrrma certa cidade, o nmero de crianas em idade escolar, em famlias com 4
f ilhos, uma varivel aleatria modelada pela Binomial com parmetros n : 4
c 1r: 0,6. Para cada filho em idade escolai, um projeto de apoio educao
prrga 1 salrio mnimo para a famlia. Calcule a mdia e a varincia do custo
rlcsse projeto por famlia.

7000

Com que marca voc ficaria? Justifique.

4.4 Exerccios

l,

pulsao de 10 estudantes no incio de uma prova de estatstica?am

)86. Calcule a mdia

"

a uurin"iu

O"rr"

"".

3. Num estudo sobre consumo de combustvel, 200 automveis do mesmo ano


modelo tiveram seu consumo observado durante 1000 quilmetros.
infbrmao obtida apresentada na tabela abaixo em km/litro.
Faixas

29

9F10

46

10

F 11

43

11

55

12

rrcsse local.

l. listudando uma nova tcnica

de sutura, loram contados os dias necessrios para


ir completa cicatrizao de determinada cirurgia. Os resultados de 25 pacientes

lrlam os seguintes: 6, 8,9, 7,8,6,6,7,8,9,10,7,8, 10,9, 9,9,7,6,5,7,7,8,


l0 e I 1. Organize os dados numa tabela de freqncia e calcule a mdia e a

Freqncia

7F8
8F9

27

(-_:,.

virrincia.

, IJrna amostra de vinte empresas, de porte mdio, foi escolhidapata um estudo


sobre o nvel educacional dos funcionrios do setor de vendas. Os dados
coletados, quanto ao nmero de empregados com curso superior completo, so
rrpresentados abaixo.

Empresa

No. Funcionrios

Nurn certo bairro da cidade de So pauro, as companhias de seguro


cstabeleceram o seguinte modelo para o nmero de veculos furtados por
sclnani:

purtosl_o.

_1_

2 J n

---'t'

,-

tlrrr certo cruzamento tem alto ndice de acidentes de trnsito, conforme pode
scr constatado em uma amostra dos ltimos 12 meses: 5,4,7, B, 5, 6, 4,7, g,
7, 6 e B. Determine a mdia e a varincia do nmero de acidentes mensais

Detennine o desvio padro do consumo.

4.

t15

4,4 li.rtrccios

t"
\.

t
d

10

11

r)

Empresa

72

13

14

15

16

t7

1B

No. Funcionrios

19

20

L)

Organize uma tabela de freqncia e calcule mdia, moda e mediana.'


b. Determine o desvio padro.

ru.

calcule a mdia e a varincia do nmero de furtos semanais desse bairro.


5. Nunr jogo de dados, umjogador paga R$ S puralanar um dado equilibrado e
ganha R$ 10 se der face g, ganha R$5 se der face 5 e no ganha nda
as
outras faces. Defina a varivel luro por jogadacomo sendo o saldo do"o*
que o

c. As empresas pretendem

incentivar

estudo dos seus funcionrios

o'erecendo um adicional de 2 salrios mnimos para cada funcionrio com


curso superior. Qual ser a despesa mdia adicional nessas empresas?
.1.

As notas finais de estatstica para alunos de um curso de Administrao foram


irs scguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5,6, 4,6,6,3, 8, 4, 5, 4, 5, 5 e 6.

il

Captulo 4: Medidas R

a. Determine a mediana e a mdia.


b. Separe o conjunto de dados em dois grupos denominado s aprovados,
nota pelo menos igual a 5, e reprovados para os demais. Compare
varincia desses dois grupos.
5.

n.

a. Construa uma tabela de freqncia.


b. Calcule a mdia e o desvio padro.

c. Admitindo que cada telefonema acarreta servios sob a garantia avali


em R$ 50 por chamada, calcule a mdia e o des.rio padro das
oriundas do atendimento ao consumidor.
7. lioram anotados os nveis de colesterol (em mg/l00m1) para trinta pacientes
urna clnica cardaca. As medidas se referem a homens entre 40 e 60 anos
idade que foram clnica fazer um check-up.
.)

Paciente

10

Colesterol

160

160

161

163

167

170

172

172

173

177

Paciente

11

T2

13

74

15

16

T7

1B

19

20

Colesterol

178

181

181

782

185

186

194

797

199

203

22

23

24

25

26

27

28

29

30

205

206

206

208

209

217

214

2IB

225

(lllcule

a mdia, a moda, a mediana e a varincia a partir da tabela de dados

tcrnpo, em horas, necessrio para um certo medicarnento fazer efeio

0,2r 2,71 2,12 2,81 3,30 0,15 0,54 3,r2 0,80 1,76
1,I4 0;16 0,31 0,91 0,18 0,04 l,16 2,16 I,48 0,63
H. ( lllcLrle a mdia e a varincia para o

conjunto de dados.
b. (bnstrua uma tabela de freqncia para classes com amplitude de 0,5 hora,
corneando do zero.
f. Suponha que o conjunto original de dados foi perdido e s dispomos da

encontradas.

o departamento de atendimento ao consumidor de um concessionria


veculos recebe, via telefone, as reclamaes dos clientes. o nmero
clramadas dos ltimos 30 dias foram anotados e os resultados foram: 3,4,5,
4, 5, 6, g, 4, 4, 5, 6, 4, 3, 6, 7, 4, 5, 4, 5, 7, g, g, 5, 7, 5, 4, 5, 7 e 6.

27

203

Itplcscntado abaixo:

c. voc identifica algum valor excepcional dentre os que foram observados,


Se sim, remova-o e recalcule os itens (a) e (b). Comente as difr

6.

l)aciente

Colesterol

llrutos.
b. ( )r'ganize os dados em uma tabela de freqncia com faixas de tamanho de
l0 a partir de 160.
l{cra
o item (a) usando a tabela de freqncia obtida em (b).
e,
(lomente
as diferenas encontradas entre os valores das medidas calculadas
al.
crn (a) e (c).

um lrospital maternidade

est planejando a ampliao dos leitos para rec


nascidos. Para tal, fez um levantamento dos ltimos 50 nascimentos, obtendo
informao sobre o nmero de dias que os bebes permaneceram no h
antes de terem alta. os dados, j ordenados, so apresentados a seguir: 1, 1,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4,
4,4,4,4,5,5,5, 5, 5, 5,6,7,7, g e 15.
n. Organize uma tabela de freqncia.
b. Calcule mdia, moda e mediana.
c. Determine o desvio padro.
d. Dentre as medidas de posio calculadas em (b), discuta quais delas seri
mais adequadas para resumir esse conjunto de dados.

t17

4.4 li.rarccios

tirbcla construda em (b). Utilizando alguma suposio conveniente,


rcrculcule a mdia e a varincia e comente as possveis diferenas

cncontradas.

Ertrrrlirnclo-se o nmero de acertos em 100 lances-livre de bola ao cesto, uma


$uros(r'a com 20 jogadores forneceu os seguintes resultados: 68,73, 61, 66,96,

ft), (t5,86, 84, 79,65,78,78,62,80,67,75,88, 75 e 82. Agrupe

as

obsr:r'vaes em intervalos de comprimento 5 a partir de 60 e, usando alguma


Irrgrosiiro adicional, determine a mdia e a varincia do nmero de acertos em
l(10 irllcmessos.

10.

I Sindicato

dos Engenheiros do Estado de So Paulo est estudando o

irrrgrircto do estgio na obteno de bons empregos. Dentre os engenheiros


a'r'r'd'ru 'ormaclos e com empregos considerados bons, foi sorteada uma aostra
c' olrscrrvado o nmero de anos de estgio anteriores formatura.
$, ('irlculc a mdia e a varincia.

It- l'irnr cl'eito de anlise, decidiu-se desprezar os valores que se distanciassem


tlir rndia amostral por mais de dois desvios-padro, isto , s sero
crrrrsiclcrados os valores no intervalo fronr* 2 dponr. Recalcule o item (a) e
corncntc os resultitdos.

il8

Captulo 4: Medidas Resumo

1,.1

119

Exerccios

Anos de estgio

freqncia

Interrupes

freqncia

25

5B

t47
i05

t2
t4

r)

2
.)

t
d

72
45

10

total

462

total

50

11. Na linha de produo de uma grande montadora de veculos, existem 7


verificaes do controle de qualidade. Sorteamos alguns dias do ms e
anotamos o nmero de "OKs" recebidos pelos veculos produzidos nesses dias,
isto , em quantos dos controles mencionados o automvel foi aprovado.
Aprovaes
4

freqncia

359

L26,

1685

4764

total

6934

a. Determine mdia, moda e mediana do nmero de aprovaes por automvel

produzido.
tr. Calcule a varincia.

c. crie uma nova varivel Reprovaes, indicando o nmero de verificaes


no "OKs" no veculo. Determine mdia, moda, mediana e varincia dessa

Determine a mdia e a varincia do nmero de interrupes semanais.


b. O Governo Federal aplica uma multa de 10 mil reais por semana, se h pelo
menos uma interrupo no fornecimento. Calcule a mdia e a varincia do
valor das multas aplicadas por semana.
c. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios
setores, decorrentes da falta de energia e atribuiu um valor total de 900 mil
reais para ser ressarcido pela companhia responsvel pelo fornecimento de
eletricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo
mdio por semana?
rl. Nesse perodo, qual ser a mdia e a varincia do desembolso semanal da
companhia, incluindo multa e ressarcimento de prejuzo?
ru.

de uma faculdade pretende iniciar uma campanha junto


direo da escola com vistas melhoria das salas de informtica. Para tal, fez
nmero de
uma enquete com todos os alunos perguntou sobre

l.l. O Centro Acadmico

Computadores

freqncia

156

135

47

t)

25

total

37L

varivel.

d. Cada reprovao implica em custos adicionais para amontadora, tendo em


vista a necessidade de corrigir o defeito apontado. Admitindo um valor
bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia e a
varincia da despesa adicional por automvel produzido.

12. O rgo do Governo Federal encanegado de fiscalizar a distribuio de


energia eltrica tem acompanhado o nmro semanal de intemrpes de
fornecimento numa certa cidade. Os dados, referentes s ltimas 50 semanas,
consideraram apenas as interrupes que ultrapassaram 3 horas e so
apresentados na tabela abaixo.

computadores que cada um tinha na sua residncia.

a. Obtenha a mdia e a varincia.


b. O Centro Acadmico argumenta qe

cornputador por tluno,

o ideal ter uma

mdia de

.iuntando os 20 da sala de informtica da faculdade

H8

Captulo 4: Medidas Re

Anos de estgio

freqncia

25

5B

747

105

e)

4
5

72
45

10

total

462

Na linha de produo de uma grande montadora de veculos, existem,


verificaes do controle de qualidade. Sorteamos alguns dias do ms
anotamos o nmero de "oKs" recebidos pelos veculos produzidos nesses d

1L.

isto , em quantos dos controles mencionados o automvel foi aprovado.


Aprovaes

freqncia

726

359

1685

4764

total

6934

a. Determine mdia, moda e mediana do nmero de aprovaes por au


produzido.
b. Calcule a varincia.
c. Crie uma nova varivel 'Reprovaes, indicando o nmero de veri
no "OKs" no veculo. Determine mdia, moda, mediana e varrancla
varivel.
d. Cada reprovao implica em custos adicionais para a montadora, tendo
vista a necessidade de corrigir o defeito apontado. Admitindo um
bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia
varincia da despesa adicional por automvel produzido.

O rgo do Governo Federal encarregado de fiscalizar a distribuio


energia eltrica tem acompanhado o nmero semanal de interrupec
fomecimento numa certa cidade. Os dados, referentes s ltimas 50
consideraram apenas as interrupes que ultrapasszrram 3 horas I

lixerccios

119

freqncia

12

T4

I
t
J
t
r)

total

50

t)

tt. l)etermine amdia e a varincia do nmero de interrupes semanais.


It. O Govemo Federal aplica uma multa de 10 mil reais por semana, se h pelo
rlenos uma interrupo no fornecimento. Calcule a mdia e a varincia do
valor das multas aplicadas por semana.
e. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios
sctores, decorrentes da falta de energia e atribuiu um valor total de 900 mil
rcais para ser ressarcido pela companhia responsvel pelo fornecimento de
clctricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo
rrrdio por semana?

d. Ncsse perodo, qual ser a mdia e a varincia do desembolso semanal da


companhia, incluindo multa e ressarcimento de prejuzo?
() (-lentro Acadmico de uma faculdade pretende iniciar uma campanha junto
rlirco da escola com vistas melhoria das salas de informtica.Parata\ fez
ullir enquete com todos os alunos e perguntou sobre o nmero de
ornllutadores que cada um tinha na sua residncia.
Computadores

freqncia

156

12.

apresentados na tabela abaixo.

Interrupes

135

47

25

total

37r

n, ( )lrtcnha a mdia e a varincia,

b. ( ) Centro Acadmico

argumenta qe o ideal ter uma mdia de 1


c'onrputador por aluno, juntando os 20 da sala de informtica da faculdade

t20

Captulo 4: Medidas Resumo

com os que os alunos tm em casa. Quantos computadores precisariam ser

lixerccios

4.,1

121

10. Uma pea produzida por uma mquina pode receber do controle de qualidade

lrs classificaes: boa, defeituosa ou recupervel, com as

acrescentados sala para atender o Centro Acadmico?

14. Duas moedas esto sobre a mesa, uma delas tem duas caras e a outra tem
probabilidade igual de cara e coroa. Sorteamos, ao acaso, uma dessas moedas e
a lanamos duas vezes. Seja X a varivel aleatria que conta o nmero de
caras nesses dois lanamentos. Qual a mdia de X?
15. Num teste de digitao, o tempo em minutos (7) que os candidatos le
para digitar um texto modelado, de forma aproximada, pela seguinte fun
de probabilidade:

O tempo de durao em horas de uma lmpada especial foi modelado por uma
vlrivel aleatria X com a seguinte funo de probabilidade:

2(1.

xl5

pi
O candidato recebe 4 pontos se terminar a digitao em 9 minutos,

terminar em 8 minutos e assim por diante. Determine amdia e a varincia


nmero de pontos obtidos no teste.

16. A funo de probabilidade da varivel X


k :7,2,"',5.Calcule E(X) e E(X') e, usando
E[(X + 3)2] evar(3x - 2).

P(X:.

k)

: r/5

esses resultados, determi

17. Estatsticas obtidas junto s assistncias tcnicas indicam que a bomba


gua de uma certa lavadora s pode apresentar defeitos aps 4 anos de
Admita que nos prximos 6 meses, aps esse tempo, um mal funcioname
tem probabilidade 0,10 de ocorrer e, caso ocorra, ter 0,5 de probabilidade
ser recupervel. O reparo, que s pode ser feito uma vez, tem o preo de R$ I
enquanto uma bomba nova custa R$ 30. Determine a mdia e a varincia
gasto com essa pea em 4,5 anos de uso.

It. Os alunos do curso de estatstica tm um time de futebol que no


melhores. O cartola que administra o time paga um prmio de vitria
partida de um sorvete porjogador, acrescentando mais um sorvete por saldo
gols maior que I (saldo de gols a diferena entre gols feitos e sofri
Admita que a funo de probabilidade dos diversos saldos a seguinte:
Saldo de gols
Qu"rl a despesa mdia do cartola com cada jogador por partida? E corn os I
"c rilques" ?

seguintes

probabilidades, 0,5; 0,2 e O,3, respectivamente. Suponha que sejam vendidas a


l$ 100, R$ l0 ou R$50 conforme forem boas, defeituosas ou recuperveis,
rcspectivamente. Se duas peas, escolhidas ao acaso, so vendidas, qual o
vtlor mdio da venda?

l0,L 0,1

0,2

8910

0,4 0,1

0,1

(lacla lmpada custa ao fabricante R$ 10, mas se sua durao for inferior a 6
Iroras ele se compromete a indenizar o comprador com R$ 15. Qual deve ser o
prco de cada lmpada para o fabricante obter um lucro mdio por lmpada de
l.$ 20?

11. tlrna concessionria tem disponvel, para um certo automvel, os modelos S,


('1, c GL com duas verses de combustvel, lcool ou gasolina. Com motor a
rilcool os preos so 30, 35 e 40 mil reais para os modelos S, CL e GL,
rrspcctivamente. Esses preos so 107o superiores se o combu3tvel for
g,rrsolina. A procura por carros a lcool , de 307o e a gasolina 707o. Qualquer

tlnc seja o combustvel escolhido h igual preferncia entre os modelos.


('irlcule a funo de probabilidade do preo desse automvel e obtenha sua
Irrrlia e varincia.

,2, Nurn cassino, um jogador lana dois dados, cujas probabilidades

so

lrroporcionais aos valores das faces. Se sair soma 7, ganha R$50, se sair soma
I l, ganha R$ 100 e se sair soma 2, ganha R$ 200. Qualquer outro resultado ele
rriio garrha nada. Qual o ganho mdio do jogador?
l-1. I lrrra indstria pretende comprar 3 lotes de peas que so produzidas por dois
lrlrrcccdores, A e B. Ela inicia, comprando de um dos fornecedores escolhido
n(l ilciso e, se ficar satisfeita com o material entregue, compra o prximo lote
rhr nrcsmo fornecedor. Se no ficar satisfeita, troca o fornecedor. Admita que
lrirlir cacla lote o ndice de satisfao de 80Vo e de 707o para A e B,
rrspcctivamente. Calcule a mdia e a varincia do nmero de lotes fornecidos
por A.

Captulo 4: Medidas Resumo

122

24. A experincia de diversas companhias de resgate de navios naufragados indica


que a probabilidade de um resgate ser bem sucedido na primeira tentativa de
0,6; caindo para a metade a cada nova tentativa. Uma empresa de resgate tem

como norma no realizar mais de trs tentativas e cobra 50 mil reais para
iniciar os trabalhos e mais 10.000 x (k - 1) reais, com k sendo o nmero de
tentativas.
a. Qual o custo mdio dos servios dessa empresa?

b. Se um navio resgatado

pode render ao proprietrio 65 mil

interessante para ele contratar essa empresa? Justifique.

25. Suponha que a demanda por certa pea, numa loja de

4,4 lixerccios

t23

1. Qual a probabilidade da equipe completar 8 corridas? E de participar de

vcz. se o ganho acumulado da equipe (em milhares de reais) , 50c , sendo


rrrimero de corridas completadas por esse motor antes de quebrar, calcule:

[.

corridas?
Quanto receber em mdia essa equipe durante sua "vida" em corridas?

19. tlrn vendedor de cachorro quente trabalha na porta do Estdio do Morumbi


errr clias de jogo. Ele pode deixar preparado 5, 6 ou 7 dzias de sanduches que
(:lstam a ete R$ 5 adzia,. Sabe-se que a procura do cachorro quente (X), no
s!u ponto, uma varivel aleatria com a seguinte funo de probabilidade:

autopeas, siga o

seguinte modelo:

P(X:

k,):+, tt:r,2,J,4.

a. Encontre o valor de a.
b. Calcule a demanda esperada.
c. Qual a variabilidade da demanda?

26. Numa indstria farmacutica, uma mquina produz 100 cpsulas por minuto,
A mquina est regulada de modo que no mximo 5Vo das cpsulas n
contenham remdio e, assim, sejam consideradas defeituosas.
a. Se as cpsulas so acondicionadas em vidros com 20 unidades, qual
probabilidade de um vidro apresentar no mximo 2 cpsulas com defeito?
b. Qual o nmero esperado de cpsulas com defeito, por vidro?
c. Qual o nmero esperado de cpsulas com defeito por minuto de produo?

27. Um fotgrafo negocia com o jornal o seguinte trato: ele submete al


fotos semanalmente e por cada foto publicada, ganha R$ 50. Se a foto no
publicada, no ganha nada. Nesta semana 4 fotos so submetidas com
uma tendo probabilidade 0,60 de ser publicada, independentemente da demais,

probabilidade que o fotgrafo tenha pelo menos duas f,


publicadas esta semana?
b. Calcule a distribuio de probabilidade de Y: montante que o fot

a. Qual a

recebe esta semana;


c. Calcule o ganho mdio do fotgrafo nesta semana.

28. Admita que, em cada corrida de Frmula l, o motor tem 0,4 de probabi
de quebrar, independentemente das corridits anteriores. Suponha que a
encerrar sua participao no torneio quanclo o motor quebrar pcla pri

Sirbo-se que cada dzia de sanduche vendida a R$ 12 e os sanduches no


Vcrrrlidos vo para um canil que paga R$ 2 pela dzia. Qual o nmero de
eltiz,ias de sanduches que devem ser preparadas de modo a maximizar o lucro

nrrlio do vendedor?

floricultura vende rosas, cravos e jasmins com lucrO de, respectivamente,


R$ ltl, R$ 12 e R$ 15 por dezena. Observa-se que a procura igual para as trs
flolcs. Se o estoque do dia no for vendido, a floricultura tem um prejuzo
(lrrcro negativo) de, respectivamente, R$ 5, R$7 ou R$ 10 com cada'dezena de
fosils, cravos ou jasmins. Se a floricultura dispe de duas dezenas de cada flor
tr's clientes visitam a floricultura sucessivamente e compram uma dezena
nrlir um. Fazendo alguma suposio adicional que seja conveniente, determine
s lrrcro esperado da loja.
t.lrrra

t{t pita o problema anterior, se a procura por rosas e cravos forem iguais e
orrcsponderem ao dobro da procura porjasmins

jl, l,rrlir 1tn exame com 25 questes do tipo certo-errado, um estudante sabe

l'r,slroslr correta de 17 questes e responde as demais "chutando".


gQVo das respostas.
n. ('rrlcule a probabilidade dele acertar pelo menos
It. l)ctcrrnine a mdia e a varincia do nmero de acertos.
f. Srrpottlra que nesse mesmo exame, um outro estudante saiba a resposta
col'rolit para l5 questes e tenha probabilidade de acerto nas demais de 0,7.
(.)rrlrl clo.s estudantes voc espera que tenha melhor desempenho?
tl, Nirs lncsmas condies do item (c), qual dos estudantes ter desempenho

rrriris Irornogneo?

Captulo 4: Medidas Resumo

124

33. (Use o computador) Usando a Tabela 1.1 do Captulo 1:


a. Obtenha as medidas de posio e de variabilidade para o Peso e a Altura.
b. Compare, atravs de medidas de posio e de variabilidade, o peso e a altura
dos alunos das turmas A e B. Comente as diferenas em relao ao item (a).
c. Com respeito varivel TV, alunos e alunas tm o mesmo comportamento?
Justifique sua resposta com o uso de medidas resumo.

34. (Use o computador) Considere as observaes contidas no arquivo cancerlxt


(ver Exerccio 24, Captulo 1).

a. Obtenha as medidas de posio e de variabilidade para as variveis Idade e


Glicose (GL).
b. Repita o item (a) para cada tipo de diagnstico. Compare as respostas
obtidas.
35. (Use o computador) Com os dados do Exerccio 25, Captulo 1:

a. Para cada bloco, determine medidas de posio e de variabilidade pra a


rea total do apartamento e para a rea de cada cmodo. Voc diria que
existem diferenas nos apartamentos, dependendo do bloco?
b. Construa uma tabela de freqncia para a rea total dos apartamentos do
bloco I, utilizando faixas de valores convenientemente definidas. Suponha
que um apartamento escolhido ao acaso. Defina por X a varivel aleatria
rea total do apartamento selecionado. Baseando-se na tabela de
freqncia construda, qual o valor esperado de X? Como este valor se
compara com aquele observado no item (a) para a rea total? Porqu
deveriam ser iguais e se no so, qual arazo?

36. (Use o computador) As variveis desse exerccio fazem parte do arquivo


aeusp.txt (ver Exerccio 26, Captulo 1).

a. Obtenha as medidas de posio e de variabilidade para as variveis Itrab

Renda.

b. Repita o item (a) para cada uma das comunidades

estudadas. Existem

diferenas entre elas?

c. Utilizando os valores da varivel Serief, divida os moradores em trs


categorias: os que no pararam de estudar, aqueles que pararam at a 8
srie e os demais. Para cada uma das categorias, obtenha as medidas de
posio e a varincia da varivel Itrab.
d. Baseado nas variveis Sexo e Itrab, voc diria que os homens comeam a
trabalhar mais cedo?

Captulo 5

Variveis Bidimensionais
5.L Introduo

muito comum estarmos interessados no comportamento conjunto

de

viirias variveis. Neste captulo, vamos tratar de duas vriveis. Todavia, os


conceitos discutidos aqui podem ser, em geral, expandidos para situaes em que
lrs ou mais variveis so estudadas. Nesta primeira seo apresentamos, para
variveis em um conjunto de dados, a tabela de freqncia conjunta e, para o caso
tlc variveis aleatrias, a funo de probabilidade conjunta. A tabela de
l'cqncia conjunta tambm pode ser utilizada com variveis qualitativas,
conforme veremos nos exemplos. Nas sees subseqentes, estudamos a
russociao entre variveis e a obteno de funes de variveis aleatrias.
As informaes em um conjunto de dados, sejam elas referentes ao todo
ou parte de uma populao, quase sempre contm observaes multidimensionais,
isto , observaes relacionadas a vrias v4riveis. Por exemplo, num
rprestionrio aplicado a alunos de uma universidade, podemos obter a idade, o
llmanho da famlia e o nmero de disciplinas j cursadas, entre outras
tluantidades que podem ser de interesse para cada aluno. Considerando duas
variveis, digamos idade e tamanho da famlia, podemos listar todos os pares que
ocorrem. Como pode haver repetio de valores, os resultados podem ser
organizados em uma tabela, com os possveis pares associados s suas respectivas
'cqncias.

Ilxemplo 5.1.. Uma amostra de 20 alunos do primeiro ano de uma faculdade foi
cscolhida. Perguntou-se aos alunos se trabalhevam, varivel que foi representada
;ror X, e o nmero de vestibulares prestados, varivel representada por Y' Os
tlados obtidos esto na tabela abaixo.

nao

slm

nao

nao

nao

slm

slm

nao

slm

stm

t)

nao

nao

slm

no

slm

nao

nao

nao

slm

nao

.)

t25

I2()

Captulo

: Variveis Bidimensionais

varivel x qualitativa com dois valores: sim ou no. por outro lado, a
varivel Y quantitativa discreta com valores inteiros I,2 ou 3. Podemos coletar
as freqncias de ocorrncia dos possveis pares, construindo uma tabela de
freqncia conjunta de X eY.

Ilxcmplo 5.2: Um estudo envolveu 345 pacientes HfV positivos, acompanhados,


dttrante um ano, pelo setor de doenas infecciosas de um grande hospital pblico.
Os dados apresentados contm as ocorrncias relacionadas s variveis nmero de
itttt:rnaes (I) e nmero de crises com infeces oportunistas (C).

freqncia

(sim,1
(sim,2)
(sim,3)

1\c

B4

27

20

59

11

43

(no,

rJ

35

T4

28

12

l)irra obter as marginais dessas variveis, acrescentamos mais uma linha e uma
coluna na tabela anterior, contendo os respectivos totais de ocorrncia. Assim,

6
1

20

O par (no,1) tem freqncia de ocorrncia igual a 5, pois, na amostra coletada,


foi esse o nmero de alunos que no trabalhavam e prestaram o vestibular apenas
uma vez. Os outros valores so obtidos de forma semelhante. Esta mesma tabela
pode ser apresentada de modo mais conveniente atravs da tabela de dupla
entrada, mosfada a seguir.

1\c

q
O

total

B4

27

115

20

59

130

11

35
43

t4

2B

72

100

total

110

91

B6

44

L4

345

Cbnro j mencionamos, a ltima coluna da tabela acima fornece as freqncias


eorrcspondentes aos valores da varivel -I, enquanto que a ltima linha fornece as

x\v

.)

total

slm

nao

12

total

a)

20

l'ct1i.incias para C. Logo,

Note que a ltima linha e a ltima coluna contm os totais de ocorrncias de cada
varivel, separadamente. Dessa forma, fica facilitad a a tarefa de obter a tabela de
'eqtincia individual para cada "varivel que, pela posio em que seus valores
aparecem na tabela de dupla entrada, chamada de tabela marginal de
freqincia
du vuridvel x (ou Y), ou simplesmente marginal de x (ou y). Temos ento para
as seguintes tabelas de freqncia:

freqncia

freqncia

115

110

130

91

100

B6

total

345

44

I4

total

345

freqncia

freqncia

slm

nao

L2

20

total

127

(X,Y)

(no,2)
(no,3)
total

X eY

5.1 Introduo

t)

r)

total

20

Ii:ccrnplo 5.3.' Numa amostra de 195 empregados de uma grande indstria,


rrlrscrvou-se o Salrio recebido (em salrios mnimos) e o Tempo de Servio na
l')rrprcsa (em anos). Tendo em vista que a varivel Salrio quantitativa contnua,

lrrirrn escolhidas algumas faixas para represent-la. Por outro lado, apesar da
vrrt'irvel Tempo ser discreta, ela apresentou valores to diferentes que se achou
rrlris conveniente organiz-latambm em faixas. Assim,

l2t

Captulo

Salrio \Tempo

<4
4t--B

8-72
>12
total
Segue ento

que

: Variveis Bidimensionais

<5

5F10

36

21

63

16

2B

2T

12

77

74

10

35

72

20

5B

57

51

29

195

t--

10

15

>15

Note que, pela notao utilizada na Definio 5.1, o termo

total

freqncia

Tempo

<4

63

<5

4F8

77

t--

freqncia

10

58
57

8F12

35

10F15

>12

51

20

>15

29

total

195

total

195

tcsmo que com atraso.

tr

Defino 5.1: Funo de probablidade conjunta


Sejam X e Y duas variveis aleatrias discretas originrias do mesmo
fenmeno aleatrio, com valores atribudos apartir do mesmospao
amostral.

uno de probabilidade conjunta definida, para todos os possiveis pares


de
valores de (X, Y), da seguinte forma:

isto ,

p(r,A)

: P[(X: u) n (Y : ]:

representa a probabilidade

p(X : r,y : a),


de (X,y) ser igual a (r,A).

comum
nos referirmos, sempre que no houver ambiguidades e o contexto permitir,

ftno de probabilidade conjunta como distribuio conjunta ou simplesmente

t:otti unta das variveis.

espao amostral, associado ao atendimento da

encomenda, ficar sendo:

Pelos exemplos anteriores, podemos perceber que variveis de qualquer


natreza podem ter seu comportamento conjunto representado atravs
do tablas
de freqncia. Dessa forma, variveis qualitativas u quantitativas, discretas
ou
contnuas, tm seu comportamento estudado com tabels de dupla
entrada, para
dados oriundos de toda a populao ou de uma amostra. veremos
a seguir como
tratar essa questo no caso de variveis aleatrias discretas, definidas
a partir das
suas funes de probabilidade. Iniciamos estendendo a definio
de funo de
probabilidade para o caso de duas variveis.

p(r,a)

(X: r)

rcpresenta o conjunto de eventos que levam a varivel X a assumir o valor r. No


prximo exemplo, ilustramos esse ponto.
Ilxemplo 5.4: Uma empresa atende encomendas de supermercados dividindo os
pcclidos em duas partes de modo a serem atendidos, de forma independente, pelas
suas duas fbricas. Devido grande demanda, pode haver atraso no cronograma
rlc entrega, sendo que aftbrica I atrasa com probabilidade 0,1 e a II com 0,2.
Scjam A1 e All os eventos correspondentes a ocorrncia de atraso nas fbricas I e
ll, respectivamente. Vamos admitir que as encomendas sempre sero entregues,

as marginais so:

Salrio

5.1 Introduo

tr

{A1A1r, AArr, ArAr,

AAr}.

Pirra aliviar a notao, os eventos sero representados sem os respectivos


xubscritos mantendo, entretanto, a ordem das fbricas. Dessa forma, o evento
/" significa que a ftbrica I entregou sem atraso e afbrica II com atraso.
Suponha que para um certo pedido, a indstria recebe 200 unidades
tnonetrias (u.m.) pela encomenda total entregue, mas paga uma multa de 20 u.m.
pirra cada fbrica que atrasar sua parte. Considere que o supermercado, que fez a
cncomenda, criou um ndice relacionado pontualidade da entrega. Este ihdice,
trllibui 10 pontos pata cada parte da encomenda entregue dentro do cronograma
prcvisto. Vamos denotar por X o valor recebido pelo pedido eY o ndice obtido.
Para cada evento do espao amostral, podemos obter os valores das
virrirveis. Assim, se ocorre o evento AA', avarivel X tem valor 180, pois de
?(X) subtraimos a multa de 20, decorrente de um atraso. Por outro lado, a varivel
)' assinala 10 pontos provenientes de uma entrega dentro do cronograma. A

lirbcla

seguir, apresenta os eventos, as respectivas probabilidades

crrrrcspondentes valores de

X eY.

Eventos

Probabilidade

AA
AA'
A'A

0,1 X 012

160

0,1-x 0,&

180

10

0,9 X 012

180

10

200

20

A.

A.

0,9

0,8

Ap(rs coletarmos os pares idnticos, obtemos a conjunta das variveis:

os

Captulo 5 : Variveis Bidimensionais

130

(X,Y)

p(r,y)

(160, 0)

0,02
0,26
0,72

(180, 10)

(200,20)
Dessa forma,

r3I

5.1 Introduo

Note que pares idnticos foram agrupados

x\),

a distribuio conjunta de (X, Y)

contm todas as possveis


(r, g), com suas correspondentes probabilidades. tr

Da funo de probabilidade conjunta p(r,E) possvel obter as funes


X ou de Y, atravs da soma de uma db
coordenadas. Assim,

combinaes dos valores

de probabilidade marginal de

P(X

")

: t p(r,a) e P(Y :
u:D

a)

:\n@,

com a somatria percorrendo todos os valores possveis de

ou

Y, conforme

0
I

10

I
I

Considerando que escolhemos uma das sub-regies ao acaso, isto , cada subregio tm mesma probabilidade 1/10 de ser escolhida, podemos construir a
distribuio conjunta de (X,Y):

(X,Y)

probab.

(0,0)
(0,1)
(0,2)
(1,0)
(1,1)
(2,0)
(2,1
(2,2)

L/70
2/70

total

2lr0
r/10

r/rc
rlL0

rlrc
r/t0

respectivas

2110
0

As distribuies marginais tambm podem aparecer na tabela, bastando efetuar a


soma nas linhas para obter a marginal de X e, nas colunas, paa a marginal de Y.
Por exemplo, para calcular a probabilidade de X ser igual a zero, temos
0)

r225
:10-10-10:10

x\v

* P(X :0,Y :1) + P(X :0,Y :2)


X

Y, obtemos a tabela

rlt0

2170

2lr0

7/70

rl70

2/r0

r/L0

r/n

r/t0

3l70

3/L0

4lro

3lr0

P(Y

u)

a seguir:

P(X : r)
5lr0

tabela a seguir:

as

L/n rlL0 rl10

Iepetindo os clculos para outros valores de

Exemplo 5.5.' Uma regio foi subdividida em 10 sub-regies. Em cada uma delas,
foram observadas duas variveis: ntmero de poos artesianos (X) e nmero de
riachos ou rios presentes na sub-regio (y). Os resultados so apresentados na

somamos

r/rc 2lLj
L/n r/rc

P(X :0) : P(X :0,Y:

caso.

Sub-regio

probabilidades. Uma forma equivalente de apresentar a distribuio conjunta,


porm com maior apelo visual, atravs da tabela de dupla entrada.

Portanto, as funes de probabilidade marginais so as seguintes:

xl o 1 2 e Yl o 1
p I slro 4lro
n I slto 2lro sllo

slro
tr

Em muitas situaes h interesse em estudar o comportamento de uma


tal como soma, produto ou alguma outra relao entre elas.
Vamos nos restringir ao caso de variveis aleatrias, mas o tratamento similar
para conjunto de dados referentes populao ou amostra. Se conhecemos a
clistribuio conjunta de X e Y, o comportamento de outras variveis, tais como
X +Y, X2 + 5Y ou X Y, pode ser determinado como ilustramos a seguir.
'Lrno das variveis

Ilxemplo 5.6: Emuma cidade do Estado de So Paulo, admite-se que o nmero de


unos para completar o ensino fundamental (varivel F) e o nmero de anos para
cornpletar o ensino mdio (varivel M) t,m funo de probabilidade conjunta:

t32

Captulo

(F, M)
(8,3
(8,4
(8,5
(9,3)
(9,4
(9,5
(10,4

: Variveis Bidimensionais

p(.f ,m)

lxerccios da Seo 5.1:

3/L0

l. O setor de emergncia de um Pronto Socorro Infantil anotou o numero de


crianas atendidas (C), de mdicos (M) de auxiliares () de planto em 15

r/rc
r/70
2/r0
r/20
r/10
r/70
r/20

(10, 5)

"

clias de atividades. Os dados so apresentados na tabela abaixo.

F+M e FxM.

Acrescentando, tabela anterior, colunas correspondendo aos valores dessa novas


variveis temos

(8,3
(8,4)
(8,5)
(9,3)
9,4)
9,5)
(10,4)
(10,5

13)

P(F

t
J

5- 6

10

11

12

13

L4

15

a. Determine as tabelas de freqncia marginais de C, M e A.


b. Obtenha a tabela de freqncia conjunta entre (C, M), (C, A) e (M, A).
c. Represente a tabela de freqncia conjunta de M e A, atravs de uma tabela
de dupla entrada.

d. Calcule amdiadas variveis

M e A.

3/10
L/70
7/L0
2/L0
L/20

L2,

27

total

13

7/r0

110

235

t20

465

74

36
45

L/70

51

r22

178

351

L4

40

r/20

15

84

267

15

50

total

176

44r

L62
460

8,M

5)

11

24

L2

32
40

13

Para obter a funo de probabilidade de tr.


valores comuns. Por exemplo,

P(F + M

FxM

Dia
C

Suponha que exista interesse em estudar as variveis

(F,M) pU,m) F+M

5.1 Introduo

2.Paru famlias de um certo bairro de So Paulo, apresentamos abaixo a tabela de


f'reqncia conjunta das variveis: nmero de automveis (A) e de Ws (T).

\"

* M, somamos as probabilidades nos

* P(F : 9,M

.. 1
'1020

A\
-

n'

Procedendo de modo similar com os outros valores, obtemos as funes de


probabilidade de.F * M e de F x M:

?t'

3. Uma moeda equilibrada lanada 2 vezes de forma independente. Ao final dos


lanamentos, duas variveis aleatrias so anotadas: o nmero total de caras (C)
c o nmero de coroas no 2o. lanamento (K).
a. Construa uma tabela com os possveis eventos, as respectivas probabilidades
e os valores de

r+twl tt

L2 13 1.4 15
prob. | 3/10 3lL0 3120 2lI0 Il20 '
FxMl Z+ 27 32 36 40 45
prob. l B/10 2lL0

a. Calcule as marginais de A e T.
b. Determine as mdias dessas variveis.

L077

C e K.

b. Apresente a tabela de dupla entrada com a funo de probabilidade conjunta


das variveis aleatrias C e K.
c. Determine o valor esperado de C.
50
'

tr

4. Num estudo sobre o tratamento de crises asmticas, estabeleceu-se a seguinte


uno conjunta de probabilidades entre o nmero de crises de asma () e o
tti,mero de interniles hospitalares (H).

Captulo 5 : Variv eis Bidimensionais

134

\H

r/8

I/16

3/16
r/L6

L/8
3lL6

r/16

foi construda
(l), portugus (P) e matemtica (M):

3/L6

5. A funo conjunta de probabilidade entre as variveis


abaixo (com algumas entradas faltando):

-1

,14't

-2
-1

L/16

7/at

P(Y

y1

/64

,^

3/64
7/16
77/64
0 /'r .

Ll32

5/16

X eY

P(X

%6

\lt ("

Ji

1/6tt

L/64
7t32

5/76

3t64

r/4

Ar/H.

a prxima tabela com as notas de ingls

10

11

T2

13

L4

15

B^

10

t)

Aluno

4
F7

A tabela de freqncia conjunta de (.I, P) dada por:

apresentada

1\

tto

/n(^
1

7
8

: r)

5lL6

311

135

ingls. Para esses alunos,

a. Determine as funes de probabilidade marginal das var,{eis


b. Calcule o valor esperado dessas variveis.
c. Obtenha a funo de probabilidade da varivel A + H. '-/

x\v

5,2 Associao entre Variaveis

1
1

10

tlrn grfico contendo as informaes dessa tabela apresentado, a seguir, com

a. Complete a tabela.
b. Obtenha as marginais de X e Y.
c. Calcule afuno de probabilidade da varivel

10

X x Y.

5.2 Associao entre Variveis


Uma pergunta freqente de pesquisadores e usurios de Estatstica
sobre a associao entre uma ou mais variveis. Bucar explicar como se
comporta uma varivel em funo do desempenho de outras tm sido o objetivo
de vrios estudos que utilizam a Estatstica como ferramenta auxiliar. Nesta

,l

seo, comeamos a responder a essa questo. Uma resposta mais completa ser
dada na parte referente Inferncia Estatstica.
Com dados de duas variveis, em uma populao ou amostra, podemos

construir um grfico no plano cartesiano com a freqncia de ocorrncia dos


diversos pares de valores. Esse diagrama pode auxiliar a identificao de
tendncias de associao entre as variveis, conforme veremos no prximo
exemplo.

Exemplo 5.7: Dentre os alunos do 1o. ano do ensino mdio de uma certa escola,
selecionou-se os quinze alunos com melhor desempenho (nota acima de 7) em

as

l'oqncias ao lado de cada ponto. Note que h uma tendncia das notas altas em
irrgls, serem acompanhadas por notas altas em portugus.

Considere agora as variveis


scguinte:

I e M. A tabela de freqncia conjunta

IJ

Captulo

I\M

t
J

10

0
0

Variveis Bidimensionais

5,2 Associado entre Variaveis

Deftnio 5.2: Probabilidade condicional para variveis aleatrias discretas

Dadas duas variveis aleatrias discretas definidas no mesmo espao


urnostral, a probabilidade condicional de X : :L,dado que Y : a ocorreu, dada
pcla expresso:

P(X:rlY:g):
Caso P(Y

A)

:0,

rtrbitrariamente e adotaremos

P(X:r,Y:y)
P(Y

a)

, se

P(Y:

g) >

0.

probabilidade condicional pode ser


P(X : r lY : A) : P(X : r).

definida

Definio 5.3: Independncia de varidveis aleatras


Duas variveis aleatrias discretas so independentes, se a ocorrncia de
rlualquer valor de uma delas no altera a probabilidade de ocorrncia de valores
tla outra. Em termos matemticos,

P(X:rlY:y):
prra todos os possveis valores

(r,g)

P(X
das variveis

(X,Y).

Como definio

irlternativa e equivalente podemos usar que:

P(X : n,Y : A) : P(X : n) P(Y : A), para quaisquer (*,A).


8

10

Observe que o bom desempenho em ingls parece,


neste caso, no implicar num
bom desempenho em matemtica.

Apesar de ser um instrumento til para identificar


tendncias, os
difcit interprerao,
;;;;;.;",
exempro, se o
conjunto de dados tem muitas observes
"rigun.
pou.os valores diferentes,
freqncias sero altas atrapahndo "o
a visualizao de uma eventual
'lgumas
tcndncia' Dessa forma, importanie ampliar
o estudo da associao entre
variveis, para buscar.uma caracterizao que no
dependa s da interpretao
visual' com este objetivo, definimos piobabilidad"
e independncia
para variveis aleatrias, estendendo os conceitos
"ondi"ional
apresentados no captul o 2 para
cventos aleatrios. Aqui, o condicionamento, na
ocorrncia de um valor da
varivel
rliagramas rornam-se de

aleatria, equivalente ao condicionamento na ocorrncia


de um evento.

A verificao da equivalncia entre as duas expresses, acima, pode ser


lbita de modo anlogo ao realizado no Captulo 2. Deixamos ao leitor essa tarefa.
Note, ainda, que a definio de independncia exige que a igualdade seja
vcrdadeira para todas as escolhas dos pares (r,A). Assim, basta encontrarmos um
l)rr em que a igualdade no se verifique para concluirmos que as variveis
irleatrias no so independentes. A Figura 5.1 resume esses comentrios.

Figura

5.

: Indep endncin de variv eis aleatrias

Ilxemplo 5.8r O Centro Acadmico de uma faculdade de administrao fez um


lovantamento da remunerairo dos estrgios dos alunos, em salrios mnimos, com

/.ft

Captulo

: Variveis Bidimensionais

relao ao ano que esto cursando. As probabilidades de cada caso

so

apresentadas na prxima tabela, incluindo as distribuies marginais.

Salrio

\ Ano

2
.)

P(Ano:

y)

,)

2/25
2/25
7/25
5 /25

2/25
5/25
2/25
s/25

r/25

2/25
2/25
5/25

2/25
4/25

P(Sal. : z)
5/25
Lr/25
I /25

6125

Pclas informaes apresentadas, as variveis salrio e Ano de curso


no
inclcpendentes pois, por exemplo,

P[(Sal.

3)

n (Ano

: 4]:2lzs I p(Sat.:

B)p(Ano

4)

sil

: rr/r2s.

Unra maneira bem pr'tica de verificar independncia consiste em usar a


tabela de
clupla entrada, checando se o produto da ltima linha e ltima coluna (as
rnargirrais) reproduz o corpo da tabela. se a tabela contiver um zero no
seu corpo,
brsta verificar se uma das marginais correspondentes zero. caso nenhuma
marginal seja zero, conclumos imediatamente a no independncia, uma
vez que
o produto de dois nmeros no nulos nunca zero.
tr

A verificao da independncia, no caso de duas variveis em um


conjunto de dados, ser discutida com maior profundidade no captulo g que
trata
cle Testes de Hipteses. Entretanto, podemos utilizar as idias de
indepedncia
cle variveis aleatrias para estudar a relao de duas variveis observadas
numa
populao ou amostra. Uma das formas utilizadas construir a tabela
de dupla
cntrada com porcentagens em relao ao total de colunas ou linhas.
Ilxcntplo 5.9.' Em uma clnica mdica foram coletados dados em 150 pacientes,
relbrcntes ao ltimo ano. observou-se a ocorrncia de infeces urindris (J)
eo
ttttncru tle parceiros sexuais (,n/). Deseja-se verificar se essas variveis esto
russociadas. os dados so apresentados a seguir, com as respectivas
marginais.

u\r/

2 ou mais

total

Sim

t2

2L

47

BO

7
54

70
150

No

45

1B

total

57

39

Cottstruindo uma nova tabela com as porcentagens em relao ao total de coluna,


otrtcmos a proporo relativa da varivel (J em relao i cada subconjunto
de
valores de

N.

139

5.2 Associao entre Varives

u\r'r

2 ou mals

total

Sim

2r,lvo

53,8%io

No

7B,9Vo

46,2Vq

87,l%o
L3,}Vo

53,SVo

total

I00Vo

l0OVo

L00Vo

L00Vo

46,7Vo

(lgnsiderando os valores de [/ no conjunto total de dados, temos 53,3Vo de


rcspostas positivas e 46,7V0 de negativas. Caso no haja associao dessa varivel
eoln o nmero de parceiros, devemos esperar porcentagens similares em cada
virlor da varivel ,f, indicando que esses valores no interferem com as respostas
tlo [/. Assim, por exemplo, para ly' : 0 seria esperado ter, aproximadamente,
lil,3%o de respostas positivas, que a mesma ocorrncia verificada no total da
linha. Como se pode observar da tabela acima, as porcentagens so prximas
lpenas no caso l/: 1, sendo bem diferentes nos outros casos. Dessa forma, os
rludos sugerem que as variveis no so

independentes'

Continuando o estudo da associao entre variveis num conjunto de


tllctos, construmos, no prximo exemplo, uma tabela de dupla entrada contendo
rrs freqncias que seriam esperadas, caso houvesse independncia entre as
vlriveis. Precisamos decidir se as duas tabelas, a de freqncias observadas e a
tlc esperadas, esto suficientemente prximas uma da outra.
Ilxemplo 5.-f 0.. Apresentamos os dados relativos a uma amostra de 80 famlias, de
lun certo bairro, com as informaes sobre o nmero de pessoas que trabalham
nufamlia (") e o nmero de adolescentes entre 12 e 1B anos (A).

r\

4
4

.1

total

15

rJ

15

2t

27

I7

T7

B,

80

22

1B

total

A rnarginal deT e as freqncias de seus valores, restritas ao grupo - 0, sero


irpresentadas em seguida. Note que as freqncias de ocorrncia, restritas a cada
grr.rpo de valor de A, nada mais so do que as colunas da tabela de dupla entrada
rlo incio do exemplo.

t40

Captulo 5 : Variv eis Bidimensionais

freq.

/A:0

freq. observ.

15

2L
27

L7

total

80

total

15

i,i

freq. observ.

freq. esperada

2,87

3,94
5,06
3,19

total

15

15

De modo anlogo ao feito para o grupo

e eii

proximidade nas tabelas. No difcil perceber que isto significa valores


pe(luenos da medida Q2 e,no Captulo 8, desenvolveremos um critrio estatstico,
piri tomar a deciso de aceitar a independncia de duas variveis. Para este
excrnplo, vamos nos contentar em apresentar o clculo da medida Q2 que, pelo
tlr:rr valor, consideraremos uma indicao de no independncia:

Q,:

(5-2,81)2

2,81

:12.63.
+...+ (4-r,70)2
L,70
D

: 0, calculamos as freqncias

esperadas para todas as colunas da tabela de dupla entrada (valores aproximados):

7 \.4

total

2,Bl

3,19
4,46
5,74

15

2,r0

27

2,70

27

t
t)

3,94
5,06
3,19

3,37
4,73
6,08
3,83

1,50

4,13
5,77
7,42
4,67

3,61

I,70

17

total

15

22

1B

77

80

"11

repfesentando, respectivamente, as freqncias observadas e


csl)cradas na linha 'i e coluna j. A medida Q2 usa a diferena entre oi.j e ei.j
elcvada ao quadrado para evitar o cancelamento de termos positivos por
flL:gativos. A diviso pot ei.i objetiva padronizar a medida, relativizando o
tnrrranho da diferena encontrada. Como estamos tratando de observaes de
vrrrirveis, podem ocorrer flutuaes devido natureza aleata da amostragem e
rrrrcluiremos pela independncia entre essas variveis, se houver razoxel

Eonl o,;.i

7 mantivessem a mesma proporcionalidade encontrada na


ilmostra como um todo. Em outras palavras, as duas tabelas acima precisariam ser
parecidas quanto freqncia relativa. Acrescentamos, na tabela restrita ao grupo
A.:0, uma nova coluna com a freqncia esperada caso a independncia se
verifique. Essa coluna foi calculada multiplicando a freqncia relativa do valor
cle ? (em toda a amostra) pela freqncia do grupo. Por exemplo, a freqncia
esperada do valor T:7, no grupo dos :0, seria 21180 x 15:3,94. Note
que esta freqncia no precisa ser um nmero inteiro.

eube agora quantificar se essa tabela est ou no "muito" distante da tabela

Q':D4,

de cada valor de

141

ohscrvada. Uma medida usualmente calculada a seguinte:

Se houvesse independncia entre T e A, o comportamento da varivel ?


em cada grupo deveria ser o mesmo e, portanto, esperaramos que as freqnci

T\:0

5,2 Associao entre Variveis

No caso de dependncia linear e de variveis quantitativas, existe uma


prrtla medida que freqentemente utilizada e ser definida, a seguir, para um
corr.junto de dados brutos.

I)t1[ino 5.4: Correlao entre variveis num conjunto de dados brutos


Considere um conjunto de dados com n pares de valores para as variveis

por (ru,g),':I,2,...,fr.O coeficiente de correlao


entre as variveis e calculado da seguinte forma:
linear
rrrcrlc a dependncia

.\ c Y, representados

'n

Px,Y

D@o
i,:l

- r,,r,,)(ar. -

a,*,)

Captulo 5: Variveis

142

5.2 Associao entre Variveis

Scgue que r o6, : l-35, 63


currelao vem que:

ou, em uma forma mais conveniente para clculo,


n,

LrtAt.-TLIohsAobs

i:l

PX,Y:

143

oo,

38, 75. Utilizando a expresso de clculo da

43245-8x135,63x38,75

PX,Y:

lrrtanto, a correlao entre ndice pluviomtrico e produo positiva e bastante


titzovel. Desta forma, locais com maior intensidade de chuva tenderiam a ter

As expresses anteriores podem ser adaptadas para o caso em que


dados esto agrupados em uma tabela de freqncia. As expresses no
apresentadas aqui, mas acreditamos que podem ser obtidas sem dificuldade.
possvel verificar que o coeficiente de correlao sempre um n
entre -1 e 1. Um ponto a ser ressaltado, que muitas vezes causa confuso,
correlao igual a zero no indica independncia. Se a correlao zero, o
podemos dizer que no existe dependncia linear entre as variveis.
interpretao para os termos presentes no seu clculo ser dada mais adian
quando definiremos coeficiente de correlao para variveis aleatrias.
Exemplo 5.11: A quantidade de chuva um fator importante na produtivi
agrcola. Para medir esse efeito foram anotados, para 8 diferentes regi
produtoras de soja, o ndice pluviomtrico em milmetros (X) e a produo

,t'tt(.

produtividade.

tr

Vamos voltar nossa ateno agora paravariveis aleatrias discretas. Para


elc'inir medidas de dependncia entre elas, precisamos estudar, inicialmente, as
propriedades do valor esperado.
Sejam X e Y duas variveis aleatrias discretas com distribuio
conjunta p(r,y). As marginais de X e )z sero representadas, repectivamente, por

p(t:) e p(y).
Vamos determinar o valor esperado da varivel

E(x-+Y):

tIt"
r.u

:I

X +Y:

+p@,a)

D,p@, +L,\un@,u)

TU:E'!J

Tfutull>

r"ned'u,tt7-D

'

tttlior

"o-'o

-,1,

>

auxlio o"

rr-uofrn[ilf"

o,

10Bb

,D"?:

151533;

i:l

Dru:310,
t:12640;
i:L
i:t
D*oro:
i:l

43245.

: I"

(t

p@,a))+t,

(f

p(*,)

:trp@)+tap@)

88
8

rt'''UtA

rUUT

lca o uma

88

D"o:
i--L

| ,,\J-

X;U

E(x) + E(Y).

Notc que obtemos essa importante propriedade do valor esperado, sem necessitar

tlc rtcnhuma hiptese adicional sobre as variveis. Dessa forma, esse resultado
lcrn ampla aplicao e tambm vlido para mais de duas variveis.
Considere agora o produto XY. O valor esperado do produto ser o
pt'oduto dos valores esperados, sempre que as variveis forem independentes.
Para X eY variveis aleatrias discretas independentes, temos:

t44

Captulo 5 : Variveis

idimensionais

E(xY): tL"yp@,a)
r

: I D,*aP@)P@)
r lt

-$

Segue ento que

/t

o par de variveis f*,h

Exemplo 5.12.' No Exemplo 5.5,

vl o t

pi |

t
\ ,nf

com suas probabilidades.

(0,0)
(0,1)
(0,2)
(1,0
(1,1)
(2,0)
(2,

(2,2)

X+Y XY
0

0
0

2/r0
2/r0

L/n

1170

L/10

t
r)

S/10 e E(Y)

L'

+Y)

: ISlto: E(X) + E(Y):

B/10

1,

'

isto , o valor esperado da soma igual soma dos valores esperados.


Entretanto, para o produto temos
R

/10

ou seja, o valor esperado do produto de duas variveis no igual ao produto de


seus valores esperados. Note que, conforme j havamos mencionado, as variveis
aleatrias

X eY

no so independentes.

tr

Na Figura 5.2, apresentamos a expresso do valor esperado da sorra de


variveis aleatrias.

L/rc
r/70

3lt0

E(xY):7lLo+E(x)E(Y): * t,

Utilizando a tabela acima, a funo de probabilidade de X


obtidas sem dificuldade:

x+rl

E(X

p(r,a)

E(X)

3lt0 4lr0

Podemos agora verificar que


represenr

respectivamente, a quantidade de poos artesianos e de riachos em sub-regies


uma certa rea. A prxima tabela contm os valores das variveis X f Y e X

(X,Y)

p | 5/10 2/70 slto

'.*

: (T 'p@)) (Duna)
E(x) E(Y)

xl o

'!l

145

5.2 Associao entre Variveis

+Y

e a de

XY

Fgura 5.2: Valor esperado da soma de vuriveis aleatrias.


Para os valores esperados temos:

E(X+Y):18/ro

importante salientar a relao unidirecional de implicao entre a


e E(XY)

:7lto.

As distribuies marginais de X e Y j foram calculadas no Exemplo 5.5 e so


reapresentadas em seguida:

independncia e a fatorao da esperana do produto. O resultado vfido afirma


que a independncia de X e Y implica no valor esperado do produto XY set
igual ao produto do valor esperado de X pelo valor esperado de Y. Todavia, se o
valor esperado do produto de duas variveis o produto dos valores esperados,

Captulo 5: Variveis Bidimensionais

t4(,

niio necessariamente verdade que

so independentes.

Figura

resume esse comentrio, que ilustrado no prximo exemplo.

t47

5.2 Associao entre Variveis

c, desde que temos um par em que a probabilidade da conjunta no igual ao


;rroduto das probabilidades marginais, concluimos que as variveis aleatrias W e

no so

tr

independentes.

Se as variveis so dependentes, a relao entre elas pode ser de vrios


tiflcs e, no caso de ser linear, vamos definir uma medida dessa dependncia.

Definio 5,5: Covarncia de duas varidveis aleatrias


Uma medida de dependncia linear entre

Cov(X,Y)
Itigura 5.3: Valor esperado

do

produto e independnca de variveis aleatrias.

ox,Y

E[(X

X eY
LLx)

(Y

pela covarincia:

, dada

- P")]'

Iirn palavras, a covarincia o valor esperado do produto dos desvios de cada

tr

varivel em relao sua mdia.

Ixemplo 5.13.' Considere as variveis

WeZ

com a seguinte distribuio

conjunta:

W\Z

-1

2/72

r/L2

I/L2

2/12
3/12

P(Z :

3/L2

z)

L)

P(W

3/12
L/T2
2/12
6/12

clas variveis.

w)

5l12
2/12

Ilxemplo 5.14: As variveis U eV tm a seguinte distribuio conjunta:

5/r2

(u,v)

(2,2)

(3,4)

(3, B)

(4,6)

(5,4)

(5,8)

(6, 10)

P(u,u)

0,1

012

0,1

012

0,1

012

0,1

A varivel W Z tem funo de probabilidade dada por:

wzl-4
prob. |

-2

No prximo exemplo ilustramos o clculo da covarincia e, para auxiliar


ir interpretao de sua expresso, faremos uma representao grfica dos valores

l{epresentamos a seguir essa distribuio atravs de uma tabela de dupla entrada,


i ncluindo as marginais.

3lL2 2/L2 2/L2 7/72 2

Temos ento,

E(W Z)

(-4) x 3lL2+ .'. + 4 x 2lLz

-0.
Por outro lado, utilizando as distribuies marginais de

W e Z, podemoscalcular

Vale portanto a relao E(WZ):E(W)E(Z).Nesse caso, seriam


independentes? A resposta no, uma vez que, por exemplo,
2)

: 2lI2 + P(W : -L)P(Z -

0,1

t)

P(V

E(W) : (-1) x 5lI2 + 0 x 2lI2 * L x 5fL2 : 0 ;


E(Z) : 2 x 3lI2 + 3 x 3112 + 4 x 6lL2 : 391L2

: -I,Z -

seus valores esperados. Assim,

P(W

u\v

2)

WeZ

L5/L44,

u)

P(U

10

012

0,1
0,3

012

0,1
0

012

0
0

0,3

0,1
0

0,1

0,1

0,1

0,3

012

0,3

0,1

u)

012

Utilizando as probabilidades marginais, obtemos imediatamente que E(t/) : 4 e


Ii(V) :6. Nosso interesse verificar a existncia de uma relao linear entre U e
|/. No diagrama a seguir, apresentamos a funo de probabilidade conjunta das
cluas variveis.

148

Captulo 5: Variveis

5,2 A,r,vtciao entre Variveis

r49

os pontos localizados no 1" e 3" quadrantes tm suas coordenadas


com o
ffinnro sinal, Iogo o produto delas positivo. No 2" e 4o, o produto
e n"guii;o.

Sonr'ndo esses produtos, ponderados ielas respectivas probabilidades, temos:

tf

- n(u))x

(u

- E(v)) x p(u,u),

essc nmero inai"u' t"naon"iu de alinhamento no sentido dos quadrantes


mp'res ou pares, de acordo com o sinal positivo ou negativo, respectivamente.
A
r;trcsso acima nada mais do que a frmula da covarincia entre
x e y,
prcsentada aqui em uma forma mais detarhada do que na Definio
5.5.
calculos, obtemos Cov(U
ru.rirnoo os clculos,
Etbtuando
: 2, inOi"nao
Cov(U,V)
indicando u
rV) :2,
a tendncia das
varirveis moverem-se na mesma direo, isto , quando uma varivel
cresce na

Uru tambm cresce.

tr

A covarincia pode ser calculada mais facilmente pela seguinte


expresso

lternativa:

Fazemos agora uma translao de eixos para colocar a origem


respectivas mdias, isto , no ponto (4,6).Dessa forma, os pontos anteri
transformam-se em (u - 4,a - 6), com cada coordenada representando o desvi
em relao sua mdia.

: o*,, : E(Xl) - E(X) E(y).


bserve que' no caso em que xe y serem independentes, temos
cov(x,y) :
Cov(X,Y)

ut1il vez que

ffJl*'.for'
lllcilr.

0,

o valor esperado do produto se torna igual ao produto do, uIo.",


A partir da covarincia, definimos uma nova medid" d" d;;"d;;;

Derfinio 5.6: Correlao entre vatrveis aleatras

O coeficiente de correlao entre as variveis aleatrias discretas

r:irlculado pela seguinte expresso:

4'.,- :

X ey

Cov(X,Y)
OX OY

E
Pela definio acima, o coeficiente de correla
o o quociente entre a
crviuincia e o produto dos desvios-padro de x e )2. A diviso
pelo produto dos
rlcsvios-padro tem a funo de padronizar a medida
e torn-la possvel de ser
,tilizada para comparaes com outras variveis. No difcil
u"rifi.u, gue px,v
rrrrr nmero adimensional e limitado por 1, isto ,
<
lpx,vl 1. A interpretao de
suir cxpresso segue os mesmos passos da covarincia,
sendo que valores de
1t,y,y prximos de 1 indicam correlao forte.

t50

Captulo 5: Variveis

5,2 Associao entre Variaveis

151

Vamos, agora, deduzir a expresso da varincia da soma de duas vari


aleatrias. Desenvolvendo a partir da definio de varincia temos:

Var(X

+Y): E16 +Y) - (trt + t"y)l'


: El(x - px) + (Y - pt)l'
16 - px)z + (v - pv)2 + 2(x - px)(Y - p")l
E(x - px)2 + E(Y - ttv)2 +2El(X - px)(Y - p")].
E

Figura 5.4: Correlao para conjuntos de dados (brutos).

Ento,

Var(X +

y) :

Var(X) + Var(Y)

Cov(X,Y)

que, se rcdtzir soma das varincias, no caso de independncia entre

X eY.

Exemplo 5.15.' Nos Exemplos 5 .5 e 5 .I2, o par de variveis (X ,Y) representa


respectivamente, o nmero de poos e de riachos em sub-regies de uma

Figura 5.5: Covarincia

6trea.

J calculamos .E(X

cov(x,Y)

Y)

E(xY)

ltO, E(X) :8/10

E(Y)

1, portanto,

- E(x) E(Y) :+t0- *10t t :

Usando as distribuies marginais, podemos obter


Para avarincia de X i Y temos

Var(X

+n:
''100 2 #
"

2x :76/100
ozr:

+2(-#) :

e correlao de varidveis aleatrias.

-*.
10
:
:60/1

e o2u

116
100

Figura 5.6: Varincia da soma de duas variveis aleatrins.

O coeficiente de correlao ser

Cov(X,Y)
ox oY

-Llt0

ffi@

-0,15.

Vamos encerrar essa seo, aplicando as propriedades do valor esperado e


rlu varincia na obteno dessas quantidades para o modelo Binomial.
Il"rctnplo 5.1.' Considere uma sequncia de variveis aleatrias independentes
Bernoulli de parmetro p. Como se comporta a soma de n dessas
virliiiveis?

eorrr distribuio

Nas figuras a seguir, resumimos algumas frmulas dessa seo.

Representemos por Xr, Xz, .. ., X,,, a sequncia de variveis de Bernoulli.


lisirrnos interessados em X : Xr t Xz * '.' * Xn, e, pela definio do modelo
Ilirrornial, j sabemos que X - b(n,p).
Lembrando que E(Xa) : p e Var(X6) : p(l - p) para 'i:1,2,..., D,

virrros calcular

mdia

ea

varincia de

X,

utilizando as propriedades

Captulo 5 : Varidv eis Bidimensionais

t52

5.2 Associao entre Variveis

t53

apresentadas anteriormente. Temos,

r\c

E(X):E(Xt+Xz.-"'+X,)

:
:

E(xt) + E(x2) + ... + E(x")


p+ p+...+ p

np.

3.

H
M

(M)

10

11

C'

'c

b.

b
c

b
c

l2
a,

aos funcionrios de um pequeno escritrio;


busca relacionar as variveis: anos de estudo (X) nmero de diftrentes
"
empregos nos ltimos 5 anos (y). O que voc pode dizer com os dados
fornecidos?

3.

10

11

l2

10
38

T2

16

31

Uma amostra de 220 clientes de uma clnica dentria foi selecionada' As


variveis tempo, em anos, decorridos desde a ltima visita ao dentista (V) eo
nmero de cries encontradas (C) apresentado na prxima tabela'

eY

x\y

-2

-1

0,1

0,2

012

012

0,1
0,1

0,1

a. Obtenha as funes de probabilidade marginais das variveis.


X e Y so independentes?
c. Calcule a covarincia e a correlao entre X eY.

I existem duas bolas numeradas 0 e 1, enquanto que a caixa II contm


duas bolas numeradas 1 e 0. Uma bola retirada aleatoriamente de cada
caixa, de forma independente uma da outra. A esse experimento, associamos as
variveis aleatrias: nmero da bola retirada na caixa I (X), soma dos valores
das duas bolas retiradas (Y) e a difurena, em mdulo, desses valores (Z).
a. Determine a funo de probabilidade conjunta entre X eY e entre Y e Z.
b. Verifique se X e Y so independentes. Idem paraY e Z.
c. Calcule a covarincia entre X eY.
d. Obtenha Var(X +Y).

5. Na caixa

2. rJm levantamento obtido, junto

16

45

b.

a. Construa as tabelas de freqncia conjunta para H e M e para H e F.


b. Calcule a proporo de alunos com em fsica, dentre os com pelo menos c
em matemtica.

1B

34

apresentada na prxima tabela.

tl

1. Na tabela a seguir encontram-se os conceitos de histria (H), matemtica


efsica (F ) de alguns alunos do 3o. ano do ensino mdio de uma escola.

4. A funo de probabilidade conjunta entre as variveis aleatrias

Exerccios da Seo 5.2:

Aluno

a. Obtenha as tabelas marginais de freqncia.


b. Construa a tabela de freqncias esperadas, caso houvesse independncia
entre as variveis.
c. Determine o ndice Q2.

: Var(Xr t Xz + "' 1 X,,)


: Var(Xt) * var(X2) + ... + var(X")
: p(l - p) + p(I - p) + ... + p(L - p)
: np(I- p).

Esses resultados coincidem com aqueles apresentados no Captulo

2
J

Para obter a varincia, usaremos a independncia dos X;,r:

Var(X)

6.

A varivel X ,Bernoulli com p : 0,4 eY


Admita que X e Y so independentes.
a. Determine P(X :\lY :2).

Binomial com p

0,5 e n

b. Obtenha a funo de probabilidade conjunta de X e Y e do produto XY.


c. Calcule E(X),8(Y) e E(XY) e verifique que: E(X) x E(Y) : E(XY).
d. Determine o valor de Cov(X,Y) e de py,y.

3.

Captulo 5 : Variv eis Bidimensionais

t54

5.3 Exerccios

155

5.3 Exerccios
1.

tabela a seguir apresenta os valores observados em uma amostra de 130


empregados do ramo do comrcio.
Sexo \ Fumante

Masculino
Feminino

Sim

18

25

63

a. Construa as tabelas marginais de freqncia para as variveis Sexo

Fumante.
b. Se usssemos a amostra para tirar uma concluso sobre toda populao,
voc diria que, proporcionalmente, mais homens fumam do que mulheres?
c. Calcule o ndice de associao Q2 entre as variveis.
,,

freq.

(0,0)

L2

(0,

25

(0,2)
(1,1)
(2,1
(3,1
(3,2)

No

24

(F,C)

t4
57
40
45

(4,r

27

(4,2)

22

5. Os dados a seguir referem-se a uma amostra de


incio do curso, seu peso e idade.

5 alunos que informaram, no

Em uma amostra de 8 funcionrios de uma empresa, observou-se duas


variveis: anos de empresa (A) e nmero de promoes recebidas (P). Com

Aluno

Peso

7L

65

70

57

66

os resultados apresentados a seguir voc diria que, para essa empresa, essas
variveis esto associadas?

Idade

L7

L7

18

17

19

A
P

B
t
J

3. Est sendo estudado o efeito do teor de ferro na capacidade ile car p de vigas
de concreto. Os dados abaixo apresentam os resultados de medidas btidas em

5,4
2rL

6,8

,)

6,9

2r9

7,3
2r9

7,7
3,0

8,1
3,1

8,2
3,1

4. A tabela de freqncia conjunta entre nmero de filhos

8,5
3,1

(f')

8,6
314

Tempo (min.)

3,5

Temperatura

nmero de

cusamentos
ur certa empresa.

a. Determine as tabelas de freqncia marginais, correspondentes a cada uma


das variveis, isoladamente, e calcule as mdias de F e C.
b. Construa um grfico com a distribuio de freqncia das variveis. Voc

c.

concluso?

coeficiente de correlao entre F e C. Note que ser


necessrio adaptar a expresso apresentada na Definio 5.4.
Determine

anos.

r. Para cinco volumes de uma mesma soluo foram medidos os tempos


aquecimento, em um mesmo bico de gs, e as respectivas temperaturas

8,9

"
oficiais (C) apresentada, a seguir, para os 250 funcionrios
de

chega a alguma

l7

de
de

ebulio:

uma amostra. Obtenha a correlao entre as variveis.


Ferro (7o peso)
Carga (ton./m2)

a. Encontre a mdia e o desvio padro do peso dos alunos c"om


b. Construa o diagrama de Peso por ldade.
c. Obtenha o coeficiente de correlao entre peso e idade.

('C)

20

22

19

23

17

75

BO

75

82

78

a. Obtenha o grfico do Tempo pela Temperatura e calcule a correlao.


b. Voc acha que existe associao entre as variveis?
7. Alguns cientistas sociais acreditam que a opinio sobre o aborto independe da
situao familiar. O que voc diria, aps estudar a amostra?

Situao \ Opinio

Favorveis

Contrrios

Casados

56

2:4

Solteiros
Divorciados

15

25

24

16

Vivos

13

27

t56

8.

Captulo 5 : Variveis Bidimensionais

5.3 Exerccios

A tabela a seguir consiste de 16 valores de trs variveis observadas em alunos


do curso de cincias sociaisr sexo (S), nota de estatstica (E) nota de
"
antropologio (A).

r)

iJ

r)

e)

a. construa a

tabela de dupla entrada para as notas de estatstica

9. Num certo distrito de sade, o comportamento conjunto dos

Pac. No.

s
F

t)

Pac. No.

I4

15

t6

er

antropologia.
b. Repita o item (a), considerando apenas os homens.
c. calcule, para os alunos do sexo masculino, o coeficiente de correlao entre
as notas de estatstica e de antropologia.
d. Com o uso da tabela obtida em (a), calcule a porcentagem de cada
freqncia conjunta em relao ao total de alunos.
de

sarampo (S) e difteria (D) foi o seguinte:

r57

,9

,f
t
d

a)

t
d

L)

t
L)

18
a)

10

ll

12

I3

23

24

r)

t9

20

2I

22

()

!)

t)

,)

a. Construa a tabela de dupla entrada com as variveis C e S.


b. Estude a associao entre as variveis C e S, atravs das porcentagens em
relao ao total de coluna.
c. Repita os itens (a) e (b) para C e F.
d. Repita os itens (a) e (b) para S e F.

departamento de vendas de certa companhia ofereceu um curso de


atualizao a seus funcionrios e, para estudar a eficcia do curso, resolveu
comparar a noto de teste no curso (7) com o volume de vendas, em rhilhares
de unidades, nos seis meses seguintes ao curso (V). Os resultados esto na

11.

tabela abaixo.

t6

I7

18

t9

20

2t

22

23

24

25

26

27

28

29

30

t
.)

i)

t
()

a. Obtenha a tabela de dupla entrada.


b. Calcule a porcentagem de cada ocorrncia conjunta em relao ao total de
casos.

c. Repita o item (b), fazendo a porcentagem em relao ao total de colunas.

d. Que concluso

se pode tirar da relao entre a incidncia de sarampo e

difteria?
10. As informaes da tabela a seguir foram coletadas de 24 pacientes da rea de
cardiologia de um grande hospital pblico. A varivel C indica o nmero de

intervenes cirrgicas sofridas pelo paciente, ,9 representa o nmero de


pontes safena colocadas pelo paciente em uma ou mais cirurgias e a varivel F
indica o nmero de.familiares prximos com problemas cardacos.

,1,

.J

q
d

74

13

T2

13

10

I2

11

11

10

T2

10

13

10

T2

11

a. A varivel ? serve para explicar a varivel


b. Calcule a correlao entre as variveis.

I/? Justifique.

12. Um total de 1000 passageiros de vos domsticos foram entrevistados no


Aeroporto de Guarulhos. Duas variveis foram observadas: nmero de viagens
mensais (V) nmero de automveis na famlia (). O resultado est na
prxima tabela"que, por descuido, est incompleta.

V\A
1

/0

150
/t0

total

300

r)

total

BO

60

-zt)O

:.{.,t

L20

450

,l4a

300

200

'i i .. ),

Captulo 5 : Variveis Bidimensionais

/51J

5.3 Exerccios

A funo de probabilidade conjunta das variveis


tabela de dupla entrada.

16.

!
a. Complete a tabela.
b. Calcule as porcentagens em relao ao total de coluna.
c. As variveis so independentes? Justifique.

x\y

13. A tabela de freqncia apresentada em seguida est incompleta e contm


observaes das variveis: vida til do equipamento (t/)
garantia do
"
fabricante (G), ambas medidas em anos.

U\G

t)

10

t2

total

'.,

1t

X eY

so independentes.
d. Calcule o coeficiente de correlao entre

15. Considere a funo conjunta:


0

t/78

rls
I/I8

rl6

a. Calcule

7/9
L/6

r/6

P(l < X 12,y > 1) e P(X:

b. Determine E(X), E(Y) e Cov(X,Y).


c. X e Y so independentes? Justifique.

1,

U9
r/18

1/8

r/8

1/8
L/8

1/B

I/B

L/8

eT.rJmabola sorteada ao
devolvida caixa. uma segunda bola
"
escolhida, tambm ao acaso, e seu nmero
denotado por X2.
a. Determine a conjunta de X1e X2.
b. Calcule as marginais de X1 e X2. Elas so independentes?
c. Encontre o valor esperado e a varincia de X1, X2 eX : e+t.

igual a 0 se a

(xr)

18. Uma moeda equilibrada lanada trs vezes e so definidas as variveis


aleatrias: nmero de caras nos dois primeiros resultados (x), nmero de
caras no ltimo lanamento (Y) e nmero total de caras (S).
a. Construa a tabela conjunta de (X,Y).
b. Verifique se X e Y so independentes. '
,
c. Calcule E(X), E(Y) e Cov(X,Y).
d. Expresse ,5 em funo de X e Y e determine E(.9) e Var(S).
19. considere a frase: "Para mais sade pratique mais esporte,,. Escolha ao acaso
uma palavra dessa frase e considere as variveis aleatrias nmero de vogais

(V) e nmero de consoantes (C).


a. Determine a conjunta deV e C.
b. Obtenha as funes de probabilidade marginais.
c. Calcule os valores esperados dessas variveis.
d. As variveis so independentes? Justifique.
e. se a escolha acima resultou em v : 2,, qual a probabilidade da palavra
"mais" ter sido a escolhida.

X eY.

x\v

-1

acaso, seu nmero anotado

L4. Para o lanamento de dois dados equilibrados, defina duas variveis

eY

17. Numa caixa existem 4 bolas numeradas 3, 5, 5

a. Complete tabe
Construa o grfico de [/ por G e verifique se h associao entre as
variveis.
c. Calcule a vida til mdia para cada subgrupo de valor da garantia. Comente
os resultados.

aleatrias. Seja X o nmero de vezes que aparece aface 2


soma for par e 1, caso contrrio.
a. Determine a funo de probabilidade conjunta de X eY.
b. Calcule E(X), E(Y) e E(X +Y).

dadapela seguinte

10\
<,O

x ey

a. Verifique se E(XY)
E(X)E(Y).
b. X e Y so independentes? Comente.

+4.
4

-1

I/B

total

b.

c. Verifique se

t59

1).

A tabela a seguir representa a funo de probabilidade conjunta de duas


variveis aleatrias independentes.

20.

160

Captulo

x\

),
-1

P(X

P(Y

: r)

r/5

y1

:,Y';E(Y) "

3/5

L/5

25.

variveis que representam, respectivamente, o nmero de


/ezes em que o 2 e o
{

b. calcule a covarincia e o coeficiente de correlao entre as variveis.


22. As variveis F e M representam, respectivamente, o nmero de anos para
compltar o ensino fundamental e o ensino mdio. Numa certa cidade , a tabela
a seguir adotada pafa a funo de probabilidade conjunta dessas variveis.
Determine o valor esperado e a varincia da varivel F + M que representa o
total de anos at completar o ensino mdio.
3

e 160

/60
3/60

/60
5/60
3/60

r/60

I /60
7 /60

10

4160

3/60
2/60

23. Sejam X -b(5;0,5) e Y -b(3;0,2) independentes. Determine o valor


esperado e a varincia da

varivel2X

BY.

24. A rabela a seguir representa a funo de probabilidade conjunta entre o


nmero de empregos desde que comeou a trabalhar (E) e a idade do primeiro
enlprego (1), de jovens em uma pequena cidade do Estado de so paulo.

E\r
b
6
I

13

14

15

16

0,02
0,07
0,10
0,10

0,02
0,09
0,08
0,06

0,02
0,L2
0,03
0,04

0,03
0,13
0,05
0,04

X eY.

conjunta das variveis aleatrias independentes

x\v

F\M

18.

' parcialmente

apresentada a seguir:

3 aparecem na decomposio.
a. Obtenha a conjunta entre D e T.

X :1-

b.IdemparaY:E-l.tp.

21. sorteia-se ao acaso um dentre os nmeros g, 12, e zz e feita a


decomposio do nmero sorteado em fatores primos.
$ejam D e T, as

r61

c. Obtenha a conjunta entre

cov(x'Y)

\.. lxerccios

a. Determine o valor esperado e a varinciadavarivel

L/6

a. Complete a tabela.

i:3i,iil'l

: Variveis Bidimensionais

2/6
3/6

0
1

-2

P(X

: r)

0,3

0r7

P(Y

u)

0,3

012

a. Complete a tabela.

b. Calcule o valor esperado e a varincia de 2X

Y.

26. Sendo Xr,Xz e X3 variveis aleatrias independentes, seguindo o modelo


Bernoulli de parmetro p, pergunta-se:
a. Qual a funo de probabilidade de Xt t Xz * Xs? Voc reconhece essa
varivel?
b. Qual o valor aeVar($h)t

X e Y so independentes e assumem, respectivamente, os valores


7,2 e 3 e-0, I e2. Admita conhecidas as probabilidades P(Y:0):1/3,
P(X :3) : Ll3, P(X : L,Y :0) : 1/9 e P(X :3,Y :2) : Llq,
a. Construa atabela de dupla entrada para X eY.
b. Calcule E(X x Y) e Var(X + Y).

27. Sabe-se que

28. Um paleontlogo acredita que o nmero de minerais presentes em certo tipo


de rocha pode influir na chance de se encontrar fsseis perto de uma indstria
calcria. Atravs de amostras de rocha obtidas em levantamentos de campo, elc

obteve

presentes

distribuio conjunta para as variveis Z:nmero de minerctis


varivel que assume 1, se for observada a presena de fssil e 0

eW:

caso contrrio.

w\z
a. Calcule

P(W

r)

r/8

r/8

r/4

L/8

L/4

1/B

:0, Z > L).

b. Encontre as distribuies marginais para Z e W


c. Qual a esperana de Z?

I ()2

Captulo 5 : Variveis Bidimensionais

d. A

suspeita do paleontlogo confirmada pelos valores apresentados na

tabela? Justifique sua resposta quantitativamente.

29. Sejam (J

X eY

:Y2 eV : X +Y, com a funo de probabilidade


-1
1

L/12
7/6

Ll6
7/4

r/3

a. Obtenha a conjunta de U e V.
b. Calcule P(U
L).
c. Determine Cov(U,V).

: 4lV :

somente os valores ay, a2 e oJ, enquanto

P(A:
P(A :

"
os valore

a/l,aoota
sl6

que

assume
e b2. Sabemos que:

:0,2; P(A - or) : 0,,5 ; P(B: br) :


a1,B :bt) : 0,,L2 e P(B : bz I A : as):
ot)

a.S: X+Y.
b.D:X-Y.

32. Baseando-se nas projees de preo de duas matrias primas, M1 e M2,


pretende-se estudar a viabilidade econmica do lanamento de um certo
produto. A funo conjunta de probabilidade com os preos (em reais)
apresentada a seguir.

13

0,1
0,1

I
r)

0,2

012

012

012

a. Determine o preo mdio e a varincia das matrias primas.


b. O produto usa 2 unidades de M1e 3 de M2. Qual seu custo mdio?

eY

34. Considere duas variveis aleatrias independentes U-Po(2) e V-G(0,3). A


partir dessas variveis definimos outras duas da seguinte forma:

seU:0;

-_0l1 sel/)1:
\-

0,b,

31. sejam x e Y independentes com funo de probabilidade G(0,5). Determine


o valor esperado e a varincia de:

Mz

A caixa I

contm uma bola vermelha e uma azul, enquanto que a caixa II


contm duas vermelhas e uma azul. Um experimento consiste em escolher uma
bola ao acaso da caixa I e passar para a caixa II e, em seguida, escolher uma
bola da II e passar paraa I. Sejam X eY os nmeros de bolas vermelhas nas

33.

0,6;

a. Construa a tabela de dupla entrada entre A e B.


b. As variveis so independentes? Justifique.
c. Calcule P(A: or l B: br).

Mt\

c. Se o produto dever ser vendido poi 50 reais, qual ser o lucro mdio por

caixas Ie II, respectivamente.


a. Calcule a conjunta de X e Y. Elas so independentes?
b. Comente o que ocorre com a varivel X +Y.
c. Determine a mdia e a varincia para cada uma das varivel

30. considere duas ua.iveis aleatrias discretas ,1,

163

unidade?

conjuntaentre

dada na tabeia a seguir:

x\v

.\.-l Exerccios

e Y:
{'

seI/:0;
seI/:1;
seV ) 2.

a. Construa a conjunta de X e Y e determine Cov(X,Y).


b. Determine o valor esperado e a varincia de 2X - 3Y .

35. Duas moedas so lanadas simultaneamente. Uma delas equilibrada e a


outra tem probabilidade 213 de sair face cara. Considere as variveis U: total
de caras observadas eV uma Bernoulli que assume valor I se as duas faces
so iguais.
a. Determine a conjunta de U e V e verifique se so independentes.
b. Calcule a mdia e a varincia de 2U - V .

36. (Use o computador) Com os dados das variveis altura e peso da Tabela 1.1
do Captulo l:
a. Verifique o grau de associao atravs do clculo do coeficiente de
correlao.

b. Obtenha a mdia e o desvio padro para cada uma das variveis.

c.

Calcule

coeficiente de correlao entre as variveis peso

altura

padronizadas. Os valores da varivel padronizada so obtidos subtraindo-se


a mdia e dividindo-se pelo correspondente desvio padro. Compare com o
resultado encontrado no item (a).

o computador) Considere os dados apresentados no Exerccio 23 do


Captulo 1, onde, no item (b) foi definida a varivel Etrio.

.17. (Use

I.1

Captulo 5 : Variveis Bidimensionais

n. crie uma tabela de dupla entracla, contendo Etrio nas linhas e Coag nas
colunas. Com base em tal tabela, reavalie se a presena de cogulos

diferente dependendo da faixa etria.


b. Suponha que um paciente escolhido ao acaso.
Qual a probabilidade de que
a pessoa apresentasse cogulos no momento de admissol E uma pessoa
de
faixa etria mais alta?
c. Voc diria que Coag e Etrio so independentes? por qu?
38. (Use o computador) Novamente com os dados do Exerccio 23 do Captulo

Captulo 6

Variveis Aleatrias Contnuas


(r.1

1.

considere agotaavarivelCuracriadanoitem(c).
\
a. Crie uma tabela de dupla entrada com Cura nas linhas e Tratjm nas colunas.
b. com base na tabela do item (a), voc diria que neste caso,/rapidezda cura
depende do tipo de tratamento considerado? Justifique.
/
c. Qual a probabilidade de que uma pessoa selecionada o u"uro tenha cura
rpida, dado que recebeu tratamento do tipo I ?
d. Qual a probabilidade de uma pessoa ter recebido tratamento do tipo I, dado
que teve cura normal?

39. (use o computador) Responda os itens a seguir, baseado nos dados de


incidncia de cncer apresentados no Exercc io 24, captulo l.
a. utilizando a mediana da varivel GL, classifique os pacientes em dois
grupos, de alta e de baixa taxa de glicose. Denote essa nova varivel por
Clagl e construa uma tabela de dupla entrada entre Clagl e ALB. Voc diria
que as duas variveis esto relacionadas de alguma forma?
b. considere os valores da varivel Idade em trs grupos: jovem com at,25
anos (inclusive), meia idade para indivduos com idades entre 25 e 55 anos
(inclusive) e senior para maiores de 55 anos. construa uma tabela de dupla
entrada para estudar o comportamento desses grupos em relao
concentrao de fosfato, tirando as concluses pertinentes.
c. Escolhendo-se um paciente ao acaso, qual a probabilidade de que ele seja do
grupo .falso-negativo, dado que tem mais de 50 anos? E ter acima
de 50
irnos, dado que no do grupo falso-negativo?

40. (use o computador) utilize as informaes do arquivo aeusp.txt, introduzido


no Exerccio 26 do Captulo 1.
a. crie uma tabela de dupla entrada com as variveis comun e Renda. Voc
diria que existe associao entre elas?
b. Repita o item (a) para as variveis Reproce e Trab.
c. O que pode ser dito da associao entre nmero de residentes (varivel
Resid) e idade que comeou a traballrar (varirvel Itrab),?

Introduo

Neste captulo, discutiremos a Vracteriz4o de variveis cujos possveis


valores ocorrem aleatoriamente e pertencem a um intervalo dos nmerd's reais:
virriveis aleatrias contnuas. Renda, salrio, tempo de uso de um equipamento,
comprimento de uma pea e rea atingida por certa praga agreola so exemplos
dc quantidades que podem ser modeladas por variveis aleatrias contnuas. De
lrrma semelhante quela desenvolvida. para variveis aleatrias discretas,
prccisamos estabelecer, para as contnuas, a atribuio de probabilidades s suas

cliversas realizaes que, neste caso, podem assumir um nmero


vtlores diferentes. Abordamos esta questo no prgximo exemplo.

infinito

de

Iixemplo .1.' Estudos anteriores revelam a existncia de um grande lenol de


gua no subsolo de uma regio. No entanto, sua profundidade ainda no foi
tlcterminada, sabendo-se apenas que o lenol pode estar situado em qualquer
ponto entre 20 e 100 metros.

Vamos supor que escolhemos, ao acaso, um ponto nessa regio e


tlispomos de uma sonda que, ao fazer a perfurao, detecta com preciso a
lrlofundidade do reservatrio de gua. Denotamos por X a varivel alearia
rcpresentand o a p rofundidade.
Notemos que, apesar de X poder ser qualquer nmero entre 20 e 100
nctros, o instrumento, com que trabalhamos, pode no ser to preciso como
liostaramos. Por exemplo, uma profundidade de 32,571 metros poderia ser
rrrcdida por 32,6 metros. Vamos assumir, entretanto, que temos um instrumento
itlcal que no faz aproximaes. Nessas condies, podemos supor a sonda
;rcoplada a um instrumento indicador da profundidade e um dispositivo que,
tlrrnndo a sonda encontrar gua, provoque a imediata interrupo da perfurao.
Uma vez que no temos informaes adicionais a respeito da
lrronndidade do lenol, razovel assumirmos que a sonda pode parar em
rprnlquer ponto entre 20 e 100 metros, sem que tenhamos motivos para privilegiar
cssn oll aquela profundidade. Assim, consideraremos todos os pontos como
igrralmcnte provveis. Se utilizarmos a mesma idia de atribuir a cada possvel

l6(t

Captulo 6: Variveis Aleatrias

ponto uma probabilidade, teremos uma dificuldade extra, pois eles pertencem
intervalo [20, 100], em que existem infinitos nmeros reais. Assim, se cada

cleles tiver, individualmente, probabilidade maior que zero, a soma


probabilidades ser igual a infinito e no 1, como requer a definio da funo
probabilidade. Em geral, em situaes como esta, no de intEresse conside
um nico valor para a vari..vel aleatria, mas intervalos de valores na atribui
dc probabilidades. Neste caso, sabemos que o espao amostral corresponde
intervalo [20, 100] e as profundidades so igualmente provveis. suponh, por
nomento, que dividimos o espao amostral em 8 intervalos de comorimento 1
Logo, razovel atribuir aos intervalos a probabilidade l/g,
us, corre$ondend,
corres\ondendo
relao entre o comprimento de cada um deles e o compri-"ntoldo
nmostral. Isto , 10 para 80 ou 1/8. Assim, com a diviso m s fzas de".p,
is
comprimento e sem interseco entre elas, teremos os intervalo d po, 30),
40),..., [90, 100] todos com a mesma probabilidade l/g, pois tods tem o mes
termanho.

Para construir um histograma, nos mesmos moldes do captulo


podemos supor que l/8 , a freqncia relativa da ocorrncia de cada um
irrtervalos. As ordenadas do grfico so as densidades, calculadas de modo que
rea de cada retngulo seja a freqncia relativa (probabilidade) do intervalo.

167

6,1 Introduo

Densidade

20

30

40

O histograma mostra que,

50

apesar

70

80

90

100

de termos diferentes intervalos,

clcnsidade permanece com o mesmo valor, igual a 1/80.

taumentando cada vez mais o


Podemos continuar esse procedimento,
rrrnero de faixas, com a conseqente diminuio das suas amplitudes de tal forma

(ple, em uma situao terica com infinitos intervalos, temos

seguinte

Iristograma:

Densidade

Densidade de
Probabilidade

1/8

1/8

lta

1t8

1/8

'v8

1lA

118

Note que, dada as caractersticas do problema, a diviso em g intervalos


produziu o mesmo valor de densidade de l/80 para todos eles. Se dividirmos o
intcrvalo [20, 100] em l6 faixas iguais, utilizando o mesmo argumento anterior,
tcrnos que os intervalos [20, 25), [25, 30), [30, 35), .. . , [95, 100] tero todos a
rosma probabilidade l/16. O histograma correspondente ser:

100

Estamos agora em condies de caracterizar, completamente, a atribuio


rlc probabilidades para o caso contnuo. Ela ser definida pela fuea abaixo de uma

I'uno positiva, denominada densidade de probabilidade. Observe que a


clcnsidade em si no uma probabilidade, mas uma funo matemtica que nos

Você também pode gostar