Você está na página 1de 227

Lvio Jos Brand 2012

Fundamentos
de Estatstica

Introduo
Estatstica

A estatstica nos fornece uma linguagem atravs da qual


podemos falar sobre a incerteza, usada e compreendida pelas
pessoas com conhecimento de estatstica em toda parte.

No h certeza nas concluses

Como h variao em tudo, as concluses so incertas.

Introduo
Os dados batem os casos anedticos

Um caso anedtico uma narrativa surpreendente que se fixa em


nossa mente exatamente por ter essa caracterstica. Casos
anedticos humanizam um fato, mas tambm podem levar a
interpretaes errneas.
Morar perto de linhas de transmisso de eletricidade causa
leucemia em crianas? O National Cancer Institute dedicou 5
anos e 5 milhes de dlares coletando dados sobre esse assunto.
Os pesquisadores compararam 638 crianas portadoras de
leucemia com 620 saudveis.
http://oglobo.globo.com/saude/excesso-de-raio-dental-aumenta-riscode-tumor-cerebral-4608637
3

Como obter dados




Mtodos pelos quais possvel obter os dados

Tipos de pesquisas quantitativas:

Quanto a participao do pesquisador nos resultados:


experimentao ou levantamento;
Quanto ao objetivo da anlise: descritivo ou analtico;
Quanto a complexidade dos dados: simples ou multivariados;
Quanto a amplitude da coleta: censo ou amostra.

24 = 16 possibilidades!





Como obter dados


A Investigao da Amostra


O primeiro passo na avaliao da validade de uma pesquisa


(levantamento ou experimento) determinar se a mesma teve
como base uma amostra probabilstica ou no-probabilstica.
Pesquisas que empregam mtodos de amostragem noprobabilstica esto sujeitas a srios vieses na coleta de dados,
que podem apresentar resultados sem qualquer significado.

Como obter dados


Vantagens da amostragem





Custo menor.
Velocidade maior.
Preciso controlada.
Necessidades especializadas: quando censo impossvel.
Se voc usar mtodos comumente aceitos de amostragem para
selecionar 1.500 adultos de uma populao com milhes de
adultos, voc pode quase sempre estimar com erro inferior a 3% a
proporo de pessoas que tem certa caracterstica ou opinio.
Este fato no depende do tamanho da populao, mas somente do
tamanho da amostra.
6

Como obter dados


Tipos de Amostras




1) Amostra Probabilstica
Uma amostra probabilstica aquela na qual os sujeitos da
amostra so escolhidos com base em probabilidades conhecidas.
O nico meio de fazermos inferncias estatsticas corretas de uma
amostra para uma populao atravs da utilizao de uma
amostra probabilstica.
Os quatro tipos de amostras probabilsticas geralmente mais
utilizados so a amostra aleatria simples, a amostra
estratificada, a amostra sistemtica e a amostra de grupo
(cluster).
2) Amostra no-probabilstica: amostra
amostragem de quota; amostragem de fatia.
7

de

julgamento;

Como obter dados


Amostragem Aleatria Simples (AAS)
Populao: N=64

Amostra: n=8

Cada elemento na populao tem a mesma


possibilidade de ser selecionado na amostra

Como obter dados


Amostragem Estratificada
Populao: N=64

Amostra: n=8
E1
E2
E3
E4

Como obter dados


Amostragem por Conglomerados
Populao: N=64

Amostra: n=8

c1 c2 c3 c4 c5 c6 c7 c8

10

Como obter dados


Amostragem Sistemtica
Populao: N=64

Amostra: n=8 k=5

11

Como obter dados


Principais tipos de erros


Mesmo quando empregam mtodos de amostragem probabilstica


aleatria, as pesquisas esto sujeitas a erros potenciais. Existem
quatro tipos de erros de pesquisa:

1) Erro de Cobertura (ou de abrangncia, ou vis de seleo);


2) Erro por falta de resposta ou vis por falta de resposta;
3) Erro de amostragem;
4) Erro de medio.





12

Como obter dados


Erros de Cobertura (ou de abrangncia, ou vis de
seleo)
Resultam da excluso de certos grupos de sujeitos da lista de populao, de
modo que os mesmos no tm chance de ser selecionados na amostra.

Populao: N=64

Amostra: n=8

Ignorado pelo plano amostral


(vis de seleo)

13

Como obter dados


Erros por falta de resposta
Resultam da falha em coletar dados de todos os elementos da amostra, e os
erros decorrentes da falta de resposta resultam em vis pela falta de resposta.

Populao: N=64

Amostra: n=8

No responderam
Falta de resposta  Vis por falta de resposta

14

Como obter dados


Erros de medio (erros grosseiros ou acidentais)
Referem-se falta de exatido das respostas registradas. Pode
ocorrer devido a diversos fatores, tais como:
deficincia na formulao da pergunta;
por um efeito causado pelo entrevistador sobre o informante;
arredondamento mal feito;
condies ambientais, etc.

15

Como obter dados


Erro de Amostragem


Embora somente uma amostra seja efetivamente selecionada, se


muitas amostras diferentes fossem selecionadas, espera-se que
cada amostra seja uma representao em miniatura da populao
e produza estimativas razoveis de suas caractersticas.
Erros de amostragem refletem a heterogeneidade ou diferenas
de oportunidade de amostra para amostra, com base na
probabilidade de os elementos serem selecionados nas amostras
em particular.

16

Como obter dados


Caracterstica de interesse: espessura de uma camada, ngulo de
mergulho de um eixo de dobra, nmero de gros de zirco, classificao
de um fssil, identificao da rocha num determinado grupo petrogrfico,
etc.

Populao?
Amostra Aleatria?

17

Como obter dados


Caracterstica de interesse: espessura de uma camada, ngulo de
mergulho de um eixo de dobra, nmero de gros de zirco, classificao
de um fssil, identificao da rocha num determinado grupo petrogrfico,
etc.

Populao

Os indivduos so definidos segundo os limites impostos pela


natureza e o propsito do estudo.
Exemplo1: populao de corpos arenosos (elementos
arquiteturais)
existentes
numa
determinada
unidade
estratigrfica:
Espessura
de
arenitos;
relao
clsticos/qumicos, etc.
Exemplo2: populao de unidades estratigrficas situadas em
uma bacia sedimentar: porosidade da unidade estratigrfica;
espessura de corpos arenosos por unidade estratigrfica; etc

Amostra Aleatria?

18

Lvio Jos Brand / Estatstica 2012

Estatstica
Descritiva

19

Estatstica Descritiva
Indivduos e Variveis

Os indivduos so os objetos descritos por um conjunto de


dados.
Uma varivel qualquer caracterstica de um indivduo. Uma
varivel pode assumir valores diferentes para indivduos
diferentes.
Para cada indivduo, os dados fornecem valores para uma ou
mais variveis.
A estatstica descritiva utiliza grficos e resumos numricos para
descrever as variveis num conjunto de dados e as relaes entre
elas.
20

Estatstica Descritiva


Variveis Categricas e Quantitativas

Algumas variveis so categricas e outras quantitativas.

Uma varivel categrica posiciona um indivduo em um dos


diversos grupos ou categorias.
- escala nominal: prorpiedade de automvel (sim, no); seguro de
vida (prazo limitado, por dote, toda a vida, outro, nenhum); etc.
- escala ordinal: satisfao com produto (muito insatisfeito,
relativamente insatisfeito, neutro, relativamente satisfeito, muito
satisfeito); ttulo na faculdade (professor titular, professor
associado, professor assistente, professor); etc

21

Estatstica Descritiva


Variveis Categricas e Quantitativas

Uma varivel quantitativa assume valores numricos com os


quais se faz sentido efetuar operaes aritmticas, tais como
adio e clculo de mdias.
-Dados contnuos: gerados a partir de algum processo de
medio ( temperatura; altura; peso; idade; salrio; etc)
-Dados discretos: gerados a partir de algum processo de
contagem (nmero de revistas assinadas: 0, 1, 2,).

22

Estatstica Descritiva


Organizando Dados Numricos

Quando um conjunto de dados coletado, os dados esto


geralmente em forma bruta, isto , as observaes numricas
no esto arrumadas em qualquer ordem ou sequncia especfica.
medida que o nmero de observaes cresce, vai-se tornando
mais difcil focalizar os principais aspectos em um conjunto de
dados; assim, precisamos de meios para organizar as
observaes de modo que possamos compreender melhor que
informaes os dados esto comunicando.

A Disposio Ordenada
Se colocarmos os dados brutos em ordem de classificao, da menor
para a maior observao, a sequncia ordenada chamada de
disposio ordenada. Quando os dados esto classificados em uma
disposio ordenada, nossa avaliao de seus principais aspectos
fica facilitada. Torna-se ento fcil detectar os extremos, os valores
tpicos e as concentraes de valores.

23

Estatstica Descritiva


A Distribuio de Frequncia

A distribuio de uma varivel informa os valores que ela assume


e com que frequncia assume esses valores.

Uma distribuio de frequncia uma tabela resumida na qual


os dados so organizados em grupos de classe ou categorias
convenientemente estabelecidas e numericamente ordenadas.

24

Estatstica Descritiva


Tabulando Dados Numricos

A Distribuio de Frequncia
Ao construir a tabela de distribuio de frequncia, deve-se
atentar para:
1) A seleo do nmero apropriado de grupos de classe para a
tabela.
O nmero de grupos de classe a ser utilizado depende
principalmente do nmero de observaes nos dados. Um
nmero maior de observaes requer um nmero maior de
intervalos de classes. Em geral, entretanto, a distribuio de
frequncia deve possuir ao menos 5 grupos de classe, porm
no mais do que 15.




Obs.:

log n
= (q3 q1 )

1
3

x mx - x mn
k=

onde n o nmero de observaes e k o nmero de classes.


25

Estatstica Descritiva


Tabulando Dados Numricos

A Distribuio de Frequncia

Frmula de Sturges:
Nmero de classes (k) = 1 + 3,3log10n,

Frequncias Acumuladas

Uma medida muito usada para descrever dados quantitativos


a frequncia acumulada (Fac), que indica quantos elementos,
ou que percentagem deles, esto abaixo de um certo valor.

26

Estatstica Descritiva


Histograma

Histogramas so utilizados para descrever dados numricos que


tenham sido agrupados em distribuio de frequncia.
O histograma d uma idia de como a verdadeira densidade de
frequncias da populao da qual os dados foram selecionados.
Histogramas so grficos de barras verticais nos quais as barras
retangulares so construdas nos limites de cada classe.
O eixo vertical representa o nmero, a proporo, o percentual ou
a densidade de observaes por intervalo de classe.





27

Estatstica Descritiva


Curva de Densidade

Uma curva de densidade uma curva que:


Est sempre ou sobre o eixo horizontal ou acima dele
 Tem rea exatamente igual a 1 abaixo dela


Uma curva de densidade descreve o padro geral de uma


distribuio. A rea sob a curva e acima de qualquer amplitude
de valores a proporo de todas as observaes que caem
neste intervalo.
As curvas de densidade, assim como as distribuies, podem
apresentar diversas formas.

28

Estatstica Descritiva


Curva de Densidade

Uma curva de densidade com uma forma apropriada ,


geralmente, uma descrio adequada do padro geral de uma
distribuio.
Evidentemente que nenhum conjunto de dados reais descrito
exatamente por uma curva de densidade. A curva consiste em
uma aproximao de fcil utilizao e com preciso suficiente para
ser usada na prtica.

29

Estatstica Descritiva
Nmero de erros de impresso da primeira pgina de um jornal
durante determinado perodo.
Histograma
DensidadedeFreqncia

0,10

38,0%
34,0%

0,05

18,0%

6,0%
2,0%

2,0%

0,00
4

12

16

24

20

Nmero de erros

30

Estatstica Descritiva


Medidas Resumo

As trs principais propriedades que descrevem um conjunto de


dados numricos so:
1) Medidas de localizao
2) Variao
3) Formato
Em qualquer anlise e/ou interpretao, vrias medidas descritivas
representando as propriedades de localizao, variao e formato
podem ser utilizadas para extrair e resumir as principais
caractersticas do conjunto de dados. Se essas medidas descritivas
resumidas forem calculadas atravs de uma amostra de dados,
elas sero chamadas de estatsticas; caso sejam calculadas
atravs de toda uma populao de dados (curva de densidade),
elas sero chamadas de parmetros.






31

Estatstica Descritiva


Medidas de localizao de tendncia central

A Mdia Aritmtica da Amostra


A maioria dos dados apresenta uma diferente tendncia de se
agrupar ou concentrar em torno de um ponto central. Assim sendo,
para um conjunto de dados, em particular, geralmente se torna
possvel selecionar um valor tpico ou mdia para descrever todo
o conjunto. Tal valor descritivo tpico uma medida de
localizao ou tendncia central.
Para uma amostra contendo um conjunto de n observaes X1,
X2,,Xn, a mdia aritmtica (representada pelo smbolo X ) pode
ser escrita como

X 1 + X 2 + ... + X n
1 n
X = Xi =
n i =1
n
32

Estatstica Descritiva


A Mdia Aritmtica (dados agrupados em classes)


k

1
X = X j fj =
n j =1

uj =

XjA
h

X
j =1
k

f
j =1

fj
k

X = u .h + A

u=

j =1
k

onde:

j =1

Xj: ponto mdio da j-sima classe;


fj : frequncia da j-sima classe;
k: nmero de classes.

33

fj
j

Estatstica Descritiva


A Moda

A moda o valor que aparece mais frequentemente em um


conjunto de dados.

A Moda (dados agrupados):

d1
h
M o = LI +
d1 + d 2

onde:
d1: excesso de frequncia da classe modal sobre a classe anterior
classe modal;
d2: excesso de frequncia da classe modal sobre a classe posterior
classe modal;
h: intervalo de classe padro;
LI: limite inferior da classe que contm a moda.
34

Estatstica Descritiva


A Mediana

Para uma amostra contendo um conjunto de n observaes X1,


X2,,Xn, a mediana (representada pelo smbolo Md) o valor que
divide a disposio ordenada pela metade (50% das observaes
so menores e 50% so maiores).
Regra para o clculo da Mediana (dados no agrupados)
Posio de X correspondente mediana: valor correspondente
observao ordenada (n+1)/2.
Se o tamanho da amostra for um nmero mpar, a mediana
representada palo valor numrico de X correspondente ao ponto
de posicionamento (n+1)/2.
Se o tamanho da amostra for um nmero par, o ponto de
posicionamento fica entre duas observaes no meio da disposio
ordenada. A mediana a mdia dos valores numricos
correspondentes quelas duas observaes centrais.





35

Estatstica Descritiva


Regra para o clculo da Mediana (dados agrupados)

Fac
2

h
M d = LI +
f md
onde:
LI: limite inferior da classe que contm a mediana;
n: nmero de observaes;
Fac: frequncia acumulada at a classe anterior classe da
mediana;
fmd: frequncia absoluta da classe da mediana;
h: intervalo de classe padro.
36

Estatstica Descritiva


Medidas de localizao no-centrais

Quartis
Enquanto a mediana o valor que divide a disposio ordenada
pela metade (50% das observaes so menores e 50% so
maiores), os quartis so medidas descritivas que dividem os
dados ordenados em quatro partes.
O primeiro quartil, Q1, o valor que faz com que 25% das
observaes sejam menores e 75% sejam maiores.
O segundo quartil, Q2, o valor que faz com que 50% das
observaes sejam menores e 50% sejam maiores.
O terceiro quartil, Q3, o valor que faz com que 75% das
observaes sejam menores e 25% sejam maiores.





37

Estatstica Descritiva


Quantis

De modo geral, podemos definir uma medida, chamada quantil de


ordem p ou p-quantil, indicada por q(p), onde p uma proporo
qualquer, 0 < p < 1, tal que 100p% das observaes sejam
menores do que q(p).

q(0,25) = 1 Quartil = 25 Percentil


q(0,50) = Mediana = 2 Quartil = 5 Decil = 50 Percentil
q(0,75) = 3 Quartil = 75 Percentil
q(0,40) = 4 Decil
q(0,95) = 95 Percentil






38

Estatstica Descritiva


Clculo dos quantis para dados no agrupados

x( i ) ,

q ( p ) = (1 - f i )q (p i ) + f i q (p i +1 ),
x1 ,

x( n ) ,
onde f i =

i - 0,5
se p = p i =
, i = 1,2,..., n
n
se p i < p < p i +1
se p < p1
se p > p n

(p - p i )

( pi +1 pi )

39

Estatstica Descritiva


Clculo dos quantis para dados agrupados


n

Fac

100

h, i = 1,2,...,99
Pi = LI +
f Pi
onde:
LI: limite inferior da classe que contm o percentil;
n: nmero de observaes;
Fac: frequncia acumulada at a classe anterior classe do
percentil i;
fPi: frequncia absoluta da classe do percentil i;
h: intervalo de classe do percentil i.
40

Estatstica Descritiva


Boxplot

um desenho esquemtico representando o menor e o maior valor, a


mediana, os quartis e os valores atpicos (caso existam).

Valores atpicos

* *

** *
Q1

Md=Q2

Q3

Cerca inferior= maior entre [menor valor; Q1-1,5 (Q3-Q1)]

Cerca superior= menor entre [maior valor; Q3+1,5 (Q3-Q1)]

Os valores que ficarem abaixo da cerca inferior ou acima da cerca


superior so considerados valores atpicos (ou outliers).

41

Estatstica Descritiva


Medidas de variao (disperso)

A Varincia da Amostra e o Desvio Padro da Amostra

A varincia a soma das diferenas ao quadrado em torno da


mdia aritmtica dividida pelo tamanho da amostra menos 1.

(X
n

S2 =

i =1

i X)

n 1

n
1

S2 =
X i2 nX 2 (Dados no agrupados)
n 1 i =1

DP = S 2 (Desvio Padro)

42

Estatstica Descritiva


A Varincia e o Desvio Padro


k
k

1
1
2
2
2
2
(X j X ) f j = X j f j nX
S =

n 1 j =1
n 1 j =1

(Dados agrupados em classes ou frequncias)

43

Estatstica Descritiva


Resumindo e Descrevendo Dados Numricos

A Varincia (dados agrupados em classes)

S 2X = h 2 Su2
k

1
2
2
2
u j f j nu
Su =

n 1 j =1

44

Estatstica Descritiva


Propriedades da Mdia e da Varincia de um


conjunto de dados
X : conjunto de dados numricos
X : mdia aritmtica de X

S2X : varincia de X

1) Se Y = X + a

2) Se Y = aX

3) Se Y = aX + b

Y = X +a

Y = aX

Y = aX + b

S =S

S =a S

2
Y

2
X

2
Y

2
X

45

S =a S
2
Y

2
X

Estatstica Descritiva


Medidas de Variao

O Coeficiente de Variao
O coeficiente de variao uma medida relativa de variao. Ele
expresso como uma percentagem em vez de se utilizarem termos
de unidades dos dados especficos.

S
CV =
X


100%

Como uma medida relativa, o coeficiente de variao


particularmente til quando comparamos a variabilidade de dois
ou mais conjuntos de dados que so expressos em diferentes
unidades de medida.

46

Estatstica Descritiva


Medidas de Variao

O Coeficiente de Variao
O coeficiente de variao tambm muito til quando
comparamos dois ou mais conjuntos de dados que so medidos
nas mesmas unidades, porm diferem de tal modo que uma
comparao direta dos respectivos desvios padres no de
muita ajuda.







A mdia = 50 DP=10
B mdia = 12 DP=4
CVA=(10/50)100% = 20,0%
CVB=(4/12)100% = 33,3%
Na verdade, em relao mdia aritmtica, B muito mais
varivel do que A.

47

Estatstica Descritiva


Medidas de Variao

O Coeficiente de Variao
Se
CV 15%: baixa disperso (dados homogneos);
15% < CV 30%: mdia disperso;
CV > 30%: alta disperso (dados heterogneos).
CV > 30%: mediana melhor p/ representar os dados;
CV 30%: mdia melhor p representar os dados.

48

Estatstica Descritiva


Varivel reduzida, escores reduzidos

X X
z=
,
S

A varivel

que mede o desvio em relao mdia, em unidades de desvio


padro, denominada varivel reduzida e uma quantidade
abstrata (ou seja, independe das unidades usadas).
Se os desvios em relao mdia forem dados em unidades de
desvio padro, diz-se que esto expressos em unidades reduzidas
ou escores reduzidos. Essas grandezas so muito valiosas para a
comparao de distribuies.

49

Estatstica Descritiva


Medidas de Formato

Assimetria
Coeficiente de assimetria de Pearson:
X Mo
As =
S

3(X - M d )
ou A s =
S

As = 0, distribuio simtrica;
As > 0, distribuio assimtrica positiva;
As < 0, distribuio assimtrica negativa.
|As| 0,15, distribuio praticamente simtrica;
0,15 < |As| 1, assimetria moderada;
|As| > 1, forte assimetria.
50

Estatstica Descritiva


Resumindo e Descrevendo Dados Numricos

Medidas de Formato
Assimetria
Coeficiente de momento de assimetria:

(X
n

n m3
a3 =
3
n2 S

(Excel)

m3 =

i =i

a3 = 0, distribuio simtrica;
a3 > 0, distribuio assimtrica positiva;
a3 < 0, distribuio assimtrica negativa.
51

X)

n 1

Estatstica Descritiva


Resumindo e Descrevendo Dados Numricos

Medidas de Formato

Curtose

Q3 Q1
K=
2(P90 P10 )

K > 0,263, platicrtica (muito achatada);


K = 0,263, mesocrtica (normal);
K < 0,263, leptocrtica (pouco achatada).

52

Estatstica Descritiva


Resumindo e Descrevendo Dados Numricos

Medidas de Formato
Curtose
Coeficiente de momento de curtose




3(n 1)
n(n + 1)
m4
a4 =
4
(n 2)(n 3) S (n 2)(n 3)
2

(X
n

m4 =

i =1

(Excel )

X)

n 1

a4 > 3, leptocrtica (pouco achatada);


a4 = 3, mesocrtica (normal);
a4 < 3, platicrtica (muito achatada).
53

Estatstica Descritiva


Medidas de associao

Medidas de associao entre variveis qualitativas


(categricas)
Tabulando dados categorizados utilizando tabelas de
contingncia
Com frequncia necessrio examinar as respostas de duas
variveis categricas simultaneamente. Essas tabelas combinadas
com cruzamento de classificaes (tabulaes cruzadas) so
conhecidas como tabelas de contingncia.




54

Estatstica Descritiva


Medidas de associao

Medidas de associao entre variveis qualitativas


Suponha 2 variveis qualitativas X e Y, classificadas em r
categorias A1, A2, , Ar para X e s categorias B1, B2, , Bs para Y.

Tabela 1: Notao para tabelas de contingncia


Y
X
B1
B2
Bj
...
A1
A2

n11
n21

n12
n22

...
...

n1j
n21

...
...
...

Bs
n1s
n21

Total
n1.
n2.

Ai

ni1

ni2

...

nij

...

nis

ni.

Ar

nr1
n.1

nr2
n.2

...

nrj
n.j

...

Total

...

...

nrs
n.s

nr.
n..

55

Estatstica Descritiva


Medidas de associao entre variveis qualitativas

n ij = nmero de elementos pertencent es i - sima categoria de X e j - sima categoria de Y.


s

n i. = n ij = nmero de elementos pertencent es i - sima categoria de X.


j=1
r

n .j = n ij = nmero de elementos pertencent es j - sima categoria de Y


i =1

n.. = n = n ij = nmero total de elementos


i =1 j=1

56

Estatstica Descritiva


Medidas de associao entre variveis qualitativas

Qui-quadrado de Pearson
Sob a hiptese de no associao entre as variveis :
n *ij

n i. n .j
n i.
*
=
n ij =
, i = 1,2,..., r; j = 1,2,..., s
n .j
n
n
r

2 =
i =1 j =1

(n

ij

) , onde : n

* 2
ij

n
*
ij

ij

: valores observados

nij* : valores esperados




Se a hiptese de no-associao for verdadeira, ento o valor


2

calculado para
deve ser prximo de zero, caso contrrio o valor
2
de deve ser grande.

57

Estatstica Descritiva


Medidas de associao entre variveis numricas

Coeficiente de correlao de Pearson


Y (observado)
YY

P4

Y (ajustado)

R3
e1
b0

R2

P1
R1

e2
P2

Y = A + B X

e4

Y Y = e (resduo)

R4

e3
P3
X

X1

X2

X3

X4

A diferena entre os valores observados e


ajustados so os resduos
58

Estatstica Descritiva


Medidas de associao entre variveis numricas

Coeficiente de correlao de Pearson


n

r = corr(X, Y) =

x y

1 r -1


nx . y

(x i x ) (y i y ) =
1
i =1

n
n - 1 i =1 DP(X) DP(Y)
n 2
2
2
2
xi nx yi ny
i =1
i =1

Covarincia entre X e Y

1 n
(x i x )(y i y )
cov(X, Y) =

n - 1 i =1
59

Estatstica Descritiva


Medidas de associao entre variveis numricas

Interpretao de r
Se o valor absoluto do valor calculado de r exceder o valor da
tabela de valores crticos de r, conclua que h uma correlao
linear significativa. Caso contrrio, no h evidncia suficiente
para apoiar a concluso de uma correlao linear significativa.

Equao da
quadrados

reta
n

Y = A + B X
A = Y B X

ajustada pelo mtodo

B =

X Y nX Y
i i

i =1

2
2
X

n
X
i
i =1

60

dos

mnimos

Estatstica Descritiva
Interpretao de r
Se o valor absoluto do valor calculado
de r exceder o valor da tabela de
valores crticos de r, conclua que h
uma correlao linear significativa.
Caso contrrio, no h evidncia
suficiente para apoiar a concluso de
uma correlao linear significativa.

61

Estatstica Descritiva
Medida de Qualidade do Ajuste:
Partio das Somas de Quadrados
n




2
(
Y

Y
)
Soma de Quadrados Total: i
i =1
SQT
 representa a variao de Yi em torno de sua mdia X
n

Y )2
(
Y
Soma de Quadrados do Modelo (da Regresso): i
i =1
 SQM
 representa a variao da esperana de Y dado X em torno da
mdia de Y

62

Estatstica Descritiva
Medida de Qualidade do Ajuste:
Partio das Somas de Quadrados
n




Soma de Quadrados dos erros (ou Resduos): (Yi Yi )2


i =1
SQE ou SQRes
 representa a variao de Y em torno da reta estimada

63

Estatstica Descritiva
Coeficiente de Determinao

Proporo da variao de Y explicada pela incluso da


varivel X no modelo

SQM
r ==
SQT

0 r2 1

b0 Y i + b1 X iY i n (Y
n

i =1

i =1

Y
i =1

2
i

n (Y

64

Estatstica Descritiva


Medida de associao
quantitativas

Clculo do R2
R2 =

entre

variveis

qualitativas

var( X ) var( X )
var( X )
= 1
, onde :
var( X )
var( X )

(X
n

var(X) =

j=1

-X

(X
ni

vari (X) =

j=1

ij

- Xi

var(X) =

ni

n var (X)
i =1

n
i =1

var(X) = mdia das varincias ponderadas pelo n o de observaes em cada grupo;


vari (X) = varincia do i - simo grupo
k = n o de grupos


O R2 indica o quanto da variao na varivel numrica explicada com a


incluso da varivel categrica. 0 R2 1.
65

Lvio Jos Brand / Estatstica 2012

Probabilidade

66

Introduo Probabilidade
A

idia de probabilidade

A teoria da probabilidade o ramo da matemtica que descreve o


comportamento aleatrio.
 Ao considerarmos probabilidades, lidamos com experimentos
aleatrios, tais como medir a intensidade da corrente eltrica em
um circuito, jogar um dado, responder a um teste de questes de
mltipla escolha, submeter-se a um teste sobre uso de drogas, etc),
os quais produzem resultados.
 Um evento qualquer conjunto de resultados ou consequncias de
um experimento.
 Um evento simples um resultado ou um evento que no pode
mais ser decomposto em componentes mais simples.
 O espao amostral de um experimento consiste em todos os
eventos simples possveis.


67

Introduo Probabilidade


Espao Amostral

o conjunto de todos os eventos simples possveis do


experimento, denotado usualmente por .

O Espao Amostral pode ser:


- Discreto: finito ou contvel infinito;
- Contnuo: no contvel ou no enumervel.

68

Introduo Probabilidade


Evento Aleatrio

Um evento aleatrio, A, por definio um subconjunto do espao


amostral .

Operaes com Eventos


Eventos podem ser combinados usando operaes de conjuntos:
i) A unio de dois eventos A e B (em smbolo: A U B), representa
a ocorrncia de pelo menos um dos eventos A ou B (isto : ou A
ocorre, ou B ocorre ou ambos os eventos ocorrem).
ii) A interseo de dois eventos A e B (em smbolo: A B)
representa a ocorrncia simultnea de A e B (isto : ambos os
eventos A e B ocorrem).

69

Introduo Probabilidade


Operaes com Eventos


iii) O complementar de A (em smbolos: Ac), representa o
conjunto de pontos em S que no esto em A. Ou seja, o evento
A no ocorre se o experimento produz um resultado em Ac.
iv) Dois eventos A e B so disjuntos ou mutuamente exclusivos se
eles no podem ocorrer simultaneamente, isto , A B = .
Exemplos:
1) E - jogar um dado e observar a face que caiu para cima.
= {1, 2, 3, 4, 5,6}
Sejam os eventos: A - ocorrer n par;
B - ocorrer um no maior ou igual a 4.
Neste caso: A = { 2, 4, 6 } e B = { 4, 5, 6}
A U B = { 2, 4, 5, 6 }
A B = { 4, 6 }
Ac = { 1, 3, 5 } e Bc = {1, 2, 3}
70

Introduo Probabilidade


Exemplos:
2) E - jogar um dado e observar a face que caiu para cima.
= {1, 2, 3, 4, 5,6}
Sejam os eventos: A - ocorrer n par;
B - ocorrer n mpar.
Neste caso: A = { 2, 4, 6 } e B = { 1, 3, 5}
AB=
Neste caso, os eventos A e B so disjuntos, pois a ocorrncia de
um n par e mpar no pode ser verificada como decorrncia do
mesmo experimento.

71

Introduo Probabilidade



Se A for um evento associado a um experimento, ento, no


poderemos afirmar com certeza que A ir ocorrer ou no.
Por isso, muito importante tentar associar um nmero ao
evento A, o qual medir de alguma maneira quo verossmil
que o evento A venha ocorrer.
Esta tarefa nos leva Teoria de Probabilidade.

72

Introduo Probabilidade


Probabilidade
uma funo utilizada para atribuir valores numricos aos eventos
do espao amostral, conforme as definies a seguir:




Definio 1: Aproximao da Probabilidade pela Frequncia


Relativa (procedimento frequencialista ou a posteriori )
Repeties do experimento em condies idnticas
Realize (ou observe) um procedimento e conte o nmero de vezes
em que o evento A realmente ocorre. Com base nesses
resultados, P(A) estimada como:

n repeties
f n ocorrncias do evento A
P(A) = lim n

fn
n de vezes em que ocorreu A
=
n n de vezes que o procedimento foi repetido
73

Introduo Probabilidade


Definio 2: Abordagem Clssica da Probabilidade


(requer resultados igualmente provveis)
Suponha que um determinado experimento tenha n diferentes
eventos simples e que cada um desses eventos tenha igual
chance de ocorrer. Se o evento A pode ocorrer em k desses n
casos, ento

n de casos favorveis a A no experimento k


P(A) =
=
n total de eventos simples no experimento n
Consiste na atribuio de probabilidades, baseando-se em
caractersticas tericas da realizao do fenmeno.

74

Introduo Probabilidade


Definio 3: Probabilidades Subjetivas


P(A), a probabilidade do evento A, estimada com base no
conhecimento de circunstncias relevantes.
Opinio de um especialista
Ex.: Potencial de uma bacia ainda no explorada

75

Introduo Probabilidade


Axiomas da Probabilidade
i) 0 P(A) 1, para todo evento A contido no ;
ii) P() = 1;
iii) P(A1 U A2 U..... U An) = P(A1) + P(A2) + ......+ P(An),
com os Ais eventos disjuntos.

76

Introduo Probabilidade


Algumas propriedades de probabilidade


1) Se o conjunto vazio, ento P() = 0;
2) Se Ac o complemento de A, ento P(Ac) = 1- P(A);
3) Se A B, ento P(A) P(B)
4) Se A e B so dois eventos quaisquer, ento
P(AUB) = P(A) + P(B) - P(A B); (regra de adio de
probabilidades)
5) Se A e B forem eventos disjuntos (ou mutuamente exclusivos),
ento P(AUB) = P(A) + P(B).

77

Introduo Probabilidade


Clculo de Probabilidade Conjunta


Probabilidade de ocorrncia de um Evento Conjunto, A e B
(isto , A B):
nmeros de resultados favorveis a A e B no espao amostral
P(A B) =
nmero total de eventos elementare s no espao amostral

Probabilidade Conjunta usando


Tabela de Contingncia
Eventos

B1

B2

Total

A1

P(A1 e B1)

P(A1 e B2)

P(A1)

A2

P(A2 e B1)

P(A2 e B2)

P(A2)

Total

P(B1)

P(B2)
78

Introduo Probabilidade


Regra de Adio de Probabilidades


P(A B) =

nmeros de resultados favorveis a A ou B no espao amostral


nmero total de eventos elementare s no espao amostral

P(A ou B) = P(A U B) = P(A) + P(B) - P(A B)

79

Introduo Probabilidade


Princpio fundamental da contagem

Quando duas aes distintas so realizadas em sucesso, se a


primeira puder ser realizada em m maneiras distintas e a segunda
em n, temos um total de mn maneiras distintas em que se pode
realizar as duas aes em conjunto.

Permutao

Conjunto de objetos organizados de alguma maneira


Duas permutaes so iguais apenas se contiverem os mesmos
objetos e na mesma ordem
n!
Sem repetio P(n, k) =
(n - k )!

Com repetio

nk
80

Introduo Probabilidade


Combinao

Conjunto de objetos em que no importa a ordem


Podemos construir qualquer permutao de n elementos tomados
k a k escolhendo em primeiro lugar a combinao, ou conjunto dos
objetos envolvidos, e ento colocando estes objetos em alguma
ordem. Pelo princpio fundamental da contagem o nmero de
permutaes ser igual ao produto do nmero de possveis
combinaes pelo nmero de modos como podem ser ordenados.

P(n, k) = C(n, k)k!


n!
C(n, k) =
(n k )!k!

81

Introduo Probabilidade


Probabilidade Condicional

Existem situaes nas quais estamos interessados em saber a


probabilidade de um evento A sabendo que o evento B ocorreu.
Por exemplo:
Sabendo que uma pessoa selecionada aleatoriamente de uma
populao tem histria familiar de diabete (evento B), pode-se
querer saber qual a probabilidade dessa pessoa ter diabete
(evento A).
Ento, vamos estudar como a probabilidade de um evento A muda
depois de sabermos que algum outro evento B ocorreu.
Esta nova probabilidade de A chamada a probabilidade
condicional do evento A dado que (ou sabendo que) o evento B
ocorreu.
Notao: P(A | B)




82

Introduo Probabilidade


Probabilidade Condicional

Definio:
Se A e B so dois eventos quaisquer tal que P(B) > 0, ento
define-se a probabilidade condicional de A dado B, P(A | B), como
sendo

P(A B)
P(A | B) =
P(B)
Note que pela definio acima, P(AB) e P(B) so calculados em
relao ao espao amostral original .

83

Introduo Probabilidade


Probabilidade Condicional
Uma probabilidade condicional nada mais do que uma
probabilidade calculada a partir de um subconjunto de (isto ,
calculada em relao ao espao amostral reduzido) e no mais a
partir do espao amostral original .
Eventos

Verm.

Preta

Total

No s

24

24

48

Total

26

26

52

P(s / verm) =

P(verm. e s) 2 / 52
1
=
=
P(verm.)
26 / 52 13

Probabilidade condicional
usando tabela de
contingncia

P(verm. e s) 2 / 52 1
P(verm. / s) =
=
=
P(s)
4 / 52 2

84

Introduo Probabilidade


Consideraes:
A noo intuitiva de probabilidade condicional foi introduzida e,
depois, uma definio formal desta noo foi estabelecida.
Ento, pode-se notar que a probabilidade condicional de A dado
B, P(A | B), pode ser calculada:
- Diretamente, pela considerao da probabilidade de A em
relao ao espao amostral reduzido B; ou
- Empregando a definio dada, onde P(AB) e P(B) so
calculados em relao ao espao amostral original .

85

Introduo Probabilidade


Regra do Produto de Probabilidades


A partir da definio de probabilidade condicional, obtm-se a
regra do produto (ou regra de multiplicao) de probabilidades,
Esta regra bastante til para calcular a probabilidade de
ocorrncia conjunta dos eventos A e B.
Ou seja, esta regra usa o conceito de probabilidade condicional
para se obter a probabilidade de ocorrncia conjunta de, no caso,
dois eventos.
P( A B) = P( A| B) P(B)

86

Introduo Probabilidade


Definio: Independncia de eventos


Dois eventos A e B so independentes se a informao da
ocorrncia ou no de B no altera a probabilidade de ocorrncia
de A, isto ,
P(A B) = P(A)P(B)
Ou ainda, equivalentemente,
a) se P(A | B) = P(A), se P(B) > 0, ou
b) se P(B | A) = P(B), se P(A) > 0.

87

Introduo Probabilidade


Eventos independentes
Observaes:
i) Se A independe de B, ento B tambm independe de A;
ii) Independncia de A e B implica independncia de outros
eventos.
Se A e B so independentes, ento
A e Bc tambm so independentes;
Ac e B tambm so independentes;
Ac e Bc tambm so independentes.

88

Introduo Probabilidade


Exerccio
Uma urna contm 2 bolas brancas (B) e 3 vermelhas (V). Suponha
que sorteemos 2 bolas ao acaso, sem reposio. Isto significa que
escolhemos a 1a bola, verificamos a sua cor e no a devolvemos
urna; misturamos as bolas restantes e retiramos a 2a bola.
Pergunta-se: Qual a probabilidade
a) de se obter 2 bolas brancas (B)?
b) de se obter uma bola branca (B)?
c) de se obter nenhuma bola branca (B)?

89

Introduo Probabilidade


Diagrama em rvore

Em cada galho da rvore esto indicadas as probabilidades de


ocorrncia, sendo que para as 2as bolas temos probabilidades
condicionais.
Resultados
Probabilidades
1/4
B
BB
2/5 x 1/4 = 2/20
B
2/5
BV
2/5 x 3/4 = 6/20
V
3/4
B
VB
3/5 x 2/4 = 6/20
2/4
VV
3/5 x 2/4 = 6/20
V
3/5
--------------------------------------------2/4
V
Total
20/20 = 1

90

Introduo Probabilidade
a) P(2 bolas brancas) = P(B e B)
= P(B na 1a) x P(B na 2a | B na 1a) = 2/5 x 1/4 = 2/20
b) P(obter 1 bola branca) = P(B e V) + P(V e B)
= [P(B na 1a) x P(V na 2a | B na 1a)] +
+ {P(V na 1a) x P(B na 2a | V na 1a)} =
= [2/5 x 3/4] + {3/5 x 2/4} = [6/20] + {6/20} = 12/20
c) P(de se obter nenhuma bola branca) = P(V e V)
= P(V na 1a) x P(V na 2a | V na 1a) = 6/20

91

Introduo Probabilidade


Eventos Independentes
Exemplo da urna: Imagine agora que as duas extraes feitas so
com reposio, isto a 1 bola reposta na urna antes da extrao da
2a bola.
Ento, nestas condies as extraes so independentes, no sentido
de que o resultado de cada extrao no tem influncia no resultado da
outra.
Construa o diagrama de rvores para este caso.
Resultados
BB
BV
VB
VV
Total

Probabilidades
2/5 x 2/5 = 4/25
2/5 x 3/5 = 6/25
3/5 x 2/5 = 625
3/5 x 3/5 = 9/25
1

Observe que a P(B na 2a | B na


1a) = 2/5 = P(B na 2a),ou seja,
se o evento A independente
do evento B, ento P(A | B) =
P(A).

92

Introduo Probabilidade


Definio: Partio do Espao Amostral

Os eventos A1, A2,........., Ak formam uma partio do espao amostral


se eles no tm interseo entre si e se sua unio igual ao
espao amostral . Isto ,
Ai Aj = para i j e
k

UA

= A1 A2 ... Ak =

i =1

A figura abaixo apresenta um exemplo de uma partio de em 5


eventos.
A1

A2

A4

A5

A3

K=5

Introduo Probabilidade


Exemplo: Experimento (E) - Jogar um dado


= {1, 2, 3, 4, 5, 6}
Uma partio possvel de :
A1 = {1, 2};
A2 = {3, 4};
A3 = {5};
A4 = {6}
Note que Ai Aj = para i j
4

UA = A A
i

A3 A4 =

i =1

Enquanto: C1 = {1,2,3,4}, C2 = {4,5,6} no seria uma partio de .


Pois, C1 C2 = {4}

94

Introduo Probabilidade


Teorema de Bayes

Seja A1, A2,......., Ak uma partio do espao amostral tal que


P(Ai) > 0, para i = 1, 2, ......, k e seja B um evento qualquer em ,
tal que P(B) > 0.
Ento para i = 1, 2, ........., k

P ( Ai | B ) =

P( B | Ai ) P( Ai )
k

P( B | A )P( A )
j =1

95

Introduo Probabilidade

Observao:
O Teorema de Bayes permite inverter probabilidades
condicionais. Isto , s vezes fcil calcular P(B|Ai), mas o que
se deseja conhecer P(Ai|B). O Teorema de Bayes fornece uma
regra simples para calcular probabilidades condicionais P(Ai|B) a
partir de probabilidades condicionais P(B|Ai) e probabilidades
no-condicionais P(Ai).
Ou seja, o Teorema de Bayes expressa uma probabilidade
condicional em termos de outras probabilidades condicionais e
no condicionais (marginais).

96

Introduo Probabilidade


Exemplo 1: Num estudo de reservatrio foram sistematicamente


amostrados (20 cm) os testemunhos de trs poos. Do total de
amostras 15% so do poo 1, 35% do poo 2 e 50% do poo 3.
Nestes poos ocorrem 1%, 5% e 2%, respectivamente, de
amostras cimentadas. Se uma amostra escolhida ao acaso:

a) Qual a probabilidade de ser arenito cimentado?


b) No caso dos trs poos, dado que foi selecionada uma amostra
de arenito cimentado, qual a probabilidade de ser uma amostra do
poo 2?

97

Introduo Probabilidade








Considere os eventos:
Pi - amostra selecionada do poo i, com i =1, 2, 3
C - amostra de arenito cimentado
Probabilidades fornecidas:
P(P1) = 0,15; P(P2) = 0,35; P(P3) = 0,50
P(C | P1) = 0,01; P(C | P2) = 0,05; P(C | P3) = 0,02
Note que P1, P2 e P3 formam uma partio do espao
amostral pois uma dada amostra cimentada vem,
necessariamente, de um e apenas um dos 3 poos.

98

Introduo Probabilidade


Ento o evento C pode ser escrito em termos de intersees de C


com os eventos P1, P2 e P3, conforme figura a seguir.

P1

P2

P3

C = (C P1) U (C P2) U (C P3)

99

Introduo Probabilidade



C = (C P1) U (C P2) U (C P3)


C a unio de trs eventos disjuntos (ou mutuamente
exclusivos), logo a
P(C) = (C P1) U (C P2) U (C P3) =
P(C) = P[(C P1)] + P[(C P2)] + P[(C P3)] =
3

= P (C Pi )
i =1

(*)

Se P(Pi)>0, para i = 1,2,3


Ento P(C Pi) = P(C | Pi) P(Pi)
(**) em (*), temos que:

(**)

P(C ) = P(C | Pi )P( Pi )


i =1

(***)
100

Introduo Probabilidade










Soluo (cont.):
a) Qual a probabilidade de ser arenito cimentado?
Probabilidades fornecidas:
P(P1) = 0,15; P(P2) = 0,35; P(P3) = 0,50
P(C | P1) = 0,01; P(C | P2) = 0,05; P(C | P3) = 0,02
Da pgina anterior, obtivemos que:
P(C) = P(P1) P(C | P1) + P(P2) P(C | P2) + P(P3) P(C | P3)
Logo,
P(C) = (0,15)(0,01) + (0,35)(0,05) + (0,50)(0,02) = 0,029 = 2,9%

101

Introduo Probabilidade






Soluo (cont.):
b) No caso dos trs poos, dado que foi selecionada uma
amostra de arenito cimentado, qual a probabilidade de ser uma
amostra do poo 2?
Queremos: P(P2 | C) = ?
Da definio de probabilidade condicional temos que:
P ( P2 | C ) =

P ( P2 C )
P (C )

102

Introduo Probabilidade








Soluo (cont.): b) No caso dos trs poos, dado que foi


selecionada uma amostra de arenito cimentado, qual a
probabilidade de ser uma amostra do poo 2?
Queremos: P(P2 | C) = ?
Probabilidades fornecidas:
P(P1) = 0,15; P(P2) = 0,35; P(P3) = 0,50
P(C | P1) = 0,01; P(C | P2) = 0,05; P(C | P3) = 0,02
Da pgina anterior, obtivemos que:
P (C | P2 ) P ( P2 )
P ( P2 | C ) =
=
P (C | P1 ) P ( P1 ) + P (C | P2 ) P ( P2 ) + P (C | P3 ) P ( P3 )
(0,05)(0,35)
=
= 0,603
0,029

103

Lvio Jos Brand 2012

Variveis
Aleatrias
Discretas
104

Variveis Aleatrias Discretas




Noo Geral de Varivel Aleatria

Informalmente, uma varivel aleatria (v.a.) um nmero


associado a um resultado de um experimento.

Exemplo1: E - jogar uma moeda equilibrada duas vezes


= {kk, kc, ck, cc}, onde: k - coroa; c - cara

Eventos kk
probabilidades 1/4

kc ck cc
1/4 1/4 1/4

105

Variveis Aleatrias Discretas





Se definimos X - nmero de caras observadas, vemos que o valor


de X depende do resultado do experimento.
Logo os possveis valores de X so {0, 1, 2}.

Valores de X Eventos correspondentes


0 kk
1 kc ou ck
2 cc
********************************************************
X
0
1
2
1/4 1/2 1/4
P(X = xi)

P( X = x ) = 1
i

xi

106

Variveis Aleatrias Discretas








Exemplo: Ao descrever uma pea manufaturada, podemos


empregar as categorias defeituosae no defeituosa.
Todavia podemos atribuir um nmero a cada resultado nonumrico do experimento.
Por exemplo,
peas no-defeituosas - atribuir o valor 1.
peas defeituosas - atribuir o valor 0.

107

Variveis Aleatrias Discretas




Notao

Utiliza-se letras maisculas para v.as. (por ex., X, Y, Z,...) e para o


valor que elas assumem utiliza-se letras minsculas, como, x, y ,
z,....

Em muitas situaes experimentais, desejamos atribuir um


nmero real x a todo elemento s do espao amostral S.
Isto , X(s) = x o valor da funo X do espao amostral no
espao dos nmeros reais.
Com isto em mente, formulamos a seguinte definio.




108

Variveis Aleatrias Discretas






Definio: Sejam E um experimento e um espao amostral


associado ao experimento.
Uma funo X, que associe a cada elemento s um nmero
real, X(s), denominada varivel aleatria.
Em smbolos: X: R
s X(s)=x
Graficamente,

s.

R
X

. X(s)

109

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas

Uma varivel aleatria discreta se o nmero de valores


possveis de X for finito (isto , {x1, x2,..., xk}) ou se for infinito
enumervel (isto , {x1, x2, ...,xk, ...}).
Obs.: Usualmente, X assumir apenas um nmero finito de
valores.

110

Variveis Aleatrias Discretas















O que queremos?
A cada v.a. atribuir uma noo de probabilidade.
Definimos ento para cada valor xi da v.a. X, o evento, [X = xi] =
{s S tal que X(s) = xi}.
Assim poderemos calcular P([X=xi]), ou simplesmente, P(X = xi).
Voltando ao Exemplo 1:
E - jogar uma moeda equilibrada duas vezes
= {kk, kc, ck, cc}, onde: k - coroa; c - cara
X - v.a. que representa o nmero de caras observadas nos dois
lanamentos.
[X=0] = {kk}
[X=1] = {ck, kc}
[X=2] = {cc}
Logo: P(X=0) = 1/4, P(X=1) = 1/2, P(X=2) =1/4
111

Variveis Aleatrias Discretas




Funo de probabilidade (fp)

A funo que atribui a cada valor xi (i=1, 2,...) da varivel aleatria


X sua probabilidade de ocorrncia denominada de funo de
probabilidade.
Notao utilizada: P(X=x i) = p(xi), i = 1, 2, ....
ou ainda,

X
P(X=xi)=p(xi)


x1
p(x1)

x2
p(x2)

x3 ......
p(x3) ......

Uma funo de probabilidade satisfaz 0 p(xi) 1 e p(xi) = 1

112

Variveis Aleatrias Discretas





Definio 2: Funo de distribuio acumulada


A funo de distribuio acumulada (f.d.a.), ou
simplesmente funo de distribuio de uma varivel
aleatria X definida, para qualquer nmero real x, por:

F ( x ) = P ( X x ) = p ( xi )
xi x

Obs.: O domnio de F todo o conjunto dos nmeros


reais, enquanto que o contradomnio o intervalo [0,1].

113

Variveis Aleatrias Discretas




Voltando ao Exemplo 1: Utilizando a funo de probabilidade


de X, temos que a funo de distribuio acumulada de X
dada por:
Relembrando: X - V.A. que representa o nmero de caras
observadas nos dois lanamentos.
X
0
1
2
P(X = xi)=p(xi)
1/4 1/2 1/4
A funo de distribuio acumulada (f.d.a.) de X :
0, se x < 0
1
, se 0 x < 1

F ( x) = 4
3 , se 1 x < 2
4
1, se x 2

114

Variveis Aleatrias Discretas




Grfico da funo de distribuio acumulada


F(x)

3/4

1/2

115

Variveis Aleatrias Discretas





Exemplo 3: (Magalhes & Lima)


Uma populao de 1000 crianas foi analisada em um estudo
para determinar a efetividade de uma vacina contra um tipo
de alergia. No estudo, as crianas recebiam uma dose de
vacina e aps um ms passavam por um novo teste. Caso
ainda tivessem tido alguma reao alrgica, recebiam outra
dose da vacina. Ao fim de 5 doses todas as crianas foram
consideradas imunizadas.
Os resultados completos esto na tabela abaixo:

Doses
freqncia

1
245

2
288

3
4
256 145

5
66

116

Variveis Aleatrias Discretas





Supondo que uma criana sorteada ao acaso dessa populao,


qual ser a probabilidade dela ter recebido 2 doses?
Soluo.: Utilizando a idia de atribuir probabilidade atravs da
freqncia de ocorrncia, a probabilidade desejada de: 288/1000
= 0,288.
A funo de probabilidade da V.A. nmero de doses recebidas (X)
fica sendo:

X
p(xi)

1
0,245

2
0,288

3
0,256

4
0,145

5
0,066

117

Variveis Aleatrias Discretas








Suponha agora que desejamos calcular a probabilidade da


criana ter recebido at 2 doses de vacina.
Soluo.: O que precisamos obter a funo de distribuio no
ponto 2, ou seja, calcularmos a probabilidade de ocorrncia de
valores menores ou iguais a 2.
Logo,
F(2) = P(X 2) = P(X=1) + P(X=2)= 0,245 + 0,288 =0,533.

118

Variveis Aleatrias Discretas







Note que, tendo em vista que a varivel aleatria s


assume os valores 1, 2, 3, 4 , 5; ento o valor de F no
se altera no intervalo [2 ; 3).
Ou seja, por exemplo, F(2,1)=F(2,5)=F(2,99)= 0,533.
Logo, podemos escrever: F(x) = P(X x) = 0,533 para 2
x < 3.
A funo de distribuio acumulada :
0,
0,245

0,533
F ( x) =
0,789
0,934

se x < 1
se 1 x < 2
se 2 x < 3
se 3 x < 4
se 4 x < 5
se x 5
119

Variveis Aleatrias Discretas


F(x)

Grfico da funo de distribuio acumulada

1
0,939
0,789
0,533
0,245

120

Variveis Aleatrias Discretas








Importante:
i) 0 F(x) 1
ii) Observe que P(X = x i) igual ao salto (pulo) que a
funo F(x) d no ponto xi; por exemplo,
P(X=3) = F(3) - F(3-) = 0,789 - 0,533 = 0,256 .
Generalizando: P(X=xi) = F(xi) - F(xi-)

121

Variveis Aleatrias Discretas







Esperana e Varincia de uma v. aleatria discreta


Sabe-se que para descrever um conjunto de dados utilizase medidas resumo como a mdia, a varincia, etc.
Pode-se fazer o mesmo para descrever um modelo
probabilstico.
Para isto utiliza-se a mdia e a varincia da varivel
aleatria.

122

Variveis Aleatrias Discretas





Definio:
A mdia, valor esperado ou esperana de uma varivel aleatria
discreta X dada pela expresso:

E ( X ) = xi p ( xi )
i

Em palavras: A esperana (ou mdia) da varivel aleatria X,


representada por E(X), uma mdia dos possveis valores que a
varivel aleatria pode assumir ponderados pelas respectivas
probabilidades de ocorrncia.
Notao alternativa: = E(X)

123

Variveis Aleatrias Discretas





Exemplo: A esperana da varivel aleatria X.


X - representa o nmero de caras obtidas no lanamento de 2
moedas.

X
P(X = xi)=p(xi)

0
1/4

1
1/2

E ( X ) = xi p ( xi ) =
i

= 0.P(X=0) +1.P(X=1) + 2.P(X=2)


= 0.(1/4) + 1.(1/2) + 2.(1/4)
= (1/2) + (2/4) = 1

124

Variveis Aleatrias Discretas





Definio: Seja X uma V.A. com mdia E(X) (ou, ).


Ento a varincia de X denotada por Var(X) definida por:
Var(X) = E{( X - E(X) )2} = E{( X - )2} = (xi - )2p(xi)
Em palavras: A varincia de X a soma dos desvios
quadrticos em torno da mdia ponderados pelas
probabilidades de ocorrncia de X.

125

Variveis Aleatrias Discretas





Observaes importantes:
Var(X) = E{( X - E(X) )2} = E(X2) - (E(X))2
(maneira mais fcil para fazer os clculos);
onde:

E ( X 2 ) = xi2 p( xi )
i

Notao alternativa: 2 = Var(X)

126

Variveis Aleatrias Discretas





Definio: O desvio-padro de uma V. aleatria discreta


O desvio padro de X, DP(X), definido por:

= DP( X ) = Var ( X )


Obs.: Em muitas aplicaes prefervel usar o desvio padro ao


invs da varincia, pois ele tem a mesma unidade de medida da
varivel aleatria.

127

Variveis Aleatrias Discretas





Exemplo: A varincia da varivel aleatria X.


X - representa o nmero de caras obtidas no lanamento de 2
moedas.

X
P(X=xi)=p(xi)

0
1/4

1
1/2

Var(X) = E{( X - E(X) )2} =


= E(X2) - (E(X))2 = x2p(x) (E(X ))2 =
= (021/4 + 121/2 + 221/4) 12 = (1/2 + 4/4)-1=
=1/2

128

Variveis Aleatrias Discretas




Variveis Aleatrias Independentes

Relembrando:
Os eventos aleatrios A e B so independentes se e somente se
P(AB)=P(A)P(B).







Definio: v.as. discretas independentes


As variveis aleatrias X e Y, assumindo os valores x1, x2, ......e
y1, y2, ....., respectivamente, so independentes se, e somente se,
para todo par de valores (xi,yj) de X e Y,

Basta que a igualdade acima no seja satisfeita para um par (xi,yj),


para que X e Y no sejam independentes.
A definio acima pode ser estendida para mais de duas v.as.

129

Variveis Aleatrias Discretas




Propriedades do Valor Esperado:

i) Se X = c, onde c uma constante. Ento: E(X) = c.


ii) Suponha que b seja uma constante e suponha que X uma v.a.
Ento: E(bX) = b E(X).
iii) Se a e b so constantes. Ento: E(aX + b) = a E(X) + b.
iv) Sejam X e Y duas v.as quaisquer.
Ento E(X+Y) = E(X) +
E(Y).
v) Se X e Y so v.as. independentes. Ento: E(XY) = E(X) E(Y).






130

Variveis Aleatrias Discretas




Propriedades da Varincia:

i) Se c uma constante. Ento V(c) = 0.


ii) Se c for uma constante. Ento: V(X + c) = V(X). Esta
propriedade intuitivamente evidente, porque somar
uma constante a um resultado X no altera sua
variabilidade, que aquilo que a varincia mede.
Apenas desloca os valores de X para a direita ou para
a esquerda, dependendo do sinal de c.
iii) Se c for uma constante. Ento: V(cX) = c2V(X).
iv) Para quaisquer constantes a e b, V(aX + b) = a2V(X).




131

Variveis Aleatrias Discretas




Propriedades da Varincia

Covarincia entre duas variveis aleatrias

A covarincia e o coeficiente de correlao so medidas da


relao linear entre duas variveis aleatrias.

Definio: Se X e Y so duas v.as, a covarincia entre elas


definida por

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}

Em palavras: a Covarincia o valor mdio do produto dos


desvios de X e Y em relao s suas respectivas mdias.

132

Variveis Aleatrias Discretas




Propriedades da Varincia:

vi) Se X e Y so v.as independentes. Ento: V(X+Y) = V(X) +


V(Y).
vii) Se X e Y so v.as independentes. Ento: V(X - Y) = V(X) +
Var(Y).
viii) Se X e Y no so v.as independentes:
Ento: V(X + Y) = V(X) + V(Y) + 2Cov(X,Y)
V(X - Y) = V(X) + V(-Y) + 2Cov(X,-Y) = V(X) + V(-Y) +
2{E[X(-Y)] - E(X)E(-Y)} =
= V (X) + V(Y) + 2{-E(XY) + E(X)E(Y)} =
V(X) + V(Y) 2Cov(X,Y)




133

Variveis Aleatrias Discretas







Definio: Quando a Cov(X,Y)=0, dizemos que as v.as X e Y so


no correlacionadas.
Proposio: Se X e Y so duas v.as independentes ento
Cov(X,Y)=0.
Ou seja, se X e Y so independentes ento elas so no
correlacionadas.
Ateno: no vale a recproca. Isto , se X e Y so no
correlacionadas (Cov(X,Y)=0) NO IMPLICA que X e Y sejam
independentes.
Comentrio: Se a correlao zero, o que podemos dizer que
no existe dependncia linear entre as variveis.

134

Variveis Aleatrias Discretas




O Coeficiente de Correlao

A Covarincia depende das unidades de medida de X e Y.


O Coeficiente de Correlao no depende das unidades de
medida de X e Y.
Definio: O coeficiente de correlao entre X e Y definido por




Cov( X , Y )
(X ,Y ) =
( X ) (Y )



Isto , o coeficiente de correlao a covarincia dividida pelo


produto dos desvios padres das duas variveis.
O coeficiente de correlao uma medida da relao linear entre
X e Y.
135

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Bernoulli

A Distribuio de Bernoulli
Um experimento particularmente simples um no qual somente 2
possveis resultados existem.
Exemplos:
1) Uma moeda lanada: o resultado ou cara ou coroa.
2) Um dado lanado: ou ocorre a face 5, ou no (neste caso,
ocorrendo uma das faces: 1,2, 3,4 ou 6).
3) Uma pea escolhida, ao acaso, de um lote contendo 300
peas: esta pea defeituosa ou no.
4) Uma pessoa escolhida, ao acaso, dentre 500 pessoas: ou
no do sexo masculino.








136

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Bernoulli

O resultado de cada experimento acima pode ser classificado


como sucesso ou fracasso.
Para cada experimento anterior podemos designar os dois
resultados possveis do experimento por 0 e 1.
Ento, vamos definir uma v.a. X que assume apenas 2 valores: X
= 1 se ocorre sucesso e X = 0 se ocorre fracasso.
Indicaremos por p a probabilidade de sucesso, isto , P(Sucesso)
= p, 0 < p < 1





137

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Bernoulli

Definio: Dizemos que uma v.a. X tem uma distribuio de


Bernoulli (ou uma v.a. de Bernoulli) com parmetro p (com 0 < p
< 1), se X assume somente os valores 0 e 1 com funo de
probabilidade:

Onde: q=1-p. Ou escrevendo de outra maneira: P(X = 1) = p, P(X =


0) = 1 p.
Experimentos que resultam em uma v.a. de Bernoulli so
chamados de ensaios de Bernoulli.

138

Variveis Aleatrias Discretas


Variveis Aleatrias Discretas: Bernoulli

139

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Bernoulli

Exemplo: Experimento - lanamento de um dado equilibrado. Seja


X = 1, se a face 5 ocorre e X = 0 , caso contrrio. Determine a
funo de probabilidade de X.

Soluo:
X
P(X=x)

0
5/6

1
1/6

140

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Binomial

A Distribuio Binomial
Considere agora n ensaios de Bernoulli. Isto , suponha que
repitamos um ensaio de Bernoulli n vezes.
Suponha que as repeties so independentes (resultado de um
ensaio no afeta o resultado de qualquer outro ensaio).
A probabilidade de sucesso em cada ensaio constante (
sempre p).
Um resultado qualquer ser constitudo de uma seqncia de
sucessos e fracassos, ou, de uns e zeros.






141

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Binomial

Definio: Chama-se experimento binomial ao experimento:


i) Que consiste em n ensaios de Bernoulli;
ii) Cujos ensaios so independentes;
iii) A probabilidade de sucesso em cada ensaio sempre igual a p.






Definio: Seja X uma v.a. que representa o nmero de sucessos


em n ensaios (ou experimentos) de Bernoulli. Ento X uma v.a.
binomial com parmetros (n, p). A funo de probabilidade de uma
v.a. binomial com parmetros n e p dada por:

142

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Binomial

Se X uma V.A. binomial com parmetros n e p, denota-se por X


~ bin (n, p).

Esperana de X: E(X) = np
Varincia de X: Var(X) = np(1-p)




Se cada uma das v.as X1, X2, ..., Xn tem distribuio de Bernoulli
com parmetro p e se
X = X1 + X2 + ...+ Xn

Ento X tem distribuio binomial com parmetros n e p.

143

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Binomial

Se X1, X2, ..., Xk so v.a.s independentes e se cada Xi tem


distribuio binomial com parmetros ni (i =1, 2, ..., k) e p.
Ento a soma
X1 + X2 +...+ Xk
tem distribuio binomial com parmetros (n1 + n2 +...+ nk) e p.
(isto , X1 + X2 + ...+ Xk ~ Bin (n1 + n2 +...+ nk, p)).

144

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Poisson

A Distribuio de Poisson
Quando observamos eventos discretos em uma rea de
oportunidade (intervalo de tempo, superfcie, volume, etc) de
modo que se encurtarmos suficientemente a rea em pequenas
unidades:
1) Em cada unidade a probabilidade de observarmos exatamente
um sucesso estvel;
2) Em cada unidade a probabilidade de observarmos mais de um
sucesso zero;
3) A probabilidade de sucesso em cada unidade
estatisticamente independente das demais.
Podemos utilizar a distribuio de Poisson para modelar o
fenmeno observado.

145

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Poisson

Definio: Uma v.a. X uma v.a. de Poisson com parmetro


> 0, se sua funo de probabilidade dada por:

Onde P(X=x) a probabilidade de observarmos x sucessos, dado


que em mdia so esperados sucessos por unidade.

Notao: X ~ Pois ()
Observao: e = 2,71828

146

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Poisson

A distribuio de Poisson fornece um modelo para muitos


fenmenos aleatrios, como por exemplo:









a) o n de acidentes fatais por semana em um dado lugar;


b) o n de falhas de um computador em um dia de operao;
c) o n de partculas radioativas emitidas por unidade de tempo;
d) o n de chamadas telefnicas por hora que chegam a uma
central telefnica de uma empresa;
e) o n de bactrias por unidade de volume de algum fluido;
f) o n de defeitos de algum arame por unidade de comprimento

147

Variveis Aleatrias Discretas




Variveis Aleatrias Discretas: Poisson

A distribuio de Poisson como aproximao da distribuio


Binomial (n,p).

Se n grande, p pequeno, ento

Observao: A aproximao boa se n grande e p pequeno


e de tal forma que np 7.

148

Lvio Jos Brand / Estatstica 2012

Variveis
Aleatrias
Contnuas
149

Variveis Aleatrias Contnuas




Varivel Aleatria Contnua

Uma funo X, definida sobre o espao amostral e assumindo


valores em um intervalo de nmeros reais, chamada uma
varivel aleatria contnua.
Informalmente: X uma v.a. contnua se o nmero de valores
possveis de X for um intervalo ou uma coleo de intervalos. Os
valores da v.a. so, usualmente, resultantes de uma mensurao.





Exemplos:
Medidas de: comprimento, rea, peso, altura, salrio, tempo de
vida de um equipamento, etc.
So quantidades que podem ser modeladas por variveis
aleatrias contnuas.

Variveis Aleatrias Contnuas




Funo Densidade de Probabilidade (fdp)

A fdp um modelo terico para as freqncias relativas de uma


varivel aleatria contnua.
Diz-se que X uma v.a. contnua se existir uma funo f,
denominada funo densidade de probabilidade (fdp), que
satisfaa s seguintes condies:

1) f(x) 0, x;
2) rea sob a curva = 1;
3) P (c < X < d ) = rea entre c e d .
f(x)

x
151

Variveis Aleatrias Contnuas





Observaes Importantes:
1) A condio ii) pode ser escrita como

f ( x ) dx = 1




2) P( a < X < b) representa a rea sob a curva da fdp f entre a e b


(com a < b).
3) Pela forma como atribumos as probabilidades no caso
contnuo, teremos rea zero sob qualquer valor individual, logo,
P(X=x0) = 0, para qualquer x0.
4) Devido a obs. anterior, se X for uma v.a. contnua, ento todas
as probabilidades abaixo so iguais: P(a < X < b), P(a X < b),
P(a < X b), P(a X b), para quaisquer a e b.

Variveis Aleatrias Contnuas




5) Note que a funo de densidade de probabilidade (fdp)


no uma probabilidade, mas uma funo matemtica que
nos auxilia na atribuio de probabilidades.
6) Relembrando:
b

b
f ( x ) dx = Pf = Pf (b) Pf ( a )
a

Teorema Fundamental do Clculo

Primitiva de f

definio

Variveis Aleatrias Contnuas





Definio: Funo de distribuio acumulada


A funo de distribuio acumulada (f.d.a.), ou simplesmente
funo de distribuio de uma varivel aleatria contnua X
definida, para qualquer nmero real x, por:
x

F ( x) = P ( X x) =

f (u )du ,

para todo x real.

Exemplo 5: Seja X uma varivel aleatria contnua com fdp


dada por:

2 x , 0 x 1
f ( x) =
0, c.c.


a) Determine a f.d.a de X . Isto , determine F(x).

Variveis Aleatrias Contnuas


2 x, 0 x 1
f ( x) =
0, c.c.


Resoluo:

0
0du,
-
x
0
2u 2 x 2
F ( x) = 0du + 2udu = 0 +
|0 = x ,
2
0
-
1
x
0
2
0du + 2udu + 0du = 0 + 2u |10 +0 = 1,
2
-
0
1

se x < 0
se 0 x < 1
se x 1

Variveis Aleatrias Contnuas




Logo:
0, se x < 0

F ( x ) = x 2 , se 0 x < 1
1
se x 1

Grfico de F(x):
F(x)

Variveis Aleatrias Contnuas




Importante:
i) 0 F(x) 1, para todo x real
ii) lim x -F(x) = 0
iii) lim xF(x) = 1
iv) No caso de uma V.A. contnua, no h saltos (pulos) na
f.d.a., ou seja, F(x) - F(x-) = 0.
v) Para todos os valores de x para os quais F(x) derivvel
temos que,

dF ( x )
F ' ( x) =
= f ( x)
dx

Variveis Aleatrias Contnuas









Exemplo:
Suponha que
0, se x < 0

F ( x ) = x 2 , se 0 x < 1
1
se x 1

seja a f.d.a. de uma V.A. X.


Determine a fdp de X.
Soluo:
dF ( x)
Utilizando o fato que
F ' ( x) =
= f ( x)
dx

2 x , 0 x 1
temos que f ( x) =
0, c.c.

Variveis Aleatrias Contnuas




Definio: A mdia, valor esperado ou esperana de uma


varivel aleatria contnua X, com funo de densidade f, dada
pela expresso:

E( X ) =

xf ( x)dx

Notao alternativa: = E(X)

Variveis Aleatrias Contnuas




Varincia para variveis aleatrias contnuas

Definio: Se X uma V.A. contnua com mdia E(X). Ento a


varincia de X denotada por Var(X) definida por:

} {

Var ( X ) = E ( X E ( X )) 2 = E ( X ) 2 = ( x ) 2 f ( x)dx




Notao alternativa: 2 = Var(X)


Expresso alternativa: Var(X) = E{( X - E(X) )2} = E(X2) -(E(X))2
(maneira fcil para fazer os clculos); onde:

E( X 2 ) =

2
x
f ( x)dx

Variveis Aleatrias Contnuas





Definio: O desvio-padro de uma V. aleatria contnua


O desvio padro de X, DP(X), definido por:

= DP ( X ) = Var ( X )

Obs.: Em muitas aplicaes prefervel usar o desvio padro ao


invs da varincia, pois ele tem a mesma unidade de medida da
varivel aleatria.

Variveis Aleatrias Contnuas




Exemplo: Gelogos estudaram uma certa regio e


estabeleceram um modelo terico para a varivel X, comprimento
de fsseis da regio (em cm).
Suponha que X seja uma V.A. contnua com a seguinte fdp:
1 x

+
1
,

f ( x ) = 40 10
0,




a) Calcule E(X).
b) Calcule DP(X).

para 0 x 20
caso contrrio

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas











Alguns modelos probabilsticos p/ variveis aleatrias


contnuas
De um modo geral, podemos dizer que as variveis
aleatrias cujos valores resultam de mensurao so V.A.
contnuas.
Exemplos:
Os pesos ou as alturas de pessoas de uma cidade;
A demanda diria de arroz em um supermercado;
O tempo de vida de uma lmpada;
Erros de medida resultantes de experimentos laboratoriais.

Variveis Aleatrias Contnuas


Alguns modelos contnuos





Distribuio Uniforme;
Distribuio Normal;
Distribuio Exponencial;
Distribuio Lognormal;

Variveis Aleatrias Contnuas




Definio: Distribuio Uniforme


Uma varivel aleatria X tem distribuio uniforme no intervalo
[a,b], com < a < b < +, a,b se sua funo de
densidade de probabilidade (fdp) dada por

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas





Distribuio Uniforme
A funo de distribuio de X, F(x), dada por

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas






Se X uniformemente distribuda no intervalo [a,b] ento:


E(x) = (a + b)/2
Var(X) = (b - a)2/12
Verificando

Variveis Aleatrias Contnuas





Distribuio Uniforme
Exemplo 1: Suponha que X seja uma V.A. que represente a
corrente medida em um fio fino de cobre (em mili amperes).
Assuma que X uniformemente distribuda no intervalo
[9mA,11mA]. Qual a probabilidade que a corrente medida
esteja entre 9,5 e 10 mA?
Calcule tambm a esperana de X, a varincia e o desvio
padro.

Variveis Aleatrias Contnuas




Soluo:

Variveis Aleatrias Contnuas








A distribuio Normal
A distribuio normal uma das distribuies mais
importantes em estatstica.
A distribuio Normal foi introduzida pelo matemtico francs
Abraham De Moivre em 1733.
Foi usada por ele para aproximar probabilidades associadas
com v.a.s Binomiais quando n grande.
Todavia, o trabalho de De Moivre foi perdido (por algum
tempo) e, independentemente Karl Gauss desenvolveu a
distribuio Normal 100 anos mais tarde (aproximadamente).
A Normal - tambm conhecida como Gaussiana.

Variveis Aleatrias Contnuas




Definio: Dizemos que a V.A. X tem distribuio Normal


com parmetros e 2, - < < + e 0 < 2 < +, se sua
fdp dada por:

Notao: X ~ N(, 2)

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas




Conhecidos os valores de e , a frmula anterior fica


determinada para qualquer valor de X.

possvel calcular qual a probabilidade (ou a proporo de


valores) em cada intervalo de dados.

Denotamos por N(;) ou N(;2), a distribuio Normal com


mdia e desvio padro (ou varincia 2) isto , (X ~
N(;2)).

Variveis Aleatrias Contnuas




Modelo Normal - A rea sob o grfico de f(x) (ou sob a curva de


freqncia normal) igual a 1, pois f(x) uma fdp. Esta
propriedade vale para quaisquer valores de (,).

rea sob o grfico de f(x) em um intervalo especificado


representa a probabilidade (essencialmente, a proporo de
casos ou freqncia relativa) no intervalo.

Variveis Aleatrias Contnuas




Calculando Probabilidades

Variveis Aleatrias Contnuas




Suponha que X~ N(, 2) e queiramos determinar

A integral acima indicada no pode ser calculada


exatamente, e a probabilidade indicada s pode ser obtida
aproximadamente por mtodos numricos.
Esta tarefa facilitada pelo uso da varivel Z=(X-)/, desta
forma somente necessrio construir uma tabela para a
distribuio normal padro, (N(0,1)).

Variveis Aleatrias Contnuas




Teorema 1:
Se X ~ N(,2) e Y = aX + b, onde a e b so constantes e a 0,
Ento Y ~ N(a+b, a22).

Corolrio 1: Seja X ~ N(, 2).


Ento, Z = (X )/ ~ N (0,1)

Variveis Aleatrias Contnuas




Quando uma distribuio normal tem = 0, e 2 = 1, a


distribuio chamada de distribuio normal padro ou
reduzida.
Observao: A densidade e a funo de distribuio de um V.A.
N(0,1) so denotadas usualmente por e . Assim, a fdp de Z
:

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas




Exemplo 4: Suponha que dimetros de eixos manufaturados


por uma mquina so V.A.s normais com mdia 10cm e
desvio padro 0,1cm. Para uma dada aplicao o eixo deve
satisfazer a especificao que o dimetro esteja entre 9,9 e
10,2cm. Qual a proporo de eixos produzidos por essa
mquina que satisfazem a especificao?

Variveis Aleatrias Contnuas




Soluo:

Variveis Aleatrias Contnuas

Variveis Aleatrias Contnuas





Combinaes lineares de V.A.'s distribudas normalmente


Teorema 2: Se as V.A.'s X1, X2, ....., Xk so independentes e
se Xi ~ N(i,i2), i = 1,...,k, ento a soma

Corolrio 2: Se as V.A.'s X1, X2, ....., Xk so independentes,


se Xi~N(i, i2), i=1,...,k, e se a1, a2, ....., ak so constantes
sendo pelo menos uma das ais no nulas, ento

Variveis Aleatrias Contnuas




Corolrio 3: Suponha que X1, X2, ....., Xn constituam uma


sequncia v.a.s independentes e normalmente distribudas
com E(Xi)= e V(Xi)=2. Seja

a mdia amostral. Ento

Z=

~ N( 0 ,1 )

Variveis Aleatrias Contnuas




Distribuio Exponencial

Definio: A V.A. X tem distribuio exponencial com parmetro


(>0) se a sua fdp :

A fda de X dada por:

194

Variveis Aleatrias Contnuas














Se X ~ Exp(), ento:
(i) E(X) = 1/,
(ii) Var(X) = 1/2
Aplicaes: na engenharia, fsica, biologia, etc.
A distribuio exponencial utilizada como um modelo para o tempo
de vida de vrias coisas. Por exemplo:
Tempo de vida de equipamentos;
Tempo que um tomo radioativo leva para se desintegrar;
O tempo requerido para atender um cliente em um estabelecimento;
Intervalos entre solicitaes de servios;
Tempos de sobrevivncia de espcies; etc.
A exponencial representa o tempo de vida (ou tempo de espera) at
que um evento ocorra.
195

Variveis Aleatrias Contnuas




Exemplo 2: O tempo de vida (em horas) de uma lmpada


uma V.A. T com fdp

Qual a probabilidade de que o tempo de vida da lmpada seja


maior do que a sua mdia?

196

Variveis Aleatrias Contnuas





Soluo:
E(T) = 500 horas (vida mdia da lmpada). Assim,

197

Variveis Aleatrias Contnuas







Exemplo 3: Considere a varivel aleatria X que representa o


intervalo de tempo em minutos entre emisses consecutivas de
uma fonte radioativa, tal que X ~ Exp( ) , com = 0,2 .
a) Calcule a probabilidade de ocorrer emisso em um intervalo
inferior ou igual a 2 minutos.
b) Calcule a probabilidade deste intervalo de tempo ser superior a 7,
sabendo-se que maior que 5.

198

Variveis Aleatrias Contnuas


a)

199

Variveis Aleatrias Contnuas




b) Calcule a probabilidade deste intervalo de tempo ser superior a 7,


sabendo-se que maior que 5.

Adicionalmente, note que:

Este fato uma importante propriedade da distribuio exponencial.


200

Variveis Aleatrias Contnuas





Falta de memria da Distribuio Exponencial


Se X ~ exp() ento

201

Variveis Aleatrias Contnuas




A distribuio lognormal

Para dados que so altamente assimtricos ou que contm


outliers, a distribuio normal, em geral, no apropriada. A
distribuio lognormal, que relacionada com a normal,
frequentemente uma boa escolha para estes conjuntos de dados.
A distribuio lognormal derivada da distribuio normal como
segue:
Se X uma varivel aleatria com mdia e varincia 2, ento a
varivel Y = ex dita ter a distribuio lognormal com parmetros
e 2. Note que se Y tem distribuio lognormal com parmetros
e 2, ento X = lnY tem distribuio normal com mdia e
varincia 2.

202

Variveis Aleatrias Contnuas




Funo densidade de probabilidade da lognormal


1
1

2
(
)
x
exp

ln

2 2

f ( x ) = x 2
0

se x > 0
se x 0

Se Y uma varivel aleatria com distribuio lognormal de


parmetros e 2, ento a mdia E(Y) e a varincia V(Y) so
dadas por
2

E (Y ) = e

V (Y ) = e

2 + 2 2

2 + 2

203

Variveis Aleatrias Contnuas




Note que se Y tem distribuio lognormal, os parmetros e 2


no se referem mdia e varincia de Y.

Exerccio:
Os tempos de vida de certo componente eletrnico so
distribudos com parmetros =1 dia e = 0,5 dia.




a) Encontre o tempo de vida mdio destes componentes.


Encontre o desvio padro dos tempos de vida.
b) Calcule P(Y>4).

204

Lvio Jos Brand 2012

Teorema do
Limite Central

205

Teorema do Limite Central




Definio: Amostra Aleatria (a.a)

Suponha que exista uma distribuio (implcita) para a populao


de tal forma que os dados amostrais possam ser pensados como
v.a.s independentes tendo esta distribuio.
Uma amostra aleatria de tamanho n de uma v.a. X com dada
distribuio um conjunto X1, X2,,Xn de n v.as independentes,
cada uma com a mesma distribuio de X.






Por exemplo,
suponha que se esteja investigando o tempo de vida de lmpadas
produzidas por uma fbrica.
Suponha que o tempo de vida (X) seja Normalmente distribudo.
Espera-se que cada uma das observaes do tempo X1, X2,...,Xn
em uma a.a. de n lmpadas sejam v.a.s independentes com a
mesma distribuio Normal.

206

Teorema do Limite Central




Estatstica

Se X1,X2,...,Xn uma a.a de uma v.a. X, uma estatstica qualquer


funo de X1,X2,...,Xn.
 As estatsticas mais comuns so: a mdia amostral, a proporo
amostral, a varincia amostral, o desvio padro amostral.


O processo de tirar concluses acerca da populao baseado em


dados amostrais faz uso constante destas estatsticas.

207

Teorema do Limite Central




Distribuio de Amostragem

Um dos principais objetivos da anlise de dados utilizar as


estatsticas da amostra, como a mdia aritmtica da amostra e a
proporo da amostra, para estimar os parmetros
correspondentes nas respectivas populaes.
Hipoteticamente, para utilizar a estatstica de amostragem para
estimar o parmetro da populao, deveramos examinar cada
amostra que tivesse possibilidade de ocorrer.
Se essa seleo de todas as amostras possveis fosse
efetivamente realizada, a distribuio dos resultados seria
chamada de distribuio de amostragem.
O processo de generalizao dos resultados dessas amostras
para toda a populao chamado de inferncia estatstica.
Na prtica, uma amostra simples de tamanho predeterminado
selecionada aleatoriamente, a partir da populao.




208

Teorema do Limite Central




O Teorema do Limite Central

O TLC um dos resultados mais extraordinrios em probabilidade.


Informalmente, o teorema afirma que a soma de um grande
nmero de v.a.s independentes possui uma distribuio de
amostragem aproximadamente Normal.
Seja X1, X2,...,Xn uma sequncia de v.a. independentes e
identicamente distribudas, com E(Xi)= e V(Xi)=2.
Faamos X=X1+X2+...+Xn.




Ento, quando n suficientemente grande


X1 + X 2 + ... + X n n
A distribuio de amostragem de Z =
N(0;1).
n

onde E(X 1 + X 2 + ... + X n ) = n e V(X 1 + X 2 + ... + X n ) = n 2


209

Teorema do Limite Central




Distribuio de amostragem da mdia aritmtica

Equivalentemente, com as mesmas hipteses anteriores o TLC


tambm apresentado da seguinte forma:
Seja X1, X2,...,Xn uma sequncia de v.a. independentes e
identicamente distribudas (iid), com E(Xi)= e V(Xi)=2.
n
Xi
Faamos X =




i =1

Ento a distribuio de amostragem da varivel

X
Z=
N(0,1),

quando n for grande

210

Teorema do Limite Central




Aproximao Normal da distribio Binomial

Se X tiver uma distribuio binomial com parmetros n e p, e se


X np
Y=
np (1 p)

Ento, para n grande, Y ter uma distribuio aproximadamente


N(0,1).
n > 10, se p .
n 30, se p 0 ou 1. Na prtica esta aproximao ser razovel
quando np>5 e n(1-p)>5.
Notamos agora duas aproximaes possveis para a dist. Binomial:
- Poisson: quando n grande e p pequeno (np7)
- Normal

211

Teorema do Limite Central




Aproximao Normal da distribuio das propores

Se X for o nmero de sucessos e p for a proporo de sucessos em


uma amostra aleatria de tamanho n, tal que p = X / n , ento
np (1 p )
n Xi
X + X 2 + ... + X n
p = V ( p ) = V = V 1
=
=

2
n
n

i =1 n

p(1 p )
n

e portanto a v.a.

Z=

p p
p (1 p )
n

ter uma distribuio aproximadamente N(0,1), para n grande.


n > 10, se p .
n 30, se p 0 ou 1. Na prtica esta aproximao ser razovel
quando np5 e n(1-p)5.
212

Teorema do Limite Central




Aproximao Normal da distribuio de Poisson

Se X tiver distribuio de Poisson com parmetro suficientemente


grande ento:


Z=

ter uma distribuio aproximadamente N(0,1).


Na prtica, esta aproximao ser razovel quando >18.

213

Teorema do Limite Central


Observao:
1) A velocidade de convergncia depende da distribuio inicial,
sendo mais rpida nas distribuies simtricas.
2) Pelo teorema temos que quanto maior o tamanho da amostra,
melhor a aproximao. Estudos envolvendo simulaes mostram
que em muitos casos valores de n ao redor de 30 fornecem
aproximaes bastante boas na prtica.
3) Nos casos em que a verdadeira distribuio dos dados
simtrica, excelentes aproximaes so obtidas, mesmo com
valores de n inferiores a 30.


214

Teorema do Limite Central




Correo de continuidade

Ao empregar aproximaes Normais para a Binomial ou Poisson


estamos aproximando a distribuio de uma varivel aleatria
discreta por uma contnua. Isto requer cautela quanto s
extremidades dos intervalos considerados.
Se a varivel aleatria contnua, a probabilidade de um ponto
nula (por ex., P(X=3)=0), enquanto para uma varivel aleatria
discreta esta probabilidade pode ou no ser nula.
Para melhorar a aproximao, costume alterar em 0,5 unidades
os valores das extremidades dos intervalos, para mais ou para
menos.

215

Teorema do Limite Central




Correo de continuidade

i) P ( X x ) = P ( X x 0,5)

ii) P ( X

> x) = P( X x + 0,5)

iii) P ( X

x) = P( X x + 0,5)

iv) P ( X

< x) = P( X x 0,5)

216

Lvio Jos Brand / Estatstica 2012

Nes de
Anlise de Risco

217

Noes de Anlise de Risco





Valor Monetrio Esperado


Avaliao Econmica de um Prospecto
= {seco, acumulao pequena, acumulao mdia, acumulao
grande} = {S,P,M,G}.
P(S)=0,90
P(P)=0,06
P(M)=0,03
P(G)=0,01

218

Noes de Anlise de Risco




Avaliao Econmica de um Prospecto

X = {(S, -5), (P, 20), (M, 100), (G, 500)}.


VME = valor monetrio estimado = E(X)
= (-5)(0,90) + (20)(0,06) + (100)(0,03) + (500)(0,01)=
= 4,7 milhes.

219

Noes de Anlise de Risco




Anlise de Risco

Tabela de Retorno
Tabela 1 - Tabela de Retorno para a ao Ai
Rumos de ao alternativos
(aes a tomar)




Eventos

A1

A2

E1

x11

x12

E2

x21

x22

Onde
xij o retorno que ocorre quando o rumo de ao j selecionado e
o evento i ocorre.

220

Noes de Anlise de Risco




Anlise de Risco

rvore de Deciso

A1

A2

E1

x11

E2

x21

E1

E2

x12
x22

221

Noes de Anlise de Risco




Anlise de Risco

Perda de Oportunidade
a diferena entre o lucro mais elevado possvel para um evento
e o lucro real obtido para uma ao empreendida.
Valor Monetrio Esperado (VME) para um rumo de ao j o
lucro para cada combinao Xij do evento i e da ao j, vezes a
probabilidade de ocorrncia do evento Pi, somado para todos os
eventos.




VME j = X ij Pi
i =1





VMEj = valor monetrio esperado da ao j;


Xij = retorno que ocorre quando o rumo de ao j selecionado e
o evento i ocorre;
Pi = probabilidade de ocorrncia do evento i.
222

Noes de Anlise de Risco




Anlise de Risco

Perda de Oportunidade Esperada


n

POE j = lij Pi
i =1





POEj = perda de oportunidade esperada da ao j;


lij = perda de oportunidade que ocorre quando o rumo de ao j
selecionado e o evento i ocorre;
Pi = probabilidade de ocorrncia do evento i.

223

Noes de Anlise de Risco




Anlise de Risco

Lucro esperado em condies de certeza


Representa o lucro que ser realizado se tivermos a informao
perfeita sobre qual evento ir ocorrer.







Valor Esperado da Informao Perfeita (VEIP)


Representa a quantia mxima que estamos dispostos a pagar
para obter a informao perfeita.
VEIP = lucro esperado em condies de certeza valor monetrio
esperado da melhor alternativa.
VEIP = POE (menor)

224

Noes de Anlise de Risco




Anlise de Risco

Relao entre Retorno e Risco

Relao entre retorno e risco j =




VME j
j

VMEj = valor monetrio esperado da ao j;


j = desvio padro para a ao j;

225

Bibliografia
BUSSAB, W. O., MORETTIN, P. A. (2005). Estatstica Bsica. 5 ed.
So Paulo: Saraiva.
CIENFUEGOS, F. Estatstica Aplicada ao Laboratrio. Editora
Intercincia. 2005.
COSTA NETO, P. L. O. Estatstica. So Paulo, 15 ed., Edgard
Blcher, 1997.
LEVINE, D. M., BERENSON, M. L. e STEPHAN, D. (1998).
Estatstica: Teoria e Aplicaes Usando Microsoft Excel em
Portugus. Rio de Janeiro: LTC.

226

Bibliografia
MAGALHES, M.N. e LIMA, A.C.P. (2005). Noes de
Probabilidade e Estatstica, 6 ed. rev. So Paulo: Editora da
Universidade de So Paulo.
MONTOMERY, DOUGLAS C., Estatstica Aplicada e
Probabilidade para Engenheiros, 2 ed. LCT 2003.
SPIEGEL, M.R, Estatstica, 3 ed., Makron Books, 1993, Rio de
Janeiro.
TRIOLA, MARIO F. Introduo Estatstica, 9 ed., LCT, 2005.

227

Você também pode gostar