Você está na página 1de 24

MOQ-13 PROBABILIDADE

E ESTATSTICA
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo

Programa do curso:
Semanas

Contedo

Introduo probabilidade (eventos, espao amostral, axiomas, propriedades, probabilidade condicional e independncia).

Teorema da probabilidade total e teorema de Bayes. Variveis aleatrias. Distribuies de probabilidade. Funes massa,
densidade, e distribuio acumulada. Funes de variveis aleatrias.

Valor esperado e varincia. Momentos de uma varivel aleatria. Funo geradora de momentos. Principais distribuies de
probabilidade discretas (Bernoulli, Binomial e Poisson).

Principais distribuies de probabilidade contnuas (Exponencial negativa e Normal).

Feriado (2/4)

Variveis aleatrias conjuntas, funo distribuio conjunta e marginal. Independncia estatstica. Covarincia e Coeficiente
de Correlao.

Prova

Princpios de estatstica. Estimadores e estimativas. Estimao pontual de parmetros (Mtodos dos momentos e da mxima
verossimilhana). Estatstica Descritiva.

Amostras aleatrias. Distribuies amostrais. Teorema do limite central.

10

Propriedades dos estimadores. Intervalos de confiana (estimao por intervalo). Tamanho da amostra. Princpios de testes
de hipteses.

11

Testes de Hipteses. Inferncia baseada em 2 amostras (entre parmetros de populaes distintas).

12

Testes no-paramtricos (associao, independncia e de aderncia).

13

Feriado (4/6)

14

Prova

15 e 16

Regresso linear simples e correlao.


Aplicaes de modelos de regresso linear.

PRINCPIOS DA
ESTATSTICA
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo

Probabilidade x Estatstica:

PROBABILIDADE

POPULAO

AMOSTRA

ESTATSTICA

 Em probabilidade assume-se que populao em estudo conhecida


 Em estatstica, amostras so utilizadas para se chegar a concluses

Princpios da Estatstica:
Em probabilidade estudamos os modelos probabilsticos que auxiliam na
reduo da realidade:

TESTAR
ADERNCIA
REALIDADE
MODELO

HIPTESES

ESTIMAO
DOS
PARMETROS

FAZER INFERNCIAS
EM RELAO
REALIDADE

Princpios da Estatstica:
No procedimento descrito:
 A REALIDADE a POPULAO (totalidade das observaes na qual
estamos interessados)
Na reduo da realidade a HIPTESE que cada observao em uma
populao um valor de uma varivel aleatria X, com distribuio de
probabilidade f(x). Assim,
Quando nos referirmos a uma populao f(x) queremos dizer uma
populao cujas observaes so valores de uma varivel aleatria que
tem uma distribuio de probabilidade f(x)
O valor esperado e a varincia da varivel aleatria o valor esperado e
a varincia da populao correspondente

Princpios da Estatstica:
Objetivo: Fazer inferncias em relao populao (caracterizar e
eventualmente definir regras de deciso sobre uma populao conhecendo
apenas parte dela)

TESTAR
ADERNCIA

POPULAO
AMOSTRA

HIPTESES

ESTIMAO DOS
PARMETROS

FAZER INFERNCIAS EM
RELAO A POPULAO

Princpios da Estatstica:
Def: Amostra um subconjunto da populao.
O processo de amostragem deve assegurar a representatividade da amostra
em relao populao de onde foi retirada.
Mtodos de amostragem:
 Amostragem aleatria: iid
 Amostragem estratificada
 Amostragem por agrupamentos

Princpios da Estatstica:
Def: Ao selecionar uma amostra de tamanho n de uma populao f(x),
define-se a varivel aleatria Xi, i =1,,n, para representar o i-simo valor
amostral. As variveis aleatrias X1, X2, , Xn sero uma amostra aleatria
da populao f(x), com valores numricos x1, x2, , xn se os valores
amostrais foram obtidos repetindo-se o experimento n vezes
independentemente, sob as mesmas condies. Portanto:
 Os Xis so independentes
 Todas Xi tem a mesma distribuio de probabilidade

Quando as amostras so feitas com reposio ou de uma populao


infinita, essas condies so satisfeitas (as amostras so iid).

Princpios da Estatstica:
Distribuio de probabilidade de uma amostra aleatria:
Como X1, X2, , Xn uma amostra aleatria da populao f(x), sua
distribuio de probabilidade conjunta

f (x1 , x 2 ,...x n ) = f (x1 ). f (x 2 )... f (x n )


POPULAO
AMOSTRA
HIPTESES:
f(x) e
independncia

ESTIMAO DOS
PARMETROS

Portanto, essa distribuio caracterizada pelos parmetros populacionais


E[X] e Var[X] que so constantes no afetadas ou influenciadas pelas
observaes da amostra aleatria.

MTODOS DE
ESTIMAO DE
PARMETROS
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo

Mtodos de estimao pontual de parmetros:


Um mtodo de estimao de parmetros sugere como obter estimadores
em casos especficos (quando faz-se alguma hiptese sobre a distribuio
da populao, por exemplo).
Dois dos mtodos mais utilizados em estimao de parmetros so:
 Mtodo da mxima verossimilhana
 Mtodo dos momentos

Mtodo da mxima verossimilhana:


O MLE um mtodo para estimao dos parmetros a partir de uma
amostra aleatria proposto por Fisher em 1912.
Def: Funo de Verossimilhana: seja X1,,Xn uma amostra aleatria com
f.d.p. conjunta f(x1,,xn ; 1,, m) em que 1,, m tem valores
desconhecidos. Quando x1,,xn so os valores observados e a f.d.p.
conjunta vista como em funo de 1,, m esta chamada de funo de
verossimilhana.
^

 Procedimento: a estimativa de mxima verossimilhana de 1,, m so os


^

valores de i que maximizam a funo de verossimilhana.


Por esse mtodo obtm-se os valores de 1,, m que maximizam o valor
que torna a amostra observada a mais provvel.

Mtodo dos momentos:


A idia bsica deste mtodo igualar os parmetros obtidas a partir das
amostras aos parmetros esperados da populao (por exemplo, a mdia
amostral ao valor esperado populacional).
Def: Momento populacional: seja X1,,Xn uma amostra aleatria de uma
populao com f.d.p. f(x). Para k=1,2,3, o k-simo momento populacional
(ou seja, da distribuio f(x)) E[Xk].
Def: Momento amostral: seja X1,,Xn uma amostra aleatria de uma
populao com f.d.p. f(x). Para k=1,2,3, o k-simo momento amostral
N

Mk =

X ik

i =1

Mtodo dos momentos:


 Procedimento:
 Seja X1,X2,,Xn uma amostra aleatria de uma distribuio com
f.d.p. f(x;
1,, m), em que 1,, m so parmetros cujos valores so
desconhecidos.
^

 Os estimadores de momento 1,, ^m so obtidos igualando-se os


primeiros m momentos amostrais aos m momentos populacionais
correspondentes e resolvendo para 1,, m.
DISTRIBUIO
E[X]
VAR[X]
Binomial [X~Bin(n,p)]
n.p
n.p.(1-p)
Poisson [X~Poi( )]

2
Normal [X~N( , )]
Uniforme [X~Uni(a , b )] (a +b)/2 (b-a )2/12
Exponencial [X~Exp( )]
1/

1/
2
Gamma [X~Gamma(a ,b)] a .b
a .b2

m
1
1
2
2
1
2

Obs: n conhecido

ESTATSTICA
DESCRITIVA
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo

Anlise exploratria de dados:


 Uma vez coletados, necessrio fazer sua anlise exploratria com
o objetivo de:
Checar sua qualidade (presena de outliers). Formas:
 Estatsticas de sumarizao (de posio e de disperso)
 Anlise grfica (histograma, box-plot)
 A anlise exploratria de dados importante pois alm de
proporcionar o maior entendimento do problema e dos dados
coletados, previne contra erros (concluses equivocadas).

Histograma:
- Grfico de barras contguas;
- Base proporcional ao intervalo da classe;
- rea proporcional a frequncia da classe;
- Pode-se usar tanto a frequncia (ni) como a frequncia relativa (fi)

Histograma:
 Deteco de outliers

Medidas de posio:
 So utilizadas quando se quer resumir os dados apresentando
apenas um ou alguns valores que sejam representativos de toda
srie.
 Mdia (aritmtica): a soma das observaes divididas pelo nmero
delas, ou seja,
k

X =

njX j
Xi
j =1
i =1

em que n o nmero de obsevaes,


x1,...,xn so as observaes,

= fjX
j =1

nj o nmero de informaes iguais a xj,


fj a frequncia relativa da observao xj.

 Mediana: realizao que ocupa a posio central da srie de


observaes, quando esto ordenadas em ordem crescente.

Medidas de posio:

Mdia

Mediana

A comparao entre a
mdia e a mediana indica
a assimetria da
distribuio.

MEDIANA:  Muito interessante para grande massa de dados.

 Menos suscetvel a valores extremos (mais indicada que


a mdia em casos de grande disperso)

Medidas de disperso:
 So utilizadas quando se quer dar informao sobre a variabilidade
do conjunto de observaes.
n

2
(
)
Xi X

 Varincia:

s2 ( X ) =

i =1

n 1
n

2
(
)
X

X
i

 Desvio padro: s ( X ) =

i =1

n 1

= s2 ( X )

Quantis e box-plot:
 QUARTIS: Q1, Q2, Q3 Dividem os valores ordenados em quatro
subconjuntos com iguais nmeros de elementos.

 DECIS: D1, D2, , D10 Dividem os valores em 10 subconjuntos.


 PERCENTIS:P1,P2, ,P100Dividem os valores em 100 subconjuntos.

Para casa:
Lista de Exerccios 6 (site: www.mec.ita.br/~rodrigo/)
Leitura: Devore caps. 1 e 6.2 (Mtodos de Estimativa Pontual)
ou Walpole et al. caps. 1 e 9.14 (Estimao de MV)

Você também pode gostar