Você está na página 1de 56

D EPARTAMENTO DE M ATEMTICA

Probabilidades e Estatstica

Notas de apoio s aulas tericas

Paulo Soares 14 de Setembro de 2010

Programa
1. Revises de Estatstica Descritiva e de Anlise Combinatria 2. Noes de probabilidade 1. Experincias aleatrias. Espao de resultados. Acontecimentos. 2. Noo de probabilidade: interpretaes de Laplace, frequencista e subjectivista. Axiomtica de probabilidade e teoremas decorrentes. 3. Probabilidade condicional. 4. Teoremas da probabilidade composta e da probabilidade total. Teorema de Bayes. Acontecimentos independentes. 3. Variveis aleatrias 1. Varivel aleatria. Funo de distribuio. 2. Variveis aleatrias discretas. Funo (massa) de probabilidade. 3. Variveis aleatrias contnuas. Funo densidade de probabilidade. 4. Vectores aleatrios bidimensionais. Funes de distribuio conjunta e marginais. 5. Vectores aleatrios discretos e contnuos. Distribuies conjunta, marginais e condicionais. Independncia entre variveis aleatrias. 4. Distribuies de probabilidade e caractersticas 1. Valor esperado de uma varivel aleatria e de uma funo de uma varivel aleatria. 2. Momentos simples e centrais. Desvio padro e coeficiente de variao. 3. Moda e quantis. 4. Distribuies discretas: Uniforme, Bernoulli, Binomial, Hipergeomtrica, Geomtrica e Poisson. 5. Distribuies contnuas: Uniforme, Exponencial e Normal. 5. Complementos das distribuies de probabilidade 1. Valor esperado de uma funo de um par aleatrio discreto e contnuo. Covarincia e correlao. Valor esperado e matriz de covarincias de um par aleatrio. Valor esperado condicional e propriedades. 2. Relaes entre distribuies. 3. Convergncia em distribuio e Teorema Central do Limite. Aplicaes. 6. Amostragem e estimao pontual 1. Estatstica Descritiva e Inferncia Estatstica. Amostragem aleatria. Estatsticas. 2. Estimao pontual: estimador e estimativa. Propriedades dos estimadores. 3. Mtodo da mxima verosimilhana. 4. Momentos da mdia amostral e de varincias amostrais. Distribuies amostrais da mdia e varincia numa populao normal. Distribuies do qui-quadrado e t-Student. 7. Estimao por intervalos 1. Noes bsicas. Mtodo pivotal. 2. Intervalos de confiana para parmetros de populaes normais. 3. Intervalos de confiana para parmetros de populaes no normais uniparamtricas. 8. Testes de hipteses 1. Noes bsicas. 2. Testes de hipteses para parmetros de populaes normais. 3. Testes de hipteses para parmetros de populaes no normais uniparamtricas. 4. Teste de ajustamento do qui-quadrado de Pearson. 9. Introduo regresso linear simples 1. Modelos de regresso. 2. Mtodo dos mnimos quadrados em regresso linear simples. 3. Propriedades dos estimadores dos mnimos quadrados. 4. Inferncias no modelo de regresso linear simples. 5. Coeficiente de determinao e anlise de resduos na avaliao do modelo.

2. Noes de probabilidade
2.1 Experincias aleatrias. Espao de resultados. Acontecimentos.
Definio
Um procedimento ou conjunto de circunstncias que produza resultados observveis e para o qual: 1. se conhecem todos os resultados possveis previamente sua realizao, 2. mas no possvel prever o resultado de cada realizao, diz-se uma experincia aleatria.

Definio
O conjunto formado por todos os resultados possveis de uma experincia aleatria diz-se o seu espao de resultados ().

Exemplo - Algumas experincias aleatrias


E1 E2 E3 E4 : : : : lanamento de um dado cbico lanamento de duas moedas lanamento de uma moeda at sair "cara" ensaio da durao de uma lmpada nova

Definio
Um qualquer subconjunto de diz-se um acontecimento. Seja = {1 , , n , } um espao de resultados. Destaquemos alguns acontecimentos notveis: acontecimento impossvel

{ i } acontecimento elementar acontecimento certo

Definio
O conjunto de todos os acontecimentos definidos num espao de resultados diz-se o espao de acontecimentos de uma experincia aleatria ( ).

Um espao de acontecimentos uma -lgebra, ou seja: ; 1. A A 2. A1 , , An , Ai .


i=1 +

Definio
Uma funo P : diz-se uma funo de probabilidade . Para um qualquer acontecimento A , o nmero real P ( A) diz-se a probabilidade da ocorrncia de A.

Definio
O terno (, , P ) diz-se o espao de probabilidade de uma experincia aleatria.

2.2 Noo de probabilidade: interpretaes de Laplace, frequencista e subjectivista. Axiomtica de probabilidade e teoremas decorrentes.
Como definir uma funo de probabilidade ou como interpretar o conceito de probabilidade? No h uma definio de probabilidade! antes um conceito primitivo que tem tido, ao longo do tempo, diferentes interpretaes.

Interpretao de Laplace (1749-1827)


Consideremos um espao de resultados formado por n resultados (# = n) e A tal que # A = n A . Ento #A nA = P ( A) = . # n Limitaes finito. Resultados equiprovveis.

Interpretao frequencista
Considerem-se n repeties de uma experincia aleatria e seja n A o nmero de ocorrncias de um acontecimento A nessas n repeties. Ento nA P ( A) = lim . n + n

Limitaes S se aplica se a experincia for repetvel. apenas uma interpretao que no fornece uma regra de clculo.

Exemplo - 1000 lanamentos de uma moeda


1.0

0.8

Frequncia relativa de caras

0.6

0.4

0.2

200

400

600

800

1000

Axiomtica de Kolmogorov (1903-1987)


1. P ( A) 0, A ; 2. P () = 1; 3. sendo A1 , , An , acontecimentos mutuamente exclusivos ento + + Ai P i= = P ( Ai ). 1
i=1

A partir destes axiomas pode-se provar um grande nmero de propriedades de uma funo de probabilidade. Alguns exemplos 1. 2. 3. 4. ) = 1 P ( A), A ; P( A A = P ( A) = 0; A, B : A B P ( A) P ( B); P ( A) 1, A ; ) = P ( A B) = P ( A) P ( A B), A, B ; 5. P ( A B 6. P ( A B) = P ( A) + P ( B) P ( A B), A, B .

Definio
Se P ( A) = 0(1) ento A diz-se um acontecimento quase impossvel (quase certo).

Clculo de probabilidades em espaos de resultados finitos


Seja = {1 , , n }. Quantos acontecimentos podemos definir?
* , , * . Seja A = {1 k}

P ( A) = P

= P * * ( i = 1 { i }) i = 1 ({ i })

Caso particular: resultados equiprovveis P ({ i }) = 1 / n, i. k #A P ( A) = = n #

2.3 Probabilidade condicional.


No vimos ainda como levar em conta no clculo de probabilidades o facto de a ocorrncia de um acontecimento poder afectar a probabilidade de outros acontecimentos ocorrerem.

Definio
Seja B tal que P ( B) > 0. A probabilidade condicional da ocorrncia de A dado que B ocorreu definida por P ( A B) P( A , A . B) = P ( B) Toda a probabilidade condicional!

Teorema
Seja B tal que P ( B) > 0 e defina-se a funo P ( B) de em . Ento B)) um espao de probabilidade. (, , P ( Como consequncia do teorema anterior todas as propriedades de uma funo de probabilidade so satisfeitas por P ( B). Alguns exemplos B) = 1 P ( A B), A ; 1. P ( A 2. P ( B) = 0; 3. A1 , A2 : A1 A2 P ( A1 B) P ( A 2 B); 4. P ( A1 A2 B) = P ( A 1 B) + P ( A 2 B) P ( A 1 A 2 B), A1 , A2 .

2.4 Teoremas da probabilidade composta e da probabilidade total. Teorema de Bayes. Acontecimentos

independentes.
Uma aplicao das probabilidades condicionais = P ( A) P ( B P ( A B) A), se P ( A) > 0 = P ( B) P ( A B), se P ( B) > 0

Teorema da probabilidade composta


P ( A1 A2 An ) = P ( A1 ) P ( A2 A1 ) P ( An 1 A1 A2 An 2 ) P ( An A1 A2 An 1 )

Definio
Uma sucesso de acontecimentos A1 , , An tais que 1. Ai A j = , i j 2.
i=1

Ai =

diz-se uma partio do espao de resultados .

Teorema da probabilidade total


Sendo A1 , , An uma partio de ento P ( B) = P ( B Ai ) P ( Ai ), B .
i=1 n

Teorema de Bayes (1702-1761)


Sendo A1 , , An uma partio de e B tal que P ( B) > 0, ento P(B Ak ) P ( Ak ) P ( A k B) = n , k = 1, , n. i = 1 P ( B Ai ) P ( Ai )

Definio
Os acontecimentos A e B dizem-se independentes se e s se P ( A B) = P ( A) P ( B). Notas: 1. A e B independentes P ( A B) = P ( A), se P ( B) > 0 e P ( B A) = P ( B), se P ( A) > 0; 2. todo o acontecimento independente de e . 3. Podero dois acontecimentos disjuntos serem independentes?

Definio
Seja H tal que P ( H) > 0. Dois acontecimentos A e B dizem-se condicionalmente independentes (dado H) se e s se P ( A B H) = P ( A H) P ( B H). Para mais do que dois acontecimentos possvel definir vrias formas de independncia.

Definio
Os acontecimentos A1 , , An dizem-se completamente independentes se e s se P ( A1 An ) = P ( Ai );
i=1 n

anlogo para qualquer subconjunto com n 1 acontecimentos; quaisquer dois acontecimentos distintos so independentes.

3. Variveis aleatrias
3.1 Varivel aleatria. Funo de distribuio.
1. Em geral, h interesse apenas numa ou mais caractersticas dos resultados de uma experincia aleatria. 2. H ainda interesse em abandonar a formalizao particular de cada experincia aleatria e levar o clculo de probabilidades para um campo mais familiar a anlise de funes reais de varivel real. Variveis aleatrias

Exemplo
Considere uma caixa com 4 peas boas ( B) e 5 peas defeituosas ( D). Suponha que so retiradas 2 peas dessa caixa. Espao de resultados: = { BB, BD, DB, DD} P ( BB) = 4 3 = 9 8 P ( BD) = 4 5 9 8 4 P ( DD) = 5 9 8
1 6 5 = 18 5 = 18

=5 4 = P ( DB) 9 8

Exemplo (continuao)
Seja X ="nmero de peas defeituosas nas 2 extraces". P ( X = 0) = P ( BB) = P ( X = 2) = P ( DD) =
1 6 5 9

P ( X = 1) = P ( BD) + P ( DB) =
5 18

Note-se que P ( X = 0) + P ( X = 1) + P ( X = 2) = P () = 1.

Definio
Seja (, , P ) um espao de probabilidade. Uma funo X : diz-se uma varivel aleatria . A : P ( X A) = P ( X 1 ( A)) = P ( B) em que B = { : X () A}

Definio

Seja X uma varivel aleatria. A funo de distribuio de X definida por F X (x) = P ( X x), x .

Caracterizao de uma funo de distribuio


1. (x, y) 2 : x < y F X (x) F X ( y) (funo no decrescente) 2. lim F X (x) = 0 e lim F X (x) = 1
x x x+
0

x +

3. lim F X (x) = F X (x0 ), x 0 (funo contnua direita)

Outras propriedades de uma funo de distribuio


1. 0 F X (x) 1, x 2. P ( X = x) = F X (x) F X (x ), x

Tipos de variveis aleatrias


Seja D o conjunto (numervel) dos pontos de descontinuidade de F X (x). 1. D e P ( X D) = 1 a varivel aleatria diz-se discreta. 2. D = a varivel aleatria diz-se contnua. 3. D e P ( X D) < 1 a varivel aleatria diz-se mista.

1.0

1.0

1.0

0.5

0.5

0.5

-1

-1

-1

3.2 Variveis aleatrias discretas. Funo (massa) de probabilidade.


Seja D o conjunto de valores de uma varivel aleatria discreta X .

Definio
A funo (massa) de probabilidade de X definida por f X (x) = P ( X = x), { 0, xD . xD

Algumas propriedades da funo de probabilidade

1. f X (x) 0, x 2. f X (x) = P () = 1
xD

Notas: 1. P ( X A) =
xi D A

f X (xi ), A
xi D : xi x

2. F X (x) = P ( X x) =

f X (xi ), x

Exemplo (continuao)
1.0 1.0

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

funo de probabilidade

funo de distribuio

Em muitas situaes o interesse recai sobre uma varivel aleatria que funo de uma outra varivel aleatria, Y = g( X ). Se X uma varivel aleatria discreta ento Y tambm o . Como determinar a funo de probabilidade de Y ?

Exemplo
Seja X uma varivel aleatria com funo de probabilidade 1 , x = 0, 1, 2 5 f X (x) = . 0, caso contrrio Qual a funo de probabilidade de Y = X 2 ?

3.3 Variveis aleatrias contnuas. Funo densidade de probabilidade.


J vimos que, quando uma funo de distribuio no tem pontos de descontinuidade, a varivel aleatria se diz contnua.

Definio
Se existir uma funo f X (x) tal que

F X (x) = f X (t ) dt , x ento f X (x) diz-se a funo densidade de probabilidade da varivel aleatria X .

Algumas propriedades
1. f X (x) 0, x 2. P ( X A) = f X (x) dx, A A 3. P ( X ) = f X (x) dx = 1 4. P ( X = a) = 0, a 5. f X (x) =
dF X (x ) dx +

nos pontos onde F X diferencivel

No caso contnuo uma varivel Y = g( X ) pode ser de qualquer tipo e , em geral, mais simples recorrer funo de distribuio.

Exemplo
Sejam X uma varivel aleatria contnua com funo densidade de probabilidade f X (x) = 1, { 0, x ]0, 1[ . caso contrrio

Quais as funes densidade de probabilidade de Y = log X e de Z = 3 X 2 ? No exemplo anterior ambas as transformaes so bijectivas. Mesmo quando no esse o caso, a funo de distribuio pode conduzir resoluo do problema.

Exemplo
Sejam X uma varivel aleatria contnua com funo densidade de probabilidade f X (x) > 0, x , e Y = X 2 . Qual a funo de distribuio de Y ?

3.5 Vectores aleatrios bidimensionais. Funes de distribuio conjunta e marginais.


O que vimos atrs sobre a funo de distribuio generaliza-se facilmente para o estudo simultneo de duas variveis aleatrias.

Definio
Seja ( X , Y ) uma varivel aleatria bidimensional. Ento F X , Y (x, y) = P ( X x, Y y), (x, y) 2

diz-se a funo de distribuio conjunta de ( X , Y ).

Algumas propriedades da funo de distribuio conjunta


1. 0 F X , Y (x, y) 1, (x, y) 2 2. F X , Y (x + x , y + y ) F X , Y (x, y), x , y 0 3. lim F X , Y (x, y) = 1
x, y + x

4. lim F X , Y (x, y) = 0 e lim F X , Y (x, y) = 0


y

A partir do conhecimento do comportamento conjunto de ( X , Y ) tambm possvel analisar separadamente X e Y uma vez que lim F X , Y (x, y) = FY ( y) e
x + y +

lim F X , Y (x, y) = F X (x).

3.6 Vectores aleatrios discretos e contnuos. Distribuies conjunta, marginais e condicionais. Independncia entre variveis aleatrias.
Definio
Seja ( X , Y ) uma varivel aleatria bidimensional discreta. Ento f X , Y (x, y) = P ( X = x, Y = y), (x, y) 2 diz-se a funo de probabilidade conjunta de ( X , Y ).

Exemplo
Tiram-se duas cartas ao acaso de um baralho de 52 cartas. Sejam X o nmero de figuras (reis, damas ou valetes) e Y o nmero de ases obtidos. Determine a funo de probabilidade conjuntas do par aleatrio ( X , Y ) e calcule os valores da funo de distribuio conjunta nos pontos (0, 1.5), (3, 1) e (5, 4). Y/X 0 1 2 0 1 2

105 / 221 72 / 221 11 / 221 24 / 221 1 / 221 8 / 221 0 0 0

Definio
Seja ( X , Y ) uma varivel aleatria bidimensional contnua. Se existir uma funo f X , Y (x, y) tal que

F X , Y (x, y) = f X , Y (u, v) dv du, (x, y) 2 ento ela diz-se a funo densidade de probabilidade conjunta de ( X , Y ). Notas: 1. f X , Y (x, y) dy dx = 1 2. f X , Y (x, y) 0, (x, y) 2 F X , Y (x, y) = f X , Y (x, y), (x, y) 2 nos pontos onde F X , Y diferencivel 3. x y

Exemplo
Num sistema formado por duas componentes, sejam X e Y as variveis aleatrias que representam as duraes, em anos, da primeira e da segunda componentes, respectivamente. A funo densidade de probabilidade conjunta de ( X , Y ) dada por f X , Y (x, y) = ex y , x > 0 e y > 0 { 0, x 0 ou y 0

1. Qual a probabilidade de ambas as componentes durarem no mximo 2 anos? 2. Qual a probabilidade da primeira componente durar mais do dobro do tempo que a segunda?

Definio
Seja ( X , Y ) uma varivel aleatria bidimensional. Ento f X (x) = f X , Y (x, y) = f X , Y (x, y) dy , x y e = fY ( y) = f X , Y (x, y) f X , Y (x, y) dx , y x dizem-se as funes (densidade) de probabilidade marginais de X e Y , respectivamente.

Definio
Seja ( X , Y ) uma varivel aleatria bidimensional. Ento

f X Y = y (x) = e fY X = x ( y ) =

f X , Y (x, y) fY ( y )

, x e y : fY ( y ) > 0

f X , Y (x, y) f X (x)

, y e x : f X (x) > 0

dizem-se as funes (densidade) de probabilidade condicionais de X dado Y = y e de Y dado X = x, respectivamente.

Definio
Duas variveis aleatrias, X e Y , dizem-se independentes se para todo A, B os acontecimentos X A e Y B so independentes, isto , se P ( X A, Y B) = P ( X A) P (Y B).

Teorema
As variveis aleatrias X e Y so independentes se e s se F X , Y (x, y) = F X (x) FY ( y), (x, y) 2 .

Teorema
As variveis aleatrias X e Y so independentes se e s se f X , Y (x, y) = f X (x) fY ( y), (x, y) 2 . Qual o efeito da independncia sobre as distribuies condicionais das variveis aleatrias?

Teorema
Se X e Y so variveis aleatrias independentes ento as variveis aleatrias U = g( X ) e V = h(Y ) so tambm independentes.

4. Distribuies de probabilidade e caractersticas


4.1 Valor esperado de uma varivel aleatria.
A funo de distribuio ou a funo (densidade) de probabilidade so descries probabilsticas completas de uma varivel aleatria. Pode-se ainda quantificar aspectos particulares do comportamento da varivel aleatria atravs do clculo de algumas medidas numricas.

Definio
O valor esperado ou esperana matemtica da varivel aleatria X definido por E[ X ] = xi f X (xi ) = xf X (x) dx , i caso exista. Nota: o valor esperado de uma varivel aleatria no necessariamente um valor dessa varivel assim como o centro de massa de um corpo pode no pertencer ao prprio corpo. Generalizao: E[g( X )] = g(xi ) f X (xi ) = g(x) f X (x) dx .
i

Algumas propriedades do valor esperado


1. E[c ] = c , c 2. E[aX + b] = aE[ X ] + b, (a, b) 2 (operador linear)

4.2 Momentos simples e centrais. Desvio padro e coeficiente de variao.


Definio
O momento simples de ordem k da varivel aleatria X definido por k = E[ X k ], caso exista. O momento central de ordem k da varivel aleatria X definido por Mk = E[( X E[ X ]) k ], caso exista. Notas: 1. possvel relacionar os momentos simples com os centrais 2. M1 = 0

Definio
A varincia da varivel aleatria X definida por Var [ X ] = E[( X 1 ) 2 ] = E[( X E[ X ]) 2 ], caso exista. O desvio padro de X igual a + Var [ X ].

Algumas propriedades da varincia


1. Var [ X ] 0 2. Var [c ] = 0, c 3. Var [ X ] = 0 P ( X = E[ X ]) = 1 4. Var [aX + b] = a 2 Var [ X ], (a, b) 2 2 5. Var [ X ] = E[ X 2 ] ( E[ X ]) 2 M2 = 2 1

Definio
O coeficiente de variao da varivel aleatria X definido por + CV = Var [ X ] E[ X ] .

4.3 Moda e quantis


Para alm das medidas anteriores h outras que no se baseiam em momentos. Moda(s) de X = argmax x f X (x) Mediana de X = Q0.5 : P ( X Q0.5 ) 0.5 e P ( X Q0.5 ) 0.5. A mediana um caso particular de um conjunto de medidas:

Definio
Para 0 < p < 1, o valor Qp diz-se o quantil de ordem p se P ( X Qp ) p e P ( X Qp ) 1 p. No caso contnuo o clculo de quantis simplifica-se: Quantil de ordem p de X = Qp : F X (Qp ) = f X (x) dx = p
Qp

Exemplo
O jogador A prope um jogo de dados ao jogador B com as seguintes regras: o jogador B paga 5 de aposta e lana um dado; se sair 4 ou 5 o jogador B recebe o valor da aposta;

se sair 6 o jogador B ganha 20. Qual o lucro mais provvel do jogador B numa jogada? Ser este um jogo justo?

4.4 Distribuies discretas.


Distribuio uniforme discreta.

Definio
Seja X uma varivel aleatria que toma valores em D = { x 1 , , x n }. Se esses valores forem equiprovveis ento diz-se que a varivel tem uma distribuio uniforme discreta nesse conjunto. 1, x D n X U ({ x 1 , , x n }) f X (x) = . 0, x D
n n

E[ X ] = xi f X (xi ) = xi
i=1 i=1

1 n

in= 1 xi n in= 1 xi ( n )
2

Var [ X ] = E[ X ] ( E[ X ]) =

in= 1 xi2 n

Distribuio binomial.

Definio
Uma experincia aleatria com apenas dois resultados diz-se um ensaio ou prova de Bernoulli. 1, { 0, se ocorreu um "sucesso"

Seja X =

. se no ocorreu um "sucesso"

A distribuio de X fica definida se conhecermos a probabilidade de "sucesso", 0 < p < 1. Ento, p, x=1 x = 0, 1 p x (1 p) 1 x , . f X (x) = 1 p, x = 0 { 0, caso contrrio 0, caso contrrio

Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio de Bernoulli ou X Ber (p), com 0 < p < 1. Facilmente se mostra que E[ X ] = E[ X 2 ] = p e Var [ X ] = p(1 p). Uma prova de Bernoulli isolada um caso pouco interessante. No entanto, muitas situaes de interesse prtico podem ser descritas como sequncias de repeties de uma prova desse tipo. Consideremos uma experincia aleatria que consiste numa sequncia de realizaes independentes de uma prova de Bernoulli com probabilidade de sucesso p. Que variveis aleatrias poder ter interesse considerar? Seja X = "nmero de sucessos em n realizaes da prova". Temos ento que n x nx f X (x) = , x = 0, 1, , n. x p (1 p)

Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio binomial ou X Bi(n, p), com n e 0 < p < 1. Notas: 1. Bi(1, p) Ber (p); 2. X = Xi onde X i Ber (p) indica o resultado da i realizao;
i=1 n

3. E[ X ] = np e Var [ X ] = np(1 p). Funes de probabilidade binomiais variao de p


Bi(20,0.10)
0.2 0.2

Bi(20,0.30)
0.2

Bi(20,0.50)

0.1

0.1

0.1

11 13 15 17 19

11 13 15 17 19

11 13 15 17 19

Bi(20,0.70)
0.2 0.2

Bi(20,0.90)

0.1

0.1

11 13 15 17 19

11 13 15 17 19

Exemplo
Um teste de escolha mltipla formado por 10 questes com 4 alneas das quais apenas uma est certa. 1. Qual a probabilidade desse aluno responder acertadamente a pelo menos metade das questes? 2. Se se responder a todas as questes ao acaso, qual o nmero mais provvel de respostas certas?

Se X Bi(n, p) representar o nmero de sucessos numa experincia aleatria do tipo referido, qual a distribuio do nmero de insucessos na mesma experincia (Y )? Qual a relao entre as variveis aleatrias X e Y ?

Distribuio hipergeomtrica.
Consideremos uma populao de dimenso N formada por objectos de dois tipos: M com uma caracterstica associada ao "sucesso" e N M sem essa caracterstica. Retirada uma amostra de dimenso n dessa populao, ao acaso mas sem reposio, seja X = "nmero de sucessos na amostra". Ento, M NM ( x )( n x ) f X (x) = , x = max (0, n ( N M )), , min (n, M ). N (n)

Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio hipergeomtrica ou X H( N , M , n), com N , 0 < M < N e 0 < n < N . Notas: 1. A experincia aleatria referida pode ser vista como uma sequncia de n realizaes dependentes de uma prova de Bernoulli mas com probabilidade de sucesso constante igual a p = M ; N 2. E[ X ] = n M N 3. Se N + com p = e Var [ X ] = n
M N

; N N N 1 fixo ento E[ X ] = np, Var [ X ] np(1 p) e ainda M NM ( x )( n x ) N (n) n x nx . p (1 p) x

NM

N n

Aplicao: se N tem um valor elevado e N n ento ao longo das realizaes da prova a proporo de sucessos na populao tem uma variao pequena e podemos considerar que

X Bi(n, p) com p = M / N .

Distribuio geomtrica.
Consideremos uma experincia aleatria que consiste numa sequncia de realizaes independentes de uma prova de Bernoulli com probabilidade de sucesso p at ocorrncia do primeiro sucesso. Seja X = "nmero de realizaes da prova at ao primeiro sucesso". Temos ento que f X (x) = (1 p) x 1 p, x = 1, 2, .

Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio geomtrica (ou de Pascal) ou X Geo(p), com 0 < p < 1. Notas: 1. f X (x) sempre decrescente; 2. E[ X ] =
1 p

e Var [ X ] = 0,

1 p p2

. x<1 k x < k, k

3. F X (x) =

{ 1 (1 p) k ,

Teorema
X Geo(p) P ( X > i + j X > i) = P ( X > j), i, j = 1, 2,

Distribuio de Poisson.

Definio
Consideremos a contagem do nmero de ocorrncias de um evento durante um certo intervalo de tempo (comprimento, rea, etc.). Seja N (t ) o nmero de ocorrncias em ]0, t ] com N (0) = 0. Se 1. os nmeros de ocorrncias em intervalos disjuntos so independentes; 2. P ( N (t + t ) N (t ) = 1) t ; 3. P ( N (t + t ) N (t ) > 1) 0, ento a experincia aleatria diz-se um processo de Poisson com parmetro +.

Definio
Seja X a varivel aleatria que representa o nmero de ocorrncias de um fenmeno por unidade de tempo (comprimento, rea, etc.). Diz-se que X tem uma distribuio de Poisson ou X Poi( ), com + quando f X (x) = e x x! , x = 0, 1, .

em que a taxa mdia de ocorrncias por unidade de tempo. E[ X ] = Var [ X ] = . Funes de probabilidade de Poisson
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 -0.1 1 3 5 7

Poi(0.1)

0.5 0.4 0.3 0.2 0.1

Poi(1)
0.2

Poi(5)

0.1

9 11 13 15 17 19 21

9 11 13 15 17 19 21

9 11 13 15 17 19 21

0.15 0.10 0.05

Poi(10)

0.15 0.10 0.05

Poi(15)

0.08 0.06 0.04 0.02

Poi(30)

9 11 13 15 17 19 21

-3

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

-6

9 14 19 24 29 34 39 44 49 54 59

Teorema
Seja Nt o nmero de ocorrncias durante um intervalo de comprimento t > 0 num processo de Poisson de taxa mdia . Ento, Nt Poi( t ).

Teorema
Seja X Bi(n, p). Ento, quando n + , p 0 e = np constante, tem-se f X (x) e x x! .

Aplicao: quando X Bi(n, p), n suficientemente grande e p suficientemente pequeno ento X Poi(np).
a

4.5 Distribuies contnuas.


Distribuio uniforme contnua.

Definio
Se 1 , ba f X (x) = 0, axb caso contrrio

ento diz-se que X tem uma distribuio uniforme contnua no intervalo [a, b] ou X U (a, b), com a < b . Notas:
b 1 a+b 1. E[ X ] = x dx = a b a 2 2 (b a) 2. Var [ X ] = 12

Distribuio exponencial.

Definio
Se x<0 ento diz-se que X tem uma distribuio exponencial ou X Exp( ), com > 0. Notas: 1. F X (x) = e t dt = [ e t ]0 = 1 e x , x 0 0 1 1 2. E[ X ] = e Var [ X ] = 2
x x

f X (x) =

e x , x 0 { 0,

Teorema
X Exp( ) P ( X > s + t X > t ) = P ( X > s), s, t 0

Teorema
Seja X uma varivel aleatria que representa o nmero de ocorrncias por unidade de tempo (comprimento, rea, etc.) de um qualquer fenmeno e Y uma outra varivel aleatria que representa o tempo entre ocorrncias sucessivas. Se X Poi( ) ento Y Exp( ). O teorema anterior tambm se aplica se a varivel aleatria representar o tempo at primeira ocorrncia do fenmeno.

Distribuio normal.

Definio
Se f X (x) = 1 2 2 exp ento diz-se que X tem uma distribuio normal ou gaussiana ou X N (, 2 ), com e 2 > 0. Notas: 1. E[ X ] = e Var [ X ] = 2 2. f X ( x) = f X ( + x), x > 0 3. Moda=Mediana= Funes densidade de probabilidade gaussianas
N(0,1) 0.8 N(1,2) N(-1,0.2) 0.6

1 2 2

(x ) 2 , x }

0.4

0.2

-3

-2

-1

Teorema
Se X N (, 2 ) e Y = aX + b, com a 0, ento Y N (a + b, a 2 2 ). Caso particular: 1 X Sejam a = e b = , isto , Y = . Ento Y N (0, 1) distribuio normal reduzida ou standard. As funes ( y) = FY ( y) e 1 ( y) encontram-se tabeladas.

5. Complementos das distribuies de probabilidade


Covarincia e correlao. Propriedades.
Definio
Sejam X e Y duas variveis aleatrias. O valor esperado de uma funo g( X , Y ) dado por g(x, y) f no caso discreto X , Y (x , y ), x y E[g( X , Y )] = , g(x, y) f ( x , y ) dy dx , no caso contnuo X, Y caso exista.

Teorema
Sendo X e Y duas variveis aleatrias ento E[ X + Y ] = E[ X ] + E[Y ].

Teorema
Se X e Y so variveis aleatrias independentes ento E[ XY ] = E[ X ] E[Y ].

Definio
Seja ( X 1 , X 2 ) um par aleatrio. O valor esperado condicional de X i dado X j , com i j, definido por xi f no caso discreto Xi X j = x j (x i ), xi , E[ X i X j = x j] = x f (x ) dx i , no caso contnuo i Xi X j = x j i caso exista.

Teorema
Sendo ( X 1 , X 2 ) um par aleatrio tem-se que E[ E[ X i X j ]] = E[ X i ].

Definio
A covarincia de X e Y definida por Cov[ X , Y ] = E[( X E[ X ])(Y E[Y ])].

caso exista. Algumas propriedades da covarincia 1. Cov[ X , Y ] = Cov[Y , X ] 2. Cov[ X , X ] = Var [ X ] 3. Cov[ X , Y ] = E[ XY ] E[ X ] E[Y ] Interpretao da covarincia

E[Y]

E[Y]

E[X]

E[X]

E[Y]

E[Y]

E[X]

E[X]

Teorema
Se X e Y so variveis aleatrias independentes ento Cov[ X , Y ] = 0.

Definio
O coeficiente de correlao de X e Y definido por Cov[ X , Y ] Corr [ X , Y ] = . Var [ X ]Var [Y ] Algumas propriedades do coeficiente de correlao 1. 1 Corr [ X , Y ] 1

2. Corr [aX , Y + b] =

Corr [ X , Y ], a 0 e b a 3. Corr [ X , Y ] = 1 Y = aX + b, com a 0 e b

Combinaes lineares de variveis aleatrias. Relaes entre distribuies.


Definio
Seja X 1 , , X n uma sucesso de variveis aleatrias. Uma combinao linear dessas variveis uma varivel aleatria Y definida por Y = c i Xi , com (c 1 , , c n ) n .
i=1 n

Algumas propriedades: 1. E[Y ] = c i E[ X i ]


i=1 n

2. Cov c i Xi , d j Y j = c i d j Cov[ X i , Y j ] [i = 1 ] i=1 j=1 j=1 3. Var [Y ] = c i2 Var [ X i ] + 2 c i c j Cov[ X i , X j ]


i=1 i=1 j>i n n

Teorema
Sejam X i Bi(ni , p), i = 1, , n, variveis aleatrias independentes. Ento Y = Xi Bi ni , p . (i = 1 ) i=1
n n

Teorema
Sejam X i Poi( i ), i = 1, , n, variveis aleatrias independentes. Ento Y = Xi Poi i . (i = 1 ) i=1
n n

Teorema
Sejam X i N (i , i2 ), i = 1, , n, variveis aleatrias independentes. Ento Y = Xi N
i=1 n

, 2 . (i = 1 i i = 1 i )

Aproximaes entre distribuies: convergncia em distribuio e Teorema do Limite Central.


Em geral, no fcil ou mesmo impossvel determinar a distribuio da soma de uma sucesso de variveis aleatrias independentes!

Definio
Uma sucesso de variveis aleatrias X 1 , , X n , com funes de distribuio F1 , , Fn , converge em distribuio para uma varivel aleatria X ( Xn X ), quando n + , se Fn F X para todo o ponto de continuidade de F X . Exemplos 1. H( N , M , n) Bi(n, p = M / N ) quando N + , M / N e n constantes; 2. Bi(n, p) Poi( = np) quando n + , p 0 e np constante.

Teorema do limite central


Seja X 1 , , X n , uma sucesso de variveis aleatrias no correlacionadas e identicamente distribudas com varincia finita. Sendo Sn = in= 1 Xi , ento, quando n + , Sn E[Sn ] Var [Sn ] Notas: 1. E[Sn ] = E[ X i ] = nE[ X ] e Var [Sn ] = Var [ X i ] = nVar [ X ];
i=1 i=1 n n

N (0, 1).

Sn E[Sn ] 2. Para n suficientemente grande, P x (x). Var [Sn ] Aplicao Sejam X i Ber (p), i = 1, , n, variveis aleatrias independentes e Sn = in= 1 Xi . Tem-se que E[Sn ] = np, Var [Sn ] = np(1 p) e, pelo T. L. C., Sn np N (0, 1). np(1 p) Note-se que Sn Bi(n, p). Para n suficientemente grande ento Sn N (np, np(1 p)).
a

Funes de probabilidade binomiais variao de n


0.3 0.2

Bi(10,0.8)
0.2

Bi(20,0.8)

0.2

Bi(30,0.8)

0.1 0.1

0.1

11 13 15 17 19

-3

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

0.15 0.10

Bi(50,0.8)

0.10

Bi(100,0.8)

0.05 0.05

-5

3 7 11 15 19 23 27 31 35 39 43 47

-11

19 29 39 49 59 69 79 89

Soma de exponenciais
0.4 n=1 0.4 n=2 0.4 n=5

0.2

0.2

0.2

-3

-2

-1 0.4

3 n=10

-3

-2

-1 0.4

3 n=20

-3

-2

-1 0.4

3 n=50

0.2

0.2

0.2

-3

-2

-1

-3

-2

-1

-3

-2

-1

Outra convergncia Se X Poi( ) ento, quando + , X


a

N (0, 1).

Para suficientemente grande ento X N ( , ).

6. Amostragem e estimao pontual


Estatstica descritiva e Inferncia Estatstica. Amostragem aleatria. Estatsticas.
Definio
Uma populao um conjunto de objectos ou indviduos que tm pelo menos uma caracterstica (varivel estatstica) em comum. Exceptuando a realizao de censos e casos em que as populaes so pequenas no , em geral, desejvel ou mesmo possvel conhecer todos os elementos de uma populao!

Definio
Uma amostra um qualquer subconjunto de uma populao. Notao: x 1 , , x n amostra observada de dimenso n Como escolher uma amostra que represente bem uma populao? 1. 2. 3. 4. 5. Amostragem Amostragem Amostragem Amostragem aleatria simples ou amostragem casual aleatria por conglomerados aleatria estratificada determinstica

Definio
A amostragem aleatria simples um mtodo de amostragem em que todos os elementos de uma populao tm a mesma probabilidade de serem seleccionados. Descrio da amostra Estatstica descritiva Descrio da populao Inferncia estatstica Objectivo Estudo de uma varivel estatstica numa populao Estatstica paramtrica Estudo de uma varivel aleatria X com distribuio conhecida, f X (x; ), mas em que k tem um valor desconhecido. Nota: um vector de parmetros e o espao paramtrico (conjunto de valores possveis para ).

Definio
Uma amostra aleatria simples uma sucesso de variveis aleatrias X = ( X 1 , , X n ) independentes e identicamente distribudas de acordo com a

distribuio da varivel estatstica da populao. Nota: cada amostra observada uma concretizao particular da amostra aleatria! Qual a informao amostral? 1. os valores da amostra observada; 2. a distribuio da amostra aleatria : fX (x1 , , x n ; ) = f Xi (xi ; ) = f X (xi ; )
i=1 i=1 n n

O que fazer com a informao amostral? Em geral, essa informao resumida atravs do clculo de estatsticas.

Definio
Uma estatstica uma funo da amostra aleatria, ou seja, dada a amostra aleatria X = ( X 1 , , X n ) uma estatstica T dada por T = T (X ) = g( X1 , , X n ). Alguns exemplos comuns: = 1. X
2

in= 1 Xi n

mdia amostral; varincia amostral (corrigida);

2. S =
2 = 3. Sn

)2 in= 1 ( X i X n1 n )2 i = 1 ( Xi X

4. X(1) 5. X(n)

varincia amostral; n = min ( X 1 , , X n ) mnimo amostral; = max ( X 1 , , X n ) mximo amostral.

Notao: , S 2 , ) 1. T (X ) estatstica ( X 2. t (x ) valor observado da estatstica (x , s 2 , )

Estimao pontual: estimador e estimativa. Propriedades dos estimadores.


Estimao pontual clculo, a partir de uma amostra observada, de valores plausveis para os parmetros da distribuio da varivel estatstica de interesse numa populao.

Definio
Um estimador pontual de um parmetro uma qualquer funo da amostra aleatria que no dependa de parmetros cujo valor seja desconhecido (estatstica).

Definio
Uma estimativa pontual de um parmetro um valor observado de um estimador pontual desse parmetro.

Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio N (, 2 ). Alguns estimadores possveis para so: mdia amostral 1. X 2. mediana amostral 3. moda amostral X(1) + X(n) 4. centro do intervalo de variao amostral 2

Como comparar diferentes estimadores?

Definio
Um estimador pontual T de um parmetro diz-se centrado se e s se E[T ] = , . Nota: d [T ] = E[T ] o desvio ou enviesamento do estimador.

Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao X . Ento, um estimador centrado de E[ X ]; 1. X
2 2. S 2 ( = Sn um estimador centrado de Var [ X ]; 1) 2 3. qual o problema de Sn ?

Definio
O erro quadrtico mdio de um estimador pontual T de um parmetro definido por EQM [T ] = E[(T ) 2 ]. Notas:
2 1. EQM [T ] = Var [T ] + d [T ]

2. Se T um estimador centrado ento EQM [T ] = Var [T ]

E[T] d ( T )

Var[T]

Definio
Sejam T1 e T2 dois estimadores pontuais de um parmetro . Diz-se que T1 mais eficiente do que T2 se EQM [T1 ] EQM [T2 ], e : EQM [T1 ] < EQM [T2 ].

Mtodo da mxima verosimilhana.


Retomemos a distribuio amostral fX (x1 , , x n ; ) = f Xi (xi ; ) = f X (xi ; ).
i=1 i=1 n n

No caso discreto, quando o valor de conhecido, esta funo d-nos a probabilidade de se observar qualquer ponto amostral (x 1 , , x n ).

Definio
A funo (; x ) fX (x ; ) diz-se a funo de verosimilhana.

Definio
O valor

^ = argmax (; x ) diz-se a estimativa de mxima verosimilhana do parmetro . Notas: 1. O estimador associado, quando determinvel analiticamente, diz-se o respectivo estimador de mxima verosimilhana; 2. Frequentemente mais conveniente maximizar log (; x ).

Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio Geo(p), com 0 < p < 1. Determine o estimador de mxima verosimilhana do parmetro p e de q = P ( X > 1).

Teorema (Invarincia dos estimadores de mxima verosimilhana)


Seja ^ o estimador de mxima verosimilhana de um parmetro k e g uma funo de k em p com p k. Ento, o estimador de mxima verosimilhana de g() g(^ ).

Momentos da mdia amostral e de varincias amostrais. Distribuies amostrais da mdia e varincia numa populao normal. Distribuies do qui-quadrado e t-Student.
] = E[ X ]. Temos ainda que Var [ X ] = Var [ X ] / n. Para melhor se avaliar a J vimos que E[ X estimao de um parmetro importante conhecer a distribuio amostral de um estimador ou estatstica.

Teorema
Seja X 1 , , X n uma amostra aleatria de uma populao N (, 2 ). Ento 2 X X N , N (0, 1) ( n) n Para populaes no normais, se a amostra for suficientemente grande, podemos aplicar o Teorema do Limite Central, obtendo-se: E[ X ] a X Var [ X ] a N E[ X ], . N (0, 1) X ( n ) Var [ X ] n

Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio Ber (p). Para n suficientemente grande tem-se p X p(1 p) a a N p, N (0, 1) X ) ( n p(1 p) n

Outros resultados semelhantes para populaes normais

Teorema
Se X N (0, 1) ento Y = X 2 tem uma funo densidade de probabilidade dada por fY ( y ) = com n = 1. (1 / 2) n /2 (n / 2) y n /2 1 e y /2 , y > 0,

Definio
Uma varivel aleatria com a funo densidade de probabilidade atrs diz-se que tem uma distribuio do qui-quadrado, X (2 , n . n) E[ X ] = n e Var [ X ] = 2 n Distribuies do qui-quadrado
n=2 0.4 n=3 n=5 0.3 n=10

0.2

0.1

10

15

Teorema
2 Se X 1 , , X n so variveis aleatrias independentes com X i (1) ento

Y = in= 1 Xi (2 . n) Aplicaes Sejam X 1 , , X n variveis aleatrias independentes com X i N (, 2 ).

Ento 1. 2. in= 1 ( X i ) 2 2 )2 in= 1 ( X i X 2 (2 ; n) = (n 1)S 2 2 (2 . n 1)

Definio
Uma varivel aleatria com a funo densidade de probabilidade n+1 n 1 2 2 ( + ) x 2 1+ , x f X (x) = ( ) n n n ( ) 2 diz-se que tem uma distribuio t-Student, X t(n) , n . E[ X ] = 0, n 2 e Var [ X ] = Distribuies t-Student
0.4 N(0,1) t (2) 0.3 t (5) t (20) 0.2

n , n2

n 3, X N (0, 1)

0.1

-3

-2

-1

Teorema
Se X N (0, 1) e Y (2 so variveis aleatrias independentes ento n) X Y/n t(n) .

Aplicao Seja X 1 , , X n uma amostra aleatria de uma populao N (, 2 ). Ento X t(n 1) S n

7. Estimao por intervalos


Noes bsicas. Mtodo pivotal.
Calculada uma estimativa pontual de um parmetro como avaliar a qualidade dessa estimativa? Complementar uma estimativa pontual de um parmetro com um intervalo de valores que, com maior "confiana", contenha o valor desconhecido do parmetro numa populao. Como construir esses intervalos? Usar funes adequadas de estimadores pontuais e as suas distribuies amostrais. Seja X 1 , , X n uma amostra aleatria de uma populao N (, 2 ) em que o valor de 2 conhecido. o estimador de mxima verosimilhana de . J vimos No difcil mostrar que X 2 N (, / n) ou, equivalentemente, que tambm que X X N (0, 1). n Fixado 0 < < 1 determinemos a e b tais que P a< n ( X <b ) = .

Como a soluo no nica necessrio introduzir um critrio adicional. Se tomarmos, por mera convenincia, a = b temos ento que b = 1 (
1+ . 2 )

Resolvendo as duas desigualdades anteriores em ordem a obtm-se b +b <<X PX = . n n 1 1+ b +b IAC () = X , X , com b = ( 2 ). n n Outras solues intervalos unilaterais: +b a = e b = 1 ( ) IAC () = , X n

+a a = 1 (1 ) e b = + IAC () = X , + n Aplicao Suponhamos que = 1 e que se observou uma amostra de dimenso n = 100 tal que x = 10. Para = 0.95 tem-se b = 1 (0.975) = 1.96 e IC0.95 () = ]9.804, 10.196[. Ser que podemos afirmar que P (9.804 < < 10.196) = 0.95 ?

uma probabilidade associada ao intervalo aleatrio de confiana, ou seja, a proporo de intervalos de confiana obtenveis que contm o valor desconhecido do parmetro. o nvel de confiana associado ao intervalo de confiana, ou seja, uma medida da confiana que podemos ter de que esse intervalo numrico contenha, de facto, o valor desconhecido do parmetro.

Definio
O conjunto (infinito) de todas as amostras possveis de serem obtidas numa populao designa-se por espao amostral e ser representado por .

Definio
Seja X = ( X 1 , , X n ) uma amostra aleatria de uma populao com distribuio f X (x; ). Um intervalo ] I (X ), S(X )[, com I (x ) S(x ) x , diz-se um intervalo aleatrio de confiana para . 1. se I (X ) (S(X )) no depende da amostra aleatria ento o intervalo diz-se unilateral esquerda (direita); 2. dada uma amostra observada x a concretizao do intervalo aleatrio de confiana, ] I (x ), S(x )[, um intervalo numrico designado por intervalo de confiana.

Definio
Seja ] I (X ), S(X )[ um intervalo aleatrio de confiana para um parmetro . Se P ( I (X ) < < S(X )) = , ento diz-se o nvel de confiana do intervalo aleatrio de confiana. O que h de geral no exemplo inicial? Mtodo da varivel fulcral ou mtodo pivotal

Definio
Uma funo da amostra aleatria e do parmetro de interesse, , que no depende de quaisquer outros parmetros com valores desconhecidos e cuja distribuio completamente conhecida diz-se uma varivel fulcral ou piv para o parmetro . E se o valor de 2 for tambm desconhecido? Neste caso a varivel aleatria, que j vimos anteriormente, X t(n 1) S n uma varivel fulcral para e a construo de intervalos de confiana segue os mesmos passos do exemplo anterior.

Intervalos de conana para parmetros de populaes normais.


IC para a varincia de uma populao normal
J vimos atrs que (n 1)S 2 2 (2 . Como anteriormente, determinemos a e b tais que n 1) (n 1)S 2 2 <b ) = , para 0 < < 1.

P a< (

Agora a distribuio da varivel fulcral no simtrica! Possvel soluo intervalo central ou de caudas iguais: 1. determinar a tal que F 2 (a) =
1 ; 2 1 2

(n 1)

2. determinar b tal que F 2

(n 1)

(b) = 1

1+ . 2

P a< (

(n 1)S 2 2

<b

=P

(n 1)S 2 ( b

< 2 <

(n 1)S 2 a )

IAC ( 2 ) =

(n 1)S 2 ] b

(n 1)S 2 a [

Duas populaes normais


Sejam X 1, 1 , , X 1, n1 e X 2, 1 , , X 2, n2 duas amostras aleatrias independentes de
2 2 ) e N (2 , 2 ), respectivamente. populaes N (1 , 1

i N (i , 2 / ni ). Como X 2 so variveis aleatrias independentes 1 e X J vimos que X i ento


2 2 1 2 . X 1 X 2 N 1 2 , + ( n1 n2 )

Equivalentemente, 1 X 2 ) (1 2 ) (X
2 2 2 1 +n 2 n1

N (0, 1),

2 2 e 2 so conhecidas. que pode servir como varivel fulcral para 1 2 quando 1 2 2 e 2 so tambm desconhecidos pode-se mostrar que, se Quando os valores de 1 2 2 = 2 , ento 1

2 ) (1 2 ) 1 X (X
2 2 (n1 1)S1 + (n2 1)S2 1 1 ( n1 + n2 ) n1 + n2 2

t(n1 + n2 2) .

No caso mais geral no conhecida uma soluo exacta mas, se as amostras forem suficientemente grandes, pode-se usar uma varivel fulcral com uma distribuio aproximada 1 X 2 ) (1 2 ) a (X N (0, 1). 2 2 S2 S1 + n1 n2 claro que, neste ltimo caso, os intervalos tm nveis de confiana aproximados!

Intervalos de conana para parmetros de populaes no normais uniparamtricas.


Em geral, a obteno de variveis fulcrais no fcil! Com amostras grandes muitas vezes suficiente o clculo de intervalos com nveis de confiana aproximados recorrendo, por exemplo, ao Teorema do Limite Central. Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio f X (x; ), com n suficientemente grande, e Sn = in= 1 Xi . Pelo T. L. C. temos que Sn E[Sn ] Var [Sn ] = E[ X ] X Var [ X ] = E[ X ] X Var [ X ] n N (0, 1).
a

Uma vez que E[ X ] e Var [ X ] dependem de a varivel anterior pode ser usada como uma varivel fulcral aproximada para .

Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio Ber (p). Para n suficientemente grande temos ento p X a N (0, 1). p(1 p) n Fixado 0 < < 1 ento com a = 1 (
1+ 2 )

tem-se

X p < a = . P a < p(1 p) n

Exemplo (cont.)
p) 2 (X X p < a2 <a p (1 p ) p(1 p) n n a2 n) a2 n) 2<0 p+X

1+

+ 2X

Como (1 + an ) > 0 ento o intervalo aleatrio de confiana aproximado da forma ]k1 , k2 [ onde k1 e k2 so as solues da equao do segundo grau associada inequao anterior.

Exemplo (cont.)
Uma soluo mais simples: pode-se mostrar ainda que p X a N (0, 1). (1 X ) X n Com esta varivel fulcral aproximada tem-se (1 X ) (1 X ) X X , a +a IAC (p) X , X n n com a = 1 (
1+ 2 )

8. Testes de hipteses
Noes bsicas.
Nos dois captulos anteriores vimos como usar os dados observados para determinar um valor ou um conjunto de valores plausveis para um parmetro cujo valor numa populao desconhecido. Nas primeiras seces deste captulo o procedimento inverte-se: escolhido um valor ou um conjunto de valores possveis para um parmetro vamos avaliar se os dados observados suportam ou no essa escolha. Por fim, iremos analisar uma questo de uma natureza diferente: o ajustamento de uma distribuio a uma varivel aleatria.

Procedimento geral de um teste de hipteses paramtricas


Seja X = ( X 1 , , X n ) uma amostra aleatria de uma populao com distribuio f X (x; ), . 1. Hipteses paramtricas Hiptese nula: H0 : 0 Hiptese alternativa: H1 : 1 com = 0 1 e 0 1 = . Tipos de hipteses: H : = 0 hiptese simples H : 0 H : > 0 ou H : 0 hipteses compostas H : < 0 ou H : 0 2. Estatstica de teste Escolha de uma estatstica de teste adequada T (X ) cuja distribuio sob H0 seja conhecida e que, de alguma forma, mea a maior ou menor concordncia entre os dados e a hiptese H0 . 3. Regio crtica Admitindo que H0 verdadeira, define-se uma regio C tal que a P (T (X ) C H0 )

seja pequena. 4. Aplicao do teste de hipteses Observada uma amostra x = (x1 , , x n ) calcula-se T (x ) e tomada uma deciso: se T (x ) C rejeita-se H0 ; caso contrrio no se rejeita H0 .

Avaliao de um teste de hipteses


Numa deciso sobre uma hiptese H0 h dois tipos de erros possveis: Erro de tipo I: rejeitar H0 quando H0 verdadeira Erro de tipo II: no rejeitar H0 quando H0 falsa Sejam () = P (rejeitar H0 H0 verdadeira) = P (T (X ) C 0 ) e () = P (no rejeitar H0 H0 falsa) = P (T (X ) C 1 ).

Definio
A potncia de um teste de hipteses definida por (), P (rejeitar H0 ) = { 1 (), 0 1 .

Definio
O nvel de significncia de um teste de hipteses definido por sup P (rejeitar H0 ) = sup ().
0

Testes de hipteses para parmetros de populaes normais.


Testes de hipteses para a mdia
Seja X 1 , , X n uma amostra aleatria de uma populao N (, 2 ) em que o valor de 2 conhecido. 1. H0 : = 0 contra H1 : 0

Estatstica de teste: Z0 =

= 0 X 0 N (0,

1)

Para definir a regio crtica fixa-se o nvel de significncia do teste, , ou seja, a probabilidade dessa regio sob H0 . C = x 0 1 x : n 1 > { 2 }

Deciso: se z0 C ento rejeita-se H0 para qualquer nvel de significncia superior ou igual a . x 0 1 Nota: z0 = n 1 2 1 0 1 1 x 1 + 0 2 n 2 n 1 1 0 x x + 1 1 2 2 n n z0 C 0 IC1 (), ou seja, no se rejeita H0 a um nvel de significncia se e s se 0 pertence ao IC1 ()! Alternativa Clculo do valor-p

Definio
O valor-p a probabilidade sob H0 de a estatstica de teste tomar valores to ou mais desfavorveis a H0 do que o seu valor observado, ou seja, o menor nvel de significncia que conduz rejeio de H0 . Neste caso o valor-p calculado como 2min { P ( Z0 > z0 ), P ( Z0 z0 )} = 2 P ( Z0 > z0 ) = 2 (1 ( z0 )). Pela definio anterior rejeita-se H0 para nveis de significncia superiores ao valor-p e no se rejeita no caso contrrio. o clculo do valor-p permite que se prescinda de fixar previamente o nvel de significncia de um teste de hipteses. 2. H0 : 0 contra H1 : > 0 Estatstica de teste: Z0 = n 0 = 0 X N (0, 1)

Regio crtica: C = Valor-p: P ( Z0 > z0 )

x: n {

x 0

> 1 (1 ) }

Nota: este teste de hipteses tambm se aplica s hipteses H0 : = 0 contra H1 : = 1 , com 1 > 0 . 3. H0 : 0 contra H1 : < 0 Estatstica de teste: Z0 = n 0 = 0 X N (0, 1) x 0 < 1 () }

Regio crtica: C = Valor-p: P ( Z0 < z0 )

x: n {

Nota: este teste de hipteses tambm se aplica s hipteses H0 : = 0 contra H1 : = 1 , com 1 < 0 . Quando o valor de 2 tambm desconhecido, todas as hipteses anteriores podem ser testadas usando a estatstica de teste X T= n t(n 1) . S A construco dos testes de hipteses inteiramente anloga aos casos anteriores.

Testes de hipteses para a varincia


Neste caso recorre-se varivel fulcral usada no Cap. 7 para 2 e na construo dos testes de hipteses segue-se o procedimento que vimos atrs. No entanto, pode-se pensar que a assimetria da distribuio da estatstica de teste introduz novas dificuldades. Vejamos, num exemplo, que isso no acontece.
2 Consideremos a construo de um teste para as hipteses H0 : 2 = 0 contra 2 . H1 : 2 0
2 (n 1)S 2 2 = 0 (2 n 1) 2 0

Estatstica de teste: Q0 =

Qual dever ser a forma da regio crtica? Sob H0 de esperar que a estatstica tome valores em torno de E[Q0 ] = n 1. Logo, , quer para valores que se afastem dessa medida de localizao da distribuio (2 n 1) valores elevados quer para valores prximos de 0, fornecem evidncia contra a hiptese nula, ou seja,

C =

1 1 s 2 + : q0 < F ( / 2) q0 > F (1 / 2) . 2 2 { } (n 1) (n 1)

Testes de hipteses sobre a igualdade das mdias de duas populaes normais


Nesta seco no h grandes novidades! Para testar hipteses que envolvam a diferena de mdias de duas populaes normais, 1 2 , utilizam-se as variveis fulcrais descritas na Seco 7.2. A construo dos testes de hipteses segue as linhas que foram esboadas anteriormente.

Testes de hipteses para parmetros de populaes no normais uniparamtricas.


Tal como na construo de intervalos de confiana, tambm aqui s iremos considerar testes de hipteses aproximados baseados em estatsticas de teste obtidas pela aplicao do Teorema do Limite Central, ou seja, E[ X ] a X N (0, 1), Var [ X ] n para n suficientemente grande. Um exemplo dever ser suficiente para que o procedimento geral seja bem entendido!

Exemplo
Um fabricante de lmpadas afirma que o tempo mdio de vida das suas lmpadas de 110 3 horas, no mnimo. Numa amostra de 120 lmpadas retiradas ao acaso da produo desse fabricante observou-se um tempo total de vida de 11210 3 horas. Admitindo que o tempo de vida de uma lmpada, em milhares de horas, segue uma distribuio exponencial, avalie a afirmao do fabricante. Seja X = ( X 1 , , X n ) uma amostra aleatria de uma populao com distribuio Exp( ), > 0. Hipteses H0 : 1 / 1 contra H1 : 1 / < 1 Estatstica de teste Como a dimenso da amostra suficientemente grande podemos utilizar T0 = Regio crtica 1 ) N (0, 1), n X (
a

Tendo em conta as hipteses e a estatstica de teste, a regio crtica dever ter a forma
+ 1 C = {x : t0 < ()}.

Assim o valor-p dado por P (T0 t0 ). Aplicao do teste de hipteses x = 112 tem-se t0 = Como i120 =1 i 120 (112 / 120 1) 0.73.

O valor-p igual a P (T0 0.73) = 1 (0.73) = 1 0.7673 = 0.2327. Concluses 1. deve-se rejeitar H0 para nveis de significncia superiores a 0.2327 e no rejeitar no caso contrrio; 2. no h evidncia suficiente para rejeitar a afirmao do fabricante de lmpadas aos nveis de significncia mais usuais (0.01-0.1).

Teste de ajustamento do qui-quadrado de Pearson.


Nos procedimentos estatsticos que vimos at aqui admitiu-se que a distribuio da varivel aleatria de interesse era conhecida a menos do valor de um ou mais parmetros. Iremos agora encarar esse pressuposto como uma hiptese estatstica cuja plausibilidade se pretende avaliar. Consideremos uma amostra aleatria de dimenso n extrada de uma populao X com distribuio f X (x) desconhecida. Pretende-se ento testar as hipteses
0 0 (x) contra H1 : X / fX (x). H0 : X f X

Comecemos por criar uma partio do contradomnio de X , A1 , , Ak , na qual se agrupam os dados observados. Sejam pi0 = P ( X Ai H0 ) e Oi o nmero de observaes na amostra agrupadas na classe Ai , i = 1, , k. Sob H0 , Oi Bi(n, pi0 ) e defina-se Ei = E[Oi H0 ] = npi0 . Note-se que ik= 1 Oi = ik= 1 Ei = nik= 1 pi0 = n. Uma forma de avaliar a plausibilidade de H0 consiste em comparar as frequncias observveis, Oi , com as frequncias esperadas sob H0 , Ei . Para isso utiliza-se a estatstica do qui-quadrado de Pearson k (Oi Ei ) 2 a Q2 = (2 . k 1) Ei i=1

Para um nvel de significncia a regio crtica , naturalmente, C =


1 q 2 + : Q2 > F (1 ) . 2 { } (k 1)

Uma vez que se trata de um teste aproximado necessrio que se verifiquem as seguintes condies: 1. todas as classes com Ei 1; 2. pelo menos 80% das classes com Ei 5. Quando isto no acontece procede-se a um agrupamento das classes.

Exemplo
Voltemos ao exemplo anterior. Para os 120 tempos de vida de lmpadas observados construiu-se o seguinte histograma:
71 70 60 50 40 30 20 12 10 6 2 4 5 2 6 27

Ser razovel admitir que X tem uma distribuio Exp(1)?

H0 : A varivel segue uma distribuio Exp(1) H1 : A varivel no segue uma distribuio Exp(1) Seja pi0 = P ( X (i 1, i] H0 ), i = 1, , 6 e
0 = P ( X > 6 H0 ) = 1 i6= 1 pi0 . p7

Classes oi (0, 1] (1, 2] (2, 3] (3, 4] (4, 5] (5, 6] 71 27 12 6 2 2 120

Como, sob H0 , F X (x) = 1 e x , x 0, ento p i0 = F X (i) F X (i 1) =e


i + 1

e , i = 1, , 6. oi pi0 ei = 120pi0

Classes

Classes (0, 1] (1, 2] (2, 3] (3, 4] (4, 5] (5, 6] (6, + )

oi

pi0

ei = 120pi0 75.854 27.905 10.266 3.777 1.389 0.511 0.297 120

71 0.6321 27 0.2325 12 0.0855 6 0.0315 2 0.0116 2 0.0043 0 120 0.0025 1

Como o nmero de classes 4 e no foram estimados quaisquer parmetros, o nmero de graus de liberdade da distribuio aproximada da estatstica de teste 3. Assim, para um nvel de significncia = 0.05, a regio

Classes (0, 1] (1, 2] (2, 3] (3, + )

oi

pi0

ei = 120pi0 (oi ei ) 2 / ei 75.854 27.905 10.266 5.974 0.3107 0.0294 0.2930 2.7124

71 0.6321 27 0.2325 12 0.0855 10 0.0498 120 1

120 q 2 = 3.3454

crtica C0.05 = {q 2 + : q 2 > 7.815 }. Logo no h evidncia para rejeitar a hiptese nula para 0.05. Alternativa: valor-p = P (Q 2 > 3.3454) 0.30 < valor-p < 0.40. O teste anterior tambm pode ser utilizado para testar as hipteses
0 0 (x; ) contra H1 : X / fX (x, ) H0 : X f X

em que representa um conjunto de m parmetros com valores desconhecidos. Neste caso no possvel calcular as probabilidades p i0 ! Em vez disso, utilizam-se estimativas dessas probabilidades, ^ p i , calculadas a partir da estimativa de mxima verosimilhana de com base na amostra agrupada em classes. A estatstica de teste passa a ser Q2 =
i=1 k 0

^ (Oi Ei ) ^ Ei

(2 . k m 1)

9. Introduo regresso linear simples


Modelos de regresso.
Objectivo: estudo de uma v. a. (Y varivel resposta) incluindo o possvel efeito de uma ou vrias variveis explicativas . Variao observada em Y = Variao previsvel + Variao aleatria Dados: um conjunto de pontos observados ( y i , x i ), i = 1, , n

Exemplo - Exerccio 9.1


Estudo da relao entre a resistncia de um tipo de plstico (Y ) e o tempo que decorre a partir do fim do processo de moldagem at medio da resistncia (x, em horas).
Y 340

290

240

25

35

45

55

65

75

85 x

Modelo de Regresso Linear Simples (MRLS) Yi = 0 + 1 xi + i , i = 1, , n 0 , 1 parmetros do MRLS i erro aleatrio associado a Yi = Y x = xi Pressupostos usuais do MRLS 1. E[i ] = 0, i E[Y x = xi ] = 0 + 1 xi ; 2 2. Var [i ] = 2 , i Var [Y x = xi ] = ; 3. i 's no correlacionados. Interpretao dos parmetros do MRLS 0 = ordenada na origem = E[Y x = 0] 1 = declive da recta = E[Y x = x0 + 1] E[Y x = x0 ] Aplicabilidade e validade do MRLS

Mtodo dos mnimos quadrados em regresso linear simples.


SQ( 0 , 1 ) = i2 = (Yi 0 1 xi ) 2
i=1 i=1 n n

(^ 0 , ^ 1 ) = argmin SQ( 0 , 1 ) estimador de mnimos quadrados SQ( 0 , 1 ) 0 SQ( 0 , 1 ) 1 = = ^ 1 0 ^ 0 0 = =


n Y xi Yi nx i=1 n 2 2 x nx i=1 i

^ Y 1 x

Equao de regresso estimada: ^ E[Y x] = ^ 0 + ^ 1 x Alternativa: mtodo da mxima verosimilhana Pressuposto adicional: i N (0, 2 ), i = 1, n Yi N ( 0 + 1 xi , 2 )

( 0 , 1 , 2 y ) =

1 2 2

1 ( yi ( 0 + 1 xi )) 2 2 2

i=1

os estimadores de mxima verosimilhana de 0 e 1 coincidem com os anteriores e 0 + ^ 1 xi )) in= 1 (Yi (^ n


2

2 ^ MV =

Propriedades dos estimadores dos mnimos quadrados.


^ 1 = in= 1 xi Yi nx Y in= 1 xi2 nx 2 = in= 1 xi Yi in= 1 x Yi in= 1 xi2 nx 2 = ki Yi
i=1 n

onde ki =

(xi x ) n j=1
n

x2 nx 2 j

Tem-se que ki =
i=1 n

in= 1 (xi x ) x 2 nx n 2 j=1 j


n

= 0 e ki xi =
i=1

in= 1 xi (xi x ) x 2 nx n 2 j=1 j

= 1.

E[^ 1 ] = ki E[Yi ] = ki ( 0 + 1 xi ) = 1 .
i=1 i=1

^ ^ 1 x 0 = Y =

in= 1 Yi n

n n n 1 x ki Yi = ( x ki )Yi = w i Yi i=1 i=1 n i=1

0 ] = 0 . com in= 1 w i = 1 e in= 1 w i xi = 0 E[^


2 Pode-se ainda mostrar que E[^ MV ] =

n2 n

2.

Logo,
2 ^ =

0 + ^ 1 xi )) in= 1 (Yi (^ n2

um estimador centrado de .

Inferncias no modelo de regresso linear simples.


Inferncias sobre 1

^ 1 1
2 ^ x i2 nx 2

t(n 2) - varivel fulcral para 1

Hipteses importantes: H0 : 1 = 0 contra H1 : 1 0 Inferncias sobre 0 ^ 0 0 1 2 x 2 ^ + 2 n 2) ( x i nx t(n 2) - varivel fulcral para 0

Estimao da resposta esperada: E[Y0 ] = E[Y x = x 0 ] = 0 + 1 x0 Estimador pontual: ^ E[Y0 ] = ^ 0 + ^ 1 x0 (centrado!) ^ ^ ( 0 + 1 x 0 ) ( 0 + 1 x 0 ) t(n 2) - varivel fulcral para E[Y0 ] 2 1 ) ( x x 2 0 ^ + 2 n ( x nx 2) i Nota: as inferncias podem no ser vlidas fora do intervalo de valores de x considerado extrapolao.

Coeficiente de determinao e anlise grfica de resduos na avaliao do modelo.


H um grande nmero de tcnicas para avaliar a qualidade do ajustamento de um MRLS. Vejamos algumas das mais simples. 0 + ^ 1 xi pode mostrar-se que Sendo ^ yi = ^
2 2 2 ( yi y yi ) + (^ yi y ) = ( yi ^ ) 2 2 ^ ^x ^ ( yi y ) = ( yi ) 0 1 i ) + ( 1 ) (x i x 2 2

SQT = SQE + SQR variao total em Y =variao devida ao erro aleatrio + variao explicada pelo MRLS Coeficiente de determinao: R 2 = explicada pelo MRLS Por definio 0 R 2 1.
SQR SQT

= 1 SQE proporo da variao em Y SQT

R 2 1 indica um bom ajustamento do MRLS R 2 0 indica um mau ajustamento do MRLS R = + R 2 coeficiente de correlao emprico Resduos: yi = yi (^ 0 + ^ 1 xi ), i = 1, , n ri = yi ^ y i so teis para detectar violaes dos pressupostos do Grficos de ri versus x i ou ^ MRLS: 1. 2. 3. 4. dependncia nos erros; heterogeneidade da varincia; falta de normalidade; observaes discordantes.

Exerccio 9.1 Represente graficamente as observaes e desenhe a recta que, no seu entender, melhor se ajusta s observaes. Considere um modelo de regresso linear simples para explicar as observaes. Obtenha a estimativa dos mnimos quadrados dos coeficientes da recta de regresso e desenhe-a no grfico. Estimativas de mnimos quadrados e de mxima verosimilhana: ^ 1 =
y 12 xi yi nx
i=1

2 12 x 2 nx
i=1 i

164752 1248269.92 31486 1248 2

= 2.4167

^ 0 = y 1 x ^ = 269.92 2.416748 = 153.9167 Equao de regresso estimada: 0 + ^ 1 x = 153.92 + 2.42 x E [Y x] = ^


Y 340

290

240

25

35

45

55

65

75

85 x

Calcule o coeficiente de determinao e comente o valor obtido. R =


2 n y ) (i = 1 xi yi nx 2

n 2 2 )(in= 1 yi2 ny 2) (i = 1 xi nx

(9278.08) 2 383823378.92

= 0.9593

Isto , 95.93% da variabilidade total da resistncia do plstico explicada pelo modelo de regresso com o tempo decorrido entre a moldagem e a medio da resistncia. Proceda ao teste da hiptese "O coeficiente angular nulo". Qual o interesse desta hiptese? Relacione-o com o valor do coeficiente de determinao obtido atrs.

Hipteses: H0 : 1 = 0 versus H1 : 1 0. Estatstica do teste: T= ^ 1 1


2 ^ i xi2 10 x 2 1 = 0

t(10) ,

cujo valor observado dado por t0 = 15.35. Valor-p: p = 2 P (T0 > 15.35) = 2.8110 8 . Note-se que p < 0.001 = 20.0005 pois Ft1 (0.9995) = 4.587. (10) Concluso: Rejeita-se H 0 para nveis de significncia de pelo menos 2.8110 8 , ou seja, h evidncia contra H0 , isto , o tempo decorrido entre a moldagem e a medio da resistncia influencia significativamente a resistncia do plstico. Calcule o intervalo de confiana a 95% para o valor esperado da resistncia obtida 48 horas depois de concluda a moldagem. Acha legtimo usar o mesmo procedimento tratando-se de um perodo de 10 horas em vez de 48 horas? Justifique a sua resposta.

Varivel fulcral para E[Y x = x0 ] = 0 + 1 x0 : ^ ^ ( 0 + 1 x 0 ) ( 0 + 1 x 0 ) t(10) W= 2 1 (x x0 ) 2 ^ + 2 n 2 i xi nx ) ( Intervalo aleatrio de confiana para E[Y x = x0 ] a 95%: 1 (x x0 )2 2 1 ^ ^ ^ ( 0 + 1 x0 ) Ft(10) (0.975) + 2 2 ) ( n i xi nx P ( 2.228 < W < 2.228) = 0.95 pois Ft1 (0.975) = 2.228 (10) Estimativa pontual: E [Y x = 48] = 153.91 + 2.416748 = 269.91

Intervalo de confiana para E[Y x = 48] a 95%: (263.035; 276.785) No aconselhvel considerarmos x 0 fora do domnio dos dados observados, visto que no h informao fora desse domnio. O que acontece com x 0 = 10 (16, 80). yi = yi (^ 0 + ^ 1 xi ): Anlise de resduos ri = yi ^
ri 15 10 5 25 -5 -10 -15 35 45 55 65 75 85 x

Você também pode gostar