Você está na página 1de 43

Introdução à Inferência

Introdução à Inferência
Introdução à Inferência
Vimos que quando temos um modelo probabilístico, podemos
usá-lo para fazer previsões sobre a realização das v.a’s
envolvidas no estudo.

Introdução à Inferência
Introdução à Inferência
Vimos que quando temos um modelo probabilístico, podemos
usá-lo para fazer previsões sobre a realização das v.a’s
envolvidas no estudo.

Por exemplo, se sabemos que a probabilidade de que cada


cliente de um banco fique inadimplente é p = 0, 15 e se o banco
realizar empréstimo a 1000 clientes no próximo mês, então
sabemos que, em média, 150 deles ficarão inadimplentes.

Introdução à Inferência
Introdução à Inferência
Vimos que quando temos um modelo probabilístico, podemos
usá-lo para fazer previsões sobre a realização das v.a’s
envolvidas no estudo.

Por exemplo, se sabemos que a probabilidade de que cada


cliente de um banco fique inadimplente é p = 0, 15 e se o banco
realizar empréstimo a 1000 clientes no próximo mês, então
sabemos que, em média, 150 deles ficarão inadimplentes.

E se não conhecemos p? Podemos olhar para o histórico de


empréstimos e tentar estimar essa probabilidade, obtendo então
um modelo probabilístico binomial que seja adequado.

Introdução à Inferência
Introdução à Inferência
Vimos que quando temos um modelo probabilístico, podemos
usá-lo para fazer previsões sobre a realização das v.a’s
envolvidas no estudo.

Por exemplo, se sabemos que a probabilidade de que cada


cliente de um banco fique inadimplente é p = 0, 15 e se o banco
realizar empréstimo a 1000 clientes no próximo mês, então
sabemos que, em média, 150 deles ficarão inadimplentes.

E se não conhecemos p? Podemos olhar para o histórico de


empréstimos e tentar estimar essa probabilidade, obtendo então
um modelo probabilístico binomial que seja adequado.

Ou seja, se tivermos acesso às realizações de uma v.a., podemos


usar os dados observados para tentar estimar o modelo
probabilístico que gerou os dados.
Introdução à Inferência
Introdução à Inferência

O objetivo da inferência estatística, muitas vezes, é estimar um


parâmetro de uma população.

Para isso utiliza-se uma amostra e, por meio de um estimador,


obtém-se uma estimativa para o parâmetro desconhecido.

Introdução à Inferência
Introdução à Inferência

População: é o conjunto completo de elementos sobre os


quais desejamos que recaiam nossas conclusões.
Amostra: subconjunto da população. Sob a ótica da
inferência, a amostra é um conjunto de v.a’s.
Parâmetro: característica da população traduzida em um
valor numérico, muitas vezes desconhecido. Portanto,
parâmetro não é v.a.
Estimador: função das v.a’s que compõem a amostra
utilizada para se estimar o valor de um parâmetro
desconhecido. Como é função de v.a’s, é uma v.a.
Estimativa: é o valor numérico assumido pelo estimador
para uma determinada amostra.

Introdução à Inferência
Introdução à Inferência

Por que fazer estimação?

Por que simplesmente não observamos toda a população e


obtemos o verdadeiro valor do parâmetro desconhecido?

Introdução à Inferência
Introdução à Inferência

Por que fazer estimação?

Por que simplesmente não observamos toda a população e


obtemos o verdadeiro valor do parâmetro desconhecido?

Problemas: custo, tempo, população infinita, etc.

Introdução à Inferência
Introdução à Inferência

Ex. Um candidato contrata um instituto de pesquisa para


estimar a proporção de eleitores que pretendem votar nele. O
instituto entrevista mil eleitores, dos quais 358 afirmam que
pretendem votar naquele candidato.

Introdução à Inferência
Introdução à Inferência

Ex. Um candidato contrata um instituto de pesquisa para


estimar a proporção de eleitores que pretendem votar nele. O
instituto entrevista mil eleitores, dos quais 358 afirmam que
pretendem votar naquele candidato.

População: todos os eleitores


Amostra: os 1000 eleitores entrevistados
Parâmetro: proporção de eleitores que pretendem votar
no candidato
Estimador: proporção amostral
(#pretendem votar no candidato/#entrevistados)
Estimativa: 358/1000=0,358

Introdução à Inferência
Introdução à Inferência

Mais formalmente, podemos considerar cada elemento da


amostra como uma v.a. Xi , i = 1, . . . , 1000, com Xi ∼
Bernoulli(p), em que p é a verdadeira propoção de eleitores que
pretendem votar no candidato.

p é o parâmetro desconhecido.

1000
1 X
O estimador é: Xi
1000 i=1

1000
1 X 358
A estimativa é: xi =
1000 i=1 1000

Introdução à Inferência
Introdução à Inferência

Parâmetro Símbolo Estimador Fórmula


n
1X
Média µ Média µ̂ = X = Xi
n i=1
populacional amostral
n
1X
Proporção p Proporção p̂ = Xi
n i=1
populacional amostral
com Xi ∼P Bernoulli(p)
n
(Xi − X)2
Variância σ2 Variância σ̂ 2 = s2 = i=1
n−1
populacional amostral √
Desvio-padrão σ Desvio-padrão σ̂ = s = s2
populacional amostral

Introdução à Inferência
Introdução à Inferência

Desenvolvendo a fórmula da variância amostral, temos


2
(Xi − X)2
P P 2
2 (Xi − 2Xi X + X )
s = =
n−1 n−1
2 2 2
Xi2 − 2X Xi + nX
P P P 2
Xi − 2nX + nX
= =
n−1 n−1
2
Xi2 − nX
P
=
n−1

que é mais prático para ser calculado.

Introdução à Inferência
Introdução à Inferência

Ex. Uma amostra de 10 peças de uma fábrica é selecionada ao


acaso. Os comprimentos (em mm) dessas peças são 9,2 - 9,5 -
9,6 - 9,6 - 10,1 - 10,3 - 10,4 - 10,5 - 10,5 - 10,7. Obtenha as
estimativas para

a) o comprimento médio
b) a variância
c) a proporção de peças defeituosas (fora do intervalo
[9,5;10,5])

Introdução à Inferência
Introdução à Inferência

Ex. Uma amostra de 10 peças de uma fábrica é selecionada ao


acaso. Os comprimentos (em mm) dessas peças são 9,2 - 9,5 -
9,6 - 9,6 - 10,1 - 10,3 - 10,4 - 10,5 - 10,5 - 10,7. Obtenha as
estimativas para

a. Vamos associar a cada peça observada como uma v.a. Xi , que


é o comprimento da i-ésima peça, i = 1, . . . , 10. Então

9, 2 + 9, 5 + . . . + 10, 7
a) x = = 10, 04
10

Introdução à Inferência
Introdução à Inferência

Ex. Uma amostra de 10 peças de uma fábrica é selecionada ao


acaso. Os comprimentos (em mm) dessas peças são 9,2 - 9,5 -
9,6 - 9,6 - 10,1 - 10,3 - 10,4 - 10,5 - 10,5 - 10,7. Obtenha as
estimativas para

b)

(9,2−10,04)2 +(9,5−10,04)2 +...+(10,7−10,04)2


s2 = 9
= 0, 2716

Ou
(9,22 +9,52 +...+10,72 )−10(10,04)2
s2 = 9
= 0, 2716

Introdução à Inferência
Introdução à Inferência

Ex. Uma amostra de 10 peças de uma fábrica é selecionada ao


acaso. Os comprimentos (em mm) dessas peças são 9,2 - 9,5 -
9,6 - 9,6 - 10,1 - 10,3 - 10,4 - 10,5 - 10,5 - 10,7. Obtenha as
estimativas para

c) Agora, considere Yi = 0 se a i-ésima peça não é defeituosa,


isto é, se Xi está no intervalo [9,5;10,5], e Yi = 1 se é
defeituosa. Então
1+0+0+0+0+0+0+0+0+1
p̂ = = 0, 2
10

Introdução à Inferência
Introdução à Inferência

Como o estimador é uma v.a., é muito útil que conheçamos sua


distribuição. Vamos estudar a distribuição de alguns
estimadores sob condições bastante específicas, mas que são
úteis em muitas situações.

Uma amostra aleatória independente e identicamente


distribuída (a.a.i.i.d.) é um conjunto de v.a’s X1 , . . . , Xn tal que:

Xi e Xj são independentes, para todo i 6= j.


Todas as v.a’s X1 , . . . , Xn têm exatamente a mesma
distribuição.

Introdução à Inferência
Introdução à Inferência

Um estimador G é dito ser não-viciado ou não-viesado para um


parâmetro θ se E(G) = θ, isto é, a estimativa obtida é, em
média, igual ao parâmetro estimado.

O estimador média amostral X é um excelente estimador para


uma média desconhecida, porque além de ser não-viciado,
possui variância pequena.

Isso quer dizer que, além de a estimativa ser em média igual à


média populacional, ela geralmente está próxima do valor
verdadeiro.

Introdução à Inferência
Introdução à Inferência
De fato, vamos considerar uma amostra aleatória i.i.d.
X1 , . . . , Xn tal que E(Xi ) = µ e Var(Xi ) = σ 2 . Então

n
! n
! n
1X 1 X 1X nµ
E(X) =E Xi = E Xi = E(Xi ) = =µ
n i=1 n i=1
n i=1 n

Introdução à Inferência
Introdução à Inferência
De fato, vamos considerar uma amostra aleatória i.i.d.
X1 , . . . , Xn tal que E(Xi ) = µ e Var(Xi ) = σ 2 . Então

n
! n
! n
1X 1 X 1X nµ
E(X) =E Xi = E Xi = E(Xi ) = =µ
n i=1 n i=1
n i=1 n

n
! n
!
1X 1 X ind
Var(X) = Var Xi = 2 Var Xi =
n i=1 n i=1
n
1 X nσ 2 σ2
Var(Xi ) = =
n2 i=1 n2 n

Ou seja, a variância de X é n vezes menor que a variância das


v.a’s que compõem a amostra.
Introdução à Inferência
Introdução à Inferência

No estimador variância amostral, o denominador é n-1 pois, se


dividirmos por n o estimador fica viesado. De fato, pode-se
mostrar que
Pn
− X)2 (n − 1)σ 2

i=1 (Xi
E =
n n
e
Pn
− X)2

i=1 (Xi
E = σ2
n−1

Introdução à Inferência
Introdução à Inferência

Proposição: Seja (X1 , . . . , Xn ) uma amostra aleatória i.i.d. tal


que Xi ∼ N(µ, σ 2 ). Então X ∼ N(µ, σ 2 /n).

Introdução à Inferência
Introdução à Inferência

Ex. O comprimento (em mm) das peças de um lote segue


distribuição normal com média 10 e desvio-padrão 4. O lote é
rejeitado se o comprimento médio de 10 peças escolhidas ao
acaso estiver fora do intervalo [9,11]. Qual a probabilidade de
que o lote seja aceito?

Introdução à Inferência
Introdução à Inferência

Ex. O comprimento (em mm) das peças de um lote segue


distribuição normal com média 10 e desvio-padrão 4. O lote é
rejeitado se o comprimento médio de 10 peças escolhidas ao
acaso estiver fora do intervalo [9,11]. Qual a probabilidade de
que o lote seja aceito?

Xi : comprimento da i-ésima peça, i = 1, . . . , 10.

Xi ∼ N(10,16)

P(9 ≤ X ≤ 11) =?

Introdução à Inferência
Introdução à Inferência

Se Xi ∼ N(10,16), então X ∼ N(10;1,6).


 
P(9 ≤ X ≤ 11) = P 9−10 √
1,6
≤ Z ≤ 11−10

1,6

= P(−0, 79 ≤ Z ≤ 0, 79)

= P(Z ≤ 0, 79) − P(Z ≤ −0, 79)

= P(Z ≤ 0, 79) − (1 − P(Z ≤ 0, 79))

= 0, 78524 − (1 − 0, 78524) = 0, 5705

Introdução à Inferência
Introdução à Inferência

E se a população não tem distribuição normal?

Teorema do Limite Central: Seja (X1 , . . . , Xn ) uma amostra


aleatória i.i.d. tal que E(Xi ) = µ e Var(Xi ) = σ 2 . Então

X − E(X) X − µ n→∞
p = √ ∼ N(0, 1)
Var(X) σ/ n
O TLC garante que, para amostras grandes, a distribuição da
média amostral se aproxima da distribuição normal,
independentemente da distribuição da população.

Em geral, admite-se que a aproximação é boa se n ≥ 30.

Introdução à Inferência
Introdução à Inferência

Intuitivamente, vamos considerar uma v.a. X ∼ Uniforme(0,1).


A f.d.p. de X é f (x) = 1 se x ∈ [0, 1], e f (x) = 0 se x ∈
/ [0, 1].

Introdução à Inferência
Introdução à Inferência

P(0 ≤ X ≤ 0, 2) = P(0, 4 ≤ X ≤ 0, 6) = P(0, 8 ≤ X ≤ 1) =


0, 2

Introdução à Inferência
Introdução à Inferência
Agora vamos considerar uma amostra i.i.d. X1 , . . . , X10 , tal que
Xi ∼ Uniforme(0,1), e seja X a média dos Xi s.

Introdução à Inferência
Introdução à Inferência
Agora vamos considerar uma amostra i.i.d. X1 , . . . , X10 , tal que
Xi ∼ Uniforme(0,1), e seja X a média dos Xi s.
Parece razoável que as probabilidades de que X ocorra em cada
intervalo [0; 0, 2], [0, 4; 0, 6] e [0, 8; 1] sejam as mesmas?

Introdução à Inferência
Introdução à Inferência
Agora vamos considerar uma amostra i.i.d. X1 , . . . , X10 , tal que
Xi ∼ Uniforme(0,1), e seja X a média dos Xi s.
Parece razoável que as probabilidades de que X ocorra em cada
intervalo [0; 0, 2], [0, 4; 0, 6] e [0, 8; 1] sejam as mesmas?

Não! Enquanto X ocorre em qualquer parte com mesma


probabilidade, para que X ocorra, por exemplo, próximo de 0, a
grande maioria dos dez valores da amostra deve estar próxima
de 0.

Introdução à Inferência
Introdução à Inferência
Agora vamos considerar uma amostra i.i.d. X1 , . . . , X10 , tal que
Xi ∼ Uniforme(0,1), e seja X a média dos Xi s.
Parece razoável que as probabilidades de que X ocorra em cada
intervalo [0; 0, 2], [0, 4; 0, 6] e [0, 8; 1] sejam as mesmas?

Não! Enquanto X ocorre em qualquer parte com mesma


probabilidade, para que X ocorra, por exemplo, próximo de 0, a
grande maioria dos dez valores da amostra deve estar próxima
de 0.

De fato, a probabilidade de que X ocorra no intervalo mais


central é maior do que nos intervalos [0; 0, 2] e [0, 8; 1].

Introdução à Inferência
Introdução à Inferência
Agora vamos considerar uma amostra i.i.d. X1 , . . . , X10 , tal que
Xi ∼ Uniforme(0,1), e seja X a média dos Xi s.
Parece razoável que as probabilidades de que X ocorra em cada
intervalo [0; 0, 2], [0, 4; 0, 6] e [0, 8; 1] sejam as mesmas?

Não! Enquanto X ocorre em qualquer parte com mesma


probabilidade, para que X ocorra, por exemplo, próximo de 0, a
grande maioria dos dez valores da amostra deve estar próxima
de 0.

De fato, a probabilidade de que X ocorra no intervalo mais


central é maior do que nos intervalos [0; 0, 2] e [0, 8; 1].

Também parece claro que, quanto maior o tamanho n da


amostra, menores são as chances de que X se distancie da média
0.5. Ou seja, quanto maior n, menor a variância de X.
Introdução à Inferência
Introdução à Inferência

n=100

n=30
Unif(0,1)

Introdução à Inferência
Introdução à Inferência

Ex. Suponha que as maçãs de uma banca de feira pesam em


média 100g, com desvio-padrão de 10g. Se um freguês compra
um caixote com 30 maçãs, qual a probabilidade de que o peso
total das maçãs seja maior que 3,1kg?

Introdução à Inferência
Introdução à Inferência

Ex. Suponha que as maçãs de uma banca de feira pesam em


média 100g, com desvio-padrão de 10g. Se um freguês compra
um caixote com 30 maçãs, qual a probabilidade de que o peso
total das maçãs seja maior que 3,1kg?

Xi : peso da i-ésima maçã, i = 1, . . . , 30

E(Xi ) = 100 e Var(Xi ) = 100

30
!
X
P Xi ≥ 3100 =?
i=1

Introdução à Inferência
Introdução à Inferência
Nesse caso, E(X) = 100 e Var(X) = 100/30. Logo

X − 100 aprox.
√ ∼ N(0, 1)
10/ 30

30
! P30 !
i=1 Xi 3100
X
P Xi ≥ 3100 =P ≥ = P(X ≥ 103, 33)
i=1
30 30
 
103,33−100
=P Z≥ √
10/ 30
= P(Z ≥ 1, 8257)

≈ 1 − P(Z ≤ 1, 83) = 1 − 0, 96638

= 0, 03362

Introdução à Inferência
Introdução à Inferência

Ex. Suponha que a proporção de peças fora de especificação em


um lote seja de 50%. Tomada uma amostra de tamanho 30,
calcule a probabilidade desta amostra fornecer no máximo 60%
de peças defeituosas.

Introdução à Inferência
Introdução à Inferência

Ex. Suponha que a proporção de peças fora de especificação em


um lote seja de 50%. Tomada uma amostra de tamanho 30,
calcule a probabilidade desta amostra fornecer no máximo 60%
de peças defeituosas.

O número X de peças defeituosas dentre as 30 observadas segue


distribuição binomial(30,1/2). Logo,

P(X ≤ 18) = P(X = 0)+P(X = 1)+. . .+P(X = 18) = 0, 8998

Trabalhoso!

Introdução à Inferência
Introdução à Inferência
Podemos resolver usando o TLC. Vamos considerar Xi = 1 se a
i-ésima peça é defeituosa e Xi = 0 se a peça é perfeita.

Então Xi ∼ Bernoulli(0,5) e, portanto, E(Xi ) = 0, 5 e


Var(Xi ) = 0, 25.

30
X
1
A proporção amostral é p̂ = 30
Xi .
i=1

A proporção amostral é uma média de Bernoulli’s. Assim, pelo


TLC
p̂ − 0, 5 aprox.
√ ∼ N(0, 1)
0, 5/ 30

Introdução à Inferência
Introdução à Inferência

Logo,
 
0,6−0,5
P(p̂ ≤ 0, 6) = P Z ≤ √
0,5/ 30
≈ P(Z ≤ 1, 10) = 0, 86433

Como vimos, podemos usar a correção de continuidade para


melhorar esse resultado. Ao invés de considerar até 18 peças
(60% de 30), vamos considerar até 18,5 (o que daria uma
proporção de 0,6167). Assim,
 
0,6167−0,5
P(p̂ ≤ 0, 6167) = P Z ≤ √
0,5 30
≈ P(Z ≤ 1, 28) = 0, 89973

Que é bem mais próximo do valor exato dado pela binomial.

Introdução à Inferência

Você também pode gostar