Você está na página 1de 24

Inferência Estatı́stica: Introdução e Distribuição Amostral

Inferência Estatı́stica: Introdução


e Distribuição Amostral

Profª.: Fernanda Clotilde

Aula preparada para turma de Inferência Estatı́stica


do Departamento de Estatı́stica da Universidade Estadual da Paraı́ba.

Campina-Grande
Agosto de 2023 1 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Introdução

O que é estatı́stica?
Definição 1: A Estatı́stica hoje consiste numa metodologia cientı́fica para
obtenção, organização e análise de dados, provenientes das mais diversas
áreas, cujo objetivo principal é auxiliar na tomada de decisões em situações
de incerteza.

Basicamente podemos dividir a estatı́stica em três partes:

Estatı́stica Descritiva: Etapa inicial da análise, utilizada para


descrever, organizar e resumir os dados coletados.

Probabilidade: A teoria das probabilidades nos permite modelar


fenômenos aleatórios, ou seja, aqueles em que está presente a
incerteza. É uma ferramenta fundamental para a Inferência
Estatı́stica.

Inferência Estatı́stica: Um conjunto de técnicas baseadas em


probabilidade, qu a partir de dados amostrais nos permite tirar
conclusões sobre a população de interesse.
2 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Introdução

3 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Introdução

O objetivo principal da Inferência Estatı́stica é fazer afirmações sobre


caracterı́sticas de uma população baseando-se em resultados de uma
amostra.

É o que chamamos de inferência indutiva que parte do particular
para o geral.

Na inferência estatı́stica a incerteza sempre está presente. No


entanto, se o experimento for conduzido de acordo com certos
princı́pios essa incerteza pode ser medida.

A partir da observação de alguns dados experimentais, a inferência


estatı́stica realiza a análise e interpretação desses dados com o
objetivo de generalizar e prever resultados, utilizando-se da Teoria
das Probabilidades.

4 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos

Conceitos Básicos

Definição 2: População é um conjunto de valores de uma caracterı́stica


(uma variável) observável associada a uma coleção de indivı́duos ou objetos
de interesse.

Definição 3: Amostra é qualquer parte (ou subconjunto) da população.

Exemplo: Consideremos uma pesquisa para estudar os salários dos 500


funcionários da Companhia MB. Seleciona-se uma amostra de 36 in-
divı́duos, e anotam-se os seus salários. Nesse caso:

variável de estudo: o salário dos funcionários;

população: os 500 funcionários da Companhia MB;

amostra: os 36 funcionários selecionados.

5 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos

Para usar dados da amostra para fazer inferências sobre a população


é necessário fazer algumas suposições sobre a relação entre elas.

Uma suposição que muitas vezes é bastante razoável, é que há uma
distribuição de probabilidade subjacente de tal forma que os valores
mensuráveis dos itens na população pode ser pensado como sendo
variáveis aleatórias independentes tendo esta distribuição.

Se os dados da amostra são escolhidos de forma aleatória, então é


razoável supor que eles também são valores independentes dessa
distribuição.

6 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos

Definição 4: Seja X uma variável aleatória com função densidade (ou


função de probabilidade) que denotaremos por f (x, θ) em que θ é um
parâmetro desconhecido. Chamamos de inferência estatı́stica o problema
que consiste em especificar um ou mais valores para θ, baseado em um
conjunto de valores observado de X .

Vamos assumir que a distribuição da variável aleatória X pertence a certa


famı́lia de distribuições em que um particular elemento é especificado
quando o valor do parâmetro é especificado.

7 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos

Em Estimação o objetivo é obter um valor plausı́vel para θ. No caso de


Teste de Hipóteses é verificar a validade de afirmação feitas sobre θ.

8 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos

Definição 5: Uma Amostra Aleatória Simples de tamanho n (ou apenas


amostra aleatória) de uma variável aleatória X com dada distribuição é o
conjunto de n variáveis aleatórias independentes X1 , X2 , . . . , Xn , cada uma
com a mesma distribuição de X .

Obtida uma amostra muitas vezes desejamos usá-la para produzi alguma
caracterı́stica especı́fica.

Por exemplo, se quisermos calcular a média da amostra (X1 , X2 , . . . , Xn )


esta será dada por
X1 + X2 + . . . + Xn
X = .
n

Definição 6: Um Parâmetro, digamos θ, é uma medida usada para des-


crever uma caracterı́stica da população (isto é, da distribuição de uma
determinada variável aleatória X ).

9 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos

Definição 7: Uma Estatı́stica é uma caracterı́stica da amostra. Ou seja,


uma estatı́stica T é qualquer função das observações em uma amostra
aleatória X1 , X2 , . . . , Xn . Isto é

T = g (X1 , X2 , . . . , Xn ),

onde g é uma função qualquer.

Exemplos de Estatı́sticas:
1 Pn
(i) X = n i =1 Xi ,

1 Pn
(ii) S 2 = n−1 i =1 (Xi − X )2 ,

(iii) X(1) = min(X1 , X2 , . . . , Xn ),

(iv) X(n) = max(X1 , X2 , . . . , Xn ).

10 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos


Assim,se a população é representada pela variável aleatória X , alguns
parâmetros são a esperança E (X ) e a variância Var (X ) de X .

Com relação às caracterı́sticas mais usuais, vamos usar a seguinte notação:

11 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Conceitos Básicos

Note que uma estatı́stica é uma função de v.a’s que constituem a


amostra.

Logo, uma estatı́stica também é uma variável aleatória.

E a correspondente distribuição de probabilidade formará a base das


argumentações probabilı́sticas utilizadas na extrapolação da
informação da amostra para os parâmetros populacionais.

12 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral

Distribuição Amostral

Muitas amostras aleatórias são possı́veis a partir de uma população. Logo,


o valor de uma determinada estatı́stica T varia de amostra para amostra.

Assim, uma estatı́stica também é uma variável aleatória, cuja distribuição


de probabilidades é chamada de distribuição amostral.

Sendo X1 , X2 , . . . , Xn uma a.a. (amostra aleatória), seria natural


peguntar o que acontece com a estatı́stica T quando retiramos
todas as amostras de uma população conhecida, de acordo com o
plano amostral adotado?

Ou seja, qual seria a distribuição de T quando X1 , X2 , . . . , Xn
assume todos os valores possı́veis ?
Essa distribuição é chamada de Distribuição Amostral da
Estatı́stica T

13 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral

Exemplo 1: Considere uma população formada pelos seguintes elementos

{1, 3, 5, 5, 7}.

Considere a variável aleatória

X : valor assumido pelo elemento na população.

A distribuição da v.a X é dada por


x 1 3 5 7
P(X = x) 1/5 1/5 2/5 1/5
Considere todas as amostras de tamanho 2, com reposição, da população
X . Qual a distribuição da estatı́stica X = X1 +X
2 ?
2

14 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral

A distribuição amostral de uma estatı́stica depende

da distribuição da população da qual a amostra foi selecionada;

do tamanho amostral;

do método de seleção amostral.

15 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Amostral da Média X

Teorema 1: Seja X uma variável aleatória com média µ e variância σ 2 , e


seja X1 , X2 , . . . , Xn uma amostra aleatória de X . Então, a média amostral
X terá média e variância dadas respectivamente por

σ2
E (X ) = µ e Var (X ) = .
n

Demonstração do Teorema: no quadro...

16 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Amostral da Média X


Portanto, o valor esperado da média amostral é a média populacional,
enquanto que a variâcia populacional dividido pelo tamanho da tamanho
da amostra.

Notamos assim que

X também é centrada em torno de µ;

A variabilidade de X se torna mais reduzida quando n → ∞.

17 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Amostral da Média X

Um teorema bem mais forte referente à distribuição de probabilidade da


soma de variáveis aleatórias independentes, e consequentemente à distri-
buição de X é muito conhecido, chamado de Teorema Central do Limite.

Teorema 2: (Teorema Central do Limite) Sejam X1 , X2 , . . . , Xn uma


sequência de variáveis aleatórias independentes e identicamente dis-
2
Pn cada uma com média µ e variância σ < ∞. Então, para
tribuı́das,
Sn = i=1 Xi temos que

Sn − E (Sn ) Sn − nµ
p = √ ≈ N(0, 1),
Var (Sn ) nσ 2

para n suficientemente grande.

18 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Amostral da Média X

Segue então do Teorema Central do Limite que

X −µ
≈ N(0, 1),
σ/n

para n suficientemente grande.

Então, seja a uma constante conhecida


 
X −µ
P ≤a ≃ P(Z ≤ a),
σ/n

em que Z ∼ N(0, 1).

19 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Amostral da Média X

Observações:

(I) Nenhuma suposição foi feita sobre a natureza das distribuições das
variáveis aleatórias X1 , X2 , . . . , Xn . Ou seja, independentemente de
como essas variáveis comportam-se, sejam discretas ou contı́nuas, o
teorema continua válido.

(II) Se as variáveis X1 , X2 , . . . , Xn têm distribuição normal, então X terá


também distribuição normal e não apenas uma aproximação.

(III) Em muitos casos, n ≥ 30 a aproximação normal será satisfatória,


independente da distribuição da população.

20 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Amostral da Média X

Exemplo 2: Uma v.a X tem distribuição normal, com média 100 e desvio
padrão 10.

(a) Qual a P(90 < X < 110)?

(b) Se X for a média de uma amostra de 16 elementos retirados dessa


população, calcule P(90 < X < 110).

(c) Que tamanho deveria ter a amostra para que


P(90 < X < 110) = 0, 95?

21 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Amostral da Média X

Exemplo 3: Uma máquina de empacotar um determinado produto faz


segundo uma distribuição normal, com média µ e desvio padrão 10g.

(a) Em quanto deve ser regulado o peso médio µ para que apenas 10%
dos pacotes tenham menos do que 500g?

(b) Com a máquina regulada, qual a probabilidade de que o peso total


de 4 pacotes escolhidos ao acaso seja inferior a 2kg?

22 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Exata de X

Teorema 3: Seja X1 , X2 , . . . , Xn uma a.a. de uma f (x, θ) com função


geradora de momentos MX (t). Então

MX (t) = [MX (t/n)]n . (1)

Lembrete: A função geradora de momentos da v.a X é definida por

MX (t) = E (e tX ), t ∈ IR
Xn
= e txi p(xi )
i=1
Z ∞
= e tx f (x)dx
−∞

23 / 24
Inferência Estatı́stica: Introdução e Distribuição Amostral
Distribuição Amostral
Distribuição Exata de X

Resultado Útil: Sejam X1 , X2 , . . . , Xn vetores aleatórios independentes.


Seja g (xi ) uma função apenas de xi , i = 1, . . . , n. Então, as v.a’s Ui =
g (Xi ), i = 1, . . . , n são multuamente independentes.

Demonstração do Teorema 3: no quadro...

⇒ Podemos então determinar a distribuição “exata” de X , quando


X1 , X2 , . . . , Xn é uma a.a. de N(µ, σ 2 ), usando a função geradora de
momentos. Teremos então
σ2 t 2
MX (t) = e tµ+ 2n .

Portanto,
X ∼ N(µ, σ 2 /n).

24 / 24

Você também pode gostar