Você está na página 1de 81

Visão geral da parte III

Prof. Wagner Hugo Bonat

Departamento de Estatística
Universidade Federal do Paraná

Prof. Wagner Hugo Bonat Visão geral da parte III 1


Onde estamos?

1. Estatística descritiva e exploratória


(UD1).
2. Probabilidades e variáveis aleatórias
(UD2, UD3 e UD4).
3. Inferência estatística (UD5, UD6 e UD7).
4. Métodos estatísticos (UD8).

Figura 1. Foto de Andrea Piacquadio no Pexels.

Prof. Wagner Hugo Bonat Visão geral da parte III 2


Resumo
Estatística

Estatística Descritiva Probabilidades Inferência Estatística

Coleta, organização, Análise de situações Métodos para reali-


tratamento, análise, que lidam com o acaso zação de inferência
apresentação e inter- para determinação estatística a partir de
pretação de dados. de probabilidades. dados observados.

Métodos de Estimação
Probabilidades
amostragem pontual e intervalar

Análise gráfica Variáveis aleatórias Testes de hipótese

Distribuições de
Medidas resumo Métodos estatísticos
probabilidade

Figura 2. Organização modular da disciplina de estatística básica.


Prof. Wagner Hugo Bonat Visão geral da parte III 3
Inferência estatística
População

I População → distribuição de
probabilidade.
I Intuição → Como que a v.a. deve se
comportar na população. Parâmetros:
I Variável → variável aleatória. µ, σ 2 , θ, ρ,
P(Y ≤ y), etc.

I Parâmetros da distribuição de Amostragem Estatística


Descritiva
probabilidade → parâmetros
populacionais.
Inferência
I Como obter a amostra? Estatística

I Como a partir da amostra estimar os Estatísticas:


ȳ, S 2 , θ̂, r,
Amostra Freq(Y ≤ y), etc.
parâmetros populacionais?
Figura 3. Processo de inferência estatística.

Prof. Wagner Hugo Bonat Visão geral da parte III 4


Inferência estatística

I Problema prático: Qual a proporção da população que desenvolveu anticorpos


contra uma doença?

Prof. Wagner Hugo Bonat Visão geral da parte III 5


Inferência estatística

I Problema prático: Qual a proporção da população que desenvolveu anticorpos


contra uma doença?
I Formalizando o problema:
I Qual é a variável aleatória e quais valores ela pode assumir?

Prof. Wagner Hugo Bonat Visão geral da parte III 5


Inferência estatística

I Problema prático: Qual a proporção da população que desenvolveu anticorpos


contra uma doença?
I Formalizando o problema:
I Qual é a variável aleatória e quais valores ela pode assumir?
I Y : desenvolveu anticorpos. Opções SIM ou NÃO.
I Qual a distribuição de probabilidade adequada para esta v.a.?

Prof. Wagner Hugo Bonat Visão geral da parte III 5


Inferência estatística

I Problema prático: Qual a proporção da população que desenvolveu anticorpos


contra uma doença?
I Formalizando o problema:
I Qual é a variável aleatória e quais valores ela pode assumir?
I Y : desenvolveu anticorpos. Opções SIM ou NÃO.
I Qual a distribuição de probabilidade adequada para esta v.a.?
I Bernoulli com função de probabilidade

P(Y = y) = py (1 − p)1−y .

I Qual o parâmetro de interesse e o que ele significa?

Prof. Wagner Hugo Bonat Visão geral da parte III 5


Inferência estatística

I Problema prático: Qual a proporção da população que desenvolveu anticorpos


contra uma doença?
I Formalizando o problema:
I Qual é a variável aleatória e quais valores ela pode assumir?
I Y : desenvolveu anticorpos. Opções SIM ou NÃO.
I Qual a distribuição de probabilidade adequada para esta v.a.?
I Bernoulli com função de probabilidade

P(Y = y) = py (1 − p)1−y .

I Qual o parâmetro de interesse e o que ele significa?


I p: proporção de pessoas que desenvolveram anticorpos.

Prof. Wagner Hugo Bonat Visão geral da parte III 5


Pensamento Estatístico

I Como determinar o valor de p?


I Examinar todos os membros da população e verificar a proporção que desenvolveu
anticorpos.
I Examinar apenas alguns membros da população (amostra) e calcular a proporção que
desenvolveu anticorpos.
I Problema: A proporção obtida na amostra não é a mesma obtida na população.
I Incerteza associada ao valor da proporção devido a termos apenas uma amostra.
I Como quantificar essa incerteza?
I Como tomar uma decisão baseada apenas na amostra?
I Descrição probabilística da estatística de interesse → Distribuição amostral.

Prof. Wagner Hugo Bonat Visão geral da parte III 6


Especificação do problema de Inferência

I Y : desenvolveu anticorpos (v.a.).


I Especificação do modelo Y ∼ Ber(p).
I Parâmetro p.
I Informação sobre p através de uma amostra da população.
I Denotamos as amostras por y1 , . . . , yn .
I Objetivos da inferência estatística:
I Estimar p baseado apenas na amostra (valor pontual)! Quanto é p na população?
I Informar o quanto preciso ou creditável é o valor estimado (intervalo de confiança).
I Decidir sobre possíveis valores de p baseado apenas na amostra.
I A proporção da população com anticorpos atingiu um patamar desejável?

Prof. Wagner Hugo Bonat Visão geral da parte III 7


Especificação do problema de Inferência

I Suponha que coletamos uma amostra (aleatória) de tamanho n = 10 e que y = 7


pessoas apresentaram anticorpos.
I Qual valor você acha que o parâmetro p assume na população?
I Assumindo observações independentes, sabemos que a soma de v.a. Bernoulli é
binomial com n = 10 e um parâmetro p desconhecido.
I Podemos calcular a probabilidade de observar y = 7 para um valor de p, por
exemplo, p = 0.8
 
10
P(Y = 7|n = 10, p = 0,80) = 0,807 (1 − 0,80)10−7 = 0,2013.
7

Prof. Wagner Hugo Bonat Visão geral da parte III 8


Especificação do problema de Inferência

I Para qualquer outro valor de p


 
10 7
P(Y = 7|n = 10, p) = p (1 − p)10−7 ,
7

variando p temos a função de verossimilhança


 
10 7
L(p) ≡ P(Y = 7|n = 10, p) = p (1 − p)10−7 .
7

I Ideia: Se p for um determinado valor, qual a probabilidade de observar o que eu


realmente observei na amostra.

Prof. Wagner Hugo Bonat Visão geral da parte III 9


Pensamento frequentista
População Amostras
Amostragem
p̂1

p̂2
I Se o experimento for repetido um
p̂3
número grande de vezes e a cada
realização p̂ for obtido, o que
p̂4

aconteceria? p̂5

p̂6
I p̂ é uma variável aleatória.
p̂7
I Se é variável aleatória, então tem p̂8

distribuição de probabilidade que p̂9


descreve o seu comportamento. p̂10
I Qual é a sua distribuição? p̂11

I Qual o seu valor esperado? p̂12

I Qual a sua variância? Estatística amostral

Figura 4. Ilustração da distribuição amostral.


Prof. Wagner Hugo Bonat Visão geral da parte III 10
Ilustração computacional
0.3

Frequência relativa
0.2

0.1

0.0

0.4 0.6 0.8 1.0


Proporção estimada (p
^)

Figura 5. Distribuição amostral da proporção.


Prof. Wagner Hugo Bonat Visão geral da parte III 11
Distribuição amostral

I Veja que mesmo se o valor verdadeiro for p = 0,8 existe uma probabilidade não
desprezível de observarmos 7 pessoas com anticorpos entre as 10 avaliadas.
I A incerteza associada ao valor de p no caso de apenas 10 observações é grande.
I Como podemos diminuir esta incerteza?

Prof. Wagner Hugo Bonat Visão geral da parte III 12


Distribuição amostral

I Veja que mesmo se o valor verdadeiro for p = 0,8 existe uma probabilidade não
desprezível de observarmos 7 pessoas com anticorpos entre as 10 avaliadas.
I A incerteza associada ao valor de p no caso de apenas 10 observações é grande.
I Como podemos diminuir esta incerteza?
I Solução: Aumentar o número de observações.

Prof. Wagner Hugo Bonat Visão geral da parte III 12


Ilustração computacional
n =5 n = 10 n = 20
500
400
300
200
100
Frequência

0
n = 50 n = 100 n = 500
500
400
300
200
100
0
0.25 0.50 0.75 1.00 0.25 0.50 0.75 1.00 0.25 0.50 0.75 1.00
Proporção estimada (p
^)

Figura 6. Efeito de aumentar o tamanho da amostra na distribuição amostral da proporção estimada.

Prof. Wagner Hugo Bonat Visão geral da parte III 13


Estatística frequentista

I Temos o procedimento, mas e como faremos as replicações do experimento em


termos práticos?

Prof. Wagner Hugo Bonat Visão geral da parte III 14


Estatística frequentista

I Temos o procedimento, mas e como faremos as replicações do experimento em


termos práticos?
I Não faremos!!
I Estimador é função da variável aleatória.
I Portanto, tem distribuição de probabilidade.
I A distribuição amostral do estimador pode ser usada para estudar o que
aconteceria caso o estudo fosse replicado um número muito grande de vezes.
I Distribuição exata de um estimador é dificil de se obter.
I O Teorema Central do Limite oferece uma aproximação para amostras grandes
(assintótica).

Prof. Wagner Hugo Bonat Visão geral da parte III 14


Reforçando os conceitos

I Problema prático: Qual o tamanho ideal de carteiras escolares para os alunos da


UFPR?
I Precisamos saber como a altura dos alunos se distribui.

Prof. Wagner Hugo Bonat Visão geral da parte III 15


Reforçando os conceitos

I Problema prático: Qual o tamanho ideal de carteiras escolares para os alunos da


UFPR?
I Precisamos saber como a altura dos alunos se distribui.
I Formalizando o problema.
I Qual é a variável aleatória e quais valores ela pode assumir?

Prof. Wagner Hugo Bonat Visão geral da parte III 15


Reforçando os conceitos

I Problema prático: Qual o tamanho ideal de carteiras escolares para os alunos da


UFPR?
I Precisamos saber como a altura dos alunos se distribui.
I Formalizando o problema.
I Qual é a variável aleatória e quais valores ela pode assumir?
I Y ∈ <+ - Altura dos alunos da UFPR.
I Qual a distribuição de probabilidade adequada para esta v.a.?

Prof. Wagner Hugo Bonat Visão geral da parte III 15


Reforçando os conceitos

I Problema prático: Qual o tamanho ideal de carteiras escolares para os alunos da


UFPR?
I Precisamos saber como a altura dos alunos se distribui.
I Formalizando o problema.
I Qual é a variável aleatória e quais valores ela pode assumir?
I Y ∈ <+ - Altura dos alunos da UFPR.
I Qual a distribuição de probabilidade adequada para esta v.a.?
I Normal, Gama, Lognormal, Normal Inversa, Weibul, etc.
I Qual o parâmetro de interesse e o que ele significa?

Prof. Wagner Hugo Bonat Visão geral da parte III 15


Reforçando os conceitos

I Problema prático: Qual o tamanho ideal de carteiras escolares para os alunos da


UFPR?
I Precisamos saber como a altura dos alunos se distribui.
I Formalizando o problema.
I Qual é a variável aleatória e quais valores ela pode assumir?
I Y ∈ <+ - Altura dos alunos da UFPR.
I Qual a distribuição de probabilidade adequada para esta v.a.?
I Normal, Gama, Lognormal, Normal Inversa, Weibul, etc.
I Qual o parâmetro de interesse e o que ele significa?
I Altura média e variabilidade da altura dos alunos da UFPR.

Prof. Wagner Hugo Bonat Visão geral da parte III 15


Juntando dados e probabilidades Normal

0.08
I Suponha que uma amostra (AAS) de

Densidade
0.04
tamanho n = 293 foi obtida.

0.00
120 140 160 180 200 220
0.04

x
Log−normal

0.08
0.03

Densidade
0.04
Density

0.02

0.00
0.01

120 140 160 180 200 220


x
0.00

Gama

0.030
150 160 170 180 190

Densidade
quest$altura

0.015
Figura 7. Histograma da altura dos alunos UFPR.

0.000
Qual modelo é o mais provável de ter
120 140 160 180 200 220
I x

gerado essa amostra? Figura 8. Distribuições de probabilidades candidatas.

Prof. Wagner Hugo Bonat Visão geral da parte III 16


Escolhendo o modelo

0.04
I Modelo Normal

0.01 0.02 0.03


Notação Y ∼ N(µ, σ 2 );

Densidade
I
n 2
o
I f (y) = √ 1 exp − (y−µ) ;
2πσ 2 2σ 2

I E(Y ) = µ e V(Y ) = σ 2 .

0.00
Quais os valores de µ e σ 2 devo usar?
120 140 160 180 200 220
I Altura

Podemos usar os equivalentes

1.0
I
amostrais?

0.8
1
Pn 1
Pn
yi e σ̂ 2 = − µ̂)2 .

0.4 0.6
µ̂ = i=1 (yi

Fn(x)
I
n i=1 n
I Como medir a incerteza em µ̂ e σ̂ 2 ,

0.2
sendo que temos apenas uma

0.0
amostra? → Distribuição amostral. 150 160 170 180 190
Altura
I E para os outros modelos? → Métodos
Figura 9. Ajuste da distribuição Normal para a
para estimação de parâmetros. variável altura.
Prof. Wagner Hugo Bonat Visão geral da parte III 17
Distribuição amostral

I Objeto de inferência (frequentista).


θ
I A estimativa pontual é um resumo
desta distribuição.
I Intervalos entre quantis representam a
incerteza sobre o valor estimado.
I Comparam-se estimadores
concorrentes pelas características de
suas distribuições amostrais.
I E para tudo isto: Figura 10. Distribuição amostral de diferentes
é preciso saber como estimar. estimadores de um parâmetro.

Prof. Wagner Hugo Bonat Visão geral da parte III 18


Resumo
População

I Modelo → comportamento da
natureza.
I Parâmetros do modelo → parâmetros
populacionais de interesse.
I Qual modelo melhor descreve os Parâmetros:
µ, σ 2 , θ, ρ,
dados? P(Y ≤ y), etc.

I Assumimos um modelo → parâmetros Amostragem Estatística


Descritiva
são desconhecidos.
I Baseado na amostra → encontrar os Inferência
parâmetros compatíveis com a Estatística

amostra. Estatísticas:
ȳ, S 2 , θ̂, r,
I Descrever a incerteza → distribuição Amostra Freq(Y ≤ y), etc.

amostral.
Figura 11. Processo de inferência estatística.
Prof. Wagner Hugo Bonat Visão geral da parte III 19
Distribuição amostral e estimação

Prof. Wagner Hugo Bonat

Departamento de Estatística
Universidade Federal do Paraná

Prof. Wagner Hugo Bonat Distribuição amostral e estimação 1


Onde estamos?

1. Estatística descritiva e exploratória


(UD1).
2. Probabilidades e variáveis aleatórias
(UD2, UD3 e UD4).
3. Inferência estatística (UD5, UD6, UD7 e
UD8).
4. Métodos estatísticos (UD9).
Figura 1. Foto de Andrea Piacquadio no Pexels.

Prof. Wagner Hugo Bonat Distribuição amostral e estimação 2


Resumo
Estatística

Estatística Descritiva Probabilidades Inferência Estatística

Coleta, organização, Análise de situações Métodos para reali-


tratamento, análise, que lidam com o acaso zação de inferência
apresentação e inter- para determinação estatística a partir de
pretação de dados. de probabilidades. dados observados.

Métodos de Estimação
Probabilidades
amostragem pontual e intervalar

Análise gráfica Variáveis aleatórias Testes de hipótese

Distribuições de
Medidas resumo Métodos estatísticos
probabilidade

Figura 2. Organização modular da disciplina de estatística básica.


Prof. Wagner Hugo Bonat Distribuição amostral e estimação 3
Estrutura da unidade

I Inferência estatística · Visão geral.


I Distribuição amostral de médias.
I Distribuição amostral de estatísticas
importantes.
I Estimação pontual e intervalar.
I Determinação do tamanho da amostra.
I Resolução de exercícios.
I Adicionais
Figura 3. Foto de Andrea Piacquadio no Pexels.
I Propriedades de estimadores.
I Métodos de estimação.

Prof. Wagner Hugo Bonat Distribuição amostral e estimação 4


Distribuição amostral de médias

Prof. Wagner Hugo Bonat

Departamento de Estatística
Universidade Federal do Paraná

Prof. Wagner Hugo Bonat Distribuição amostral de médias 1


Definições (mais detalhadas)
I População ou Universo: Conjunto de todos as unidades elementares.
U = {1, 2, . . . , N},
onde N é o tamanho da população.
I Unidade elementar: refere-se a qualquer elemento i ∈ U.
I Variável: característica a ser observada em cada unidade elementar → variável
aleatória. Notação Yi , i ∈ U.
I Todos os valores de uma variável denotamos por D = (Y1 , . . . , YN ).
I Função paramétrica populacional: característica numérica qualquer da população,
ou seja, uma expressão que condensa os Yi ’s. Notação,
θ(D).
Exemplos: total, médias, quocientes, etc.
I É comum utilizar a expressão parâmetro populacional.
Prof. Wagner Hugo Bonat Distribuição amostral de médias 2
Exemplo: População de domicílios
Considere a população formada por três domicílios U = {1,2,3} nos quais estão sendo
observadas as seguintes variáveis: nome (do chefe), sexo, idade, fumante ou não, renda
bruta (mensal em salários mínimos) familiar e número de trabalhadores.

Variável Valores Notação


unidade 1 2 3 i
nome do chefe Ada Beto Ema Ai
sexo1 0 1 0 Xi
idade 20 30 40 Ii
fumante 0 1 1 Gi
renda bruta 12 30 18 Fi
no trabalhadores 1 3 2 Ti

1 0: feminino; 1: masculino.
2 0: não fumante; 1: fumante.
Prof. Wagner Hugo Bonat Distribuição amostral de médias 3
Exemplos de funções paramétricas populacionais

I Idade média
20 + 30 + 40
θ(D) = = 30.
3
I Média das variáveis renda e número de trabalhadores
 12+30+18   
θ(D) = .
3 20
1+3+2 =
3
2

I Renda média por trabalhador

12 + 30 + 18
θ(D) = = 10.
1+3+2

Prof. Wagner Hugo Bonat Distribuição amostral de médias 4


Parâmetros populacionais mais usados
I Total populacional
N
X
θ(D) = τ = Yi .
i=1

I Média populacional
N
1 X
θ(D) = µ = Y = Yi .
N
i=1

I Variância populacional,
N
1 X
σ = θ(D) =
2
(Yi − µ)2 ,
N
i=1
ou às vezes
N
1 X
θ(D) = S 2 = (Yi − µ)2 .
N −1
i=1

Prof. Wagner Hugo Bonat Distribuição amostral de médias 5


Amostra

I Uma sequência qualquer de n unidades de U é uma amostra ordenada de U,

s = (1, . . . ,i, . . . , n) tal que i ∈ U.

I O rótulo i é chamado de i-ésimo componente de s.


I Exemplos: Seja U = {1,2,3}, os vetores s1 = (1,2), s2 = (2,1) e s3 = (2,2,1,3,2) são
amostras de U.
I Chama-se de tamanho de amostra o número de elementos em s.
I Chama-se de dados da amostra s a matriz ou vetor de observações pertencentes à
amostra, notação
ds = (Y1 , . . . , Yn ) = (Yi , i ∈ s).

Prof. Wagner Hugo Bonat Distribuição amostral de médias 6


Amostragem aleatória simples (AAS)
I Definição: De uma população U com N unidades elementares, sorteiam-se com
igual probabilidade n unidades.

Amostragem aleatória simples

Figura 1. Amostragem aleatória simples.


Prof. Wagner Hugo Bonat Distribuição amostral de médias 7
Estatísticas
I Qualquer característica numérica dos dados correspondentes à amostra s é
chamada de estatística, ou seja, qualquer função h(ds ) que relaciona as
observações da amostra s.
I Exemplo: Populações de domicílios (cont.): Considere a amostra s = (1,2). Para as
variáveis renda bruta F e número de trabalhadores T , temos os seguintes dados da
amostra:

 
ds = .
12 30
1 3

I As médias (estatísticas) amostrais


12 + 30
f= = 21
2
e
1+3
t= = 2.
2
Prof. Wagner Hugo Bonat Distribuição amostral de médias 8
Distribuição amostral
I A distribuição amostral de uma estatística h(ds ) é a distribuição de probabilidade
da variável aleatória H(ds ).
I Exemplo: População de domicílios (cont.): Determine a distribuição amostral da
estatística h(ds ) definida como a razão entre o total da renda familiar e o número de
trabalhadores.
I População    
Fi
D= .
12 30 18
Ti
=
1 3 2
I Plano amostral AASc: Possíveis amostras
S = {(1,1), (1,2), (1,3), (2,1),(2,2),(2,3),(3,1),(3,2),(3,3)}.
I Calculando a estatística para a amostra s = (3,1),

18 + 12
r= = 10.
2+1
Prof. Wagner Hugo Bonat Distribuição amostral de médias 9
Exemplo: População de domicílios (cont.)
I Calculando para todas as amostras temos,

s (1,1) (1,2) (1,3) (2,1) (2,2) (2,3) (3,1) (3,2) (3,3)


P(s) 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
h(ds ) = r 12 10,5 10 10,5 10 9,6 10 9,6 9

I Distribuição amostral de r

r 9 9,6 10 10,5 12
pr 1/9 2/9 3/9 2/9 1/9

I Podemos resumir a distribuição amostral da v.a. R , por exemplo

1 2 3 2 1
E(R ) = 9 · + 9,6 · + 10 · + 10,5 · + 12 · ≈ 10,13.
9 9 9 9 9
V(R ) ≈ 0,6289.
Prof. Wagner Hugo Bonat Distribuição amostral de médias 10
Exemplo: Distribuição amostral

Considerando os dados do exemplo População de domicílios, encontre a distribuição de


probabilidade das estatísticas Y e S 2 relacionadas à v.a. renda familiar para uma
amostra de tamanho 2 obtida pelo plano AASc.

s (1,1) (1,2) (1,3) (2,1) (2,2) (2,3) (3,1) (3,2) (3,3)


P(s) 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
Y 12 21 15 21 30 24 15 24 18
s2 0 162 18 162 0 72 18 72 0

Prof. Wagner Hugo Bonat Distribuição amostral de médias 11


Exemplo: Distribuição amostral (cont.) Distribuição amostral da média

I Distribuição amostral de Y . E(Y)

0.20
0.15
Probabilidade
Y

0.10
12 15 18 21 24 30

0.05
P(y) 1/9 2/9 1/9 2/9 2/9 1/9

0.00
15 20 25 30
y
Distribuição amostral da variância

0.30
^2
E(S )

Probabilidade
0.20
I Distribuição amostral de S 2 .

0.10 0.00
S2 0 18 72 162 0 50 100 150
s2
P(s2 ) 3/9 2/9 2/9 2/9
Figura 2. Distribuição amostral.

Prof. Wagner Hugo Bonat Distribuição amostral de médias 12


Exemplo: Distribuição amostral (cont.)

I Note que E(Y ) = 20 e Var(Y ) = 56


2 = 28.
I Note ainda que E(S 2 ) = 504
9 = 56.
I Tanto E(Y ) como E(S 2 ) coincidem com os parâmetros populacionais, ou seja,

(12 − 20)2 + (30 − 20)2 + (18 − 20)2


= 20 e σ 2 =
12 + 30 + 18
µ= = 56.
3 3

I Esperança do estimador coincide com o valor populacional → estimador


não-viciado.

Prof. Wagner Hugo Bonat Distribuição amostral de médias 13


Comentários

- A distribuição amostral caracteriza proba-


bilisticamente a estatística de interesse. -
Pode ser resumida da mesma forma que
qualquer outra distribuição de probabi-
lidade (esperança, variância, covariância,
etc). - Para populações pequenas é fácil de
ser obtida. E para populações grandes? -
Nenhuma suposição foi feita sobre a distri-
buição de probabilidade da v.a. - Estratégia
vista até aqui é impraticável! - Precisamos
de algo mais geral e flexível em termos prá-
Figura 3. Photo by Anna Shvets from Pexels.
ticos!!!

Prof. Wagner Hugo Bonat Distribuição amostral de médias 14


Distribuição amostral da média: V.a. Normal
I Seja Yi ∼ N(µ, σ 2 ) para i = 1, . . . , N. Suponha que uma amostra aleatória de
tamanho n, com valores observados denotados por y1 , . . . , yn foi obtida. A
distribuição amostral da média Y é dada por
 
σ2
Y ∼ N µ, .
n

I Segue do fato de que combinação linear de Normal é Normal e de que


n
1X nµ
E(Y) = E(Yi ) = = µ.
n n
i=1

n
1 X nσ 2 σ2
V(Y ) = V(Yi ) = = .
n2 n2 n
i=1

Prof. Wagner Hugo Bonat Distribuição amostral de médias 15


Exemplo: Salário de pilotos

O salário anual médio dos pilotos de avião pode ser modelado por uma distribuição
Normal com média de R$41979,00 e desvio padrão de R$5000,00. Suponha que uma
amostra aleatória simples de 50 pilotos seja selecionada.

I Qual é o desvio padrão da média amostral?


I Qual é a probabilidade da média amostral ser maior que R$41979,00?
I Qual é a probabilidade da média amostral não diferir da média populacional em até
R$1000,00?
I Como a probabilidade do item anterior seria alterada caso a amostra fosse de
tamanho 100?

Prof. Wagner Hugo Bonat Distribuição amostral de médias 16


Exemplo: Salário de pilotos (cont.)
I Qual é o desvio padrão da média amostral?

σ2
n. Assim, a variância é e o desvio padrão da média
V(Y ) = 50002 √ .
5000
50 50

I Qual é a probabilidade da média amostral ser maior que R$41979,00?


 
41979 − 41979
P(Y > 41979) = P Z > √ = P(Z > 0) = 0,5.
5000/ 50
I Qual é a probabilidade da média amostral não diferir da média populacional em até
R$1000,00?

 
40979 − 41979 42979 − 41979
P(40979 < Y < 42979) = P √ <Z < √
5000/ 50 5000/ 50
= P(−1.414 < Z < 1.414) ≈ 0,842.
Prof. Wagner Hugo Bonat Distribuição amostral de médias 17
Exemplo: Salário de pilotos (cont.)

I Como a probabilidade do item anterior seria alterada caso a amostra fosse de


tamanho 100?

 
40979 − 41979 42979 − 41979
P(40979 < Y < 42979) = P √ <Z < √
5000/ 100 5000/ 100
= P(−2 < Z < 2) ≈ 0,954.

Prof. Wagner Hugo Bonat Distribuição amostral de médias 18


Exemplo: Acesso à internet

Uma pesquisa divulgou que 56% das famílias brasileiras têm acesso à internet. Suponha
que esta seja a verdadeira proporção populacional p = 0,56 e suponha que uma
amostra de 300 famílias seja selecionada.

I Apresente a distribuição amostral de p̂, em que p̂ é a proporção amostral de


famílias com acesso à internet.
I Qual a probabilidade de a proporção amostral não diferir da populacional em mais
de 0,03?
I Responda o item anterior considerando amostras de tamanho 600 e 1000.

Prof. Wagner Hugo Bonat Distribuição amostral de médias 19


Exemplo: Acesso à internet (comentários)
I Note que agora temos que a distribuição da v.a. não é Normal.
I Y - acesso à internet (SIM ou NÃO).
I Y ∼ Ber(p) com p sendo a probabilidade de ter acesso à internet.
I Sabemos que E(Y ) = p e V(Y ) = p(1 − p).
Sendo p̂ = n1 ni=1 Yi , podemos facilmente obter
P
I

n
1X np
E(p̂) = E(Yi ) = = p.
n n
i=1

n
1 X np(1 − p) p(1 − p)
V(p̂) = V(Yi ) = = .
n 2 n 2 n
i=1

I Conseguimos obter a média e a variância de p̂, mas e a distribuição?


Prof. Wagner Hugo Bonat Distribuição amostral de médias 20
Teorema do Limite Central

Teorema Lindeberg-Levy: Seja Y1 , . . . , Yn uma amostra aleatória independente e


identicamente distribuída com E(Yi ) = µ e V(Yi ) = σ 2 < ∞. Então,


 
Y −µ D
n → Z ∼ N(0,1), para n → ∞.
σ

Forma alternativa: Y ∼ N(µ, σ 2 /n).

Prof. Wagner Hugo Bonat Distribuição amostral de médias 21


Ilustração computacional
n = 10 n = 50 n = 100

10
7
6

8
5

2 3 4 5
Densidade

Densidade

Densidade
2 3 4

4 2 6
1

1
0

0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
^
p ^
p ^
p
n = 250 n = 500 n = 1000
15

25
20

10 15 20
10
Densidade

Densidade

Densidade
10 15
5

5
0

0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
^
p ^
p ^
p

Figura 4. Distribuição amostral da proporção conforme tamanho da amostra.


Prof. Wagner Hugo Bonat Distribuição amostral de médias 22
Exemplo: Acesso à internet (cont.)
I Apresente a distribuição amostral de p̂, em que p̂ é a proporção amostral de
famílias com acesso à internet.
I Usando o TLC, temos

 
p(1 − p)
p̂ ∼ N p, .
n

I Qual a probabilidade de a proporção amostral não diferir da populacional em mais


de 0,03?
P(0,53 < p̂ < 0,59) = P(−1,046 < Z < 1,046) ≈ 0,704.

!
0,53 − 0,56 p̂ − p 0,59 − 0,56
P p <p <p .
0,56(1 − 0,56)/300 p(1 − p)/n 0,56(1 − 0,56)/300

Prof. Wagner Hugo Bonat Distribuição amostral de médias 23


Exemplo: Acesso à internet (cont.)

I Responda o item anterior considerando amostras de tamanho 600 e 1000.


I n = 600 → P(0,53 < p̂ < 0,59) = P(−1,480 < Z < 1,480) ≈ 0,861.

!
0,53 − 0,56 p̂ − p 0,59 − 0,56
P p <p <p .
0,56(1 − 0,56)/600 p(1 − p)/n 0,56(1 − 0,56)/600

I n = 1000 → P(0,53 < p̂ < 0,59) = P(−1,911 < Z < 1,911) ≈ 0,944.

!
0,53 − 0,56 p̂ − p 0,59 − 0,56
P p <p <p .
0,56(1 − 0,56)/1000 p(1 − p)/n 0,56(1 − 0,56)/1000

Prof. Wagner Hugo Bonat Distribuição amostral de médias 24


Resumo

I Distribuição amostral da média.


I Distribuição amostral aproximada da
proporção.
I Teorema Central do Limite.

Figura 5. Retirada do Google imagens.

Prof. Wagner Hugo Bonat Distribuição amostral de médias 25


Distribuição amostral de estatísticas importantes

Prof. Wagner Hugo Bonat

Departamento de Estatística
Universidade Federal do Paraná

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 1


Distribuição amostral da média

I Sejam Y1 , . . . , Yn v.a.’s independentes e identicamente distribuídas (iid) com


distribuição desconhecida, porém com média E(Yi ) = µ e variância V(Yi ) = σ 2 < ∞.
Para amostras grandes o TLC nos diz que
 
σ2
Y ∼ N µ, .
n

I E para outras estatísticas de interesse?

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 2


Distribuição amostral da média

I Sejam Y1 , . . . , Yn v.a.’s independentes e identicamente distribuídas (iid) com


distribuição desconhecida, porém com média E(Yi ) = µ e variância V(Yi ) = σ 2 < ∞.
Para amostras grandes o TLC nos diz que
 
σ2
Y ∼ N µ, .
n

I E para outras estatísticas de interesse?


I De forma geral é dificil obter a distribuição amostral de outras estatísticas.
I Porém para v.a.’s Normais temos alguns resultados importantes.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 2


Amostragem de v.a.’s Normais e estatísticas relacionadas

Sejam Y1 , . . . , Yn v.a.’s iid com distribuição N(µ, σ 2 ).


Algumas estatísticas relacionadas são:
Pn
I Média amostral → Y = 1
n i=1 Yi .
Pn Pn
I Variância amostral → σ̂ =
i=1 (Yi − Y ) ou S = − Y )2 .
1 1
i=1 (Yi
2 2 2
n n−1
Y −µ
I Estatística t-Student → t = √ .
S/ n
SY2 1
I Sendo duas v.a.’s Normais com variância SY2 1 e SY2 2 , respectivamente. A razão SY2 2
é
chamada de estatística F .

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 3


Distribuição χ 2

I Sendo Yi ∼ N(µ, σ 2 ), então

S2
(n − 1) ∼ χn−1
2
, onde n − 1 são os graus de liberdade.
σ2

I Função densidade probabilidade Ys ∼ χk2


k
−1 − ys
ys2 e 2
f (ys ; k) = k
para k ∈ N e ys > 0.
2 2 Γ( k2 )

I Cálculo de probabilidades → tabelas (só para as caudas) ou softwares estatísticos.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 4


Ilustração computacional
n = 10 n = 25
0.100

0.075

0.050

0.025
Densidade

0.000

n = 50 n = 100
0.100

0.075

0.050

0.025

0.000
0 50 100 150 0 50 100 150
(n − 1)S2 σ2

Figura 1. Distribuição amostral da estatística qui-quadrado.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 5


Aplicações e propriedades da distribuição χ 2

1.2
k1
k2

1.0
k3
k4
k5

0.8
k6

Densidade
k7
I Muito comum em testes de hipóteses:

0.6
k8
k9

0.4
I Independência em tabelas de

0.2
contingência.

0.0
I Bondade de ajuste. 0 2 4 6 8 10
ys
I Razão de verossimilhanças.

1.0
I Log-rank.

0.8
I Cochran-Mantel-Haenszel.

Probabilidade
0.6
I Soma de quadrados de n − 1 Normais

0.4
padrão independentes.

0.2
I Caso particular da distribuição Gama.

0.0
0 2 4 6 8 10
ys

Figura 2. Distribuição qui-quadrado.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 6


Exemplo: Bateria para celular
Uma empresa desenvolveu uma nova bate-
ria para celular. Em média a bateria dura 60
horas com desvio-padrão de 4 horas. Supo-
nha que o fabricante efetua um controle da
qualidade das baterias onde são seleciona-
das aleatoriamente 7 baterias. Supondo que
a duração das baterias pode ser adequada-
mente modelada pela distribuição Normal.
Calcule
I Probabilidade da variância amostral
ser maior que 16 horas.
I Probabilidade da variância amostral
estar entre 4 e 36 horas. Figura 3. Foto de Tyler Lastovich no Pexels.

I Probabilidade da variância amostral


ser menor do que 4 horas.
Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 7
Exemplo: Bateria para celular (cont.)
I Probabilidade da variância amostral ser maior que 16 horas.
 
s2
P(S > 16) = P (n − 1) 2 > (7 − 1) = P(χ7−1 > 6) ≈ 0,423.
2 16 2
σ 16

I Probabilidade da variância amostral estar entre 4 e 36 horas.


 
P(4 < S < 36) = P (7 − 1) < χ7−1 < (7 − 1) = P(1,5 < χ7−1 < 13,5) ≈ 0,923.
2 4 2 36 2
16 16

I Probabilidade da variância amostral ser menor do que 4 horas.


 
P(S < 4) = P χ7−1 < (7 − 1) = P(χ7−1 < 1,5) ≈ 0,040.
2 2 4 2
16

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 8


Consulta da tabela χ 2
ν = 10, α = 0.05
f (X 2 )
0.1
··· 0.1 0.05 ···
..
.
9
2
5 · 10−2 χα;ν 10 18.307
11
α ..
.

0
0 5 10 15 20 25 30 X2

P(X 2 > χα;ν


2
)=α

Pontos percentuais da distribuição χ 2 com áreas na calda direita.


ν/α α = 0.995 0.99 0.975 0.95 0.9 0.5 0.1 0.05 0.025 0.01 0.005
ν=1 0.000 0.000 0.001 0.004 0.016 0.455 2.706 3.841 5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 0.211 1.386 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 2.366 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 3.357 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 4.351 9.236 11.070 12.833 15.086 16.750
6 0.676 0.872 1.237 1.635 2.204 5.348 10.645 12.592 14.449 16.812 18.548
7 0.989
Figura
1.239
4. Consulta
1.690 2.167
da tabela
2.833 6.346
qui-quadrado.
12.017 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 3.490 7.344 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 8.343 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 9.342 15.987 18.307 20.483 23.209 25.188
11 Hugo2.603
Prof. Wagner Bonat 3.053 3.816amostral
Distribuição 4.575 de estatísticas
5.578 10.341 17.275
importantes 19.675 21.920 24.725 26.757 9
Distribuição t-Student
I Sendo Yi ∼ N(µ, σ 2 ) e Y e S 2 a média e a variância amostral a v.a.

Y −µ
t= √ ∼ tn−1 ,
S/ n

tn−1 denota a distribuição t-Student com n − 1 graus de liberdade.


I Função densidade probabilidade
− ν+1
Γ( ν+1 )

t2 2
f (t) = √ 2 ν ,
νπΓ( 2 ) ν
1+

onde ν ∈ N é o número de graus de liberdade e Γ(·) é a função gama.


I Cálculo de probabilidades → tabelas similares às da distribuição Normal ou
softwares estatísticos.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 10


Ilustração computacional
n =5 n = 10
0.4

0.3

0.2

0.1
Densidade

0.0

n = 25 n = 50
0.4

0.3

0.2

0.1

0.0
−5 0 5 −5 0 5
t

Figura 5. Distribuição amostral da estatística t-Student.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 11


Aplicações e propriedades da distribuição t-Student
k1

0.4
k2
k6
k 10
k 14

0.3
k 18

Densidade
I Teste t e suas variações.

0.2
I Intervalo de confiança para a média.

0.1
Simétrica em forma de sino (igual à

0.0
I
−4 −2 0 2 4
Normal). t

1.0
I Caudas mais pesadas que a Normal.

0.8
I Descreve o comportamento da razão

Probabilidade
0.6
de algumas v.a.’s.

0.4
I Desenvolvida por William Sealy Gosset

0.2
(sob o pseudônimo de Student).

0.0
−4 −2 0 2 4
t

Figura 6. Distribuição t-Student.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 12


Exemplo: Acupuntura

Suponha que um experimento foi realizado


para avaliar a efetividade do uso da acupun-
tura para aliviar a dor. A taxa sensorial de
15 pacientes foi medida resultando em uma
média de 8,22 e um desvio-padrão de 1,67.
Supondo que a distribuição Normal é ade-
quada para a variável de interesse obtenha
um intervalo t1 e t2 , tal que a probabilidade
deste intervalo conter a média populacional Figura 7. Extraído de www.health.harvard.edu.
seja de aproximadamente 0,95.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 13


Exemplo 2 (cont.)
I Precisamos obter valores yli e yls , tal que
P(yli < µ < yls ) = 0,95.
I Vamos padronizar
   
yli − µ y−µ yls − µ y−µ
P √ < √ < √ = P t1 < √ < t2 = 0,95
s/ n s/ n s/ n s/ n
I Note que a distribuição t−Student é simétrica, então vamos focar apenas em
intervalos simétricos, o que implica que t = t2 = −t1 . Assim os limites são dados por
s
y ± t0,05/2 √ ,
n
onde t0,05/2 é o valor da distribuição t-Student com n − 1 graus de liberdade.
I Usando a tabela da distribuição t-Student com 14 graus de liberdade, temos

8,22 ± 2,14 √ ≈ [7,30; 9,14].


1,67
15
Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 14
Consulta da tabela t-Student
ν = 10, α = 0.05
f (t)
0.4
··· 0.1 0.05 ···
..
.
tα;ν 9
0.2 10 1.8125
11
α ..
.

0
−4 −2 0 2 4 t

P(T > tα;ν ) = α

Pontos percentuais da distribuição t de Student com áreas na calda direita.


ν/α α = 0.4 0.25 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
ν=1 0.3249 1.0000 3.0777 6.3138 12.7062 31.8205 63.6567 127.3213 318.3088 636.6192
2 0.2887 0.8165 1.8856 2.9200 4.3027 6.9646 9.9248 14.0890 22.3271 31.5991
3 0.2767 0.7649 1.6377 2.3534 3.1824 4.5407 5.8409 7.4533 10.2145 12.9240
4 0.2707 0.7407 1.5332 2.1318 2.7764 3.7469 4.6041 5.5976 7.1732 8.6103
5 0.2672 0.7267 1.4759 2.0150 2.5706 3.3649 4.0321 4.7733 5.8934 6.8688
6 0.2648 0.7176 1.4398 1.9432 2.4469 3.1427 3.7074 4.3168 5.2076 5.9588
7 0.2632 0.7111 Figura
1.4149 8.1.8946 2.3646da 2.9980
Consulta tabela 3.4995
t-Student. 4.0293 4.7853 5.4079
8 0.2619 0.7064 1.3968 1.8595 2.3060 2.8965 3.3554 3.8325 4.5008 5.0413
9 0.2610 0.7027 1.3830 1.8331 2.2622 2.8214 3.2498 3.6897 4.2968 4.7809
10 0.2602 0.6998 1.3722 1.8125 2.2281 2.7638 3.1693 3.5814 4.1437 4.5869
Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 15
Distribuição F de Snedecor
I Sejam Y1i ∼ N(µ1 , σ12 ) e Y2i ∼ N(µ2 , σ22 ). Com média e variância amostrais Y 1 , Y 2 , S12 e
S22 . Suponha ainda que amostras de tamanho n1 e n2 estão disponíveis de Y1 e Y2 .
Se σ12 = σ22 , então temos que a v.a.

S12
F= ∼ Fn1 −1,n2 −1 ,
S22

em que Fn1 −1,n2 −1 denota a distribuição F com n1 − 1 e n2 − 1 graus de liberdade.


I Função densidade probabilidade
s
(d1 y)d1 d2d2
  
d1 d2
f (y) = yB , para y > 0,
(d1 y + d2 )d1 +d2 2 2

onde d1 e d2 são os graus de liberdade do numerador e denominador e B(·) é a


função beta.
I Cálculo de probabilidades → tabelas ou softwares estatísticos.
Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 16
Ilustração computacional
d f 1 = 10 e d f 2 = 10 d f 1 = 20 e d f 2 = 10 d f 1 = 50 e d f 2 = 10
1.25

1.00

0.75

0.50

0.25
Densidade

0.00

d f 1 = 10 e d f 2 = 25 d f 1 = 20 e d f 2 = 25 d f 1 = 50 e d f 2 = 25
1.25

1.00

0.75

0.50

0.25

0.00
0 2 4 6 8 0 2 4 6 8 0 2 4 6 8
F

Figura 9. Distribuição amostral da estatística F .

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 17


Aplicações e propriedades da distribuição F

2.0
d1
d2
d6

1.5
d 10
d 14
d 18

Densidade
1.0
I Teste F para igualdade de variâncias.

0.5
I ANOVA - Analise de variância.

0.0
I Modelos de regressão. 0 1 2
F
3 4 5

I Razão entre v.a.’s qui-quadrado.

1.0
0.8
I Também conhecida como distribuição

Probabilidade
de Fisher-Snedecor’s.

0.4 0.6
I Se σY21 6= σY22 a estatística F ainda tem
distribuição F , porém não central.

0.2
0.0
0 2 4 6 8 10
F

Figura 10. Distribuição F de Snedecor.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 18


Consulta da tabela F de Snedecor
ν1 = 8, ν2 = 10, α = 0.1
f (F )
3
··· 9 10 ···
..
.
2
7
8 2.377
1 Fα,ν1 ,ν2 9
..
.

0
0 1 2 3 4 5 F

P(Fobs > Fα,ν1 ,ν2 ) = α


Pontos percentuais da distribuição F com áreas na calda direita para α = 0.1.
ν2 = 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
ν1 = 1 39.863 8.526 5.538 4.545 4.060 3.776 3.589 3.458 3.360 3.285 3.177 3.073 2.975 2.927 2.881 2.835 2.791 2.748
2 49.500 9.000 5.462 4.325 3.780 3.463 3.257 3.113 3.006 2.924 2.807 2.695 2.589 2.538 2.489 2.440 2.393 2.347
3 53.593 9.162 5.391 4.191 3.619 3.289 3.074 2.924 2.813 2.728 2.606 2.490 2.380 2.327 2.276 2.226 2.177 2.130
4 55.833 9.243 5.343 4.107 3.520 3.181 2.961 2.806 2.693 2.605 2.480 2.361 2.249 2.195 2.142 2.091 2.041 1.992
5 57.240 9.293 5.309 4.051 3.453 3.108 2.883 2.726 2.611 2.522 2.394 2.273 2.158 2.103 2.049 1.997 1.946 1.896
6 58.204 9.326 5.285 4.010 3.405 3.055 2.827 2.668 2.551 2.461 2.331 2.208 2.091 2.035 1.980 1.927 1.875 1.824
7 58.906 9.349 5.266 3.979 3.368 3.014 2.785 2.624 2.505 2.414 2.283 2.158 2.040 1.983 1.927 1.873 1.819 1.767
8 59.439 9.367 5.252 3.955 3.339 2.983 2.752 2.589 2.469 2.377 2.245 2.119 1.999 1.941 1.884 1.829 1.775 1.722
9 59.858 9.381 5.240 3.936 3.316 2.958 2.725 2.561 2.440 2.347 2.214 2.086 1.965 1.906 1.849 1.793 1.738 1.684
Figura 11. Consulta da tabela F de Snedecor
10 60.195 9.392 5.230 3.920 3.297 2.937 2.703 2.538 2.416 2.323 2.188 2.059 1.937 1.877 1.819 1.763 1.707 1.652
12 60.705 9.408 5.216 3.896 3.268 2.905 2.668 2.502 2.379 2.284 2.147 2.017 1.892 1.832 1.773 1.715 1.657 1.601
15 61.220 9.425 5.200 3.870 3.238 2.871 2.632 2.464 2.340 2.244 2.105 1.972 1.845 1.783 1.722 1.662 1.603 1.545
20 61.740 9.441 5.184 3.844 3.207 2.836 2.595 2.425 2.298 2.201 2.060 1.924 1.794 1.730 1.667 1.605 1.543 1.482
24 62.002 9.450 5.176 3.831 3.191 2.818 2.575 2.404 2.277 2.178 2.036 1.899 1.767 1.702 1.638 1.574 1.511 1.447
30 62.265 9.458 5.168 3.817 3.174 2.800 2.555 2.383 2.255 2.155 2.011 1.873 1.738 1.672 1.606 1.541 1.476 1.409
40 62.529 9.466 5.160 3.804 3.157 2.781 2.535 2.361 2.232 2.132 1.986 1.845 1.708 1.641 1.573 1.506 1.437 1.368
60 62.794 9.475 5.151 3.790 3.140 2.762 2.514 2.339 2.208 2.107 1.960 1.817 1.677 1.607 1.538 1.467 1.395 1.320
120 63.061 9.483 5.143 3.775 3.123 2.742 2.493 2.316 2.184 2.082 1.932 1.787 1.643 1.571 1.499 1.425 1.348 1.265
Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 19
Exemplo: Acunputura

Suponha que um experimento foi realizado com dois grupos para avaliar a efetividade
do uso da acupuntura para aliviar a dor. A taxa sensorial foi medida para o grupo 1 em 5
pacientes e para o 2 em 8 pacientes. Suponha que as variâncias amostrais foram
s21 = 4,44 e o s22 = 1,5. Assumindo que as variâncias populacionais são iguais, qual a
s21
probabilidade de ocorrer a razão s22
ou uma mais extrema?

 
s21
P > = P(F5−1,8−1 > 2,96) ≈ 0,1.
4,44
s22 1,5

Você considera a suposição de igualdade de variâncias plausível dado o resultado do


experimento?

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 20


Relações entre as distribuições

I Uma v.a. Normal padrão ao quadrado tem distribuição χ 2 com gl = 1.


I Uma v.a. t-Student ao quadrado tem distribuição F com gl = 1.
I Razão de duas v.a. χ 2 divida pelos seus gl’s tem distribuição Fn1 ,n2 .
I Distribuição F converge para a χ 2 com n → ∞.
I Existem extensões não-centrais (modelo de locação e escala).
I Distribuição t-Student é uma alternativa robusta a Normal.
I Todas são relacionadas a Normal e quando gl cresce vão convergir para a Normal.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 21


Resumo

I Distribuição amostral de estatísticas


importantes.
I Distribuição χ 2 ;
I Distribuição t−Student;
I Distribuição F .

Figura 12. Retirada do Google imagens.

Prof. Wagner Hugo Bonat Distribuição amostral de estatísticas importantes 22

Você também pode gostar