Você está na página 1de 40

Intervalo de Confiança para

diferença de médias– Aula


03
Statistics for Business and Economics 7 edição, by Paul Newbold , William Carlson ,
Betty Thorne (cap. Estimation: Additional Topics)
Cap 12 Bussab e Morettin
Statistics for Economics, Accounting and Business Studies, capítulo 4, Barrow
Marislei Nishijima

Estatística II 1
Amostras Dependentes
Teste de média de 2 Populações Relacionadas
Amostras • Amostras emparelhadas ou combinadas
dependentes • Medidas repetidas (antes / depois)
• Use a diferença entre os valores emparelhados:
di = xi - yi

• Elimina a variação entre objetos


• Hipótese:
• Ambas populações são normalmente distribuídas

Estatística II
Diferença de média
A iésima diferença emparelhada é di , sendo
Amostras
dependentes
di = xi - yi
n

åd
A estimative pontual para a
diferença da média da população i
emparelhada é d : d= i =1
n
O desvio padrão da n

diferença amostral å i
(d - d) 2

é: Sd = i=1
n -1
n é o número de pares combinados numa mesma amostra
Estatística II
Intervalo de Confiança para a diferença de Médias

IC para a diferença de Médias


Amostras populacionais, μd , é
dependentes

Sd Sd
d - t n-1,α/2 < μd < d + t n-1,α/2
n n
Sendo
n = tamanho da amostra
(número de pares combinados numa amostra
emparelhada)

Estatística II
IC para a diferença de Médias
(cont.)

• A margem de erro é
Amostras
dependentes
sd
ME = t n-1,α/2
n

• tn-1,a/2 é o valor da distribuição t de Student com


(n – 1) graus de Liberdade para a probabilidade

α
P(t n-1 > t n-1,α/2 ) =
2

Estatística II
Estatística II 6
Exemplo de amostras dependentes
Seis pessoas se inscreveram
Amostras em um programa de perda de
dependentes peso. Você coleta os seguintes
dados:
Peso: S
d = n
d i
Pessoa Antes(x) Depois (y) Diferença, di

1 136 125 11 = 7.0


2 205 195 10
3 157 150 7
4 138 140 -2
Sd =
å i
(d - d) 2

5 175 165 10
n -1
6 166 160 6
42 = 4.82

Estatística II
Exemplo de amostras dependentes (emparelhadas)
(cont.)

Amostras • Para um IC de 95%, o valor t apropriado t é tn-1,a/2 = t5,.025 = 2.571


dependentes
• O IC de 95% para a diferença de médias, μd , é

Sd S
d - t n-1,α/2 < μd < d + t n-1,α/2 d
n n
4.82 4.82
7 - (2.571) < μd < 7 + (2.571)
6 6
- 1.94 < μd < 12.06

Como este intervalo contém zero, não podemos ter 95% de confiança, dados
esses dados limitados, de que o programa de perda de peso ajuda as pessoas a
perderem peso
Estatística II
Diferenças entre duas medias:
Amostras Independentes

Objetivo: Construir um intervalo de


Médias população,
amostras independentes confiança para a diferença entre
duas médias populacionais, μx – μy
• Diferente fontes de dados
• Não relacionados
• Independente
• A amostra selecionada de uma população não tem efeito sobre a
amostra selecionada de outra população
• A estimativa pontual é a diferença entre as duas médias
amostrais:
x–y
Estatística II
Diferenças entre duas medias:
Amostras Independentes
(cont.)

Médias população,
amostras independentes

σx2 e σy2 conhecidas IC usar za/2

σx2 e σy2 desconhecidas

σx2 e σy2 assumido


serem iguais IC usar valores da distribuição t de
Student ou t(n-1),a/2
σx2 e σy2 assumido
diferentes
Estatística II
σx2 e σy2 conhecidos

Médias população, Hipóteses:


amostras independentes
§ As amostras são aleatórias e
independentemente retiradas

σx2 e σy2 conhecidas


* § ambas as distribuições de população são
normais

σx2 e σy2 desconhecidas § As variâncias populacionais são


conhecidas

Estatística II
σx2 e σy2 conhecidas
(cont.)
Quando σx e σy são conhecidos e ambas
Médias população, populações são normais, a variância de X – Y é
amostras independentes

2 2
σx σy

*
σx2 e σy2 conhecidas
σ 2X - Y = +
nx ny

…e a variável aleatória
σx2 e σy2 desconhecidas
(x - y) - (μX - μY )
Z=
2
σ 2x σ y
+
nX nY
tem distribuição normal padrão

Estatística II
IC, σx2 e σy2 conhecidas

Médias população,
amostras independentes

σx2 e σy2 conhecidas


* O IC para μx – μy é:

σx2 e σy2 desconhecidas

σ 2X σ 2Y σ 2X σ 2Y
(x - y) - z α/2 + < μX - μY < (x - y) + z α/2 +
nx ny nx ny
Estatística II
σx2 e σy2 desconhecidas,
Assumidas iguais
Hipóteses:
Médias população,
amostras independentes
§ As amostras são aleatórias e retiradas de
forma independente
σx2 e σy2 conhecidas

§ Populações são normalmente distribuídas


σx2 e σy2 desconhecidas

§ As variações populacionais são


σx2 e σy2 supostas
iguais * desconhecido, mas supostas iguais

σx2 e σy2 supostas


diferentes
Estatística II
σx2 e σy2 desconhecidas,
Assumidas iguais (cont.)

Médias população, Criando estimativas por


amostras independentes
intervalo:
§ as variâncias populacionais são assumidas
iguais, usar então os dois desvio-padrão
σx2 e σy2 conhecidas amostrais e juntá-los para estimar σ

§ use o t valor com


σx2 e σy2 desconhecidas (nx + ny – 2) graus de liberdade

σx2 e σy2 supostas


iguais *
σx2 e σy2 supostas
diferentes
Estatística II
σx2 e σy2 desconhecidas,
Assumidas iguais (cont.)

Médias população,
amostras independentes

A variância conjunta é
σx e
2 σy2 conhecidas

σx2 e σy2 desconhecidas


(n x - 1)s2x + (n y - 1)s2y
sp2 =
σx2 e σy2 supostas
iguais * nx + ny - 2

σx2 e σy2 supostas


diferentes
Estatística II
σx2 e σy2 desconhecidas,
Assumidas iguais
σx2 e σy2 conhecidas

σx2 e σy2 supostas


iguais * O IC para μ1 – μ2 é:

σx2 e σy2 supostas


diferentes

sp2 sp2 sp2 sp2


(x - y) - t nx +ny -2,α/2 + < μX - μY < (x - y) + t nx +ny -2,α/2 +
nx ny nx ny

(n x - 1)s2x + (n y - 1)s2y
Where sp2 =
nx + ny - 2
Estatística II
Exemplo: Variância conjunta

Você está testando a velocidade de dois processadores de


computador. Forme um intervalo de confiança para a
diferença na velocidade da CPU. Você coleta os seguintes
dados de velocidade (em Mhz):
CPUx CPUy
Quant. Testada 17 14
Média amostra 3004 2538
Des-Pad amostra 74 56

Assuma que ambas as populações são


normalmente distribuídas e com variâncias
iguais. Use 95% de confiânça.

Estatística II
Calculando a Variância conjunta
a Variância conjunta é:

S =
2
(n x - 1)S x
2
+ (n y - 1)S y
2

=
(17 - 1)74 2 + (14 - 1)56 2
= 4427.03
p
(n x - 1) + (n y - 1) (17 - 1) + (14 - 1)

O t valor para um IC de 95% é:

t nx +ny -2 , α/2 = t 29 , 0.025 = 2.045

Estatística II
Calculando os limites do Intervalo

• O IC de 95% é:

sp2 sp2 sp2 sp2


(x - y) - t nx +ny -2,α/2 + < μX - μY < (x - y) + t nx +ny -2,α/2 +
nx ny nx ny

4427.03 4427.03 4427.03 4427.03


(3004 - 2538) - (2.054) + < μX - μY < (3004 - 2538) + (2.054) +
17 14 17 14

416.69 < μX - μY < 515.31

Estamos 95% confiantes que a diferença de media em velocidade de CPU


recai entre 416.69 e 515.31 Mhz.
Estatística II
σx2 e σy2 desconhecidas,
supostas diferentes

Médias população, Hipóteses:


amostras independentes

§ As amostras são aleatórias e retiradas de


forma independente
σx2 e σy2 conhecidas
§ Populações são normalmente distribuídas
σx2 e σy2 desconhecidas
§ As variações populacionais são
σx2 e σy2 supostas desconhecido, mas supostas diferentes
iguais

Estatística II
σx2 e σy2 supostas
diferentes *
σx2 e σy2 desconhecidas,
supostas diferentes
(cont.)

Médias população,
Forming interval estimates:
amostras independentes
Criando estimativas por intervalo:
§ as variâncias populacionais não são supostas iguais,
σx2 e σy2 conhecidas usar então usar a variância conjunta não é adequado.

§ use o t valor com n graus de Liberdade, sendo


σx2 e σy2 desconhecidas 2
é s 2
s ù2
y
ê( ) + ( )ú
x

σx2 e σy2 supostas êë n x n y úû


v=
iguais æ sx ö
2
2
æ sy ö
2
2

çç ÷÷ /(n x - 1) + ç ÷ /(n y - 1)

*
çn ÷
σx2 e σy2 supostas è nx ø è yø
diferentes
Estatística II
Intervalo de Confiança,
σx2 e σy2 desconhecidas, supostas diferentes

σx2 e σy2 desconhecidas

σx2 e σy2 supostas O IC para μ1 – μ2 é:


iguais

σx2 e σy2 supostas


diferentes *
2 2
s2x s y s2x s y
(x - y) - tn ,α/2 + < μX - μY < (x - y) + tn ,α/2 +
nx ny nx ny
2
é s2x s2y ù
ê( ) + ( )ú
ëê n x n y ûú
Sendo v= 2 2
æ s2x ö æ s2 ö
çç ÷÷ /(n x - 1) + ç y ÷ /(n y - 1)
çn ÷
Estatística II è nx ø è yø
Duas Proporções Populacionais
Objetivo: Construir um Intervalo de
Proporções
Populacionais
Confiança para a diferença de duas
proporções populacionais, Px – Py

Hipóteses:
Ambas amostras são grandes (geralmente pelo menos 40
observações em cada amostra)

pˆ x - pˆ y
A estimativa pontual para a
diferença é

Estatística II
Duas Proporções Populacionais
(cont.)

• A variável aleatória
Proporções
Populacionais

(pˆ x - pˆ y ) - (p x - p y )
Z=
pˆ x (1- pˆ x ) pˆ y (1- pˆ y )
+
nx ny

É aproximadamente normalmente
distribuída

Estatística II
Intervalo de Confiança for duas
proporções populacionais

Proporções
Populacionais Os limites de confiança para
Px – Py são:

pˆ x (1- pˆ x ) pˆ y (1- pˆ y )
(pˆ x - pˆ y ) ± Za / 2 +
nx ny

Estatística II
Exemplo:
Duas proporções populacionais
Construa um IC de 90% para a diferença
entre as proporções de homens e mulheres
que tem Ensino Superior completo

• Numa amostra aleatória, 26 de 50 homens


e 28 de 40 mulheres obtiveram curso
superior.

Estatística II
Exemplo:
Duas proporções populacionais
(cont.)

Homens: ˆp x = 26 = 0.52
50

Mulheres: ˆp y = 28 = 0.70
40

pˆ x (1- pˆ x ) pˆ y (1- pˆ y ) 0.52(0.48) 0.70(0.30)


+ = + = 0.1012
nx ny 50 40

Para 90% confiança, Za/2 = 1.645

Estatística II
Exemplo:
Duas proporções populacionais
(cont.)

Os limites de confiança são:

pˆ x (1- pˆ x ) pˆ y (1- pˆ y )
(pˆ x - pˆ y ) ± Z α/2 +
nx ny

= (.52 - .70) ± 1.645 (0.1012)

então o IC é

-0.3465 < Px – Py < -0.0135

Como o interval não inclui zero de estamos 90% confiantes que as duas
proporções não são iguais.
Estatística II
Determinando o tamanho da amostra

Determinando o
tamanho da
amostra

Populações Grandes

Para a média Para a proporção

Estatística II
Margem de Erro
• O tamanho requerido da amostra pode ser calculado
para alcançar a margem de erro (ME) desejada com
o nível de confiança de (1 - a)

• A margem de erro também é conhecida por erro


amostral
• a quantidade de imprecisão na estimativa do parâmetro
populacional
• a quantidade adicionada e subtraída à estimativa pontual
para formar o intervalo de confiança

Estatística II
Determinando o tamanho da amostra
Populações Grandes

Para a média

Margem de Erro (Erro


amostral)

σ σ
x ± z α/2 ME = z α/2
n n

Estatística II
Determinando o tamanho da amostra
(cont.)
Populações Grandes

Para a média

2 2
σ Resolvendo para z σ
ME = z α/2
n
n tem-se: n= α/2
2
ME

Estatística II
Determinando o tamanho da amostra
(cont.)

• Para determinar o tamanho da amostra para a


média, é preciso conhecer:

• O nível de confiança desejado (1 - a), que determina o


valor za/2
• A margem de erro aceitável (erro de amostragem), ME
• O desvio-padrão populaciona, σ

Estatística II
Tamanho da amostra requerido

Se s = 45, qual o tamanho da amostra


necessário para estimar a média dentro de ± 5
com 90% de confiança?

2 2 2 2
z σ (1.645) (45)
n= α/2
2
= 2
= 219.19
ME 5

Então o tamanho requerido é n = 220


(Sempre
arredondado)
Estatística II
Determinando o tamanho da amostra:
Proporção da população
População grande

Para a proporção

pˆ (1- pˆ ) pˆ (1- pˆ )
pˆ ± z α/2 ME = z α/2
n n
Margem de Erro (erro
amostral)
Estatística II
Determinando o tamanho da amostra:
Proporção da população (cont.)
População grande

Para a proporção

pˆ (1- pˆ )
ME = z α/2
n
pˆ (1- pˆ )
não pode ser Substituir por 0.25
2
maior que 0.25, e resolver para n
0.25 z
quando p̂= 0.5 para obter pˆ (1- pˆ)
n= 2
α/2
ME
Estatística II
Determinando o tamanho da amostra:
Proporção da população (cont.)
• As proporções amostral e populacional, p̂ e P, são em geral
desconhecidas (nenhuma amostra havia sido retirada)
• P(1 – P) = 0.25 gera uma margem de erro grande ( então,
garante que o resultado da amostra atenderá o nível de
confiança desejado)
• Para determinar o tamanho da amostra necessário para a
proporção, deve-se conhecer:
• O tamanho desejado do nível de confiança (1 - a), que determina o
valor crítico za/2
• A margem de erro de aceitação (margem de erro), ME
• Estimativa P(1 – P) = 0.25

Estatística II
Tamanho necessário da amostra para a Proporção.
Exemplo: Proporção Populacional

Qual o tamanho da amostra seria necessário


para estimar a verdadeira proporção de
defeitos em uma grande população dentro de
± 3%, com 95% de confiança?

Estatística II
Tamanho necessário da amostra para a Proporção
(cont.)

Solução:
Para 95% de confiança, use z0.025 = 1.96
ME = 0.03
Estimativa P(1 – P) = 0.25

2 2
0.25 z (0.25)(1.96)
n= 2
α/2
= 2
= 1067.11
ME (0.03)
Usar n = 1068

Estatística II

Você também pode gostar