Você está na página 1de 16

05/12/2014

Estimativa pontual para populao

ESTATSTICA
INFERENCIAL

Estimativa pontual
Um valor nico estimado para um parmetro
populacional.
A estimativa pontual menos tendenciosa de uma mdia
populacional a mdia amostral.

UNIVERSIDADE FEDERAL DO MARANHO


MARIA JOS HERCULANO MACEDO
DISCIPLINA: ESTATSTICA E PROBABILIDADE

Parmetro de estimativa Com amostra


populacional
estatstica

Mdia:

Exemplo: estimativa pontual para


populao
Pesquisadores de mercado usam o nmero de frases por
anncio como medida de legibilidade de anncios de
revistas. A seguir, representamos uma amostra aleatria do
nmero de frases encontrado em 50 anncios. Encontre a
estimativa pontual da mdia populacional . (Fonte:
Journal of Advertising Research.)
9
12
17
12

20 18 16 9 9 11 13 22 16 5 18 6 6 5
25 17 23 7 10 9 10 10 5 11 18 18 9 9
13 11 7 14 6 11 12 11 6 12 14 11 9 18
12 17 11 20

Soluo: estimativa
pontual para populao .
A mdia amostral dos dados
x

x 620

12.4
n
50

Ento, a estimativa pontual para a mdia do


comprimento de todos os anncios de revista
12,4 frases.

05/12/2014

Nvel de confiana (c)

Estimativa intervalar

A probabilidade de que o intervalo estimado contenha o

Um intervalo, ou amplitude de valores, usado

parmetro populacional.

para estimar um parmetro populacional.

c a rea sob a curva


normal padro entre os
valores crticos.

c
(1 c)

(1 c)
-zc

Qual o nvel de confiana que queremos ter para


a estimativa intervalar contenha a mdia
populacional ?

z=0

zc

Use a tabela normal


padro para encontrar
Valores crticos os escores z
correspondentes.

A rea restante nas caudas 1 c .

Erro de amostragem
Se o nvel de confiana 90%, isso significa que temos

90% de certeza que o intervalo contm a mdia


populacional .

A diferena entre a estimativa pontual e o valor do

parmetro populacional real.


Para :
O erro de amostragem a diferena
geralmente desconhecido.
x varia de amostra para amostra.

c = 0,90
(1 c) = 0,05

(1 c) = 0,05

zc
-zc = 1,645

x .

z
z=0

zc
zc = 1,645

Os escores z correspondentes so +1,645.

05/12/2014

Margem de erro

10

Exemplo: encontrando a
margem de erro

Maior distncia possvel entre o ponto de estimativa e o

valor do parmetro que est se estimando para um dado


nvel de confiana, c.
Denotado por E.

E zc x zc

Quando n 30, o
desvio padro da
amostra, s, pode ser
usado para .

Use os dados das propagandas das revistas e


um nvel de confiana de 95% para encontrar a
margem de erro do nmero de frases em todos
os anncios de revistas. Assuma que o desvio
padro da amostra seja aproximadamente 5,0.

s vezes chamado de erro mximo ou tolerncia de erro.

11

12

Soluo: encontrando a margem de erro


Primeiro, encontre os valores crticos

E zc

0,95

zc

-zc = 1,96

z=0

zc
zc = 1,96

1.96

0,025

0,025

95% da rea sob a curva normal padro cai dentro de


1,96 desvio padro da mdia. (Voc pode aproximar a
distribuio das mdias amostrais com uma curva
normal pelo Teorema do Limite Central, j que n 30.)

zc
5.0

s
n

Voc no conhece
, mas j que n
30, voc pode usar
s no lugar de .

50

1.4
Voc tem 95% de confiana que a margem de
erro para a mdia populacional de
aproximadamente 1,4 frase.

05/12/2014

13

14

Construindo intervalos
de confiana para

Intervalos de confiana
para a mdia populacional

Encontrando um intervalo de confiana para a mdia


populacional (n 30 ou conhecido como uma
populao normalmente distribuda).
Em palavras
smbolos

Onde:

Em

1. Encontre a estatstica amostral n e


.

2. Especifique , se for conhecido.


Caso contrrio, encontre o desvio
padro amostral s e use-o como
uma estimativa para .

x
n

(x x )2
n 1

15

Em palavras
3. Encontre o valor crtico zc
que corresponda ao nvel de
confiana dado.

Em smbolos
Use a tabela
normal padro

4. Encontre a margem de erro


E.

E zc

5. Encontre os extremos
esquerdo e direito e forme o
intervalo de confiana.

Extremo esquerdo:
x E
Extremo direito: x E
Intervalo:
x E x E

16

Exemplo: construindo um
intervalo de confiana
Construa um intervalo de confiana de 95% para a mdia
do nmero de frases em todos os anncios de revista.

Soluo: Lembre-se: x 12.4 e E = 1,4.


Extremo esquerdo: Extremo direito:

xE

xE

12.4 1.4

12.4 1.4

11.0

13.8
11,0 < < 13,8

05/12/2014

17

18

Exemplo: construindo um
intervalo de confiana, conhecido

Soluo: construindo um
intervalo de confiana
11,0 < < 13,8

Com 95% de confiana, voc pode dizer que a


mdia populacional do nmero de frases est
entre 11,0 e 13,8.

O diretor de admisso de uma faculdade deseja estimar a


idade mdia de todos os estudantes matriculados. Em uma
amostra aleatria de 20 estudantes, a idade mdia
encontrada de 22,9 anos. Baseado em estudos
anteriores, o desvio padro conhecido 1,5 ano e a
populao normalmente distribuda. Construa um
intervalo de confiana de 90% para a mdia de idade da
populao.

19

20

Soluo: construindo um
intervalo de confiana, conhecido

Primeiro encontre os valores crticos

E zc

c = 0,90

(1 c) = 0,05

(1 c) = 0,05

zc
-zc = 1,645

z=0

zc
zc = 1,645

zc = 1,645

Margem de erro:

1.645

1.5
20

0.6

Intervalo de confiana:

Extremo
esquerdo:

xE

Extremo
direito:

22.9 0.6
22.3
22,3 < < 23,5

xE
22.9 0.6
23.5

05/12/2014

21

22

22,3 < < 23,5

Os segmentos
horizontais representam
90% de intervalos de
confiana para diferentes
amostras do mesmo
tamanho. A longo prazo,
9 de cada 10 intervalos
destes contero .

Estimativa
pontual

22,3

22,9

23,5

xE

x E

Com 90% de confiana, voc pode dizer que a


idade mdia de todos os estudantes est entre
22,3 e 23,5 anos.

23

A distribuio t
Quando o desvio padro da populao desconhecido, o

tamanho da amostra menor que 30, e a varivel x


normalmente distribuda; ela segue uma distribuio t.

24

Propriedades da distribuio t
1.

x -
s
n

Valores crticos de t so denotados por tc

A distribuio t tem formato de sino e simtrica


em relao mdia.
A distribuio t uma famlia de curvas, cada uma
determinada por um parmetro chamado de graus
de liberdade. Quando usamos a distribuio t para
estimar a mdia da populao, os graus de
liberdade so iguais ao tamanho da amostra
menos um.
d.f. = n 1
Graus de liberdade

05/12/2014

25

2. A rea total sob a curva t 1 ou 100%.


3. A mdia, a mediana e a moda da distribuio t so iguais
a zero.
4. Conforme os graus de liberdade aumentam, a
distribuio t aproxima-se da distribuio normal.
Depois de 30 g.l., a distribuio t est muito prxima da
distribuio normal padro z. A amostra 15.

26

Exemplo: valores
crticos de t
Encontre o valor crtico de tc para uma confiana de 95% quando o tamanho
da amostra 15.
Soluo: d.f. = n 1 = 15 1 = 14

As caudas na distribuio t
so mais grossas que
aquelas da distribuio
normal padro.

d.f. = 2
d.f. = 5

Curva normal padro

27

28

Soluo: valores
crticos de t

Intervalos de confiana
para a mdia populacional

95% da rea sob a curva da distribuio t com 14 graus de


liberdade est entre t = +2,145.

Um intervalo de confiana c para a mdia


populacional

c = 0,95

x E x E

em
que
where

E tc

s
n

A probabilidade de que o intervalo de confiana contenha


t

tc = 2,145

c.

tc = 2,145

05/12/2014

29

30

Intervalos de confiana e
a distribuio t
Em palavras
1. Identifique nas amostras as
estatsticas n, x e s.

Em palavras

Em smbolos
x

2. Identifique os graus de
liberdade, o nvel de confiana
c e o valor crtico tc.
3. Encontre a margem de erro E.

x
(x x )
s
n 1
n

4. Encontre os extremos
esquerdo e direito e
forme um intervalo de
confiana.

Em smbolos
Extremo esquerdo:

x E

Extremo direito: x E
Intervalo:
x E x E

d.f. = n 1

E tc

s
n

31

Exemplo: construindo
um intervalo de confiana

32

Soluo: construindo
um intervalo de confiana

Voc seleciona aleatoriamente 16 cafeterias e mede a


temperatura do caf vendido em cada uma delas. A mdia
de temperatura da amostra 162,0F com desvio padro
da amostra de 10,0F. Encontre um intervalo de confiana
de 95% para a temperatura mdia. Assuma que as
temperaturas so normalmente distribudas.

Soluo:
Use a distribuio t (n < 30, desconhecido,
temperaturas so normalmente distribudas.)

tc = 2.131

05/12/2014

33

Margem de erro:

Intervalo de confiana:

34

156,7 < < 167,3

E tc

s 2.131 10 5.3
n

Estimativa pontual

156,7

16

Extremo esquerdo:

xE

x E

Extremo direito:

xE

162 5.3

162 5.3

156.7

167.3

162,0

167,3

xE

Com 95% de confiana, voc pode dizer que a


temperatura mdia do caf vendido est entre 156.7F
e 167.3F.

156,7 < < 167,3

35

Normal ou distribuio t?
n 30?

Sim

No

A populao distribuda
normalmente, ou
aproximadamente normal?

Sim

No pode usar a distribuio


normal ou a distribuio t.
Use a distribuio normal com
E zc

No

Teste de hiptese
Um processo que usa amostras estatsticas para testar uma

afirmao sobre o valor de um parmetro populacional.


No

Sim

conhecido?

Use a distribuio normal com

E zc
n
Se for desconhecido, use s.

Por exemplo: Um fabricante de automveis anuncia que seu

novo carro hbrido percorre 20km com 1 litro de gasolina. Para


testar essa afirmao, uma amostra deve ser tirada. Se a
mdia amostral difere da mdia anunciada, voc pode afimar
que o anncio est incorreto.

Use a distribuio t com


E tc

e n 1 grau de liberdade.

05/12/2014

Correlao

Um diagrama de disperso pode ser usado para


determinar se existe uma correlao linear (linha reta)
entre duas variveis.
y

Uma relao entre duas variveis.


Os dados podem ser representados por pares ordenados

(x, y):

Exemplo:
x
y

x a varivel independente (ou explanatria).


y a varivel dependente (ou resposta).

1
2
3
4 2 1

4
0

5
2

x
2

Tipos de correlao

Conforme x
aumenta, y tende
a decrescer.

Conforme x
aumenta, y tende
a aumentar.
x

Correlao linear negativa


y

Sem correlao

Correlao linear positiva

Correlao no linear

Exemplo: construindo
um diagrama de disperso
Um gerente de marketing conduziu um
estudo para determinar se h uma
relao entre o dinheiro gasto com
propaganda e as vendas da empresa.
Os dados so mostrados na tabela ao
lado. Coloque os dados em um
diagrama de disperso e determine se
parece haver uma correlao linear
positiva e negativa ou se parece no
haver correlao linear.

Gastos com
propaganda,
($1000), x

Vendas da
empresa
($1000), y

2,4
1,6
2,0
2,6
1,4
1,6
2,0
2,2

225
184
220
240
180
184
186
215

10

05/12/2014

Soluo: construindo um diagrama de disperso

Coeficiente de correlao
Uma medida da fora e direo de uma relao linear

entre duas variveis.


O smbolo r representa o coeficiente de correlao

amostral.
Uma frmula para r :

Parece haver uma correlao linear positiva. Conforme os gastos com


propaganda aumentam, as vendas tendem a aumentar.

n xy x y
n x 2 x

n y 2 y

Sendo n o nmero de pares ordenados.


O coeficiente de correlao populacional representado
por (r).

Correlao linear
y

A amplitude do coeficiente de correlao -1 para 1.

-1
Se r = -1 existe
uma correlao
negativa perfeita.

0
Se r est prximo
de 0 no existe
correlao linear.

1
Se r = 1 Existe
uma correlao
positiva perfeita.

r = 0,91

r = 0,88

Correlao negativa forte


y

Correlao positiva forte


y

r = 0,42

r = 0,07

Correlao positiva fraca

Correlao no linear

11

05/12/2014

Calculando um coeficiente de correlao


Em palavras

Em palavras
4. Faa o quadrado de cada
valor x e encontre a
soma.

Em smbolos

1. Encontre a soma dos valores x.

2. Encontre a soma dos valores y.

3. Multiplique cada valor x por seu


valor y correspondente e encontre
a soma.

x2

5. Faa o quadrado de cada


valor y e encontre a
soma.

xy

6. Use as cinco somas para


calcular o coeficiente de
correlao.

y2

n xy x y
n x 2 x

n y 2 y

Soluo: encontrando o coeficiente de correlao

Exemplo: encontrando
o coeficiente de correlao
Calcule o coeficiente de correlao para
os dados dos gastos com propaganda e
vendas da empresa informados no
Exemplo 1. O que podemos concluir?

Em smbolos

Gastos com Vendas da


propaganda, empresa
($1000), x ($1000), y

2,4
1,6
2,0
2,6
1,4
1,6
2,0
2,2

225
184
220
240
180
184
186
215

x
2.4
1.6
2.0
2.6
1.4
1.6
2.0
2.2
x = 15.8

y
225
184
220
240
180
184
186
215
y = 1634

xy
x2
y2
5.76
50,625
540
294.4
2.56
33,856
440
4
48,400
624
57,600
6.76
252
1.96
32,400
294.4
2.56
33,856
372
4
34,596
473
4.84
46,225
xy = 3289.8 x2 = 32.44 y2 = 337,558

12

05/12/2014

Exemplo: usando tecnologia para encontrar o coeficiente


de correlao
x = 15.8

y = 1634

xy = 3289.8

x2 = 32.44

y2 = 337,558

n xy x y

Use a ferramenta tecnolgica para


calcular o coeficiente de correlao para
os dados do Old Faithful fornecidos na
tabela. O que podemos concluir?

Durao
x

Tempo,
y

Durao Tempo,
x
y

1.8

56

3.78

79

1.82

58

3.83

85

1.9

62

3.88

80

1.93

56

4.1

89

1.98

57

4.27

90

8(32.44) 15.82 8(337, 558) 1634 2

2.05

57

4.3

89

2.13

60

4.43

89

501.2
0.9129
9.88 30, 508

2.3

57

4.47

86

2.37

61

4.53

89

2.82

73

4.55

86

3.13

76

4.6

92

3.27

77

4.63

91

3.65

77

n x x
2

n y y
2

8(3289.8) 15.81634

r 0.913 sugere uma correlao linear positiva forte. Conforme aumenta


o gasto com propaganda, as vendas da empresa tambm aumentam.

Soluo: usando tecnologia para encontrar


o coeficiente de correlao 2
2
x = 32.44

y = 337,558

Linhas de regresso
Podem ser usadas para prever o valor de y para um

dado valor de x.

13

05/12/2014

Resduos
A diferena entre o valor y observado e o valor y previsto

para um dado valor x na linha.


Para um dado valor x,
di = (valor y observado) (valor y previsto)
y

valor y
observado
d3{
}d1

d4

}d2

d6{

}d5

valor y
previsto
x

A equao da linha de regresso


= mx + b onde

n xy x y
m
2
n x 2 x

y
x
b y mx
m
n
n

y a mdia dos valores y no conjunto de dados

x a mdia dos valores x no conjunto de dados

A linha de regresso sempre passa pelo ponto

x, y

Linha de regresso (linha de melhor ajuste)


A linha para a qual a soma dos quadrados dos resduos
um mnimo.
A equao de uma linha de regresso para uma varivel
independente x e uma varivel dependente y :
= mx + b
interseo y
valor y
inclinao
previsto para
um dado
valor x

Soluo: encontrando a equao


da linha de regresso

x
2,4
1,6
2,0
2,6
1,4
1,6
2,0
2,2

y
225
184
220
240
180
184
186
215

x = 15,8

y = 1634

xy

x2

y2

540
5,76
50.625
294,4
2,56
33.856
440
4
48.400
624
6,76
57.600
252
1,96
32.400
294,4
2,56
33.856
372
4
34.596
473
4,84
46.225
xy = 3289,8 x2 = 32,44 y2 = 337.558

14

05/12/2014

Para desenhar a linha de regresso, use quaisquer dois valores x

dentro da faixa de dados e calcule seus valores y correspondentes a


partir da linha de regresso.

x = 15,8

y = 1634

xy = 3289,8

x2 = 32,44 y2 = 337.558
y

8(3289.8) (15.8)(1634)
n xy x y
m
8(32.44) 15.82
2
2
n x x
501.2

50.72874
9.88

Vendas da empresa
(em milhares de dlares)

b y mx

260

1634
15.8
(50.72874)
8
8
204.25 (50.72874)(1.975) 104.0607

240

y 50.729 x 104.061

220

200

180

160
1,2

Equao da linha de regresso

1,4

y 50.729 x 104.061

Exemplo: prevendo valores y usando equaes de


regresso
A equao de regresso para os dados sobre gastos com

propaganda (em milhares de dlares) e vendas da empresa (em


milhares de dlares) : = 50,729x + 104,061. Use essa
equao para prever as vendas esperadas da empresa para os
seguintes gastos com propaganda
1.1,5 mil dlares
2.1,8 mil dlares
3.2,5 mil dlares

1,6

1,8

2,2

2,4

2,6

2,8

Gastos com propaganda


(em milhares de dlares)

Soluo: prevendo valores y usando equaes de


regresso
= 50,729x + 104,061
1.
1,5 mil dlares

=50,729(1,5) + 104,061 180,155


Quando os gastos com propaganda so de $1500, as vendas da
empresa so cerca de $180,155.
2.

1,8 mil dlares


=50,729(1,8) + 104,061 195,373
Quando os gastos com propaganda so de $1800, as vendas da
empresa so cerca de $195,373.

15

05/12/2014

3. 2,5 mil dlares

=50,729(2,5) + 104,061 230,884


Quando os gastos com propaganda so de $2500, as
vendas da empresa so cerca de $230,884.
Valores de previso so significantes somente para valores x
na (ou prximos ) faixa dos dados. Os valores x do
conjunto original de dados variam de 1,4 a 2,6. Portanto,
no seria apropriado usar a linha de regresso y^ = 50,729x
+ 104,061 para prever as vendas da empresa por gastos com
propaganda, tais como 0,5 ($ 500) ou 5,0 ($ 5.000).

Coeficiente de determinao
A proporo da variao explicada para a variao total.
Denotada por r2 .

Exemplo: coeficiente de determinao


O coeficiente de correlao para os gastos de propaganda e dados
sobre as vendas da empresa conforme calculado no Exemplo 4 r
=0,913. Encontre
o coeficiente de determinao. O que isso lhe diz

sobre a variao explicada dos dados sobre a linha de regresso?


E sobre a variao no explicada?

Soluo:

r 2 (0.913) 2
0.834

Cerca de 83,4% da variao nas vendas da empresa podem ser


explicadas pela variao dos gastos com propaganda. Cerca de
16,9% da variao no explicada.

16