Você está na página 1de 113

Inferncia Estatstica

Capitulo1: TEORIA DE AMOSTRAGEM


Introduo
A teoria de amostragem dedica-se ao desenvolvimento, anlise e melhoramento dos mtodos de
recolha de informao necessria num inqurito, a seleco da amostra, a obteno de
informao da amostra, na traduo da informao em afirmaes relacionadas com os
objectivos do inqurito e na avaliao dessas afirmaes.
O problema da inferncia Indutiva do ponto de vista de estatstica, encarado da seguinte
forma: A finalidade da investigao descobrir algo sobre determina caracterstica da
populao ou universo. Por isso importante definir alguns conceitos fundamentais na teoria da
amostragem.

1.1 Alguns Conceitos Importantes na Teoria de Amostragem


1.1.2 Populao ou universo
Conjunto de unidades bem definidas com caractersticas comuns, no tempo e no espao. A
unidade bsica de uma populao denomina-se elemento da populao.
Para definir uma populao, ns temos que estar em condies de determinar o tipo de
elementos que a constitui e indicar as regras de incluso ou excluso um elemento particular.
Exemplos:
1. Pases produtores de ouro.
2. O nmero de habitantes dum determinado pas, ou cidade.
1. O nmero de desempregados dum pas, duma provncia, num determinado perodo de tempo,
etc.

1.1.2 Amostra um sub-conjunto do universo ou populao. A obteno de informao


sobre parte de uma populao denomina-se Amostragem.

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica
Em geral, o investigador est interessado em certa(s) caracterstica(s) especfica(s) da populao
em estudo. Define-se ento uma certa varivel X que representar a caracterstica que se
pretende avaliar.
A varivel X poder designar: O nmero de filhos por famlia; O rendimento mensal dos
agregados familiares moambicanos ou de algumas provncias, ou distritos de interesse
econmico:
Plano de Amostragem constitudo por todas as etapas necessrias para seleccionar uma
amostra depois da definio da populao.

1.1.3 Tipos de variveis:


As variveis podem ser: Discretas ou Contnuas
Variveis Discretas
So no numricas
So normalmente codificadas;
Variveis Contnuas: Podem ser:
Discretas Neste caso assumem somente um e um s valor . Exemplo: Nmero de filhos
Contnuas - Medidas com mais detalhes, ou sejam tomam um valor num certo intervalo, por
exemplo a altura duma pessoa, o peso, etc.

Mtodos de Amostragem

Amostragem Aleatria Simples

Amostragem Estratificada

Amostragem por Conglomerados

Amostragem por Estgios Mltiplos

Fontes de Erro em levantamentos por Amostragem

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica

Amostragem Aleatria Simples


Tambm conhecida por amostragem casual, randnica, acidental etc. Consiste basicamente em
atribuir a cada elemento do universo um nmero nico para, depois, seleccionar alguns desses
elementos de maneira casual.
Este procedimento, embora seja o que mais se ajusta aos princpios da teoria das
probabilidades, nem sempre o de mais fcil aplicao, sobretudo porque se exige que se
atribua a cada elemento da populao um nico nmero. Alm disso, despreza o conhecimento
prvio da populao que por ventura o pesquisador pode ter.

Amostragem Sistemtica
uma variao da amostragem aleatria simples. A sua aplicao requer que a populao seja
ordenada de tal modo que cada um de seus elementos possa ser unicamente identificado pela
posio. Apresentam condies para satisfao desse requisito uma populao identificada a
partir de uma lista que englobe todos os seus elementos, uma fila de pessoas ou um conjunto de
candidatos a um concurso identificado pela ficha de inscrio.

Amostragem Estratificada
Caracteriza-se pela seleco de uma amostra de cada subgrupo da populao considerada.
O fundamento para delimitar os subgrupos ou estratos pode ser encontrados em propriedades
como sexo, idade ou classe social. Muitas vezes essas propriedades so combinadas, o que
exige uma matriz de classificao. Por exemplo quando se compara homem e mulher com
"maior de 18 anos" e menor de 18 anos" resultam quatros extractos: homem menor de 18 anos,
mulher menor de 18 anos, homem maior de 18 anos, mulher maior de 18 anos.
A

amostragem

estratificada

pode

ser

proporcional

ou

no-proporcional.

No primeiro caso, selecciona-se de cada grupo uma amostra aleatria que seja proporcional
extenso de cada subgrupo determinada por alguma propriedade tida como relevante. Este
tipo de amostragem tem como principal vantagem o fato de assegurar representatividade em
Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica
relao

propriedades

adoptadas

como

critrios

para

estratificao.

No caso da amostragem estratificada no-proporcional, a extenso da amostra dos vrios


estratos no proporcional extenso desses estratos em relao ao universo. H situaes em
que esse procedimento o mais adequado, particularmente naqueles em que se tem interesse na
comparao entre os vrios estratos.

Amostragem por Conglomerados


So indicadas em situaes em que bastante difcil a identificao de seus elementos. o caso,
por exemplo, de pesquisa cuja populao seja constituda por todos os habitantes de uma
cidade. Em casos desse tipo possvel proceder-se seleco da amostra a partir de
"conglomerados".(quarteires, organizaes, edifcios, fazendas, etc.)

Amostragem Por Cotas


Este tipo de amostragem muito utilizado em pesquisas eleitorais e de mercado, tendo como
principal vantagem o seu baixo custo. De modo geral desenvolvida em trs fases :
1 Classificao da populao em funo de propiedades tidas como relevantes para o
fenmeno a ser estudado.
2 Determinao da proporo da populao a ser colocada em cada classe com base na
constituio conhecida ou presumida da populao.
3 Fixao de cotas para cada entrevistador encarregado de seleccionar elementos da
populao a ser pesquisada de modo tal que a amostra total seja composta em observncia
proporo das classes consideradas.

Amostragem por Estgios Mltiplos


Esta estratgia de amostragem pode ser vista como uma combinao de dois ou mais planos
amostrais. Considere por exemplo uma populao estratificada onde o nmero de estratos
muito grande. Ao invs de sortear uma amostra de cada estrato, o que poderia ser invivel
devido quantidade de estratos, o pesquisador poderia optar por sortear alguns estratos e em
seguida seleccionar uma amostra de cada estrato sorteado. Neste caso, teramos uma
amostragem em dois estgios usando, nas duas vezes, a amostragem aleatria simples, sendo

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica
que no primeiro estgio as unidades amostrais so os estratos e no segundo so as componentes
da populao.

Nota: Nos levantamentos por Amostragem usam-se os Questionrios. Este tpico sera

tratado

mais tarde no curso.

2. ESTIMAO DE PARMETROS
Nesta seco introduziremos alguns conceitos aplicados na rea de inferncia Estatstica que
sero dados nos captulos seguintes. A inferncia estatstica inclui assim trs grandes tipos de
aplicao:
1. Estimao pontual;
2. Estimao por intervalos;
3. Testes de Hipteses;

2.1 Estimao Pontual


O objectivo da estimao por pontos usar toda a informao disponvel a partir da amostra,
para produzir um valor que melhor valor que se pode adiantar para um certo parmetro da
populao ou universo.
Um estimador para certo parmetro designa-se genericamente por ( X 1 , X 2 ,..., X n ) e
uma estatstica, ou seja, uma varivel aleatria funo duma amostra.
Como resultado, obtm-se uma aproximao concreta ao valor do parmetro que lhe est
associado. Esta designa-se por estimativa e denota-se, usualmente por: * .
Portanto, um estimador uma frmula, funo de variveis observveis a partir da amostra,
que no pode envolver valores desconhecidos. Para um mesmo parmetro (desconhecido)
possvel propor estimadores alternativos. Cada estimador uma varivel aleatria que
fornece infinitas estimativas, uma para cada concretizao da amostra aleatria.
Uma estimativa um valor concreto, resultante do estimador.
Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica

Exemplo:
Para estimar o parmetro (mdia da populao) duma populao normal poder-se-ia
utilizar, entre outros estimadores, o estimador:

ou seja a mdia amostral.

2.2 Propriedades dos estimadores


A preciso de qualquer estimativa feita da amostra depende do mtodo atravs do qual a
estimativa calculada e do plano de amostragem.
As principais propriedades dos estimadores em pequenas amostras so:
1. No enviesamento (no viciamento);
2. Eficincia;
3. Suficincia.

2.2.1 No Enviesamento
Um estimador diz-se no enviesado (no viciado) se o valor mdio da estimativa (valor
esperado), para todas as amostras possveis do tamanho n, for exactamente igual ao valor real
da populao ou seja se para o parmetro se tem E[] .
Exemplos:
A mdia amostral X e a varincia amostral s 2 so exemplos de estimadores no viciados j
que demonstra que:

E[ X ]
.

E[ s 2 ] 2

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica

2.2.2 Eficincia
Um estimador diz-se eficiente, de dentro da classe dos estimadores no viciado ou centrados
tiver a menor varincia. Assim, dados dois estimadores 1 e 2 ambos no viciados, 1 ser mais
eficiente que 2 , se Var (1 ) Var (2 ) .
Exemplo:
De entre os estimadores para a mdia da populao normal, pode se demonstrar que X um
estimador eficiente; pois:

E[ X ]
, Onde designa qualquer outro estimador no viciado para .

Var[ X ] Var[ ]

2.2.3 Suficincia
O estimador diz-se suficiente, se utiliza toda a informao disponvel na amostra, relevante
para estimao de .
Exemplo: Os estimadores Mo e Me so estimadores suficientes para a mdia duma populao
normal .

2.3. Amostragem Aleatria Simples


Inquritos por amostragem envolvem a escolha de amostras duma populao que contem um
nmero finito N de unidades. Se essas unidades podem ser distinguidas uma da outra, o nmero
de amostras diferentes de tamanho n que podem ser formadas a partir de N unidades, 1qual
a:

N
N!

n n! N n !
Exemplo: Se uma populao contm 5 unidades, representadas por A, B, C, D e E,
respectivamente, existem 10 amostras diferentes de tamanho 3, que so.

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica
ABC

ABD

ABE

ACD

ACE

ADE

BCD

BCE

BDE

CDE

Neste exemplo, podemos notar que:


No h letras repetidas na mesma amostra;

A ordem das letras no tem importncia;

E as seis amostras ABC, ACB, BAC, BCA, CAB e CBA so consideradas de forma idntica.

2.3.1 Amostragem aleatria simples


N
um mtodo de seleco de n unidades a partir de N atravs do qual, cada uma das
n
amostras tm igual chance (probabilidade) de serem escolhidas. Este tipo de amostragem
tambm conhecido pelo nome de amostragem aleatria sem restries.
Na prtica, a amostra aleatria simples seleccionada unidade por unidade. As unidades na
populao so enumeradas de 1 at N. E depois, uma srie de nmeros aleatrios entre 1 e N,
da tabela dos nmeros aleatrios, so lidos em sequncia at se atingir o nmero n, o tamanho
da amostra. As unidades que tomarem os nmeros lidos da tabela constituiro a amostra.
Em cada etapa da escolha, este processo d aos nmeros a mesma chance de serem escolhidos.
Se o nmero escolhido no devolvido para a lista, pois isso daria a possibilidade de a mesma
unidade entrar na amostra mais do que uma vez, na prtica no se repete. Por essa razo este
tipo de amostragem se d o nome de amostragem sem reposio.
Desta forma, ao usarmos a tabela dos nmeros aleatrio, o nmero que j foi escolhido
anteriormente ignorado.
Muitas vezes, no plausvel o uso deste tipo de amostragem preferindo-se outros tipos de
amostragem, por razes de convenincia ou mesmo aumento de preciso.

2.3.2. Definies Bsicas e Notaes


Ao seleccionarmos uma amostra ns estamos interessados em certas propriedades que ns
pretendemos medir ou registar para cada unidade que entra na amostra. Estas propriedades
so denominadas de caractersticas ou mais simplesmente itemes.
Autor: Filipe Mahaluca

mahaluca@gmail.com

10

Inferncia Estatstica
Assim:
Os valores obtidos para cada item nas N unidades que compem a populao so
representados por: y1, y2, y3,..., yN .
E os valores correspondentes na amostra por: y1, y2, y3, ..., yn ou simplismente yi (i =1, 2, ...,n)

Exemplos sobre caractersticas:


Populao

Algumas caractersticas

Todas as pessoas moradoras

Peso mdio;

duma cidade

Rendimento Total;

Percentagem de rendimento gasto em comida;

Nmero de mulheres;

Distribuio do rendimento total entre as famlias


por tamanho de rendimento;

Portanto, caracterstica da populao no tem que ser obrigatoriamente numrica. Caracterstica


tudo aquilo que nos possa interessar saber sobre a populao em estudo.
Usam-se letras maisculas para representar as caractersticas da populao e as minsculas para
representar as da amostra: Para os totais e as mdias, temos as seguintes definies:
Populao

Amostra

Y y i y1 y 2 ... y N

Total:

i 1

i 1

y1 y 2 ... y n

Mdia

y y 2 ... y N
Y 1

yi

y y 2 ... y n
y 1

i 1

y
i 1

Embora a amostragem seja realizada para diferentes objectivos, geralmente o interesse centras
em quatro caractersticas da populao, nomeadamente:

1. A mdia = Y , por exemplo, o nmero mdio de crianas por escola;

Autor: Filipe Mahaluca

mahaluca@gmail.com

11

Inferncia Estatstica
2. O total = Y, Por exemplo, o nmero total de moradores dum distrito;
3. A razo entre dois totais ou duas mdias R

Y
X

Y
ou ;

4. A proporo de unidades que pertencem a uma certa classe ou categoria. Por exemplo a
proporo de habitantes do sexo Feminino, a proporo de estudantes dispensados, etc.
O Simbolo ^ usado para indicar a estimativa duma caracterstica da populao obtida atravs
da amostra. Nesta seco ns somente consideraremos as estimativas mais simples:
Estimativa (estimante)
Media da populao Y

Y y mdia da amostra
n

Total da populao Y

Y N y N

y
i 1

n
n

Razo da populao R

y
R
x

y
i 1
n

x
i 1

N
Em Y o factor
a que se multiplica o total da amostra chamado de factor de expanso, ou
n

factor de inflao. O seu inverso

n
, a razo entre o tamanho da amostra e o tamanho da
N

populao, chamado de fraco de amostragem e representado por f.

2.3.3 Propriedades dos Estimadores Para Amostragem


Aleatria Simples (AAS)
Para investigar se y ou no viciado, para amostragem Aleatria Simples ns calculamos o

N
valor de y para todas as amostras e depois achamos a mdias das estimativas. O
n

Autor: Filipe Mahaluca

mahaluca@gmail.com

12

Inferncia Estatstica
Smbolo E denota, mdia de todas possveis amostras, ou seja o valor esperados das mdias
amostrais
Teorema 3.1:
A mdia amostral y um estimador no viciado de Y , isto : E[ X ] Y
Demonstrao: Por definio

Ey

y
N

n

( y1 y 2 ... y n )
n
N!
n!( N n)!

n!( N n)! ( y1 y 2 ... y n )

N!
n

(3.1)

N
Onde o somatrio se estende para todas as amostras. Para calcular esta soma, ns
n
determinamos em quantas amostras um dado valor especfico yi aparece. Dado que existem
outras (N-1) unidades para o resto da amostra e (n-1) lugares para preencher na amostra, o
nmero de amostras contendo yi :
N 1
( N 1)!


n 1 (n 1)!( N n)!

Consequentemente,

(y

y 2 ... y n )

( N 1)!
( y1 y 2 ... y N )
(n 1)!( N n)!

De (a) teremos

( N n)!
n!( N _ n)!
( y1 y 2 ... y N )
(n 1)!( N n)! nN!
( y y 2 ... y N )
1
Y
N
Ey

Corolrio 3.1:
Y N y um estimador no viciado do total da populao Y.

Autor: Filipe Mahaluca

(3.2)

mahaluca@gmail.com

13

Inferncia Estatstica

2.3.4 As Varincias dos Estimadores


A varincia de yi numa populao finita geralmente definida como:
N

(y
i 1

Y )2

(3.4)

Agora vamos considerar a varincia de y a mdia amotral, considerada para todas as

2
N
mostras possveis, ou seja E y Y .
n

Teorema 3.2: A varincia da mdia amostral para Amostragem Aleatria Simples igual a:

V y E y Y
Onde f

S 2 N n S 2
1 f

n
n
n

(3.5)

n
a fraco amostral.
N

Corolrio 3.2: O erro padro para y

S
n

N n / N

S
n

1 f

(3.6)

Corolrio 3.3: A varincia de Y N y , como estimador do total da populao Y, na


amostragem Aleatria Simples dada pela frmula:

N 2 S 2 ( N n) N 2 S 2
1 f
V (Y ) E (Y Y ) 2

n
N
n

(3.7)

Corolrio 3.4: O Erro padro para a estimativa do o total da populao Y igual a:

NS
n

( N n) / N

NS
n

1 f

(3.8)

2.3.5 O Factor de Correco da Populao Finita

Autor: Filipe Mahaluca

mahaluca@gmail.com

14

Inferncia Estatstica
Sabemos que para qualquer populao infinita, para uma amostra de tamanho a varincia
da mdia amostral igual a:

V y

Quando a populao finita, introduz-se o factor

( N n)
para a varincia e o factor
N

( N n)
para o desvio padro.
N
Esses factores do-se o nome de factores de correlao da populao finita. Na pratica, o
factor de correco pode ser ignorado sempre que ele no exceder 5% e para muitas
aplicaes mesmo quando for superior a 10%. O efeito da ignorncia do factor da
correco super estima o erro padro do estimador y .

2.3.6 Clculo do Erro Padro a Partir da Amostra


Para Amostragem Aleatria Simples tem lugar o seguinte Teorema.
Teorema 3.3: Para a Amostragem Aleatria Simples (AAS)
n

s2

(y
i 1

y) 2

(n 1)

um estimador no viciado para


N

S2

(y
i 1

Y )2

N 1

Nota: Ns tivemos um resultado idntico para populao infinita, onde provamos que

E[S 2 ] 2 . A nica diferena que na demonstrao entra o factor de correco.

Corolrio 3.5: Os estimadores no viciados das varincias da mdia amostral

y e do total

da populao Y N y so:
Autor: Filipe Mahaluca

mahaluca@gmail.com

15

Inferncia Estatstica

ss N n s2
v( y ) s
1 f
n N n
2
y

(3.9)

e,

N 2ss N n N 2s2
2

1 f
v(Y ) sY

n N
n

(3.10)

Respectivamente.
Para os erros padro toma-se.

sy

s
s

1 f

sY

Ns
n

1 f

(3.11)

Nota: Esses estimadores so ligeiramente enviesados (viciados). Para muitas aplicaes o


enviesamento no importante.

2.3.7 Intervalos de Confiana


Os intervalos de confiana para a mdia e para o estimador do total so dados por:
a) Para Mdia, tem-se:

Y y

ts
n

1 f

(3.12)

b) Para o Total:

tNs
Y N y
1 f
n

(3.13)

O smbolo t o valor do desvio da mdia na distribuio Normal e depende do intervalo de


confiana desejado ( ou da probabilidade de confiana desejada)
Os valore mais comuns no:
Intervalo de confiana (%)

Autor: Filipe Mahaluca

50

80

90

95

mahaluca@gmail.com

99

16

Inferncia Estatstica
Valor de t corresponte

0.67

1.28

1.64

1.96

2.58

NOTA: Se o tamanho da amostra for menor do que 60, os pontos percentuais acima referidos
so tirados da tabela de distribuio t de Student com (n-1) graus de liberdade, graus
liberdades usados no calcula da varincia s 2 .
Exerccio:
Numa localidade com 250 Famlias (Agregados familiares), fez-se um levantamento por
amostragem com o objectivo de determinar o nmero de crianas com idades compreendias
entre 0 e 14 anos na aldeia independentemente de quem so os pais. Decidiu-se trabalhar com
uma amostra de 80 famlias (AF). A tabela abaixo indica os resultados do inqurito.
# filhos yi
Fi

13

19

15

20

10

Com base nesse dados estimar:


a) o nmero mdio de crianas por agregado Familiar;
b) o nmero total de crianas existentes nessa aldeia;
c) o intervalo de confiana da mdia e do da estimativa do total.

Estimao de um ndice (duma Razo)


Frequentemente, a quantidade que deve ser estimada, atravs de uma amostra aleatria
simples, uma relao entre duas variveis, as quais variam de unidade para unidade. Em
inquritos aos agregados familiares, so exemplos disso o nmero de casacos por homem adulto,
a mdia das despesas com cosmticos por mulher adulta, o nmero mdio de horas semanais
passadas assistindo televiso por crianas de idade entre 10 e 15 anos, etc. A fim de estimar a
primeira dessas quantidades, registaramos, para os i agregados familiares ( i = 1, 2, ..., n),o
nmero de homens adultos que a vivem xi e o nmero de mudas de roupa que eles possussem yi.
O parmetro da populao a ser estimado o ndice
Autor: Filipe Mahaluca

mahaluca@gmail.com

17

Inferncia Estatstica
N

Numero total de casa cos


R

Numero total de hom ens adultos

y
i 1
N

x
i 1

o estimativa da amostra correspondente :


n

y
i 1
n

x
i 1

y
x

(3.14)

Exemplos dessa natureza ocorrem, frequentemente, quando a unidade de amostragem (no caso
do AF) e o nosso interesse est no valor mdio da populao por elemento. Os ndices tambm
aparecem em muitas outras aplicaes, como, por exemplo, o ndice de emprstimos para
construes imobilirias no total de emprstimos de um banco, ou o ndice de acres plantadas
com trigo, no total dos acres cultivados de uma fazenda.
Teorema 3.4:
Se as variveis yi e xi so medidas em cada unidade de uma amostra aleatria simples de
tamanho n, que se presume grande, a varincia da razo R y / x , aproximadamente igual
a:

Var R

1 f
nX

(y

Rx i ) 2

N 1

(3.15)

Onde
Y
n
R
o ndice dos valores mdios da populao e f .
N
X

Demonstrao:

Autor: Filipe Mahaluca

mahaluca@gmail.com

18

Inferncia Estatstica
y
y Rx
R R R
x
x

(3.16)

y Rx
R R
X

E y Rx Y R X
E R R

0
X
X

Visto que R

Y
. Isto mostra que a ordem de aproximao usada, ou seja R um estimador
X

no viciado de R .
De (3.16), ns obtemos o seguinte resultado
1
Var ( R ) E ( R R) 2 E ( y R x) 2
X

A quantidade y R x a mdia amostral da varivel d i yi Rxi , cuja mdia populacional

D Y R X 0.
Assim, podemos calcular Var[R ] aplicando o teorema (2.2) a varincia da mdia da
Amostragem Aleatria Simples.
Como estimativa amostral de
N

(y
i 1

Rx i ) 2

N 1

comum tomar-se
n

(y
i 1

R xi ) 2

n 1

Autor: Filipe Mahaluca

mahaluca@gmail.com

19

Inferncia Estatstica
E para o estimador do erro padro para R o seguinte:
1 f
s( R )
nX

(y

R xi ) 2

(3.17)

n 1

Se X no conhecido, o estimador amostral x substitudo no denominador. A forma mais


rpida de calcular s(R ) com mquina de calcular expressa da forma:
1 f
s( R )
X n

2 R yi xi R 2 xi2
n 1

(3.18)

2.4 Estimao do Valor Mdio das Sub-Populaes


Em muitos inquritos, as estimativas so feitas em cada classe na qual a populao se encontra
sub-divida. Por exemplo, o Agregado familiar podemos estar interessados em achar as
estimativas para AF com 0, 1,.., n filhos.
A Comisso de Amostragem dos Estados Unidos (1950), chamou dessas sub-divises da
populao por Domnios de Estudo.
Na situao mais simples cada unidade da populao pertence um dos domnios.
Seja jth o domnio que contm Nj unidades e
nj = o nmero de unidades na Amostragem Aleatria Simples de tamanho n.
Se yjk (k= 1, 2,.., nj ) so as medies nessas unidades, a mdia da populao Y j para o domnio
jht estimado por
nj

y jk

k 1

nj

yj

Autor: Filipe Mahaluca

(3.19)

mahaluca@gmail.com

20

Inferncia Estatstica

Assim:
1. y j um estimador no viciado para Y j ;
2. O erro padro para y j igual a

Sj

sy

nj

nj

(3.20)

Nj

Onde
Nj

Sj
2

jk

Y j

N j 1

k 1

(3.21)

Uma estimativa do erro padro para y j dada por


sj
nj

nj

(3.22)

Nj

Onde
Nj

sj
2

k 1

jk

yj

n j 1

(3.23)

Se o valor de Nj for desconhecido, a quantidade

nj
n
pode ser utilizada em llugar de
, no
N
Nj

calculo do cpf.

Autor: Filipe Mahaluca

mahaluca@gmail.com

21

Inferncia Estatstica

2.5 Estimao dos valores Totais das Sub-Populaes


Consideremos um exemplo, duma lista de clientes da Mcel com contractos, onde uns pagaram a
sua mensalidade e outros no. Podemos estar interessados em estimar, atravs duma amostra, o
total do dinheiro ainda em divida. Se (o nmero de dividas no pagas na populao) for Nj
conhecido, ento a estimativa do total na amostra ser:

Yj N j y j

(3.24)

Se Nj nem o total de recebimentos forem desconhecidos, as estimativas no se podem calcular. No


seu lugar usa-se a estimativa. Seguinte:

N
Yj
n

nj

y
k 1

jk

(3.25)

E o o seu erro padro correspondente :

NS '
n

(Y j )
1
N
n

(3.26)

Em cuja S um afastamento padro da populao de yi' .A fim de calcularmos S, admitamos


que a populao seja constituda de Nj valores de yi que esto compreendidos no sector j, e e
de N Nj valores. Vem ento
Onde

Autor: Filipe Mahaluca

mahaluca@gmail.com

22

Inferncia Estatstica

S'

Yj
1
2
( yi )
N 1 sec tor j
N

(3.27)

Assim, uma estimativa amostral do erro padro de Y j para ser:

Ns i
n

s Yj
1
N
n

(3.28)

3. AMOSTRAGEM PARA PROPORCES E PERCENTAGENS


3.1 Varincias dos Estimadores Amostrais
s vezes, deseja-se estimar o nmero total, a proporo de unidades na populao que possuem
uma certa caracterstica ou atributo, ou que integram uma determinada categoria. Muitos dos
resultados dos censos e inquritos, habitualmente divulgados assumem essa forma, como, por
exemplo, o nmero de pessoas desempregadas numa populao C e C. Admite-se que qualquer
unidade da populao se integra em uma das duas categorias.
A notao usada a seguinte:
Nmero de unidades na categoria C

Proporo de unidades em C

Na populao

Na amostra

Na populao

Na Amostra

P = A/N

p = a/n

Teorema 4.1: A proporo amostral p


populao P

a
um estimador no viciado da proporo da
n

A
.
N

Var ( p) E ( p P) 2

S 2 N n PQ N n

N N
n N

Autor: Filipe Mahaluca

mahaluca@gmail.com

23

Inferncia Estatstica

Corolrio 1:
Corolrio 2: A varincia de A Np , o estimador do nmero total de unidades na classe/
categoria C, :

N 2 PQ N n
Var ( A )

n N 1

(37)

Teorema 4.2 (3.3): O estimador no viciado da varincia de p, obtido da amostra :

var( p) s p
2

N n
pq
(n 1)

(3.8)

Demonstrao:
Corolrio: O estimador no viciado da varincia de A Np , estimado do nmero total de
unidades na classe C na populao dada por:
N ( N n)
2
var( A ) s Np
pq
n 1

(3.11)

4. CLCULO DO TAMANHO DA AMOSTRA


4.1. A Especificao da Preciso
4.2. A Frmula para o Tamanho da Amostra para Propores
As unidades so classificadas em duas classes C e C. Admite se uma margem de erro d, na
proporo estimada p das unidades da classe C e existe um pequeno risco que ns aceitamos
incorrer e o erro real admitido de ser maior do que d, isto ,
Autor: Filipe Mahaluca

mahaluca@gmail.com

24

Inferncia Estatstica

Pr p P d

(3.12)

Assumindo que p distribuda de forma normal, e que se trata de amostragem Aleatria


Simples, sabemos que:

N n PQ
N 1 n

(3.13)

Consequentemente, a frmula que liga n com o grau de preciso desejado :

d t

N n PQ
N 1 n

(3.14)

Onde t a abcissa da curva normal que corta a rea nas regio em dois lados.
Resolvendo em relao a n, temos:

t 2 PQ
d2
n
1 t 2 PQ
1 2 1
N d

(3.15)

Para o uso prtico, como estimador aproximado para P, toma-se p na frmula. Se N for grande,
como primeira aproximao para n, toma-se:

n0

t 2 pq pq

V
d2

(3.16)

Onde

d2
= Varincia da populao desejada.
t2

Na prtica, primeiro calcula-se n0 . Se

n0
N

for negligencivel, n0 uma aproximao

satisfatria de n. Se no, o n obtido atravs da frmula:


Autor: Filipe Mahaluca

mahaluca@gmail.com

25

Inferncia Estatstica

n0
n0

(n0 1)
n
1
1 0
N
N

(3.17)

4.3 A Frmula do Tamanho da Amostra para Dados Contnuos


Se y for a mdia de n observaes duma amostra aleatria simples, ns pretendemos que:

Pr y Y d

(3.18)

Onde d, a margem de erro escolhido e uma probailidade pequena. Dos captulos


anteriores sabemos que, que o erro padro da mdia :

N n S
N
n

(3.19)

Ento
N n S
N
n

d t

(3.20)

Elevando ambos os membros ao quadrado, e expressando em funo a n ebtemos:


2

tS

d
n 2
1 tS
1
Nd

(3.21)

Como para o caso das propores, toma-se como primeira aproximao para o tamanho da
amostra n o nmero:
2

S2
tS
n0
V
d
Autor: Filipe Mahaluca

(3.22)

mahaluca@gmail.com

26

Inferncia Estatstica

Esta frmula da resultado aceitvel, a no que

n0
seja grande. Caso seja, ento calculamos
N

n, como
n

n0
n
1 0
N

(3.23)

Se o que se pretende estimar o total da populao Y, com a margem de erro d , toma-se como
a primeira aproximao para n

NS
NtS
n0

V
d
2

(3.24)

no lugar de (3.23), e o resto mantm-se.

4.4 Mtodos Avanados na Estimao da Varincia da


Populao.
Geralmente, a varincia da populao S 2 desconhecida. Na, prtica existem quatro mtodos
de estimao da varincia da populao no clculo do tamanho da amostra.
1. Escolha do tamanho da amostra em duas etapas, onde na primeira etapa se escolhe o
tamanho n1 duma amostra aleatria simples no qual os valores de S 2 e P e o tamanho
exigido de n so Obtidos;
2. Atravs dos resultados dum estudo piloto;
3. Atravs de inquritos de populaes similares;
4. Atravs dum guess work sobre a estrutura da populao com apoio de resultados
matemticos

Autor: Filipe Mahaluca

mahaluca@gmail.com

27

Inferncia Estatstica

4.5 Estimao de Y com varincia V


2

Se s1 for a varincia resultante da primeira amostra, tome unidades adicionais para tornar o
tamanho da amostra igual a:
2

s1
V

2
1 .
n1

(3.23)

Assume se que y aproximadamente normal. Se S fosse exactamente conhecido, o tamanho


necessrio (exigido) seria S 2 / V . O efeito de no conhecer S o de aumentar o tamanho mdio
pelo factor

2
1 .
n1

(3.24)

4.6 Estimao de P com a varincia V


Seja p1 a estimada de P, resultante da primeira amostra. O tamanho da amostra combinado as
duas primeiras amostras ser:

p1q1 3 8 p1q1 1 3 p1q1

V
p1q1
Vn1

(3.25)

O primeiro termo em (x) o tamanho da amostra requerido se sabido que P e igual a p1 .


Com este mtodo o estimador binomial de p obtido atravs duma amostra completa de
tamanho n, ligeiramente viciado. Para corrigir este enviesamento, use:

p p

Autor: Filipe Mahaluca

V (1 2 p)
pq

(3.26)

mahaluca@gmail.com

28

Inferncia Estatstica

5.7 Estimao de P dado o coeficiente de varincia


cv C
Para n toma-se

q1
3
1

Cp1 p1 q1 Cp1 n1

(3.27)

A estimativa torna-se:

Cp
P p
q

(3.28)

6. AMOSTRAGEM ALEATRIA ESTRATIFICADA


Neste mtodo a populao dividida em L sub-populaes mutuamente exclusivas ou estratos, e
a amostragem aleatria Simples realizada para cada estrato. Essas sub amostras so
combinadas numa nica amostra, estatsticas da qual so usadas para estimar os parmetros da
populao.
Notaes
O sufixo h denota o estrato e i a unidade dentro do estrato. Geralmente, so usados os seguintes
smbolos.

Nh

= Nmero total de unidades no estrato h;

nh = O nmero de unidades na amostra no estrato h;

y hi = Valor obtido para a unidade i no estrato h

Autor: Filipe Mahaluca

mahaluca@gmail.com

29

Inferncia Estatstica

fh

nk
= a fraco amostral no estrato
Nh

Wh

Nh
= O peso do estrato h
N
Nk

Yh

i 1

hi

Nh

= A mdia do estrato h na populao = h

nh

yh

i 1

nh

hi

= Mdia amostral do estrato h

Sh

1 Nh
Yhi Y h
N h 1 i 1

sh

1 nh
y hi y h
nh 1 i 1

== a varincia verdadeira do estrato h;

= a varincia amostral do estrato h

6.1 Alocao da Amostra


Na amostragem aleatria estratificada, o total da amostra n, pode ser alocada aos vrios
estratos de diferentes maneiras. O tamanho total da amostra e o tamanho da amostra em cada
estrato depende do mtodo de alocao usado. Ns vamos descrever trs dos mais usados
mtodos de alocao.

6.2 Propriedades dos estimadores na Amostragem Estratificada


Para o valor mdio, por unidade, da populao, a estimativa usada na amostragem estratificada
representada por y st (onde st significa stratified), onde

Autor: Filipe Mahaluca

mahaluca@gmail.com

30

Inferncia Estatstica
L

y st

na qual

N
h 1

yh
(6.1)

N N1 N 2 ... N L .

A estimativa y st , de modo geral, no o mesmo valor mdio amostral. Esse valor mdio
amostral, y , dado pela frmula:
L

n
h 1

yh
(6.2)

A diferena que, em y st , as estimativas dos estratos individuais recebem os seus pesos


correctos correspondentes Wh

Nh
.
N

evidente que y coincide com y st , desde que em cada estrato se verifique a condio

nh N h

n
N

nh
n

Nh N

ou seja

fh f

(6.3)

Significando assim, que a fraco amostral a mesma em todos os estratos.

Autor: Filipe Mahaluca

mahaluca@gmail.com

31

Inferncia Estatstica
As principais propriedades da estimativa y st

Teorema 6.1: Se, em todos os estratos, a estimativa amostral

yh

for sem tendncia, ento o y st

uma estimativa sem tendncia do valor mdio da populacional Y .

yh

Corolrio 6.1: Uma vez que

um estimador no viciado para Y h para a amostragem

aleatria simples dentro do estrato, y st um estimador no viciado para a mdia populacional


Y para a amostragem aleatria estratificada.

Isto significa, que na amostragem aleatria estratificada, como estimador da mdia

da

populao Y , usa-se:
L

y st

N
h 1

yh
(6.4)

Teorema 6.2: Para a amostragem estratificada, a varincia do estimador y st , sendo este uma
estimativa do valor mdio da populao Y :
L

Var ( y st )

N
h 1

2
h

Var ( y h )

Wh Var ( y h )
2

(6.5)

h 1

Onde
Autor: Filipe Mahaluca

mahaluca@gmail.com

32

Inferncia Estatstica

V Var ( y h ) E y h Y h

(6.6)

Nota Importante: A varincia de y st depende das varincias dos estimadores das mdias Y h
de cada.
Teorema 6.3: Para a amostragem aleatria estratificada, a varincia da estimativa y st
2

L
Sh
1 L
2 S
V ( y st ) 2 N h ( N h nh )
Wh h (1 f h )
nh h1
nh
N h1

Corolrio 6.2: Se as fraces de amostragem

(6.8)

nh
forem desprezveis em todos os estratos,
Nh

tem-se:

V ( y st )

1
N2

L
Nh Sh
Wh S h

nh
nh
h 1
h 1

(6.9)

Esta frmula apropriada quando se podem desprezar as correces das para populaes
finitas.
Corolrio 6.3:
No caso em que a repartio proporcional, pode-se substituir nh por seu valor na frmula
(6.8),

nh

nN h
N

Desse modo, reduzindo a varincia para mm

Autor: Filipe Mahaluca

mahaluca@gmail.com

33

Inferncia Estatstica

N S N n 1 f
V ( y st ) h h

n N
n
h 1 N
2

W S
h 1

2
h

(6.10)

Corolrio 6.4: Se a amostragem for proporcional ao tamanho e as varincias de todos os


2

estratos tiverem o mesmo valor S w , obtm-se a frmula simplificada

V y st

S N n Sw
1 f
w

n N
n
2

(6.11)

Tem lugar o seguinte resultado.


Teorema 6.4: Se Yst N y st a estimativa do valor total da populao Y, ento temos:
2

S
V (Yst ) N n ( N n nn ) h
nh

(6.12)

(Nota: Incluir o exemplo da pag.133-134)

6.3.1 Alocao proporcional


A amostra alocada ao estrato, proporcionalmente ao tamanho do estrato, isto :

nh N h

n
N

(6.1)

Autor: Filipe Mahaluca

mahaluca@gmail.com

34

Inferncia Estatstica

6.3.2 Alocao ptima


Na amostragem estratificada os valores dos tamanhos das amostras nk nos estratos so
escolhidos pelo amostrista. Esses valores podem ser escolhidos de modo a minimizar

V Var y est para um dado custo especfico para a mostra ou para minimizar o custo para um

valor especfico para V Var y est .


A funo custo mais simples tem a forma:
L

custo C C0 C h nh

(6.2)

i 1

Onde

C 0 = Custo de contingncias
C h = Custo por unidade em cada estrato e pode variar de unidade por unidade, e para cada
estrato, este custo proporcional ao tamanho da amostra.
Se a amostra alocada ao estrato de tal modo que a varincia do estimador seja mnima, na
condio de que o total oramento disponvel para cobrir a varivel custos fixa e igual a C e
que o custo de amostragem por unidade no estrato h Ch . Essa alocao dada por:

nn

Wh S h / Ch

W S

i 1

/ Ch

N h S h / Ch

N S
L

i 1

/ Ch

(6.3)

A equao (6.3) d nh em termo de n . Se os custos so fixos, ento n pode ser expresso como:

C C0 N h S h /
L

i 1

N S
L

i 1

Ch

Ch

Autor: Filipe Mahaluca

(6.4)

mahaluca@gmail.com

35

Inferncia Estatstica

Se V Var y est

for fixo, ento n dado por:

L
Wh S h Wh S h / C h

i 1

n
1 L
2
V Wh S h
N i 1

(6.5)

Onde, Wh N h / N .

6.3.3 Alocao de Neyman (1934)


A amostra alocada ao estrato de modo que a varincia do estimador seja mnima, na condio
de que o oramento total disponvel para cobrir a varivel custo fixo e iqual a C e que o custo
de amostragem por unidade o mesmo para cada. Essa alocao dada por:

nn
WS
N S
L h h L h h
n
Wh S h N h S h
i 1

(6.7)

i 1

CONFECAO DO QUESTIONRIO
Sob a denominao genrica de " formulrio " se inclui toda forma impressa destinada a colecta
de dados, tal como pronturios, formulrios de declarao de imposto de renda, formulrio de
atestado de bito ou questionrio que por sua vez permitem recolher dados ou sirvam para sua
apuraro.

Autor: Filipe Mahaluca

mahaluca@gmail.com

36

Inferncia Estatstica
Os formulrios devem ser planejados cuidadosamente, de tal forma que sejam realmente teis e
que facilitem e no dificultem a obteno de dados. Eles devem ajudar a colectar informaes
de maneira completa e eficiente, permitindo uniformidades nas diferentes observaes e
evitando a colecta de dados inteis ou irrelevantes ao estudo.
1. Formas de aplicao de um questionrio:
I)

QUESTIONRIO - enviado (distribudo pelo correio) apresentado (distribudos por

pesquisadores que mais tarde vo busc-los.

Desvantagens:

1. Dificuldades de esclarecer dvidas do informante;


2. Uso de abreviaturas nas respostas, m letra, etc;
3. Impossibilidades fazer comprovaes;

S devem ser usadas em grupos seleccionados, cujos componentes possam, sozinhos,


preencher os questionrios e tenham compreenso do valor e do alcance da pesquisa.
Nesse caso, possvel sua utilizao preferindo-se o processo por questionrio
apresentado.

II) QUESTIONRIO E ENTREVISTA

O prprio entrevistador preenche o questionrio, interrogando o informante;

o melhor de todos os processos;

Custo maior devido a necessidade de entrevistadores;

2.Principios de construo de um questionrio:


Antes de ser elaborado o questionrio devem ser considerados:
I)

o propsito para qual ser utilizado;

II) as circunstncias sob as quais se recolher a informao;

Autor: Filipe Mahaluca

mahaluca@gmail.com

37

Inferncia Estatstica
O primeiro tem importncia para se decidir sobre os dados que em ultima estncia se recolhero
e o seguro para a adopo do tamanho, forma e tamanho mais conveniente.
O questionrio deve permitir reconhecer duas classes de dados:
I) Dados administrativos ou de Identificao - ajudaro a identificar as unidades em
observao.
II) Dados sobre o problema que se estuda - devem ter o propsito perfeitamente definido a ser
pertinentes ao estudo
Embora seja impossvel dar regras fixas para a correcta elaborao de um questionrio, os
seguintes princpios devem ser usados:
I) Decidir sobre os dados que sero colectados:

Fazer uma lista de todas as informaes que so " desejveis " colectar de acordo com a
finalidade do estudo;

Considerar aqueles que so factveis de colectar de maneira fidedigna e exactas;

Limitar os dados queles prticos de colectar;

Limitar a informao quela que se usar; (s perguntar o estritamente necessrio)

II) Decidir a ordem em que se alocaro as perguntas do questionrio.

O questionrio deve ser dividido em grupos de questes que denominamos de Blocos .As
questes de um bloco so de um mesmo assunto;

O 1 Bloco geralmente constitudo de dados dos informantes (bloco e identificao);

O desenho o questionrio deve separar os blocos visando uma melhor visualizao;

III) Considerar como sero feitas as perguntas:

S perguntar aquilo que o informante tem o conhecimento directo;

Perguntar fato e no juzos, a no ser em caso especiais;

No exigir clculos e sim dados;

Autor: Filipe Mahaluca

mahaluca@gmail.com

38

Inferncia Estatstica

Empregar linguagem simples e sem ambiguidades;

Enunciar perguntas sem prolixidade;

Evitar perguntas: insinuantes, pouco explcitas, que faam apelam a memria;

Fazer pergunta de carcter quantitativos e no qualitativos, sempre que possvel;

IV) Planear como se anotaro as respostas.

No utilizar perguntas abertas, somente em pesquisas especiais esta pergunta


admitida. Pois as respostas podem, ser as mais diversas possveis.

As perguntas de um questionrio podem ser classificadas em funo das respostas em:


Perguntas Abertas - informante expressa livremente sua opinio sobre determinado assunto.
Perguntas Fechadas - informante selecciona sua resposta dentre um conjunto de opes.
V) Determinar as caractersticas do formulrio.
Quem colectar a informao?
De Quem ser colectada?
Onde e Quando se registar?
Como se processar os dados?
De acordo com as respostas s perguntas acima se decidir sobre:

A Forma

O Tamanho

O Material

A Cor

VI) Provar a operacionalidade do questionrio - PESQUISA PILOTO.

Testar o questionrio no mnimo com 10 informantes com a mesma caracterstica da


populao em estudo;

Autor: Filipe Mahaluca

mahaluca@gmail.com

39

Inferncia Estatstica

Reformular se necessrio

VII) Redigir as informaes necessrias:

Apresentao explicando o objectivo da pesquisa e enfatizando a importncia das


respostas do informante;

Manual de resposta se necessrio;

No entanto antes de entramos nos temas especficos introduziremos alguns conceitos necessrios
para compreenso dessas matrias.

Exerccios Resolvidos
Um pesquisador deseja estimar a proporo de ratos nos quais se desenvolve um certo tipo de
tumor quando submetidos a radiao. Ele deseja que sua estimativa no se desvie da proporo
verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.
(a) Quantos animais ele precisa examinar para satisfazer essa exigncia?

Pelo enunciado acima temos:


- Erro da estimativa: =0,02.
- Coeficiente de confiana: P()= 0,90.
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,95, portanto,
z=1,64.
Como no temos uma informao preliminar sobre p, devemos utilizar p=0,5, que maximiza p (1p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:

z
1
,
6
4

pp
(
1

0
,
2
5

1681

0
,
0
2

Logo, para que o erro cometido na estimao da proporo de ratos nos quais se desenvolve
certo tipo de tumor quando submetidos a radiao seja no mximo 0,02 com probabilidade
igual a 0,90, o pesquisador precisa examinar 1.681 animais.
Autor: Filipe Mahaluca

mahaluca@gmail.com

40

Inferncia Estatstica

(b) Como seria possvel diminuir o tamanho da amostra utilizando a informao adicional de que

em geral esse tipo de radiao no afeta mais que 20% dos ratos?
Se p for no mximo 20%, o tamanho da amostra ser:
2

z
1
,
6
4

p
(
1

p
)

0
,
2
0
*
0
,
8
0

1076

0
,
0
2

Logo, se p for no mximo 20%, para que o erro cometido na estimao da proporo de
ratos nos quais se desenvolve certo tipo de tumor quando submetidos a radiao seja no mximo
0,02 com probabilidade igual a 0,90, o pesquisador precisa examinar 1.076 animais.
Exerccio 02
Antes de uma eleio, um determinado partido est interessado em estimar a proporo de
eleitores favorveis a seu candidato.
(a) Determine o tamanho de amostra necessrio para que o erro cometido na estimao seja de,

no mximo 0,01, com probabilidade de 80%.


Pelo enunciado acima temos:
- Erro da estimativa: =0,01.
- Coeficiente de confiana: P() =0,80.
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,90, portanto,
z=1,28.
Como no dispomos de uma informao preliminar sobre p, devemos usar p=0,5, que maximiza
p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:

z
1
,
2
8

pp
(
1

0
,
2
5

4096

0
,
0
1

Logo, para que o erro cometido na estimao seja de no mximo 0,01, com probabilidade de
80%, o tamanho da amostra teria que ser de 4.096 eleitores.
Autor: Filipe Mahaluca

mahaluca@gmail.com

41

Inferncia Estatstica

(b) Uma amostra piloto revelou que entre 60% e 70% dos eleitores eram favorveis ao

candidato em questo. Com base nessa informao, qual deve ser o tamanho de amostra de
modo que as condies em (a) estejam satisfeitos?
Nesse caso, o mximo de p (1-p) ocorre quando p=0,60. Assim,
2

z
1
,
2
8

p
(
1

p
)

0
,
6
0
*
0
,
4
0

3933

0
,
0
1

ou seja, sabendo que p dever estar entre 0,60 e 0,70, o tamanho da amostra teria que ser
3.933, para que as condies em (a) sejam satisfeitas.
(c) Se na amostra com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores eram

favorveis ao candidato, construa um intervalo de confiana para a proporo de eleitores


do candidato com coeficiente de confiana de 0,95.
Temos que:
n = 4096

p =0,55
P()= 0,95
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,975, portanto,
z=1,96.

p
(
1)

z
I
C
(
p
;
0
,
9
5
)

0
,
5
5
(
1

0
,
5
5
)

I
C
(
p
;
0
,
9
5
)

0
,
5
5

1
,
9
6

0
,
5
5

0
,
0
1
5
2

0
,
5
3
4
8
;
0
,
5
6
5
2

4
0
9
6

Exerccio 03
Um cientista resolve estimar a proporo p de indivduos com certa molstia numa regio. Ele
deseja que a probabilidade de que a sua estimativa no se desvie do verdadeiro valor de p
por mais que 0,02 seja de pelo menos 95%. Qual deve ser o tamanho da amostra para que
Autor: Filipe Mahaluca

mahaluca@gmail.com

42

Inferncia Estatstica
essas condies sejam satisfeitas? Um outro cientista descobre que a doena em questo est
relacionada com a concentrao da substncia A no sangue e que considerado doente todo
indivduo para o qual a concentrao A menor que 1,488 mg/cm3. Sabe-se que a
concentrao da substncia A no sangue tem distribuio normal com desvio padro 0,4 mg/cm3
e mdia maior que 2,0 mg/cm3. Voc acha que essas novas informaes podem ser utilizadas
pelo primeiro cientista para diminuir o tamanho amostral? Em caso afirmativo, qual seria o novo
tamanho amostral?
= 0,02
P()= 0,95
z tal que A(z) = 0,975 ,z = 1,96
Como no temos uma informao sobre p, devemos usar p=0,5, que maximiza p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
2

z
1
,
9
6

pp
(
1

0
,
2
5

2401

0
,
0
2

O tamanho da amostra deve ser 2.401 indivduos para que as condies acima sejam satisfeitas.
Seja X: concentrao da substncia A no sangue em mg/cm3
X~N (; 0,42), >2.
P = P (estar doente) = P(X<1,488) = P[Z < (1,488-2)/0,4] = P[Z < -1,28] = P[Z >1,28] =
= 1 - P[Z1,28] = 1 A(1,28) = 1 0,9 =0,1.
Assim, segundo um outro cientista, p menor ou igual a 0,10.
A informao acima podem ser utilizada pelo primeiro cientista para reduzir o tamanho da
amostra, pois como o valor de p no mximo 0,1, o valor mximo de p(1-p) atingido quando
p=0,10, e assim:

z
1
,
9
6

p
(
1

p
)

0
,
1
0
*
0
,
9
0

865

0
,
0
2

Autor: Filipe Mahaluca

mahaluca@gmail.com

43

Inferncia Estatstica
Neste caso, a informao do segundo cientista ajuda a reduzir o tamanho de amostra para
aproximadamente 865 indivduos.

Exerccio 04
Um centro de estudos de pesquisa de opinio realizou uma pesquisa para avaliar a opinio dos
telespectadores de uma regio, sobre um certo comentarista desportivo. Para isso entrevistou
380 telespectadores, seleccionados ao acaso da regio, e constatou que 180 desejavam que o
comentarista fosse afastado da TV.
(a) Determine um intervalo de confiana de 90% para p:proporo de telespectadores,

favorveis ao afastamento do comentarista.


Uma estimativa pontual da proporo p de telespectadores da regio favorveis ao
afastamento do comentarista desportivo dada por:

180
p0,473
380
Considerando o coeficiente de confiana =0,90, temos que z tal que A(z)=0,95 e,
portanto, z=1,64.
Assim, o intervalo de confiana para p ser:

p
(
1)

z
I
C
(
p
;
0
,
9
0
)

0
,
4
7
(
1

0
,
4
7
)

I
C
(
p
;
0
,
9
0
)

0
,
4
7

1
,
6
4

0
,
4
7

0
,
0
4

0
,
4
3
;
0
,
5
1

3
8
0

(b) Suponha agora que o centro decida que um intervalo de confiana, com coeficiente de 90%

para p, deve ter comprimento 0,05. Voc acha que os dados do item (a) atingem esse
objetivo? Justifique e comente.
Os dados do item (a) no atingiram o objectivo, j que, o intervalo obtido no item (a) tem
comprimento igual a 0,08.
Autor: Filipe Mahaluca

mahaluca@gmail.com

44

Inferncia Estatstica
Para que o objectivo seja atingido, deveramos ter comprimento 0,05.
Para diminuir o comprimento do intervalo, necessrio diminuir o erro, ou seja,
Comprimento 0,05

= 0,025.

Para um erro menor, necessrio aumentar o tamanho da amostra para:

0
,
4
7
(
1

0
,
4
7
)
*
1
,
6
4

0
,
0
2
5

n
=1072.
*
n
Assim, os dados do item(a) atingem os objectivos se o nmero de telespectadores
entrevistados aumentar para 1.072.
Os dados do item (a) no atingem o objectivo, somente se o nmero de telespectadores
entrevistados aumentar para 1072, ou seja:
Comprimento = 0,05

= 0,025.

Autor: Filipe Mahaluca

mahaluca@gmail.com

45

Inferncia Estatstica

Exerccios
1. Seja X1, X2, ..., X6, variveis aleatrias independentes, identicamente distribudas de forma
normal com a mdia, e varincia, 2 . Defina os seguintes estimadores:

X X 2 X 3 3X 5
a) 1 1
5

X X2 X3 X4
b) 2 1
4

2X1 X 2 X 3 X 4
X X2 X3 X4 X5
c) 3
d) 4 1
4
6

X X2 X3 X4 X5
e) 5 1
5
Diga qual desses estimadores no viciado e qual o mais eficiente.
2. Sejam X1 = 25, X2 = 30, X3 = 27, X4 = 35, X5 = 40, as idades dos estudantes duma turma
do DMI (Departamento de Matemtica e Informtica).
a) Com base nesses dados determine a idade mdia da turma.
b) Forme todas as amostras de tamanho trs e calcule as mdias de cada amostra e
comprove que E X e

var[ X ]

2
n

c) Quantas amostras de tamanho 4 so possveis formar? Forme essas amostras e repita o


exerccio da alnea b).
3. Determine a distribuio por amostragem da diferena entre duas mdias amostrais, isto

determine E X 1 X 2 e var X 1 X 2 .

4. Mostre que a varincia amostral S 2 um estimador no enviesado (no viciado da


varincia da populao 2 .
5. Num estudo sobre a relao existente entre uma atitude de criana e a idade na qual ela
fala primeiro, os pesquisadores registaram a idade (em meses) da primeira fala da criana e
o nmero de pontos (escore) obtido pela criana num teste sobre a atitude. Seguem-se os
dados para 21 crianas:
Autor: Filipe Mahaluca

mahaluca@gmail.com

46

Inferncia Estatstica

criana

10

11

Idade

15

10

15

20

18

11

20

Escore

95

71

83

91

102

87

93

100

104

94

113

Criana

12

13

14

15

16

17

18

19

20

21

Idade

10

11

11

10

12

42

17

11

10

Escore

96

83

84

102

100

105

57

121

86

100

a) Fazendo o uso da tabela de nmeros aleatrios seleccione uma amostra de tamanho 8. Inicie
a sua leitura da tabela em anexo na linha um, coluna dois. A leitura deve ser feita atravs das
colunas.
b) Com base na sua amostra determine:

(i) a idade mdia da primeira fala;

(ii) o nmero mdio de pontos (escores) dessa amostra e a sua varincia;

(iii) estime o nmero total de pontos para a populao em estudo;

(iv) estime o erro padro da estimativa do total e, d o intervalo de confiana de 95%


dessa estimativa.

6. Numa Biblioteca Privada, os livros esto arrumados em 130 estantes de igual tamanho. Duma
amostra aleatria de 15 estantes deu as seguintes quantidades de livros em cada estante:
28, 23, 25, 33, 31, 18, 22,

29, 30, 22, 26, 20,

21, 28, 25

a) Estimar o valor total de livros dessa biblioteca e o intervalo de confiana dessa estimativa do
total.
b) Suponha agora que o resultado da estimativa no suficientemente correcto e pretendemos ser
95% certos de que a estimativa do do total duma amostra aleatria esteja a 100 de unidades
do valor verdadeiro. Quantas estantes devero ser inclusos na amostra?

Autor: Filipe Mahaluca

mahaluca@gmail.com

47

Inferncia Estatstica
7. Num sector particular duma fbrica foi realizado um inquerido para tentar investigar at que
ponto o absentismo no este ligado com doenas ou frias oficiais. Uma amostra de 500
pessoas, num total de 36000 trabalhadores foi perguntada sobre o nmero de dias que eles
j tinham solicitado para descansar, nos anteriores seis meses.
Os resultados do inqurito foram os seguintes:
No. De dias de licena

No. De trabalhadores

157 192 90

31

18

40\ 0

10
1

a) Estimar o nmero total de licenas solicitadas, o o erro padro e o respectivo intervalo


confiana de 95% dessa estimativa.
b) Repita o mesmo exerccio pra uma amostra de1000.
8. Uma amostra aleatria simples de 30 Agregados Familiares (AF) foi seleccionada em uma
zona urbana que contem 14848 AFs. O nmero de pessoas (membros do AF) em cada um
dos AFs que integram a mostra o seguinte:
3, 6, 3, 3, 2, 3, 3, 3, 4, 4, 3, 2, 7, 4, 3, 5, 4, 4, 3, 3, 4, 3, 3, 1, 2, 4, 3, 4, 2, 4.
a) Estimar o nmero total de pessoas que vivem na zona.
b) Calcular a probabilidade de que essa estimativa esteja dentro do limite de 10% do valo
real.
9. Numa populao em que N = 6, os valores de yi so 8, 3, 1, 11, 4 e 7.
a) Calcular o valor mdio amostral y para todas as possveis amostras simples de tamanho 2.
Provar que um estimador y no viciado (sem tendncia) de Y .
b) Dada a mesma populao, calcular s 2 para todas as amostras aleatrias simples de tamanho
3 e provar que E[s 2 ] S 2 .
10 Duma populao de 2400 estudantes residentes fora da residncia universitria, foram
escolhidas duas amostras independentes (sem reposio) de tamanhos 200 e 450

Autor: Filipe Mahaluca

mahaluca@gmail.com

48

Inferncia Estatstica
respectivamente. Cada estudante foi perguntado sobre a distncia entre a sua casa e a
universidade. Os resultados amostrais foram os seguintes:

y 1 5.14

y 2 4.90

s12 3.87

s22 4.02

Calcule o intervalo de confiana aproximado de 99% para a distncia mdia entre a


universidade e a zona de residncia dos estudantes.
11.Sabe-se que duma populao de tamanho N = 430 unidades, Y 19 e S 2 85,6 . Qual o
tamanho da amostra necessria para estimar Y com a probabilidade de 10% e a margem de
erro de 1,9.
12.O instituto Internacional de Democracia pretende realizar um inqurito nalguns distritos do
pas com objectivo de determinar a percentagem de pessoas que tm uma certa percepo
sobre democracia. O nmero total da populao (Universo) em causa N = 50000 pessoas.
a) Determine o tamanho da amostra necessrio para a realizao deste levantamento por
amostragem, com um erro aceitvel de 5% e com um intervalo de confiana de 95%.
b) Alteraes haver no tamanho da amostra se o intervalo de confiana for de 90%?
13.Numa Amostra Aleatria simples de tamanho 100, duma populao de tamanho 500, existem
37 unidades na classe C. Determine o intervalo de confiana de 95% da proporo para o
nmero total de unidades em C na populao
14. Pretende se realizar um inqurito ao Agregados familiares com o objectivo de determinar a
proporo de famlias que possuem certos atributos. Numa populao com 4000 Agregados
familiares, qual o tamanho da amostra necessrio para determinar P, com uma margem de erro
de 5% com 95% de confiana?
a) Se sabe de estudos anteriores de que a proporo p = 30%.
b) Se o valor p desconhecido?
15.Os dados seguintes mostram a estratificao de todas as empresas agrcolas, de acordo com
o tamanho da farma e o nmero mdio de hectares de milho por farma em cada estrato.
Autor: Filipe Mahaluca

mahaluca@gmail.com

49

Inferncia Estatstica

Tamanho

Nmero

Mdia

Desvio

da farma

de Farmas

de milho

Padro

Nh

Yh

Sh

0- 40

394

5.4

8.3

41-80

461

16.3

13.3

81-120

391

24.3

15.1

121-160

334

34.5

19.8

161-200

169

42.1

24.5

201-240

113

50.1

26.0

241 -

148

63.8

35.2

Total

ou 2010

26.3

mdias
Para uma amostra de 100 farmas, calcule o tamanho da amostra para cada estrato, usando:
a) A alocao proporcional;
b) A alocao ptima

16. Um amostrista pretende seleccionar uma amostra aleatria estratificada e suspeita que os
custos do trabalho de campo sero da forma

C n
h

. As estimativas das quantidades relativas

para os dois estratos so:

Estrato

Wh

Sh

Ch

0.4

10

$4

0.6

20

$9


b) Determine o tamanho da amostra necessrio, para esta alocao, de modo que Var y 1.
a) Determine valores de n1 / n e n2 / n que minimizam o custos para dado valor de Var y est .
est

Autor: Filipe Mahaluca

mahaluca@gmail.com

50

Inferncia Estatstica

Capitulo 2: INTEVALO DE CONFIANCA


Introduo

Intervalo de confiana uma tcnica para se fazer inferncia estatstica. Ou seja, a


partir de um intervalo de confiana, construdo com elementos amostrais, pode-se inferir sobre um
parmetro populacional.
A lgica da construo de intervalos de confiana a seguinte:

Seja um parmetro populacional;

Seja um estimado de q.

Conhecida a distribuio de probabilidade de , possvel construir um intervalo:

1 2
que contm , e se exigir que a probabilidade do intervalo seja de (1 ) = nvel de
confiana.
Geralmente (1-).100=90%, 95%, 99%, .
Esta tcnica diferencia-se da estimao por ponto, onde se calcula um nico valor (estimativa)
para o parmetro populacional. No caso do intervalo de confiana busca-se um segmento, ou
intervalo 1: 2 que contm o parmetro desconhecido.
Por exemplo, retira-se uma amostra de 500 Moambicanos e calcula-se a mdia de suas alturas
encontrando-se 1,66 m. Logo, uma estimao pontual da verdadeira altura mdia (m) dada
por x =1,66 m. J atravs do intervalo de confiana poder-se-ia encontrar um intervalo, por
exemplo [1,58; 1,68] que, em 95% das vezes, incluiria (a verdadeira altura mdia dos
Moambicanos).

Autor: Filipe Mahaluca

mahaluca@gmail.com

51

Inferncia Estatstica

2.1 INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL


QUANDO A VARINCIA (2) CONHECIDA
Como se sabe, o estimador de X . Tambm conhecida a distribuio de probabilidade de
X:
X ~N(;

) para as populaes infinitas

X ~N(;

) para as populaes finitas

Assim, para o caso de populaes infinitas, a varivel padronizada de X ser:


Z=
Fixando se um nvel de confiana: 1- tem se:
Ou seja:
P( -Z/2ZZ/2)=1-
Substituindo se o valor de Z,
P(-Z/2

Z/2)=1-

Resolvendo -se as duas inequaes para , tem-se o intervalo de confiana para a mdia
populacional () quando a varincia (2) conhecida:

P( X -Z/2

X +Z/2 )

Exemplo:
A durao da vida de uma pea de equipamento tal que = 5 horas.
Foram amostradas 100 dessas peas obtendo-se a mdia de 500 horas. Deseja-se construir um
intervalo de confiana para a verdadeira durao mdia da pea com um nvel de 95%.
Resolucao:
Do problema se tem: = 5; n = 100; X = 500; (1 a).100 = 95%
Z/2=1.96
Autor: Filipe Mahaluca

mahaluca@gmail.com

52

Inferncia Estatstica
Lembre-se que para descobrir a abcissa 1,96, entrou-se na tabela com 0.475= 47.5%, j que a
tabela da faixa central.
Substituindo se os dados na formula:
P(500-1,96.

500+1,96.

) =95%

Efectuando os clculos:
P(499.02500.98)=95%
que o intervalo solicitado.
A interpretao desse resultado dada por:
O intervalo [499,02; 500,98] contm a durao mdia da pea com 95% de confiana. Isto
significa que se forem construdos intervalos dessa mesma maneira, para um grande nmero de
amostras, em 95% dos casos tais intervalos incluiriam.
Para o caso de populaes finitas usa-se a seguinte frmula:
P( X -Z/2

X +Z/2

)=1-

Um intervalo unilateral de 100(1-)% com limite superior estabelecido a partir de:


X +Z
Um intervalo unilateral de 100(1-)% com limite inferior estabelecido a partir de:

X -Z/2

ERRO DE ESTIMACAO
O intervalo de confiana bilateral tem a forma;
X

Z/2

Aumentando a amplitude do intervalo, aumenta se o nvel de confiana do intervalo, no entanto,


aumenta se o erro mximo de estimacao que o valor absoluto da diferena entre o parmetro
amostral ( X ) e o parametro papulacional(), representado como =| X

|.

Como o intervalo de confiana tem centro na mdia amostral, o erro mximo provvel igual a
metade da amplitude do intervalo.

Autor: Filipe Mahaluca

mahaluca@gmail.com

53

Inferncia Estatstica
Como X

Z/2

, pode se escrever X

erro

Logo = Z/2
n= (

)2

Logo, o tamanho da amostra depender:


do grau de confiana;
da disperso na populao ;
dee certo valor especifico para o erro tolervel.

2.2 INTERVALO DE CONFIANA PARA A MDIA () QUANDO A


VARINCIA (2) DESCONHECIDA
O processo para se obter o intervalo de confiana semelhante quele mostrado no item
anterior. Como no se conhece , porm, preciso substitu-lo por S (desvio-padro amostral)
que, contrariamente a , uma varivel aleatria. Da se
ter o quociente entre duas variveis aleatrias, X e S, pois:

Pode-se demonstrar que:


t=
Tem distribuio t de Student com (n 1) graus de liberdade.
Fixando-se um nvel de confiana: 1 tem-se:
P( -Z/2ZZ/2)=1-

Substituindo se o valor de t e resolvendo -se as duas inequaes para , obtm-se o intervalo


para a mdia quando a varincia (2) desconhecida.

Autor: Filipe Mahaluca

mahaluca@gmail.com

54

Inferncia Estatstica
P( X -t/2

X +t/2 )=1-

Onde a varivel t possui (n 1) graus de liberdade.


Exemplo:
A amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao normal. Construir um
intervalo de confiana para a mdia a nvel de 95%.
Resolucao:
Calculando-se a mdia e o desvio-padro da amostra obtm-se: X = 8,7 e S = 2.
Como: 1 - = 95% e g. l. = = n 1 = 10 1 = 9
t/2=2.2622 (tabela)
Logo
P(8.7-2.2622.

8.7+2.2622.

)=95%

Ou
P(7.2710.13)=95%
A interpretao desse resultado dada por:
O intervalo [7,27; 10,13] contm a verdadeira mdia com 95% de confiana.
Para o caso de populaes finitas usa-se a seguinte frmula:
Para o caso de populaes finitas usa-se a seguinte frmula:
P( X -t/2

X +t/2

)=1-

2.3 INTERVALO DE CONFIANA PARA A VARINCIA


O estimador de 2 S2.
Demonstra-se que

tem distribuio qui-quadrado com (n 1) graus de liberdade. Ou


seja:
n-1

Autor: Filipe Mahaluca

mahaluca@gmail.com

55

Inferncia Estatstica
Ento, substituindo-se o valor de 2, e isolando-se 2 obtm-se o seguinte intervalo:
)

P(

Exemplo:
Admita n = 10, S2=4 e que se deseja construir um IC para a varincia a nvel de 90%
Resolucao:
Tem se n=10, S2=4, (1-).100=90% e =(n-1)=(10-1)+9
Consultando-se a tabela de distribuio qui-quadrado:

Logo:
P(

)=90%

P(2,13

)=90%

A interpretao que o intervalo [2,13; 10,81] contm a verdadeira varincia com 90% de
confiana.

2.4 INTERVALO DE CONFIANA PARA O DESVIO-PADRO


Como o desvio-padro a raiz quadrada da varincia, pode-se usar a seguinte: frmula:

P( S.

)=1-

Com a distribuio qui-quadrado de parmetros: = (n 1).


Autor: Filipe Mahaluca

mahaluca@gmail.com

56

Inferncia Estatstica
A interpretao segue o modelo j apresentado.

2.5 INTERVALO DE CONFIANA PARA PROPORO


f o estimador de e tem distribuio dada por:
f

)
)

Assim, para o caso de populaes infinitas, a varivel padronizada de f dada por:

Z=

Fixando-se um nvel de confiana 1 a tem-se:


P( -Z/2ZZ/2)=1-
Substituindo-se o valor de Z:
P( -Z/2

Z/2)=1-

Isolando-se

do denominador, encontra-se:

P(f-Z/2

f+

)=1-

Para amostras grandes (n > 30) pode-se substituir p e q = (1 p) do radicando por f e (1 f).
Assim, o IC para a proporo ser:
)

P(f-Z/2

f+

)=1-

Para o caso de populaes finitas o IC ser:

P(f-Z/2

Autor: Filipe Mahaluca

f+

)=1-

mahaluca@gmail.com

57

Inferncia Estatstica
Exemplo: Examinadas 500 peas de uma grande produo encontrou-se 260 defeituosas. No
nvel de 90% construir um IC para a verdadeira proporo de peas defeituosas.
Tem-se: n = 500, p = 260, 1 - a = 90%.
Logo:
f= =

=0.52

Z/2=1.64
Ento, o IC ser:
P(0.52-1.64

(0.52+1.64

=1-

Ou
P(0.483

Ou ainda
P(48.3%

E a interpretao de que o intervalo [44,8%; 55,2%] contm a verdadeira percentagem (ou


proporo) de peas defeituosas.

Autor: Filipe Mahaluca

mahaluca@gmail.com

58

Inferncia Estatstica

Capitulo3: TESTE DE HIPTESES


INTRODUO

Teste de Hipteses uma tcnica para se fazer inferncia estatstica. Ou seja, a partir
de um teste de hipteses, realizado com os dados amostrais, pode-se inferir sobre a populao.
No caso das inferncias atravs dos IC, busca-se cercar o parmetro populacional
desconhecido. Aqui formula-se uma hiptese quanto ao valor do parmetro populacional, e pelos
elementos amostrais faz-se um teste que indicar a aceitao ou rejeio da hiptese formulada.

CONCEITO DE HIPTESE ESTATSTICA


Hiptese estatstica uma suposio quanto ao valor de um parmetro populacional, ou quanto
natureza da distribuio de probabilidade de uma varivel populacional.
Nesta sesso trabalharemos apenas com os testes referentes aos parmetros da populao.
So exemplos de hipteses estatsticas:
a) A altura mdia da populao Moambicana 1,65m, isto : H: = 1,65 m;
b) A varincia populacional dos salrios vale 2.0002mt, isto : H : 2= 2.000 2mt
c) A proporo de Maputenses com a doena X 40%, ou seja: H:

= 40%;

d) A distribuio dos pesos dos alunos da nossa faculdade normal;


e) A chegada de navios ao porto de Nacala descrita por uma distribuio de Poisson.

3.1 TESTE DE HIPTESES E TIPOS DE HIPTESE


Teste de hipteses uma regra de deciso para aceitar ou rejeitar uma hiptese estatstica com
base nos elementos amostrais.
Uma hiptese pode ser definida como uma afirmativa sobre a populao.
Por exemplo, um psiclogo pode levantar a hiptese de que as meninas tm melhor desempenho
verbal do que os meninos, ou um mdico pode levantar a hiptese de que os fumantes vivem
menos do que os no-fumantes. O testes de hipteses permitem estabelecer se tais afirmativas
so confirmadas pelos dados disponveis.
Autor: Filipe Mahaluca

mahaluca@gmail.com

59

Inferncia Estatstica

A primeira hiptese denominada hiptese nula e a segunda denominada hiptese


alternativa. Indica-se a primeira hiptese por H0 (l-se agzero) e a segunda por H1 (l-se agum). Escreve-se: H
H0:as mdias so iguais H
H1 as mdias so diferentes
Para decidir por uma das hipteses isto , para decidir se as mdias na populao so, ou
no so, iguais o pesquisador submete os dados da sua amostra a um teste de hipteses. Mas
em que consiste este teste? O pesquisador supe que as mdias, na populao, so iguais. Se
sob essa hiptese for pouco provvel ocorrer uma diferena de mdias to grande ou maior
do que a que se observou na amostra, o pesquisador rejeita a hiptese inicial e conclui que as
mdias, na populao, so diferentes.
Exemplo:
Um professor quer saber se dois mtodos de alfabetizao, A e B, tm a mesma eficincia. Na
amostra, as mdias das notas dos alunos foram 5,0 para o mtodo A e 7,0 para o mtodo B. Se
sob a hiptese de que, na populao, as mdias so iguais for pouco provvel ocorrer, na
amostra, uma diferena de dois pontos ou mais entre mdias, lgico rejeitar a hiptese inicial e
concluir que B mais eficiente do que A.
Mas preciso insistir neste ponto pouco provvel no significa impossvel. Ento, o
pesquisador pode cometer erro quando conclui que, na populao, as mdias so diferentes s
porque seria pouco provvel ocorrer uma diferena de mdias to grande, ou maior do que a
que ele prprio observou, se as mdias da populao fossem iguais. O pesquisador no sabe se
est ou no cometendo esse tipo de erro, embora a probabilidade de ocorrer o erro seja
conhecida. o que os estatsticos denominam nvel de significncia do teste (probabilidade de
rejeitar H0 quando H0 verdadeira).
Finalmente, toda vez que se rejeita H0, ao nvel de significncia de 5%, usual afirmar que o
resultado significante e indicar isso com um asterisco. Quando se rejeita H0 ao nvel de
significncia de 1%, usual afirmar que o resultado altamente significante e indicar isso com
dois asteriscos.

Autor: Filipe Mahaluca

mahaluca@gmail.com

60

Inferncia Estatstica

O exemplo a seguir mostra diferentes tipos de testes de hipteses.


Exemplo:
a) H0: =1.65m
H1: 1.65m

Dar origem a um teste bicaudal

b) H0: =1.65m
H1: 1.65m

Dar origem a um teste unicaudal direita

c) H0: =1.65m
H1: 1.65m

Dar origem a um teste unicaudal esquerda

3.2 TESTES DE SIGNIFICNCIA


Os testes de significncia so os mais usados nas pesquisas educacionais, scio-econmicas, etc.
O procedimento para realizao dos testes de significncia resumido nos seguintes passos:
1) Enunciar as hipteses H0 e H1;
2) Fixar o limite de erro a, e identificar a varivel de teste;
3) Com o auxlio das tabelas estatsticas, considerando e a varivel do teste, determinar a RC
(regio crtica) e RA (regio de aceitao) para H0
4) Com os elementos amostrais, calcular o valor da varivel do teste;
5) Concluir pela aceitao ou rejeio de H0 pela comparao do valor obtido no passo
anterior com RA e RC.

3.2.1 TESTE DE SIGNIFICNCIA PARA MDIAS


1) H0: =0
Autor: Filipe Mahaluca

mahaluca@gmail.com

61

Inferncia Estatstica
H1: Uma das alternativas

0 (a)

0 (b)

0 (c)

2) Fixar . Admitindo-se que 2 desconhecida, a varivel do teste ser t de


Student, com = (n 1).
3) Com auxlio da tabela t determinam-se RA e RC.
4) Clculo do valor da varivel

onde:
X = Media amostral

0= Valor da hiptese nula


S= desvio padro amostral
n = tamanho da amostra
5) Concluses
a) Se -t/2 tcal t/2 no se rejeita H0
Se tcal> t/2 ou tcal <-t/2, rejeita se H0
b) Se tcal t no se rejeita H0
Se tcal> t rejeita se H0
c) Se tcal

-t no se rejeita H0

Se tcal <- t rejeita se H0


Exemplo: Os dois registos dos ltimos anos de uma Universidade atestam, para os calouros
admitidos, uma nota mdia 115 (teste vocacional). Para testar a hiptese de que a mdia de
uma nova turma a mesma, tirou-se, ao acaso, uma amostra de 20 notas, obtendo-se mdia 118
e desvio-padro 20. Admitir que = 0,05, para efectuar o teste.
Autor: Filipe Mahaluca

mahaluca@gmail.com

62

Inferncia Estatstica
Resoluo
1) H0: =1.65m
H1: 1.65m
2) = 0,05
Varivel t com 19 graus de liberdade.
3) t/2=2,093
4)

=0,67

5) Como 2,093 tcal 2,093, no se pode rejeitar H0: = 115 com esse nvel de
significncia.

3.2.2 TESTE DE SIGNIFICNCIA PARA VARINCIAS


1) H0: 2= 20
H1: 2

20 (a)

2>20 (b)
2< 20 (c)
2) Fixar . Escolher a varivel qui-quadrado com = (n 1).
3)
4) Com auxlio da tabela 2 determinam-se RA e RC.
5) Clculo do valor da varivel
)

onde:
n = tamanho da amostra;
S2= varincia amostral;
2 = valor da hiptese nula.
Autor: Filipe Mahaluca

mahaluca@gmail.com

63

Inferncia Estatstica

6) Conclusoes:
a) Se 2inf 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup ou 2cal < 2inf rejeita se H0
b) Se 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup rejeita se H0
c) 2ca

2inf no se pode rejeitar H0

2ca 2inf rejeita se H0


Exemplo: Para testar a hiptese de que a varincia de uma populao 25, tirou-se uma
amostra aleatria de 25 elementos obtendo se S2=18,3. Admitindo-se = 0,1, efectuar o teste
de significncia unicaudal esquerda.
Resolucao:
1) H0: 2= 25
2< 25
2) = 0,01; varivel 2 com 25-1=24 graus de liberdade
3) 2inf=15.7

4) 2cal=

=17,56

5) Como 2cal> 15.7, no se pode rejeitar H0: 2= 25 ao nvel de significncia de 10%.

3.2.3 TESTE DE SIGNIFICNCIA PARA PROPORES


1) H0: p=p0
H1: Uma das alternativas
p=p0 (a)
p>p0 (b)
Autor: Filipe Mahaluca

mahaluca@gmail.com

64

Inferncia Estatstica
p<p0 (c)
2) Fixar . Escolher a varivel normal padro: Z.
3) Com auxlio da tabela de distribuio normal padro, determinam-se RA e RC.

4) Clculo do valor da varivel


Zcal=

Onde: f = frequncia relativa do evento na amostra;


p0 = valor da hiptese nula;
n = tamanho da amostra.
5) Concluses
a) Se -Z/2ZcalZ/2 no se pode rejeitar H0;
Se Zcal> Z/2 ou Zcal <-Z/2 rejeita se H0
b) Se Zcal Z no se pode rejeitar H0
Se Zcal>Z regeita se H0
c) Se Zcal
Se Zcal

Z no se pode rejeitar H0
Z rejeita se H0

Exemplo:
As condies de mortalidade de uma regio so tais que a proporo de nascidos que
sobrevivem at 60 anos de 0,6. Testar essa hiptese ao nvel de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes at 60 anos.
1) H0: p=0.6
H1: p
2) =0.05 e a varivel escolhida, a normal (0;1).

Autor: Filipe Mahaluca

mahaluca@gmail.com

65

Inferncia Estatstica
3) RA e RC
Z/2=1.96

4) Zcal=

=-4,51

5) Como Zcal <-1,96, rejeita se H0, concluindo se, ao nvel de 5% de significncia que
p

3.2.4 TESTE DE SIGNIFICNCIA PARA A IGUALDADE DE DUAS


VARINCIAS
1) H0: 21= 22
H1: 21

22

Podem-se testar as desigualdades < ou >, todavia, o mais comum


2) Fixar . Escolher a varivel F com (n1 1) graus de liberdade no numerador, e (n2 1)
graus de liberdade no denominador.
3)
4) Com auxlio da tabela da distribuio F, determinam-se RA e RC.
=(n-1)
5) Clculo do valor da varivel
Fcal=
6) Concluses
Se Fint

Fsup no se pode rejeitar H0;

Se Fcal > Fsup ou Fcal < Fint, rejeita se H0


Exemplo
Dois programas de treinamento de funcionrios foram efectuados. Os 21 funcionrios treinados
no programa antigo apresentam uma varincia 146 em suas taxas de erro. No novo programa,

Autor: Filipe Mahaluca

mahaluca@gmail.com

66

Inferncia Estatstica
13 funcionrios apresentaram uma varincia de 200. Sendo = 0,1, pode-se concluir que a
varincia diferente para os dois programas?
1) H0: 21= 22
H1: 21

22

2) = 0,1. A varivel F com 1=n1-1=20 e 2=n2-1=12


3) RA e RC
Fint=0,43 e Fsup=2.54

4) Fcal=

=0.73

5 Como 0,43 Fcal2.54, no se pode rejeitar H, portanto, no se pode concluir que as


varincias sejam diferentes em esse nvel de significncia.

3.2.5 TESTE DE SIGNIFICNCIA PARA A IGUALDADE DE DUAS


MDIAS
1 Caso: As varincias so conhecidas, independentes e normais.
1) H0: 1=2 ou 1-2=d onde d>0 uma diferena admitida entre as medias.
H1: 1 2 ou 1-2 d
2) Fixar . Escolher a varivel normal padro: Z.
3) Com auxilio da tabela da distribuicao normal padro, determinar RA e RC.
4) Clculo do valor da varivel
(

Zcal =

5) Conclusoes
Se -Z/2ZcalZ/2 no se pode regeitar H0;
Se Zcal> Z/2 ou Zcal<-Z/2 , regeita se H0.
Autor: Filipe Mahaluca

mahaluca@gmail.com

67

Inferncia Estatstica

Exemplo
Um fabricante de pneus produz dois modelos. Para o modelo A, = 2500 milhas, e para o
modelo B, = 3000 milhas. Um txi testou 50 pneus do modelo A e 40 do modelo B, obtendo
24000 milhas e 26000 milhas de durao mdia dos respectivos modelos. Adoptando-se um
risco = 0,04 testar a hiptese de que a vida mdia dos dois modelos a mesma.
Resolucao:
1) H0: A=B
H1: A B
2) =0.04, a varivel N(0;1)
3) RA e RC
Z/2=2.05

4)

Zcal =

=-3,38

5) Como Zcal <-2,05, rejeita-se H0, concluindo-se com risco de 4% que as mdias dos pneus
so diferentes.
2 Caso: As varincias populacionais so desconhecidas e, admitidas iguais, independentes e
normais.
1) H0: 1=2 ou 1-2=d onde d>0 uma diferena admitida entre as medias.
H1: 1 2 ou 1-2 d
2) Fixar . Escolher a varivel t, com =(n1+n2-2)
3) Com auxlio da tabela da distribuio t, determinam-se RA e RC.
4) Clculo do valor da varivel

Autor: Filipe Mahaluca

mahaluca@gmail.com

68

Inferncia Estatstica
(

tcal =

5) Concluses
Se -t/2tcalt/2 no se pode rejeitar H0;
Se tcal> t/2 ou tcal < -t/2 , rejeita se H0.

Exemplo: Dois tipos de tinta foram testados sob as mesmas condies meteorolgicas. O tipo A
registou uma mdia de 80 com um desvio de 5 em 5 partes. O tipo B, uma mdia de 83 com um
desvio de 4 em 6 partes. Adoptando-se = 0,05 testar a hiptese da igualdade das mdias.
Resolucao:
1) H0: A=B
H1: A B
2) =0,05 e a varivel t com 5+6-2=9 graus de liberdade.
3) RA e RC
t/2=2.2622

4) Sc=

Sc=

Tcal=

=4.47

=-1.12

5) Como 2,2622 tcal2,2622, no se pode rejeitar H0 com esse nvel de significncia.

EXERCCIOS: INTERVALO DE CONFIANA


01) De uma distribuio normal com 2 = 2,25 obteve-se a seguinte amostra:
Autor: Filipe Mahaluca

mahaluca@gmail.com

69

Inferncia Estatstica
27,5 25,6 28,2 26,1 25,0.
Determinar o intervalo de confiana para a mdia populacional aos nveis de significncia
de 5% e 1%.
02) Dados: n=10, x = 112 e s = 11, determinar os intervalos de confiana, para os nveis de
95% e 90%, para a mdia populacional.
03) Um conjunto, composto por 12 animais em experincia, foi alimentado com uma dieta
especial durante certo tempo e verificou-se que os aumentos de peso foram:
25 22 30 26 24 39 32 26 32 33 28 30.
Encontrar os limites de confiana para a mdia, ao nvel de confiana de 90%.
04) Supondo populaes normais, determinar o intervalo de confiana para a mdia dos
seguintes conjuntos de dados (considere = 0,05):
a) 64,9 64,1 63,8 64,0 62,0 61,2 65,9 60,7.
b) 1,19 1,23 1,18 1,21 1,27 1,17 1,15 1,14 1,19 1,20.
05) Numa fbrica, colhida uma amostra de parafusos, foram obtidos os seguintes valores de
dimetro (medidas em mm)
10

11

11

11

12

12

12

12

13

13

13

13

13

13

13

13

13

13

13

13

14

14

14

14

14

15

15

15

16

16

Pede-se para construir o intervalo de confiana para:


a) o dimetro mdio real de toda a produo de parafusos , bem como para o desvio padro
desse dimetro, ao nvel de 95% de confiana ;
b) a proporo real de parafusos que medem de 12 a 14 mm , ao nvel de 88% de confiana.
06) Uma amostra composta dos seguintes elementos:
7 - 7 8 9 9 9 10 11 11 11 12 13 13 14 15 15.
Pede-se construir o intervalo de confiana para:
a) a mdia ao nvel de confiana de 99 % ;
b) a proporo real de valores inferiores a 9 , ao nvel de confiana de 80%.

Autor: Filipe Mahaluca

mahaluca@gmail.com

70

Inferncia Estatstica
07) Numa pesquisa de opinio pblica, entre 600 pessoas, 240 responderam que sim a certa
pergunta. Determinar o intervalo de confiana para a percentagem populacional que deve
responder sim, ao nvel de confiana de 95%.
08) Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a fluorao da
gua. Encontrar limites de confiana para a proporo real de habitantes no favorveis
fluorao, para:
a) nvel de confiana de 90% ;
b) nvel de confiana de 95%.
09) Numa cidade, entre 1000 residncias, 288 assinam TV cabo. Determinar o intervalo de
confiana para a proporo de assinantes de TV cabo, nesta cidade, ao nvel de confiana
de 98%.
10) Dada a distribuio a seguir, pede-se para construir o intervalo de confiana para a mdia
ao nvel de 95%
Classes

2,2 6,2

Fi

6,2 10,2 10,2 14,2 14,2 18,2


4

11) Com uma amostra de 25 elementos de uma populao obtivemos: mdia 8; desvio padro
1,58 e f =60%. Determinar os intervalos de confiana para :
a) a mdia , com = 10% ;
b) a proporo , com = 4% .

EXERCCIOS: TESTE DE HIPTESE

Autor: Filipe Mahaluca

mahaluca@gmail.com

71

Inferncia Estatstica
01) Uma amostra de 10 elementos apresentou x = 230. Sabe-se que a varincia da populao
igual a 160. Testar a hiptese de = 218, contra a alternativa 218, ao nvel de
significncia de 10%.
02) Uma indstria produz lmpadas que seguem uma distribuio N (800, 1600) horas. Testar a
hiptese de que = 800, contra a alternativa 800, se uma amostra aleatria de 30
lmpadas teve um tempo mdio de vida de 788 horas e adoptando nvel de 5%.
03) Numa amostra de 20 elementos de uma populao normal obteve-se mdia 42 e desvio
padro 5. Ao nvel de significncia de 5%, testar a hiptese de que a mdia populacional
50, contra a alternativa de ser diferente de 50.
04) Os pesos de certo produto so:
20,21 20,05 20,09 19,90 19,83 20,01 19,90 19,87 kg.
Testar a hiptese de = 20,00, contra 20,00, ao nvel de 5% de significncia.
05) Dada a amostra:
Classes

0 5

5 10

10 15 15 20 20 25

Fi

Testar as hipteses, para o nvel de significncia de 1% (testes bilaterais)


a) = 12

c) = 14

b) = 13

d) = 16

06) Numa amostra de 20 elementos de uma populao normal obteve-se varincia de 25 e


mdia 15. Ao nvel de 10%, testar: = 16, contra 16.
07) Em 60 lances de uma moeda observaram-se 37 caras. Testar a hiptese da moeda ser
honesta, aos nveis de 5% e 1%.
08) As condies de mortalidade de uma certa regio so tais que a proporo de nascidos que
sobrevivem at 60 anos de 60%. Testar essa hiptese, ao nvel de 5% , sabendo-se que ,
em 1000 nascimentos amostrados, verificaram-se 530 sobreviventes at 60 anos.
Autor: Filipe Mahaluca

mahaluca@gmail.com

72

Inferncia Estatstica

09) Medidos os dimetros (em mm) de 32 peas de uma produo, resultou a distribuio
abaixo:
Valores 56,5

56,6

56,7

56,8

56,9

57,0

57,1

57,2

57,3

Fi

10

Pergunta-se se H evidncia que :


a) O dimetro mdio no seja 57,0, ao nvel de 1%.
b) A proporo de peas com dimetro inferior a 56,9 seja maior que 30%, ao nvel de 8%.
10) Uma amostra com 25 elementos, provinda de uma populao normal, apresentou mdia
amostral 81. Uma outra com 36 elementos apresentou mdia 76. Sendo os desvios padres
populacionais de 5,2 e 3,4 respectivamente, testar a hiptese das mdias das duas populaes
serem iguais, contra a hiptese alternativa de serem diferentes, ao nvel de 6%.
11) Dois tipos de solues qumicas A e B foram ensaiados para determinar os pH. Observandose nA = 6, obteve-se mdia 7,52 e com nB = 5 obteve-se mdia 7,49. Sendo os desvios padres
populacionais de 0,024 e 0,032, respectivamente, testar a hiptese das mdias serem iguais,
contra a alternativa de serem diferentes, ao nvel de significncia de 5%.
12) Num levantamento de opinio pblica para previso de uma eleio, foram ouvidos 500
eleitores escolhidos ao acaso; 236 declararam que iriam votar no candidato A e os demais no
candidato B. Verificar se, com base nesta previso, podemos concluir que o candidato B j
venceu a eleio, ao nvel de significncia de 1%.
13) Testar se h diferena significativa entre as mdias populacionais com base nas duas
amostras, para um nvel de significncia de 5% e 1%.
a) (supor que as varincias populacionais so iguais )
AMOS.1
Classes
Fi
0 4 1
4 8 4

AMOS. 2
Classes
0 5
5 10

Autor: Filipe Mahaluca

b)
Fi
2
5

Amostr.1
Xi
15
25

Fi
7
4

Amostr.2
Xi
10
30

Fi
5
5

mahaluca@gmail.com

73

Inferncia Estatstica
8 12 3

10 15

14) Numa amostra de 250 elementos verificaram-se 24 sucessos e noutra de 100 elementos
verificaram-se 15 sucessos. Podemos supor idnticas as probabilidades de sucesso nas duas
populaes, ao nvel de 5%?
15) Numa pesquisa com os telespectadores de uma cidade, 60 de 200 homens desaprovam
certo programa, acontecendo o mesmo com 75 de 300 mulheres. Ao nvel de significncia de
10%, h diferena real entre as opinies de homens e mulheres?
16) Dados: n1 = 25, x1 = 8, s1 = 1,58, f1 = 60% para uma certa populao, e para outra
populao: n2 = 31, x2 = 7, s2 = 1,24, f2 = 35%. Testar:
a) H0: 1 = 7,5

H1 : 1 7,5

5%

b) H0 : p1 = 55%

H1 : p1 55%

= 4%

c) H0 : 1 = 2

H1 : 1 2

= 5%

d) H0 : p1 = p2

H1 : p1 p2

= 7%

EXERCCIOS: DIMENSIONAMENTO DE AMOSTRA


01) Determinar o nmero mnimo de elementos de uma amostra, se desejamos estimar a mdia
populacional, com 95% de confiana, e erro amostral de 0,4, sendo que de uma amostra piloto
com 70 elementos obtivemos varincia de 36.

Autor: Filipe Mahaluca

mahaluca@gmail.com

74

Inferncia Estatstica
02) Suponhamos que se pretenda estimar a renda mdia por famlia numa grande cidade. Com
base em informaes passadas, admite-se que o desvio padro das rendas das famlias de
200,00mt. Qual deve ser o tamanho da amostra, a fim de que o erro de estimativa da renda
mdia seja no mximo de 10,00mt, com probabilidade igual a 96%?
03) Para se estimar a proporo de pessoas interessadas em gua fluorada, qual o tamanho da
amostra, para se estar confiante em 95% de que o erro seja de no mximo 1% ?
04) Um fabricante de peas acredita que aproximadamente 5% de seus produtos so
defeituosos. Se ele deseja estimar a verdadeira percentagem, dentro de 0,5% de erro, com uma
probabilidade de estar certo de 90%, qual o tamanho da amostra a ser tomada?

Capitulo 4: ANLISE DE REGRESO LINEAR E CORRELAO


LINEAR

Autor: Filipe Mahaluca

mahaluca@gmail.com

75

Inferncia Estatstica

INTRODUO
Muitas vezes, na prtica, necessitamos estudar o relacionamento de duas variveis, colectadas
como pares de valores, para resolver questes, como por exemplo:
O sucesso de um emprego pode ser predito com base no resultado de testes:
Quanto maior for a produo, maior ser o custo total.
Quanto maior for a idade de um imvel, menor ser seu preo de venda.
Problemas como esses podem ser estudados atravs uma analise de correlao simples, onde
podemos determinar a fora do relacionamento entre asa duas variveis estudadas.
As variveis estudadas sero: X, denominada de varivel independente, e Y, denominada de
varivel dependente.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o valor
de Y, conhecido um valor de X, atravs de uma frmula matemtica adequada, podemos aplicar
a chamada anlise de regresso simples.

4.1 Objectivos e hipteses da Anlise de Regresso


O objetivo principal da anlise de regresso predizer o valor da varivel dependente Y
dado que seja conhecido o valor da varivel independente X.
A equao de regresso a frmula algbrica pela qual se determina Y.
A Anlise de Regresso Simples diz respeito predio de Y por uma nica varivel X.
A Anlise de Regresso Mltipla diz respeito predio de Y por mais de uma varivel X
(x1, x2,....).
As hipteses gerais so:
1. Y uma varivel aleatria obtida de uma amostra;
2. Y e X esto associadas linearmente;
3. homocedasticidade as varincias das distribuies condicionais de Y dado X so todas
iguais.
Se em conjunto com a anlise de regresso, utiliza-se a estimao por intervalo, necessria
a hiptese de que as distribuies condicionais de Y dado X so todas distribudas
normalmente para os valores da populao.
Autor: Filipe Mahaluca

mahaluca@gmail.com

76

Inferncia Estatstica

4.2 Diagrama de disperso


um grfico no qual cada ponto representa um par de valores (x;y). Os valores de X so
colocados no eixo horizontal e Y no vertical.
Transformao Linear se a relao ente X e Y for curvilnea, usa-se logaritmos para
transforma-la em linear e aplicar a Anlise de Regresso Linear. Para voltar escala
original usa-se o antilogartmo.Se o diagrama indica uma relao linear, ento ajusta-se aos
dados uma linha que seja a melhor funo ajustante.
A localizao precisa desta linha determinada pelo Mtodo dos Mnimos Quadrados
(MMQ).
Exemplos de diagramas de disperso:

4.3 Mtodo dos Mnimos Quadrados (MMQ)


A frmula geral na populao

Autor: Filipe Mahaluca

mahaluca@gmail.com

77

Inferncia Estatstica
Y x u

onde

coeficiente linear ou intercepto-Y;


coeficiente angular;
u = variaes aleatrias.
A frmula geral na amostra

a bx
Y
onde a= estimador do coeficiente linear;
b= estimador do coeficiente angular;
Pelo MMQ, a reta resultante tem duas caractersticas importantes:
1. A soma dos desvios verticais dos pontos em relao a reta zero.
2. A soma dos quadrados desses desvios mnima.
As frmulas de clculo para a e b so:

sxy
sxx
a y b.x
b

sxy xy

x. y

n
x
sxx x
n
y
syy y
n

Autor: Filipe Mahaluca

mahaluca@gmail.com

78

Inferncia Estatstica
A estimao de Y deve ser feita apenas dentro do intervalo de variao de X originalmente
amostrado. A equao fornece a base de uma estimativa por ponto.

4.4 Erro padro de Estimao (predio) e Intervalos de


Predio
O erro padro de estimao um desvio-padro condicional, na medida em que indica
o desvio-padro da varivel Y dado um valor especfico de X.
O erro padro de estimao

( y Y )
n2

Divide-se por n-2 pois perde-se dois graus de liberdade com as estimativas de

Frmula alternativa

a y b x. y
n2

Para construir um intervalo de predio para Y dado X, usa-se

e duas hipteses

bsicas:
1. a disperso de y a mesma em todos os pontos da recta;
2. a cada ponto, os valores de y so normalmente distribudos em relao recta de
regresso.

4.5 Intervalos de Predio para a varivel dependente y


^

[Y tn2; / 2 . u ]
4.6 Intervalo de Predio para a declividade

O erro-padro de b
Autor: Filipe Mahaluca

mahaluca@gmail.com

79

Inferncia Estatstica

x2 n X

O parmetro pode ser estimado atravs do intervalo de predio

b t

n 2 ; / 2

Se o valor zero estiver no intervalo, no h declividade.

4.7 Teste de Hiptese para

H0: = 0
H1: 0 ou > 0 ou < 0

tc

b 0
~ t n 2 gl
b

4.8 CORRELAO LINEAR DE PEARSON


4.8.1 Objectivos e Hipteses
A anlise de correlao mede o grau de relacionamento entre as variveis. Estudaremos a
Anlise de Correlao Simples, a qual diz respeito medida entre X e Y.
Hipteses:
a. a relao entre X e Y linear;
b. ambas so variveis aleatrias;
c. homocedasticidade;
d. as distribuies condicionais de Y dado X tm distribuio Normal;
e. as duas distribuies, de X e de Y, tm distribuio Normal na populao.

Autor: Filipe Mahaluca

mahaluca@gmail.com

80

Inferncia Estatstica

4.8.2 O coeficiente de Determinao


2 - Coeficiente de determinao na populao
r2 - coeficiente de determinao na amostra
O coeficiente de determinao para a amostra :

a y b xy n( y )
Amostra: r
y n( y )

Tem uma leve tendenciosidade positiva.


Interpretao: a proporo da varincia de Y explicada pelo conhecimento da variao de X (
e vice-versa).

4.8.3 O coeficiente de correlao


Muito embora o coeficiente de determinao seja relativamente fcil de interpretar, ele no
pode ser testado estatisticamente. Contudo, a raiz quadrada do coeficiente de determinao,
que o coeficiente de correlao (r), pode ser testada estatisticamente, pois est includa em
uma estatstica de teste que distribuda segundo uma distribuio t, quando a correlao
populacional =0.
Alm disso, o sinal aritmtico associado com o coeficiente de correlao, que sempre o mesmo
sinal associado com na equao de regresso, indica a direo da relao X e Y
(positivo=direta; negativo=inversa). Por tais razes o coeficiente de correlao mais
freqentemente usado como medida de relao entre as variveis.
O coeficiente de correlao para dados populacionais :
Populao:

O coeficiente de correlao para dados amostrais :


Amostra:

r r

Autor: Filipe Mahaluca

mahaluca@gmail.com

81

Inferncia Estatstica
Pode-se elevar o coeficiente de correlao ao quadrado para se obter o coeficiente de
determinao.
Frmula Alternativa para o coeficiente de correlao amostral,

sxy
sxx . syy

que no requer o conhecimento dos coeficientes a e b da equao de regresso. O sinal do


coeficiente obtido directamente, sem necessidade de observar ou calcular a declividade da
linha de regresso.
O coeficiente amostral de correlao r tem uma leve tendenciosidade como um estimador de .

4.9 Signific
ncia do coeficiente de correlao
Hipteses:

H0 : 0

H0 : 0
H1 : 0

ou

H1 : 0

H0 : 0

ou

H1 : 0

Se a hiptese nula, ao nvel de significncia , for rejeitada podemos concluir que efetivamente
existe uma relao entre as variveis.
A estatstica de teste

tc

r n2
1 r 2

com n-2 graus de liberdade na tabela t

Exerccios Resolvidos
Exerccio 01

Autor: Filipe Mahaluca

mahaluca@gmail.com

82

Inferncia Estatstica
esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa
relao, uma nutricionista seleccionou 18 mulheres, com idade entre 40 e 79 anos, e observou em
cada uma delas a idade (X) e a massa muscular (Y).
Massa muscular (Y)

Idade (X)

82.0

71.0

91.0

64.0

100.0

43.0

68.0

67.0

87.0

56.0

73.0

73.0

78.0

68.0

80.0

56.0

65.0

76.0

84.0

65.0

116.0

45.0

76.0

58.0

97.0

45.0

100.0

53.0

105.0

49.0

77.0

78.0

73.0

73.0

78.0

68.0

(a) Construa o diagrama de disperso e interprete-o.

Autor: Filipe Mahaluca

mahaluca@gmail.com

83

Inferncia Estatstica

120

M.muscular

110
100
90
80
70
60
40

50

60

70

80

Idade

No grfico de disperso entre a varivel massa muscular e idade, pode-se observar que h um
forte indcio de relao linear decrescente entre as variveis em estudo. Nota-se que a massa
muscular das pessoas diminui medida que a idade aumenta.
(b) Calcule o coeficiente de correlao linear entre X e Y.
Denotamos as variveis: Y = Massa Muscular e X = Idade n=18
18

X i2 70362

Y 85

X 61,556

i 1

18

S XX X i2 18 X
i 1

18

S YY Yi 2 18 Y
i 1

i 1

18

Y X
i 1

91964

133300 18(85) 2 3250

( X i X )(Yi Y )
S XX SYY

Yi 2 133300

70362 18(61,556) 2 2157,460

18

i 1

18

18

X Y
i 1

i i

18 XY

S XX SYY

91964 18(85)(61,556)
(2157,460)(3250)

-0,837

Segundo o resultado da correlao obtida, pode-se notar que h uma forte correlao linear
entre a varivel massa muscular e idade. Nota-se que medida que a idade da pessoa

Autor: Filipe Mahaluca

mahaluca@gmail.com

84

Inferncia Estatstica
aumenta a massa muscular diminui, o que coerente com o grfico de disperso apresentada
anteriormente.

(c) Ajuste uma recta de regresso para a relao entre as variveis Y: massa muscular
(dependente) e X: idade (independente).

S XY 91964 18(85)(61,556)

-1,027
2157,460
S XX

0 Y 1 X 85 1,027(61,556) 148,218
A recta de regresso estimada da varivel Massa muscular (Y) em funo da Idade (X)

Y 148,218 1,027 X
(d) Considerando a recta estimada dada no item (c), estime a massa muscular mdia de mulheres
com 50 anos.

Y 50 0 1 X 148,218- 1,027(50) 96,868

Exerccio 02
Os dados a seguir correspondem varivel renda familiar e gasto com alimentao (em
unidades monetrias) para uma amostra de 25 famlias.
Renda Familiar (X)

Gasto com Alimentao (Y)

1,5

2,0

10

6,0

10

7,0

Autor: Filipe Mahaluca

mahaluca@gmail.com

85

Inferncia Estatstica
20

10,0

20

12,0

20

15,0

30

8,0

40

10,0

50

20,0

60

20,0

70

25,0

70

30,0

80

25,0

100

40,0

100

35,0

100

40,0

120

30,0

120

40,0

140

40,0

150

50,0

180

40,0

180

50,0

200

60,0

200

50,0

Autor: Filipe Mahaluca

mahaluca@gmail.com

86

Inferncia Estatstica
(a)

Construa o diagrama de disperso do varivel gasto com alimentao (Y) em funo da


renda

familiar

(X).

Gasto com Alimentao

60
50
40
30
20
10
0
0

100

200

Renda Familiar

(b)

Calcular o coeficiente de correlao entre essas variveis.

Denotamos as variveis: Y = Gasto com Alimentao e X = Renda familiar

X 83,120 Y 26,660

25

X i2 271934
i 1

25

(c)

S XY
S X SY

X Y

i i

i 1

25

Yi 2 24899,250
i 1

25

Y X
i 1

80774,500

25 XY
0,954

S X SY

Obtenha a equao de regresso do gasto com alimentao em funo da renda familiar.


25

S
1 XY
S XX

X Y
i 1

i i

25 X Y

S XX

Autor: Filipe Mahaluca

80774,5 25(83,12)(26,66)
0,256
271934 25(83,12) 2
mahaluca@gmail.com

87

Inferncia Estatstica
e

0 Y 1 X 26,66 0,256(83,120) 5,380


A recta de regresso estimada da varivel Gasto de alimentao (Y) em funo da Renda
familiar (X)

Y 5,380 0,256X

(d)

Qual o significado prtico do valor da inclinao da recta de regresso do item (c)?


O valor 1 =0,256 significa que estima-se que para cada aumento de uma unidade

monetria da renda familiar ocorre um acrscimo em mdia de 0,256 unidades no gasto com
alimentao.
Exerccio 03
Um pesquisador deseja verificar se um instrumento para medir a concentrao de determinada
substncia no sangue est bem calibrado. Para isto, ele tomou 15 amostras de concentraes
conhecidas (X) e determinou a respectiva concentrao atravs do instrumento (Y), obtendo:

2,0

2,0

2,0

4,0

4,0

4,0

6,0

6,0

6,0

8,0

8,0

8,0

10,0 10,0 10,0

2,1

1,8

1,9

4,5

4,2

4,0

6,2

6,0

6,5

8,2

7,8

7,7

9,6

10,0 10,1

(a) Construa o diagrama de disperso para esses dados.

Autor: Filipe Mahaluca

mahaluca@gmail.com

88

Inferncia Estatstica

Diagrama de Disperso
10,5
9,5
8,5
7,5

6,5
5,5
4,5
3,5
2,5
1,5
2

10

(b) Trace no grfico a recta com 45 de inclinao passando pela origem. Como essa reta pode
ser til na avaliao do instrumento?

10

0
0

10

Esta recta til, pois, quanto mais prximos os pontos estiverem nela, maior preciso do
instrumento, j que o ideal Y=X.

Autor: Filipe Mahaluca

mahaluca@gmail.com

89

Inferncia Estatstica

(c) Calcule o coeficiente de correlao entre as variveis X e Y.

X 6

Y 6,040

15

X i2 660
i 1

15

(X
i 1

X )(Yi Y )
S X SY

15

Yi 2 663,380
i 1

15

Y X
i 1

661,200

0,996

(d) Obtenha a reta de regresso da varivel Y em funo de X.

A reta de regresso estimada da varivel Y e X

Y 0,160 0,980X
(e) Com base nos itens anteriores tire concluses sobre a eficincia do instrumento.
Com base nos itens anteriores, nota-se que, o instrumento para medir a concentrao de
determinada substncia no sangue encontra-se bem calibrado. Observa-se que existe uma alta
correlao entre as medidas feitas pelo instrumento e a concentrao da determinada
substncia, o que pode ser confirmado nos grficos apresentados anteriormente. Alm disso, a
reta de regresso obtida bem prxima da reta Y=X, indicando grande proximidade entre as
medidas. O mtodo formal para verificar se o instrumento esta bem calibrado testar as
hipteses: (=0,05)

H 0: 1 1
H 1 : 1 1

Estatstica do teste:

Autor: Filipe Mahaluca

1 1
2 / S XX

~
T(15 2)
SobH 0

mahaluca@gmail.com

90

Inferncia Estatstica
R.C. (=0,05)
R.C. {T R :| T | 2,16}

Valores observados

T0bs

0,980 1

/ S XX
2

0.02
0.06984/ 120

0.828

Como T0bs R.C. , ento aceita-se Ho. Ou seja, o instrumento esta bem calibrado.

Autor: Filipe Mahaluca

mahaluca@gmail.com

91

Inferncia Estatstica

Exerccios de Correlao e Regresso Linear


1- Abaixo voc encontra uma lista de situaes de pesquisa. Para cada uma delas indique se o
apropriado proceder uma anlise de regresso ou uma de correlao. Justifique sua indicao.
a) 0 Rendimento escolar na Universidade favorece o xito profissional?
b) 0 Tempo de treinamento influi no desempenho profissional?
c) O objectivo e estimar o tempo necessrio a consecuo de certa tarefa usando, para tanto, o
tempo de treinamento do executor.
d) 0 Objectivo e utilizar o preo da carne de gado para estimar a quantidade de procura desse
bem.
e) A quantidade procurada de carne de gado depende do preo da carne de porco?
2- Uma cadeia de supermercados financiou um estudo dos gastos realizados por famlia de
quatro pessoas com renda mensal lquida entre oito e vinte salrios mnimos. A pesquisa levou a
equao de regresso Y = -1,2 + 0,4 X, onde Y representa a despesa mensal estimada
(atravs do modelo) e X a renda mensal lquida expressa em nmero de salrios mnimos.
a) Estime a despesa mensal de uma famlia com renda lquida mensal de 15 salrios mnimos.
b) A equao parece sugerir que uma famlia com renda mensal de 3 salrios mnimos nada
gasta com mercadorias. O que voc tem a dizer sobre isso?
c) A equao em questo serve para estimar a despesa mensal de uma famlia de 5 pessoas
com renda lquida de 12 salrios mnimos? Justifique.
3- Uma amostra de fbricas de uma indstria levou a:
Custo total Y

Produo X

80

12

44

51

70

11

61

a) Determine a equao de regresso linear.


b) Quais os significados econmicos de "a" e "b"?
c) Encontre o coeficiente de determinao (ou de explicao).
d) Teste a existncia da regresso a um nvel de significncia de 5%.
Autor: Filipe Mahaluca

mahaluca@gmail.com

92

Inferncia Estatstica
e) Determine um Intervalo de Predio (90%) para a mdia de Y dado X=10.
4- Pretendendo estudar a relao entre o tempo necessrio a um consumidor para optar e o
nmero de produtos substitutos alternativos expostos a ele, foi observada uma amostra aleatria
de 15 consumidores, da qual resultaram os seguintes dados:
Y

10

10

11

10

12

A varivel Y refere-se ao tempo necessrio para a tomada de deciso e X o nmero de


alternativas.
a) Estime o coeficiente de correlao linear de Pearson.
b) Determine a equao de regresso para a amostra dada.
c)Interprete os valores dos coeficientes encontrados para a recta.
d)Estime e interprete o coeficiente de determinao entre X e Y.
5- Para cada caso abaixo, estime a correspondente recta de regresso:
a) n 20, X 200, Y 300, XY 6200, X
b) n 36, X 7,2, Y 37, XY 3100, X
Autor: Filipe Mahaluca

3600.

620.

mahaluca@gmail.com

93

Inferncia Estatstica
6- Uma populao composta por N=6 pontos (X;Y). So eles:
(1;2) (5;6) (2;4) (2;3) (3;5) (5;10)
a) Determine a recta de regresso populacional;
b) Faa um diagrama de disperso, localize a recta do item anterior e os segmentos que
representam os 6 valores de u. Verifique que a soma de u igual a zero.
7- Uma amostra de residncias seleccionadas aleatoriamente foi observada quanto idade do
imvel X e quanto ao preo de venda. Resultou:
X Y
1 10
2 30
3 40
4 50
5 65
6 70
a) Estime a recta de regresso populacional;
b) Teste, usando o coeficiente angular, se o preo de venda do imvel diminui medida que a
idade cresce. Use 5%.
c) Obtenha e interprete o intervalo de projeco de 95% para o preo de uma casa com 3
anos;
d) Obtenha e interprete o intervalo de projeco de 95% para o preo mdio de uma casa
com 3 anos;
e) Estime os coeficientes de correlao e determinao entre X e Y;
f) necessrio testar a significncia do coeficiente de correlao? Explique.
8- Abaixo, voc encontra 3 afirmaes. Indique, justificando, se so verdadeiras ou falsas:
a) Se entre X e Y o coeficiente de correlao 1, apenas uma dessas variveis exerce
influncia sobre a outra. Isso j no verdade quando o coeficiente de correlao 1.
b) Se o coeficiente angular da recta de regresso nulo, o coeficiente de correlao entre as
mesmas variveis tambm o .

Autor: Filipe Mahaluca

mahaluca@gmail.com

94

Inferncia Estatstica
c) Se o coeficiente angular da recta de regresso positivo, necessariamente o coeficiente de
correlao entre as mesmas variveis tambm o .
9- Para cada um dos casos abaixo teste, a 5%, a significncia do coeficiente angular da recta
de regresso:
a) b=4; b 1; n=12;
b) b=-0,15 b 0,1; n=20;
c) b=0,6 b 0,2; n=50.
10- Para estudar a poluio de um rio, um cientista mediu a concentrao de um determinado
composto orgnico (Y) e a precipitao pluviomtrica na semana anterior (X):
X

0,91 0,10
1,33 1,10
4,19 3,40
2,68 2,10
1,86 2,60
1,17 1,00
a)Existe alguma relao entre o nvel de poluio e a precipitao pluviomtrica?
Informa-se que r= 0,89. Teste sua significncia, ao nvel de 5%. ,
b) Determine a equao de regresso linear. Teste a existncia da regresso, ao nvel de 1 % e
5%.
c)Calcule o coeficiente de correlao linear de Pearson e teste a sua significncia ao nvel de 1
%.
11- Procurando quantificar os efeitos da escassez de sono sobre a capacidade de resoluo
de problemas simples, um agente tomou ao acaso 10 sujeitos e os submeteu a experimentao.
Deixou-os sem dormir por diferentes nmeros de horas, aps o que solicitou que os mesmos
resolvessem os itens "contas de adicionar" de um teste. Obteve, assim, os seguintes dados:
Autor: Filipe Mahaluca

mahaluca@gmail.com

95

Inferncia Estatstica
No de erros - Y

Horas sem dormir - X

12

10

12

16

14

16

14

20

12

20

16

24

12

24

a)Calcule o coeficiente de correlao linear de Pearson e teste a sua significncia ao nvel de


1%.
b) Determine a equao de regresso linear. Teste a existncia da regresso, ao nvel de 1 % e
5%.
12-A tabela abaixo mostra o comprimento ( X ) e largura ( Y ) de 10 folhas extradas de uma
arvore aleatoriamente.
a)Verifique se existe correlao significativa entre as variveis com um nvel de significncia de
5%.
b) Determine a equao de regresso linear. Teste a existncia da regresso, ao nvel de 1% e
5%.
comprimento

largura

12

10

15

14

11

16

13

13

10

12

12

10

17

13

15

14

Autor: Filipe Mahaluca

mahaluca@gmail.com

96

Inferncia Estatstica
13- A tabela abaixo mostra a frequncia do pulso mdio em diferentes perodos etrios:
Idade Pulso
2

112

104

100

92

10

88

12

86

14

84

16

80

a) Determine a equao de regresso linear. Teste a existncia da regresso, ao nvel de 1 % e


5%.
14- A tabela abaixo mostra o volume de vendas (em 1.000 unidades) e os gastos promocionais
(em 100.000 mt ).
Vendas

Promoo

80

90

95

95

100

110

115

10

110

10

120

12

130

15

a) Represente graficamente estes pontos.


b) Calcule o coeficiente de correlao linear de Pearson.
c) Ajuste os dados atravs de uma recta de mnimos quadrados. (modelo linear)
d) Determine o coeficiente de explicao para a recta.
Autor: Filipe Mahaluca

mahaluca@gmail.com

97

Inferncia Estatstica
e) Teste a existncia da regresso ao um nvel de significncia de 5%.
15- H suspeitas de que a qualidade do remdio depende do tempo de maturao despendido
em sua produo. Para verificar isso, um laboratrio farmacutico colectou os seguintes dados:
Tempo-X

Qualidade - Y

23

31

40

46

52

63

a) Represente graficamente estes pontos.


b) Calcule o coeficiente de correlao linear de Pearson.
c) Ajuste os dados atravs de uma recta de mnimos quadrados. (modelo linear)
d) Determine o coeficiente de explicao para a recta.
e) Teste a existncia da regresso ao um nvel de significncia de 5%.
16- Em certa populao, o coeficiente de correlao entre X e Y 0,80.
a) O que isto significa?
b) Que percentual da varincia de Y no explicada pelas variaes de X?
17- A tabela seguinte mostra os resultados de uma pesquisa com 10 famlias de determinada
regio.
Famlias

Renda

Poupana

Nmero de

Mdia de Anos de

(10000 mt)

(1000 mt)

Filhos

Estudo da Famlia

10

15

12

70

20

12

Autor: Filipe Mahaluca

mahaluca@gmail.com

98

Inferncia Estatstica
E

80

20

16

100

30

18

20

30

10

60

15

Calcule o coeficiente de correlao linear de Pearson entre:


a) Renda familiar e poupana das dez famlias;
b) Renda e numero de filhos para as dez famlias;
c) Poupana e nmero de filhos;
d) Mdia de anos de estudo e nmero de filhos;
e)Renda familiar e media de anos de estudo.
18- Um grupo de pesquisa estabeleceu uma escala de quocientes de violncia para programas
de televiso. Classificou cada um dos 6 programas e colectou dados sobre o percentual de
pessoas que assistem cada programa. Verifique se existe correlao significativa entre as
variveis com um nvel de significncia de 5%.
Programa

Quociente de violncia (X)

% que assistem (Y)

10

15

30

20

40

24

50

30

65

35

70

35

19- Os dados abaixo representam o Consumo (Y) e Renda disponvel (X) num perodo de 14
anos. As variveis so expressas em milhes de meticais.
X 3915,5

Y 3273,4

1150349,73

2
Y 800330,16

XY 959198,36

a) Determine as estimativas de a e b dos parmetros da recta estimada;


b) Qual o significado econmico dessas estimativas?
Autor: Filipe Mahaluca

mahaluca@gmail.com

99

Inferncia Estatstica
c) Qual o consumo esperado para uma renda de 400 milhes de meticais?
d) Calcule o poder explicativo da regresso e interprete-o.
20-Uma empresa est estudando como varia a demanda de certo produto em funo de seu
preo de venda. Para isso levantou as seguintes informaes:
Meses Unidades Vendidas Preo/unidade
(Y)

(X)

248

162

242

167

234

165

216

173

230

170

220

176

213

178

205

180

198

182

195

187

197

190

260

200

a) Ajuste os dados atravs de um modelo linear;


b) Qual o significado econmico das estimativas de a e b dos parmetros da recta
estimada?
c) Teste a existncia da regresso a um nvel de 1%;
d) Determine um intervalo de 95% de confiana para a mdia de y dado x=185.

Autor: Filipe Mahaluca

mahaluca@gmail.com

100

Inferncia Estatstica

Capitulo 5: NMEROS NDICES


5.1. Situaes
Diariamente ouvimos frases como estas:
A inflao do ms de Janeiro de 2005 foi de 0,69%.
A inflao acumulada de 2004 foi de 8,19%.
O rendimento da caderneta de poupana com database 28/01/05 foi de 0,65%.
A indstria automobilstica trabalha com a taxa de 3,72% nos financiamentos dos
carros.
Um jornal, por ocasio de um pleito eleitoral publicou uma tabela com os seguintes resultados da
apuraro na regio:
Cidades

Candidato 1

Candidato 2

Votos brancos

Votos nulos

Total

46.856

41.856

1.468

14.643

108.324

23.587

28.678

1.125

8.410

61.800

10.368

8.965

687

2.564

22.584

21.814

12.128

849

4.887

39.678

1.856

2.569

126

1.356

5.907

5.287

5.679

352

28

11.346

10.876

5.987

238

87

17.188

Cidade

Votos Nulos (%)

A
B
C
D
E
F
G

Autor: Filipe Mahaluca

mahaluca@gmail.com

101

Inferncia Estatstica

5.2 Definio
Um nmero-ndice uma medida estatstica que serve para comparar grupos de variveis
relacionadas entre si e obter um quadro simples e resumido das mudanas em reas
relacionadas como preos de matrias-primas, preos de produtos acabados, volume fsico de
produo, etc.

5.4 Nmeros-ndices
Consideremos a tabela abaixo, relativa s matrculas efectivadas em certo estabelecimento de
ensino durante o perodo de 1999 a 2004:
TABELA
ANOS

1999

2000

2001

2002

2003

2004

MATRCULA

1050

1150

1200

1400

1560

1700

NMERO-NDICE

100

109,5

O primeiro valor posicionado no numerador chamado valor corrente; o segundo, no


denominador, designado valor base. Essa definio, indicando-se o nmero-ndice entre b
(valor - base) e c (valor considerado) por Ib, c, resumida na seguinte expresso:

I b, c

c
.100
b

Ib, c = (valor da varivel na data considerada / valor da varivel na data-base) x100

Exemplo: Qual o ndice de crescimento do salrio de um funcionrio de uma empresa publica,


sabendo-se que ele ganhava em 1999 740,00mt e em 2003 passou a ganhar 1.240,00mt?

Autor: Filipe Mahaluca

mahaluca@gmail.com

102

Inferncia Estatstica

5.5 Conceito de Relativo


Frequentemente, tem-se trs variveis a ser analisada: preo, quantidade e valor.

5.5.1 Relativo de Preo


a razo entre o preo de um produto numa poca pt (poca atual) com o de uma poca po
(poca base).

p0 ------- 100
pt ------- p(0, t)

p ( 0, t )

pt
.100
p0

Exemplo: O preo do ventilador em 2002 era de 450,00mt e em 2003 foi para R$ 600,00mt.
Tomando por base o ano de 2002, determinar o preo relativo em 2003.

5.2. Relativo de Quantidade


Representa a variao da quantidade na poca t com relao a uma poca 0 (base).

q(o, t )

qt
.100
qo

Exemplo:
Uma empresa produziu 12 toneladas de ao em 1995 e 17 toneladas em 1996. Tomando como
ano base 1995, a quantidade relativa ser:

5.3. Relativo de Valor


Considere pt e qt respectivamente o preo e a quantidade de um produto na poca atual(t) e p0
e q0, o preo e a quantidade do mesmo produto na poca base (0), definimos o valor relativo
como:

Autor: Filipe Mahaluca

mahaluca@gmail.com

103

Inferncia Estatstica

v( o, t )

v t p1q1

.100
vo po q o

Exemplo: Uma empresa vendeu em 1995, 10000 unidades de um artigo ao preo unitrio de
100,00mt. Em 1996 vendeu 20000 unidades do mesmo artigo ao preo unitrio de 120,00mt.
Qual foi o valor relativo da venda em 1996?

5.6. Elos de Relativos ndice de Base Mvel


Vrios relativos formam elos, quando cada um deles calculado tomando como base o ano
anterior.
Exemplo: Se um bem apresentou, no perodo de 2001 a 2004, respectivamente os preos de
240.00mt, 300.00mt, 360.00mt e 540.00mt, os elos relativos so:

p(0, t )

pt
p
300
.100 2002 .100
.100 125
p0
p 2001
240
p( 2002,2003)
p( 2003, 2004)

5.7. Relativos em Cadeia - ndice de base fixa


Utilizando como exemplo os dados do item anterior e considerando 2001 como ano
base, otm-se:

p(0, t )

pt
p
300
.100 2002 .100
.100 125
p0
p 2001
240
p( 2001, 2003)

Autor: Filipe Mahaluca

mahaluca@gmail.com

104

Inferncia Estatstica

p( 2001, 2004)
Exemplo: No exemplo anterior, considerar 2001 como ano base, determinar os relativos em
cadeia, em porcentagem.
Anos

2001

2002

2003

2004

Relativos

100

125

150

225

O grfico abaixo mostra a evoluo do preo do bem em questo:

Relativos em cadeia: 2001-2004


250

ndice (%)

200

150

100

50

0
2001

2002

2003

2004

Ano

5.8. ndice Agregativo Simples


o quociente entre a soma dos preos (ou quantidades) de n bens na poca actual e a soma dos
preos (ou quantidades) desses mesmos bens na poca base.

I p 0 ,t

pt

i 1
n i
p0
i 1

.100

=> ndice agregativo simples de preo

Autor: Filipe Mahaluca

mahaluca@gmail.com

105

Inferncia Estatstica

Iq

0 ,t

I v 0 ,t

qt

i 1
n i
q0
i 1

.100

=> ndice agregativo simples de quantidade

i i

ptqt

i 1
n i i
p 0q 0
i 1

.100

=> ndice agregativo simples de valor.

Exemplo: Uma famlia efectuou duas compras num supermercado em duas pocas diferentes. Os
preos e as quantidades dos produtos adquiridos encontram-se na tabela abaixo:
2003

2003

2004

2004

Produtos

Preo

Quantidade

Preo

Quantidade

1 - carne ( kg )

4,60

0,50

5,20

0,60

2 - leite ( l )

0,80

10

0,90

14

3 - ovos (dz )

1,20

1,40

Total

6,60

12,5

7,50

18,60

Construir o ndice agregativo simples de preo, de quantidade e de valor para 2004 com base
em 2003.

5.9. ndice Agregativo Ponderado


No clculo do ndice simples, todos os itens do agregado so colocados em um mesmo nvel.
Sabe-se, porm, que na prtica isso no acontece, h bens de importncia muito maior que
outro, razo pela qual deve-se considerar os coeficientes de ponderao, atribuindo, a cada
item, a importncia que lhe cabe.

Autor: Filipe Mahaluca

mahaluca@gmail.com

106

Inferncia Estatstica

5.9.1. ndice de Laspeyres ou Mtodo da poca-Base


O peso relativo ou fator de ponderao relativa para um dado bem i, dado por:

w
i
0

p i0 .q i0
n

p i0 .q i0
i 1

O numerador da expresso representa o valor gasto com um dado item i, e o denominador a


soma dos valores de todos os bens adquiridos na poca base.

5.9.1.1. ndice de Laspeyres de Preo


O ndice de Laspeyres de preo definido pela seguinte expresso:

Lp 0, t

pt qo
poq o

.100

Exemplo: Considerando a tabela, calcule o ndice ponderado para preos, empregando a


frmula de Laspeyres e tomando 2002 = 100.
2002

2003
p

20

28

40

56

15

30

12

Bens

Autor: Filipe Mahaluca

mahaluca@gmail.com

107

Inferncia Estatstica

5.9.1.2. ndice de Laspeyres de Quantidade


O ndice de Laspeyres de Quantidade definido pela seguinte expresso

L'0, t

q t po
q o po

.100

5.9.2. ndice de Paasche ou Mtodo da poca Atual


O ndice agregativo proposto por Paasche representado por:

w
i
t

p it .q it
n

p it .q it
i 1

5.9.2.1. ndice de Paasche de Preo:

P0, t

ptq t
poq t

.100

Exemplo: Considerando a tabela, calcule o ndice ponderado para preos, empregando a


frmula de Paasche e tomando 2002 = 100.
2002

2003

20

28

40

56

15

30

12

Bens

Autor: Filipe Mahaluca

mahaluca@gmail.com

108

Inferncia Estatstica

5.9.2.2. ndice de Paasche de Quantidade

P'0, t

qt pt
qopt

.100

5.9.3. ndice de Fisher


Tambm conhecido como forma ideal. a mdia geomtrica dos nmeros ndices de Laspeyres e
de Paasche.

5.9.3.1. ndice de Fisher de Preo


I 0, t L 0, t .P0, t
Exemplo: Nos dois exemplos anteriores, tem-se que o ndice de Laspeyres de Preo = 1,625 e
o ndice de Paasche de Preo = 1,700, calcule o ndice de Fisher de Preo.

5.9.3.2. ndice de Fisher de Quantidade

I'0, t L'0, t .P'0, t

Exerccio: Voc proprietrio de uma padaria, e deseja comparar vendas e preos de 2008
com as vendas e preos de 2007. Os produtos escolhidos, preos e quantidades vendidas esto
apresentados na tabela abaixo.

Autor: Filipe Mahaluca

mahaluca@gmail.com

109

Inferncia Estatstica

Produto

Unidade

Pretzels

2007

2008

Preo

Qtde.

Preo

Qtde.

kg

5,60

0,700

5,90

0,840

Cuca

kg

6,80

1,000

8,10

0,800

Po integral

kg

9,10

0,320

9,90

0,450

Croissant

kg

15,20

0,300

16,30

0,350

a) Em qual destes produtos o ndice de Laspeyres tem o maior aumento?


b) Calcule os ndices de preo de Laspeyres, Paasche e Fisher.

5.10. Deflao de uma srie temporal


As variaes de preo, causadas por inflao ou deflao, podem obscurecer as variaes de
quantidade
Valor deflacionado = (valor original/ndice) x 100
Ano

Valores (US$)

IPC

1983

207132

100

1984

218937

103,9

1985

228689

107,6

1986

237246

109,6

1987

247093,3

113,6

1988

259915,6

118,3

1989

278894,7

124

1990

303903,3

130,7

1991

317292,4

136,2

1992

319253,2

140,3

1993

325125,4

144,5

1994

341287,2

148,2

1995

354122,3

152,4

1996

369334,2

156,9

Autor: Filipe Mahaluca

Srie deflacionada

mahaluca@gmail.com

110

Inferncia Estatstica

ANEXOS

Autor: Filipe Mahaluca

mahaluca@gmail.com

111

Inferncia Estatstica
DISTRIBUIO DE STUDENT

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica
DISTRIBUIO DE FISHER-SNEDECOR PARA = 5%

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica
VALORES DE z PARA O NVEL DE SIGNIFICNCIA COM = 5% - TESTE DE DUNCAN

Autor: Filipe Mahaluca

mahaluca@gmail.com

Inferncia Estatstica
DISTRIBUIO DE 2

Autor: Filipe Mahaluca

mahaluca@gmail.com