Você está na página 1de 94

UNIVERSIDADE FEDERAL DO RIO GRANDE

DO SUL

Instituto de Matemtica
Departamento de Estatstica

ESTATSTICA GERAL II
MAT02215

Professor: Marco Antnio Giacomelli


www.mat.ufrgs.br/~giacomo/

Porto Alegre, Agosto de 2013


1- INTRODUO

1.1 - Cincias Estatsticas

Na medida que foi sendo colocado diante de novos desafios, decorrentes


especialmente do crescimento da populao quando as atividades e as relaes scio-
econmicas tornaram-se mais complexas o homem precisou aprimorar,
sistematicamente, os instrumentos existentes e/ou criar outros para continuar
garantindo sua sobrevivncia. Nesse processo de evoluo, que perdura at os dias atuais,
novas necessidades e dificuldades foram se sucedendo, sempre desafiando o ser humano a
ultrapass-las. Com a observao sistemtica da realidade e a utilizao dos instrumentos
criados, surgiu o conhecimento cientfico, que permitiu ao ser humano entender explicar e
explorar melhor, e mais rapidamente, o mundo em que vive.

Para registrar, classificar, controlar e estudar mais adequadamente fenmenos, fatos,


eventos e ocorrncias foram sendo criadas, desenvolvidas e aperfeioadas, muitas tcnicas
de anlise de informaes e mtodos quantitativos. Esses avanos facilitaram a resoluo
de inmeros problemas que o homem encontrava para realizar as atividades bsicas de
produo, comrcio, transportes, etc.

Nestes ltimos anos houve necessidade de aprofundar estudos, realizar experimentos e


pesquisas mais especficas, inclusive para avaliar os resultados das atividades
desenvolvidas. Por essa razo, os conhecimentos tericos e os mtodos de anlise de dados
quantitativos vm sendo aprimorados continuamente.

O conjunto de tcnicas e mtodos de pesquisa, experimentao e inferncias mais


utilizadas para alcanar esses objetivos so o que modernamente se conhece como
Cincias Estatsticas, onde se destaca a seguinte gama de conhecimentos: Teoria dos Jogos,
Planejamento de Experimentos, Teoria das Filas, Controle de Qualidade, Teoria das
Decises, Sries Temporais, Econometria e outras tcnicas.

1.2 - reas de aplicao da Estatstica

Dentre as reas em que a Estatstica adquire maior relevncia, destacamos:

Economia: Planeja e desenvolve estudos prospectivos sobre o comportamento de


variveis macroeconmicas: renda, produo, comrcio interno, importao, exportao,
inflao, emisso de moeda, elaborao de ndices para medir produtividade, realiza
anlises microeconmicas envolvendo a evoluo das vendas, produo, custos, margem de
lucro, otimizao da receita, formula indicadores gerenciais para tomada de decises, etc.

2
Cincias Sociais: estudo de fatores desencadeadores de comportamento violento,
tipificao de uso de drogas, causas de criminalidade.

Pesquisa de mercado: planeja e coordena a realizao de pesquisa, por


amostrage, para avaliar o comportamento do mercado, as reaes do consumidor para
lanamento de novos produtos ou para estabelecer estratgias de venda, etc.

Pesquisa de opinio: planeja e coordena a realizao de pesquisas sobre preferncia


ou opinio da populao em variados temas: candidaturas eleitorais, regime poltico,
atividades culturais.

Controle de qualidade: desenvolve estudos para estabelecer padres de qualidade e


confiabilidade de produtos e servios; realiza testes para avaliao e controle de processos,
etc.

Informtica: elabora modelos de simulao para resoluo de problemas complexos:


define indicadores para amostragem de banco de dados; implanta modelos de previso e
anlises estatsticas; estabelece ndices e coeficientes para gerenciamento e tomada de
decises.

Demografia e sade: estuda a evoluo e as caractersticas da populao; estabelece


tbuas de mortalidade; analisa os fluxos migratrios; estabelece nveis e padres para
testes clnicos; planeja e realiza experimentos com grupos de controle para avaliao de
tratamentos.

Pesquisa operacional: elabora modelos matemticos utilizando tcnicas de


programao linear e programao no linear para otimizar alocao de recursos; utiliza
mtodos de simulao para indicar solues timas, etc.

Recursos Humanos: pesquisa a compatibilidade entre os conhecimentos/habilidades


e as atividades desenvolvidas por funcionrios; estuda curvas salariais; prope planos de
avaliao de desempenho do quadro funcional; elabora plano de previdncia complementar
e fundo de penso.

Agronomia e veterinria: produtividade em funo do uso de fertilizantes,


melhoramento gentico, desempenho de variedades de plantas.

3
1.2. Diviso da Estatstica

Estatstica Descritiva: descrio, resumo e organizao das informaes. Compreende o


uso de tabelas, grficos e medidas-resumo.

Estatstica Inferencial: atravs do particular (amostra) faz indues a respeito do todo


(populao), controlando a probabilidade de erro (por isso estudaremos a Teoria das
Probabilidades).

Exemplo 1: projeo da percentagem de votos para um candidato numa eleio.

Exemplo 2: comparao de adubos

Os trs canteiros so expostos mesma incidncia de luz, tipo de solo, mas recebem adubos
diferentes. No final do experimento ser medida a altura das plantas.

4
1.3 Reviso de Estatstica Descritiva

Medidas descritivas para dados no agrupados

x + x2 + L + xn x i
Mdia aritmtica: X = 1 = i =1

n n

Moda: a moda de um conjunto de valores, denotada por mo, definida como o valor mais
freqente no conjunto. Convm lembrar que a moda pode no ser nica, isto , um conjunto
pode ser bimodal, trimodal, etc. No caso em que todas freqncias forem iguais diremos
que no h moda. Se a moda existir ser denotada por Mo.

Mediana: A mediana de um conjunto ordenado de valores, denotada por Med, definida


como o valor que separa o conjunto em dois subconjuntos de mesmo tamanho.

x [ n +1 ] , se n mpar
2



Med =

(x [n2 ] + x [n2 +1] )
, se n par
2

sendo {x[ ] } a amostra ordenada em ordem crescente.

Amplitude: h = x max x min 0

n 2 2

i x n ( X )
2
Varincia: S = i =1
n 1

Desvio padro: S = S 2

S
Coeficiente de variao: C.V =
100%
X

5
Exemplo 3: nmero de irmos dos alunos da turma U - disciplina Estatstica

0 1 1 6 3 1 3 1 1 0 4 5 1 1 1 0 2 2 4 1 3 1 2 1 1
1 1 5 5 6 4 1 1 0 2 1 4 3 2 2 1 0 2 1 1 2 3 0 1 0

Obtenha mdia aritmtica, mediana, moda, varincia, desvio padro e coeficiente de


variao.

Soluo:

x f
0 7
1 21
2 8
3 5
4 4
5 3
6 2
Total 50

95
x= = 1,9 ; Mo=1; Med=1
50

2
309 50 (1,9)
2
s = = 2,6224 ; s = 1,6194 ; CV=85%.
49

Medidas descritivas para dados agrupados em classes

k k

x
i =1
i fi x
i =1
i fi
X = k
=
n
fi =1
i

2
k

x f i n X

i
2

S 2 = i =1
n 1

S
S = S 2 ; C.V =
100%
X

6
Exemplo 4: vendas semanais (em mil reais) de gneros alimentcios:

30 34 35 35,8 36,2 37,1 37,5 37,9 38 38,3 39 39,3 42,5 43,3 44,5
40 40,1 40,2 40,2 40,3 40,4 40,7 40,8 41 41,1 41,4 42 44,7 44,8 44,9
49,4 49 45,6 49,7 49,4 46 48 46,5 45,4 47,6 46,3 45,9 47,6 49,8 49,6
49,8 49,7 49,7 45,7 48,5 49,7 49,8 49,6 45,5 47,3 48,9 48,9 46,4 45,6 45
47 45,5 49,4 48,1 48,8 49,3 49,7 47,4 48,2 48,9 45,1 46,7 49,1 46 49,5
48,3 48,3 46,9 48,7 48,6 53,6 52,3 51,9 52 53,2 50,8 50,8 51,4 53,4 53,9
50,1 51,5 51,3 54,2 50,2 50,7 50,4 54,8 54 54 53,4 50,6 51,5 53,7 54,6
52,4 50,1 53,2 52,1 50,6 51,8 51 53,7 50,2 53,8 50,1 50,9 52 52,3 52,2
52,1 52,3 57,7 57,5 55,3 56,9 55,2 56,7 57,6 57,9 58,8 56,7 59,5 59,7 55,6
55,5 57,7 56,9 57,3 56,8 55 58 56 56,6 56,9 55,7 59,5 58,8 57,1 56,5
59,2 57,5 60,8 60,5 62,9 62,3 61,2 61,6 63,2 62,5 63,3 63,5 63,6 64,8 62,2
63,5 60,4 64,4 61 62,4 66 68

Tabela de distribuio de freqncias com 5 classes

Vendas xi fi Fi Percentual xi f i xi2 f i


30.0000 | 38.0000 34 8 8 4.6512 % 272 924
38.0000 | 46.0000 42 31 39 18.0233 % 1302 54684
46.0000 | 54.0000 50 78 117 45.3488 % 3900 195000
54.0000 | 62.0000 58 41 158 23.8372 % 2378 137924
62.0000 | 70.0000 66 14 172 8.1395 % 924 60984

Total -------- 172 -------- 100% 8776 457840

2
8776 457840 172 (51,02325)
X = = 51,02325 ; S 2 = = 58,82986 ; S = 7,67006 ,
172 171

7,670101
CV = 100 = 15,0325% .
51,02325

7
1.4 Reviso de Probabilidade

Operaes com eventos: A c I B c = AU B ; ( )


c
(AI B )c
= Ac U B c ;

A c I B = B AI B( )

Propriedades:

(1) 0 P( A) 1 , para A evento no espao amostral


(2) P() = 1
(3) P() = 0
(4) P(Ui =1 Ai ) = i =1 P( Ai ) , para Ai I A j = , i j
n n

(5) P( A c ) = 1 P( A)
(6) A B P( A) P( B)
(7) A B P( B A) = P( B) P( A) :

( )
Regra da adio: P AU B = P( A) + P( B ) P ( AI B) para A, B eventos quaisquer

Regra do produto: P( AI B) = P( A) P ( B) se A e B forem independentes

P( AI B)
Probabilidade condicional: P( A | B) = se P( B ) > 0
P( B)

Variveis aleatrias discretas

funo massa de probabilidade (fmp): para X v.a. f ( x) = P ( X = x)


0 f ( x) 1
x f ( x) = 1


E ( X ) = xf ( x) , 2 = Var ( X ) = x 2 f ( x) (EX )2 , = 2
x x


C.V = 100%
EX

8
Modelos Probabilsticos discretos

Modelo Binomial

Seja um experimento aleatrio com dois resultados possveis, isto , = {1 , 2 } ,


com P(1 ) = p e P( 2 ) = 1 p = q . A varivel aleatria X , tal que X (1 ) = 1 (ocorreu
um sucesso) e X ( 2 ) = 0 (ocorreu um fracasso) dita modelo de Bernoulli. O que um
sucesso ou um fracasso subjetivo.

Exemplo 5: ={ fator RH+ ; fator RH-}

X = 1, se RH+
= 0, se RH-

Sabe-se, da Biologia, que P( X = 1) = 0,85 e P( X = 0 ) = 0,15 .

Sendo X 1 , X 2 ,...., X n v.as. independentes e identicamente distribudas segundo


uma Bernoulli de parmetro p , ento X = i =1 X i dita binomial de parmetros n e p .
n

Notao: X ~ Binomial (n, p)

fmp: f ( x, n, p) = C nx p x q n x , x = 0,1,2....., n

Esperana e Varincia de uma v.a. Binomial

EX = np ; VarX = np(1 p)

9
Exemplo 6: suponha que 40% dos moradores de um municpio so favorveis
implantao de um novo sistema de coleta e reciclagem de lixo. Se 5 pessoas forem
entrevistadas (independentemente), qual a probabilidade de:

(a) nenhuma ser favorvel (b) no mximo 2 serem favorveis


(c) no mnimo 4 serem favorveis (d) entre 2 (incluso) e 5 (excluso) serem favorveis

soluo: vamos denotar X como o nmero de pessoas favorveis ao projeto


X ~ Binomial (5;0,40)

(a) P( X = 0) = C 50 0,40 0 0,60 5 = 0,07776

P( X 2) = P ( X = 0) + P( X = 1) + P ( X = 2) =
(b)
= C 50 0,40 0 0,60 5 + C 51 0,401 0,60 4 + C 52 0,40 2 0,60 3 = 0,68256

(c) P( X 4) = P ( X = 4) + P( X = 5) = C 54 0,40 4 0,601 + C 55 0,40 5 0,60 0 = 0,08704

P(2 X < 5) = P ( X = 2) + P( X = 3) + P( X = 4) =
(d)
C 52 0,40 2 0,60 3 + C 53 0,40 3 0,60 2 + C 54 0,40 4 0,601 = 0,6528

Exemplo 7: no exemplo anterior, se 50 pessoas forem entrevistadas, qual o nmero


esperado de favorveis?

Soluo: E ( X ) = 50 0,40 = 20 ; Var ( X ) = 50 0,40 0,60 = 12 ,

10
Modelo de Poisson

e t ( t ) x
fmp: f ( x, t ) = , x = 0,1,2,.......
x!

sendo e = 2,7182882..... , e > 0 o nmero mdio de sucessos no intervalo de


comprimento 1.

Notao: X ~ Pois(t )

Esperana e varincia de uma Poisson: EX = t Var ( X ) = t .

Exemplo 8: Numa central telefnica chegam 300 chamadas por hora. Qual a probabilidade
de que:

(a) em 1 minuto no haja nenhuma chamada?


(b) em 2 minutos ocorram 8 chamadas?
(c) em 0,5 minutos ocorram no mnimo 2 chamadas?
Soluo: X nmero de chamadas em um intervalo de t minutos

300
= = 5 o nmero esperado de chamadas em 1 minuto ( t = 1 )
60

(a) P( X = 0) = e ( )0 = e 5 = 0,00673
0!

(b) P( X = 8) = e 2
(2 )8 = e 10 10 8 = 0,1126
8! 8!

11
P( X 2) = 1 P( X < 2) = 1 P( X 1) = 1 P ( X = 0) P( X = 1) =
(c) (2,5)0 + e 2,5 (2,5)1 = 1 0,2873 = 0,7127
1 e 2 , 5
0! 1!

Variveis Aleatrias contnuas

Funo densidade de probabilidade (fdp): f ( x) 0 e a rea sob a curva 1

Funo acumulada: F tal que F ( x ) = P( X x) , x R


P ( X x ) = P ( X > x ) = 1 F ( x)

P(a X b) = P (a < X b) = P(a X < b) = P (a < X < b) = F (b) F (a) .


pois P( X = a ) = P( X = b) = 0

Modelos Probabilsticos contnuos

Modelo Uniforme contnuo

Notao: X ~ U [a, b]

0, x < a
0, x (a, b) x a

f ( x) = 1 ; F ( x) = ,a x b
b a , a x b b a
1, x > b

( a + b) (b a) 2
EX = , Var ( X ) =
2 12

Exemplo 9: considere um relgio circular de ponteiros. O relgio pode parar, por falta de
bateria, em qualquer quadrante. Defina X o ngulo formado pelo ponteiro maior quando
o relgio parar. Determinar:

(a) fdp (b) fda (c) probabilidade do ponteiro parar entre -90 e 0 graus

12
Soluo:
0, x < 360
1 x + 360
,360 x 0
(a) f ( x) = 360 (b) F ( x) = ,360 x 0
0, c.c. 360
1, x > 0

360 90 + 360 1
(c) P(90 X 0) = F (0) F (90) = =
360 360 4

Modelo Exponencial

Este modelo possui aplicaes em diversas reas: Biologia, Engenharia,


Computao. Na Teoria da Confiabilidade est associada probabilidade de falha de
componentes em um sistema.

Notao: X ~ Expon( )

0, x 0
Funo densidade de probabilidade: f ( x) = x ; >0
e , x > 0

O parmetro a taxa (intensidade) de falhas

0, x 0
Funo de distribuio acumulada: F ( x) = x
1 e , x > 0

1 1
Esperana e varincia da exponencial: EX = , Var ( X ) =
2

Exemplo 10: o tempo de durao de um componente eletrnico exponencial de


1
parmetro = . Qual a probabilidade de que o componente:
500

(a) tenha durao entre 300 e 600 horas?

(b) dure mais do que a mdia?


Soluo: X denota o tempo de durao do componente em horas

13
(a)
P(300 X 600) = F (600) F (300) = 1 e 600 (1 e 300 ) = e 0,6 e 1, 2 = 0,247617

1
(b) A media de X = = 500 . Assim,

P( X > 500) = 1 F (500) = 1 (1 e 500 ) = e 1 = 0,367879

A distribuio Normal (Gaussiana)

A distribuio Normal de grande importncia em Probabilidade e em Inferncia


Estatstica. A denominao Normal foi adotada devido forma simtrica desse modelo
probabilstico, pois na poca acreditava-se que os fenmenos da natureza estavam sempre
em equilbrio e simetria.

Funo densidade: a fdp tem forma de sino e tem dois parmetros: R e > 0

1 1 x 2
f ( x, , ) = exp , < x < + ;
2 2 2

Notao: X ~ N ( , ) .

Grfico da densidade normal

14
Tabulao da distribuio Normal padro

Seja Z ~ N (0;1) . A funo de distribuio acumulada de Z denotada por


( z ) = P( Z z ) .

Propriedades de

(1) lim z ( z ) = 0 , lim z + ( z ) = 1

(2) (0) = 0,5

(3) P(a Z b) = (b) (a )

(4) P( Z b) = 1 (b)

(5) ( z ) = 1 ( z ) , devido simetria da densidade

(6) Se X ~ N ( ; ) preciso padroniz-la , para poder usar a tabela da normal padro:

a X b a b b a
P ( a X b) = P = P Z =

15
Nota: Na figura acima, as reas A e B tm formas diferentes, mas tem mesmo valor.

Tabela de : fornece P( Z z ) , z [3,59;3,59] , que rea hachurada na figura abaixo.


No exemplo, P( Z 1,27) = 0,8980

16
Exemplo 11: Seja Z ~ N (0;1) .

(a) P( Z 1) = (1) = 0,8413


(b) P( Z 1,57) = (1,57) = 0,9418
(c) P(1,96 Z 1,96) = (1,96) (1,96) = 0,9750 0,025 = 0,95
(d) P( Z 1,64) = 1 (1,64) = 1 0,9495 = 0,0505
(e) P(2,32 Z 2,01) = (2,01) (2,32) = 0,0222 0,0102 = 0,012
(f) P( Z 4) = (4) = 0 e P( Z 4) = 1 (4) = 1 1 = 0 . Mas, pelo computador
P( Z 4) = 0,000031671242 , ou seja, na tabela a rea foi arredondada para zero.

Exemplo 12: As notas da disciplina de Direito Tributrio de uma determinada faculdade


tem distribuio segundo uma normal de mdia 6,4 e desvio padra 0,8. Os conceitos so
atribudos de acordo com a seguinte graduao:

Notas Conceito
0 X <5 D
5 X < 7,5 C
7,5 X < 9 B
9 X 10 A

Em uma classe de 80 alunos, qual o nmero esperado de conceitos A,B,C e D?

Soluo:

P(0 X < 5) = P(8 Z < 1,75) = (1,75) (8) = 0,0401 0 = 0,0401

P(5 X < 7,5) = (1,38) (1,75) = 0,9162 0,0401 = 0,8761

P(7,5 X < 9) = (3,25) (1,38) = 0,9994 0,9162 = 0,0832

P(9 X 10) = (4,5) (3,25) = 1 0,9994 = 0,0006

Notas Probabilidade Probabilidade N


0 X <5 0,0401 3
5 X < 7,5 0,8761 70
7,5 X < 9 0,0832 7
9 X 10 0,0006 0

17
Tabela da Normal Padro Inversa: 1 : fornece as coordenadas tais que z = 1 ( ) ,
ou seja:

P( Z z ) = (reas unilaterais superiores)

P(| Z | z ) = 2 (reas bilaterais)

Exemplo 13: Para uma normal padro, obtenha z tal que :

(a) P( Z z ) = 0,9750 (b) P( z Z z ) = 0,90

Soluo:

(a) z = 1,96

18
Tambm poder utilizar a tabela da normal inversa, com a rea unilateral de 0,025, como
mostra a figura abaixo:

(b) z=1,6445.

19
2 ANLISE BIDIMENSIONAL

2.1 - Vetores aleatrios bidimensionais

Definio 1 ( Funo massa de probabilidade conjunta) :

(
f ( x, y ) = P X = xI Y = y , ) x X e y Y

Nota: f ( x, y ) a probabilidade conjunta (simultnea) do evento [ X = xI Y = y ] .

Propriedades:

(1) 0 f ( x, y ) 1 , x, y

(2) x y
f ( x, y ) = y x f ( x, y ) = 1

Exemplo 1: suponha que se esteja interessado em estudar a composio de famlias com 3


crianas. Defina:

X nmero de meninos

Y = 1, se a primeira criana menino


= 0, se a primeira criana menina

1
P( H ) = P( M ) =
2

1 1 1 1
( ) ( )
f (0,0) = P X = 0I Y = 0 = P M I M I M = P( M ) P ( M ) P ( M ) = =
2 2 2 8

(
f (0,1) = P X = 0I Y = 1 = P() = 0 )
2
( ) (
f (1,0) = P X = 1I Y = 0 = P M I H I M + P M I M I H = ) ( ) 8

20
1
( )
f (1,1) = P X = 1I Y = 1 = P H I M I M = ( ) 8
1
(
f (2,0) = P X = 2I Y = 0 = P M I H I H = ) ( ) 8

2
( )
f (2,1) = P X = 2I Y = 1 = P H I H I M + P H I M I H = ( ) ( ) 8

(
f (3,0) = P X = 3I Y = 0 = P() = 0 )
1
( )
f (3,1) = P X = 3I Y = 1 = P H I H I H = ( ) 8

Y
X 0 1 2 3
0 1/8 2/8 1/8 0 1/2
1 0 1/8 2/8 1/8 1/2
1/8 3/8 3/8 1/8 1

Definio 2 (Funo massa de probabilidade marginal):

f X ( x ) = P ( X = x ) = f ( x, y ) , x X
y

f Y ( y ) = P(Y = y ) = f ( x, y ) , y Y
x

Exemplo 2: no Exemplo 1,

x 0 1 2 3
f X (x) 1/8 3/8 3/8 1/8 1

X tem distribuio binomial(n=3,p=0,5)

y 0 1
f Y ( y) 1/2 1/2 1

Y binomial(n=1,p=0,5)

21
Definio 3 (Funo massa de probabilidade condicional):

f ( x | y ) = P( X = x | Y = y ) =
(
P X = xI Y = y )= f ( x, y )
, f Y ( y) > 0
P (Y = y ) f Y ( y)

f ( y | x) = P(Y = y | X = x ) =
(
P X = xI Y = y )= f ( x, y )
, f X ( x) > 0
P ( X = x) f X ( x)

Exemplo 3:

X nmero de acidentes

Y = 1, se for motocicleta
2, se for automvel
3, se for caminho ou nibus

Y
X 1 2 3 4 5
1 2/48 4/48 2/48 2/48 6/48 16/48
2 1/48 2/48 1/48 1/48 6/48 11/48
3 3/48 6/48 3/48 3/48 6/48 21/48
6/48 12/48 6/48 6/48 18/48 1

distribuies marginais
y 1 2 3
f Y ( y) 16/48 11/48 21/48 1

x 1 3 3 4 5
f X ( x) 6/48 12/48 6/48 6/48 18/48 1

distribuio condicional de ( X | Y = 1)

x 1 2 3 4 5
f ( x | y = 1) 2/16 4/16 2/16 2/16 6/16 1

22
4 / 48
Por exemplo, f (2 | y = 1) = = 4 / 16
16 / 48

Definio 4 : as variveis aleatrias X e Y so ditas independentes se e somente se

( )
f ( x, y ) = P X = xI Y = y = P( X = x ) P(Y = y ) = f X ( x) f Y ( y ) , para quaisquer x, y

Exemplo 4: para o Exemplo 3 temos

2
f (1,1) =
48
f (1,1) = f X (1) f Y (1)
6 16 2
f X (1) f Y (1) = =
48 48 48
4
f (2,1) =
48
f (2,1) = f X (2) f Y (1)
12 16 4
f X (2) f Y (1) = =
48 48 48

1
f (1,2) =
48
f (1,2) f X (1) f Y (2) ,
6 11
f X (1) f Y (2) =
48 48

logo X e Y no so independentes.

Funes de vetores aleatrios discretos

Uma funo de um vetor aleatrio ( X , Y ) uma transformao Z = T ( X , Y ) . Por


exemplo, Z = X + Y , W = X Y .

Exemplo 5 : para a distribuio conjunta abaixo, obtenha a fmp de T = X + Y e de

W = X Y

Y
X 1 2 3 4 5
1 2/46 3/46 2/46 4/46 5/46 16/60
2 1/46 4/46 3/46 2/46 4/46 14/60
3 2/46 3/46 2/46 4/46 5/46 16/46
5/46 10/46 7/46 10/46 14/46 1

23
( X ,Y ) T = X +Y W = X Y

(1,1) 2 1

(1,2) 3 2

(1,3) 4 3

(2,1) 3 2

(2,2) 4 4

(2,3) 5 6

(3,1) 4 3

(3,2) 5 6

(3,3) 6 9

(4,1) 5 4

(4,2) 6 8

(4,3) 7 12

(5,1) 6 5

(5,2) 7 10

(5,3) 8 15

t 2 3 4 5 6 7 8

f T (t ) 2/46 4/46 8/46 10/46 9/46 8/46 5/46 1

Por exemplo,

[ ]
P(T = 4) = f T (4) = P ( X = 1 Y = 3)U ( X = 3 Y = 1)U ( X = 2 Y = 2) =
2 2 4 8
f (1,3) + f (3,1) + f (2,2) = + + =
46 46 46 46

24
w
1 2 3 4 5 6 8 9 10 12 15

f W (w) 2/46 4/46 4/46 8/46 5/46 6/46 2/46 2/46 4/46 4/46 5/46 1

Por exemplo,

1 3 4
[ ]
P(W = 2) = f W (2) = P ( X = 1 Y = 2)U ( X = 2 Y = 1) = f (1,2) + f (2,1) = + =
46 46 46

Resultados:

(a) A soma de duas v.as independentes com X ~ Binomial (n, p ) e


Y ~ Binomial (m, p ) tal que T = X + Y ~ Binomial (n + m, p ) .

(b) A soma de duas v.as independentes com X ~ Poisson( X ) e Y ~ Poisson(Y )


tal que T = X + Y ~ Poisson( X + Y ) .

(c) A soma de duas v.as independentes com X ~ N X , X2 ( ) (


e Y ~ N Y , Y2 ) tal
(
que T = X + Y ~ N X + Y , X2 + Y2 . )

Exemplo 6: suponha que um jogador lana uma moeda honesta quatro vezes e o outro
jogador lana outra moeda honesta cinco vezes. Qual a probabilidade de que no total dos
lanamentos dos jogadores ocorram:

(a) no mximo 3 caras?


(b) No mnimo 7 caras?
(c) Entre 4 (incluso) e 6 (incluso) caras?

Soluo:

Seja X denotando o numero de caras obtidas pelo primeiro jogador e Y pelo segundo.
Ento X binomial de parmetros n = 4 ; p = 0,5 e Y binomial de parmetros
m = 5 ; p = 0,5 . Uma que X e Y so v.as independentes, T=X+Y binomial de
parmetros n + m = 9 e p = 0,5 .

(a) P(T 3) = P (T = 0) + P (T = 1) + P(T = 2) + P(T = 3) = 0,2539


(b) P(T 7) = P (T = 7) + P(T = 8) + P (T = 9) = 0,08984
(c) P(4 T 6) = P (T = 4) + P(T = 5) + P(T = 6) = 0,65625

25
Exemplo 7: Em uma central telefnica, o nmero de chamadas que chegam no intervalo
(t 0 ; t1 ] Poisson de parmetro 1 , e o de chamadas no intervalo (t1 ; t 2 ] Poisson de
parmetro 2 . Sabendo-se ter havido n chamadas em (t 0 ; t 2 ] , qual a probabilidade de
que o nmero de chamadas em (t 0 ; t1 ] tenha sido x , 0 x n ?

Soluo:

X ~ Poisson(1 ) e Y ~ Poisson(2 ) . Como os dois intervalos so disjuntos, ento X e


Y so v.as independentes, e portanto T = X + Y ~ Poisson(1 + 2 ) . Segue que

P( X = x | T = n ) =
(
P [ X = x]I [T = n] ) = P([ X = x]I[Y = n x]) =
P (T = n ) P(T = n )
exp{1 } (1 ) exp{ 2 } ( 2 )
x n x


P( X = x ) P(Y = n x ) x! (n x)!
= = =
P (T = n ) exp{1 2 } (1 + 2 )
n

n!
x n x
1 2
= C
x
n

1 + 2 1 + 2

ou seja, a varivel aleatria condicionada [X | T = n] uma binomial de parmetros n e


1
p= . Agora suponha que (t 0 ; t1 ] = (0;6] horas, 1 = 40 e (t1 ; t 2 ] = (6;12]
1 + 2
horas, 2 = 500 . Alm disso, n = 580 e x = 60 . Ento,

60 520
40 500
P( X = 60 | T = 580) = C 580
60
= 0,00205
540 540

26
Exemplo 8: a distribuio dos pesos das pessoas que moram em um edifcio segue uma
normal de esperana = 70 kg e varincia 2 = 16 kg para homens, e = 55 kg
e varincia 2 = 9 kg para mulheres. Se um homem e uma mulher desse edifcio
entrarem no elevador vazio, qual a probabilidade de que o peso total dessas duas pessoas:

(a) exceda 130 kg


(b) esteja abaixo de 115 kg
(c) esteja entre 120 e 135

Soluo: denotemos X o peso dos homens e Y o peso das mulheres. Ento


(
T = X + Y ~ N T = 125; T2 = 25 . )
(a) P(T > 130) = P ( Z > 1) = 1 - 0,8413 = 0,1587
(b) P(T < 115) = P( Z < 2) = 0.0228
(c) P(120 < T < 135) = P(1 < Z < 2) = 0.9772 - 0.1587 = 0,8185

Definio 5: a Covarincia de duas variveis aleatrias definida como:

Cov( X , Y ) = E [( X EX ) (Y EY )] = E ( XY ) E ( X ) E (Y ) ,

onde , E ( XY ) = xy f ( x, y ) , E ( X ) = x f X ( x) , E (Y ) = y f Y ( y )
x y x y

Teorema 1: para duas variveis aleatrias independentes E ( XY ) = E ( X ) E (Y ) , e


portanto Cov( X , Y ) = 0 .

Definio 6: o coeficiente de correlao linear de Pearson para duas variveis aleatrias


definida como:

Cov( X , Y ) E ( XY ) E ( X ) E (Y )
( X ,Y ) = = ,
Var ( X ) Var (Y ) Var ( X ) Var (Y )

27
Observaes: Covarincia tem como unidade de medida o produto das unidades de X
e Y, e por isso de difcil interpretao. Por outro lado, a correlao uma medida
relativa (sem unidade), sendo mais fcil a interpretao.

Resultados:

(1) 1 ( X , Y ) 1 ;

(2) se Y e X tiverem uma relao linear perfeita diretamente proporcional ( Y = a + bX )


ento ( X , Y ) = 1

(3) se Y e X tiverem uma relao linear perfeita inversamente proporcional ( Y = a bX )


ento ( X , Y ) = 1

28
(4) se Y e X forem independentes ento ( X , Y ) = 0 . Contudo, a recproca no vale,
( X , Y ) = 0 no implica Y e X independentes.

Exemplo 9:

Y
X 0 1 2 3
0 0 0 0 1/8 1/8
1 0 0 3/8 0 3/8
2 0 3/8 0 0 3/8
3 1/8 0 0 0 1/8
1/8 3/8 3/8 1/8 1

E ( X ) = E (Y ) = 1,5 ;

Var ( X ) = Var (Y ) = 0,75 ; E ( XY ) = 1,5 , Cov( X , Y ) = 0,75

( X , Y ) = 1 . Note que ( X , Y ) = 1 era de se esperar, pois X = 3 Y .

Exemplo 10: lanamento de 2 dados honestos.

X representa o nmero da face do 1 dado

Y representa o nmero da face do 2 dado

29
x 1 2 3 4 5 6

f X (x) 1/6 1/6 1/6 1/6 1/6 1/6 1

y 1 2 3 4 5 6

f Y ( y) 1/6 1/6 1/6 1/6 1/6 1/6 1

Y
X 1 2 3 4 5 6
1 1/36 1/36 1/36 1/36 1/36 1/36 1/6
2 1/36 1/36 1/36 1/36 1/36 1/36 1/6
3 1/36 1/36 1/36 1/36 1/36 1/36 1/6
4 1/36 1/36 1/36 1/36 1/36 1/36 1/6
5 1/36 1/36 1/36 1/36 1/36 1/36 1/6
6 1/36 1/36 1/36 1/36 1/36 1/36 1/6
1/6 1/6 1/6 1/6 1/6 1/6 1

E ( X ) = E (Y ) = 3,5 ;

441
E ( XY ) = = 12,25 = E ( X ) E (Y ) Cov( X , Y ) = 0
36

Note que f ( x, y ) = f X ( x) f Y ( x) para qualquer par ( x, y ) , portanto, Cov( X , Y ) = 0 .

30
3 - AMOSTRAGEM E ESTIMAO DE PARMETROS

3.1 - Tipos de amostragem probabilstica:


* Simples
* Sistemtica
* Estratificada
* Por conglomerados

Aqui nos concentraremos na amostragem aleatria simples (aas). Uma aas pode ser
extrada de uma populao de acordo com os critrios:

(a) com reposio


(b) sem reposio.

Se a populao for infinita ento as retiradas com e sem reposio sero


equivalentes, isto , se a populao for infinita (ou ento muito grande), o fato de se
recolocar o elemento retirado de volta na populao no vai afetar em quase nada a
probabilidade de extrao do elemento seguinte. Se, no entanto, a populao for finita (e
pequena) ser necessrio fazer uma distino entre os dois procedimentos, pois na extrao
com reposio as diversas retiradas sero independentes, mas no processo sem reposio
haver dependncia entre as retiradas, isto , o fato de no recolocar o elemento retirado
afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposio
mais eficiente que a amostragem com reposio e reduz a variabilidade uma vez que no
possvel retirar elementos extremos mais do que uma vez.

(a) Com reposio

1
P(uma amostra de tamanho n )=
Nn
(b) Sem reposio

1
P(uma amostra de tamanho n ) = , desconsiderando a ordenao na amostra
C Nn

1
, considerando a ordenao na amostra
ANn

Exemplo 1: suponha que em um municpio existam 60 escolas de ensino fundamental da


rede municipal. Est-se interessado em avaliar o nmero de matrculas durante o ano. Para
tal, optou-se por uma amostragem aleatria simples sem reposio de tamanho 15.

31
Soluo:

Populao: escolas municipais de ensino fundamental

Unidade amostral: escolas municipais

Varivel de interesse: nmero de matrculas

N=60

n=15

1
P(uma escola qualquer ser escolhida no 1 sorteio)=
60

1
P(uma amostra qualquer)= 15
C 60

3.2 - Parmetros e Estatsticas

Definio 1: denomina-se amostra aleatria a n upla ( X 1 , X 2 ,L , X n ) de v.as com


mesma distribuio de probabilidade.

Exemplo 2: ( X 1 , X 2 ,L, X n ) com distribuio binomial de parmetros m e p .

Definio 2: um parmetro uma medida usada para descrever uma caracterstica


numrica da populao.

Exemplo 3: = 0,85 a proporo de pessoas com fator RH+

Exemplo 4: a funo-produo definida como Y = K Q B , sendo Y o valor do


produto e Q a quantidade produzida, K e B parmetros.

Definio 3: uma estatstica (ou estimador) uma caracterstica numrica da amostra, isto
, uma estatstica uma funo de ( X 1 , X 2 , L, X n ) .

Notao: T = f ( X 1 , X 2 ,.... X n )

32
n

X i
Exemplo 5: P = i =1
, onde X i = 1, se for RH+
n
= 0, se for RH-

Nota: uma vez que a estatstica funo de vas, ento tambm ser aleatria.

Definio 4: uma estimativa um valor particular assumido pelo estimador


t = f ( x1 , x2 ,....xn )

Observao: por conveno representamos a amostra observada (e as estimativas) por


letras minsculas.

25
Exemplo 6: numa amostra de 30 pessoas, 25 tem RH+. Assim, p = = 0,83 .
30

Notaes usuais:

Parmetro Estimador Estimativa



Mdia

k k

i =1
fi X i
i =1
f i xi
X = x=
n n
Varincia 2 2 2
k
2 k
2
f i X i n X f i x i n x
S 2 = i =1 s 2 = i =1
n 1 n 1
Desvio padro S s

Amplitude H h

Proporo P p

Correlao R r

33
3.3. Propriedades dos Estimadores:

(1) Um estimador dito no tendencioso ou no enviesado, se E (T ) = , onde um


parmetro populacional

Exemplo 7: a mdia de todas mdias amostrais possveis igual mdia populacional,



ou seja, E( X ) = .

k 2
fi X i 2
( )
Exemplo 8: E S 2 = 2 , mas E V 2 ( ) 2 , onde V 2 = i =1 X .
n

(2) Uma seqncia {Tn }n 1 de estimadores de dita consistente se:

lim n E (Tn ) = e lim n Var (Tn ) = 0

2


Exemplo 9: como E ( X ) = e lim n Var X = lim n = 0 , ento X
n
consistente.

(3) Se T e H so dois estimadores no tendenciosos de e Var (T ) < Var ( H ) ento


dizemos que T mais eficiente que H.

34
Exemplificao de quatro estimadores onde foram feitas 18 observaes

Teorema 3.3.1: Seja X v.a com esperana e varincia 2 , e X 1 , X 2 ,.... X n uma


n

i =1
Xi
amostra. Ento, para X = , tem-se :
n

(i) E ( X ) =
2 2 N n
(ii) Var ( X ) = se for com reposio e Var ( X ) = para o caso sem
n n N 1
reposio.


(iii) X o estimador de varincia mnima dentre os estimadores lineares no-
tendenciosos.

35
N n
Observao: o quociente dito fator de correo para populao finita. Note
N 1
2
que para N suficientemente grande, Var ( X ) prxima de .
n


n
i =1
Xi (1 )
Corolrio 3.3.1: para P= , tem-se que E (P) = , Var ( P) = se
n n

(1 ) N n
for com reposio e Var ( P) = se for sem reposio.
n N 1

Exemplo 10: seja uma populao de 5 elementos (2 pases da frica e 3 asiticos) cuja v.a.
X = taxa de crescimento anual tem a seguinte distribuio de probabilidade:

X 1 3 5 7
P(X=x) 1/5 1/5 2/5 1/5 1

Para uma amostra de tamanho n=2 , com reposio, construa a distribuio amostral de
X + X2
X = 1 .
2
Soluo: X 1 , X 2 so iid (independentes e identicamente distribudas) segundo a v.a X,
isto :

P ( X 1 = x) = P ( X 2 = x) = P ( X = x )
P ( X 1 = xI X 2 = y ) = P ( X 1 = x ) P ( X 2 = y )

EX 1 = EX 2 = = 4,2 ; Var ( X 1 ) = Var ( X 2 ) = 2 = 4,16

Como o processo com reposio ento existem 52 = 25 amostras possveis. De fato:

(1,1) (3,1) (5(1) ,5(1) ) (5( 2) ,5( 2) ) (7,1)


(1,3) (3,3) (5(1) ,5( 2) ) (5( 2 ) ,5(1) ) (7,3)
(1,7) (3,7) (5(1) ,1) (5( 2 ) ,3) (7,7)
(1, 5(1) ) (3, 5(1) ) (5(1) ,3) (5( 2 ) ,7) (7, 5(1) )
(1, 5( 2 ) ) (3, 5( 2 ) ) (5(1) ,7) (5( 2) ,1) (7, 5( 2) )

36
Distribuio de probabilidade conjunta de ( X 1 , X 2 )
X2 1 3 5 7
X1
1 1/25 1/25 2/25 1/25 1/5
3 1/25 1/25 2/25 1/25 1/5
5 2/25 2/25 4/25 2/25 2/5
7 1/25 1/25 2/25 1/25 1/5
1/5 1/5 2/5 1/5 1

Valores possveis de X :

Amostra
x
(1,1) 1
(1,3) (3,1) 2
(3,3) (1,5) (5,1) 3
(1,7) (7,1) (5,3) (3,5) 4
(5,5) (3,7) (7,3) 5
(7,5) (5,7) 6
(7,7) 7


Populao dos valores possveis de X : {1,2,3,4,5,6,7}

1 1 1
P( X = 1) = P ( X 1 = 1) P( X 2 = 1) = =
5 5 25


P( X = 3) = P( X 1 = 1I X 2 = 5) + P( X 1 = 5I X 2 = 1) + P ( X 1 = 3I X 2 = 3) =
2 2 1 5
= + + =
25 25 25 25


Distribuio de probabilidade de X :

x
1 2 3 4 5 6 7
1/25 2/25 5/25 6/25 6/25 4/25 1/25 1
P( X = x )

Exemplo 11: no Exemplo 10 verifique que vale o Teorema 3.3.1 .


1 2 1
E ( X ) = xP( X = x) = 1 + 2 + .... + 7 = 4,2
25 25 25

37
EX 1 = EX 2 = = 4,2

2

2
1 2 1
Var ( X ) = x P( X = x) E ( X ) = 12 + 22 + .... + 7 2 2 =
i 25 25 25
3.4.

4,16 2
= =
2 n

3.4 - Distribuies amostrais:

O conjunto de todas amostras de mesmo tamanho formam uma populao, que tem
uma distribuio de probabilidade referente estatstica T , a qual recebe o nome de
distribuio amostral da estatstica T .

Teorema 3.4.1: para uma amostra aleatria ( X 1 , X 2 ,L , X n ) de uma distribuio normal de



parmetros e , a estatstica X tem distribuio normal de mdia e desvio

padro .
n

Exemplo 12: Uma populao tem distribuio normal de mdia 800 e desvio padro 60.
Determine a probabilidade de uma amostra aleatria apresentar mdia amostral entre
781,4 e 818,6 quando: (a) n = 9 (b) n = 25

38


X E X
Soluo: a varivel Z = = X n tem distribuio normal padro.


Var X


781,4 800 818,6 800
P 781,4 X 818,6 = P 9 Z 9 =
(a) 60 60
(0,93) ( 0,93) = 0,8238 0,1762 = 0,6476



(b) P 781,4 X 818,6 = (1,55) ( 1,55) = 0,9394 0,0606 = 0,8788

3.5. Estimao por ponto e por intervalo

Estimao por ponto: a estimativa resultante da amostra.

Estimao por intervalo: a estimao por ponto no permite julgar a magnitude do erro
que estamos cometendo. Da surge a idia de construir os intervalos de confiana, que so
fundamentados na distribuio amostral do estimador.

P( I .C.) =

dito grau de confiana, que a probabilidade do parmetro pertencer ao intervalo

= 1 a probabilidade de no pertencer ao intervalo

Construo de intervalos de confiana: o teorema a seguir o alicerce dos Intervalos de


Confiana.

Teorema 3.4.2 (Teorema Central do Limite): Para uma amostra aleatria ( X 1 ,...., X n )
e um estimador Tn = f ( X 1 ,...., X n ) de mxima verossimilhana do parmetro , tal que
E (Tn ) = , tem-se:

39
Tn E (Tn ) }
n

Zn = N (0,1)
Var (Tn )

3.6. Intervalos de confiana

3.6.1. IC para a mdia populacional quando o desvio padro


conhecido

Pelo TCL,



X E X

P z tab z tab 1 P X z tab X + z tab 1 ,
n n
Var X

onde z tab tal que 2(1 ( z tab ) ) = .

Assim, o intervalo de confiana para , de grau = (1 ) 100% , dado por

40


IC = X , onde = z tab
dito erro de estimao (ou erro amostral).
n

Observao: note que o erro de estimao a semi-amplitude do I.C.

Exemplo 13: suponha que se esteja estudando a altura de pessoas numa certa populao.

Sabe-se que =15. A amostra de 100 indivduos resultou em x =170 . Construa
intervalos de confiana para a mdia populacional com:

(a) 1 =0,90 (b) 1 =0,95 (c) 1 =0,99

Soluo:

15 15
(a) = 2,4675 ; I.C= 170 1,645 ;170 + 1,645 = [167,54;172,46]
100 100

15 15
(b) = 2,94 ; I.C= 170 1,96 ;170 + 1,96 = [167,06;172,94]
100 100

15 15
(c) = 3,86625 ; I.C= 170 2,575 ;170 + 2,575 = [166,14;173,85]
100 100

41
Interpretao do Intervalo de Confiana: espera-se que (1 ) 100% dos
intervalos originados de amostras de mesmo tamanho contenham o parmetro .

Observaes:

(1) No se utiliza grau de confiana igual a 100%, pois neste caso o intervalo fica a
prpria reta real! De fato, para que P( z tab Z z tab ) = 1 , ento preciso que
z tab = + .

(2) Um grau de confiana igual a 0% resulta em um intervalo degenerado (que a prpria


estimativa por ponto!). De fato, para que P( z tab Z z tab ) = 0 , ento preciso que
z tab = 0 .

(3) No existe um valor ideal para o grau de confiana. Nunca se deve utilizar os
extremos de 0% e 100%. Os valores mais usuais so 0,99; 0,95 e 0,90, mas no h uma
justificativa formal para us-los, so apenas valores de referncia mais encontrados em
artigos e livros.

42
(4) O desvio padro influencia diretamente na amplitude do I.C., ou seja, se for
grande, ento o I.C. ser amplo. O grau de confiana tambm responsvel pela amplitude
do I.C. Mantendo fixado, se n aumentar ento a amplitude do I.C. ir diminuir, ou
seja, ficar mais preciso.

3.6.2. IC para a mdia populacional quando o desvio padro


desconhecido

A distribuio t-student:

Foi introduzida por William Gosset, que utilizou o pseudnimo um estudante.


Essa distribuio aparece quando substitumos o desvio padro pelo respectivo
estimador S . A t-student similar normal padro, isto , e simtrica em torno do zero e
tem a forma de um sino, sendo mais baixa (achatada) que a normal. Alm disso, a t-student
converge normal padro.

Notao: X ~ t (v ) , onde v > 0 o parmetro da distribuio.

Comparao entre a normal padro e a t-student

43
Em inferncia estatstica esse parmetro assume valores inteiros positivos e tem a
denominao de graus de liberdade. O conceito de graus de liberdade (GL) o nmero de
valores que poderemos atribuir de maneira arbitrria. Por exemplo, suponha que temos trs
parcelas, cujos valores devem ser no negativos e somarem 14:

4 + 7 + = 14

Ento, teremos a liberdade de atribuir apenas dois valores, pois o ltimo ficar
amarrado (determinado).

A tabela da t-student tal que se voc entrar com GL e a rea, voc obter a
coordenada. Para GL maior que 120, utiliza-se a normal padro.

44
Modelo de Tabela t-student


S
IC = X t tab , onde t tab tal que P (| T | t tab ) = , T ~ t (n 1)
n

Exemplo 14: de 1500 placas de memria fabricadas retirou-se uma amostra de 30


unidades, observando-se o tempo at a primeira falha. Obteve-se as seguintes estatsticas:

x = 800 h e s = 100 h. Construa um IC de 99% para a mdia da populao.

100 100
Soluo: IC = 800 2,7564 ;800 + 2,7564 = [749,68;850,31]
30 30

Observao: o desvio padro amostral S influencia diretamente na amplitude do I.C. Se


a variabilidade na amostra for alta, o I.C. ser mais amplo. Aumentando-se a amostra o
I.C. dever ficar mais preciso.

45
3.6.3. IC para a varincia populacional 2

A distribuio Qui-Quadrado: a distribuio origina-se da soma de quadrados de


distribuies normais. A densidade dessa distribuio assimtrica direita. O nome
QUI vem da letra grega .

Algumas distribuies Qui-Quadrado

Notao: X ~ Qui Quadrado(v) , onde v > 0 o parmetro da distribuio.

Assim como na t-student, em inferncia estatstica esse parmetro assume valores


inteiros positivos, e denomina-se graus de liberdade. A tabela da Qui-Quadrado tal
que se voc entrar com GL e a rea, voc ir obter a coordenada.

46
Modelo de Tabela Qui-Quadrado


(n 1) S 2 (n 1) S 2
O intervalo de confiana para a varincia : IC = , , onde
qsup q inf

P(qinf X q sup ) = 1 ; X ~ Qui Quadrado(n 1)

(n 1) S 2 (n 1) S 2
O intervalo de confiana para o desvio padro : IC = ,
qsup q inf

Exemplo 15: O setor de qualidade de uma indstria de parafusos deseja estimar a variao
dos comprimentos de parafusos produzidos. Obtenha intervalo de confiana de grau 95%
para . A amostra foi a seguinte: 12,2 12,4 12,1 12,0 12,7 12,4 14,0 13,7 13,9 14,1
13,9 13,7 13,5 12,2 12,5 13,6.

Soluo: x = 13,05625 s 2 = 0,634624 s = 0,796633

15 0,634624 15 0,634624
IC = ; = [0,58848;1,23295]
27,4884 6,2621

47
3.6.4. IC para a proporo populacional


P (1 P)
IC = P z tab , onde P a proporo amostral e z tab tal que
n

2(1 ( z tab ) ) = .

Exemplo 16: suponha a seguinte amostra sobre a inteno de voto em um candidato:

{1; 0; 1; 1; 1; 1; 0; 0; 1; 1; 0; 0; 0; 0; 0; 1; 0; 0; 1; 0}

1 a favor; 0 contra

Construa um IC de 98% para a proporo.

9
Soluo: p = = 0,45
20

0,45 0,55 0,45 0,55


IC = 0,45 2,325 ;0,45 + 2,325 = [0,1913;0,7086]
20 20

3.7. Dimensionamento de amostras

Estimao da mdia



Vimos que para a mdia populacional, I .C. = X , X + , onde


= z tab o erro de estimao absoluto. Isolando n nesta ltima equao obtemos
n
o tamanho da amostra:
2 2
populao infinita: n = ( z tab ) , z tab tal que 2(1 ( z tab ) ) =
2
n N
populao finita: m = .
N +n

48
Observaes:

(1) se for desconhecido ento utiliza-se algum valor em uma pesquisa semelhante que
j foi realizada, ou procede-se em uma pesquisa piloto (amostra inicial)

(2) O tamanho da amostra n e o erro de estimao tem relao inversa, como mostra
a figura:

Exemplo 17: deseja-se estimar a renda dos moradores do bairro da Gvea , no Rio de
Janeiro, sabendo-se que o desvio padro da renda de 300,00. Exige-se um erro absoluto
mximo de 20,00 e um grau de confiana de 95%. Qual deve ser o tamanho da amostra?

1,96 2 300 2
Soluo: n = = 864,36 865
20 2

5000 864,36
Supondo N=5000, m = = 736,96 737
5000 + 864,36

Estimao da proporo

r o erro de estimao relativo

2 (1 )
populao infinita: n = ( z tab ) , z tab tal que 2(1 ( z tab ) ) =
r2

49
n N
populao finita: m = .
N +n

Observaes:

(1) o erro de estimao para a proporo est em termos relativos, visto que uma
proporo uma medida relativa (sem unidade de medida).

(2) Se for desconhecida, pode-se utilizar alguma estimativa de uma pesquisa anterior.
Tambm pode-se assumir o maior valor possvel (1 ) = 0,25 . Desta forma,

(z tab )2 0,25
n= .
r2

1
(3) Alguns autores adotam z tab = 2 e (1 ) = 0,25 . Assim, n =
r2

Exemplo 18 : Uma amostra preliminar de 50 famlias foi selecionada de N=4000 famlias.


Constatou-se que na amostra 30 famlias possuam renda superior a 1000,00. Qual deve ser
o tamanho da amostra, com grau de confiana de 99% e erro de estimao mximo de 5%?

Soluo:

30
p= = 0,6 ;
50

= 0,99 z tab = 2,575

2
n=
(2,575) 0,6 0,4
= 636,54 637 ; m=
4000 636,54
= 549,15 550
2
0,05 4000 + 636,54

Se usarmos (1 ) = 0,5 0,5 = 0,25 , n =


(2,575)2 0,25 = 663,06 663 e m 569
0,05 2

50
4 TESTES DE HIPTESES

4.1. Definies

Hiptese conceitual: a hiptese formulada utilizando termos especficos na rea em


estudo.

Hiptese operacional: a formulao matemtica da hiptese conceitual

Exemplo 1: o biodiesel menos poluente que o diesel convencional

Como trabalhar matematicamente com essa hiptese? Iremos comparar as mdias de


emisses de partculas de xido de enxofre por cm 3 . Um grupo de veculos vai rodar com
biodiesel e outro com o convencional. Vamos denotar por B a mdia de emisso de
partculas por cm 3 usando biodiesel, e por C usando o diesel comum.

Hipteses : B = C e B < C

Hipteses estatsticas

Em inferncia estatstica uma hiptese uma suposio formulada a respeito dos


parmetros de uma distribuio de probabilidade de uma ou mais populaes. Esta hiptese
ser testada com base em resultados amostrais, sendo aceita ou rejeitada. Ela somente ser
rejeitada se o resultado da amostra for improvvel de ocorrer sob a suposio da hiptese
ser verdadeira.

Denominaremos por H 0 (hiptese nula) a hiptese a ser testada, e por H 1


(hiptese alternativa) a negao de H 0 . Atravs de um teste aceitaremos ou
rejeitaremos H 0 . A nossa deciso ter uma probabilidade de erro. Essa probabilidade de
erro controlada (escolhida pelo pesquisador). Um pesquisador nunca poder escrever
num artigo ou relatrio frases do tipo: o teste de hiptese mostrou que...., mas dever
apresentar qual a probabilidade de erro que ele admitiu no teste.

51
O quadro abaixo apresenta o que pode acontecer em um teste de hipteses:

Exemplo 2: suponha um julgamento num tribunal

As probabilidades desses erros so chamadas e respectivamente, ou seja:

= P(erro tipo I) = P(rejeitar H 0 | H 0 verdadeira)


= P(aceitar H 0 | H 0 verdadeira), que o grau de confiana
= P(erro tipo II) = P(aceitar H 0 | H 0 falsa)
1 = P(rejeitar H 0 | H 0 falsa)

Observao: neste curso nos concentraremos na probabilidade do erro tipo I.

Nvel de significncia de um teste: o valor de no teste, ou seja, a probabilidade de


rejeitar H 0 , dado que verdadeira. Os valores mais utilizados para so: 0,01; 0,05 e
0,10.

Observao: Fisher, um dos precursores da Teoria Estatstica, usou o valor de 5% para


facilitar o ensino da Teoria, e por isso ficou como um valor consagrado.

52
4.2 - Etapas de um teste de hipteses

(1) Formular as hipteses estatsticas: a hiptese nula a respeito de um parmetro deve


conter a igualdade e alternativa pode ser bilateral ou unilateral.

H0 : = 0 H1 : 0 (bilateral)
< 0 (unilateral esquerda)
> 0 (unilateral direita).

(2) Fixar o nvel de significncia do teste.

(3) Calcular a estatstica do teste.

(4) Tomada de deciso: rejeitar H 0 se a estatstica do teste estiver na regio crtica


(regio aonde a hiptese nula rejeitada), caso contrrio no se rejeita H 0 .

Observaes:

(3) Hipteses unilaterais levam a um teste mais rigoroso (menor regio de aceitao de
H 0 , quando comparados aos bilaterais.

53
4.3. Testes de hipteses

4.3.1.Teste de hipteses para a mdia de uma populao

(a) desvio padro populacional conhecido

H 0 : = 0


X 0
estatstica do teste: z c = n

H 1 bilateral ( H 1 : 0 ): rejeita H 0 se | z c | > z tab , tal que 2(1 ( z tab ) ) = .

H 1 unilateral direita ( H 1 : > 0 ): rejeita H 0 se z c > z tab , tal que 1 ( z tab ) = .

H 1 unilateral esquerda ( H 1 : < 0 ): rejeita H 0 se z c < z tab , tal que 1 ( z tab ) = .

54
55
Observaes:

(1) No rejeitar a hiptese nula significa no haver evidncia suficiente para duvidar de
sua validade, portanto, conclui-se que = 0 , ou seja, qualquer diferena observada
entre a mdia amostral e o valor sob H 0 ser considerada uma ocorrncia casual, e
no representa uma real diferena. Contudo, existe a possibilidade de ocorrer o erro tipo
II, ou seja, uma diferena que no foi reconhecida.

(2) Rejeitar a hiptese nula significa haver evidncia suficiente para duvidar da
validade de H 0 . A diferena entre a mdia amostral e o valor sob H 0 grande demais
para ser explicada apenas pelo erro amostral.

(3) se for grande, a estatstica z c no ser sensvel o bastante para detectar diferena

significante entre X e 0 .

(4) aumentando a amostra, o teste ficar mais sensvel para detectar diferenas
significativas.

(5) O teste unilateral mais rigoroso que o bilateral. Na figura abaixo, o valor tabelado do
(u ) (b)
teste unilateral menor que no bilateral. Se z tab < z c < z tab , ento o teste unilateral ir
rejeitar a hiptese nula, mas o bilateral no.

56
Exemplo 3: uma linha de produo fabrica parafusos cujo dimetro tem desvio padro

= 1,22716 . Tomou-se uma amostra de tamanho 20, cujas estatsticas foram x = 3,735 e
s = 3,8756 . Com = 0,05 , teste H 0 : = 5 contra

(a) H 1 : 5 (b) H 1 : < 5 (c) para H 1 : = 4 , calcule

(d) Em relao ao item (b), apresente um que levaria aceitao de H 0 .

Soluo:

3,735 5
zc = 20 = 4,61
1,22716

(a) z tab = 1,96 . Como | z c |> z tab , rejeitamos H 0 .

(b) z tab = 1,645 . Como z c < z tab , rejeitamos H 0 .



X 0
(c) para = 0,05 a regra de deciso : rejeita H 0 se z c = n < 1,645 .

X < K

X 5 K = 4,54998
20 < 1,645
1,22716


Assim, a regio crtica X < 4,54998 . Portanto,


X 1 4,54998 4
1 = P X < K H 1 = P n < 20 =
1,22716

= P(Z < 2 ) = (2) = 0,9772498

Logo, = 0,02275 .

(d) Temos que encontrar um - z tab tal que z c > z tab . Note que z tab = 4,65 leva-nos
aceitao! Mas, = P( Z z tab ) = 0,000001659 , que um absurdo!

57
(b) desvio padro populacional desconhecido

H 0 : = 0


X 0
Estatstica do teste: t c = n
S

H 1 bilateral: rejeita H 0 se | t c | > ttab , P(| T |> t tab ) = , T ~ t (n 1)

H 1 unilateral direita: rejeita H 0 se t c > t tab , P(T > t tab ) =

H 1 unilateral esquerda: rejeita H 0 se t c < - t tab , P(T > t tab ) =

58
Exemplo 4: em relao ao Exemplo 3, vamos supor que era desconhecido. Use
= 0,05 .
3,735 5
Soluo: t c = 20 = 1,4597
3,8756

(a) t tab = 2,093 . Como | t c |< t tab , no rejeitamos H 0 .


(b) t tab = 1,7291. Como t c > t tab , no rejeitamos H 0 .

3,8756
Nota: como CV = 100% = 103,76% elevado, o teste no foi sensvel o
3,735
bastante para detectar diferena significativa!

59
4.3.2. Teste de hipteses para a proporo de uma populao

H0 : = 0

P 0
Estatstica do teste: z c = n , sendo P a proporo amostral.
(1 )
0 0

H 1 bilateral( 0 ): rejeita H 0 se | z c | > z tab , tal que 2(1 ( z tab ) ) =

H 1 unilateral direita( > 0 ): rejeita H 0 se z c > z tab , tal que 1 ( z tab ) = .

H 1 unilateral esquerda( < 0 ): rejeita H 0 se z c < z tab , tal que 1 ( z tab ) = .

Exemplo 5: uma estao de TV afirma que 60% dos televisores estavam ligados no seu
programa especial de sbado. Uma rede concorrente deseja contestar essa afirmao, e
decide entrevistar 200 domiclios. Desses 200, 104 deram respostas afirmativas. Teste a
hipteses H 0 : = 0,6 e H 1 : < 0,6 , com : (a) = 0,01 (b) = 0,05 .

0,52 0,6
Soluo: z c = = 2,31
0,24
200

(a) z tab = 2,325 , ento no rejeitamos H 0 para 1% de significncia .

(b) z tab = 1,645 , logo rejeitamos H 0 para 5% .

60
4.3.3. Teste de hipteses para a varincia de uma populao

H 0 : 2 = 02 ;

S 2 (n 1)
Estatstica do teste: q c =
02

H 1 bilateral( 2 02 ): rejeita H 0 se 0 < q c < q inf ou q c > qsup ,


onde P( X qsup ) = , P( X qinf ) = 1 , X ~ Qui Quadrado(n 1)
2 2

H 1 unilateral direita( 2 > 02 ): rejeita H 0 se q c > q sup , onde P( X qsup ) =

H 1 unilateral esquerda( 2 < 02 ): rejeita H 0 se 0 < qc < qinf , onde


P( X q inf ) = 1

61
Exemplo 6: para o exemplo do dimetro dos parafusos, deseja-se testar H 0 : 2 = 0,65
contra H 1 : 2 0,65 . Use = 0,05 .

Soluo: n = 16 ; s 2 = 0,634624 ; s = 0,796633

15 0,634624
qc = = 14,645 . Como 6,262 < q c < 27,488 no rejeitamos H 0
0,65

4.3.4. Teste de hipteses para a igualdade de mdias de duas populaes


independentes

(a) desvios padres populacionais conhecidos

H 0 : X = Y

62


X Y
Estatstica do teste: z c = , n o tamanho da amostra para X e m para Y
2 2
X + Y

n m

H 1 bilateral( X Y ): rejeita H 0 se | z c | > z tab , tal que 2(1 ( z tab ) ) =

H 1 unilateral direita( X > Y ): rejeita H 0 se z c > z tab , tal que 1 ( z tab ) = .

H 1 unilateral esquerda( X < Y ): rejeita H 0 se z c < - z tab , tal que 1 ( z tab ) = .

Exemplo 8: Uma mquina automtica enche latas com base no peso lquido, com
variabilidade praticamente constante e independente dos ajustes da mdia, onde = 5 g.
Duas amostras retiradas em dois perodos de trabalho consecutivos, de quinze e dez
latas, respectivamente, resultaram pesos lquidos mdios de 188,9 e 184,6 g. Desconfia-se
que a regulagem da mquina quanto ao peso mdio possa ter sido modificada entre a
coleta das duas amostras. Qual a concluso ao nvel de significncia de 5%?

Soluo: H 0 : X = Y contra H 1 : X Y

188,9 184,6
zc = = 2,10656
1 1
5 +
15 10

Para teste bilateral, z tab = 1,96 , levando-nos rejeio de H 0 .

(b) desvios padres populacionais desconhecidos

H 0 : X = Y



(n 1) S X2 + (m 1) S Y2
Estatstica do teste: t c = ,
XY
S=
1 1 n+m2
S +
n m

63
H 1 bilateral ( X Y ): rejeita H 0 se | t c | > ttab , P(| T |> t tab ) = , T ~ t ( n + m 2)

H 1 unilateral direita ( X > Y ): rejeita H 0 se t c > t tab , P(T > t tab ) =

H 1 unilateral esquerda( X < Y ) : rejeita H 0 se t c < - t tab , P(T > t tab ) =

Exemplo 9: duas tcnicas de vendas so aplicadas por duas equipes de vendedores: a


tcnica A por 12 vendedores e a B por 15. No final de um ms obtiveram-se os seguintes
resultados:

Estatsticas A B
Mdia 68 76
Varincia 50 50,8
Amostra 12 15

Teste se a mdia do grupo B maior que a do A, usando = 0,05 .

Soluo: H 0 : B = A contra H1 : B > A .

14 50,8 + 11 50 76 68
s= = 7,1026 ; tc = = 2,908 ; t tab = 1,7081
25 1 1
7,1026 +
15 12
Como t c > t tab rejeitamos H 0 .

4.3.5. Teste de hipteses para a igualdade de mdias de populaes


pareadas

Quando se compara mdias de duas populaes pode ocorrer uma diferena


significativa devido a fatores externos no-controlveis. Um modo de contornar este
problema coletar observaes aos pares, de modo que os dois elementos de cada par
sejam o mais homogneos possvel, exceto naquilo que se quer comparar.

64
A amostra ser de pares (X1, Y1), (X2, Y2), ..., (Xn, Yn). A estatstica do teste
ser construda atravs da diferena D = X Y, que mede o efeito (diferena) entre os
dois tratamentos.

H0 : D = 0

D
Estatstica do teste: t c = n , onde D e S D so a mdia e o desvio padro
SD
amostrais, respectivamente.

H 1 bilateral( D 0 ): rejeita H 0 se | t c | > t tab , P(| T |> t tab ) = , T ~ t (n 1)

H 1 unilateral direita( D > 0 ): rejeita H 0 se t c > t tab , P(T > t tab ) =

H 1 unilateral esquerda( D < 0 ): rejeita H 0 se t c < - t tab , P(T > t tab ) =

Exemplo 11: cinco operadores so treinados em duas mquinas de diferentes


fabricantes, para verificar qual delas apresenta maior facilidade de aprendizagem. Mediu-
se o tempo (em minutos) que cada um dos operadores gastou na realizao de uma mesma
tarefa com cada um dos dois tipos de mquinas. Os resultados foram os seguintes:

operador Fabricante X Fabricante Y D D2


1 80 75 5 25
2 72 70 2 4
3 65 60 5 25
4 78 72 6 36
5 85 78 7 49
Total 380 355 25 139

Ao nvel de 10% possvel afirmar que a tarefa realizada na mquina X demora mais do
que na mquina Y?

Soluo: H 0 : X = Y contra H 1 : X > Y .

5
d = 5 e s D = = 1,8708 ; t c = 5 = 5,98 , t tab = 1,533 . Como t c > t tab ,
1,8708
rejeitamos H 0 .

65
4.3.6. Teste de hipteses para a igualdade de propores de populaes
independentes

H 0 : X = Y

PX PY
Estatstica do teste: z c = , PX , PY so as propores amostrais
PX (1 PX ) PY (1 PY )
+ )
n m

H 1 bilateral( X Y ): rejeita H 0 se | z c | > z tab , 2(1 ( z tab ) ) =

H 1 unilateral direita( X > Y ): rejeita H 0 se z c > z tab , (1 ( z tab )) =

H 1 unilateral esquerda(( X < Y )): rejeita H 0 se z c < - z tab , (1 ( z tab ) ) =


Exemplo 12: a matriz de uma empresa de embalagens quer comparar a proporo de itens
que so rejeitados pelo setor de qualidade em duas de suas filiais. As amostras resultaram
no seguinte: n = 200 ; p X = 0,05 e m = 210 ; pY = 0,052

0,05 0,052
zc = = 0,092
0,05 (1 0,05 ) 0,052(1 0,052)
+
200 210

Para teste unilateral esquerda, com = 0,05 , aceita-se H 0 , pois - z tab = 1,645 . Mas,
qual valor de levaria rejeio de H 0 ? Temos que encontrar um - z tab tal que
z c < z tab . Note que - z tab = 0,09 leva-nos rejeio. Mas,

= P( Z 0,09) = 0,4641 = 0,4641 , que um absurdo!

4.4. Consideraes sobre significncia estatstica

Um teste de hiptese leva-nos a uma deciso acerca da hiptese nula: rejeit-la ou


aceit-la, com uma probabilidade de cometer os erros tipo I e II, respectivamente. Mas,
alm de simplesmente decidir, os seguintes aspectos devem ser considerados:

66
(1) preciso um senso crtico ao se aplicar um teste de hipteses. claro que, dependendo
do nvel de significncia adotado, poderemos rejeitar ou aceitar H 0 . Num teste de
hipteses, o usurio pode estar movido por uma extrema vontade de rejeitar H 0 , sendo
assim, ele vai encontrar um valor de que atenda aos interesses dele, mesmo que o valor
seja um absurdo, por exemplo = 0,60 . Logo, devemos ser o mais imparcial possvel.

(2) A significncia prtica outro aspecto a ser considerado. Suponha que se esteja
fazendo um teste sobre o dimetro mdio, em centmetros, de eixos de tratores em uma
linha de montagem. As hipteses so: H 0 : = 10 H 1 : 10 , com = 0,05 .

Suponha que uma amostra de 2000 eixos resultou X = 10,01 e S = 0,2 . A estatstica do
10,01 10
teste resultou em t c = 2000 = 2,24 . Para = 0,05 , t tab = 1,96 , levando-nos
0,2
rejeio de H 0 . Mas, pensando nos aspectos prticos, o engenheiro responsvel pelo setor
considera que essa diferena de 0,01 cm irrelevante, no causar problemas para o trator.
Embora o teste acusou uma diferena estatisticamente significativa, essa diferena no tem
importncia prtica. Uma vez que o engenheiro afirma que essa diferena no relevante,
poderemos adotar um valor menos rigoroso para , por exemplo, =0,01, cujo valor
tabelado t tab = 2,575 , e assim no rejeitaramos H 0 .

(3) Pode acontecer o contrrio que em (2) acima. Por exemplo, suponha que se esteja
realizando um teste de hipteses sobre a receita (em milhes de reais) de um municpio:

H 0 : = 1030 H 1 : 1030 , com = 0,05 .


Dispondo-se de uma amostra de tamanho 15, os resultados foram: X = 1130 e S = 720 .

1130 1030
A estatstica do teste resultou em t c = 15 = 0,54 . Para = 0,05 ,
720

t tab = 2,15 , levando-nos no rejeio de H 0 . Note que a diferena entre a mdia amostral

e o valor sob H 0 de 100 unidades monetrias, que considerada elevada, mas o teste no

foi sensvel o bastante para detectar. Isto ocorreu devido ao elevado coeficiente de variao

de 63,72%. Seria necessria uma amostra maior.

67
5 PROBABILIDADE E ESTATSTICA PELO COMPUTADOR

Testes de hipteses usando o computador

Quando realizamos testes de hipteses partimos de um valor fixado para ,


permitindo tomar uma deciso entre H 0 e H 1 . Quando utilizamos o computador, o
programa no ir utilizar um pr-fixado, ou seja, o programa deixa a critrio do
usurio fixar o nvel de significncia. O computador calcula o valor-p ( ou significncia
amostral) . De posse do valor-p comparamos com , utilizando a seguinte regra de
deciso: se valor-p < ento rejeitamos H 0 . Valores pequenos do valor-p
evidenciam que a hiptese nula falsa . O conceito de pequeno incumbncia do usurio,
que decide qual utilizar. Contudo, h trs interpretaes freqentemente utilizadas em
trabalhos de pesquisa:

Significativa, quando p for menor que 0,05

Muito significativa, quando p for menor que 0,01;

Altamente significativa, quando p for menor que 0,001;

68
H diversos softwares estatsticos: SPSS, SAS, MINITAB, R, BIOESTAT e
outros. O software R um programa mais avanado, mas de domnio pblico e pode ser
obtido gratuitamente no site R-Project. Outra opo o Matlab, que possui mdulos de
Estatstica, e tambm o Scilab, similar ao Matlab. O Scilab gratuito.

Trabalharemos com o SPSS (Statistical Package for Social Sciences). O SPSS


originalmente foi planejado para utilizao em cincias sociais. Posteriormente foi
amplamente difundido e foi sendo adotado por diversas reas cientficas, devido expanso
de recursos que lhe foi incorporada. A UFRGS possui licena para o SPSS, estando
disponvel nas suas Faculdades e Institutos. Atualmente o nome do programa SPSS
passou a se chamar PASW.

A entrada de dados no SPSS do tipo planilha (similar ao Excel) de dados, ou seja,


as variveis so colocadas em colunas e as unidades amostrais em linhas.

O SPSS realiza testes de hipteses e intervalos de confiana para uma, duas ou mais
amostras (de populaes independentes e dependentes). A sada fornecida pelo SPSS
consta de dois mdulos:

Estatsticas descritivas: contm mdia amostral, desvio padro, erro padro da mdia,
tamanho da amostra.

69
Inferncia: contm estatstica do teste, graus de liberdade (df), significncia bilateral
(valor-p) e intervalo de confiana. Caso o usurio deseje um teste unilateral, basta dividir
o valor-p por 2 e comparar com .

Exemplo 1: teste a hiptese de que a receita de um municpio (em milhes) seja de 1229.

Receita: 1230 582 576 2093 2621 1045 1439 717 1838 1359

Para executar o teste pelo SPSS voc deve seguir os seguintes passos:

T-Test

Estatsticas para uma amostra

n mdia
Desvio Erro padro da
padro mdia
RECEITA 10 1350,0000 675,8246 213,7145

Teste t para uma amostra


Valor do
teste =
1229
t gl Signif. bilateral DiferenaIntervalo de
da mdia 95% de
em confiana
relao ao
para a
valor diferena
Limite Limite
inferior superior
RECEITA ,566 9 ,585 121,0000 -362,4558 604,4558

Atravs do quadro estatsticas para uma amostra obtemos que

675,8246
CV = 100 = 50% .
1350

70
O teste t resultou na estatstica t c =,566, cujo valor-p (sig) 0,585. Se fixarmos
= 0,05 no h evidncias para rejeitar H0: = 1229 . Note que embora a diferena entre a
mdia amostral e o valor sob H0 foi de 121, o teste no foi sensvel o bastante para
detectar esta diferena, isto porque o coeficiente de variao elevado.

Exemplo 2: teste a hiptese de que o dimetro mdio de parafusos seja de 57 mm

Dimetro: 56,5 56,6 56,6 56,7 56,7 56,8 56,8 56,8 56,8 56,9 56,9 56,9 56,9 56,9 56,9 56,9
56,9 56,9 56,9 57 57 57 57 57 57,1 57,1 57,1 57,1 57,2 57,2 57,3

T-Test

Estatsticas para uma amostra

n mdia Desvio Erro padro da


padro mdia
DIAMET 31 56,9161 0,1828 3,28E-02

Teste t para uma amostra


Valor do
teste =
57
t gl Signif. bilateral Diferena da Intervalo de
mdia em 95% de
relao ao confiana
valor para a
diferena
Limite Limite
inferior superior
DIAMET -2,555 30 ,0,016 -8,3871E-02 -,1741 6,392E-
03

0,1828
CV = 100 = 0,321%
56,9161

Se assumirmos = 0,01 ento no rejeitaremos a hiptese nula, pois valor-p = 0,016.

71
Exemplo 3: comparar duas marcas de pneus quanto aos quilmetros percorridos.

1 Marca : 34,00 38,00 31,00 35,00 36,00 37,00 32,00 32,00 31,00 34,00 35,00 35,00
36,00 34,00

2 Marca : 30,00 32,00 32,00 33,00 33,00 30,00 28,00 32,00 30,00 33,00 32,00 33,00
29,00 32,00 31,00

Para executar o teste pelo SPSS voc deve seguir os seguintes passos:
digitar os dados na planilha em duas colunas

Km Marca
34 1
38 1
31 1
35 1
36 1
37 1
32 1
32 1
31 1
34 1
35 1
35 1
36 1
34 1
30 2
32 2
32 2
33 2
33 2
30 2
28 2
32 2
30 2
33 2
32 2
33 2
29 2
32 2
31 2

72
O prximo passo executar os comandos:

T-Test

Estatsticas dos grupos


MARCA N Mdia Desvio Erro padro da
padro mdia
KM 1,00 14 34,2857 2,1636 ,5783
2,00 15 31,3333 1,5887 ,4102

Teste t para amostras independentes


Teste t
para
igualdade
mdias
Sig. t glSig.bilateral Diferenas Erro padro da
entre mdias diferena

KM ,326 4,209 27 0,0002 2,9524 ,7014

A estatstica do teste t c = 4,209, cujo valor-p=0. Se assumirmos = 0,01 ento


rejeitaremos a hiptese de igualdade de mdias.

Exemplo 4: um grupo de cobaias submetido uma determinada dieta e observa-se o peso


inicial e final aps um perodo de tempo. Queremos testar se houve aumento significativo
no peso mdio.

Peso no incio: 635,00 704,00 662,00 560,00 603,00 745,00 698,00 575,00 633,00 669,00

Peso no final: 640,00 712,00 681,00 558,00 610,00 740,00 707,00 585,00 635,00 682,00

Os dados devem ser colocados em duas colunas:

73
Peso inicial Peso final
635 640
704 712
662 681
560 558
603 610
745 740
698 707
575 585
633 635
669 682

Aqui, como as amostras so dependentes, o caminho o seguinte:

T-Test

Estatsticas para as amostras pareadas


Mdia n Desvio Erro
padro padro da
mdia
PESO_1 648,4000 10 58,8524 18,6107
PESO_2 655,0000 10 59,2002 18,7208

Teste t para amostras pareadas


Diferena t glSignif
dos pares bilateral
Mdia Desvio Erro
padro padro
da mdia

PESO_1 - -6,6000 7,0427 2,2271 -2,963 9 ,016


PESO_2

A Estatstica do teste t c = 2,963 , cujo valor-p 0,016. Para = 0,018


rejeitaremos a hiptese de igualdade entre os pesos inicial e final.

74
6 PLANEJAMENTO DE EXPERIMENTOS

A origem dos modelos de planejamento de experimentos vem da experimentao


agrcola, mas as aplicaes atuais estendem-se s mais diversas reas: Biologia, Economia,
Engenharia, etc.

Definio: fator (ou tratamento) uma varivel que est sendo atribuda (ou controlada)
durante o experimento, pode ser qualitativa ou quantitativa.

Exemplo 1: tipo de rao para animais


tcnicas de vendas

Definio: varivel dependente (ou varivel-resposta) mede o efeito do fator nas


unidades experimentais

Exemplo 2: ganho de pesos em animais.


montantes de vendas

Definio: casualizao o processo de designar aleatoriamente os tratamentos s


unidades experimentais.

Exemplo 3: plantas so designadas aleatoriamente entre 3 tipos de adubos

Unidades experimentais: { u1 , u 2 , u 3 , u 4 , u 5 , u 6 , u 7 , u 8 , u 9 , u10 , u11 , u12 }

Adubo A Adubo B Adubo C


u11 u9 u4
u5 u7 u6
u12 u1 u10
u8 u3 u2

75
Classificao dos delineamentos experimentais

1 - Quanto ao nmero de fatores: unifatoriais e fatoriais.

2 - Quanto ao nmero de variveis-respostas: univariados e multivariados

Delineamentos completamente casualizados

Matriz de observaes
Tratamentos
1 2 .......................... k
y1,1 y 2,1 y k ,1
y1, 2 y 2, 2 y k ,2

y1,n1
y 2,n 2 y k ,nk
Total T1 T2 Tk
Mdia T1 y = T2 .......................... Tk
y1 = 2 yk =
n1 n2 nk

k
n = ni
i =1

ni o nmero de observaes no i-simo tratamento

k o nmero de tratamentos

yi , j a j-sima observao da varivel-resposta no i-simo nvel do fator

O modelo matemtico

a mdia geral

76
i a mdia do i-simo tratamento

i , j o erro aleatrio

Suposio para o erro aleatrio: i , j ~ N (0, 2 ) para todo i, j .

k ni

^
y i, j

Estimativa para yi , j : y i , j = y + y i , y = i =1 j =1
.
n

Anlise de varincia: decomposio da variabilidade total em duas fontes de variao,


uma devida aos tratamentos e outra componente aleatria.

Objetivo da anlise de varincia: testar as hipteses

H 0 : 1 = 2 = L = k contra H 1 : i j , para algum par (i,j),

ou seja, se em mdia os tratamentos diferem.

Suposio para a anlise de varincia: as varincias populacionais dos grupos


devem ser iguais.

Tabela de anlise de varincia

Fonte de G.L Soma de Quadrado Estatstica F


variao Quadrados mdio
Entre k-1 SQE QME QME
tratamentos F=
QMD
Dentro dos n-k SQD QMD
tratamentos
Total n-1 SQT QMT

77
2
k ni

k ni
Soma de quadrados total: SQT= y i , j y = yi2, j C
i =1 j =1 i =1 j =1

k ni


y
i =1 j =1
i, j

2

sendo y= a mdia global amostral e C = n y .


n

2
k k
T
Soma de quadrados entre: SQE= ni yi y = i C
i =1 i =1 ni

n 2

i k
Soma de quadrados dentro: SQD= y i , j y j =SQT SQE
i =1 j =1

SQT SQE SQD


QMT = , QME = , QMD =
n 1 k 1 nk

A Distribuio de Fisher-Snedecor

Uma v.a. contnua com distribuio de Fisher-Snedecor tem como argumentos


os parmetros v1 = G.L. no numerador e v2 = G.L no denominador.

Notao: F (n 1; m 1)

Existem tabelas da distribuio Fisher-Snedecor para reas unilaterais de 1%, 5% e 10%.

78
Regra de deciso na anlise de varincia: a estatstica F tem distribuio de
Fisher-Snedecor, de argumentos k-1 e n-k. Para um nvel de significncia fixado, rejeita-
se Ho se F > Ftab . Equivalentemente, pode-se calcular a significncia amostral (valor-
p). Usando o valor-p, rejeita-se Ho se valor-p < .

Comparaes mltiplas de mdias

Quando a estatstica F resultar significante, ento preciso verificar quais pares de


mdias de tratamentos diferem entre si. As comparaes levam em conta a distncia

d i, j = yi y j . H diversos tipos de comparaes: LSD, Tukey, Scheff, Dunnett,

Bonferroni, Duncan e outras.

79
Exemplo 4: produo de milho em kg/100m2 segundo a variedade.

Variedade 1 Variedade 2 Variedade 3 Variedade 4


25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28

T1 = 115 , T2 = 135 , T3 = 130 , T4 = 155


y 1 = 23 ; y 2 = 27 ; y 3 = 26 ; y 4 = 31

535
y= = 26,75 , C = 14311,25
20

SQT= 25 2 + 26 2 + LLL + 28 2 14311,25 = 14587 14311,25 = 275,75

115 2 + 135 2 + 130 2 + 155 2


SQE= 14311,25 = 163,75
5

SQD= 275,75 163,75 = 112

Tabela de anlise de varincia


Fonte de G.L Soma de Quadrado Estatstica F
variao Quadrados mdio
Entre 3 163,75 54,58
Variedades F=7,8
Dentro das 16 112,00 7
Variedades
Total 19 275,75

Para = 0,05 Ftab = 3,239 , sendo assim, a estatstica F significativa.

No programa SPSS os dados devem ser colocados em coluna, como segue:

80
Variedade Produo
1,00 25,00
1,00 26,00
1,00 20,00
1,00 23,00
1,00 21,00
2,00 31,00
2,00 25,00
2,00 28,00
2,00 27,00
2,00 24,00
3,00 22,00
3,00 26,00
3,00 28,00
3,00 25,00
3,00 29,00
4,00 33,00
4,00 29,00
4,00 31,00
4,00 34,00
4,00 28,00

Para executar a anlise de varincia pelo SPSS o caminho deve ser:

Oneway

Descrio da amostra

PRODU
n MdiaDesvio Erro padro Intervalo de Min Max
padro confiana de 95%
para mdia
Limite inferior Limite superior
1,00 5 23,0000 2,5495 1,1402 19,8344 26,1656 20,00 26,00
2,00 5 27,0000 2,7386 1,2247 23,5996 30,4004 24,00 31,00
3,00 5 26,0000 2,7386 1,2247 22,5996 29,4004 22,00 29,00
4,00 5 31,0000 2,5495 1,1402 27,8344 34,1656 28,00 34,00
Total 20 26,7500 3,8096 ,8519 24,9670 28,5330 20,00 34,00

A tabela abaixo o resultado do teste de homogeneidade de varincias. Como valor


p=1, aceitamos a suposio de varincias iguais entre os grupos.

81
Tabela de anlse de varincia

PRODU
Fonte de Soma de gl Quadrado F Sig.
variao quadrados mdio
Entre 163,750 3 54,583 7,798 ,002
grupos
Dentro 112,000 16 7,000
dos
grupos
Total 275,750 19

A significncia da estatstica F foi 0,002. Se adotarmos = 0,05 ento


rejeitaremos a hiptese de igualdade de mdias das variedades de milho. O prximo
passo realizar as comparaes mltiplas. No mesmo cone da ANOVA escolha as
comparaes mltiplas desejadas.

Comparaes mltiplas
Varivel dependente: PRODU
Varied (i) Varied (j) Sig
Tukey 1 2 0,119 {1;2;3} e {2;4}
3 0,312
4 0,0001 * no formou
2 3 0,931 grupos disjuntos
4 0,119
3 4 0,039 *
Scheff 1 2 0,170
3 0,389 {1;2;3} e
4 0,002 * {2;3;4}
2 3 0,948
4 0,170 no formou
3 4 0,063 * grupos disjuntos
LSD 1 2 0,029 *
3 0,092 * {1} {2;3} e {4}
4 0,000 *
2 3 0,558 formou grupos
4 0,029 * disjuntos
3 4 0,009 *
Bonferroni 1 2 0,177 * {1;2;3} {2;3;4}
3 0,552 * e {4}
4 0,001 *
2 3 1,000 * no formou
4 0,177 * grupos disjuntos
3 4 0,052 *

* A diferena entre medias significante ao nvel de 10%.

82
Pela tabela acima vemos que as comparaes mltiplas LSD formaram trs
grupos disjuntos: {1}; {2;3} e {4}. J as comparaes Tukey, Scheff e Bonferroni no
formaram grupos disjuntos.

83
7 TESTE DE INDEPENDNCIA

Quando h interesse em investigar se existe ou no dependncia entre duas


variveis qualitativas (ou variveis quantitativas que foram categorizadas) o teste
adequado o qui-quadrado de independncia. As observaes devem estar em uma tabela
de contingncia, cujas entradas so ditas caselas.

X x1 x2 xc
Y
y1 f 1,1 f 1, 2 f 1,c f 1.

yr f r ,1 f 1, 2 f r ,c f r.

f .1 f .2 f .c n

Hipteses: H 0 : f i , j = f i. f . j , i j contra H 1 : f i , j f i. f . j , para algum i j

2
f f
f i. . j
r c i, j n
Estatstica do teste: q c = , onde
i =1 j =1 f i. f . j

n

qc tem distribuio qui-quadrado com (r 1) (c 1) graus de liberdade

Regra de deciso: rejeitamos H 0 se q c > qtab , onde qtab o valor obtido na tabela da qui-
quadrado tal que a rea superior de qtab .

84
Exemplo 1: quer-se verificar se existe alguma associao entre tipo de cooperativa (X) e
estado (Y).

Y
X Consumidor produtor escola outros
So Paulo 214 237 78 119 648
Paran 51 102 126 22 301
Rio Grande Sul 111 304 139 48 602
376 643 343 189 1551

Soluo:

(i, j ) f i, j f. j f i. ei , j = ( f i . f . j ) / n ( f i , j ei , j )^ 2 / ei , j
1,1 214 648 376 157,0909 20,61637205
1,2 237 648 643 268,6422 3,726990087
1,3 78 648 343 143,3037 29,75897145
1,4 119 648 189 78,96325 20,29984074
2,1 51 301 376 72,9697 6,614630525
2,2 102 301 643 124,7859 4,16071915
2,3 126 301 343 66,56544 53,06757739
2,4 22 301 189 36,67892 5,874508243
3,1 111 602 376 145,9394 8,36485075
3,2 304 602 643 249,5719 11,87000373
3,3 139 602 343 133,1309 0,258741848
3,4 48 602 189 73,35783 8,765522313
Total 1551 xxxxx xxxx 1551 173,3787283

85
2 2
648 376 602 189
214 48
1551 1551
qc = +L+ = 173,3787283
648 376 602 189
1551 1551

Para = 0,05 e G.L=6, qtab = 12,592 , logo rejeitamos H 0 . Visualizando a tabela de


contingncia acima vemos que em SP h concentrao de cooperativas consumidor e
produtor, e no RS cooperativas produtor.

Os passos para executar o teste qui-quadrado pelo SPSS so:

A entrada de dados deve ser como segue:

X Y freq
1,00 1,00 214,00
1,00 2,00 51,00
1,00 3,00 111,00
2,00 1,00 237,00
2,00 2,00 102,00
2,00 3,00 304,00
3,00 1,00 78,00
3,00 2,00 126,00
3,00 3,00 139,00
4,00 1,00 119,00
4,00 2,00 22,00
4,00 3,00 48,00

Cruzamento Y * X
Frequencias
X Total
1,00 2,00 3,00 4,00

Y 1,00 214 237 78 119 648


2,00 51 102 126 22 301
3,00 111 304 139 48 602
Total 376 643 343 189 1551

86
Teste qui-quadrado
valor GL Sig
Qui-quadrado 173,379 6 8,63E-35
de Pearson

O valor da estatstica do teste 173,379 (prxima quela que calculamos anteriormente)


cuja significncia (valor p) 8,63E-35, altamente significativa.

Qui-Quadrado em tabelas 2 2

Y
X x1 x2
y1 a b a+b

y2 c d c+d

a+c b+d n

Qui-quadrado de Yates:

2
n
n ad bc
2
qc =
(a + b) (a + c) (b + d ) (c + d )

qc tem distribuio qui-quadrado com 1 grau de liberdade.

Exemplo 2: quer-se verificar se existe alguma associao entre Vendedor (X) e resultado
da visita (Y).

Vendedor
Visita Bem
sucedida
Mal
sucedida

A 20 300 320
B 80 600 680
100 900 1000

2
1000
1000 20 600 80 300
2
qc = = 6,75296 e p=0,009359, que significativo.
100 900 320 680

87
8 CORRELAO E REGRESSO LINEAR

8.1. O COEFICIENTE DE CORRELAO LINEAR DE PEARSON

O diagrama de disperso nos fornece uma idia do tipo de relacionamento entre duas
variveis quantitativas X e Y. Uma forma de quantificar a relao entre duas variveis
quantitativas atravs do coeficiente de correlao linear de Pearson.

Exemplo 1:

Carga aplicada em uma mola, em kg (X): 1 2 3 4 5 6 7 8 9 10

Alongamento da mola, em cm (Y): 0,5 1,0 2,0 2,5 4,0 5,0 5,3 6,2 6,8 7,2

Definio: o coeficiente de correlao linear de Pearson para duas variveis definido


como:

R=
XYi i i nXY
2 2
X i2 n X Yi 2 n Y
i i

88
Exemplo 2: para o exemplo anterior,

Planilha do Excel

288,4 10 5,5 4,05


r= = 0,992 .
(385 10 (5,5) )(217,11 10 (4,05) )
2 2

O Excel tambm tem o comando que calcula diretamente a correlao linear: Corr( )

Resultados:

(1) 1 R 1

(2) se Y e X tiverem uma relao linear perfeita diretamente proporcional ( Y = a + bX )


ento R = 1

89
(3) se Y e X tiverem uma relao linear perfeita inversamente proporcional ( Y = a bX )
ento R = 1

(4) se Y e X forem independentes ento R = 0 . Contudo, a recproca no vale, R = 0


no implica Y e X independentes. Na figura, h uma relao perfeita Y = X 2 , contudo,
R = 0.

(5)

|R| Interpretao da correlao


0 a 0,40 Fraca
0,40 a 0,70 Regular
0,70 a 0,80 Boa
0,80 a 0,99 tima
1 Perfeita

90
Teste de hipteses para o coeficiente de correlao

H0 : = 0 contra H1 : 0

R n2
Estatstica do teste : t c =
1 R2

Regra de deciso: rejeita-se H 0 se t c > t tab , onde P(| T |> t tab ) = , T ~ t (n 2) .

0,992 10 2
Exemplo 3: para o exemplo anterior, t c = = 22,2263 e p = 1,7748 10 8 ,
2
1 (0,992)
que altamente significante.

8.2. O modelo linear simples

O modelo linear simples definido como Yi = 0 + 1 X i + i , i=1,.....,n., onde:

0 , 1 so os parmetros do modelo que devero ser estimados;


X dita varivel preditora;
Y dita varivel resposta (dependente).
o erro aleatrio

91
O mtodo que usaremos para estimar os parmetros do modelo o dos Mnimos
Quadrados. Neste mtodo, minimiza-se a soma dos quadrados das distncias d i (ver
figura). Os estimadores de 0 e 1 so, respectivamente:

n
X Y
i =1
i i nXY
b1 = 2
, b0 = Y b1 X .

n


i =1
X i
2
n X

2

n


i =1
Yi
2
n Y

Observao: da relao b1 = R segue que b1 e R tm o mesmo
2
n


X i =1
i
2
n X

sinal.

Exemplo 4: para o exemplo anterior,

288,4 10 5,5 4,05


b1 = 2
= 0,795758 ; b0 = 4,05 0,795758 5,5 = 0,326667
385 10 (5,5)

^
O modelo ajustado ficou Y = 0,326667 + 0,795758 X . Para x=7,5 kg, o valor estimado
para y ser 5,6415 cm.

92
8.3. Modelos no lineares

Modelo Exponencial: Y = exp{ x} , x R

Modelo Logaritmico: Y = + ln( x ) , x > 0

x
Modelo Hiperblico: Y = , x
x

exp{ x + }
Modelo Logstico: Y = , xR
1 + exp{ x + }

8.4 Regresso usando o computador

No SPSS as variveis devem estar em colunas:

Carga Alongam
1 0,5
2 1,0
3 2,0
4 2,5
5 4,0
6 5,0
7 5,3
8 6,2
9 6,8
10 7,2

Os passos para ajustar um modelo de regresso linear pelo SPSS so:

93
Resumo do Modelo
Modelo R R ao
quadrado
0,992 0,984

Preditor: Carga
Dependente: Alongamento
Modelo Coeficientes Erro padro Estatstica t signif
C = constante 0,287 223 -1,283 0,238
Carga 0,790 0,038 21,942 0,000

^
Para = 0,05 o modelo ajustado fica sendo y = 0,790 x , uma vez que a constante no
significativa.

9 REFERNCIAS BIBLIOGRFICAS

9.1. Costa Neto, P. L. Estatstica, Ed. Edgar Blcher.

9.2. Fonseca, J. S. e Martins, G. A. Curso de Estatstica, Ed. Atlas.

9.3. Mendelhall, W. Probabilidade e Estatstica (Vol. I), Ed. Campus.

9.4. Meyer, P. Probabilidade. Aplicaes Estatstica, Ed. Livros Tcnicos e Cientficos.

9.5. Morettin, P. A. e Bussab, W. O. Estatstica Bsica, Ed. Atual.

9.6. Soares, J. F. e outros. Introduo Estatstica, Ed. Livros Tcnicos e Cientficos.

9.7. Spiegel, M. R. Probabilidade e Estatstica, Ed. McGraw-Hill.

94