Escolar Documentos
Profissional Documentos
Cultura Documentos
Parametricos e Não Parametricos
Parametricos e Não Parametricos
TESTES PARAMETRICOS
1.1 CORRELAO
Dizemos que duas ou mais variveis expressam a relao de causa e efeito ou se elas
variam concomitantemente, so variveis consideradas correlacionadas.
O grau de relacionamento para dados amostrais dado pela seguinte expresso:
n
n n
n Xi Yi Xi Yi
i 1
i 1 i 1
r
2
n 2 n n 2 n 2
n X X n Y Y
i 1 i i 1 i i 1 i i 1 i
(Y)
6
9
8
10
5
7
8
4
6
2
65
XY
30
72
56
100
30
49
72
12
48
4
473
X2
25
64
49
100
36
49
81
9
64
4
481
Y2
36
81
64
100
25
49
64
16
36
4
475
10 .473 65 .65
10 .481 65
10 .475 65
505
0,911
585 525
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
ANLISE DE REGRESSO
Muitas vezes de interesse estudar-se um elemento em relao a dois ou mais
atributos ou variveis simultaneamente.
Nesses casos presume-se que pelo menos duas observaes so feitas sobre cada
elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada
uma das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores
(Xi; Yi). O objetivo visado quando se registra pares de valores (observaes) em uma
amostra, o estudo das relaes entre as variveis X e Y.
Para a anlise de regresso interessam principalmente os casos em que a variao de
um atributo sensivelmente dependente do outro atributo.
O problema consiste em estabelecer a funo matemtica que melhor exprime a
relao existente entre as duas variveis. Simbolicamente a relao expressa por uma
equao de regresso e graficamente por uma curva de regresso.
REGRESSO LINEAR SIMPLES
Modelo: Yi = + xi + i
Pressuposies:
a) A relao entre X e Y linear (os acrscimos em X produzem acrscimos proporcionais
em Y e a razo de crescimento constante).
b) Os valores de X so fixados arbitrariamente ( X no uma varivel aleatria ).
c) Y uma varivel aleatria que depende entre outras coisas dos valores de X.
d) i o erro aleatrio, portanto uma varivel aleatria com distribuio normal, com mdia
zero e varincia 2. [ i N (0, 2)]. i representa a variao de Y que no explicada pela
varivel independente X.
e) Os erros so considerados independentes.
Estimativas dos Parmetros e
As estimativas dos parmetros e dadas por a e b, sero obtidas a partir de
uma amostra de n pares de valores (xi, yi) que correspondem a n pontos no diagrama de
disperso. Exemplo:
(Y)
5
8
7
10
6
7
9
3
8
2
6
9
8
10
5
7
8
4
6
2
12
10
8
Y
(X)
Y previsto
4
2
0
0
10
Varivel X
Obtemos ento:
y i ax i b
ei yi yi
= yi-( axi + b)
ei
i 1
S = f(a, b)
= [y i - axi - b]2
i 1
i 1
z
b 2 yi axi b 1 0
z 2 y ax b x 0
i
a i i
yi ax i b 0
yi ax i b xi 0
yi a xi nb 0
x i yi a x i b xi 0
2
y a x
x y b x a x
i i
2
i
n x i yi x i y i
n x i2 x i
b y ax
e a partir da 1 equao
No exemplo:
(X)
(Y)
5
6
8
9
7
8
10
10
6
5
7
7
9
8
3
4
8
6
2
2
65
65
X.Y
30
72
56
100
30
49
72
12
48
4
473
X2
25
64
49
100
36
49
81
9
64
4
481
Y2
36
81
64
100
25
49
64
16
36
4
475
12
10
8
6
4
2
0
0
10
Varivel X
0,8632
10.481 652
585
65
65
0,8632.
0,8892
10
10
y i 0,8 6 3 2x i 0,88 9 2
EXERCCIOS
c) Para x = 4, ache
, o valor predito de y.
, o peso predito.
4. Os dados da tabela abaixo consistem nos pesos (em libras) de plstico descartado e
tamanhos de residncias.
Plstico (lb.)
0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05
Tam. da residncia 2
3
3
6
4
2
1
5
c) Ache o tamanho predito de uma residncia que descarta 2,50 lb. de plstico.
5. A tabela abaixo apresenta os pesos totais (em libras) de lixo descartado e tamanhos de
residncias.
Peso total
10,76 19,96 27,6 38,11 27,9 21,9 21,83 49,27 33,27 35,54
Tam da
2
3
3
6
4
2
1
5
6
4
Residncia
c) Ache o tamanho predito de uma residncia que descarta 20,0 lb. de lixo.
6. Os dados seguintes foram obtidos da altura (polegadas) e do peso (libras) de mulheres
nadadoras.
Altura
68
64
62
65
66
Peso
132 108 102 115 128
c) Estimar o peso de uma mulher, que possui 67 polegadas.
7. Os dados seguintes mostram o gasto com mdia (milhes de dlares) e as vendas de
caixas (milhes) para sete grandes marcas de refrigerantes.
Marca
Gastos com mdia (US$) Vendas de caixas
Coca-Cola
131,3
1929,2
Pepsi-Cola
92,4
1384,6
Coca-Cola Light
60,4
811,4
Sprite
55,7
541,5
Dr. Pepper
40,2
536,9
Mountain Dew
29,0
535,6
7- Up
11,6
219,5
Fonte: Superbrands 98, 20 de outubro de 1997
c) Estimar as vendas, sabendo que foi gasto US$ 80,0 com mdia.
8.
1
2
3
4
5
6
7
8
1
3
4
4
6
8
10
10
80
97
92
102
103
111
119
123
9
10
11
13
117
136
N m e r o de
c as os favrov e is
N m e r o de
c as os posvse is
d oe
ve
no
t
ha
h u ra
c
da
n afig u ra a
ba
ix o .
A, d e
noa
d
t a p o rA c
ha
ma
da
ve
e
n to
o mp le
c
me
nt
r d eA. ilu d
a
tra a
s
n ap a
rte
NEGAO
EXERCCIOS
1. Quais dos valores abaixo no podem ser probabilidades?
0;
N de cartes
243
85
52
46
Selecionado aleatoriamente uma caso de fraude nos casos resumidos na tabela, qual
a probabilidade de a fraude resultar de um carto falsificado? . R: 0,2.
IP(A)
7. Determine
Correto
Erro tipo I
H0 falsa
Erro tipo II
Correto
5%
1%
Tipo de teste
unilateral bilateral
+1,65 ou
1,96
-1,65
+2,33 ou
2,58
-2,33
H1:
0 (a )
0 (b)
( c)
0
4) Calcular:
Z
X 0
onde:
= mdia amostral
0 = valor da hiptese nula
= desvio padro da populao
n = tamanho da amostra
5) Concluses:
a) Se Z > z rejeita-se H0 (para um teste bicaudal)
b) Se Z > z rejeita-se H0 (para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H0 (para um teste unicaudal a esquerda).