Você está na página 1de 15

1.

TESTES PARAMETRICOS
1.1 CORRELAO
Dizemos que duas ou mais variveis expressam a relao de causa e efeito ou se elas
variam concomitantemente, so variveis consideradas correlacionadas.
O grau de relacionamento para dados amostrais dado pela seguinte expresso:
n
n n
n Xi Yi Xi Yi
i 1
i 1 i 1
r
2
n 2 n n 2 n 2
n X X n Y Y
i 1 i i 1 i i 1 i i 1 i

Onde: n o nmero de observaes;


r o coeficiente de correlao linear para uma amostra.
EXEMPLO 1: Encontre o coeficiente de correlao para os dados da tabela anterior.
(X)
5
8
7
10
6
7
9
3
8
2
65
r

(Y)
6
9
8
10
5
7
8
4
6
2
65

XY
30
72
56
100
30
49
72
12
48
4
473

X2
25
64
49
100
36
49
81
9
64
4
481

Y2
36
81
64
100
25
49
64
16
36
4
475

10 .473 65 .65
10 .481 65

10 .475 65

505
0,911
585 525

PROPRIEDADE DO COEFICIENTE DE CORRELAAO LINEAR r.


1. O valor de r est sempre entre 1 e 1.
2. O valor de r no varia se todos os valores de qualquer uma das variveis so
convertidos para uma escala diferente.
3. O valor de r no afetado pela escolha de x ou y.

4. r mede a intensidade, ou grau, de um relacionamento linear. No serve para medir a


intensidade de um relacionamento no-linear.

CORRELAO POSITIVA E CORRELAO NEGATIVA


Se as variveis x e y crescem no mesmo sentido, isto , quando x cresce, y tambm
cresce, diz-se que as duas variveis tm correlao positiva.
Ento, notas de matemtica e notas de estatstica dos alunos tem correlao
positiva, porque quando uma das variveis cresce, a outra , em mdia, tambm cresce.
Se as variveis x e y variam em sentido contrrio, isto , quando x cresce, em mdia
y decresce, diz-se que as duas variveis tm correlao negativa. Observe os dados da
Tabela abaixo:
Consumo individual de protenas de origem animal, em gramas, e coeficiente de
natalidade, em 14 pases, 1961.
Pas
Consumo
Coef. de
de
natalidade
protenas
Formosa
4,7
45,6
Malsia
7,5
39,7
ndia
8,7
33,0
Japo
9,7
27,0
Iugoslvia
11,2
25,9
Grcia
15,2
23,5
Itlia
15,2
23,4
Bulgria
16,8
22,2
Alemanha
37,3
20,0
Irlanda
46,7
19,1
Dinamarca
56,1
18,3
Austrlia
59,9
18,0
Estados Unidos
61,4
17,9
Sucia
62,6
15,0
Fonte: Castro(1961)

CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral
CE660ral

CE660ral

CE660ral

CE660ral

Eixo x = consumo de protenas


Eixo y= coeficiente de natalidade

ANLISE DE REGRESSO
Muitas vezes de interesse estudar-se um elemento em relao a dois ou mais
atributos ou variveis simultaneamente.
Nesses casos presume-se que pelo menos duas observaes so feitas sobre cada
elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada
uma das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores
(Xi; Yi). O objetivo visado quando se registra pares de valores (observaes) em uma
amostra, o estudo das relaes entre as variveis X e Y.
Para a anlise de regresso interessam principalmente os casos em que a variao de
um atributo sensivelmente dependente do outro atributo.
O problema consiste em estabelecer a funo matemtica que melhor exprime a
relao existente entre as duas variveis. Simbolicamente a relao expressa por uma
equao de regresso e graficamente por uma curva de regresso.
REGRESSO LINEAR SIMPLES
Modelo: Yi = + xi + i
Pressuposies:
a) A relao entre X e Y linear (os acrscimos em X produzem acrscimos proporcionais
em Y e a razo de crescimento constante).
b) Os valores de X so fixados arbitrariamente ( X no uma varivel aleatria ).
c) Y uma varivel aleatria que depende entre outras coisas dos valores de X.

d) i o erro aleatrio, portanto uma varivel aleatria com distribuio normal, com mdia
zero e varincia 2. [ i N (0, 2)]. i representa a variao de Y que no explicada pela
varivel independente X.
e) Os erros so considerados independentes.
Estimativas dos Parmetros e
As estimativas dos parmetros e dadas por a e b, sero obtidas a partir de
uma amostra de n pares de valores (xi, yi) que correspondem a n pontos no diagrama de
disperso. Exemplo:
(Y)

5
8
7
10
6
7
9
3
8
2

6
9
8
10
5
7
8
4
6
2

12
10
8
Y

(X)

Y previsto

4
2
0
0

10

Varivel X

Obtemos ento:

y i ax i b

Para cada par de valores (xi, yi) podemos estabelecer o desvio:

ei yi yi

= yi-( axi + b)

Mtodo dos Mnimos Quadrados


O mtodo dos mnimos quadrados consiste em adotar como estimativa dos
parmetros os valores que minimizem a soma dos quadrados dos desvios.

ei

i 1

S = f(a, b)

= [y i - axi - b]2
i 1

Essa soma, funo de a e de b, ter mnimo quando suas derivadas parciais em


relao a a e b forem nulas.
n

Para facilitar a escrita, considera-se

i 1

z
b 2 yi axi b 1 0

z 2 y ax b x 0
i
a i i

yi ax i b 0

yi ax i b xi 0
yi a xi nb 0

x i yi a x i b xi 0
2

y a x

x y b x a x
i i

2
i

Resolvendo-se esse sistema, obtemos as estimativa para o clculo de:

n x i yi x i y i
n x i2 x i

b y ax

e a partir da 1 equao

No exemplo:
(X)
(Y)
5
6
8
9
7
8
10
10
6
5
7
7
9
8
3
4
8
6
2
2
65
65

X.Y
30
72
56
100
30
49
72
12
48
4
473

X2
25
64
49
100
36
49
81
9
64
4
481

Y2
36
81
64
100
25
49
64
16
36
4
475

12
10

8
6
4
2
0
0

10

Varivel X

10 .473- 65.65 505

0,8632
10.481 652
585

65
65
0,8632.
0,8892
10
10

y i 0,8 6 3 2x i 0,88 9 2

EXERCCIOS

Nos Exerccios 1-10,


a) Determine o coeficiente de correlao.
b) Determine a equao da reta de regresso.
1. A tabela apresenta dados de amostra referentes ao nmero de horas de estudo fora de
classe para determinados alunos de um curso de estatstica, bem como os graus obtidos
em um exame aplicado no fim do curso.
Estudante
1
2
3
4
5
6
7
8
Horas de estudo 20 16 34 23 27 32 18 22
Grau no exame 64 61 84 70 88 92 72 77
c) Estimar o grau no exame obtido por um estudante que dedicou 30 horas fora
de classe.
2. A tabela mostrada relaciona os nmeros x de azulejos e os custos y (em dlares) de
sua ajustagem e colocao.
x
1 2 3 5 6
y
5 8 11 17 20

c) Para x = 4, ache

, o valor predito de y.

3. Os dados emparelhados que se seguem consistem no permetro torcico (em


polegadas) e dos pesos (em libras) de uma amostra de ursos machos.
X Trax 26 45
54
49
41
49
44 19
Y Peso 90 344 416 348 262 360 332 34

a) Para um urso com permetro torcico de 52 in, ache

, o peso predito.

4. Os dados da tabela abaixo consistem nos pesos (em libras) de plstico descartado e
tamanhos de residncias.
Plstico (lb.)
0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05
Tam. da residncia 2
3
3
6
4
2
1
5
c) Ache o tamanho predito de uma residncia que descarta 2,50 lb. de plstico.
5. A tabela abaixo apresenta os pesos totais (em libras) de lixo descartado e tamanhos de
residncias.
Peso total
10,76 19,96 27,6 38,11 27,9 21,9 21,83 49,27 33,27 35,54
Tam da
2
3
3
6
4
2
1
5
6
4
Residncia
c) Ache o tamanho predito de uma residncia que descarta 20,0 lb. de lixo.
6. Os dados seguintes foram obtidos da altura (polegadas) e do peso (libras) de mulheres
nadadoras.
Altura
68
64
62
65
66
Peso
132 108 102 115 128
c) Estimar o peso de uma mulher, que possui 67 polegadas.
7. Os dados seguintes mostram o gasto com mdia (milhes de dlares) e as vendas de
caixas (milhes) para sete grandes marcas de refrigerantes.
Marca
Gastos com mdia (US$) Vendas de caixas
Coca-Cola
131,3
1929,2
Pepsi-Cola
92,4
1384,6
Coca-Cola Light
60,4
811,4
Sprite
55,7
541,5
Dr. Pepper
40,2
536,9
Mountain Dew
29,0
535,6
7- Up
11,6
219,5
Fonte: Superbrands 98, 20 de outubro de 1997

c) Estimar as vendas, sabendo que foi gasto US$ 80,0 com mdia.
8.

Os dados a seguir so a mdia das notas x e salrios mensais y de estudantes que


obtiveram bacharelado em administrao com nfase em sistemas de informao.

Mdia das Notas


Salrio Mensal (US$)

2,6 3,4 3,6 3,2 3,5 2,9


2800 3100 3500 3000 3400 3100

c) Supondo que a nota de um estudante de bacharelado em administrao com


nfase em sistemas de informao seja 8,0. Estime ser seu salrio mensal.
9.Um gerente de vendas reuniu os seguintes dados considerando os anos de experincia e as
vendas anuais.
Vendedor
Anos de experincia Vendas anuais (US$ 1.000)

1
2
3
4
5
6
7
8

1
3
4
4
6
8
10
10

80
97
92
102
103
111
119
123

9
10

11
13

117
136

c) Estimar as vendas anuais, supondo que um vendedor tenha 9 anos de


experincia.
10 ados sobre os gastos com publicidade (US$ 1.000) e faturamento (US$ 1.000)
para o Four Seasons Restaurant so apresentados a seguir.
Gastos com publicidade Faturamento
1
19
2
32
4
44
6
40
10
52
14
53
20
54
c) Sabendo que os gastos com publicidade foi de US$ 7.000,00. Quanto espera ganhar o
Four Seasons Restaurant?
1.2 PROBABILIDADE
Encontramos na natureza dois tipos de fenmenos: determinsticos e aleatrios.
Os fenmenos determinsticos so aqueles em que os resultados so sempre os mesmos,
qualquer que seja o nmero de ocorrncias.
Nos fenmenos aleatrios, os resultados no sero previsveis, mesmo que haja um grande
nmero de repeties do mesmo fenmeno.
Nos experimentos aleatrios, mesmo que as condies iniciais sejam as mesmas, os
resultados finais de cada tentativa do experimento, sero diferentes e no previsveis, por isso,
conveniente dispormos de uma medida para o estudo de tais situaes. Esta medida a
probabilidade.
1.1. EXPERIMENTO ALEATRIO. ESPAO AMOSTRAL. EVENTO
Antes de passarmos definio de probabilidade, necessrio fixarmos os conceitos de
experimento, espao amostral e evento.
Um experimento aleatrio o processo de coleta de dados relativos a um fenmeno que
acusa variabilidade em seus resultados.
EXEMPLOS:
a) lanamento de uma moeda honesta;
b) lanamento de um dado;
c) determinao da vida til de um componente eletrnico;
Espao amostral o conjunto de todos os resultados possveis de um experimento. Vamos
denot-lo por .
EXEMPLOS:
1) No caso do lanamento de um dado, =

2) Uma lmpada ligada e observada at queimar anotando-se os tempos decorridos,


=
Quando o espao amostral consiste em um nmero finito ou infinito numervel de
eventos, chamado espao amostral discreto; e quando for todos os nmeros reais de
determinado intervalo, um espao amostral contnuo.
Um evento um subconjunto de um espao amostral
EXEMPLO: Nos exemplos anteriores 1 e 2. Qual seria um possvel evento para cada um
dos exemplos?
1.2. DEFINIES DE PROBABILIDADE
Seja A um evento de um experimento aleatrio, definimos a probabilidade de A,
denotada por P(A),
P(A)

N m e r o de
c as os favrov e is
N m e r o de
c as os posvse is

que a definio clssica de probabilidade.


EXEMPLO: Na jogada de um dado, qual a probabilidade de aparecer face 3 ou face 5?
Soluo:
EXEMPLO: Consideremos o experimento que consiste em lanar uma moeda 15 vezes.
Suponhamos que o nmero de caras obtido tenha sido 10. Determine a probabilidade do evento
cara:
Soluo:
1.3. OPERAES COM EVENTOS ALEATRIOS
Consideremos um espao amostral finito . Sejam A e B dois eventos de . As seguintes
operaes so definidas.
a) UNIO
O evento unio de A e B equivale ocorrncia de A, ou de B, ou de ambos. Contm os
elementos do espao amostral em que esto em pelo menos um dos dois conjuntos. Denota-se por
AB. A rea hachurada da figura abaixo ilustra a situao.

EXEMPLO: Se A o conjunto dos alunos de um Estabelecimento que freqentam o curso


de Contabilidade e B o conjunto de alunos do mesmo estabelecimento que fazem Cincia da
Computao, ento:
AB =
b) INTERSECO
O evento interseco de dois eventos A e B equivale ocorrncia de ambos. Contm
todos os pontos do espao amostral comuns a A e a B. Denota-se por AB. A interseco
ilustrada pela rea hachurada do diagrama abaixo.

EXEMPLO: Seja A o conjunto de alunos de uma Instituio que freqentam o 2 grau, e B


o conjunto dos que freqentam um curso facultativo de interpretao musical. A interseo AB
dada por:
AB =
c) EXCLUSO
Dois eventos A e B dizem-se mutuamente exclusivos ou mutuamente excludentes quando
a ocorrncia de um deles impossibilita a ocorrncia do outro. Os dois eventos no tm nenhum
elemento em comum. Exprime-se isto escrevendo AB = . O diagrama a seguir ilustra esta
situao.
EXEMPLO: Na jogada de um dado, seja A o evento aparece nmero par e B o evento
aparece nmero mpar. Ento AB =
d)
Ane
ga
o

d oe
ve
no
t

ha
h u ra
c
da

n afig u ra a
ba
ix o .

A, d e
noa
d
t a p o rA c
ha
ma
da

ve
e
n to

o mp le
c
me
nt

r d eA. ilu d
a
tra a
s

n ap a
rte

NEGAO

EXEMPLO: Se, na jogada de um dado, o evento A consiste no aparecimento de face par,


seu complementar dado por:
REGRAS BSICAS

Se A e B so dois eventos do espao amostral , ento valem as seguintes regras bsicas:


0 P(A) 1
P(A) = 0 o evento impossvel e P(A) = 1 o evento certo.
P() = 1
Se A e B so eventos mutuamente excludentes, AB = , ento: P(AB) = P(A) + P(B).

Se AB , ento: P(AB) = P(A) + P(B) P(AB).


P(A) = 1- P(A).
Se o vazio, ento P() =0.

EXERCCIO: Consideremos os alunos matriculados na disciplina de Estatstica. Temos


_____ homens com mais de 25 anos, _____ homens com menos de 25 anos, ____ mulheres com
mais de 25 anos, ____ mulheres com menos de 25 anos. Uma pessoa escolhida ao acaso dentre
os ____. Os seguintes eventos so definidos:
A: a pessoa tem mais de 25 anos;
C: a pessoa um homem;
B: a pessoa tem menos de 25 anos;
D: a pessoa uma mulher.
Calcular: P(BD) e P(AC).

EXERCCIOS
1. Quais dos valores abaixo no podem ser probabilidades?
0;

; 0,001; -0,2; 3/2; 2/3.

2. Um estudo de 500 vos da American Airlines selecionados aleatoriamente


mostrou que 430 chegaram no horrio (com base em dados do Ministrio dos
transportes). Qual a probabilidade de um vo da American Airlines chegar no
horrio?
3. Em uma pesquisa entre estudantes de uma faculdade, 1162 afirmaram que colaram
nos exames, enquanto 2468 afirmaram no colar. Selecionado aleatoriamente um
desses estudantes, determine a probabilidade de ele ou ela ter colado em um exame.
4. A MasterCard International efetuou um estudo de fraudes em cartes de crditos; os
resultados esto agrupados na tabela a seguir.
Tipo de fraude
Carto roubado
Carto falsificado
Pedidos por correio/telefone
Outros

N de cartes
243
85
52
46

Selecionado aleatoriamente uma caso de fraude nos casos resumidos na tabela, qual
a probabilidade de a fraude resultar de um carto falsificado? . R: 0,2.
IP(A)

5. Se IP (A)= 2/5, determine

6. Com base em dados do Centro Nacional de Estatstica de Sade dos EUA, a


probabilidade de uma criana ser menino 0,513. Determine a probabilidade de uma
criana ser menina.
IP(A)

7. Determine

, dado que IP (A)= 0,228.

8. Com base em dados do Centro Nacional de Examinadores Forenses, se escolhermos


aleatoriamente uma pessoa que se submete ao exame para exerccio da advocacia, a
probabilidade de obter algum que seja aprovado 0,57. Ache a probabilidade de
algum que seja reprovado.
9. Os pesquisadores esto preocupados com declnio do nvel de cooperao por parte dos
entrevistados em pesquisas. A tabela mostra o resultado de uma pesquisa feita com 359
pessoas.
Faixa etria
Respondem
No respondem
Total
18-21
73
11
84
22-29
255
20
275
Total
328
31
359
a) Qual probabilidade de obter algum que no queira responder? R: 0,086.

b) Qual probabilidade de obter algum na faixa etria 22-29? R: 0,766.


c) Determine a probabilidade de obter algum na faixa etria 18-21 ou algum que
recuse responder. R: 0,29.
d) Determine a probabilidade de obter algum na faixa etria 18-21 que no recuse
responder. R: 0,203.

1.3 TESTES DE HIPTESES


Nesta seo, vamos admitir um valor hipottico para o parmetro desconhecido - as
hipteses estatsticas - e, depois utilizar a informao da amostra para aceitar ou rejeitar
esse valor hipottico.
Por exemplo, com base na produtividade de uma hortalia cultivada em uma rea,
onde for usado um novo fertilizante, e em outra rea onde se utiliza o fertilizante
padro, temos de decidir se o novo fertilizante , ou no, melhor. A dificuldade aqui - e
da a necessidade de dados estatsticos - que a produtividade varia de planta para
planta.
Os testes de hipteses permitem-nos tomar decises em presena da variabilidade, ou
seja, verificar se estamos diante de uma diferena real (significativa) ou de uma
diferena devida simplesmente flutuao aleatria inerente ao processo.
Na realizao de um teste, so feitas duas hipteses: a hiptese nula (H0), que ser
testada, e a hiptese alternativa (H1), que ser aceita caso nosso teste indique a rejeio
da hiptese nula.
Exemplos :
1- Indique as hipteses nula e alternativa para cada uma das situaes:
a) Tubos galvanizados devem ter mdia de 2 polegadas para serem aceitveis.
b) Um fabricante de conservas deseja evitar excesso no enchimento de potes de 12
oz. De gelia.
2- Para cada um dos casos seguintes, decida se adequado um teste unilateral ou um
teste bilateral, trace a curva normal para ilustrar o teste.
a) H0: =10 , H1: 10, =0,02
b) H0: =0,037 , H1: >0,037, =0,05
c) H0: =3,2 , H1: <3,2, =0,01
Tipos de Erros
O esquema a seguir mostra os erros que podemos cometer:
Concluso do teste
H0 verdadeira
No rejeitar H0
Rejeitar H0

Correto
Erro tipo I

H0 falsa
Erro tipo II
Correto

Procedimento para se efetuar um teste de hiptese


1) Enunciar as hipteses H0 e H1;
2) Fixar-se o limite de erro e identificar-se a varivel do teste;
3) Determinar-se a regio crtica em funo da varivel tabelada;
4) Calcular o valor da varivel do teste, obtido na amostra;
5) Aceitar ou rejeitar a hiptese nula de acordo com a estimativa obtida no item 4,
em comparao com a regio crtica estabelecida no 3) passo.
Valores crticos de z em testes de hipteses
Nvel de significncia

5%
1%

Tipo de teste

unilateral bilateral
+1,65 ou
1,96
-1,65
+2,33 ou
2,58
-2,33

Teste para a mdia ( 2 conhecido)


1) Enunciar as hipteses:
H0: = 0

H1:

0 (a )

0 (b)
( c)
0

2) Fixar o nvel de significncia .


Admitindo-se que conhecemos a varincia populacional a varivel do teste ser a
distribuio Normal (Z)
3) Regio crtica

4) Calcular:
Z

X 0

onde:

= mdia amostral
0 = valor da hiptese nula
= desvio padro da populao
n = tamanho da amostra

5) Concluses:
a) Se Z > z rejeita-se H0 (para um teste bicaudal)
b) Se Z > z rejeita-se H0 (para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H0 (para um teste unicaudal a esquerda).