Você está na página 1de 34

Varivel Aleatria Discreta

Uma funo X, definida sobre o espao amostral e assumindo valores num conjunto
enumervel de pontos dita uma varivel aleatria discreta.
Uma varivel aleatria X do tipo discreto estar bem caracterizada se indicarmos os
possveis valores x1, x2, , xk que ela pode assumir e as respectivas probabilidades f(x1), f(x2), ,
f(xk), ou seja, se conhecemos a sua funo de probabilidade (x; f(x)), sendo f(x) = P(X = x). O
conjunto de pares ordenados (x; f(x)) a funo de probabilidade ou distribuio de probabilidade
da v.a. discreta X se:

i) f ( xi ) 0, para todo i ;

ii)

f (x ) 1
i

i 1

Exemplo 1: Se um experimento consiste em verificar o nmero de circuitos defeituosos num


sistema formado por quatro circuitos, a funo: X = nmero de circuitos defeituosos, define uma
varivel aleatria discreta, que pode assumir cinco valores possveis: 0, 1, 2, 3 ou 4.
Funo de distribuio acumulada F(x)
A funo de distribuio acumulada fornece a probabilidade de que a varivel em questo
esteja abaixo de um determinado valor. Em geral, ela representada por F x ou x e assim:
k

F xk P X X k P X x1 P X x2 P X xk P X xi .
i 1

Exemplo 2: Considere a varivel aleatria discreta X com a seguinte funo de probabilidade:


X
0
1
2
3
4
P[X = x] 0,1 0,3 0,4 0,1 0,1 1,0
Ento, sua funo distribuio acumulada :
X
0
1
F(x) 0,1 0,4

2
0,8

3
0,9

4
1,0

A distribuio de probabilidade da varivel aleatria X pode ser representada graficamente por:

Figura Grfico da funo distribuio acumulada da varivel aleatria X.

19

Exemplo 3: Se uma agncia vende 50% de seu estoque de carro importado com airbag,
determine a funo de probabilidade e a funo de distribuio acumulada para a varivel nmero
de carros com airbags entre os prximos 4 carros vendidos na agncia.
Resoluo: Seja A carro vendido tem airbag e S o carro vendido sem airbag. Como 50% dos
carros vendidos tem airbag, ento P(A) = P(S) = 0,5. O espao amostral possui 24 = 16 pontos. A
v.a. nmero de carros com airbag entre os 4 vendidos pode assumir os valores 0, 1, 2, 3, 4. O
numero de maneiras de se obter cada valor no espao amostral :
0 C40 1 maneira
1 C41 4 maneiras
2 C 42 6 maneiras
3 C43 4 maneiras
4 C 44 1 maneira

A funo de probabilidade pode ser apresentada pela frmula f ( x)

C4x
; x = 0,1,2,3,4
16

ou na tabela,
Tabela: Funo de probabilidade para a v.a. nmero de carros com airbag.
X

PX x
i

i 1

P[X = x]

1/16

4/16

6/16

4/16

1/16

Observa-se que a distribuio de probabilidade acima uma funo de probabilidade pois,


as condies (i) e (ii) foram satisfeitas, isto , todas as probabilidades so maiores que zero e, a
soma das probabilidades igual a um.
Exerccio: Representar graficamente a funo de probabilidade. Obter a funo de
distribuio acumulada e representar graficamente.

Varivel aleatria contnua


Uma varivel aleatria cujos valores so expressos em uma escala contnua dita uma
varivel aleatria contnua. Uma v.a. contnua tem probabilidade zero de assumir exatamente um
valor P(X = x ) = 0. As probabilidades so calculadas em intervalos como P(a < X < b ). Exemplos
de v.a. contnuas so, o peso de recm-nascidos, a altura dos alunos, a temperatura ambiente, o
dimetro de peas.
Funo de densidade de probabilidade de uma v.a. contnua:
A funo f(x) uma funo densidade de probabilidade (fdp) da v.a. X se:
20

i) f x 0, x ;
ii)

f x dx 1 .

Observao:
P a x b P a x b P X a P X b
b

P a x b P a x b f x dx

Funo de distribuio acumulada F(x) de uma v.a. contnua X.


x

F x P X x

f (t )dt .

Na funo de distribuio acumulada tem-se:


a) 0 F x 1 ;
b) se x1 x2 , ento, F x1 F x2 ;
c) P a X b F (b) F (a )
d) f ( x)

dF ( x)
F '( x)
dx

e) F 0
f) F 1
g) F(x) uma funo no decrescente.

Exemplo: Suponha que o erro na temperatura de reao (em C) para um experimento de


laboratrio seja a v.a. X com fdp dada por:

x2
, -1< x < 2
f ( x) 3
0,
caso contrario

a) Verifique a condio (ii)


b) Determine P(o < X < 1 ).
c) Determine F(x) e use-a para determinar P(o < X < 1 ). Esboce o grfico.

Esperana matemtica ou valor esperado de uma varivel aleatria


Em uma distribuio de probabilidade, ou funo de densidade de probabilidade, existem
valores numricos muito importantes, chamados de parmetros da distribuio, que so a
esperana matemtica, a varincia e o desvio padro.
A esperana matemtica da varivel aleatria X - E(X) - tambm chamada de valor
esperado, e representa a mdia (aritmtica) ou valor mdio da varivel.
21

Definio: Esperana matemtica:


Seja X uma varivel aleatria com distribuio de probabilidade f(x). A mdia ou
esperana matemtica de X dada por:

E ( X ) xf ( x ) xp( x) ,
x

se X for discreta; e

E(X )

xf ( x)dx ,

se X for contnua.

Propriedades da Esperana Matemtica


Supondo k uma constante e X e Y variveis aleatrias, podemos definir as seguintes propriedades
da esperana matemtica:
i) E(k) = k
ii) E(kX) = kE(X)
iii) E(X Y) = E(X) E(Y)
iv) E(X k) = E(X) k
v) Se X e Y so variveis aleatrias independentes, ento: E(XY) = E(X). E(Y)
Exemplos: 1) Para o exemplo do carro com airbag, calcular a esperana de X.

2) Em um jogo de azar, um homem recebe $5 se consegue trs caras ou trs coroas, quando trs
moedas so jogadas, e paga $3 quando uma ou duas caras so obtidas. Qual o seu ganho
esperado? O jogo pode ser considerado justo?

3) Seja X a varivel que denota a vida, em horas, de certo equipamento eletrnico, com fdp:

20.000
, x > 100

f (x) x 3
0
, caso contrrio
Qual o tempo mdio de durao do equipamento?

Varincia e desvio padro de uma varivel aleatria X.


A varincia da varivel aleatria X - Var(X) uma medida de disperso (ou
concentrao) de probabilidades em torno da mdia. O desvio padro - DP(X)- a raiz quadrada
da varincia.
Definio: Seja X uma varivel aleatria com distribuio de probabilidade f(x). A varincia
Var(X) = 2 de X :
i) Se X for discreta, com E ( X 2 ) x 2 f ( x) :
x

22

Var ( X ) 2 f ( x) ( x ) 2 E ( X 2 ) E ( X ) ; e
x

ii) Se X for contnua com E ( X 2 )

f ( x) :

Var ( X ) 2

2
2
( x ) f ( x)dx E ( X ) E ( X ) ,

Desvio padro DP ( X ) x Var ( X )

Exemplos:
1) Seja X a varivel aleatria discreta nmero de automveis usados com propsitos comerciais
durante um dia de trabalho. A distribuio de probabilidades para as empresas A e B esto nas
tabelas a seguir.

x
f(x)

Empresa A
1
2
0,3
0,4

3
0,3

x
f(x)

EmpresaB
0
1
0,2
0,1

2
0,3

3
0,3

4
0,1

Mostre que a varincia da distribuio de probabilidade da empresa B maior do que a da empresa


A. Represente graficamente as distribuies.

2) A demanda semanal por refrigerante, em milhares de litros, de uma loja de convenincia a


varivel aleatria contnua X, que tem como densidade de probabilidade:

2(x 1), 1<x <2


f (x)
, caso contrrio
0
Determine a mdia e a varincia de X.

23

Modelos probabilsticos para variveis aleatrias discretas


As observaes geradas por diferentes experimentos podem, por vezes, apresentar o
mesmo tipo geral de comportamento. As variveis aleatrias associadas a esses experimentos
podem ento ser descritas pela mesma distribuio de probabilidade, ou representadas por uma
nica frmula.
Para descrever o comportamento de muitas das variveis aleatrias, existem importantes
distribuies de probabilidade, tambm chamadas de modelos probabilsticos.
Alguns dos principais modelos probabilsticos discretos so:
- Distribuio uniforme discreta; - Distribuio de Bernoulli; - Distribuio Binomial
- Distribuio Poisson; - Distribuio Geomtrica; - Distribuio Hipergeomtrica;
- Distribuio Binomial negativa (Pascal); - Distribuio Polinomial.
1. Distribuio uniforme discreta
a mais simples das distribuies de probabilidades discretas. A varivel aleatria assume cada
um de seus valores com igual probabilidade.
Definio: Considere uma v.a. X cujos valores so x1, x2, ..., xk, todos tm igual probabilidade de
ocorrncia 1 . Ento, a v. a. X tem distribuio de probabilidade uniforme discreta dada por:
k
1
f (x; k) P X x ; x = x1, x2, ..., xk.
k
A notao f(x;k) indica que a distribuio depende do parmetro k.

Exemplos.
1) Quando selecionamos aleatoriamente uma lmpada, em uma caixa com 4 lmpadas, sendo uma
de 40, uma de 60, uma de 75 e uma de 100 watts, cada elemento do espao amostral ocorre com
probabilidade de 1 . Portanto, temos a varivel aleatria X com distribuio uniforme:
4
1
f (x; 4) P X x ; x = 40, 60, 75, 100.
4

2) No lanamento de um dado: f (x; 6) P X x


x
f (x)

6
1

6
1

6
1

1
6

6
1

6
1

16

Representao grfica: (exemplo)


Mdia e varincia da distribuio uniforme (parmetros caractersticos da distribuio):
1
k 1
E(X) x
ou E ( X )
e
k x
2
1
k 2 1
Var(X) (x )
ou
Var ( X )
k x
12

24

2. Distribuio de Bernoulli
Considere uma nica realizao de um experimento aleatrio, no qual se pode obter
sucesso, com probabilidade p ou fracasso com probabilidade q, sendo p + q = 1. Seja a v.a. X igual
ao nmero de sucessos em uma nica tentativa. Ento:
O, fracasso com P(X 0) q
X
1, sucesso com P(X 1) p
Nessas condies a v. a. X tem distribuio de Bernoulli e sua funo de probabilidade dada por:
P(X x) p x q1 x ; sendo q = 1- p.

Os parmetros da distribuio de Bernoulli so:


1

E ( X ) xP( X x) 0q 1 p E ( X ) p

Var ( X ) p (1 p ) pq

x 0

Exemplos de variveis de Bernoulli:


Em uma linha de montagem, uma pea selecionada pode ser defeituosa (sucesso) ou no
defeituosa (fracasso).
No lanamento de uma moeda, cara (sucesso) ou coroa (fracasso).
Uma semente avaliada pode germinar (sucesso) ou no germinar (fracasso).
Exemplo: 1) Considere um experimento que consiste no lanamento de um dado e verifique a
ocorrncia da face 5 (sucesso) ou no. Determine a funo de probabilidade e a distribuio
acumulada.

2) Uma urna contm 4 bolas vermelhas e 6 brancas. Uma bola extrada, observada sua cor e
reposta na urna. Numa nica extrao somente dois resultados podem ocorrer: bola vermelha ou
bola branca.
a) Defina uma varivel aleatria X neste experimento e indique o modelo de distribuio de
probabilidades mais adequado para descrever seu comportamento.
b) Determine a funo de probabilidade de X e seu respectivo grfico.
c) Determine a funo de distribuio de X e seu respectivo grfico.
d) Determine a esperana matemtica e a varincia de X. Interprete essas medidas.

25

3. Distribuio Binomial
uma generalizao da distribuio de Bernoulli. a mais importante das distribuies tericas
de probabilidade para variveis discretas. So realizados n ensaios independentes de Bernoulli. A
probabilidade de sucesso em cada ensaio constante. Como as probabilidades p de sucesso se
mantm constantes em cada ensaio, a distribuio binomial indicada para os casos em que a
amostragem feita com reposio.
Definio: Seja a varivel aleatria X que conta o nmero total de sucessos obtidos numa
seqncia de n ensaios independentes de Bernoulli. A varivel X segue uma distribuio binomial
com parmetros n e p, denotada por X ~ b(x; n, p), e tem funo de probabilidade:
b(x; n, p) P(X x) ( nx )p x q n x C xn p x q n x , x = 0, 1, 2, ..., n

n o n de repeties do experimento;
x o n desejado de sucessos;
n - x o n esperado de fracassos;
p a probabilidade de sucesso num ensaio individual;
1 p a probabilidade de fracasso num ensaio individual;
Exemplos:
1. A probabilidade de um produto fabricado no atender as especificaes de projeto igual a 5%
(produto no-conforme). So selecionadas ao acaso 8 unidades deste produto.
a) Defina uma varivel aleatria X neste experimento e indique o modelo de distribuio de
probabilidades mais adequado para descrever seu comportamento probabilstico.
b) Determine a funo de probabilidade de X e seu respectivo grfico.
c) Determine a funo de distribuio de X e seu respectivo grfico.
d) Determine a esperana matemtica e a varincia de X. Interprete essas medidas.
e) Qual a probabilidade de no mximo 5 no atenderem as especificaes?
f) Qual a probabilidade de pelo menos 3 no atenderem as especificaes?

2. A probabilidade de que certo tipo de componente sobreviva a um teste de choque de .


Determine a probabilidade de que dos prximos quatro componentes testados,
a) exatamente 2 sobrevivam.
b) pelo menos 2 sobrevivam.
c) no mximo 2 sobrevivam.

Os parmetros da distribuio Binomial so:


E ( X ) np e 2 Var ( X ) npq

26

4. Distribuio Poisson
A distribuio Poisson ocorre quando se deseja contar o nmero de eventos de um certo
tipo, verificados em um intervalo de tempo, de superfcie (rea) ou volume. Uma varivel aleatria
X com distribuio Poisson pode assumir infinitos valores no conjunto dos inteiros positivos (v.a.
discreta).
Exemplos de variveis de Poisson:
- Nmero de telefonemas recebidos por hora em um escritrio.
- Nmero de bactrias por unidade de rea em uma lmina.
- Nmero de erros de digitao por pgina.
- Numero de falhas de um computador em um dia de operao.
Uma varivel aleatria X com distribuio Poisson tem:
funo de probabilidade:

f (x; ) P(X x)

parmetros: x E(X)

Var(X)

e x
x!

A distribuio Poisson tem aplicao tambm nos casos em que os parmetros n e p da


distribuio binomial dificultam o clculo por esta distribuio (eventos raros). Nesses casos, a
Poisson usada como aproximao da binomial, sendo a aproximao considerada adequada
quando n grande e p pequeno n 50 e p 0,10 . Neste caso a media da Poisson ser: =
= n.p.
Exemplos.
1) Durante um experimento de laboratrio, o nmero mdio de partculas que passam por um
contador em um milsimo de segundo quatro.
a) Qual a probabilidade de que seis partculas entrem em um dado contador, em um especfico
milsimo de segundo? R: 0,1042
b) Qual a probabilidade de que 10 partculas entrem no contador, em 5 milsimos de segundo?
c) Qual a probabilidade de que no mnimo uma partcula entre em um dado contador, em dois
milsimos de segundo?

2) Em certa instalao industrial, acidentes ocorrem com baixa freqncia. Sabe-se que a
probabilidade de um acidente em certo dia de 0,005, e os acidentes so independentes uns dos
outros.
a) Qual a probabilidade de que, em qualquer perodo de 400 dias, haja 1 acidente em um dia?
0,271
b) Qual a probabilidade de que haja no mximo trs dias com acidente? R. 0,857

4. Distribuio Geomtrica
aplicada nas mesmas condies da binomial exceto pelo fato de que o nmero de
tentativas no fixo. Utilizada quando desejamos saber a probabilidade que o primeiro evento de
27

sucesso ocorra na tentativa de nmero x. Desta forma, antes do evento x (sucesso) com
probabilidade p, tivemos (x-1) fracassos, com probabilidade q = 1 p.
A v.a. X, definida como sendo o nmero de tentativas necessrias para se obter o primeiro sucesso,
segue a distribuio geomtrica, e sua funo de probabilidade ser:

P(X x) pq x 1

Parmetros:

E(X)

1
p

Var(x)

q
p2

Observe que quanto menor for o valor de p (probabilidade de sucesso), maior ser o nmero de
experincias at o primeiro sucesso.
Essa distribuio muito utilizada em processos de controle de qualidade, e a varivel , muitas
vezes, denominada de v.a. discreta de tempo de espera, pois representa a espera, em termos do
nmero de falhas, at que ocorra o primeiro sucesso.
Exemplos
1) Um rapaz est numa festa e sabe que a probabilidade de uma menina aceitar um convite para
danar 0,2. Quantas recusas ele espera receber antes de conseguir uma parceira de dana?
A probabilidade de sucesso p = 0,2 e a probabilidade de falha, q = 1 0,2 = 0,8. A mdia
dada por: E(X) = 1/ p = 1/0,2 = 5. Portanto, ele pode esperar 4 negativas antes de achar uma
parceira.

2) Um casal recorreu a uma tcnica de inseminao artificial, cuja eficincia de 20% e o custo de
cada inseminao de U$ 2000.
a) Qual a probabilidade de o casal ter xito na primeira inseminao?
b) Qual o custo esperado para se engravidar por este mtodo?

5. Distribuio binomial negativa (Pascal)


uma generalizao da distribuio Geomtrica. Consiste em determinar a probabilidade
de ocorrer o sucesso de nmero r da v. a..
Se x conta o nmero de eventos at que o r simo sucesso ocorra, ento, a v.a. X tem
distribuio binomial negativa, e sua funo de probabilidade :
r
rq
E(X)
Var(X) 2
r 1 r x r
P(X x) C x 1p q
p
p
Parmetros:
Exemplo: Um vendedor de uma loja de eletrodomsticos tem por cota realizar 3 vendas por dia.
Cada cliente, atendido por esse vendedor tem probabilidade 0,25 de efetuar uma compra qualquer.
Qual a probabilidade do vendedor ter que atender a 5 clientes para completar sua cota? 0,0527
Em mdia quantos clientes ele deve atender para cumprir sua cota? 12
X=5
r=3 p=0,25

28

6. Distribuio hipergeomtrica
Aplicada em situaes onde se vai proceder extraes casuais sem reposio, de uma
populao que apresenta dois atributos (sucesso e fracasso). muito utilizada em testes de
amostragem por aceitao (de produtos), testes eletrnicos e garantia de qualidade, em que o item
testado destrudo e no pode ser reposto.
Considere uma populao de N objetos, r dos quais tem o atributo A e N r tem o atributo
B. Um grupo de n elementos selecionado ao acaso sem reposio. Estamos interessados em
calcular a probabilidade de que este grupo contenha X elementos com o atributo A. Esta
probabilidade ser dada por:

C xr C nNxr
P(X x)
C nN

Parmetros: p

r
;
N

E ( X ) np;

Var ( X ) npq

N n
N 1

N = tamanho da populao, n = tamanho da amostra, r = nmero de sucessos na populao, x =


numero de sucessos na amostra
Exemplo 1: Em um determinado processo de produo a cada 100 peas produzidas 5 so
selecionadas e destrudas para anlises. Espera-se que 10% das peas apresentem problemas na
inspeo.
a) Qual a probabilidade de que em um teste no ocorra peas com problemas
b) Qual a probabilidade de obter pelo menos 2 com problemas
c) Determinar o nmero mdio e o desvio padro de peas com problemas por inspeo.
N = 100. n = 5; r = 10
C0 C5
C1 C 4
a ) P( X 0) 10 5 90 0,5837 ; b) P( X 1) 1 (0, 5837 10 5 90 ) 0, 0769
C100
C100

c) E ( X ) n. p 5.0,1 0, 5
N n
100 5
5.0,1.0,9.
10, 68
n 1
5 1
Desvio padro 3, 27

Var ( X ) n. p.q.

Exemplo 2: Uma remessa de 800 estabilizadores de tenso adquirida por uma Empresa. So
inspecionados 20 aparelhos da remessa, que ser aceita se ocorrer no mximo um defeituoso. H
80 defeituosos no lote. Qual a probabilidade do lote ser aceito? 0,3884

29

Modelos probabilsticos para variveis aleatrias contnuas


1. Distribuio uniforme contnua
Na distribuio uniforme, a probabilidade de se gerar qualquer ponto em um intervalo contido no
espao amostral proporcional ao tamanho do intervalo.
Uma varivel aleatria contnua X tem distribuio uniforme no intervalo [a,b] se sua
funo densidade de probabilidade dada por:

f (x) b a
0

axb
caso contrrio
b

(b a ) 2
Var ( X )
;
12

ab
E( X )
;
2

f ( x) 1

(rea do retngulo)

f(x)

1/(b-a)

a
b
x
Figura 1 Funo Densidade de Probabilidade para a Distribuio Uniforme
F(x)

Figura 2 Funo de distribuio acumulada Uniforme

2. Distribuio normal
A distribuio normal ou de Gauss ou Gaussiana uma das mais importantes distribuies
da estatstica. Alm de descrever uma srie de fenmenos fsicos, naturais, financeiros, nas
indstrias e nas pesquisas em geral, possui grande uso na estatstica inferencial. inteiramente
descrita por seus parmetros mdia e desvio padro , ou seja, conhecendo-se estes possvel
determinar qualquer probabilidade em uma distribuio Normal.
- Seu grfico tem a forma campanular (sino)
- uma distribuio simtrica em relao mdia
- duplamente assinttica em relao ao eixo das abscissas
- Tem dois pontos de inflexo que correspondem media desvio padro.
30

Uma varivel aleatria contnua X tem uma distribuio normal ou gaussiana se a funo
densidade de probabilidade for dada por:

f (x)

1
2

( x ) 2

2 2

para - < x < , - < < e 2 > 0

f ( x )dx 1

Notao: X~N( , 2): X tem distribuio normal com mdia =E(X) e varincia Var(X) = 2.
Probabilidades (reas) especiais:
P( x x ) 0, 68 ; P( x 2 x 2 ) 0, 95 ; P( x 3 x 3 ) 0,99

Funo de distribuio acumulada: F(x) P(X x)

f (x)dx

Clculo de probabilidades: Suponha a v.a. X~N( , 2)


b

( x ) 2

1
2
P(a x b) f (x)dx
e 2 dx
2
a
a
A integral no pode ser resolvida analiticamente.

Distribuio normal padro (padronizada ou reduzida)


Seja X ~ N ( , 2 ) . Subtramos de x a mdia, dividimos pelo desvio padro e obtemos a varivel
Z, que tem mdia zero e varincia 1, sendo chamada de distribuio normal padronizada;
Z ~ N (0,1) cuja fdp
f (Z)

1 (Z)2
e
2

; sendo Z

X
.

Com esta densidade, possvel resolver a integral e calcular probabilidades de intervalos, que
podem ser tabelados para a varivel Z. A varivel X transformada na varivel Z, j que a
transformao preserva a rea abaixo da curva, ou seja, P(x1 x x 2 ) P(z1 Z z 2 ) ,
X
X
sendo Z1 1
e Z2 2
.

A tabela de probabilidade Z, e o grfico.

P(0 Z z )

31

Exemplo de uso da tabela: P(0 < Z < 1,64)= 0,4495


Calcular as seguintes probabilidades:
a) P(0 < Z < 1,28)
c) P(Z< 2,57)
e) P(Z> -1,00)
g) P( 1,00< Z < 1,96)
Determinar os valores de k para:
a) P(Z> k) = 0,0505
c) P( Z < k) = 0,0505
e) P(-1,00 < Z < k) = 0,6826

b) P(Z>1,96)
d) P(Z< - 1,33)
f) P( -1,00 < Z < 1,45)

b) P( Z < k) = 0,9949
d) P(Z> K) = 0,8997

Exemplo1. Os registros indicam que o tempo mdio para se fazer um teste aproximadamente
normal, com mdia de 50 min e varincia 20 min2. Nestas condies, determinar:
a) a porcentagem de candidatos que levam menos de 45 min.
b) se o tempo concedido de 1h, que porcentagem no conseguir terminar o teste.

Exemplo 2. Em um processo industrial, as especificaes exigem que o dimetro de um rolamento


tenha medida de 3 0,01 cm . Sabe-se que a medida do dimetro tem distribuio normal com
mdia 3cm e desvio padro de 0,005. Qual a porcentagem de peas que ser inutilizada por estar
fora das especificaes? R: 0,0456

Exemplo 3. A nota mdia em um exame 74, e o desvio padro 7. Se 12% da classe recebe A e
as notas seguem uma distribuio normal, qual o A mais baixo possvel, e o B mais baixo
possvel (inteiros)? R: 83 e82

32

3. Distribuio exponencial
A distribuio exponencial tem ampla aplicao em engenharia. muito usada para
modelar o tempo e o espao entre ocorrncias de um evento Poisson.
- Exemplo: v.a. X nmero de veculos que passam por um cruzamento (X ~Poisson);
v.a. T tempo entre as chegadas desses veculos no cruzamento (T ~ exponencial).
Usada para calcular tempo de falhas.
- Exemplo: intervalo de tempo entre o instante em que uma pea foi sujeita a esforo mecnico e o
instante em que ocorreu a falha.
Uma v.a. contnua tem X tem distribuio exponencial com parmetro se sua fdp dada
por,
1 x
e ; se x 0
f x,
0;
caso contrrio

Mdia e varincia: E ( X ) X ;

Var ( X ) X2 2 .

Exemplo 1. A durao em horas de certo equipamento segue a distribuio exponencial com fdp
x
1 500
e ; se x 0

f x 500
0;
x<0

Calcular a durao mdia e o desvio padro.


Calcule a probabilidade de um equipamento durar mais que 500 horas.

P(X 500)

f (x)dx =

(R: 0,3678)

500

Exemplo 2. Um sistema possui certo tipo de componente, cujo tempo, em anos, at a falha
modelado pela distribuio exponencial, com tempo mdio at a falha de 5 . Se cinco desses
componentes so instalados em sistemas diferentes, calcule a probabilidade de que pelo menos
dois ainda estejam funcionando aps 8 anos, sendo que o nmero de componentes funcionando
segue a distribuio binomial. R : 0,2627

33

Amostragem e distribuies amostrais


Populao ou Universo: o conjunto de indivduos ou elementos que apresentam uma ou mais
caractersticas em comum (universo sob investigao).
Amostra: um subconjunto finito de uma populao, que preserva as caractersticas dessa
populao (representatividade).
Amostragem: o ato de tomar amostras da populao. Pode ser com ou sem reposio.
Censo: Estudo de todos os elementos da populao.
Parmetro: Medida usada para descrever uma caracterstica populacional. Seu valor geralmente
desconhecido.
Estimador: uma varivel que funo dos dados amostrais. Permite estimar o valor de um
parmetro.
Estimativa: o valor numrico obtido a partir do estimador.
Exemplos:
1) Estudar a proporo de indivduos, em uma cidade, que so favorveis a certo projeto
governamental. Uma amostra de 200 pessoas sorteada, e a opinio de cada uma registrada
como sendo a favor ou contra o projeto;
2) Investigar a durao de vida de um novo tipo de lmpada: 100 lmpadas do novo tio so
deixadas acesas at queimarem. A durao em horas de cada lmpada registrada.
3) a escolha de jogadores de futebol para fazer o exame de antidoping.
Amostragem probabilstica: Quando todos os elementos da populao tiveram uma
probabilidade conhecida e diferente de zero, de pertencer amostra.
Amostragem no probabilstica: Quando no se conhece a probabilidade de um elemento da
populao pertencer amostra. A amostragem restrita aos elementos que se tem acesso
(exemplos, usurios de drogas, voluntrios em testes de remdios ou vacinas).
O objetivo da amostragem determinar mtodos para estudar as populaes por meio de
amostras. A amostragem nos possibilita concluir (inferir) sobre um todo a partir de apenas uma
parte.
Razes para se amostrar: reduo de custo e material, rapidez nos resultados, reduo do
trabalho, facilidade no treinamento de pessoal, o ato de observar pode ser destrutivo.
Quando o uso de amostragem no interessante? Populao pequena; necessidade de alta
preciso.
Principais tcnicas de Amostragem:
1. Amostragem Simples ao Acaso ou Amostragem Aleatria Simples (AAS). a tcnica de
amostragem mais simples e utilizada quando a populao homognea e finita. Pode ser feita
com ou sem reposio. So sorteados n elementos de uma populao de tamanho N. A
probabilidade de selecionar um indivduo especfico da populao para uma amostra 1/N. O
sorteio pode ser feito por qualquer mtodo aleatrio, como papis ou bolas numeradas, calculadora
computador, tabela de nmeros aleatrios ou outros.
Exemplo: a) escolher 10 funcionrios no setor de produo de uma empresa para estudar o
aumento de produtividade. AAS.
b) escolher 10 funcionrios de toda a empresa para estudar o aumento de produtividade. Deve-se
usar outro tipo de amostragem (estratificada).
2. Amostragem Estratificada:
34

A populao heterognea dividida em sub-populaes homogneas (estratos), e em seguida


feita a AAS em cada estrato.
Suponha que uma populao heterognea de tamanho N seja dividida em L estratos de tamanhos
L

N1 , N 2 ,, N L e N N1 N 2 N L N h
h 1

L amostras (AAS) so retiradas (uma amostra de cada estrato) de tamanhos : n1 , n2 ,, nL e


L

n n1 n2 nL nh (em que n o tamanho da amostra).


h 1

A amostragem estratificada pode ser classificada quanto ao tipo de estratificao, em :


estratificao uniforme: cada estrato possui o mesmo nmero de elementos. O tamanho de
amostra de cada estrato n/L .
estratificao proporcional : No critrio proporcional extrai-se de cada estrato uma quantidade
de elementos nh proporcional ao tamanho N h do respectivo estrato. Este critrio recomendado
quando o tamanho dos estratos so distintos e a variabilidade dos estratos homognea. O
n
N
tamanho da amostra do estrato Lh nh : h h
n
N
estratificao tima ( Partilha tima): O nmero de elementos nh proporcional ao tamanho
N h e ao desvio padro h do respectivo estrato.
nh

n h

Nh
L

N
h

h 1

Exemplo: Suponha que uma empresa hoteleira deseja realizar uma pesquisa com os seus 84
funcionrios, em que 25 pessoas so do sexo feminino (F) e as 59 restantes do sexo masculino
(M). Estabelecendo n 9 (10% no mnimo), encontre o nmero de mulheres e de homens que
devem ser entrevistados.

3. Amostragem Sistemtica
Enumeram-se todos os elementos da populao 1, 2,, N e sorteia-se um primeiro
elemento i para formar parte da amostra. Os demais so retirados em uma progresso
aritmtica, saltando r elementos, at completar o total da amostra (n). O valor r chamado
passos de amostragem e determinado por: r = N/n. O primeiro elemento deve ser sorteado entre
os r primeiros.
Exemplo: Uma rua contm 1000 prdios, dos quais desejamos obter uma amostra sistemtica
formada por 100 deles.

35

4. Amostragem por Conglomerados


Um Conglomerado um subgrupo de elementos da populao, que deve representar bem
toda a populao. A populao dividida em sub-populaes (conglomerados) distintas
(quarteires, residncias, famlias, bairros, estados, etc.). Alguns dos conglomerados so
selecionados segundo a AAS e todos os indivduos nos conglomerados selecionados so
observados. Em geral, menos eficiente que a AAS ou AE, mas tambm mais econmica.
Dentro de cada conglomerado h muita heterogeneidade, Entre os conglomerados h uma pequena
variabilidade.

Distribuies amostrais
Considerem-se todas as amostras possveis de tamanho n que podem ser retiradas de uma
populao de tamanho N (com ou sem reposio). Para cada amostra pode-se calcular uma
grandeza estatstica, como a mdia, o desvio padro etc., que varia de amostra para amostra. Com
os valores obtidos para determinada grandeza, podemos construir uma distribuio de
probabilidades, que ser denominada de distribuio amostral.
Exemplo: Suponha uma v.a. X uniforme, com possveis valores 1, 2, 3 (N=3). Retirar todas as
amostras possveis de tamanho n = 2, com reposio, e calcular a mdia em cada uma delas. Obter
a distribuio amostral da mdia e a distribuio de x. Fazer os grficos e comparar.
Distribuio de X.
x
p (x)

13

13 13

Distribuio amostral da mdia Teorema do limite central (TLC)


Se a v.a. X tem uma distribuio qualquer, com mdia X e varincia 2X , ento a mdia
amostral x , baseada em uma amostra de tamanho n, ter distribuio normal aproximada, com
2
mdia E X X X e varincia 2X X .
n
Assim, a varivel Z definida a seguir tem distribuio aproximadamente normal padro, ou seja,

36

X X X X

a N 0,1 .

X
n
A aproximao adequada para amostras maiores ou iguais a 30 n 30 . Quanto maior o

tamanho da amostra, melhor ser a aproximao.


Para amostragem sem reposio, em populao finita, fazer a correo a seguir,

E X X e X
Se a v.a. X tem distribuio normal tem-se,

2
X N X , 2X X N X X , 2X

n

N n
.
N 1

X X
N 0,1

Distribuio t de Student Distribuio amostral da mdia em pequenas amostras (n < 30)


Se a v.a. X tem uma distribuio qualquer, com mdia X e varincia 2X , ento a mdia
amostral x , baseada em uma amostra de tamanho n < 30, ter distribuio aproximada t de
Student, ou seja,

X X X X
S2
, em que S o desvio padro amostral.
X t X X , S 2X

; t
S
n
SX

n
O valor de t associado s probabilidades pode ser obtido na tabela t de Student, em funo
do nmero de graus de liberdade v, sendo v = n 1gl.

Exemplo de uso da tabela.


a) se v = 10, P t 1, 093
b) se n = 16, P 1,34 t 2,131
c) se v = 20, P t 2, 086
d) se n = 17, P 1, 071 t 1, 071

Exemplo 2. Encontre os valores de to:


a) P(t > t0) = 0,10; com v = 13
b) P( t < t0) = 0,95 ; com v = 15
c) P( t0 < t < - 1,761) = 0,045; com n = 15

37

Distribuio amostral da diferena entre mdias (amostras grandes n1 e n 2 30 )


Considerando duas variveis aleatrias:
- Populao 1: X1 com mdia X1 e varincia 2X1 , amostra de tamanho n1 .
- Populao 2: X 2 com mdia X2 e varincia 2X 2 , amostra de tamanho n 2 .
A distribuio amostral da diferena entre as mdias, x1 x2 ,

2 2
x1 x2 N X 1 X 2 X 1 - X 2 , 2X 1x 2

;
n1 n2

x1 x2 X 1 X 2

2 2

n1 n2

a N 0,1 .

Exemplo: Um tratamento qumico A garante durao mdia de 1400h para um pea, com desvio
padro de 200h.Um tratamento B garante durao mdia de 1200h com desvio padro de 100h. Se
forem amostradas 125 unidades de peas de cada tratamento, determine as probabilidades.
a) de um elemento de cada tratamento durar mais que 1600h.
b) da mdia da amostra A durar mais que 1420h.
c) de os elementos da amostra A terem vida mdia superior aos de B em pelo menos 160h.

Distribuio amostral da varincia Distribuio qui-quadrado 2


Se S2 a varincia de uma amostra aleatria (aa) de tamanho n, retirada de uma populao
normal, com varincia 2 ento a estatstica 2 tem distribuio qui-quadrado com v = n-1 graus
de liberdade (gl), sendo,

(n 1)S2
2

e P 2 2 .

A distribuio 2 no simtrica e parte sempre da origem.


Exemplo de uso da tabela.
a) se n = 12, P 2 17, 275
b) se v = 3, P 2 11,345

38

Exemplo: Uma mquina est regulada para empacotar um produto com mdia de 500g e desvio
padro de 10g. Em uma amostra de 16 pacotes, qual a probabilidade da varincia ser,
a) maior que 48,407?
b) menor que 121,63?

Distribuio amostral de duas varincias Distribuio F Snedecor.


Se S12 e S12 so varincias de amostras aleatrias independentes, de tamanhos n1 e n2 ,
retiradas de populaes normais, com varincias 12 e 22 , ento a estatstica F tem distribuio F
Snedecor, com v1 n1 1 e v2 n2 1 graus de liberdade, sendo,
S12
F

S22

12
22

S12 22
e P F F (v1 , v 2 ) (rea acima)
12S22

Se F (v1 , v 2 ) o valor de F com v1 e v2 gl, (valor que deixa uma rea acima dele), ento,
F1 (v1 , v 2 )

1
( valor que deixa uma rea ( 1 ) acima dele).
F (v 2 , v1 )

A distribuio F no simtrica e parte sempre da origem. Para cada probabilidade


existe uma tabela.

Exemplo de uso da tabela.


a) sendo v1 9 e v2 15 P F 3,12 0, 025
b) sendo n1 13 e n2 7 P F 4, 0 1 P F 4, 0 1 0, 05 0,95
Exemplo. Se S12 e S12 representam varincias de amostras aleatrias de tamanhos n1 21 e n2 31 ,
cujas populaes tm varincias 12 35 e 22 25 , encontre.

S2

a) P 12 2, 702
S2

S2
b) P 0,594 12 3, 094
S2

39

Distribuio amostral da proporo


Considere uma populao com N elementos, dos quais, B so portadores de uma
caracterstica e N-B so no portadores. A proporo de elementos portadores da caracterstica na
populao p

B
. Retirando-se uma amostra aleatria de tamanho n, e sendo Y o nmero de
N

indivduos portadores da caracterstica na amostra, Y tem distribuio binomial com probabilidade


de sucesso p.
Usando a aproximao normal para a binomial, a proporo p de indivduos com a
caracterstica na amostra ter distribuio aproximadamente normal,

p p
p(1 p)

p N p p , 2p
e
a
estatstica
Z

n
p

p p
a N 0,1
p (1 p )
n

Exemplo. Suponha que 30% dos alunos de um curso da ufu sejam mulheres. Em uma amostra
aleatria de 10 alunos desse curso, calcula-se a proporo p de mulheres. Calcule a probabilidade
de que p seja diferente de p em pelo menos 0,01. R: 0,056

Determinao do tamanho da amostra


Suponha que a mdia populacional esteja sendo estimada por x e que o tamanho da
amostra deve ser determinado de forma que o erro de estimao seja igual a um valor pr-fixado
, com confiana dada. Assim, deseja-se determinar n tal que

P x

O valor de n encontrado n

Z2 2
2

. A varincia 2 pode ser estimada com uma amostra piloto.

Exemplo. Suponha que uma amostra piloto de n = 10 seja extrada de uma populao, fornecendo
x 15 e S2 16 . Determine o tamanho da amostra para que se tenha 0,5 e 0,95 .

40

Teoria da estimao
A teoria da estimao baseia-se na estimao por ponto e estimao intervalar.
Estimao por ponto (estimao pontual): um nico valor numrico usado como estimativa
pontual do parmetro populacional. Um estimador, q , do parmetro q uma funo qualquer dos
elementos da amostra. Estimativa o valor numrico assumido pelo estimador quando os valores
observados so considerados. Assim,
n

X
i

, um estimador da mdia populacional m , e X 50 cm uma estimativa da mdia

populacional.
Estimao intervalar (intervalos de confiana): Um intervalo de valores usado para estimar o
parmetro populacional desconhecido. Atribui-se uma confiana (ou probabilidade) de que o
verdadeiro valor do parmetro esteja contido nesse intervalo, que determinado com base na
distribuio amostral do estimador.

Intervalos de confiana (IC)


Com uma confiana 1 determina-se um limite inferior e um limite superior entre os quais se
espera que o verdadeiro valor do parmetro esteja contido.
Intervalo de confiana para a mdia populacional .
Estima-se com uma confiana 1 que esteja contida no intervalo x e; x e , ou seja,
P x e x e 1 .

Para amostras grandes n 30 :

S
S
S
IC ; (1 ) x Z
; x Z
.
n
n
n
2

2
2
O tamanho da amostra para se estimar com uma confiana dada e um erro prefixado :
e Z

Z S
n0 2

e n

n0
.
n0
1
N

Para amostras pequenas n 30 :

e t
2

S
n

S
S
IC ; (1 ) x t
; x t
.
n
n

2
2

t S
Dimensionamento da amostra: n0 2

e n

n0
.
n0
1
N

41

Exemplos
1. A concentrao de zinco em uma amostra de material de36 locais diferentes 2,6 gramas por
mililitro com desvio padro de 0,3 gramas.
a) Determine intervalos de confiana de 95% e 99% para a verdadeira concentrao mdia de
zinco.
b) Se desejamos estar 95% confiantes de que a estimativa de esteja distante por menos de 0,05,
qual deve ser o tamanho da amostra.?

2. Os contedos de cido sulfrico em 7 contineres similares so: 9,8; 10,2;10,4; 9,8; 10; 10,2;
9,6, em litros. Determine um IC de 95% de confiana para a verdadeira mdia de todos os
contineres.

Intervalo de Confiana para diferena entre duas mdias (amostras independentes):


Amostras grandes nA , nB 30
Estima-se

com

uma

confiana

xB e; xA xB e , ou seja,

e Z 2

1 que A B esteja contida no intervalo


P x A xB e A B x A xB e 1 .

A2 B2

n A nB

X A e X B so mdias amostrais, isto , so as estimativas pontuais das mdias das populaes,


A e B respectivamente;
s 2A e s B2 as varincias populacionais
n A e nB tamanho das amostras retiradas das populaes a e b, respectivamente;

Se as varincias populacionais forem desconhecidas, podem ser substitudas pelas varincias


amostrais.
Amostras pequenas nA , nB 30 (varincias populacionais iguais, desconhcecidas)
Sendo as populaes homocedsticas s 2A s B2 s 2 , assim, S A2 e SB2 so duas estimativas para
um mesmo parmetro s 2 ento o intervalo de confiana para a diferena entre duas mdias
dado por:

IC A B : X A X B t 2; nA nB 2 S p
100(1 )%

1
1

n A nB

com ta 2 com v n A nB 2 graus de liberdade em que:


42

Sp

nA 1 S A2 nB 1 S B2
n A nB 2

Intervalo de Confiana para proporo (amostras grandes n>30):

IC P : p z 2
100(1 )%

pq
n

Intervalo de Confiana para a diferena entre duas propores

IC PA PB : p A p B z 2
100(1 )%

p A q A p B qB

nA
nB

Regras de deciso envolvendo Intervalo de Confiana (IC) para diferena entre duas mdias
ou duas propores.
i) Se o IC incluir o zero, ento, A B ou pA pB .
ii) Se os extremos do intervalo forem negativos, ento, A B ou p A pB .
iv) Se os extremos do intervalo forem positivos, ento, A B ou pA pB .

Exemplos.
1) Dois motores A e B foram comparados. O motor A, em 50 experimentos, apresentou milhagem
mdia de 36 milhas/galo de combustvel, com desvio padro de 6 milhas. O motor B, em 75
experimentos apresentou milhagem mdia de 42 milhas/galo, com desvio padro de 8. Determine
um intervalo de confiana de 96% para B A . Decida com base no IC se existe diferena entre
as mdias.

2) Um novo processo de fabricao de um componente est sendo testado e comparado com o


antigo. No antigo processo, 75 de 1500 itens so considerados defeituosos. No novo processo, 80
de 2000 itens so considerados defeituosos.
a) Determine um IC de 90% para a proporo de defeituosos no antigo processo.
b) Determine um IC de 90% para a proporo de defeituosos no novo processo.
c) Determine um IC de 90% para a real diferena na proporo de defeituosos entre o antigo
processo e o novo processo, e decida se o antigo processo deve ser substitudo pelo novo.

43

Intervalo de confiana para varincia ( 2 ) de uma populao normal

2
2

1
S
n

1
S

IC 2 ; (1 ) : 2
;
; considerando uma amostra de tamanho n.
2
; v n 1 1 ; v n 1

Exemplo Sabe-se que o tempo de vida de certo aparelho tem distribuio aproximadamente
normal. Uma amostra de 25 aparelhos forneceu uma mdia de 500 horas e desvio padro de 50
horas. Construa um intervalo com confiana de 98% para 2 . R: (1,396; 5,527)
Intervalo de confiana para a razo entre duas varincias 12 22 .
Se S12 e S 22 so as varincias de amostras aleatrias de tamanhos n1 e n2, respectivamente,
provenientes de duas populaes normais independentes, com varincias desconhecidas 12 e 22 ,
ento um intervalo de confiana de 100(1 - )% para o quociente (razo) de varincias dado por:

IC

2
1

S2
1
S12
1
;(1 ) : 2
; 2 F 2; v2 , v1
S2 F 2; v1 , v2 S2
2
2

Regra de deciso envolvendo o intervalo de confiana (IC) para o quociente 12 22 :


1) Se IC inclui 1 em sua extenso, ento, estatisticamente 12 22 .
2) Se IC > 1, ento, estatisticamente 12 22 .
3) Se IC < 1, ento, estatisticamente 12 22 .
Exemplo 1: De duas populaes normais levantaram-se amostras de tamanho 9 e 11
respectivamente, obtendo-se S12 7,14 e S22 3,21 . Construa um intervalo de confiana para o
quociente das varincias das duas populaes ao nvel de significncia de 10% e verifique se as
varincias populacionais podem ser consideradas estatisticamente iguais. (0,72; 7,44)
Exemplo 2: Uma companhia fabrica propulsores para uso em motores de turbinas de avio. Uma
das operaes envolve esmerilhar o acabamento de uma superfcie particular para um componente
de liga de titnio. Dois processos diferentes para esmerilhar podem ser usados, podendo produzir
peas com iguais rugosidades mdias na superfcie. Uma amostra aleatria de n1 11 peas,
proveniente do primeiro processo, resulta em um desvio padro de S1 5,1 micro polegadas. Uma
amostra aleatria de n2 16 peas, proveniente do segundo processo, resulta em um desvio padro
de S2 4,7 micro polegadas. Considerando que os dois processos sejam independentes e que a
rugosidade na superfcie seja normalmente distribuda, encontre um intervalo de confiana de 90%
para a razo de duas varincias. Existe diferena na variabilidade da rugosidade da superfcie para
os dois processos? R: (0,46; 3,35).

44

Teoria da deciso
Teste de Hipteses
O teste de hiptese uma regra de deciso para que permita aceitar ou rejeitar uma
hiptese estatstica, com base nos dados amostrais. O objetivo verificar se os dados amostrais
trazem evidncia que apiem ou no uma hiptese formulada.
Definies
Hiptese estatstica: suposio quanto ao valor de um parmetro populacional, ou quanto
natureza da distribuio de probabilidade de uma varivel populacional.
Exemplos: O peso mdio 50. ( 50)
O nmero de pacientes atendidos segue uma distribuio de Poisson.
A proporo de eleitores favorveis a um candidato 0,70. ( p 0, 70)
Tipos de Hipteses
a) Hiptese nula ou de nulidade H 0 : geralmente uma igualdade ou afirmao positiva com
relao ao parmetro populacional.
b) Hiptese alternativa H a ou H1 : afirmao que geralmente envolve a desigualdade e contradiz

H0 .
Com base em H1 define-se a regio crtica (RC) do teste ou regio de rejeio de H 0 (RR H 0 ).
Tipos de testes
Supondo que o parmetro de interesse seja a mdia (testar o valor 50kg )
a) Teste de hiptese bilateral
H 0 : 50
H1 : 50

b) Teste de hiptese unilateral esquerda


H 0 : 50
H1 : 50

c) Teste de hiptese unilateral direita


H 0 : 50
H1 : 50
Tipos de erros
a) Erro tipo I: Rejeitar uma hiptese nula quando ela verdadeira. A probabilidade do erro tipo I
denotada por (nvel de significncia)
b) Erro tipo II: Aceitar uma hiptese nula quando ela falsa. A probabilidade do erro tipo II
denotada por .

45

Regra de deciso: Se o valor calculado da estatstica do teste estiver na regio crtica, deve-se
rejeitar a hiptese nula. Se o valor calculado da estatstica estiver na regio de aceitao de H0, no
se pode rejeitar a hiptese nula.
Testes de hipteses para a mdia
a) Teste de hiptese para mdia de uma populao Normal.
H 0 : 0

H1 : 0

H 0 : 0

ou

H1 : 0

H 0 : 0

ou

H 1 : 0

Estatstica do teste : Z calc

X 0

Varincia desconhecida: usar o desvio padro amostral.


Populao no normal
i) amostras grandes (n 30) usar distribuio Z.
ii) amostras pequenas (n 30) usar distribuio t de Student.
Exemplo 1. Uma fbrica anuncia que o ndice de nicotina dos cigarros da marca X apresenta-se
abaixo de 26 mg por cigarro. Um laboratrio realiza 10 anlises do ndice obtendo: 26, 24, 23, 22,
28, 25, 27, 26, 28, 24. Sabe-se que o ndice de nicotina dos cigarros da marca X se distribui
normalmente com varincia 5,36 mg2. Pode-se aceitar a afirmao do fabricante, ao nvel de 5%?

Teste de hiptese para diferena entre mdias de populaes Normais com varincias
populacionais conhecidas.
Estatstica do teste: Z calc

H 0 : 1 2

H1 : 1 2

ou

X 2 1 2

12 22

n1 n2
H 0 : 1 2

H1 : 1 2

. Varincia desconhecida usar S.

ou

H 0 : 1 2

H1 : 1 2

Amostra pequena (n1, n2 30) e varincias populacionais iguais:


tc

(X 1 X 2 ) ( 1 2 ) ;
s p 1 / n1 1 / n 2

Sp

n A 1 S A2 nB 1 S B2 ;
n A nB 2

v n1 n 2 2

46

Teste de hiptese para a proporo


Exemplo 2. Um fabricante de lentes intra-oculares est qualificando uma nova mquina
de moagem. Ele qualificar a mquina se a porcentagem de lentes polidas que contenha defeitos na
superfcie no exceder 2%. Uma amostra aleatria de 250 lentes contm seis lentes defeituosas.
Formule e teste a hiptese ao nvel de 5% de significncia.

Teste de hiptese para a diferena entre duas mdias.


Exemplo 3. Ao estudar os efeitos de certa anomalia na estatura de recm-nascidos do sexo
feminino, verificou-se, numa amostra de 30 crianas com anomalia, estatura mdia de 46,8 cm e
desvio padro de 3,44 cm e de 50 crianas normais, estatura mdia de 48,0 cm e desvio padro de
2,99 cm. Teste a hiptese que a mdia dos anmalos e estatisticamente igual mdia dos normais.
Use nvel de significncia de 5%.

Teste no paramtrico: Teste de qui-quadrado (2)


O teste de 2 mede a discrepncia existente entre freqncias observadas e freqncias esperadas
em um conjunto de dados, podendo ser utilizado como teste de aderncia ou de independncia
Teste de aderncia: utilizado para verificar se as diferenas entre as freqncias esperadas e
observadas so estatisticamente significativas.
Procedimento:
a) determinar o modelo terico
b) calcular as freqncias esperadas (fe) para cada classe.
c) Comparar as freqncias esperadas e observadas (fo) com a estatstica do teste:
k
2
c

i 1

oi

f ei

; k o nmero de classes, o nmero de graus de liberdade v = k-1.

f ei

Regra de deciso: Se c2 2 ,v deve-se rejeitar H0 (o modelo terico no se ajusta distribuio


observada).

Teste de independncia
47

H0 : varivel linha independe da varivel coluna


H1 : varivel linha e coluna so dependentes
A estatstica do teste a mesma c2 , e a frequncia esperada de cada classe calculada por:
fe

(total da linha)(total da coluna)


total

O nmero de graus de liberdade v = (h-1)(k-1), sendo h o nmero de linhas e k o nmero de


colunas.
Exemplo 4. Verificar se a opinio dos moradores de uma cidade quanto a uma nova poltica de
sade diferente, em vrias classes sociais, ou seja, verificar se a opinio dependente da classe
social. Foi levantada uma amostra aleatria de 1000 pessoas estratificadas por classe a seguir:
classes
opinio
a favor
contra
total

baixa
182
154
336

mdia
213
138
351

alta
203
110
313

total
598
402
1000

48

REGRESSO LINEAR SIMPLES E CORRELAO


Em problemas de engenharia e cincias, frequentemente existe interesse em encontrar modelos que
permitam explorar a relao entre duas ou mais variveis. A anlise de regresso e correlao uma tcnica
utilizada para esse fim.
Na anlise de regresso e correlao tem-se a classificao:
- Anlise de correlao;
- Anlise de regresso: Regresso Linear Simples;

Regresso Linear Mltipla;


Regresso no Linear;
Com o objetivo de investigar a presena ou ausncia de relao linear entre as variveis, tem-se os passos:
a) Inspeo visual: diagrama de disperso
b) Quantificando a fora dessa relao: coeficiente de correlao.
c) Explicitando a forma dessa relao: ajuste de uma reta de regresso.
Anlise de correlao: Verificar evidncias de correlao entre as variveis, e tentar medir sua intensidade
(fora). O diagrama de disperso nos possibilita observar os dados graficamente e tirar concluses
prvias sobre a possvel relao entre as variveis.
Exemplos:
X idade de um automvel e Y o seu valor de revenda.
X temperatura ambiente e Y consumo de cerveja
Exemplos de diagramas de disperso e tipos de correlao:

Coeficiente de correlao linear de Pearson


O coeficiente de correlao mede o grau de associao linear entre duas variveis, x e y, ou seja,
mede a fora e a direo do relacionamento linear entre as duas variveis:
O estimador do coeficiente de correlao linear populacional de Pearson o coeficiente de
correlao linear amostral, denotado por r (- 1 r +1).
r = - 1: correlao linear negativa perfeita (reta decrescente).
r = 1: correlao linear positiva perfeita (reta crescente).
r = 0: no h correlao linear.
O valor do coeficiente de correlao pode ser calculado por: r

SPxy
Sxx

Syy

; em que,
49

n n
xi yi
n
SPxy xi yi i 1 i 1
n
i 1

n
n
x
i
yi
n
n
i 1
2

2
; Sxx xi
; Syy yi i 1
n
n
i 1
i 1

MODELO DE REGRESSO LINEAR SIMPLES

Quando existe uma relao linear entre uma varivel dependente (varivel resposta) e uma
varivel independente (preditora ou explicativa), ajusta-se um modelo de regresso linear simples.
Caso exista uma relao linear entre uma varivel dependente e duas ou mais variveis
independentes, ajusta-se um modelo de regresso linear mltipla.
Havendo relao linear entre as variveis, o modelo de regresso linear tem o objetivo de
descrever essa relao, podendo ser usado para fazer inferncias sobre valores no observados. A
estimao (previso) de valores de y no deve ser feita para valores de x que estejam fora do
intervalo considerado na regresso.
O modelo estatstico de uma regresso linear simples :
yi b0 b1 xi ei
yi : representa o i-simo valor observado;
xi : representa a varivel independente, i = 1, 2, ..., n;
i : o erro no observvel associado a i-sima observao;

0 e 1 : so os parmetros do modelo, que so o intercepto ou coeficiente linear e o coeficiente


angular de regresso.
Ao estabelecer o modelo de regresso linear simples, pressupomos que:
i) A relao entre x e y linear;
ii) Os valores de x so fixos, isto , x no uma varivel aleatria;
iii) A mdia do erro zero, isto , E i 0, i 1, 2, , n ;
iv) Para um dado valor de x, a varincia do erro sempre constante, isto ,
V i E i2 2 , i 1,2, , n
v) os erros so independentes e tem distribuio Normal

Estimao dos parmetros: Mtodo dos mnimos quadrados


A reta que apresenta o melhor ajuste aos dados aquela que minimiza a soma dos quadrados dos
desvios entre os valores observados e os previstos pela prpria reta (minimizao dos quadrados
dos resduos).

Equao da reta de regresso estimada: yi b0 b1 xi


b1, inclinao da reta na amostra e pode ser usada para estimar 1.
b0, intercepto do eixo Y na amostra e pode ser usado para estimar 0.
Os estimadores de mnimos quadrados para 0 e 1 so, respectivamente:

0 b0 y 1 x

SPxy
1 b1
Sxx

50

Interpretao do coeficiente da regresso linear simples: Na regresso linear simples,


interpreta-se 1 como uma estimativa da alterao em y correspondente alterao de uma
unidade na varivel independente.

Exemplo 1: Com os dados a seguir, desenvolva uma equao de regresso estimada que possa ser
usada para prever o custo total de determinado volume de produo.
Volume de produo (unidades)
400
450
550
600
700
750

Custos totais
4.000
5.000
5.400
5.900
6.400
7.000

Teste de significncia da regresso linear simples


A significncia da regresso (do parmetro 1 ) pode ser testada por meio da Anlise de
Varincia (ANAVA). O objetivo determinar se existe uma relao linear entre a varivel de
resposta y e a varivel regressora x. Nessas, condies a hiptese testada :
H0 : 1 = 0
H1: 1 0
Se H0 for rejeitada, o teste nos d evidncias estatsticas para concluirmos que o parmetro 1 no
igual a zero e, assim, a relao entre y e a varivel independente x significativa. Mas, se H0 no
puder ser rejeitada, no se pode concluir que existe uma relao significativa. O procedimento da
anlise de varincia descrito a seguir, sendo p o nmero de parmetros do modelo, n o nmero de
observaes da varivel resposta (varivel dependente), FV fontes de variao, GL graus de
liberdade, SQ soma de quadrados, QM quadrado mdio.
Tabela 1 Esquema da Anlise de Varincia de um modelo de regresso linear simples.
FV
GL
SQ
QM
Fc
p1=1
SQReg
SQReg/( p - 1 ) = QMReg
QMReg/QME
Regresso
n p = n - 2 SQErro
SQErro/(n - 2)= QME
Erro
n-1
SQTotal
Total

Relao entre as somas de quadrados : SQTotal = SQReg + SQErro

51

SQTotal ( yi y ) y
2

2
i

i1

i1

SPxy

SQ Re g ( y i y ) 2

Syy ;

i 1

Sxx

SQErro ( yi y i ) 2

SQTotal

SQReg

i 1

Regra de deciso do teste.


Critrio do valor crtico: Rejeita-se H0 se Fc F em que F obtido na tabela da distribuio F
com 1 grau de liberdade no numerador e n 2 graus de liberdade no denominador.
Coeficiente de determinao (r2): porcentagem da variao total que explicada pela
regresso.

r2

SQ Re g
; 0 r2 1
SQtotal

Teste de hiptese para os parmetros da regresso 0 e 1


Outra forma de testar a significncia da regresso por meio do teste de hiptese do
coeficiente angular 1 . A hiptese nula H0: 1 = 0 contra H1: 1 0, testada usando a
distribuio t com n - 2 graus de liberdade.
Estatstica do teste: tc

b1
.
QME Sxx

Pode-se testar tambm o parmetro 0. Mas, o fato de 0 ser significativo no implica que existir
uma relao linear significativa entre x e y.
H : b 0
b0
Estatstica do teste: tc
Hipteses: 0 0
H1 : b0 0

QME

2
i

nSxx

i 1

Regra de Deciso: Rejeita-se H0 se tc ta 2; n2 ou tc ta 2; n2 (se tc pertencer a regio crtica).

Teste de Hipteses para a correlao linear


r
tc
1 r 2
n2

H 0 : r 0

H1 : r 0

Regra de deciso: rejeitar a hiptese nula = 0 se o valor absoluto da estatstica de teste excede
os valores crticos (Tabela de t com n - 2 gl).

Exemplo 2. Testar a significncia da regresso estabelecida no exemplo 1.


52