Você está na página 1de 24

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ - UNIOESTE

Curso: C. Computação – 1º Ano


Disciplina: Estatística Básica
Professor: Wilson Alves de Oliveira

2 PROBABILIDADES
INTRODUÇÃO
EXPERIMENTOS ALEATÓRIOS: Chamamos de experimentos aleatórios aqueles que,
repetidos em idênticas condições, produzem resultados diferentes. Embora não saibamos
qual o resultado que irá ocorrer num experimento, em geral, conseguimos descrever o
conjunto de todos os resultados possíveis que podem ocorrer.

Exemplos: a) Lançar uma moeda e observar a face de cima.


b) Lançar um dado e observar o nº da face de cima.

ESPAÇO AMOSTRAL: Chamamos de espaço amostral, e indicamos por S ou , um


conjunto formado por todos os resultados possíveis de um experimento aleatório.

Exemplos: a) Lançar uma moeda e observar a face de cima.

S = { K, C}, onde K representa cara e C coroa.

b) Lançar um dado e observar o nº da face de cima.

S = {1, 2, 3, 4, 5, 6}

EVENTO: Um evento é um conjunto de resultados do experimento; em termos de


conjunto, é um subconjunto de S. Em geral indicamos um evento por uma letra maiúscula
do alfabeto: A, B, ... , X, Y, Z.
Os eventos que possuem um único elemento são chamados eventos elementares.

Exemplo: Um dado é lançado e observa-se o nº da face de cima.


S = {1, 2, 3, 4, 5, 6}

Eis alguns eventos: A: Ocorrência de nº impar. A = {1, 3, 5};


B: Ocorrência de nº primo. B = {2, 3, 5};
C: Ocorrência de nº menor que 4. C = {1, 2, 3};
D: Ocorrência de nº menor que 7.
D = {1, 2, 3, 4, 5, 6} = S (evento certo)

E: Ocorrência de nº maior ou igual a 7.


E =  (evento impossível)
2

Usando as operações com conjuntos, podemos formar novos eventos. Assim:

A  B é o evento que ocorre se A ocorre ou B ocorre ou ambos ocorrem;


A  B é o evento que ocorre, se A e B ocorrem;
AC é o evento que ocorre se A não ocorre. (AC evento complementar de A).

Obs: Se A  B =  , A e B são chamados eventos mutuamente exclusivos. São exaustivos


se A  B = S

DEFINIÇÃO DE PROBABILIDADE

Historicamente, a teoria da probabilidade começou com o estudo de jogos de azar,


como a roleta e as cartas.
Probabilidade é o número que resulta da divisão do número de casos favoráveis a
um evento pelo número total de casos possíveis.

f
P( X )  , onde: P(X): probabilidade de ocorrer o evento X;
p
f : nº de casos favoráveis à ocorrência de X;
p: nº de casos possíveis.

Exemplo 1: No lançamento de uma moeda honesta, qual a probabilidade de sair “cara”?

(Nº de vezes que o evento " cara" pode sair numa jogada) 1
P (" cara" )   .
(Nº total de casos possíveis) 2

Exemplo 2: Vamos agora testar a definição com um dado honesto. Então, numa única
jogada, qual a probabilidade de sair face 5?

f 1
P(face 5)   .
p 6

Exemplo 3: Qual a probabilidade de face impar numa única jogada?

f 3 1
P(face ímpar) =   .
p 6 2

A fórmula P(X) = f / p permite outras conclusões;

f não pode ser maior que p , mas pode ser igual f  p;


f pode ser zero.


Estatística básica – Prof. Wilson Alves de Oliveira
3

Exemplo 4: Jogando 2 dados “honestos” simultaneamente, qual a probabilidade de sair:


a) soma 9?
b) soma par?
c) soma menor que 5?
d) soma maior que 10?

Vamos montar primeiro uma tabela que nos possibilite visualizar os vários pares de faces.

Dado 2 1 2 3 4 5 6
Dado 1
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

Sejam os eventos: A = soma 9;


B = soma par;
C = soma menor que 5;
D = soma maior que 10.
Então,
NCF 4 1
a) P(A) = = 
NCP 36 9

18 1
b) P(B) = 
36 2

6 1
c) P(C) = 
36 6

3 1
d) P(D) = 
36 12

PROPRIEDADES

Dado um espaço amostral S, a probabilidade de um evento A, P(A), é uma função


definida em S que associa a cada evento um número real, satisfazendo os seguintes
axiomas:
a) 0  P(A)  1;
b) P(S) = 1;
c) Se A e B forem eventos mutuamente exclusivos (A  B =  ), então
P(A  B) = P(A) + P(B).

Se A1 , A2 , ... , An é uma seqüência de eventos mutuamente exclusivos, então


P(A1  A2  ...  An ) = P(A1) + P(A2) + . . . + P(An).


Estatística básica – Prof. Wilson Alves de Oliveira
4

Teorema 1: Seja S um espaço amostral e seja  o evento impossível. Então P() = 0

Teorema 2: Se AC é o complemento de um evento A, então P(AC) = 1 - P(A)

Teorema 3: Seja S um espaço amostral e sejam A e B dois eventos tais que A  B, então
P(A)  P(B)

Teorema 4: Seja S um espaço amostral e sejam A e B dois eventos quaisquer. Então


P(A  B) = P(A) + P(B) - P(A  B)

Teorema 5: Seja S um espaço amostral e sejam A, B e C, três eventos quaisquer, então:

P(A  B  C) = P(A) + P(B) + P(C) - P(A  B) - P(A  C) - P(B  C) + P(A  B  C)

Exemplo 1: Um grupo de 100 estudantes fez exame em física e em matemática. Suponha


que 60 passaram em matemática, 30 em física e 20 em ambas. Se um estudante é escolhido
ao acaso deste grupo, qual é a probabilidade dele ter passado em matemática ou em física
ou em ambas?

Considere os eventos: A = {o estudante passa em matemática}


B = {o estudante passa em física}

Estamos interessados em calcular a probabilidade de P(A  B).

60 30 20
P ( A)  ; P( B )  ; P( A  B )  .
100 100 100

Assim, P(A  B) = P(A) + P(B) - P(A  B)

60 30 20 70 7
P( A  B )     
100 100 100 100 10

Exemplo 2: Um colégio tem 1000 alunos. Destes:


200 estudam matemática;
180 estudam física;
200 estudam química;
50 estudam matemática e física;
50 estudam física e química;
100 estudam matemática e química e
20 estudam matemática, física e química.
Um aluno do colégio é escolhido ao acaso. Qual a probabilidade de que ele estude
matemática, física ou química?

Sejam os eventos: A = {Candidato escolhido estuda matemática};


B = {Candidato escolhido estuda física};
C = {Candidato escolhido estuda química};


Estatística básica – Prof. Wilson Alves de Oliveira
5

200 180 200 50


P ( A)  ; P( B )  ; P (C )  ; P( A  B )  ;
1000 1000 1000 1000

100 50 20
P( A  C )  ; P( B  C )  e P( A  B  C )  .
1000 1000 1000

200  180  200  50  100  50  20 400 4 2


Então: P ( A  B  C )     .
1000 1000 10 5

ESPAÇOS DE PROBABILIDADES FINITOS

Seja S um espaço amostral finito, digamos S = {a1 , a2 , ... , an}. Um espaço de


probabilidade finito é obtido associando-se cada ponto ai  S, um nº real Pi , chamado de
probabilidade de ai , satisfazendo as seguintes propriedades:

a) Cada Pi é não negativo, Pi  0;

b) A soma dos Pi é 1, P1 + P2 + ... + Pn = 1.

Exemplo 1: Sejam S = {0, 1, 2, 3} e P uma função de probabilidade em S. Encontre P(0),


se

P(1) = P(2) = 3/8 e P(3) = 1/8

3 3 1 7 1 1
Seja P(0) = p, então p    1  p 1   P ( 0) 
8 8 8 8 8 8

Exemplo 2: Três cavalos, A, B e C estão em uma corrida; A tem duas vezes mais
probabilidade de ganhar que B e B tem duas vezes mais probabilidade de ganhar que C.
Quais são as probabilidade de vitória de cada um, isto é, P(A), P(B) e P(C)?

Chamando P(C) = p, desde que B tem duas vezes mais probabilidade de ganhar que C,

P(B) = 2P(C) = 2p e P(A) = 2P(B) = 2(2p) = 4p

Como a soma das probabilidades é 1 , então:


1
4p + 2p + p = 1 ou 7p = 1  p
7
4 2 1
Logo, temos: P ( A)  ; P( B)  e P (C )  .
7 7 7

Qual seria a probabilidade de B ou C ganhar?

2 1 3
P(B  C) = P(B) + P(C) =   (B e C são mutuamente exclusivos)
7 7 7


Estatística básica – Prof. Wilson Alves de Oliveira
6

ESPAÇOS FINITOS EQUIPROVÁVEIS

Quando nós associamos a cada ponto amostral a mesma probabilidade, o espaço


amostral chama-se equiprovável ou uniforme. Em particular, se S contém “n” pontos,
então, a probabilidade de cada ponto será 1/n. Se um evento A contém “r” pontos,
então P(A) = r/n.

Exemplo 1: Selecione aleatoriamente uma carta de em baralho com 52 cartas.


Sejam A = {a carta é uma espada};
B = {a carta é uma figura, isto é, valete, dama ou rei};
Calcular P(A), P(B) e P(A  B).

Como temos um espaço amostral equiprovável,


nº de espadas 13 1
P ( A)    ;
nº total de cartas 52 4

nº de figuras 12 3
P( B )    ;
nº total de cartas 52 13

nº de figuras de espadas 3
P( A  B )   .
nº total de cartas 52

Exemplo 2: Escolha aleatoriamente dois objetos de um lote contendo 12, dos quais 4 são
defeituosos.
Sejam: A = {ambos os objetos são defeituosos} e
B = {ambos os objetos são não defeituosos}.
Encontre P(A) e P(B).
4 4! 4 x 3x 2! 12
A pode ocorrer de: C(4, 2) =       6;
 2  2! ( 4  2)! 2! x 2! 2

8 8! 8 x7 x 6!
B pode ocorrer de: C(8, 2) =      28 ;
 2  2! (8  2)! 2! x 6!

12  12! 12 x11x10!


S pode ocorrer de: C(12, 2) =      66 .
 2  2! (12  2)! 2! x10!

6 1 28 14 
Consequentemente, P ( A)   e P( B )   .
66 11 66 33

PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA

Definição: Sejam A e B eventos de um espaço amostral S e seja P(B)  0. Então a


probabilidade condicional de A dado que B já ocorreu, denotada por P(A/B) , é dada por:


Estatística básica – Prof. Wilson Alves de Oliveira
7

P( A  B )
P( A / B )  .
P( B )

Analogamente, se P(A)  0 , então definimos:

P( A  B )
P( B / A) 
P( A)

Obs: Note que se P(B) = 0 , então a probabilidade P(A/B) não está definida e similarmente
se P(A) = 0 , então P(B/A) também não está definida.

Exemplo: Jogando um dado “honesto de seis faces e sabendo que ocorreu um nº maior
que 2, qual é a probabilidade de ser um nº ímpar?

Sejam os eventos: A: ocorre um nº ímpar;


B: ocorre um nº maior que 2.
Estamos interessados em P(A/B)

3 1 4 2 2 1
P ( A)   ; P( B )   e P( A  B )   .
6 2 6 3 6 3

1
P( A  B ) 1
Então, P( A / B )   3
P( B ) 2 2
3

REGRA DO PRODUTO

Da definição de probabilidade condicional, obtemos a chamada regra do produto de


probabilidades.
P(A  B) = P(B) P(A/B)
P(A  B) = P(A) P(B/A)

Exemplo: Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma após a
outra sem reposição. Qual a probabilidade de que ambas sejam boas?

Sejam os eventos: A = {a 1ª peça é boa};


B = {a 2ª peça é boa}.
8 7 14 
Então, P(A  B) = P(A) P(B/A) =   .
12 11 33

INDEPENDÊNCIA ESTATÍSTICA

Um evento A é considerado independente de um outro evento B se a probabilidade


de A é igual à probabilidade condicional de A dado B, isto é, se P(A) = P(A/B).
Se A é independente de B, B é independente de A, assim: P(B) = P(B/A).


Estatística básica – Prof. Wilson Alves de Oliveira
8

Considerando a regra do produto, podemos afirmar que se A e B são independentes, então:


P(A  B) = P(A). P(B)

Dados “n” eventos A1 , A2 , ... , An , diremos que eles são independentes se eles forem
independentes 2 a 2 ; 3 a 3 ; . . . ; n a n.

Exemplo: Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma após a
outra com reposição. Qual a probabilidade de que ambas sejam boas?

Sejam os eventos: A = {a 1ª peça é boa};


B = {a 2ª peça é boa};
A e B são independentes, pois P(B) = P(B/A).

8 8 64 4
Logo, P(A  B) = P(A) P(B)     .
12 12 144 9

TEOREMA DE BAYES

Suponha que os eventos A1, A2, ... ,An formam uma partição de um espaço
amostral S, ou seja, os eventos Ai são mutuamente exclusivos e sua união é S. Seja B
outro evento qualquer. Então,

B = S  B = (A1  A2  . . .  An)  B =

= (A1  B)  (A2  B)  . . .  (An  B);

onde os Ai  B são também mutuamente exclusivos. Consequentemente,

P(B) = P(A1  B) + P(A2  B) + . . . + P(An  B).

Assim, pela regra do produto,

P(B) = P(A1).P(B/A1) + P(A2).P(B/A2) + . . . + P(An).P(B/An). (1)

Por outro lado, para qualquer i, a probabilidade condicional de Ai dado B é definida como

P  Ai  B 
P  Ai / B   .
P( B )
Nesta equação, usamos (1) para substituir P(B) e P(Ai  B) = P(Ai).P(B/Ai) para
substituir P(Ai  B), obtendo assim o Teorema de Bayes.

Teorema de Bayes: Suponha A1, A2, ... ,An ser uma partição de S e B um evento
qualquer. Então para qualquer i,

P( Ai ) P( B / Ai )
P  Ai / B   .
P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 )    P( An ) P( B / An )


Estatística básica – Prof. Wilson Alves de Oliveira
9

Exemplo 1: Três máquinas, A, B e C, produzem 50% , 30% e 20% , respectivamente, do


total de peças de uma fábrica. As porcentagens de produção defeituosa destas máquinas
são 3% , 4% e 5%. Se uma peça é selecionada aleatoriamente, ache a probabilidade dela
ser defeituosa.

Seja o evento: X = peça selecionada é defeituosa;

X = (A  X)  (B  X)  (C  X);

P(X) = P(A  X) + P(B  X) + P(C  X);

P(X) = P(A) P(X/A) + P(B) P(X/B) + P(C) P(X/C);

P(X) = (0,50).(0,03) + (0,30).(0,04) + (0,20).(0,05) = 0,037.

Exemplo 2: Considere a fábrica do exemplo anterior. Suponha que uma peça, selecionada
aleatoriamente, seja considerada defeituosa. Encontre a probabilidade dela ter sido
produzida pela máquina A.

P( A  X ) P( A) P( X / A) (0,50)(0,03)
P( A / X )     0,41 .
P( X ) P( X ) 0,037

Exemplo 3: Temos duas caixas iguais. Na caixa 1 há 3 bolas brancas e 7 pretas e na caixa
2 há 1 bola branca e 4 pretas. De uma caixa escolhida ao acaso, seleciona-se uma bola e
verifica-se que é branca. Qual é a probabilidade de que a caixa de onde foi extraída a bola
seja a caixa 1?

Sejam os eventos: Ci = caixa i (i = 1 e 2);


B = bola selecionada é branca .

P (C 1  B ) P (C 1 ) P ( B / C 1 )
Então, P (C 1 / B )   ;
P( B ) P( B)

P(B) = P(C1  B) + P(C2  B);

P(B) = P(C1).P(B/C1) + P(C2).P(B/C2);

1 3 1 1 3 1 5 1
P( B )         ;
2 10 2 5 20 10 20 4

1 3
 3
P(C1 ) P( B / C1 ) 2 10 12 3 
 P (C 1 / B )    20   .
P( B ) 1 1 20 5
4
4


Estatística básica – Prof. Wilson Alves de Oliveira
10

VARIÁVEIS ALEATÓRIAS DISCRETAS

Definição: Sejam E um experimento e S o espaço associado ao experimento. Uma função


X, que associe a cada elemento s  S um nº real X(s), é denominada Variável Aleatória
(V.A.).

Definição: Função de Probabilidade é a função que associa a cada valor assumido pela
V.A, a probabilidade do evento correspondente, isto é,

P(X = xi) = P(Ai) , i = 1, 2, ... , n.

Ao conjunto {(xi , p(xi)) , i = 1, 2, ... , n} denomina-se Distribuição de Probabilidades da


V.A. X. Para que haja uma distribuição de probabilidade de uma V.A. X é necessário que:
n

 p(xi )  1 .
i 1

Exemplo: E: lançamento de três moedas;


X: Variável Aleatória que corresponde ao número de ocorrências da face cara;
Determinar a distribuição de probabilidade de X.

O espaço amostral do experimento é:

S = {KKK , KKC , KCK , KCC , CKK , CKC , CCK , CCC}

Se X é o número de caras, X assume os valores 0 , 1 , 2 e 3;

X Evento Correspondente
0 A1 = {CCC}
1 A2 = {KCC, CKC, CCK}
2 A3 = {KKC, KCK, CKK}
3 A4 = {KKK}

Assim, a distribuição de probabilidades da V.A. X é apresentada a seguir:

X 0 1 2 3
P(X) 1/8 3/8 3/8 1/8

Nota-se que a V.A. para ser discreta deve assumir valores em um conjunto finito ou em um
conjunto infinito, porém enumerável.

Exemplo: Lançam-se 2 dados. Seja X: soma das faces. Determinar a distribuição de


probabilidade da variável aleatória X. 

X 2 3 4 5 6 7 8 9 10 11 12
P(X) 1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36


Estatística básica – Prof. Wilson Alves de Oliveira
11

ESPERANÇA MATEMÁTICA

Existem características numéricas que são muito importantes em uma distribuição


de probabilidade de uma V.A. discreta. São os parâmetros das distribuições. Um primeiro
parâmetro é a esperança matemática (ou simplesmente média) de uma V.A.

n
E(X) =  x p( x )
i 1
i i

Notação: E(X), µ(x), µx, µ.

Exemplos: 1) Dada a seguinte distribuição de probabilidades:

X 0 1 2 3
P(X) 1/8 3/8 3/8 1/8

1 3 3 1 12
E ( X )  (0)  (1)  ( 2)  (3)   1,5 .
8 8 8 8 8

2) Uma seguradora paga R$ 3.000,00 em caso de acidente de carro e cobra uma


taxa de
R$ 100,00. Sabe-se que a probabilidade de que um carro sofra acidente é de 3%. Quanto
espera a seguradora ganhar por carro segurado?

X: “lucro” por carro


X P(X) X P(X)
100 0,97 97,00
- 2 900 0,03 - 87,00
1,00 10,00

 E(X) = R$ 10,00 (lucro médio por carro).

PROPRIEDADES DA ESPERANÇA MATEMÁTICA

1. E(K) = K, K constante;
2. E(KX) = K E(X);
3. E(X  Y) = E(X)  E(Y);
4. E{ Xi } =  {E(Xi)};
5. E(aX  b) = aE(X)  b, a e b constantes;
6. E(X - µx) = E(X) – E(µx) = µx - µx = 0.


Estatística básica – Prof. Wilson Alves de Oliveira
12

VARIÂNCIA: Define-se variância de uma V.A. como: VAR (X) = E{(X - E(X))2 }

No caso discreto, seja X: x1 , x2 , . . . , xn e P(X = xi) = p(xi), i = 1, 2, . . . , n,

n
VAR (X) =  x
i 1
i   x  p( x i ) .
2

Notação: VAR(X), V(X),  2 ( X ),  2 .

DESVIO PADRÃO: Por definição, desvio padrão é a raiz quadrada da variância, ou seja,

x = VAR ( X ) .

Fórmula prática para o cálculo da variância:


n
VAR (X) = E(X2) - {E(X)}2, onde E(X2) =  x i2 p( x i ) .
i 1

Exemplo: Determinar a variância e o desvio padrão para a distribuição de probabilidades


do exemplo 1:

X 0 1 2 3
P(X) 1/8 3/8 3/8 1/8

VAR (X) = E(X2) - {E(X)}2;

1 3 3 1 12
E ( X )  (0)  (1)  ( 2)  (3)   1,5 (Obtida anteriormente);
8 8 8 8 8

1 3 3 1 3 12 9 24
E ( X 2 )  ( 0) 2  (1) 2  (2) 2  (3) 2      3;
8 8 8 8 8 8 8 8

 VAR(X) = 3 - (1,5)2 = 0,75  x = 0,75 = 0,866.

PROPRIEDADES DA VARIÂNCIA

1. VAR (K) = 0, K constante;


2. VAR (KX) = K2 VAR(X);
3. VAR (X  Y) = VAR (X) + VAR (Y)  2COV (X,Y).
Definição: COV (X,Y) = Covariância entre X e Y;
COV (X,Y) = E{[X - E(X)] [Y - E(Y)]}.
A Covariância mede o grau de dependência entre as duas variáveis X e Y.
4. VAR (aX  b) = a2 VAR (X), a e b constantes.


Estatística básica – Prof. Wilson Alves de Oliveira
13

DISTRIBUIÇÃO CONJUNTA DE DUAS VARIÁVEIS ALEATÓRIAS

Função de Probabilidade Conjunta: Seja X uma V.A. que assume os valores x1 , x2 , ... ,
xm e Y uma V.A. que assume os valores y1 , y2 , ... , yn .

Definição: A função de probabilidade conjunta associa a cada par (xi , yj ) , i = 1 , 2 ,


... , m e j = 1 , 2 , ... , n a probabilidade P(X = xi , Y = yj ) = p(xi , yj) .

Denomina-se distribuição conjunta de probabilidades da variável bidimensional (X ,Y) ao


conjunto
{(xi, yj), p(xi, yj), i = 1 , 2 , ... , m e j = 1 , 2 , ... , n}.

m n
Observa-se que 
i 1 j 1
P( X  x i , Y  y j )  1 .

Exemplo: Dado o quadro abaixo, referente ao salário e tempo de serviço de dez operários.

OPERÁRIO A B C D E F G H I J
X 640 650 650 670 670 670 660 660 660 650
Y 6 5 6 4 6 6 5 6 6 5

Determinar a distribuição conjunta de probabilidade da variável X: salário em reais e da


variável Y: tempo de serviço em anos.

Y 4 5 6 Totais (linhas)
X
640 0 0 1/10 1/10
650 0 2/10 1/10 3/10
660 0 1/10 2/10 3/10
670 1/10 0 2/10 3/10
Totais (colunas) 1/10 3/10 6/10 1

DISTRIBUIÇÃO DE PROBABILIDADE MARGINAL

Dada uma distribuição conjunta de duas V. A. (X, Y) podemos determinar as


distribuições de X sem considerar Y , ou de Y sem considerar X. São as chamadas
distribuições marginais.

DISTRIBUIÇÃO MARGINAL DE X: X = xi, i = fixo;


n
P(X = xi) = j i
P(X = xi , Y = yj) , i = 1 , 2 , ... , m e
m m n

 P(X = xi) = 
i 1 j 1
p(xi , yj) = 1.
i 1


Estatística básica – Prof. Wilson Alves de Oliveira
14

DISTRIBUIÇÃO MARGINAL DE Y: Y = yj , j = fixo;


m
P(Y = yj) =  P(X = xi , Y = yj) , j = 1, 2, ... , n e
i 1
n n m

j 1
P(Y = yj) = 
j 1 i 1
p(xi , yj) = 1

Exemplo: Utilizando a distribuição conjunta do exemplo anterior:

Distribuição marginal de X:

X P(X)
640 1/10
650 3/10
660 3/10
670 3/10
1

A probabilidade marginal de X = 650 é:

2 1 3
P(X = 650, Y = 4) + P(X = 650, Y = 5) + P(X = 650, Y = 6) = 0    .
10 10 10

Distribuição marginal de Y:

Y P(Y)
4 1/10
5 3/10
6 6/10
1

Pode-se, dada a distribuição conjunta de probabilidade, calcular E(X): salário médio, E(Y):
tempo médio de serviço e suas respectivas variâncias.

m n
E ( X )   x i p( x i ) ; E (Y )   y j p( y j ) ;
i 1 j 1

1 3 3 3 6580
E ( X )  (640)  (650)  (660)  (670)   658 ;
10 10 10 10 10

1 3 6 55
E (Y )  ( 4)  (5)  (6)   5,5 ;
10 10 10 10


Estatística básica – Prof. Wilson Alves de Oliveira
15

m n
E ( X 2 )   x i2 p ( x i ) ; E (Y 2 )   y 2j p( y j ) ;
i 1 j 1

1 3 3 3 4330600
E ( X 2 )  (640) 2  (650) 2  (660) 2  (670) 2   433 060 ;
10 10 10 10 10

1 3 6 307
E (Y 2 )  ( 4) 2  (5) 2  ( 6) 2   30,7 ;
10 10 10 10

VAR (X) = E(X2) - {E(X)}2;

 VAR(X) = 433060 - (658)2 = 96  x = 9,80;

VAR(Y) = 30,7 - (5,5)2 = 0,45  y = 0,67.

 O salário médio dos operários é de 658 reais, com um desvio padrão de 9,80 reais e o
tempo médio de serviço dos operários é de 5,5 anos, com um desvio padrão de 0,67 anos.

VARIÁVEIS ALEATÓRIAS INDEPENDENTES

Sejam X: x1 , x2 , ... , xm e P(X = xi) = p(xi), i = 1, 2, ... , m;


Y: y1 , y2 , ... , yn e P(Y = yj) = p(yj), j = 1, 2, ... , n.

As Variáveis Aleatórias X e Y são independentes se e somente se

P(X = xi , Y = yj) = P(X = xi) P(Y = yj), para todo par (xi , yj), i = 1, 2, ... , m, j =
1, 2, ... , n.

As variáveis X e Y da distribuição conjunta do exemplo anterior não são independentes,


pois, por exemplo:
1 1 1
P(X = 640, Y = 4) = 0 e P(X = 640)P(Y = 4) = x  ;
10 10 100

 P(X = 640, Y = 4)  P(X = 640)P(Y = 4).

FUNÇÕES DE VARIÁVEIS ALEATÓRIAS

Conhecidas X, Y e P(X, Y), pode-se estar interessado em calcular F(X,Y), isto é,


funções de X e Y como X + Y, X - Y, X.Y, 2X + 3Y, etc.
Alguns resultados importantes: 

1. E(X  Y) = E(X)  E(Y);

2. COV(X,Y) = E(X.Y) - E(X)E(Y);


Estatística básica – Prof. Wilson Alves de Oliveira
16

3. Se X e Y são independentes, então E(XY) = E(X)E(Y);

4. Se X e Y são independentes, então COV(X, Y) = 0, a recíproca não é verdadeira;

5. Se X e Y são independentes, então VAR(X  Y) = VAR(X) + VAR(Y);


 m  m
6. Se X1, X2, ... , Xm são independentes, então VAR   X i   VAR( X i ) ;
 i 1  i 1

Exemplo: Dada a distribuição conjunta de probabilidades da variável (X,Y), calcular:

Y 0 1 2 3
X
0 1/8 2/8 1/8 0
1 0 1/8 2/8 1/8

a) X e Y são independentes?
b) E(2X - 3Y);
c) VAR(X) e VAR(Y);
d) COV(X,Y);

1 4 1
a) P(X = 0, Y = 0) = , P(X = 0) = e P(Y = 0) =
8 8 8
 P(X = 0, Y = 0)  P(X = 0) P(Y = 0)  X e Y não são independentes.

Y 0 1 2 3 P(X) X P(X) X2 P(X)


X
0 1/8 2/8 1/8 0 4/8 0 0
1 0 1/8 2/8 1/8 4/8 4/8 4/8
P(Y) 1/8 3/8 3/8 1/8 1 E(X) = 0,5 E(X2) = 0,5
Y P(Y) 0 3/8 6/8 3/8 E(Y) = 1,5
Y2 P(Y) 0 3/8 12/8 9/8 E(Y2) = 3

b) E(2X - 3Y) = E(2X) - E(3Y) = 2 E(X) - 3E(Y) = 2(0,5) - 3(1,5) = - 3,5;

c) VAR (X) = E(X2) - {E(X)}2 = 0,5 - (0,5)2 = 0,25

VAR (Y) = E(Y2) - {E(Y)}2 = 3 - (1,5)2 = 0,75

d) COV(X,Y) = E(XY) - E(X)E(Y);

 1  2  1  2  1 8
E ( XY )   0.0.    0.1.     1.1.   1.2.   1.3.    1
 8  8  8  8  8 8

COV ( X , Y )  1  (0,5).(1,5)  1  0,75  0,25 .


Estatística básica – Prof. Wilson Alves de Oliveira
17

Distribuições Teóricas de Variáveis Aleatórias Discretas


1 Distribuição Binomial

Considere n tentativas independentes de um mesmo experimento aleatório. Cada


tentativa admite apenas dois resultados: sucesso(p) e fracasso(q). Seja X: número de
sucessos em n tentativas.

A função distribuição da V.A. Binomial é dada por:

n
P( X  k )    p k (1  p ) n  k , K = 0, 1, 2, ... , n.
k 

A variável X tem distribuição binomial, com parâmetros n e p, sendo indicada


pela notação X: B(n , p).

Se X: B(n , p)  E(X) = np e VAR(X) = npq.

Exemplos:

1) Uma moeda é lançada 20 vezes. Qual a probabilidade de saírem 8 caras?

X: nº de sucessos (caras);

X: 0, 1, 2, . . . , 20  p = p(K) = 1/2  X: B(20, 1/2);

8 12
 20  1   1 
 P(X = 8) =       0,12013.
 8  2   2 

2) Uma prova tipo teste tem 10 questões independentes. Cada questão tem 5 alternativas.
Apenas uma das alternativas é a correta. Se um aluno resolve a prova respondendo a esmo
as questões, qual a probabilidade de acertar 5 questões? Qual o número de acertos
esperado?

X: número de questões respondidas corretamente;

X = 0, 1, 2, . . . , 10  p = P(acerto) = 1/5  X: B(10; 1/5);


5 5
10  1   4   1  1024 
P(X = 5) =       252    0,026 .
 5  5   5   3125  3125 

Número de acertos esperado (média),

 1  10
E ( X )  n. p  10     2
5
  5


Estatística básica – Prof. Wilson Alves de Oliveira
18

2 Distribuição de Poisson

Considere a probabilidade de ocorrência de sucessos em um determinado intervalo.


Seja X o número de sucessos no intervalo. Então:

e   k
P(X = k) = , onde  é a média.
k!

A variável X assim definida tem distribuição de Poisson.

E(X) =  e VAR(X) = .

Exemplo: Numa central telefônica chegam 300 telefonemas por hora. Qual a probabilidade
de que:
a) num minuto não haja nenhum chamado;
b) em dois minutos haja 2 chamados.

a) X: nº de chamadas por minuto   = 5,

e 5 5
0
P(X = 0) = = e5 = 0,006738;
0!

b) dois minutos   = 10,

e 10 (10) 2
P(X = 2) = = 0,002270.
2!

VARIÁVEIS ALEATÓRIAS CONTÍNUAS

Suponha que X é uma Variável Aleatória, cujo número de valores possíveis de X é


um intervalo, por exemplo 0  x  1, ou uma coleção de intervalos. Neste caso, a Variável
Aleatória é contínua.

Função Densidade de Probabilidade

Seja X uma V.A. contínua. A função densidade de probabilidade f(x) é uma função
que satisfaz as seguintes condições:

a) f(x)  0 (não negativa);


b) 
f ( x ) dx  1 .

Além disso, por definição, para qualquer a < b em R,


Estatística básica – Prof. Wilson Alves de Oliveira
19

b
P(a  X  b) =  a
f ( x ) dx (corresponde à área delimitada pala função f(x), eixo dos X
e pelas retas X = a e X = b).

f(x)

a b X

Pode-se estender todas as definições de V. A. discretas para V. A. contínuas.

Se X é uma V.A. contínua, então,


E(X) =  
x f ( x )dx e VAR(X) = E(X2) - {E(X)}2 onde,

E(X2) =  x 2 f ( x )dx .


Distribuições Teóricas de Variáveis Aleatórias Contínuas

1 Distribuição normal

Uma variável aleatória contínua X tem distribuição normal de probabilidade se a


sua função densidade de probabilidade é dada por:
2
1 X  
1  
2  

f(x) = e , para    x   ;
 2

-  + X

As principais características dessa função são:


a) O ponto de máximo de f(x) é o ponto X = ;
b) Os pontos de inflexão da função são: X =  +  e X =  - ;
c) A curva é simétrica com relação a ;
d) E(X) =  e VAR(X) = 2.


Estatística básica – Prof. Wilson Alves de Oliveira
20


Demonstra-se que  
f ( x ) dx  1 .

Para calcular a probabilidade P(a  X  b), deve-se fazer:

b
P(a  X  b) =  a
f ( x ) dx , que apresenta um grau relativo de dificuldade.

É utilizada a seguinte notação: X: N( ,  2 ), (X tem distribuição normal com média  e


variância  2 ).
X 
Seja X: N( , 2), define-se: Z = .

Demonstra-se que Z também tem distribuição normal. Z é chamada de variável normal


reduzida.

Pode ser mostrado que E(Z) = 0 e VAR(Z) = 1 .

Logo, se X: N( ,  2 )  Z: N(0, 1).

A função densidade de probabilidade de Z é:

Z2
1 
f(z) = e 2
, para    z   .
2

Exemplo de relação entre X e Z:

Seja X: N(20, 4). Achar os valores reduzidos correspondentes a X1 = 14, X2 = 16,


X3 = 18, X4 = 20, X5 = 22, X6 = 24 e X7 = 26.

  20 X  X  20
Se X: N(20, 4)  e Z=  ;
  2  2

14  20
a) X1 = 14; Z1   3  Z1  3 ;
2

16  20
b) X2 = 16; Z2   2  Z 2  2 ;
2

18  20
c) X3 = 18; Z3   1  Z 3  1 ;
2

20  20
d) X4 = 20; Z4  0  Z4  0 ;
2


Estatística básica – Prof. Wilson Alves de Oliveira
21

22  20
e) X5 = 22; Z5   1  Z5  1 ;
2

24  20
f) X6 = 24; Z6   2  Z6  2 ;
2

26  20
g) X7 = 26; Z7   3  Z7  3 .
2

Concluí-se que a variável Z indica quantos desvios padrões a variável X está


afastada da média. Como as curvas são simétricas em relação às médias,

P( -   X  ) = P(  X   + );

P(-1  Z  0) = P(0  Z  1).

Também se concluí que se X: N( ; 2) então,

P(X1  X  X2) = P(Z1  Z  Z2), em que

X1   X2  
Z1 = e Z2 = .
 

USO DA TABELA

A vantagem de se usar a variável Z é que pode-se tabelar os valores da área, ou as


probabilidades, pois para cada X dado, a área depende de  e  2 . A tabela usada fornece
a área sob a curva normal padrão entre Z = 0 e qualquer valor positivo de Z.

0 Z Z

P (0  Z  Z  )  


Estatística básica – Prof. Wilson Alves de Oliveira
22

Exemplos de uso da tabela:


1) Seja X: N(100, 25). Calcular:
a) P(100  X  106);
b) P(89  X  107);
c) P(112  X  116);
d) P(X  108).

a) P(100  X  106) = P(0  Z  1,2) = 0,384930;

100  100 106  100


* Z1  0 e Z2   1,2 ;
5 5

b) P(89  X  107) = P(-2,2  Z  1,4) = P(-2,2  Z  0) + P(0  Z  1,4) =

= 0,486097 + 0,419243 = 0,90534;

89  100 107  100


* Z1   2,2 e Z2   1,4 ;
5 5

c) P(112  X  116) = P(2,4  Z  3,2) = P(0  Z  3,2) – P(0  Z  2,4) =

= 0,499313 – 0,491803 = 0,007510;

112  100 116  100


* Z1   2 ,4 , Z2   3,2 ;
5 5

d) P(X  108) = P(Z  1,6) = 0,5 – P(0  Z  1,6) = 0,5 – 0,445201 = 0,054799;

108  100
* Z1   1,6 .
5

2) Sendo X: N(50, 16), determinar X  tal que P(X  X  ) = 0,05.


Procurando no corpo da tabela 0,45 (0,5 – 0,05), encontra-se Z = 1,64;

 = 0,05

0 Z Z

X   X   50
Como Z    1,64  
 4


Estatística básica – Prof. Wilson Alves de Oliveira
23

X   50  1,64( 4)  X   50  6,56  X   56,56 ;

 P(X  56,56) = 0,05.

Exemplo de Aplicação
Um fabricante de baterias sabe por experiência passada, que as baterias de sua
fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração
tem aproximadamente distribuição normal. Oferece uma garantia de 312 dias, isto é, troca
as baterias que apresentarem falhas nesse período. Produz 10.000 baterias mensalmente.
Quantas baterias, o fabricante, deverá trocar pelo uso da garantia, mensalmente?
  600 dias
X: duração da bateria  ;
  100 dias

P(X  312) = P(Z  - 2,88) = 0,5 - P(- 2,88  Z  0) = 0,5 - 0,498012 = 0,001988;

312  600
* Z1    2 ,88 ;
100

 Deverá substituir mensalmente: 10000(0,001988) = 19,88  20 baterias.

2 Aproximação da distribuição Binomial pela distribuição normal


n
Seja X: B(n , p). Pode-se escrever X  X i onde as variáveis X1 , X2 , ... , Xn
i 1
são independentes, cada uma com distribuição de Bernoulli.

 E( X i )  p
Neste caso  i = 1, 2, ... , n;
VAR( X i )  pq

n
Então, E(X) =  E ( X i ) = np e
i 1
n
VAR(X) = Var ( X ) = npq.
i
i 1

X  np
Logo, para n suficientemente grande, a variável Z   N (0,1) .
npq

Essa aproximação é chamada de MOIVRE - LAPLACE.

Para n grande (n  ) a aproximação fica:

P(X = k)  P(k - ½  X  k + ½) e

P(a  X  b)  P(a - ½  X  b + ½ ).


Estatística básica – Prof. Wilson Alves de Oliveira
24

Exemplos:
1) Lança-se uma moeda 20 vezes. Qual a probabilidade de se obter de uma a cinco caras,
usando:
a) distribuição binomial;
b) aproximação da binomial pela normal.
X: Nº de caras  X: B(20 , 1/2);

a) P(1  X  5) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 0,0207;

b) Se X: B(20, ½ ) então,  = np = 20(1/2) = 10;

 2  n p q 10(1 / 2)  5 e   5  2 ,24 ;

 P(1  X  5)  P(1 - ½  X  5 + ½ ) = P(0,5  X  5,5) =

= P(- 4,24  Z  - 2, 01) = 0,5 - 0,477784 = 0,022216 ;

0,5  10 5,5  10
* Z1   4,24; Z2   2,01.
2,24 2,24

2) Um sistema é formado por 100 componentes, cada um dos quais com confiabilidade de
0,95 (probabilidade de funcionamento do componente durante um certo período de
tempo). Se esses componentes funcionam independente um do outro e se o sistema
completo funciona adequadamente quando pelo menos 80 componentes funcionam, qual a
confiabilidade do sistema?

Seja X: o número de componentes que funciona, então X: B(100;0,95).

Usando a aproximação da binomial pela normal, temos:

  np  100(0,95)  95 ;

 2  npq  100(0,95)(0,05)  4,75    2,18 ;

P(80  X  100)  P(80 – 0,5  X  100 + 0,5) = P(79,5  X  100,5) =

= P(-7,11  Z  2,52) = 0,5 + 0,494132 = 0,994132;

79,5  95 100,5  95
Z1   7,11; Z2   2,52 .
2,18 2,18

Logo a confiabilidade do sistema é de 99,41%.


Estatística básica – Prof. Wilson Alves de Oliveira

Você também pode gostar