Escolar Documentos
Profissional Documentos
Cultura Documentos
1 Estatística
Definição 1.1 Estatística é uma ciência que se dedica à coleta, organização, análise,
interpretação e apresentação de informações que possam ser colocadas sob forma nu-
mérica (ou não) e que servirão de base para inferências. Ela é composta de um conjunto
de técnicas para se obter conhecimento preciso, a partir de informações incompletas.
• Estatística Descritiva
2 Estatística Descritiva
1
4 População e Amostra
5 Amostragem
São amostragens em que a seleção é aleatória de tal forma que cada elemento da
população tem uma probabilidade conhecida de fazer parte da amostra. Assim, se N
define o tamanho da população e se todos os elementos da população possuem igual
probabilidade, teremos que 1/N é a probabilidade de cada elemento participar da
amostra.
2
partir de observações da amostra) há necessidade de que o processo seja probabilístico,
pois somente neste caso poderemos avaliar a probabilidade de erro.
i. Devemos numerar todos os elementos da população. Se, por exemplo, nossa popu-
lação tem 5000 elementos, devemos numerá-los de 0000 a 4999 ou, como acontece
geralmente, usamos um número que já identifica o elemento.
ii. Devemos efetuar sucessivos sorteios com reposição até completar o tamanho da
amostra (n).
3
(01) Aristóteles (02) Anastácia (03) Arnaldo (04) Bartolomeu
(05) Bernadino (06) Cardoso (07) Carlito (08) Cláudio
(09) Ermílio (10) Ercílio (11) Ernestino (12) Endevaldo
(13) Francisco (14) Felício (15) Fabrício (16) Geraldo
(17) Gabriel (18) Getúlio (19) Hiraldo (20) João da Silva
(21) Joana (22) Joaquim (23) Joaquina (24) José da Silva
(25) José de Souza (26) Josefa (27) Josefina (28) Maria José
(29) Maria Cristina (30) Mauro (31) Paula (32) Paulo César
Procedimento:
Exemplo 5.2 Seja N = 500 e n = 50. Então, 500/50 = 10, a = 10. Sorteia-se um
número entre 1 e 10. Seja 3 (x = 3) o número sorteado. Logo, os elementos numerados
por 3; 13; 23; 33; . . . serão componentes da amostra.
4
5.3.3 Amostragem Estratificada (AE)
n1 + n2 + n3 + ... + nL = n,
Exemplo 5.3 Com o objetivo de levantar o estilo de liderança preferido pela comuni-
dade de uma escola, vamos realizar um levantamento por amostragem. A população é
composta por 10 professores, 10 servidores e 30 alunos, que identificaremos da seguinte
maneira:
Professores: P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
Servidores: S1 S2 S3 S4 S5 S6 S7 S8 S9 S10
Alunos: A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
A11 A12 A13 A14 A15 A16 A17 A18 A19 A20
A21 A22 A23 A24 A25 A26 A27 A28 A29 A30
5
mente homogêneo dentro de cada categoria. Assim, vamos realizar uma amostragem
estratificada, proporcional por categoria, para obter a amostra global.
Estrato 1:
Estrato 2:
Estrato 3:
6
Obs.: Em algumas pesquisas em grande escala, a amostragem pode ser feita em mais
estágios. Por exemplo, para selecionar uma amostra de domicílios do RN, podemos,
no primeiro estágio, selecionar municípios; no segundo estágio, selecionar quarteirões
e, finalmente, no terceiro estágio, selecionar domicílios.
Ruas Domicílios
A A1 A2 A3 A4 A5 A6
B B1 B2 B3 B4 B5 B6 B7 B8 B9 B10
B11 B12 B13 B14
C C1 C2 C3 C4 C5 C6 C7 C8
D D1 D2 D3 D4
E E1 E2 E3 E4 E5 E6 E7 E8
7
2o ESTÁGIO: Para satisfazer a fração de amostragem de 50% em cada conglomerado,
selecionamos:
6 Tipos de Variáveis
Pode assumir qualquer valor num intervalo. Ex.: tempo de permanência, peso, com-
primento, Q.I., etc. Resulta de medições numa escala.
8
7 O Método Científico
9
• Definição do problema, objetivos (geral e específico);
• Planejamento;
• Coleta de dados;
1. Definição do problema:
2. Planejamento:
Nesta fase é importante a escolha das perguntas, que, na medida do possível, devem
ser fechadas. No caso de um experimento, deve-se atentar para os objetivos que
se pretende alcançar.
10
Outros elementos do planejamento de uma pesquisa são: cronograma das ati-
vidades, custos envolvidos, exame das informações disponíveis, delineamento da
amostra, etc.
3. Coleta de dados:
Consiste na busca ou compilação dos dados. Quanto ao tempo, ela pode ser
classificada em:
Esta fase consiste em tirar conclusões que auxiliem o pesquisador a resolver seu
problema, descrevendo o fenômeno através do cálculo de medidas estatísticas, es-
pecialmente as de posição e as de dispersão.
11
7.3 O Julgamento Estatístico
Como já foi dito, o campo da estatística lida com a coleta, a apresentação, a análise e o
uso dos dados para tomar decisões, resolver problemas e planejar produtos e processos.
Devido a muitos aspectos da prática de engenharia envolverem o trabalho com dados,
obviamente algum conhecimento de estatística é importante para qualquer engenheiro.
Especificamente, técnicas estatísticas podem ser uma ajuda poderosa no planejamento
de novos produtos e sistemas, melhorando os projetos existentes e planejando, desen-
volvendo e melhorando os processos de produção.
Métodos estatísticos são usados para nos ajudar a entender a variabilidade. Por
variabilidade, queremos dizer sucessivas observações de um sistema ou fenômeno não
produzem exatamente o mesmo resultado. Todos nós encontramos variabilidade em
nosso dia-a-dia e o julgamento estatístico pode nos dar uma maneira útil para incor-
porar essa variabilidade em nossos processos de tomada de decisão.
O gráfico de pontos nos permite ver facilmente duas características dos dados; a
localização ou o meio, e o espalhamento ou a variabilidade.
12
12.4 12.6 12.8 13.0 13.2 13.4 13.6
8 Distribuição de Freqüências
É uma série estatística em que os dados são agrupados em classes ou categorias, com
suas respectivas freqüências absolutas e percentuais, com o objetivo de facilitar ao
analista o seu estudo. As distribuições de freqüências podem ser divididas em dois
tipos.
13
a) Número de alunos da classe X;
Exemplo 8.2 Distribuição de freqüências para X: Número de erros por página ob-
servados em um livro de matemática
Em que
fi : corresponde a freqüência absoluta, isto é, o número de vezes que cada uma das
categorias ocorre.
14
Exemplo 8.3 Exemplos de variáveis contínuas:
50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 88 41 78 56
72 56 17 7 69 30 80 56 29 33 46 31 39 20 18 29 34 59 73 77
36 39 30 62 54 67 39 31 53 44
8.2.2 Rol
Exemplo 8.5 Rol para o número de minutos que 50 assinantes da Internet gastaram
durante sua conexão mais recente.
15
7 7 11 17 17 18 19 20 21 22 23 28 29 29 30 30 31 31 33 34
36 37 39 39 39 40 41 41 42 44 44 46 50 51 53 54 54 56 56 56
59 62 67 69 72 73 77 78 80 88
r = max(xi ) − min(xi )
Exemplo 8.6 Amplitude total para o número de minutos que 50 assinantes da Inter-
net gastaram durante sua conexão mais recente.
r = 88 − 7 = 81 minutos.
c = 1 + 3, 33 × log(n),
Exemplo 8.7 Para determinar o número de classes para os dados dos assinantes da
16
Internet, tem-se:
c = 1 + 3, 33 × log50 = 6, 657570114 ∼
= 7 classes.
i = r ÷ c.
Exemplo 8.8 Determinar o tamanho dos intervalos de classe para os dados dos assi-
nantes da Internet:
i = 81 ÷ 7 = 11, 57 ∼
= 12 minutos.
Além dos itens principais acima especificados, destacam-se os seguintes elementos que
complementam uma distribuição de freqüências em classes:
o
fi : freqüência absoluta, ou seja, n de ocorrências (elementos) de cada classe;
f %: freqüência percentual;
17
F ↓: freqüência absoluta acumulada “abaixo de”;
8.3.1 Histograma
18
8.3.2 Polígono de Freqüências
São medidas que tendem para o centro da distribuição dos dados e têm a capacidade
de representá-la como um todo. As principais são:
• Média Aritmética
• Mediana
• Moda
• Algumas Separatrizes
19
média da amostra será:
n
x1 + x2 + · · · + xn 1X
x= = xi
n n i=1
N
1 X
µ= xi
N i=1
Embora a média da amostra seja útil, ela não transmite toda a informação acerca
de uma amostra de dados. A variabilidade ou dispersão nos dados pode ser descrita
pela variância ou o desvio-padrão da amostra.
A fórmula será dada pela soma do produto de cada elemento pela sua freqüência
20
absoluta, dividida pela soma das freqüências absolutas, ou seja:
Pn
x i fi
x = Pi=1
n
i=1 fi
Exemplo 9.2 Calcular o número médio de erros por página para os dados do Exem-
plo 8.2.
No de acidentes No de motoristas
0 20
1 10
2 16
3 9
4 6
5 5
6 3
7 1
Total 70
A fórmula será a mesma do item anterior, sendo o xi representado pelo ponto médio
de cada classe.
Exemplo 9.4 Calcular o tempo médio gasto pelos assinantes da Internet usando
os dados do Exemplo 8.9.
21
fi xi xi fi
6 13 78
10 25 250
13 37 481
8 49 392
5 61 305
6 73 438
2 85 170
50 - 2114
Pn
x i fi 2114
x = Pi=1
n = = 42,3 minutos
i=1 fi 50
9.2 Mediana
Valor que divide a distribuição dos dados em duas partes iguais, em relação à quanti-
dade de elementos.
22
b) Se n é par, a mediana é a semi-soma dos dois elementos centrais.
2. através do histograma.
PM e − F ↓−
M e = liM e + iM e ,
fM e
em que:
Pn
i=1 fi 50
PM e = = = 25 ⇒ a mediana está na 3a classe.
2 2
23
Logo,
25 − 16
M e = 31 + 12 = 39,3 minutos.
13
9.3 Moda
Exemplo 9.7 3 5 6 6 6 7 8 8 9
Exemplo 9.8 2 5 5 5 6 7 9 9 9 10 10
Exemplo 9.9 4 4 4 5 6 7 7 7 8 9 9 9
Exemplo 9.10 2 3 5 7 9 11 12 14 16
24
Quando os dados estão agrupados em uma distribuição de freqüência em classes,
pode-se determinar a moda através de quatro processos. Porém, aqui estudaremos
a determinação apenas da Moda de Pearson. Este tipo de moda é utilizada para
a análise da assimetria/concentração, sendo calculada em função da média e da
mediana, a moda de Pearson é dada por:
M op = 3M e − 2x.
b) Uma distribuição é assimétrica à esquerda quando x < M e < M op, o que representa
uma maior concentração nos valores maiores;
9.5 Separatrizes
25
1. Mediana (M e): divide em duas partes iguais;
1. Posição da mediana:
Pn
i=1 fi
PM e =
2
PM e − F ↓−
M e = liM e + iM e
fM e
Pn
x i=1 fi
PQx = , x = 1, 2, 3
4
PQx − F ↓−
Qx = liQx + iQx
fQx
26
3. Posição dos decis:
Pn
x i=1 fi
PDx = , x = 1, 2, . . . , 9
10
PDx − F ↓−
Dx = liDx + iDx
fDx
Pn
x i=1 fi
PP x = , x = 1, 2, . . . , 99
100
PP x − F ↓−
P x = liP x + iP x
fP x
10 Medidas de Dispersão
27
• Amplitude - r
• Coeficiente de variação - cv
Pn
2 − x)2
i=1 (xi
s =
n−1
s2 = n
.
n−1
28
σ, denotará o desvio-padrão da população. Quando a população for finita e consistir
em N valores, podemos definir a variância da população como:
PN
2 i=1 (xi − µ)2
σ = .
N
Pn
2 i=1 (xi − x)2 fi
s = Pn
( i=1 fi ) − 1
e
sP
n
i=1 (xi − x)2 fi
s= .
( ni=1 fi ) − 1
P
10.2 Amplitude
29
r = max (xi ) − min (xi )
s
cv = 100
x
30
11 Sumário e Apresentação de Dados
31
Tabela 1: Resistência à compressão de 80 corpos de prova da liga de alumínio-lítio
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
32
11.2 Box Plot
33
Exemplo 11.3 Construir um box plot para os dados da distribuição dos tempos que
50 assinantes da Internet gastaram durante sua conexão mais recente (Exemplo 8.9).
34
12 Introdução à Probabilidade
Experimento aleatório é aquele que poderá ser repetido sob as mesmas condições in-
definidamente. Tal experimento apresenta variações de resultados, não sendo possível
afirmar qual será sua determinação antes que o mesmo tenha sido realizado. É possí-
vel, porém, descrever todos os possíveis resultados, as probabilidades. O lançamento
de um dado constitui um experimento aleatório, pois este experimento poderá ser re-
petido quantas vezes desejarmos. Antes do lançamento, não poderemos dizer qual será
o resultado, mas somos capazes de relatar os possíveis resultados: sair o número 1, 2,
3, 4, 5 ou 6. Da mesma maneira, os experimentos abaixo são aleatórios:
Exemplo 12.1 E1 = Retirar uma carta de um baralho com 52 cartas e observar seu
naipe.
Exemplo 12.2 E2 = Retirar com ou sem reposição uma bola de uma urna que contém
5 bolas brancas e 6 pretas e observar sua cor.
35
Exemplo 12.5 S1 = {copas, ouros, espadas, paus}
12.3 Evento
E = lançar um dado.
S = {1, 2, 3, 4, 5, 6}
S = {1, 2, 3, 4, 5, 6}
36
Sejam os eventos:
12.4 Probabilidade
I) 0 6 P (A) 6 1
II) P (S) = 1
37
5. Sejam A1 , A2 , . . . , An eventos de S, então
n
! n n n
[ X X X
P Ai = P (Ai ) − P (Ai ∩ Aj ) + P (Ai ∩ Aj ∩ Ak ) + · · · +
i=1 i=1 i6=j i6=j6=k
(−1)(n−1) P (A1 ∩ A2 ∩ · · · ∩ An ).
a) pi > 0, i = 1, 2, . . . , n;
b) p1 + p2 + p3 + · · · + pn = 1.
Exemplo 12.11 Três cavalos, A, B e C, estão em uma corrida; A tem duas vezes mais
probabilidade de ganhar que B, e B tem duas vezes mais probabilidade de ganhar que
C. Quais são as probabilidades de vitória de cada um, isto é, P (A), P (B) e P (C)?
38
12.4.3 Espaços Amostrais Finitos Equiprováveis
Quando nós associamos a cada ponto amostral a mesma probabilidade, o espaço amos-
tral chama-se equiprovável ou uniforme. Em particular, se S contém n pontos, então,
a probabilidade de cada ponto será 1/n.
Por outro lado, se um evento A contém r pontos, então P (A) = r(1/n) = r/n.
Exemplo 12.14 Num lote de 12 peças, 4 são defeituosas. Duas peças são retiradas
aleatoriamente. Calcule:
39
12.4.4 Probabilidade Condicional
P (A ∩ B)
P (A | B) = .
P (B)
P (A ∩ B)
P (A | B) = ⇒ P (A ∩ B) = P (B)P (A | B)
P (B)
ou
P (A ∩ B)
P (B | A) = ⇒ P (A ∩ B) = P (A)P (B | A).
P (A)
Exemplo 12.17 Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma
após a outra sem reposição. Qual a probabilidade de que ambas sejam boas?
40
12.4.6 Teorema da Probabilidade Total
n
X
P (B) = P (B | Ai )P (Ai ).
i=1
B = (B ∩ A1 ) ∪ (B ∩ A2 ) ∪ · · · ∪ (B ∩ An )
P (B) = P (B ∩ A1 ) + P (B ∩ A2 ) + · · · + P (B ∩ An )
41
12.4.7 Independência Estatística
P (A) = P (A | B)
P (B) = P (B | A)
P (A ∩ B) = P (A)P (B)
Exemplo 12.19 Em uma caixa temos 10 peças, das quais 4 são defeituosas. São
retiradas duas peças, uma após a outra, com reposição. Calcular a probabilidade de
ambas serem boas.
42
1 2
L R
3 4
P (Ai )P (B | Ai )
P (Ai | B) = .
P (A1 )P (B | A1 ) + P (A2 )P (B | A2 ) + · · · + P (An )P (B | An )
Urnas
Cores U1 U2 U3
Preta 3 4 2
Branca 1 3 3
Vermelha 5 2 3
43
Escolheu-se uma urna ao acaso e dela extraiu-se uma bola ao acaso, verificando-se que
a bola é branca. Qual a probabilidade de a bola ter vindo da urna 2?
a) Se o veículo parou em certo dia, qual a probabilidade de que tenha havido defeito
mecânico?
13 Variáveis Aleatórias
S R
X
s X(s)
44
X = 1 → corresponde ao evento (k, c), (c, k) com probabilidade 1/2; e
A palavra aleatória indica que X é determinado por uma probabilidade. Existem dois
tipos de variáveis aleatórias: as discretas e as contínuas.
X 0 1 2
P (x) 1/4 1/2 1/4
45
Exemplo 13.4 Considere o lançamento de três moedas. Se ocorre o evento CCC,
dizemos que temos uma seqüência, ao passo que se ocorre o evento CKC temos três
seqüências. Defina a variável aleatória X: no de caras obtidas e Y : no de seqüências,
isso para cada resultado possível. Assim, X(CKK) = 1 e Y (CKK) = 2. Obtenha as
distribuições de probabilidade de X e Y
Z b
P (a < X < b) = f (x)dx,
a
em que Rx é o contradomínio de X.
Observações Importantes:
46
1. A definição acima também nos mostra que a probabilidade de qualquer valor
especificado de X, por exemplo x0 , teremos P (X = x0 ) = 0, pois
Z x0
P (X = x0 ) = f (x)dx = 0.
x0
Sendo assim as probabilidades abaixo serão todas iguais, se X for variável aleatória
contínua:
Exemplo 13.5 Seja X uma variável aleatória contínua. Com a seguinte função den-
sidade de probabilidade:
2x, 0 < x < 1
f (x) =
0, caso contrário.
F (x) = P (X 6 x).
47
Teorema:
X
F (x) = P (xj ),
j
Z x
F (x) = f (s)ds.
−∞
Observe que é muito importante indicar a inclusão ou a exclusão dos limites, na des-
crição dos diversos intervalos.
Exemplo 13.7 Suponha que X seja uma variável contínua com fdp:
2x, 0 < x < 1
f (x) =
0, caso contrário.
48
Portanto, a F é dada por:
0, se x < 0
R
x
F (x) = 0 2sds, se 0 6 x < 1,
1, se x > 1,
isto é
0, se x < 0
F (x) = x2 , se 0 6 x < 1,
1, se x > 1.
a) Se X for uma variável aleatória discreta, com um número finito de valores possíveis,
o gráfico da fd será constituído por seguimentos de reta horizontais (nesse caso, a
fd se denomina função em degraus). A função F é contínua, exceto nos valores
possíveis de X: x1 , . . . , xn , . . . . No valor xj o gráfico apresenta um “salto” de
magnitude p(xj ) = P (X = xj );
b) Se X for uma variável aleatória contínua, F será uma função contínua para todo x;
49
Exemplo 13.8 Construa o gráfico da fd:
0, se x < 0,
1,
se 0 6 x < 1,
3
F (x) =
1
2, se 1 6 x < 2,
1,
se x > 2.
Existem duas outras importantes propriedades da fd, que serão resumidas no teo-
rema seguinte:
Teorema:
50
13.2 Características
n
X
E(X) = xi P (xi ).
i=1
X 1 2 3 4 5 6
P (x) 1/6 1/6 1/6 1/6 1/6 1/6
1 1 1 1 1 1
E(X) = 1 +2 +3 +4 +5 +6 = 3,5.
6 6 6 6 6 6
Exemplo 13.12 Considere duas extrações, sem reposição, de uma urna contendo duas
bolas brancas e três bolas vermelhas. Defina a variável aleatória X: no de bolas
vermelhas obtidas nas duas extrações. Pede-se:
51
d) Calcule a esperança de X.
Z ∞
E(X) = xf (x)dx
−∞
Exemplo 13.13 Seja X uma variável aleatória contínua, com a seguinte função den-
sidade:
3x2 , 0 6 x < 1
f (x) =
0, caso contrário.
Calcular E(X).
Pede-se:
d) Calcule a esperança de X.
52
13.2.2 Propriedades da Esperança
2. Multiplicando uma variável aleatória X por uma constante, sua esperança fica
multiplicada por essa constante:
E(KX) = KE(X);
E(X ± K) = E(X) ± K;
E(X − µx ) = µx − µx = 0;
53
das esperanças:
E(XY ) = E(X)E(Y ).
13.2.3 Variância
n
X
2 2 2
xi 2 P (xi ) .
V ar(X) = E X − [E (X)] , em que E X =
i=1
E(X) = 3,5
1 1 1 1 1 1
E(X 2 ) = 12 + 22 + 32 + 42 + 52 + 62 = 15,17
6 6 6 6 6 6
Exemplo 13.17 Uma livraria mantém extensos registros das vendas diárias dos livros.
Com os dados coletados foi construída a seguinte distribuição de probabilidade da
variável aleatória X: no de livros vendidos por semana:
54
X 0 1 2 3 4 5
P (x) 0,05 0,15 0,42 0,20 0,08 0,10
Pede-se:
b) Calcule a variância de X;
Z ∞
2 2 2
x2 f (x) dx.
V ar(X) = E X − [E (X)] , em que E X =
−∞
Exemplo 13.18 Seja X uma variável aleatória contínua, com a seguinte função den-
sidade:
3x2 , 0 6 x < 1
f (x) =
0, caso contrário.
Calcular V ar(X).
55
13.2.4 Propriedades da Variância
2. Multiplicando-se uma variável aleatória por uma constante, sua variância fica mul-
tiplicada pelo quadrado da constante:
V ar(KX) = K 2 V ar(X);
V ar(X ± K) = V ar(X);
Exemplo 13.20 Um lojista mantém extensos registros das vendas diárias de um certo
aparelho. A tabela abaixo dá a distribuição de probabilidades da variável aleatória X:
no de aparelhos vendidos em uma semana. Se é de R$ 500,00 o lucro por unidade
vendida, qual o lucro esperado em uma semana? Qual é o desvio-padrão do lucro?
X 0 1 2 3 4 5
P (x) 0,1 0,1 0,2 0,3 0,2 0,1
56
13.3 Variáveis Aleatórias Bidimensionais
R
S
X
X(s)
s
Y
Y(s)
Tal como foi dito sobre a variável aleatória unidimensional, (X, Y ) poderá ser
discreta ou contínua, valendo as mesmas considerações feitas anteriormente.
1. p(xi , yj ) > 0;
P∞ P∞
2. j=1 i=1 p(xi , yj ) = 1.
57
Exemplo 13.21 Sejam E = jogar dois dados e X, Y : pontos dos respectivos dados.
Construa a distribuição conjunta de X e Y .
y
x 0 1 2 3
0 0,20 0,20 0,14 0,06
1 0,15 0,08 0,04 0,03
2 0,05 0,02 0,02 0,01
Dada uma distribuição conjunta de duas variáveis aleatórias (X, Y ) podemos deter-
minar as distribuições de X sem considerar Y , ou de considerar Y sem considerar X.
São as chamadas distribuições marginais.
58
Seja (X, Y ) discreta, então:
P (X = xi ) = P (X = xi , −∞ < Y < ∞)
Distribuição marginal de X :
P (X = x ) = P P (x , y )
i j i j
P (Y = yj ) = P (−∞ < X < ∞, Y = yj )
Distribuição marginal de Y :
P (Y = y ) = P P (x , y )
j i i j
Exemplo 13.23 Sejam E = jogar dois dados e X, Y : pontos dos respectivos dados.
Determine as distribuições marginais de X e Y .
1. Covariância:
P P
em que E(XY ) = i j xi yj P (xi , yj ) para (X, Y ) discreta.
Exemplo 13.24 Seja (X, Y ) uma variável aleatória bidimensional discreta com a
seguinte distribuição conjunta:
59
y
x -3 2 4
1 0,1 0,2 0,2
3 0,3 0,1 0,1
Calcular Cov(X, Y ).
2. Coeficiente de correlação:
Cov(X, Y )
ρ(X, Y ) = p p ,
V ar(X) V ar(Y )
em que −1 6 ρ(X, Y ) 6 1.
Seja (X, Y ) uma variável aleatória discreta bidimensional. Diremos que X e Y são va-
riáveis aleatórias independentes se, e somente se, p(xi , yj ) = p(xi )p(yj ) para quaisquer
i e j.
60
x
y 0 1 2 p(y)
0 0,10 0,20 0,20 0,50
1 0,04 0,08 0,08 0,20
2 0,06 0,12 0,12 0,30
p(x) 0,20 0,40 0,40 1,00
Pede-se:
61
d) Calcule as médias e variâncias de X e Y e a covariância entre elas;
14 Distribuições de Probabilidades
X −→ x1 = 1 (sucesso) ou x2 = 0 (fracasso)
P (x) −→ P (x1 ) = p P (x2 ) = 1 − p = q.
Diremos que esta variável, assim definida, tem uma distribuição de Bernoulli. Suas
principais características são:
√
• Desvio-padrão: σ = pq.
62
Então, p = 1/2 ⇒ µ = p = 1/2,
σ 2 = pq = 1/2.1/2 = 1/4 e
√ p
σ= pq = 1/4 = 1/2.
P (X = 0) = qqq . . . q = q n
63
n seqüências e cada uma com um único sucesso e n − 1 fracassos:
P (X = 1) = npq n−1
..
.
n x n−x
P (X = x) = p q .
x
√
• Desvio-padrão: σ = npq.
Exemplo 14.3 Um exame do tipo teste é constituído de 20 questões, cada uma delas
com cinco respostas alternativas, das quais apenas uma é correta. Se um estudante
responde as questões aleatoriamente, qual é a probabilidade que consiga acertar exa-
tamente 10 questões?
Exemplo 14.4 Uma empresa produz 10% de peças defeituosas. As peças são emba-
ladas em caixas que contém 12 peças. Calcule a probabilidade de um cliente comprar
uma caixa contendo:
64
a) Nenhuma peça defeituosa;
Exemplo 14.5 A proporção de itens que atendem as especificações entre os que são
fabricados por determinado processo industrial é igual a p, onde 0 < p < 1. É
selecionada uma amostra aleatória contendo 5 desses itens. Se X é o número de itens
entre eles que atendem as especificações, então dizemos que o resultado do experimento
pode ser considerado:
• Péssimo, se X 6 1;
• Ruim, se X 6 2;
• Bom, se X > 3;
• Ótimo, se X > 4.
a) Qual é o valor de p?
65
lote (n 6 N ), sem reposição. Seja X o número de peças defeituosas encontradas.
Desde que X = k se, e somente se, obtivermos exatamente k peças defeituosas (dentre
as r defeituosas do lote) e exatamente (n − k) não defeituosas (dentre as (N − r) não
defeituosas do lote), teremos:
r N −r
k n−k
P (X = k) = N
, k = 0, 1, . . . .
n
66
14.1.4 Distribuição de Poisson
1. X = 0, 1, 2, . . . ;
2. P (X = k) = e−λ λk /k!;
3. µ = E(X) = λ;
4. σ 2 = V ar(X) = λ.
Uma aplicação imediata deste modelo ocorre quando uma variável aleatória X
admite distribuição binomial com o número n de repetições do experimento muito
grande (n > 30) e com a probabilidade p de sucesso muito pequena (p < 0,05).
n k n−k
p q
k
n k n−k e−λ λk
p q ≈ ,
k k!
em que λ = np, isto é, selecionamos como aproximação para a binomial uma distri-
buição de Poisson com a mesma média da distribuição binomial.
Exemplo 14.8 Uma máquina produz nove peças defeituosas a cada 1.000 peças pro-
duzidas. Calcule a probabilidade de que em um lote que contém:
67
b) 500 peças, não haja nenhuma peça defeituosa.
Exemplo 14.9 Supondo que o número de carros que chegam a uma fila do guichê
de um pedágio tem distribuição de Poisson a uma taxa de três por minuto, calcule a
probabilidade de que cheguem cinco carros nos próximos dois minutos.
Se uma variável aleatória X assume valores no intervalo [a, b] com função densidade
de probabilidade dada por:
1
f (x) = ,
b−a
Descrição do modelo:
1. X ∈ [a, b];
1
2. f (x) = b−a ;
b+a
3. µ = E(X) = 2 ;
(b−a)2
4. σ 2 = V ar(X) = 12 .
68
a) O valor médio das vendas diárias;
Uma variável aleatória X tem distribuição exponencial com parâmetro λ se sua den-
sidade de probabilidade é da forma:
λe−λx , x > 0
f (x) =
0, caso contrário,
69
• Média ou esperança: µ = E(X) = λ1 ;
1
• Variância: σ 2 = V ar(X) = λ2 ;
• Desvio-padrão: σ = λ1 .
a) P (X < 1,5);
b) P (X > 0,4).
b) Suponha que ligamos o contador Geiger e esperamos 3 minutos sem detectar par-
tículas. Qual a probabilidade de uma partícula ser detectada nos próximos 30
segundos?
70
2. Valores da variável aleatória X simétricos em relação à média ocorrem com mesma
freqüência;
3. A região definida pelo gráfico da função e pelo eixo x tem área unitária.
• Média ou esperança: µ;
• Variância: σ 2 ;
• Desvio-padrão: σ.
71
a b
0 z
Esta distribuição normal padrão foi escolhida pelo fato de apresentar os parâmetros
mais simples.
Qualquer variável X que tem distribuição normal com quaisquer média e variân-
cia pode ser transformada, para efeito do cálculo de áreas, na variável Z que tem
72
distribuição normal padrão, através da mudança de variável:
X −µ
Z= .
σ
Conhecendo-se a área especificada na tabela, qualquer outro tipo de área poderá ser
calculada usando-se a simetria da curva.
Uso da tabela
0 1
Note que a área entre zero e um valor positivo é exatamente a área fornecida pela
tabela. Portanto,
73
Exemplo 14.17 Seja uma variável aleatória X que tem distribuição normal com mé-
dia 20 e desvio-padrão 3. Calcule P (20 < X < 23).
Exemplo 14.18 As alturas dos alunos de uma determinada escola são normalmente
distribuídas com média 1,60m e desvio-padrão 0,30m. Encontre a probabilidade de
um aluno medir:
b) mais de 1,75m;
c) menos de 1,48m.
Exemplo 14.19 O salário semanal dos operários industriais são distribuídos normal-
mente em torno de uma média de $180,00 com desvio-padrão de $25,00. Pede-se:
Exemplo 14.20 Suponha que as notas de uma prova sejam normalmente distribuídas
com média 73 e desvio-padrão 15. 15% dos alunos mais adiantados recebem a nota
A e 12% dos mais atrasados recebem nota F . Encontre o mínimo para receber A e o
mínimo para passar, ou seja, não receber F .
74
a) O mecânico comunicou a um cliente que o carro estará pronto em 50 min. Qual a
probabilidade de que o mecânico esteja enganado?
b) Qual deve ser a previsão de tempo de trabalho para que haja 90% de probabilidade
de que o concerto da transmissão seja efetuada dentro do tempo previsto?
15.1 Introdução
Se esse componente for posto sob condições de esforço, em algum instante espe-
cificado, digamos t = 0, e observado até que falhe (isto é, até que pare de funcionar
adequadamente sob o esforço aplicado), a duração até falhar ou duração de vida, T ,
pode ser considerada como uma variável aleatória contínua com alguma fdp f . Existe
grande quantidade de provas empíricas para indicar que o valor de T não pode ser pre-
visto a partir de um modelo determinístico. Isto é, componentes “idênticos” sujeitos a
“idênticos” esforços falharão em diferentes e imprevisíveis instantes. Alguns falharão
logo no início de sua vida e outros em épocas mais tardias. Naturalmente, “o estilo de
75
falhar” variará com o tipo de peça que se esteja considerando. Por exemplo, um fusível
falhará bastante subitamente, no sentido de que em dado momento estará funcionando
perfeitamente e no próximo momento já não funcionará mais. Por outro lado, uma
viga de aço sob uma carga pesada tornar-se-á provavelmente mais fraca durante um
longo período de tempo. De qualquer modo, o emprego de um modelo probabilístico,
com T considerada uma variável aleatória, parece constituir-se no único tratamento
realista do assunto.
Z ∞
R(t) = f (s)ds.
t
R(t) = 1 − P (T 6 t) = 1 − F (t).
76
Além da função de confiabilidade R, outra função desempenha importante papel
na descrição das características de falhas de uma peça.
f (t) f (t)
Z(t) = = ,
1 − F (t) R(t)
P (t 6 T 6 t + ∆t | T > t),
P (t < T 6 t + ∆t)
P (t 6 T 6 t + ∆t | T > t) =
P (T > t)
Z t+∆t
= f (x)dx/P (T > t)
t
= ∆tf (ε)/R(t),
em que t 6 ε 6 t + ∆t.
77
representa a proporção de peças que falharão entre t e t + ∆t, dentre aquelas peças
que estavam ainda funcionando na época t.
Teorema 1: Se T , a duração até falhar, for uma variável aleatória contínua, com fdp
f e se F (0) = 0, onde F é a fd de T , então, f poderá ser expressa em termos da taxa
de falhas Z, da seguinte maneira:
Rt
f (t) = Z(t)e− 0
Z(s)ds
.
Demonstração: Visto que R(t) = 1 − F (t), teremos R0 (t) = −F 0 (t) = −f (t). Daí,
t t
t
R0 (s)
Z Z
Z(s)ds = − ds = − ln R(s) = − ln R(t) + ln R(0) = − ln R(t),
0 0 R(s) 0
desde que ln R(0) = 0, o que vale se, e somente se, R(0) = 1. (Esta última condição
será satisfeita se F (0) = 0. Isto apenas diz que a probabilidade de falha inicial é igual
a zero; adotaremos esta hipótese no restante da exposição). Conseqüentemente,
Rt
R(t) = e− 0
Z(s)ds
.
Portanto,
0d Rt
− 0 Z(s)ds
f (t) = F (t) = [1 − R(t)] = Z(t)e .
dt
78
Existe uma interessante relação entre a função de confiabilidade e a duração média
até falhar, E(T ).
Z ∞
E(T ) = R(t)dt.
0
Demonstração: Considere
Z ∞ Z ∞ Z ∞
R(t)dt = f (s)ds dt.
0 0 t
R∞
Vamos integrar por partes, fazendo t f (s)ds = u e dt = dv. Daí, v = t e du =
−f (t)dt. Portanto,
Z ∞ Z ∞ ∞ Z ∞
R(t)dt = t f (s)ds + tf (t)dt.
0 t 0 0
Z ∞ ∞ h i
t f (s)ds = lim g(t) − g(0) = lim g(t),
t t→∞ t→∞
0
R∞
pois g(0) = 0 0 f (s)ds = 0.
79
Agora, note que para todo t > 0,
Z ∞ Z ∞
0 6 g(t) = tf (s)ds 6 sf (s)ds .
t |t {z }
(*)
Como
Z ∞ Z t Z ∞
E(T ) = sf (s)ds = sf (s)ds + sf (s)ds,
0 0 t
então
Z ∞ Z t
sf (s)ds = E(T ) − sf (s)ds.
t 0
Z ∞ Z t
0 6 g(t) = tf (s)ds 6 E(T ) − sf (s)ds.
t 0
Z t
0 6 lim g(t) 6 E(T ) − lim sf (s)ds = E(T ) − E(T ) = 0.
t→∞ | {z } t→∞ 0
<∞
a) Que “leis de falhas” subjacentes será razoável admitir? (isto é, que forma a fdp de
T deve ter?);
80
b) Suponha-se que temos dois componentes, C1 e C2 , com leis de falhas conhecidas.
Suponha que esses componentes estejam associados em série:
C1 C2
ou em paralelo:
C1
C2
para constituir um sistema. Qual será a lei de falhas (ou confiabilidade) do sistema?
A questão de qual será uma “razoável” lei de falhas nos leva de volta a um problema:
qual é um modelo matemático razoável para a descrição de algum fenômeno observá-
vel? De um ponto de vista estritamente matemático, poderemos admitir qualquer fdp
para T e, depois, simplesmente estudar as conseqüências dessa hipótese. Contudo, se
estivermos interessados em ter um modelo que represente (tão acuradamente quanto
possível) os dados de falhas realmente disponíveis, nossa escolha do modelo terá que
levar isso em consideração.
81
15.2 A Lei de Falha Normal
Existem muitos tipos de componentes cujo comportamento das falhas pode ser repre-
sentado pela distribuição normal. Isto é, se T for a duração da vida de uma peça, sua
fdp será dada por:
( 2 )
1 1 t−µ
f (t) = √ exp − .
2πσ 2 σ
[Novamente salientamos que a duração até falhar, T , deve ser maior que (ou igual
a) zero. Conseqüentemente, a fim de que o modelo acima possa ser aplicado devemos
insistir que P (T < 0) seja essencialmente zero.] Como a forma da fdp normal indica,
a lei de falhas normal significa que a maioria das peças falha em torno da duração
até falhar média, E(T ) = µ e o número de falhas decresce (simetricamente) quando
|T − µ| cresce. A lei de falhas normal indica que cerca de 95,44% das falhas ocorrem
para aqueles valores de t que satisfaçam a {t | |t − µ| < 2σ}.
R(t) = P (T > t) = 1 − P (T 6 t)
Z t ( 2 )
1 1 x−µ
= 1− √ exp − dx
2πσ −∞ 2 σ
t−µ
= 1−Φ .
σ
82
confiabilidade de 0,99 para um período de operação de 100 horas, qual será sua duração
de vida esperada?
Uma das mais importantes leis de falhas é aquela cuja duração até falhar é descrita
pela distribuição exponencial. Poderemos caracterizá-la de muitas maneiras, mas,
provavelmente, a maneira mais simples é supor que a taxa de falhas seja constante.
Isto é, Z(t) = α. Uma conseqüência imediata desta hipótese é que a fdp associada à
duração até falhar T , seja dada por:
Teorema 3: Seja T , a duração até falhar, uma variável aleatória contínua, que tome
todos os valores não-negativos. Então, T terá uma distribuição exponencial se, e
somente se, tiver uma taxa de falhas constante.
Para muitos tipos de componentes, a hipótese que conduz à lei de falhas exponen-
cial é, não somente sugestiva intuitivamente, mas de fato é confirmada pela evidência
empírica. Por exemplo, é bastante razoável admitir-se que um fusível ou um rolamento
de rubis sejam “tão bons quanto novos”, enquanto estiverem ainda funcionando. Isto
é, se o fusível não tiver fundido, estará praticamente em estado de novo; nem o rola-
mento se alterará muito devido a desgaste. Em casos tais como estes, a lei de falhas
83
exponencial representa um modelo adequado com o qual se estudem as características
de falhas da peça.
Contudo, uma palavra de advertência deve ser incluída aqui. Há muitas situações
encontradas nos estudos de falhas, para as quais as hipóteses básicas que levam à
distribuição exponencial não serão satisfeitas. Por exemplo, se um pedaço de aço for
submetido a esforço continuado, haverá obviamente alguma deterioração, e por isso,
um outro modelo, que não o exponencial deve ser examinado. Vamos apresentar, de
forma resumida, as propriedades da distribuição exponencial. Se T , a duração até
falhar, for distribuída exponencialmente (com parâmetro α), teremos:
Exemplo 15.2 Se for dado o parâmetro α e R(t) for especificada, podemos achar t, o
número de horas, por exemplo, de operação. Deste modo, se α = 0,01 e R(t) for igual
a 0,90, teremos:
0,90 = e−0,01t .
Daí, t = −100 ln(0,90) = 10,54 horas. Logo, se cada um de 100 desses componentes
estiver operando durante 10,54 horas, aproximadamente 90 não falharão durante aquele
período.
Nesta seção nos dedicaremos à segunda questão proposta na seção anterior: Como
poderemos avaliar a confiabilidade de um sistema, se conhecemos a confiabilidade de
84
seus componentes?
C1 C2
Isso significa que, a fim de que o sistema funcione, ambos os componentes deverão fun-
cionar. Se, além disso, admitirmos que os componentes funcionem independentemente,
poderemos obter a confiabilidade do sistema, R(t), em termos das confiabilidades dos
componentes, R1 (t) e R2 (t), da seguinte maneira:
componentes C1 e C2 , respectivamente)
= R1 (t)R2 (t).
Assim, achamos que R(t) 6 min[R1 (t), R2 (t)]. Quer dizer, para um sistema formado
de dois componentes independentes, em série, a confiabilidade do sistema é menor do
que a confiabilidade de qualquer de suas partes.
85
do sistema completo, R(t), será dada por:
Em conseqüência, a fdp da duração até falhar do sistema, digamos T , será dada por:
86
Em virtude da taxa de falhas constante admitida, a distribuição exponencial representa
a lei de falhas para cada uma dos componentes acima. Devido a conexão em série, a
duração até falhar para o circuito completo será também distribuída exponencialmente
com parâmetro (taxa de falhas) igual a:
R(t) = e−0,0001t .
87
1 2 3
C1
C2
R(t) = P (T > t) = 1 − P (T 6 t)
= 1 − P (T1 6 t e T2 6 t)
= 1 − [1 − R1 (t)][1 − R2 (t)]
88
A última forma indica que R(t) > máximo[R1 (t), R2 (t)]. Isto é, um sistema composto
de dois componentes em paralelo, que funcionem independentemente, será de maior
confiança que qualquer dos componentes.
Todas as idéias expostas acima para dois componentes podem ser generalizadas no
seguinte teorema:
R(t) = 1 − [1 − r(t)]n .
Portanto, a fdp da duração até falhar do sistema em paralelo, T , será dada por:
89
é igual a:
1 1 1
E(T ) = + − .
α1 α2 α1 + α2
Exemplo 15.5 Suponhamos que dispomos de três componentes. Admita que todos
tenham a mesma taxa de falhas constante α = 0,01. (Isto é, a duração até falhar de
cada componente é exponencialmente distribuída com parâmetro α = 0,01.) Portanto,
a confiabilidade de cada componente é R(t) = e−0,01t , e, por isso, a confiabilidade para
um período de operação de 10 horas é igual a e−0,1 = 0,905 ou cerca de 90%. Quanto
de melhoria poderíamos obter (em termos de aumento de confiabilidade) pela operação
de três desses componentes em paralelo?
90
Exemplo 15.6 As bombas A, B e C são bombas de carga de uma planta. Para
operar corretamente, a unidade necessita que pelo menos duas destas bombas estejam
operando. A probabilidade de falha de cada uma é de 10%, ao longo de uma campa-
nha. Suponha que essas bombas estão montadas segundo o sistema abaixo. Qual a
confiabilidade do sistema de alimentação desta planta ao longo da campanha?
91