Escolar Documentos
Profissional Documentos
Cultura Documentos
n
c
i
a
Figura 4.1- Histograma de resistncia.
21
Os histogramas so largamente utilizados na comparao de aptido de processos com seus limites
de tolerncias. Segundo JURAN, anlises de histogramas, para que sejam tiradas concluses alm dos dados
amostrais, devem ser baseadas em pelo menos 50 medies.
Um outro exemplo de organizao de dados proposto por KUME. Deseja-se investigar a
distribuio dos dimetros de eixos de ao produzidos em um processo de usinagem, os dimetros de 90 eixos
foram medidos conforme mostra a Tabela 4.5.
Tabela 4.5 - Dados originais do problema
Amostra 01-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90
2,510 2,527 2,529 2,520 2,535 2,533 2,525 2,531 2,518
2,517 2,536 2,523 2,514 2,523 2,510 2,515 2,545 2,527
2,522 2,506 2,523 2,512 2,526 2,542 2,520 2,524 2,511
2,522 2,541 2,523 2,534 2,525 2,524 2,519 2,522 2,519
2,510 2,512 2,519 2,526 2,532 2,530 2,526 2,520 2,531
2,511 2,515 2,528 2,530 2,522 2,521 2,527 2,519 2,527
2,519 2,521 2,543 2,532 2,502 2,522 2,522 2,519 2,529
2,532 2,536 2,538 2,526 2,530 2,535 2,542 2,529 2,528
2,543 2,529 2,518 2,523 2,522 2,540 2,540 2,522 2,519
R
e
s
u
l
t
a
d
o
d
a
s
M
e
d
i
e
s
(
m
m
)
2,525 2,524 2,534 2,520 2,514 2,528 2,528 2,513 2,521
Procedimento Exemplo
Etapa 1 Calcular a amplitude (R)
Obtenha o maior e o menor dos valores observados e
calcule R.
R = (o maior valor) (o menor valor)
O maior e o menor dos valores observados podem ser
facilmente obtendo-se o mximo e o mnimo dos
valores de cada coluna da tabela de observaes.
Depois, tomando-se o maior dos valores mximos e o
menor dos valores mnimos, acha-se os limites da
tabela.
Etapa 1 Calcular R
R foi obtida a partir do maior e do menor valores
observados (Tabela 4.6)
O maior valor = 2,545
O menor valor = 2,502
Portanto:
R = 2,545 2,502 = 0,043
Etapa 2 Determinar o intervalo de classe
O intervalo de classe determinado de forma que
amplitude, que compreende o maior e o menor dos
valores, seja dividida em intervalos de mesmo
tamanho.
Para obter o tamanho dos intervalos, divida R por 1, 2
ou 5 (ou 10; 20; 50 ou 0,1; 0,2; 0,5; etc.) de forma a
obter de 5 a 20 intervalos de classe de tamanho igual.
Quando houver duas possibilidades, use o tamanho de
intervalo menor se o nmero de valores observados
for maior ou igual a 100, e o tamanho de intervalo
Etapa 2 Determinar o intervalo de classe
0,043 / 0,002 = 21,5 adota-se 22
(nmero inteiro mais prximo)
0,043 / 0,005 = 8,6 adota-se 9
(nmero inteiro mais prximo)
0,043 / 0,010 = 4,3 adota-se 4
(nmero inteiro mais prximo)
22
maior se houver 99 ou menos valores observados.
Etapa 3 Preparar a tabela de freqncia
Prepare um formulrio como o da Tabela 4.7, no qual
possam ser registradas as classes, o ponto mdio, as
marcas de freqncia, freqncia, etc.
Etapa 3 Preparar a tabela de freqncia
Prepare uma tabela conforme mostra a Tabela 4.7
Tabela 4.6 - Determinao da Amplitude
Amostra 01-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90
2,510 2,527 2,529 2,520 2,535 2,533 2,525 2,531 2,518
2,517 2,536 2,523 2,514 2,523 2,510 2,515 2,545 2,527
2,522 2,506 2,523 2,512 2,526 2,542 2,520 2,524 2,511
2,522 2,541 2,523 2,534 2,525 2,524 2,519 2,522 2,519
2,510 2,512 2,519 2,526 2,532 2,530 2,526 2,520 2,531
2,511 2,515 2,528 2,530 2,522 2,521 2,527 2,519 2,527
2,519 2,521 2,543 2,532 2,502 2,522 2,522 2,519 2,529
2,532 2,536 2,538 2,526 2,530 2,535 2,542 2,529 2,528
2,543 2,529 2,518 2,523 2,522 2,540 2,540 2,522 2,519
R
e
s
u
l
t
a
d
o
d
a
s
M
e
d
i
e
s
(
m
m
)
2,525 2,524 2,534 2,520 2,514 2,528 2,528 2,513 2,521
M
e
n
o
r
e
M
a
i
o
r
v
a
l
o
r
e
s
d
a
T
a
b
e
l
a
Mximo 2,543 2,541 2,543 2,534 2,535 2,542 2,542 2,545 2,531 2,545
Mnimo -9 -9 -9 -9 -9 -9 -9 -9 -9 2,502
Etapa 4 Determinar os limites das classes
Determine os limites dos intervalos, de forma que
englobem o menor e o maior dos valores registrados, e
anote-os na tabela de freqncia.
Determine, primeiro, o limite inferior da primeira classe
e adicione a este o tamanho do intervalo para obter o
limite entre a primeira e a segunda classe. Quando fizer
isso, assegure-se de que a primeira classe contm o
menor valor observado e que os valores dos limites
tenham uma casa decimal a mais do que a preciso dos
valores medidos.
Depois, adicione sucessivamente o tamanho do
intervalo ao valor do limite anterior para obter o
segundo limite, o terceiro, e assim por diante, e
verifique se a ltima classe inclui o maior valor
observado.
Etapa 4 Determinar os limites das classes
Os limites da primeira classe devem ser
determinados como 2,5005 e 2,5055 de forma que a
classe inclua o menor valor 2,502; os limites da
segunda classe devem ser determinados como
2,5055 e 2,5105, e assim por diante.
Registre esses limites numa tabela de freqncia.
Etapa 5 Calcular o ponto mdio da classe
Usando a equao seguinte, calcule o ponto mdio das
classes e anote-os na tabela de freqncia.
Ponto mdio da primeira classe
2
classe primeira da inferior e superior limites dos soma
Ponto mdio da segunda classe
2
classe segunda da inferior e superior limites dos soma
Etapa 5 Calcular o ponto mdio da classe
Ponto mdio da primeira classe
503 , 2
2
5055 , 2 5005 , 2
+
,
Ponto mdio da segunda classe
508 , 2
2
5105 , 2 5055 , 2
+
23
e assim por diante.
Os pontos mdios da segunda classe, da terceira classe
e demais classes, tambm podem ser obtidos da
seguinte forma:
Ponto mdio da segunda classe = ponto mdio da
primeira classe + intervalo de classe
Ponto mdio da terceira classe = ponto mdio da
segunda classe + intervalo de classe
e assim por diante.
Etapa 6 - Obter as freqncias
Leia os valores observados um por um e registre as
freqncias obtidas em cada classe usando marcas de
contagem em grupos de 5, como segue:
Freqncia 1 2 3 4 5
Notao da
freqncia
/ // /// //// ////
Freqncia 6 7 ...
Notao da
freqncia
//// / //// // ...
Etapa 6 - Obter as freqncias
Registre as freqncias (Tabela 4.7)
Classe
Ponto Mdio
da Classe
Marcas de Freqncias Freqncia f
1 2,5005 2,5055 2,503 / 1
2 2,5055 2,5105 2,508 //// 4
3 2,5105 2,5155 2,513 //// //// 9
4 2,5155 2,5205 2,518 //// //// //// 14
5 2,5205 2,5255 2,523 //// //// //// //// // 22
6 2,5255 2,5305 2,528 //// //// //// //// 19
7 2,5305 2,5355 2,533 //// //// 10
8 2,5355 2,5405 2,538 //// 5
9 2,5405 2,5455 2,543 //// / 6
Total - - 90
Observao: (1) A soma das freqncias f tem que ser igual quantidade (n) de dados levantados. (2) A
freqncia relativa, quando necessria, obtida pela diviso de f por n.
4.6.1 - Como construir um Histograma
Em uma folha de papel quadriculado, marque o eixo horizontal com uma escala. melhor que a
escala no seja baseada nos limites de intervalo das classes e sem na unidade de medida dos dados, 10 gramas
correspondendo 10mm, por exemplo. Isto torna-a conveniente para fazer comparaes entre vrios
histogramas que descrevem fatores e caractersticas semelhantes, bem como com especificaes (padres).
Deixe um espao aproximadamente igual ao intervalo de classe em cada extremidade do eixo horizontal,
antes da primeira e aps a ltima classe.
Marque o eixo vertical do lado esquerdo com uma escala de freqncia e, se necessrio, trace o eixo
vertical do lado direito e marque-o com uma escala de freqncia relativa. A altura da classe com a
24
freqncia mxima deveria ser de 0,5 a 2,0 vezes a distncia entre os valores mximo e mnimo do eixo
horizontal.
Marque os valores dos limites das classes no eixo horizontal. Usando o intervalo de classe como
base, desenhe um retngulo cuja altura corresponda freqncia daquela classe.
Trace uma linha no histograma para representar a mdia e, se for o caso, trace tambm os limites da
especificao.
Numa rea em branco do histograma, anote o histrico dos dados (o perodo em que os dados foram
coletados, etc.), a quantidade de dados (n), a mdia x e o desvio-padro ().
4.6.2 - Tipos de Histograma
possvel obter informaes teis sobre a populao pela anlise da forma do histograma. As
seguintes formas so tpicas, podendo utiliza-las como modelos para anlise de um processo.
25
a) Tipo geral (simtrico ou em forma de sino)
Forma: O valor mdio do histograma est no meio da amplitude dos dados. A freqncia mais alta no
meio e torna-se gradualmente mais baixa na direo dos extremos. A forma simtrica.
Nota: Esta a forma que ocorre mais freqentemente.
b) Tipo pente (tipo multi-modal)
Forma: Vrias classes tm, como vizinhas, classes com menor freqncia.
Nota: Esta forma ocorre quando a quantidade de dados includos na classe varia de classe para classe ou
quando existe uma tendncia particular no modo como os dados so arredondados
c) Tipo assimtrico positivo (tipo assimtrico negativo)
Forma: O valor mdio do histograma fica localizado esquerda (direita) do centro da amplitude. A
freqncia decresce de modo um tanto abrupto em direo esquerda (direita), porm de modo
suave em direo direita (esquerda). assimtrica.
Nota: Esta forma ocorre quando o limite inferior (superior) controlado, ou teoricamente, ou por um valor
de especificao, ou quando valores menores (maiores) do que um valor no ocorrem.
d) Tipo abrupto esquerda (tipo abrupto direita)
Forma: O valor mdio do histograma fica localizado bem esquerda (direita) do centro da amplitude. A
freqncia decresce abruptamente esquerda (direita), e suavemente em direo direita (esquerda).
assimtrica.
Nota: Esta uma forma que ocorre freqentemente quando feita uma inspeo separadora 100% por
causa da baixa capacidade do processo e tambm quando a assimetria positiva (negativa) se torna
ainda mais extrema.
26
e) Tipo achatado
Forma: As freqncias das classes formam um achatamento porque as classes possuem mais ou menos a
mesma freqncia, exceto aquelas das extremidades.
Nota: Esta forma ocorre com a mistura de vrias distribuies que tm diferentes mdias.
f) Tipo abrupto esquerda (tipo abrupto direita)
Forma: A freqncia baixa prximo ao meio da amplitude de dados e existe um pico em cada lado.
Nota: Esta forma ocorre quando duas distribuies, com mdias muito diferentes, so misturadas.
g) Tipo pico isolado
Forma: Num histograma do tipo geral existe mais um pequeno pico isolado.
Nota: Esta uma forma que surge quando h uma pequena incluso de dados provenientes de uma
distribuio diferente, como nos casos de anormalidade de processo, erro de medio ou incluso de
dados de um processo diferente.
4.7 - Caractersticas amostrais
A estatstica descritiva prope um mtodo simples de extrair informaes de uma massa de nmeros
aparentemente sem lgica. Estas caractersticas podem representar:
Um valor tpico ou central. Enquadram-se mdia, mediana e moda.
Uma medida de disperso. Enquadram-se varincia, desvio-padro e amplitude.
Uma medida de freqncia. Enquadra-se a curva de percentil.
Uma curva de percentil um grfico de a distribuio percentil acumulada dos dados (freqncia
acumulada) versus os valores dos dados. Por exemplo para os dados de resistncia das 100 bobinas da Tabela
4.2 constri-se a curva de percentil conforme a Figura 4.2.
0
10
20
30
40
50
60
70
80
90
100
3
,
2
7
3
,
2
9
3
,
3
1
3
,
3
3
3
,
3
5
3
,
3
7
3
,
3
9
3
,
4
1
3
,
4
3
resistncia x
e
s
c
a
l
a
p
e
r
c
e
n
t
i
l
y
mediana = 3,34
Figura 4.2- Curva de percentil para um conjunto de dados.
27
Percebe-se pela curva que, por exemplo, 5% dos dados esto com ou abaixo de 3,29, e assim pode-
se avaliar as chances de ocorrncia dos valores. A maioria dos trabalhos estatsticos usa a curva de percentil
sob o nome funo de distribuio dos dados. Observa-se ainda que nenhum dos dados descartado (ou
agrupado) na elaborao da curva, preservando todas as informaes, ao contrrio do histograma dos dados.
4.8 - Medidas de Tendncia Central
A maioria das distribuies de freqncia exibe uma tendncia central, isto , uma forma tal que a
maior parte das observaes se acumula na rea entre os dois extremos. Tendncia Central um dos conceitos
fundamentais em toda a anlise estatstica.
H trs medidas principais de tendncia central: mdia aritmtica, mediana e moda.
A Mdia Aritmtica (ou simplesmente mdia) usada para distribuies simtricas ou quase
simtricas, ou para distribuies que tm um nico pico dominante. calculada somando-se as observaes e
dividindo-se pelo nmero de observaes.
X
n
i
i
n
x
1
(4.1)
A Mediana o valor central quando os dados esto ordenados por valor. usada para reduzir o
efeito dos valores extremos ou para dados que possam ser ordenados mas que no sejam economicamente
mensurveis (tons de cor, aparncia visual, odores). Na curva percentil, o valor da escala horizontal onde a
curva alcana a altura 50%.
A Moda o valor que ocorre com maior freqncia. usada para distribuies extremamente
assimtricas, situaes irregulares onde dois picos so encontrados, ou para eliminar os efeitos dos valores
extremos.
4.9 - Medidas de Disperso
Os dados esto sempre dispersos ao redor da zona de tendncia central, e a extenso dessa disperso
chamada disperso ou variao. Uma medida de disperso a segunda das duas medidas mais fundamentais
em toda a anlise estatstica.
H vrias medidas de disperso. A mais simples a Amplitude, que a diferena entre os valores
mximo e mnimo dos dados. Como a amplitude baseada em dois nmeros, mais til quando o nmero de
observaes pequeno ( cerca de 10 ou menos).
O Desvio-Padro a medida mais importante de variao, ele determina a disperso dos valores em
relao mdia. A definio do Desvio-Padro da amostra :
1
) (
2
n
X X
s
(4.2)
Onde: s o desvio-padro amostral, X os valores observados, X a mdia aritmtica e n o nmero de
observaes.
Quando necessrio distinguir entre o desvio padro de uma populao e o de uma amostra dela
extrada, adota-se freqentemente o smbolo () e (s) respectivamente.
Para fins de clculo uma frmula equivalente :
) 1 (
) ( ) (
2 2
n n
X X n
s (4.3)
28
O Desvio Padro tem as seguintes propriedades:
1) A Varincia o quadrado do desvio-padro. Ou seja:
V s
2
Com dados em forma de distribuio de freqncia, clculos simplificados podem facilitar a
determinao da mdia e do desvio-padro.
i
n
d f
A X
,
_
+
'
(4.4)
onde A tem origem arbitrria.
( ) ( )
) 1 (
' . ' .
2 2
n n
d f fd n
i s (4.5)
ou ainda,
( )
( )
) 1 (
'
'
2
2
n
n
fd
fd
i s
(4.6)
Se um conjunto de dados ordenado em ordem de grandeza, o valor mdio (ou mdia aritmtica dos
dois valores mdios) que divide o conjunto em duas partes iguais a mediana. Por extenso desse conceito,
pode-se pensar nos valores que dividem o conjunto em quatro partes iguais. Esses valores, representados por
Q
1
, Q
2
e Q
3
denominam-se primeiro, segundo, terceiro quartis, respectivamente, sendo o valor Q
2
igual
mediana.
A diferena entre Q
1
e Q
3
a amplitude quartil. A amplitude semi-quartil definida por:
2
1 3
Q Q
q
(4.7)
Semelhantemente, os valores que dividem os dados em dez partes iguais denominam-se decis e so
representados por D
1
, D
2
, ..., D
9
enquanto que os valores que dividem os dados em cem partes iguais
chamam-se percentis e so representados por P
1
, P
2
, ..., P
99
. O quinto decil e o qinquagsimo percentil
correspondem mediana. O 25 e o 75 percentis correspondem ao 1 e 3 quartis, respectivamente.
Exemplo 4.1
Considere-se as notas de dois grupos de 10 alunos cada:
Grupo A 3,0 4,5 4,5 5,0 5,0 5,0 6,5 6,5 7,0 8,0
Grupo B 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0
Esses grupos tm a mesma quantidade de elementos e admitem a mesma mdia aritmtica ( 5 , 5 X ),
mas apresentam variaes bem diferentes em torno dessa mdia. O grupo A apresenta notas mais uniformes e
o grupo B apresenta notas mais variadas.
Observe-se os quartis:
Grupo A 3,0 4,5 4,5 5,0 5,0 5,0 6,5 6,5 7,0 8,0
Q
1
Q
2
Q
3
Grupo B 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0
As amplitudes semi-quartis so:
29
10
2
45 65
A
q
25
2
30 80
B
q
4.10 - Clculo de Mdias e Desvios Padres a partir de Tabelas de Freqncia
Como exemplo, pode-se calcular a mdia e o desvio padro dos dimetros de 90 eixos, conforme
mostrado na Tabela 4.7. Como a quantidade de dados grande e os dados esto agrupados em uma tabela de
freqncia, a mdia e o desvio padro so calculados como segue:
Tabela 4.7 - Tabela de Freqncias de uma amostra 90 eixos
N Classe Ponto Mdio x Freqncia f d' d.f d.f
1 2,5005 2,5055 2,503 1 -4 -4 16
2 2,5055 2,5105 2,508 4 -3 -12 36
3 2,5105 2,5155 2,513 9 -2 -18 36
4 2,5155 2,5205 2,518 14 -1 -14 14
5 2,5205 2,5255 2,523 22 0 0 0
6 2,5255 2,5305 2,528 19 1 19 19
7 2,5305 2,5355 2,533 10 2 20 40
8 2,5355 2,5405 2,538 3 3 15 45
9 2,5405 2,5455 2,543 6 4 24 96
Total 90 - 30 302
30
Procedimento Exemplo
Etapa 1
Prepare um formulrio de clculo como o da Tabela
Etapa 2
Anote os limites das classes, os pontos mdios das
classes e a freqncia f.
Etapa 3
Atribua o ponto mdio 0 (d = 0) para a classe que
tem freqncia f mxima e anote 0 na coluna u.
Escreva 1, -2, ... na direo dos menores valores
observados e, +1, +2, ... na direo dos maiores
valores observados.
A relao entre x e d expressa pela seguinte
equao:
( )
i
A x
d
'
onde,
A o ponto mdio da classe onde u = 0
i o tamanho do intervalo de classe
Etapa 3
Atribua 0 (zero) ao ponto mdio da classe nmero 5 da
coluna d.
A = 2,523
i = 0,005
Etapa 4
Insira os produtos de d e f na coluna fd, e os
produtos de d e fd na coluna f(d)
Obtenha a soma de cada coluna e anote-as nos
espaos reservados.
... ' ' '
2 2 1 1
+ + d f d f f d
( ) ( ) ... ' ' '
2
2 2
2
1 1
+ + d f d f f d
Etapa 4
N. 1 fd = (-4) . 1 = -4
N. 2 fd = (-3) . 4 = -12
.
N. 1 f(d) = (-4) . 1 = 16
N. 2 f(d) = (-3) . 4 = 36
.
30 24 ... ) 12 ( ) 4 ( ' + + + fd
302 96 ... 36 16 ) ' ( + + + d f
Etapa 5
Calcule x usando a seguinte equao:
,
_
+
n
fd
i A x
'
Etapa 5
( ) mm x 52467 , 2 00167 , 0 523 , 2
90
30
. 005 , 0 523 , 2 + +
Etapa 6
Calcule s ( ) usando a equao:
( )
( )
) 1 (
'
'
2
2
n
n
fd
fd
i s
Etapa 6
( ) mm s 00906 , 0
) 1 90 (
90
30
302
005 , 0
2
5 - DIAGRAMAS DE DISPERSO
(
1
)
Na prtica, muitas vezes essencial estudar a relao entre duas variveis associadas como, por
exemplo, o grau a dimenso de uma pea de mquina ir variar em funo da mudana da velocidade de um
torno.
1
KUME, HITOSHI, 1993, Mtodos Estatsticos para Melhoria da Qualidade, Captulo 6, pp. 74-95
31
Para estudar a relao entre duas variveis, tais como dito acima, pode-se usar o chamado diagrama
de disperso. Diagrama de Disperso uma forma de grfico onde simplesmente representa-se graficamente
cada par de variveis de uma srie de dados em um sistema de eixos.
Tomando como exemplo os dados da Tabela 5.1 abaixo, pode-se construir um diagrama de
disperso:
Tabela 5.1
Ponto de Dados X
1
X
2
Y
1 -2 1 10
2 -1 -2 5
3 0 -5 0
5.1 - Como Construir um Diagrama de Disperso
Um diagrama de disperso construdo conforme as seguintes etapas:
Etapa 1
Coletar dados em pares (X,Y) entre os quais deseja-se estudar as relaes, e organize-os em uma
tabela. desejvel que se tenha pelo menos 30 pares de dados.
Etapa 2
Encontrar os valores mximo e mnimo, tanto para X como para Y. Defina as escalas dos eixos
horizontal e vertical de forma que ambos os comprimentos sejam aproximadamente iguais; assim, o diagrama
ficar mais fcil de interpretar.
Determinar, para cada eixo, entre 3 e 10 divises para as unidades da escala de graduao, e utilize
nmeros inteiros para torna-lo mais fcil de ler. Quando duas variveis consistirem em um fator e uma
caracterstica da qualidade, use o eixo horizontal X para o fator e o eixo vertical Y para a caracterstica da
qualidade.
Etapa 3
Marcar os dados num papel milimetrado. Quando os mesmos valores de dados forem obtidos a partir
de diferentes observaes, mostre estes pontos, desenhando crculos concntricos (), ou marcando o
segundo ponto rente ao primeiro.
Etapa 4
Inserir todos os itens necessrios. Certificar de que os seguintes itens sejam includos para que
qualquer pessoa, alm do autor do diagrama, possa entende-lo num rpido exame:
a. Ttulo do diagrama;
b. Perodo de tempo;
c. Quantidade de pares de dados;
d. Denominao e unidade de medida de cada eixo;
e. Nome (etc.) da pessoa que elaborou o diagrama.
Exemplo 5.1
Um fabricante de tanques plsticos, que os fabricava pelo processo de moldagem a sopro, encontrou
problemas de tanques defeituosos com paredes finas. Suspeitou-se que a variao da presso do ar, dia a dia,
era a causa das paredes finas no-conformes. A Tabela 5.2 mostra dados sobre a presso de sopro e a
percentagem defeituosa.
32
Tabela 5.2 Dados da Presso de Sopro e Percentagem Defeituosa
de Tanques de Plstico
Data
Presso de
Sopro
(kgf/cm)
Percent.
Defeituosa
(%)
Data
Presso de
Sopro
(kgf/cm)
Percent.
Defeituosa
(%)
Out 1 8,6 0,889 Out 22 8,7 0,892
2 8,9 0,884 23 8,5 0,877
3 8,8 0,874 24 9,2 0,885
4 8,8 0,891 25 8,5 0,866
5 8,4 0,874 26 8,3 0,896
8 8,7 0,886 29 8,7 0,896
9 9,2 0,911 30 9,3 0,928
10 8,6 0,912 31 8,9 0,886
11 9,2 0,895 Nov 1 8,9 0,908
12 8,7 0,896 2 8,3 0,881
15 8,4 0,894 5 8,7 0,882
16 8,2 0,864 6 8,9 0,904
17 9,2 0,922 7 8,7 0,912
18 8,7 0,909 8 9,1 0,925
19 9,4 0,905 9 8,7 0,872
Etapa 1
Conforme visto na Tabela 5.2, existem 30 pares de dados.
Etapa 2
Neste exemplo, indicamos a presso de sopro por X (eixo horizontal) e a percentagem defeituosa por
Y (eixo vertical).
Assim:
O valor mximo de x: x
mx
= 9,4 (kgf/cm)
O valor mnimo de x: x
mn
= 8,2 (kgf/cm)
O valor mximo de y: y
mx
= 0,928 (%)
O valor mnimo de y: y
mn
= 0,864 (%)
Marca-se divises para graduao:
no eixo horizontal em intervalos de 0,5(kgf/cm) de 8,0 a 9,5(kgf/cm)
no eixo vertical em intervalos de 0,01(%) de 0,85 a 0,93(%)
Etapa 3
Marca-se os pontos no grfico.
Etapa 4
Anota-se o perodo de tempo a que se refere a amostra coletada (1 de outubro a 9 de novembro), a
quantidade de amostras (n = 30), o eixo horizontal (presso de sopro [kgf/cm]), o eixo vertical (percentagem
defeituosa [%]), e o ttulo do diagrama (diagrama de disperso da presso do sopro e a percentagem
defeituosa).
33
Figura 5.1 Exemplo de Diagrama de Disperso
5.2 - Como Interpretar os Diagramas de Disperso
Assim como possvel avaliar o formato de uma distribuio em um histograma, a distribuio
global dos pares de dados pode ser interpretada a partir de um diagrama de disperso. Ao proceder a leitura, a
primeira coisa que se deve fazer examinar se h ou no pontos atpicos no diagrama. Geralmente, pode-se
julgar que quaisquer pontos afastados do grupo principal (Figura 5.2) resultaram de erros na medio ou
registro de dados, ou foram causados por alguma mudana nas condies de operao. necessrio excluir
esses pontos para anlise da correlao. Contudo, ao invs de desprezar completamente estes pontos, deveria
ser dada a devida ateno causa de tais irregularidades pois, muitas vezes, informaes inesperadas, porm
muito teis, so obtidas descobrindo-se por que eles ocorreram.
Existem muitos tipos de padres de disperso, e alguns destes so dados da Figura 5.3. Nesta figura,
tanto na .1 como na .2, Y aumenta com X; este o caso da correlao positiva. E ainda, como a .1 mostra esta
tendncia de forma notvel, diz-se que ela apresenta forte correlao positiva. As Figuras .4 e .5 mostram o
oposto da correlao positiva, pois medida que X aumenta, Y diminui; este o caso da chamada correlao
negativa. A Figura .4 indica uma forte correlao negativa. A Figura .3 mostra o caso em que X e Y no tm
nenhuma relao especfica; portanto, dizemos que no h correlao. Na Figura .6, medida que X
aumenta, Y varia num padro curvo. Isto ser explicado posteriormente.
Figura 5.2 Exemplo de Pontos Suspeitos
34
.1 - Correlao Positiva
.2 - Correlao Negativa
.3 - Pode haver Correlao Positiva
.4 - Pode haver Correlao Negativa
.5 - No H Correlao
.6 - No H Correlao
Figura 5.3 Exemplos de Correlao
5.3 - Clculo de Coeficientes de Correlao
Para estudar a relao entre X e Y importante traar primeiro um diagrama de disperso, entretanto,
a fim de conhecer a fora da relao em termos quantitativos, til calcular o coeficiente de correlao de
acordo com a seguinte definio:
( )
( ) ( ) YY S XX S
XY S
r
.
(5.1)
onde:
35
( ) ( ) ( )
,
_
n
i
n
n
i
i
n
i
i
n
X
X X X XX S
1
2
1 2
1
2
(5.2)
( ) ( ) ( )
,
_
n
i
n
n
i
i
n
i
i
n
Y
Y Y Y YY S
1
2
1 2
1
2
(5.3)
( ) ( )( ) ( )
,
_
,
_
n
i
n
n
i
n
n
i
i i
n
i
i i
n
Y X
Y X Y Y X X XY S
1
1 1
1
.
(5.4)
onde n a quantidade de pares de dados e S(XY) chamado de covarincia.
O coeficiente de correlao, r, est no intervalo 1 r +1. Se o valor absoluto de r for maior que
1, houve claramente um erro de clculo e deve-se refaze-lo. No caso de forte correlao positiva, ele atinge
um valor prximo de +1 e, de forma anloga, numa forte correlao negativa, ele fica prximo de 1.
Quando | r | est prximo de 1, ele indica uma forte correlao entre X e Y. Quando se aproxima de
0 (zero), implica numa correlao fraca.
Quando | r | = 1, os dados estaro sobre uma linha reta.
Exemplo 5.2
Calculemos o coeficiente de correlao para o Exemplo 5.1, dos tanques de plstico. A Tabela 5.3
abaixo apresenta os clculos, a partir dela obtm-se os resultados desejados.
( ) ( ) 88 , 2
30
2 , 263
02 , 2312
2
1
2
1 2
,
_
n
i
n
n
i
i
n
X
X XX S
( ) ( ) 00840 , 0
30
816 , 26
97833 , 23
2
1
2
1 2
,
_
n
i
n
n
i
i
n
Y
Y YY S
( ) ( ) 0913 , 0
30
816 , 26 . 2 , 263
3570 , 235
.
1
1 1
,
_
,
_
n
i
n
n
i
n
n
i
i i
n
Y X
Y X XY S
( )
( ) ( )
59 , 0
00840 , 0 . 88 , 2
0913 , 0
.
yy S xx S
xy S
r
O valor de r 0,59, existindo portanto uma correlao positiva entre a presso de sopro e a
percentagem defeituosa de tanques de plstico.
36
Tabela 5.3 Preparao para o clculo do coeficiente de correlao.
Data X Y X Y X.Y
Out. l
2
3
4
5
8,6
8,9
8,8
8,8
8,4
0,889
0,884
0,874
0,891
0,874
73,96
79,21
77,44
77,44
70,56
0,79032
0,78146
0,76388
0,79388
0,76388
7,6454
7,8676
7,6912
7,8408
7,3416
8
9
10
11
12
8,7
9,2
8,6
9,2
8,7
0,886
0,911
0,912
0,895
0,896
75,69
84,64
73,96
84,64
75,69
0,78500
0,82992
0,83174
0,80102
0,80282
7,7082
8,3812
7,8432
8,2340
7,7952
15
16
17
18
19
8,4
8,2
9,2
8,7
9,4
0,894
0,864
0,922
0,909
0,905
70,56
67,24
84,64
75,69
88,36
0,79924
0,74650
0,85008
0,82628
0,81902
7,5096
7,0848
8,4824
7,9083
8,5070
22
23
24
25
26
8,7
8,5
9,2
8,5
8,3
0,892
0,877
0,885
0,866
0,896
75,69
72,25
84,64
72,25
68,89
0,79566
0,76913
0,78322
0,74996
0,80282
7,7604
7,4545
8,1420
7,3610
7,4368
Nov.
29
30
31
1
2
8,7
9,3
8,9
8,9
8,3
0,896
0,928
0,886
0,908
0,881
75,69
86,49
79,21
79,21
68,89
0,80282
0,86118
0,78500
0,82446
0,77616
7,7952
8,6304
7,8854
8,0812
7,3123
5
6
7
8
9
8,7
8,9
8,7
9,1
8,7
0,882
0,904
0,912
0,925
0,872
75,69
79,21
75,69
82,81
75,69
0,77792
0,81722
0,83174
0,85563
0,76038
7,6734
8,0456
7,9344
8,4175
7,5864
Total 263,2 26,816 2312,02 23,97833 235,3570
6 AJUSTAMENTO DE CURVAS E O MTODO DOS MNIMOS QUADRADOS
(
2
)
Num diagrama de disperso possvel, freqentemente, visualizar uma curva regular que se
aproxima dos dados. Essa curva denominada de ajustamento.
Relao Linear
Relao No-Linear
Figura 6.1 Exemplo de Curvas em Diagramas de Disperso
2
SPIEGEL, M.R., 1976, Estatstica, Cap. 13, pp.362-400. / RIBEIRO, L. F. M., 1999, Notas de Aula
37
O problema geral da determinao das equaes de curvas que se acomodem a certos conjuntos de
dados denominado AJUSTAMENTO DE CURVAS.
6.1 - Equaes das Curvas de Ajustamento
Para fins de referncia, relaciona-se abaixo alguns tipos de curvas de ajustamento e suas equaes.
Todas as letras, exceto X e Y, representam constantes. As letras X e Y referem-se, freqentemente, a variveis
independentes e dependentes, respectivamente, embora esses papis possam ser permutados.
(1) X a a Y
1 0
+ Linha Reta
(2)
2
2 1 0
X a X a a Y + + Parbola ou Curva do 2 Grau
(3)
3
2
2
2 1 0
X a X a X a a Y + + + Curva do 3 Grau
(4)
4
4
3
2
2
2 1 0
X a X a X a X a a Y + + + + Curva do 4 Grau
(5)
n
n
X a X a X a a Y + + + + ...
2
2 1 0
Curva de Grau n
onde o segundo membro das equaes so denominados polinmios do 1, 2, 3, 4 e n -simo graus.
As funes definidas pelas quatro primeiras equaes so, s vezes, denominadas Funes Linear,
Quadrtica, Cbica e do 4 Grau, respectivamente.
Como outras equaes possveis (entre muitas usadas na prtica), menciona-se as seguintes:
(6)
X a a
Y
1 0
1
+
ou X a a
Y
1 0
1
+
Hiprbole
(7)
X
ab Y ou ( ) X a a X b a Y
1 0
log log log + + Curva Exponencial
(8)
b
aX Y ou X b a Y log log log + Curva Geomtrica
(9) g ab Y
X
+ Curva Exponencial Modificada
(10) g aX Y
b
+ Curva Geomtrica Modificada
(11)
X
b
pq Y ou g ab q b p Y
X X
+ + log log log
Curva de Gompertz
(12)
h pq Y
X
b
+
Curva de Gompertz Modificada
(13)
g ab
Y
X
+
1
ou g ab
Y
X
+
1
Curva Logstica
(14) ( )
2
2 1 0
log log X a X a a Y + +
Para decidir qual a curva a adotar, conveniente a obteno de diagramas de disperso das variveis
transformadas. Por exemplo, se o diagrama de disperso de log Y em funo de X apresentar uma relao
linear, a equao ter o aspecto da (7), enquanto, se o de log Y em funo de log X for linear, a equao ter o
formato de (8).
Emprega-se, freqentemente, para tal finalidade, grficos no qual uma ou ambas as escalas so
logartmicas (semilog ou log-log [dilog]).
6.2 - O Mtodo dos Mnimos Quadrados
Antes, necessrio instituir uma definio da melhor reta de ajustamento, da melhor parbola de
ajustamento, etc.
38
Figura 6.2 - A melhor curva de ajustamento
Para conseguir uma definio possvel, considere-se a Figura 6.2 na qual os dados esto
representados pelos pontos (X
1
,Y
1
), (X
2
,Y
2
), ..., (X
n
,Y
n
). Para um valor dado de X, por exemplo X
1
, haver uma
diferena entre y
1
e p valor correspondente determinado na curva C.
Como est representado na figura, essa diferena e
1
, que , muitas vezes, designada como desvio,
erro ou resduo e pode ser positivo, negativo ou nulo. De modo semelhante, obtm-se os desvios e
2
, e
3
, ..., e
n
.
Uma medida de qualidade do ajustamentoda Curva C aos dados apresentados (aderncia)
proporcionada pela quantidade e
2
+ e
3
+ ... + e
n
. Se ela pequena, o ajustamento bom, se grande, o
ajustamento est ruim.
Portanto, uma definio pode ser feita:
De todas as curvas que se ajustam a um conjunto de pontos, a que tem a propriedade de apresentar o
mnimo valor de e
2
+ e
3
+ ... + e
n
denominada a melhor curva de ajustamento.
Diz-se que uma curva que apresenta essa propriedade ajusta os dados no sentido dos mnimos
quadrados e denominada curva de mnimos quadrados.
6.3 - Relaes No-Lineares
As relaes no-lineares podem, s vezes, ser transformadas em lineares mediante a transformao
adequada das variveis, conforme pode ser visto no exemplo a seguir.
Exemplo 6.1
A Tabela 6.1 d os valores experimentais da presso P de uma massa dada de gs, que correspondem
a vrios valores do volume V. De acordo com os princpios da Termodinmica, deve existir entre essas
variveis uma relao da forma PV
= C, em que e C so constantes.
(a) Determinar os valores de e C;
(b) Escrever a equao de correlao entre P e V; e
(c) Estimar P para V = 100 pol.
Tabela 6.1 - Valores de Presso em funo
do Volume de um gs
V (pol) 54,3 61,8 72,4 88,7 118,6 194,0
P (psi) 61,2 49,5 37,6 28,4 19,2 10,1
Soluo:
39
Como C PV
, tem-se:
C V P log log log +
V C P log log log
fazendo-se: log V = X
log P = Y
a equao fica:
X a a Y
1 0
+ (reta de regresso)
onde: C a log
0
e
1
a
Clculo dos Coeficientes a
0
e a
1
da reta de regresso pelo mtodo dos mnimos quadrados.
Tabela 6.2
V (pol) P (psi)
X = log V Y = log P X X.Y
54,3 61,2
1,7348 1,7868 3,0095 3,0997
61,8 49,5
1,7910 1,6946 3,2076 3,0350
72,4 37,6
1,8597 1,5752 3,4586 2,9294
88,7 28,4
1,9479 1,4533 3,7944 2,8310
118,6 19,2
2,0741 1,2833 4,3018 2,6617
194 10,1
2,2878 1,0043 5,2340 2,2977
Total 11,6953 8,7975 23,0061 16,8544
1 Etapa:
9492 , 1
6
6953 , 11
n
X
X
4662 , 1
6
7975 , 8
n
Y
Y
2 Etapa:
Utilizando-se as equaes (5.2) e (5.4):
( ) ( ) 2092 , 0
6
6953 , 11
0059 , 23
2
1
2
1 2
,
_
n
i
n
n
i
i
n
X
X XX S
( ) ( ) 2939 , 0
6
7975 , 8 . 6953 , 11
8543 , 16
.
1
1 1
,
_
,
_
n
i
n
n
i
n
n
i
i i
n
Y X
Y X XY S
3 Etapa:
( )
( )
4049 , 1
2092 , 0
2939 , 0
1
XX S
XY S
a
( ) 2046 , 4 9492 , 1 . 4049 , 1 4662 , 1
1 0
X a Y a
Assim:
(a)
1
a
( ) 4049 , 1 4049 , 1
1
a
40
(b) C a log
0
69 , 16017 10 10
2046 , 4
0
a
C
(c) C PV
ento:
69 , 16017
4049 , 1
PV
(d) Para V = 100 pol psi P 28 , 25
100
69 , 16017
4049 , 1
Figura 6.3 - A curva de ajustamento (mono-log)
6.4 - A Parbola de Mnimos Quadrados
A parbola de mnimos quadrados que se ajusta ao conjunto de pontos (X
1
,Y
1
), (X
2
,Y
2
), ..., (X
n
,Y
n
) tem
a equao:
2
2 1 0
X a X a a y + +
(6.1)
cujos constantes a
0
, a
1
, e a
2
so determinadas mediante a resoluo das equaes:
'
+ +
+ +
+ +
4
2
3
1
2
0
2
3
2
2
1 0
2
2 1 0
X a X a X a Y X
X a X a X a XY
X a X a n a Y
(6.2)
denominadas equaes normais da parbola de mnimos quadrados.
Ocorrem simplificaes para as expresses acima quando X escolhido de tal modo que 0 X .
Tambm ocorrem simplificaes quando se escolhem novas variveis:
X X x
e
Y Y y
(6.3)
41
6.5 - Regresso
Deseja-se, freqentemente, com base em dados amostrais estimar o valor de uma varivel Y,
correspondente ao conhecido de uma varivel X. Isso pode ser alcanado mediante a avaliao do valor de Y,
a partir de uma curva de mnimo quadrado que se ajuste aos dados amostrais. A curva resultante
denominada de regresso de Y para X, visto que Y avaliado a partir de X.
Se se desejar estimar o valor de X a partir de um atribudo a Y, usa-se uma curva de regresso de X
para Y, o que importa em uma permutao das varveis no diagrama de disperso, de modo que X passa a ser
a varivel dependente e Y a independente.
Em geral, a reta ou curva de regresso de Y para X no igual de X para Y.
Exemplo 6.2
No Exemplo 5.1, dos tanques plsticos com paredes finas defeituosas, constatou-se que havia uma
correlao positiva entre a presso de sopro e a percentagem defeituosa. A fim de evitar esse problema,
pergunta-se:
- Quando a presso de sopro estiver em um certo valor, qual ser a espessura das paredes formadas?
- Como a presso de sopro deve ser controlada para que as paredes do tanque no fiquem finas?
Para realizar essa anlise e poder responder s perguntas feitas, necessrio compreender,
quantitativamente, a relao entre a presso de sopro e a espessura da parede.
A Tabela 6.3 mostra os dados de uma experincia na qual a presso de sopro foi mudada e, em cada
vez, a espessura das paredes foi medida. A Figura 6.4 um diagrama de disperso baseado nestes dados.
Tabela 6.3 Presso de Sopro x Espessura da Parede
Presso de sopro
(kgf/cm)
8,0 8,5 9,0 9,5 10,0
4,62 4,12 3,21 2,86 1,83
4,50 3,88 3,05 2,53 2,02
4,43 4,01 3,16 2,71 2,24
Espessura da
Parede (mm)
4,81 3,67 3,30 2,62 1,95
Figura 6.4 Relao entre a Presso de Ar e a Espessura da Parede
Pode-se representar a presso do sopro por x e a espessura da parede por y, admitindo uma relao linear:
x y +
(6.4)
onde:
uma constante
chamado de coeficiente de regresso
42
Tal reta geralmente chamada de reta de regresso, onde y a varivel resposta (ou varivel
dependente), e x a varivel explicativa (ou varivel independente). A forma quantitativa de entender a
relao entre x e y , pela busca de uma forma de regresso entre x e y , chamada de Anlise de Regresso.
Seja (X
i
,Y
i
) (para 1 i n) um conjunto de n pares de dados observados. Sejam e
os
valores estimados e e , e seja e
i
o resduo entre Y
i
e
i
X + , isto :
( )
i i i
X y e
+ (1 i n) (6.5)
Pelo mtodo dos mnimos quadrados, e
n
i
i
e
1
2
, a
soma dos quadrados dos resduos. Esse mtodo aplicado atravs das seguintes etapas:
Etapa 1
Obtenha X e Y a partir dos dados.
Etapa 2
Calcule S(XX) e S(XY).
Etapa 3
Obtenha
de
( )
( ) XY S
XX S
(6.6)
e obtenha de
X Y
(6.5)
os valores de e
n
X
X
276 , 3
20
52 , 65
n
Y
Y
2 Etapa:
( ) ( ) 0 , 10
20
180
1630
2
1
2
1 2
,
_
n
i
n
n
i
i
n
X
X XX S
( ) ( ) 8 , 12
6
52 , 65 . 180
88 , 576
.
1
1 1
,
_
,
_
n
i
n
n
i
n
n
i
i i
n
Y X
Y X XY S
3 Etapa:
( )
( )
28 , 1
0 , 10
8 , 12
XX S
XY S
80 , 14 0 , 9 ). 28 , 1 ( 276 , 3
Assim, a reta de regresso expressa por:
X Y 28 , 1 80 , 14
A cada aumento de 1(kgf/cm) da presso do ar, a espessura da parede diminui de 1,28(mm). A
Figura 6.5 mostra a reta de regresso calculada acima.
Figura 6.5 Relao entre a Presso de Ar e a Espessura da Parede
6.6 - Aplicaes das Sries Temporais
44
Se a varivel independente X corresponder ao tempo, os dados representaro os valores de Y em
diversos momentos. Os dados ordenados em relao ao tempo so denominados sries temporais.
A curva de regresso de Y para X, neste caso denominada de tendncia e freqentemente
empregada para as finalidades de estimao, predio (ato de predizer) ou previso.
6.7 - Problemas que envolvem mais de duas variveis
Podem ser tratadas de maneira anloga aos de duas. Por exemplo, pode haver uma relao entre trs
variveis X, Y e Z que pode ser descrita pela expresso:
Y a X a a Z
2 1 0
+ +
que denominada equao linear das variveis X, Y e Z.
Em um sistema tridimensional de coordenadas retangulares, essa equao representa um plano e os
pontos amostrais reais (X
1
,Y
1
), (X
2
,Y
2
), ..., (X
n
,Y
n
) podem dispersar-se em posies no muito distantes desse
plano, que pode ser denominado de ajustamento.
Mediante a extenso do mtodo dos mnimos quadrados, pode-se falar de um plano de mnimos
quadrados de ajustamento dos dados.
Se o nmero de variveis exceder a trs, perde-se a intuio geomtrica porque, ento, seria
necessrio considerar espaos de quatro ou mais dimenses.
Os problemas que envolvem a avaliao de uma varivel a partir de duas ou mais outras so
denominados problemas de regresso mltipla.
45
7 - MODELOS DE PROBABILIDADE PARA EXPERIMENTOS
(
3
)
Antes de se apresentar os diferentes modelos de probabilidade, importante que se tenha perfeitamente
claro o entendimento da diferena entre amostra e populao (ou universo). Utilizando-se mais uma vez
as conceituaes de JURAN (1992, p.33), pode-se dizer que: Uma amostra um nmero limitado de medidas
tiradas de uma fonte maior. Uma populao uma grande fonte de medidas das quais a amostra retirada.
A partir das conceituaes anteriores, apresenta-se a conceituao de distribuio de probabilidade e
suas classificaes: distribuio contnua de probabilidade e distribuio discreta de probabilidade.
Segundo JURAN (1992, p.33), ainda: Uma distribuio de probabilidade uma frmula matemtica
que relaciona os valores da caracterstica com a sua probabilidade de ocorrncia na populao.
Quando a caracterstica que est sendo medida puder assumir qualquer valor (sujeito exatido do
processo de medio), sua distribuio de probabilidade chamada distribuio contnua de probabilidade. Um
exemplo: a distribuio de freqncias dos dados de resistncias eltricas medidas.
As distribuies contnuas de probabilidade mais comuns so:
(1) a Distribuio Normal;
(2) a Distribuio Exponencial e
(3) a Distribuio de Weibull.
Distribuio Forma Funo de Probabilidade Comentrios sobre Aplicao
Normal
( )
2
2
2
2
1
X
e y
= mdia
= desvio padro
Aplicvel quando houver uma
concentrao de observaes sobre
a mdia e for igualmente provvel
que as observaes ocorrem acima
e abaixo da mdia. Variao nas
observaes geralmente o
resultado de muitas pequenas
causas.
Exponencial
X
e y
1
Aplicvel quando provvel que
mais observaes ocorram abaixo
da mdia do que acima.
Weibbull
( )
( )
X
e X y
1
Aplicvel na descrio de uma
grande variedade de padres de
variao incluindo casos
particulares da normal e
exponencial
Quando a caracterstica medida puder assumir somente certos valores especficos (por exemplo,
inteiros 1, 2, 3, etc.), sua distribuio de probabilidade chamada de distribuio discreta de probabilidade. Um
exemplo: a distribuio do nmero de defeitos r numa amostra de cinco itens, pois r s pode ser 0, 1, 2, 3, 4
ou 5, nunca 1,5 defeitos.
As distribuies discretas de probabilidade mais comuns so:
(1) a Distribuio de Poisson;
(2) a Distribuio Binomial;
(3) a Distribuio Binomial Negativa e
(4) a Distribuio Hipergeomtrica.
Distribuio Forma Funo de Probabilidade Comentrios sobre Aplicao
Poisson
( )
! r
e np
y
np r
n = nmero de tentativas
r = nmero de ocorrncias
p = probabilidade de ocorrncia
O mesmo que a binomial, porm,
empregada particularmente
quando h muitas oportunidades
de ocorrncia de um evento, mas
uma pequena probabilidade
(menos de 0,10) em cada tentativa
3
JURAN, J.M. & GRYNA, F.M. Controle da Qualidade Handbook. Vol. VI. pp. 33-69
46
Binomial
( )
r n r
q p
r n r
n
y
! !
!
n = nmero de tentativas
r = nmero de ocorrncias
p = probabilidade de ocorrncia
q = 1 - p
Aplicvel na definio da
probabilidade de r ocorrncias em
n tentativas de um evento, que tem
uma probabilidade de ocorrncia
de p em cada tentativa.
Binom. Negativo
( )
( ) ( )
s r
q p
s r
s r
y
! ! 1
! 1
+
r = nmero de ocorrncias
s = diferena entre nmero de
tentativa e nmero de
ocorrncias
p = probabilidade de ocorrncia
q = 1 - p
Aplicvel na definio da
probabilidade que r ocorrncias
exigiro um total de r + s
tentativas de um evento que tem
uma probabilidade de ocorrncias
de p em cada tentativa (note que o
nmero total de tentativas n
r + s).
Hipergeomtrica
,
_
,
_
,
_
n
N
r n
d N
r
d
y
Aplicvel na definio da
probabilidade de r ocorrncias em
n tentativas de um evento quando
h um total de d ocorrncias em
uma populao de N.
A seguir explicar-se- como as distribuies de probabilidade podem ser usadas em uma amostra de
observaes para inferir sobre a populao maior.
7.1 - Espao Amostral
A estatstica trabalha com os resultados dos experimentos. Quando algum experimento realizado,
algum resultado ocorre; denota-se um resultado tpico pelo smbolo e. Tal resultado chamado evento simples.
Se for feita uma lista de todos os possveis resultados de interesse do experimento, essa srie chamada
de espao amostral.
Exemplo: Se for realizado o experimento de jogar para cima trs moedas e observar-se se o resultado
cara (F) ou coroa (C), o espao amostral conter os oito resultados possveis.
FFF FFC FCF CFF FCC CFC CCF CCC
Para simplificao de notao, denota-se esses resultados, respectivamente, por
e1, e2, e3, e4, e5, e6, e7, e8.
Associa-se um nmero chamado probabilidade a cada um dos eventos simples. Probabilidade a
proporo de vezes que cada evento simples ocorreria num nmero muito grande de experimentos deste tipo.
Exemplo: Qual a probabilidade de FFF ocorrer?
Geralmente tomada como sendo 125 , 0
8
1
, j que ela ocorre em cerca de
8
1
das vezes de um grande
nmero de experimentos onde 3 moedas so lanadas.
Denota-se a probabilidade de um evento simples e por P(e); assim, para o exemplo, P(FFF) =
8
1
.
Adicionando a proporo de vezes que cada e no espao amostral ocorreu, deve-se obter uma soma
igual a 1.
Por exemplo, no lanamento de moedas:
P(e1)+ P(e2)+ P(e3)+ P(e4)+ P(e5)+ P(e6)+ P(e7)+ P(e8)= 1
47
7.2 - Eventos
Muitas vezes no se est interessado em um evento simples, mas sim numa combinao deles, chamado
evento composto.
Por exemplo: o evento mais caras que coroas, no exemplo do lanamento de 3 moedas, ocorre se, e
somente se, um dos eventos simples e1, e2, e3, e4 ocorrer.
A freqncia com a qual obtm-se mais caras que coroas ser a soma das freqncias relativas de e1,
e2, e3 e e4.
Ento: P(mais caras que coroas) = P(e1)+ P(e2)+ P(e3)+ P(e4)
Para facilitar a escrita, freqentemente denota-se o evento de interesse por um smbolo, como A para
o evento mais caras que coroas, logo, P(mais caras que coroas) = P(A)
Portanto: A probabilidade de um evento composto a soma das probabilidades de todos os eventos
simples que o formam.
No exemplo anterior: P(A) =
2
1
8
1
8
1
8
1
8
1
+ + +
Isto , espera-se encontrar mais caras que coroas em mais ou menos 50% de tais experimentos.
Neste exemplo tm-se eventos simples igualmente provveis, isto , P(e
i
) = P(e
j
) para todo i, j.
Quando isto for verdade, segue-se que para qualquer evento composto A tm-se
amostral espao no pontos de nmero
A em simples eventos de nmero
) ( A P
Para o exemplo anterior: P(A) =
2
1
8
4
Diz-se que dois eventos compostos A1 e A2 so mutuamente excludentes se nenhum e
1
estiver em A
1
e
A
2
, ao mesmo tempo.
Por exemplo: Se A
1
o evento 2 caras e A
2
o evento mais coroas que caras, ento A
1
e A
2
so
mutuamente excludentes, pois A
1
={e
1
, e
3
, e
4
} e A
2
={e
5
, e
6
, e
7
, e
8
} no tm qualquer evento em comum.
Com freqncia expressamos o fato de que A1 e A2 so mutuamente excludentes com smbolos,
escrevendo A
1
A
2
= .
Se A
1
e A
2
so mutuamente excludentes, ento para o evento A
1
ou A
2
tem-se
P(A
1
ou A
2
) = P(A
1
) + P(A
2
)
Assim, conclui-se que para quaisquer eventos A e A
1
a Regra da Adio :
P(A ou A
1
) = P(A) + P(A
1
) - P(A e A
1
)
Para eventos mutuamente excludentes (caso particular), P(A e A
1
) zero, de forma que a equao se
reduziria para duas parcelas, como j foi visto.
7.3 - Anlise Combinatria
A teoria das probabilidades fundamenta as decises baseadas em amostragem. Percebe-se que
a probabilidade sempre ser expressa como um nmero em 1,0 (certeza de ocorrncia de um dado evento) e 0,0
(impossibilidade de ocorrncia), e a definio mais intuitiva de probabilidade aquela baseada numa
interpretao de freqncia.
No caso simples, quando um evento A pode ocorrer em s casos de um total de n possveis
e igualmente provveis, ento a probabilidade de que o evento ocorra :
possveis casos de total nmero
sucedidos casosbem nmero
n
s
A P ) (
Contar s e n pode ser complexo, nesse caso chamado de problema de anlise
combinatria.
48
Exemplo: Um lote consiste em 100 itens. Um nico item selecionado ao acaso, e assim, cada
um dos 100 itens tem chance igual de ser selecionado. Suponha que um lote contm um total de 8 itens no-
conformes. Ento: a probabilidade de retirada de um nico item no-conforme :
% 8 08 , 0
100
8
n
s
7.4 - Teoremas
Teorema 1
Se P(A) for a probabilidade de um evento A, ento a probabilidade de que A no ocorra
P(no A) = 1-P(A)
Teorema 2
Se A e B so dois eventos, ento a probabilidade de que A ou B ocorra
P(A ou B) = P(A) + P(B) - P(A e B)
Teorema 3
Se A e B so dois eventos, ento a probabilidade de ocorrncia conjunta de A e B
P(A e B) = P(A) x P(B|A)
Onde P(B|A) a probabilidade de que B ocorra, supondo-se que A j tenha ocorrido.
Exemplo: Um sistema complexo consiste em 2 subsistemas principais. A probabilidade de
desempenho bem sucedido do primeiro subsistema 0,95; a probabilidade correspondente do segundo
subsistema 0,90. Ambos subsistemas devem operar com xito a fim de alcanar o sucesso do sistema todo. A
probabilidade da operao bem sucedida do sistema todo , portanto
P(A e B) = 0,95 x 0,90 = 0,855
Os teoremas mostrados podem ser expandidos para qualquer nmero de eventos.
7.5 - Distribuies Discretas de Probabilidade
Distribuies Discretas de Probabilidade so usadas para modelar situaes onde o resultado de
interesse pode assumir apenas alguns valores discretos (tais como 0 ou 1 para falha ou sucesso, ou 0, 1, 2, 3, ...
como nmero de ocorrncias de algum evento de interesse).
.1 - Distribuio Uniforme Discreta
Se cada um dos valores x
1
, ...,x
n
igualmente provvel de ocorrer como resultado de um experimento,
ento dizemos que o valor obtido tem a distribuio uniforme na srie de valores x
1
, ...,x
n
.
O modelo que leva a uma distribuio uniforme a seleo aleatria a partir de uma populao finita na
qual cada valor ocorre o mesmo nmero de vezes (isto faz com que os valores tornem-se igualmente provveis
de ocorrer na amostragem).
.2 Distribuio Binomial
Se a probabilidade de ocorrncia p de um evento constante em cada uma das n tentativas
independentes do evento, ento a probabilidade de r ocorrncias em n tentativas :
( )
r n r
q p
r n r
n
! !
!
onde: q = 1 - p.
A suposio de uma probabilidade constante de ocorrncia considerada razovel quando o
tamanho da populao pelo menos 10 vezes o tamanho da amostra.
Quando n tentativas independentes de um experimento tiverem, cada uma, probabilidade p
constante de ocorrncia de um evento de interesse, o nmero de ocorrncias segue uma distribuio binomial.
O nome vem do fato que o fator
( )! !
!
r n r
n
visto no clculo das probabilidades chamado de Coeficiente Binomial, em matemtica.
49
.3 Distribuio Hipergeomtrica
Ocasionalmente, as hipteses de Poisson ou binomiais no podem ser satisfeitas nem mesmo
de forma aproximada. Sujeita apenas suposio de uma amostra aleatria, a hipergeomtrica d a
probabilidade de exatamente r ocorrncias em n tentativas de um lote de N itens tendo d defeituosos como:
,
_
,
_
,
_
n
N
r n
d N
r
d
y
onde
,
_
n
N
so as combinaes de N itens tomados n de cada vez e igual a
( )
,
_
! !
!
n N n
N
, onde
( )( ) 1 ... 2 . 1 . ! N N N N e 1 ! 0 . Os clculos podem ser evitados usando-se tabelas como aquelas
preparadas por Lieberman e Owen (1961).
A Distribuio Hipergeomtrica apropriada quando tentativas independentes so feitas, mas a
probabilidade de ocorrncia do evento de interesse muda de tentativa a tentativa por causa da diminuio de uma
populao finita.
Exemplo: Um lote de 100 unidades examinado por um fabricante cuja qualidade passada foi em torno
de 5% de no-conformidade. Uma amostra aleatria de 20 unidades selecionada do lote. Para calcular a
probabilidade de 0 no-conformes em 20, observe que o lote tem 5 itens no-conformes e 95 conformes. Ento:
( )
( ) ( )
( )
319 , 0
10 . 16 , 7 . 10 . 43 , 2
10 . 33 , 9
10 . 48 , 2 . 10 . 43 , 2
10 . 033 , 1
.
120 . 1
120
! 20 100 ! 20
! 100
! 20 95 ! 20
! 95
.
! 0 5 ! 0
! 5
20
100
20
95
.
0
5
20 em 0
118 18
157
109 18
148
1
]
1
1
]
1
1
]
1
1
]
1
,
_
,
_
,
_
P
Substituies repetidas na frmula so feitas para encontrar P(r em 20), onde r neste exemplo 0, 1, 2, 3, 4 e 5.
.4 Distribuio de Poisson
uma aproximao de distribuies mais exatas e aplica-se quando o tamanho da amostra pelo menos
16. O tamanho da populao pelo menos 10 vezes o tamanho da amostra e a probabilidade de ocorrncia p em
cada tentativa menor que 0,1. (Estas condies so freqentemente satisfeitas).
Alm de ser uma aproximao de distribuies mais exatas, a Poisson a distribuio exata quando
certas hipteses so satisfeitas. Essas hipteses so:
- que os eventos ocorram ao acaso, e.g., no tempo, no espao ou na localizao com uma probabilidade
de ocorrncia mais ou menos proporcional ao espao de tempo (ou volume, ou rea)
- que no haja agrupamentos.
.5 Distribuio Binomial Negativa
Ocorre em situaes onde o tamanho da amostra no fixado previamente, mas, sim, determinado
durante o experimento.
Se a probabilidade de ocorrncia de um evento constante de tentativa para tentativa, e faz-se tentativas
at encontrar m ocorrncias, ento a probabilidade de que r tentativas sejam necessrias :
( )
( ) ( )
( )
m r m
p p
m r m
r
1
! ! 1
! 1
onde r pode ser m, m+1, m+2,...
.6 Distribuio Multinomial
Utilizada em casos importantes onde o produto multivariado, isto , numa amostra de tamanho n
observa-se tanto o nmero de peas que precisam ser retrabalhadas quanto o nmero a ser sucateadas. Como h
duas quantidades, isto chamado de situao bivariada.
.7 Seleo de uma Distribuio Discreta
A seleo de qual distribuio discreta deve ser usada geralmente feita por conhecimento da situao
ou por ajuste de um modelo de probabilidade a partir das freqncias relativas. Em, qualquer caso, um teste do
modelo selecionado de interesse para se verificar sua validade.
50
7.6 - Distribuies Contnuas de Probabilidade
Distribuies Contnuas de Probabilidade so usadas para moldar situaes onde o resultado de
interesse pode assumir valores numa escala contnua, por exemplo, os valores maiores que zero para o tempo de
falha de um motor que est trabalhando continuamente.
.1 - Distribuio Uniforme Contnua
Se todos os valores entre a e b (a < b) so possveis e se as chances do valor estar em um subintervalo
so proporcionais sua extenso, ento a distribuio uniforme apropriada.
A funo de probabilidade horizontal sobre o intervalo (a, b), onde:
( ) 1
1
b
y
assim a probabilidade do valor estar em um subintervalo da extenso c
( ) a b
c
.
.2 - Distribuio Exponencial
A funo de probabilidade exponencial :
X
e y
.
1
onde:
X amostra para qual se deseja a probabilidade
Mdia da Populao
A funo exponencial til na descrio da distribuio do tempo de falha de certos equipamentos
complexos. Pode ser mostrado que a distribuio exponencial do tempo de falha aplica-se quando falhas ocorrem
ao acaso (e no so devidas a desgaste, mas a tais itens como impactos aleatrios). Na verdade, ela
caracterizada como a nica distribuio contnua com a propriedade de falta de memria de que as chances do
item passar por uma unidade de tempo adicional t
0
dependem apenas da extenso t
0
e no de quanto tempo o
item vem sendo usado.
Predies baseadas em uma populao exponencialmente distribuda necessitam somente de uma
estimativa da mdia da populao.
Um exemplo:
O tempo entre falhas de um componente complexo de um equipamento medido e o histograma
resultante assemelha-se curva exponencial de probabilidade. Os resultados das medies de uma amostra
indicam que o tempo mdio entre falhas de 100h. Qual a probabilidade de que o tempo entre duas falhas
sucessivas deste equipamento seja pelo menos 20h?
O problema consiste em achar a rea sob a curva acima de 20h, Figura 7.1. A Tabela 7.1 d a rea sob
a curva acima de qualquer razo
X
. No problema: 20 , 0
100
20
X
De acordo com a Tabela 7.1, a rea sob a
curva acima de 20h ento 0,8187. A probabilidade de que o tempo entre duas falhas sucessivas seja superior a
20h de 0,8187, ou seja, h em torno de 82% de chance de que o equipamento opere sem falhas, continuamente,
por 20 horas ou mais.
Figura 7.1 Distribuio do tempo entre falhas
51
Tabela 7.1 Distribuio Exponencial
.3 - Distribuio de Weibull
A distribuio de Weibull uma famlia de distribuies tento a funo densidade genrica:
( )
( )
X
e X y
1
onde:
parmetro de escala;
parmetro de forma e
parmetro de localizao.
A curva da funo de Weibull varia muito, dependendo dos valores numricos dos parmetros. Os mais
importante o parmetro de forma, o qual reflete o padro da curva.
O parmetro de escala est relacionado ao ponto mximo da curva, ou seja, de acordo com a mudana
de , a curva torna-se mais plana ou mais pronunciada.
O parmetro de localizao o menor valor possvel de X. Na maior parte das vezes assume-se que
este valor zero, resultando assim na simplificao da equao.
A distribuio de Weibull surge se uma varivel exponencial elevada a uma potncia, ou seja, se Y
uma exponencial ento
1
Y tem uma distribuio de Weibull.
.4 - Distribuio Normal
Quando a variao de uma caracterstica gerada pela soma de um grande nmero de erros
infinitesimais independentes devidos a diferentes fatores, a distribuio da caracterstica se torna, em muitos
casos, aproximadamente uma distribuio normal. A Distribuio Normal pode ser simplesmente descrita como
tendo a forma de um sino ou montanha, e numa descrio mais detalhada:
a) a densidade de probabilidade mais alta no meio e diminui gradualmente em direo s caudas e
b) ela simtrica.
Esta curva pode ser expressa matematicamente como segue:
( )
2
2
2
.
2
1
X
e y
onde:
e = 2,718
= 3,141
52
= mdia da populao e
= desvio-padro da populao
Os problemas so solucionados por meio de tabelas, mas note que a distribuio exige estimativas
apenas da mdia e do desvio-padro da populao.
Teorema do Limite Central
Se uma varivel Y o resultado da soma de muitas outras variveis e aquelas variveis no so muito
dependentes umas das outras, ento Y ter aproximadamente uma Distribuio Normal.
Como pode-se observar, a equao da distribuio normal possui dois parmetros, e . A
distribuio normal unicamente determinada por estes dois parmetros e denotada simplesmente por N(,).
Estes dois parmetros podem ser descritos graficamente como na Figura 7.2.
Figura 7.2 Distribuio Normal e seus Parmetros
Para obter uma probabilidade em uma distribuio normal, realiza-se a padronizao e usa-se a tabela
de distribuio normal.
Padronizao a transformao de uma varivel x para:
x
Z
Tm-se ento o valor padronizado Z, que se distribui como a distribuio normal padronizada N(0,1).
A Tabela 7.2 da distribuio normal fornece probabilidades na distribuio normal padronizada.
Um exemplo:
Um fabricante de lmpadas verifica, atravs de uma distribuio de freqncias, que o tempo de queima
de um determinado modelo de lmpada distribudo normalmente. Uma amostra de 50 lmpadas foi testada e o
tempo mdio de vida encontrado foi 60 dias, com um desvio-padro de 20 dias. Quantas lmpadas, na
populao total de lmpadas fabricadas por ele, pode se esperar que ainda estejam funcionando aps 100 dias de
vida?
O problema aqui dado encontrar a rea sob a curva alm dos 100 dias, Figura 7.3.
A rea sob uma curva de distribuio entre dois limites estabelecidos representa a probabilidade de
ocorrncia. Portanto, a rea alm dos 100 dias a probabilidade que uma lmpada tem de durar mais de 100
dias.
Figura 7.3 Distribuio Normal de durao de uma Lmpada
Para encontrar a rea desejada, faz-se a padronizao:
0 , 2
20
60 100
X
Z
onde:
53
X = 100 dias
= 60 dias
= 20 dias
Na Tabela 7.2, acha-se uma probabilidade para Z = 2,0 { (z) = 2,0 } de 0,9773. Este valor a
probabilidade de uma lmpada ter uma vida til de at 100 dias (97,73%).
Mas no problema proposto, pede-se a probabilidade de uma lmpada ter uma vida til de mais de 100
dias. Como a curva normal simtrica e tem rea igual a 1,000, a probabilidade da durao de uma lmpada ser
maior que 100 dias ento 1,000 - 0,9773 ou 0,0227 (2,27%).
Na Tabela 7.2, pode-se obter o mesmo valor observando a coluna da funo -Z { (-z) }. Ainda na
Tabela 7.2, pode-se calcular a probabilidade da durao das lmpadas estar entre 20 e 100 dias observando a
coluna de D(z), obtendo-se 0,9545 ou 95,45% das lmpadas tm uma vida til entre 20 e 100 dias.
Observao: Os valores das funes (-z), (z) e D(z) tm o indicativo de decimal no alto da coluna { 0. }
54
Tabela 7.2 Distribuio Normal
55
Tabela 7.2 Distribuio Normal (continuao)
56
REFERNCIAS BIBLIOGRFICAS
[1] KUME, HITOSHI, 1993, Mtodos Estatsticos para Melhoria da Qualidade, Editora Gente, SP.
[2] JURAN, J.M. & GRYNA, F.M., 1992, Controle da Qualidade Handbook, Volume VI, 4 Edio,
Editora Makron Books, SP.
[3] BROCKA, BRUCE & BROCKA, M.S., 1994, Gerenciamento da Qualidade, Makron Books, SP.
[4] BONINI, E.E. & BONINI, S.E., 1972, Estatstica Teoria e Exerccios.
[5] MOURA, A.G., 1995, Tpicos de Estatstica Descritiva, Editora Goinia, Universidade Catlica
de Gois, GO.
[6] SPIEGEL, M.R., 1976, Estatstica, 10 Reimpresso, Editora McGraw-Hill do Brasil Ltda., SP.
[7] ALMODOVA, JOS, 1978, Introduo Estatstica Geral, Editora Estrutura, SP.
[8] SERRA COSTA, J.J., 1981, Elementos de Estatstica, Editora Campus, RJ.
[9] NAZARETH, HELENALDA, 1987, Curso Bsico de Estatstica, 2 Edio, Editora tica, SP.
[10] RIBEIRO, L. F. M., 1999, Notas de Aula da Disciplina Estatstica Aplicada a Engenharia.